概述
shaw/dmeta-embedding-zh
是一个中文嵌入模型,参数量为 400M,适用于多种场景。
该模型在 MTEB 基准测试中表现出色,特别适合语义检索、RAG(检索增强生成)以及其他大语言模型应用。
- 参数量:102M
- 量化:F32
- 模型架构:BERT
- 模型大小:409MB
- 更新时间:发帖的9个月前
- 支持 Ollama 0.1.30 及更高版本
- 功能:仅用于生成嵌入。
使用方法
1. 拉取模型到本地
运行以下命令将模型拉取到本地磁盘:
ollama pull shaw/dmeta-embedding-zh
2. 调用嵌入 API
拉取模型后,可以通过以下几种方式调用嵌入 API:
1. 使用 REST API
curl http://localhost:11434/api/embeddings -d '{
"model": "shaw/dmeta-embedding-zh",
"prompt": "天空是灰色的"
}'
2. 使用 Python 库
ollama.embeddings(model='shaw/dmeta-embedding-zh', prompt='天空是灰色的')
3. 使用 Javascript 库
ollama.embeddings({ model: 'shaw/dmeta-embedding-zh', prompt: '天空是灰色的' });
4. 使用 Java 库
EmbeddingResponse embeddingResponse = embeddingClient.call(
new EmbeddingRequest(List.of("天空是灰色的", "天空是蓝色的"),
OllamaOptions.create()
.withModel("shaw/dmeta-embedding-zh"));
模型特点
- 轻量级:模型仅有 400M,适合资源受限场景。
- 多用途:适用于语义检索、信息检索和 RAG 场景。
- 高性能:在 MTEB 基准测试中表现优异。
更多文档
有关嵌入 API 的详细信息,请参考 Ollama 嵌入 API 文档。