AwsBedrockEmbedder
类用于通过 AWS Bedrock API 将文本数据嵌入到向量中。默认情况下,它使用 Cohere Embed Multilingual V3 模型来生成嵌入。
默认情况下,此 embedder 使用 cohere.embed-multilingual-v3
模型。在使用此 embedder 之前,您必须在 AWS Bedrock 模型目录中启用对此模型的访问。
参数 | 类型 | 默认值 | 描述 |
---|---|---|---|
id | str | "cohere.embed-multilingual-v3" | 要使用的模型 ID。您需要在 AWS Bedrock 模型目录中启用此模型。 |
dimensions | int | 1024 | 模型生成的嵌入的维度(Cohere 模型为 1024)。 |
input_type | str | "search_query" | 在前面加上特殊标记以区分类型。选项:‘search_document’, ‘search_query’, ‘classification’, ‘clustering’。 |
truncate | Optional[str] | None | 如何处理长度超过最大标记长度的输入。选项:‘NONE’, ‘START’, ‘END’。 |
embedding_types | Optional[List[str]] | None | 要返回的嵌入类型。选项:‘float’, ‘int8’, ‘uint8’, ‘binary’, ‘ubinary’。 |
aws_region | Optional[str] | None | 要使用的 AWS 区域。如果未提供,将回退到 AWS_REGION 环境变量。 |
aws_access_key_id | Optional[str] | None | AWS 访问密钥 ID。如果未提供,将回退到 AWS_ACCESS_KEY_ID 环境变量。 |
aws_secret_access_key | Optional[str] | None | AWS 密钥访问密钥。如果未提供,将回退到 AWS_SECRET_ACCESS_KEY 环境变量。 |
session | Optional[Session] | None | 用于身份验证的 boto3 Session 对象。 |
request_params | Optional[Dict[str, Any]] | None | 要传递给 API 请求的附加参数。 |
client_params | Optional[Dict[str, Any]] | None | 要传递给 boto3 客户端的附加参数。 |
client | Optional[AwsClient] | None | 用于发出 API 请求的 AWS Bedrock 客户端实例。 |