S3TextKnowledgeBase 从 S3 存储桶读取文本文件,将它们转换为向量嵌入并加载到向量数据库中。

用法

我们在此示例中使用本地 PgVector 数据库。确保它正在运行

pip install textract
from agno.knowledge.s3.text import S3TextKnowledgeBase
from agno.vectordb.pgvector import PgVector

db_url = "postgresql+psycopg://ai:ai@localhost:5532/ai"

knowledge_base = S3TextKnowledgeBase(
    bucket_name="agno-public",
    key="recipes/recipes.docx",
    vector_db=PgVector(table_name="recipes", db_url=db_url),
)

然后将 knowledge_baseAgent 一起使用:

from agno.agent import Agent
from knowledge_base import knowledge_base

agent = Agent(
    knowledge=knowledge_base,
    search_knowledge=True,
)
agent.knowledge.load(recreate=False)

agent.print_response("How to make Hummus?")

参数

参数类型默认值描述
bucket_namestrNone文件所在 S3 存储桶的名称。
keystrNone存储桶中文件的 key。
formatsList[str][".doc", ".docx"]此知识库接受的格式。
readerS3TextReaderS3TextReader()一个 S3TextReader,用于将 Text 文件转换为用于向量数据库的 Documents

S3TextKnowledgeBaseAgentKnowledge 类的子类,可以访问相同的参数。

开发者资源