S3PDFKnowledgeBase 从 S3 存储桶中读取 PDF 文件,将它们转换为向量嵌入,并将它们加载到向量数据库中。

用法

我们在此示例中使用本地 PgVector 数据库。请确保它正在运行

from agno.knowledge.s3.pdf import S3PDFKnowledgeBase
from agno.vectordb.pgvector import PgVector

db_url = "postgresql+psycopg://ai:ai@localhost:5532/ai"

knowledge_base = S3PDFKnowledgeBase(
    bucket_name="agno-public",
    key="recipes/ThaiRecipes.pdf",
    vector_db=PgVector(table_name="recipes", db_url=db_url),
)

然后将 knowledge_baseAgent 一起使用:

from agno.agent import Agent
from knowledge_base import knowledge_base

agent = Agent(
    knowledge=knowledge_base,
    search_knowledge=True,
)
agent.knowledge.load(recreate=False)

agent.print_response("How to make Thai curry?")

参数

参数类型默认值描述
bucket_namestrNone包含 PDF 的 S3 存储桶的名称。
keystrNone存储桶中 PDF 文件的键。
readerS3PDFReaderS3PDFReader()一个 S3PDFReader,用于将 PDF 转换为供向量数据库使用的 Documents

S3PDFKnowledgeBaseAgentKnowledge 类的子类,并且可以访问相同的参数。

开发者资源