使用 Pdf-Url 进行过滤

代码

"""
用户级知识过滤示例（使用 PDF URL）

本食谱演示了如何使用知识过滤器和通过 URL 访问的 PDF 文档，
展示了如何将知识库搜索限制在特定的菜肴、来源或任何其他元数据属性。

演示的关键概念：
1. 从具有特定元数据的 URL 加载 PDF 文档
2. 按菜肴类型过滤知识库搜索
3. 组合多个过滤条件
4. 比较不同过滤条件组合的结果

您可以通过以下方式传递过滤器：
1. 如果仅在 Agent 上传递，我们将用于所有运行
2. 如果在 run/print_response 上传递，我们将用于该运行
3. 如果在两者上都传递，我们将使用在 run/print_response 上传递的过滤器来覆盖该运行
"""

from agno.agent import Agent
from agno.knowledge.pdf_url import PDFUrlKnowledgeBase
from agno.vectordb.lancedb import LanceDb

# 初始化 LanceDB
# 默认情况下，它将数据存储在 /tmp/lancedb
vector_db = LanceDb(
    table_name="recipes",
    uri="tmp/lancedb",  # 您可以将此路径更改为存储其他位置的数据
)

# 步骤 1：使用 URL 和元数据初始化知识库
# ------------------------------------------------------------------------------
# 在初始化知识库时，我们可以附加将用于过滤的元数据
# 此元数据可以包括菜肴类型、来源、地区或任何其他属性

knowledge_base = PDFUrlKnowledgeBase(
    urls=[
        {
            "url": "https://agno-public.s3.amazonaws.com/recipes/thai_recipes_short.pdf",
            "metadata": {
                "cuisine": "Thai",
                "source": "Thai Cookbook",
                "region": "Southeast Asia",
            },
        },
        {
            "url": "https://agno-public.s3.amazonaws.com/recipes/cape_recipes_short_2.pdf",
            "metadata": {
                "cuisine": "Cape",
                "source": "Cape Cookbook",
                "region": "South Africa",
            },
        },
    ],
    vector_db=vector_db,
)

# 将所有文档加载到向量数据库中
knowledge_base.load(recreate=True)

# 步骤 2：使用不同的过滤条件组合查询知识库
# ------------------------------------------------------------------------------

# 选项 1：在 Agent 上设置过滤器
# 使用知识库和过滤器初始化 Agent
agent = Agent(
    knowledge=knowledge_base,
    search_knowledge=True,
    # 这将仅返回具有泰式菜肴的文档中的信息
    knowledge_filters={"cuisine": "Thai"},
)

# 查询泰式食谱
agent.print_response(
    "告诉我如何制作泰式炒河粉",
    markdown=True,
)

# # 选项 2：在 run/print_response 上设置过滤器
# agent = Agent(
#     knowledge=knowledge_base,
#     search_knowledge=True,
# )

# # 查询 Cape Malay 咖喱
# agent.print_response(
#     "告诉我如何制作 Cape Malay 咖喱",
#     knowledge_filters={"cuisine": "Cape"},
#     markdown=True,
# )

用法

安装库

pip install -U agno openai lancedb

运行示例

python cookbook/agent_concepts/knowledge/filters/pdf_url/filtering.py

python cookbook/agent_concepts/knowledge/filters/pdf_url/filtering.py

示例

代理概念

模型

使用 Pdf-Url 进行过滤

代码

用法

​代码

​用法

代码

用法