代码

"""
用户级知识过滤示例(使用 PDF URL)

本食谱演示了如何使用知识过滤器和通过 URL 访问的 PDF 文档,
展示了如何将知识库搜索限制在特定的菜肴、来源或任何其他元数据属性。

演示的关键概念:
1. 从具有特定元数据的 URL 加载 PDF 文档
2. 按菜肴类型过滤知识库搜索
3. 组合多个过滤条件
4. 比较不同过滤条件组合的结果

您可以通过以下方式传递过滤器:
1. 如果仅在 Agent 上传递,我们将用于所有运行
2. 如果在 run/print_response 上传递,我们将用于该运行
3. 如果在两者上都传递,我们将使用在 run/print_response 上传递的过滤器来覆盖该运行
"""

from agno.agent import Agent
from agno.knowledge.pdf_url import PDFUrlKnowledgeBase
from agno.vectordb.lancedb import LanceDb

# 初始化 LanceDB
# 默认情况下,它将数据存储在 /tmp/lancedb
vector_db = LanceDb(
    table_name="recipes",
    uri="tmp/lancedb",  # 您可以将此路径更改为存储其他位置的数据
)

# 步骤 1:使用 URL 和元数据初始化知识库
# ------------------------------------------------------------------------------
# 在初始化知识库时,我们可以附加将用于过滤的元数据
# 此元数据可以包括菜肴类型、来源、地区或任何其他属性

knowledge_base = PDFUrlKnowledgeBase(
    urls=[
        {
            "url": "https://agno-public.s3.amazonaws.com/recipes/thai_recipes_short.pdf",
            "metadata": {
                "cuisine": "Thai",
                "source": "Thai Cookbook",
                "region": "Southeast Asia",
            },
        },
        {
            "url": "https://agno-public.s3.amazonaws.com/recipes/cape_recipes_short_2.pdf",
            "metadata": {
                "cuisine": "Cape",
                "source": "Cape Cookbook",
                "region": "South Africa",
            },
        },
    ],
    vector_db=vector_db,
)

# 将所有文档加载到向量数据库中
knowledge_base.load(recreate=True)

# 步骤 2:使用不同的过滤条件组合查询知识库
# ------------------------------------------------------------------------------

# 选项 1:在 Agent 上设置过滤器
# 使用知识库和过滤器初始化 Agent
agent = Agent(
    knowledge=knowledge_base,
    search_knowledge=True,
    # 这将仅返回具有泰式菜肴的文档中的信息
    knowledge_filters={"cuisine": "Thai"},
)

# 查询泰式食谱
agent.print_response(
    "告诉我如何制作泰式炒河粉",
    markdown=True,
)

# # 选项 2:在 run/print_response 上设置过滤器
# agent = Agent(
#     knowledge=knowledge_base,
#     search_knowledge=True,
# )

# # 查询 Cape Malay 咖喱
# agent.print_response(
#     "告诉我如何制作 Cape Malay 咖喱",
#     knowledge_filters={"cuisine": "Cape"},
#     markdown=True,
# )

用法

1

安装库

pip install -U agno openai lancedb
2

运行示例

python cookbook/agent_concepts/knowledge/filters/pdf_url/filtering.py