BrowserbaseTools 允许 Agent 使用 Browserbase(一项无头浏览器服务)来自动化浏览器交互。

前提条件

下面的示例需要您在 此处 注册后获得的 Browserbase API 凭证,以及 Playwright 库。

pip install browserbase playwright
export BROWSERBASE_API_KEY=xxx
export BROWSERBASE_PROJECT_ID=xxx

示例

下面的 Agent 将使用 Browserbase 访问 https://quotes.toscrape.com 并提取内容。然后导航到该网站的第二页并同样获取那里的名言。

cookbook/tools/browserbase_tools.py
from agno.agent import Agent
from agno.tools.browserbase import BrowserbaseTools

agent = Agent(
    name="Web Automation Assistant",
    tools=[BrowserbaseTools()],
    instructions=[
        "You are a web automation assistant that can help with:",
        "1. Capturing screenshots of websites",
        "2. Extracting content from web pages",
        "3. Monitoring website changes",
        "4. Taking visual snapshots of responsive layouts",
        "5. Automated web testing and verification",
    ],
    markdown=True,
)

agent.print_response("""
    Visit https://quotes.toscrape.com and:
    1. Extract the first 5 quotes and their authors
    2. Navigate to page 2
    3. Extract the first 5 quotes from page 2
""")

Toolkit 参数

参数类型默认值描述
api_keystrNoneBrowserbase API 密钥。如果未提供,则使用 BROWSERBASE_API_KEY 环境变量。
project_idstrNoneBrowserbase 项目 ID。如果未提供,则使用 BROWSERBASE_PROJECT_ID 环境变量。
base_urlstrNone自定义 Browserbase API 端点 URL。仅当您使用自托管的 Browserbase 实例时使用此参数,或需要连接到其他区域。如果未提供,则使用 BROWSERBASE_BASE_URL 环境变量。

Toolkit 函数

函数描述
navigate_to导航到指定的 URL。接受一个 URL 和一个可选的 connect_url 参数。
screenshot截取当前页面的屏幕截图。接受保存屏幕截图的路径、一个用于全页截图的布尔值,以及一个可选的 connect_url 参数。
get_page_content获取当前页面的 HTML 内容。接受一个可选的 connect_url 参数。
close_session关闭浏览器会话。

开发者资源