Code

cookbook/models/ibm/watsonx/image_agent_bytes.py
from pathlib import Path

from agno.agent import Agent
from agno.media import Image
from agno.models.ibm import WatsonX
from agno.tools.duckduckgo import DuckDuckGoTools

agent = Agent(
    model=WatsonX(id="meta-llama/llama-3-2-11b-vision-instruct"),
    tools=[DuckDuckGoTools()],
    markdown=True,
)

image_path = Path(__file__).parent.joinpath("sample.jpg")

# Read the image file content as bytes
with open(image_path, "rb") as img_file:
    image_bytes = img_file.read()

agent.print_response(
    "Tell me about this image and give me the latest news about it.",
    images=[
        Image(content=image_bytes),
    ],
    stream=True,
)

Usage

1

创建虚拟环境

打开 Terminal 并创建一个 python 虚拟环境。

python3 -m venv .venv
source .venv/bin/activate
2

设置您的 API 密钥

export IBM_WATSONX_API_KEY=xxx
export IBM_WATSONX_PROJECT_ID=xxx
3

安装库

pip install -U ibm-watsonx-ai duckduckgo-search agno
4

添加示例图片

将名为“sample.jpg”的示例图片放在脚本的同一目录下。

5

运行代理

python cookbook/models/ibm/watsonx/image_agent_bytes.py

此示例展示了如何使用支持视觉功能的 IBM WatsonX。它从文件中加载一张图片,并将图片与提示一起传递给模型。然后,模型可以分析图片并提供相关信息。

注意:此示例使用了一个支持视觉功能的模型(meta-llama/llama-3-2-11b-vision-instruct)并且需要一个示例图片文件。