Code
cookbook/models/ibm/watsonx/image_agent_bytes.py
from pathlib import Path
from agno.agent import Agent
from agno.media import Image
from agno.models.ibm import WatsonX
from agno.tools.duckduckgo import DuckDuckGoTools
agent = Agent(
model=WatsonX(id="meta-llama/llama-3-2-11b-vision-instruct"),
tools=[DuckDuckGoTools()],
markdown=True,
)
image_path = Path(__file__).parent.joinpath("sample.jpg")
# Read the image file content as bytes
with open(image_path, "rb") as img_file:
image_bytes = img_file.read()
agent.print_response(
"Tell me about this image and give me the latest news about it.",
images=[
Image(content=image_bytes),
],
stream=True,
)
Usage
创建虚拟环境
打开 Terminal
并创建一个 python 虚拟环境。
python3 -m venv .venv
source .venv/bin/activate
设置您的 API 密钥
export IBM_WATSONX_API_KEY=xxx
export IBM_WATSONX_PROJECT_ID=xxx
安装库
pip install -U ibm-watsonx-ai duckduckgo-search agno
添加示例图片
将名为“sample.jpg”的示例图片放在脚本的同一目录下。
运行代理
python cookbook/models/ibm/watsonx/image_agent_bytes.py
此示例展示了如何使用支持视觉功能的 IBM WatsonX。它从文件中加载一张图片,并将图片与提示一起传递给模型。然后,模型可以分析图片并提供相关信息。
注意:此示例使用了一个支持视觉功能的模型(meta-llama/llama-3-2-11b-vision-instruct
)并且需要一个示例图片文件。
Responses are generated using AI and may contain mistakes.