异步代理与流式输出

On this page

代码
用法

代码

cookbook/models/vllm/async_basic_stream.py

import asyncio

from agno.agent import Agent
from agno.models.vllm import vLLM

agent = Agent(model=vLLM(id="Qwen/Qwen2.5-7B-Instruct"), markdown=True)
asyncio.run(agent.aprint_response("写一个两句的恐怖故事", stream=True))

用法

创建虚拟环境

打开 Terminal 并创建一个 python 虚拟环境。

python3 -m venv .venv
source .venv/bin/activate

安装库

pip install -U agno openai vllm

启动 vLLM 服务器

vllm serve Qwen/Qwen2.5-7B-Instruct \
    --enable-auto-tool-choice \
    --tool-call-parser hermes \
    --dtype float16 \
    --max-model-len 8192 \
    --gpu-memory-utilization 0.9

运行代理

python cookbook/models/vllm/async_basic_stream.py

Async Agent 带工具的 Agent

示例

代理概念

模型

异步代理与流式输出

代码

用法

示例

代理概念

模型

​代码

​用法

代码

用法