跟踪您的评估

除了在 CLI 上运行评估外,您还可以在 Agno 平台上跟踪您的评估。这有助于跟踪结果并与团队共享。 请按照以下步骤进行操作:

1

身份验证

您可以使用 CLI 或 API 密钥进行身份验证。

使用您的 CLI:

ag setup

使用您的 API 密钥:

Agno App 获取您的 API 密钥,并使用它将您本地运行的代理连接到 Agno 平台。

export AGNO_API_KEY=your_api_key_here
2

跟踪您的评估

在运行评估时,将 monitoring 设置为 True 即可在 Agno 平台上跟踪所有运行情况:

from agno.agent import Agent
from agno.eval.accuracy import AccuracyEval
from agno.models.openai import OpenAIChat

evaluation = AccuracyEval(
  model=OpenAIChat(id="gpt-4o"),
  agent=Agent(model=OpenAIChat(id="gpt-4o")),
  input="What is 10*5 then to the power of 2? do it step by step",
  expected_output="2500",
  monitoring=True, # This activates monitoring
)

# This run will be tracked on the Agno platform
result = evaluation.run(print_results=True)

您还可以将 AGNO_MONITOR 环境变量设置为 true 来跟踪所有评估运行。

3

查看您的评估

您现在可以在 Agno 平台上的 app.agno.com/evaluations 查看您的评估结果。

遇到问题?请查看我们的 故障排除指南