Skip to main content

Web Search 与网页提取

Hermes 提供两个模型可调用的网页工具:

  • web_search:搜索网页并返回排序结果;
  • web_extract:抓取一个或多个 URL,并提取可读正文。

这两个工具共用一套后端选择逻辑。你可以在 hermes tools 中选择,也可以直接写进 config.yaml

为什么要配置后端?

不同搜索后端擅长的事情不同。Tavily 和 Exa 适合面向 Agent 的检索,Brave 和 DuckDuckGo 更接近通用搜索,SearXNG 适合自托管,Firecrawl 更偏网页抓取,xAI 则适合和 Grok / Portal 工作流结合。

简单来说:搜索不是一个功能,而是一组入口。选对入口,Agent 才能拿到更好的证据。

常见使用方式

让 Hermes 搜索网页时,可以直接说出需求:

请搜索 Hermes Agent v0.15.1 的官方发布说明,并总结影响 Docker 用户的变更。

如果任务需要阅读具体页面,可以给出 URL:

请提取这个页面的正文,并列出与 xAI OAuth 相关的配置步骤:https://example.com/page

模型会根据工具可用性调用 web_searchweb_extract

配置建议

新手建议从 Dashboard 或 hermes tools 开始配置。进阶用户可以用 config.yaml 固定后端。

选择后端时,按下面的问题判断:

  • 你需要免费自托管吗?优先看 SearXNG。
  • 你需要 Agent 友好的摘要和引用吗?优先看 Tavily 或 Exa。
  • 你已经使用 xAI / Grok / Portal 吗?可以考虑 xAI Web Search。
  • 你主要抓取指定网页正文吗?关注 web_extract 后端和网页提取质量。

web_search 面向网页。它适合查官方文档、博客、新闻、GitHub 页面和产品说明。

如果你要查 X 上的帖子、thread、社区反应或实时讨论,请使用 X Search。两者不要混用。

参考链接