工具能力总览
智能体通过「工具」与外部世界交互。你不用记工具名——描述目标即可,智能体会自己选用。下面是 当前能力一览,便于你了解「它能做什么」。
| 能力 | 工具 | 能做什么 |
|---|---|---|
| 联网检索 | web_search | 全网搜索,获取最新信息 |
| 网页读取 | web_fetch / link_reader | 抓取并提取网页/PDF 正文(可批量读多条链接) |
| 文生图 / 图生图 | image_generate / image_edit | 按描述生成图片,或编辑已有图片 |
| 文生视频 | video_generate | 按描述生成视频 |
| 语音合成 | text_to_speech | 文字转语音 |
| 代码执行 | bash / sandbox_exec_shell / sandbox_exec_python | 在安全沙箱里跑命令/脚本/数据处理 |
| 技能执行 | execute_skills | 运行预制的技能工作流 |
| 浏览器操作 | browser_* | 在无头浏览器里导航、点击、输入、截图、读 DOM |
| 手机操作 | mobile_use | 用自然语言驱动移动设备/App |
| 电脑操作 | computer_use | 用自然语言驱动桌面电脑 |
| 知识库检索 | knowledge_search | 检索你的文档集合(RAG) |
| 长期记忆 | remember_this / recall_memories | 记住/召回关于你的稳定事实 |
| 文件产物 | artifact_write / 文件读写 | 生成可下载的产物、读写沙箱文件 |
| 外部工具 | mcp__* | 通过 MCP 接入第三方工具 |
权限与确认
每个工具都受两道门约束:
- 权限策略(ToolPolicy):管理员可按 agent 配置某工具「允许 / 禁止 / 需确认」。
- 风险闸(RiskGate):按动作内容拦截高危操作(如危险命令、强制推送等)。
高风险动作(外部生成、写文件、执行命令等)默认先请你确认再执行。