跳到主要内容

多模态生成

iClaw 支持图片、视频、语音的生成与编辑。所有产物都是可下载的 artifact（带指纹与归属），不会是临时路径。

工具	作用	关键参数
`image_generate`	文生图	`prompt`、`size`（如 `1024x1024`）
`image_edit`	图生图（按描述编辑已有图片）	`input_ref`、`prompt`、`size`
`video_generate`	文生视频	`prompt`、可选首/尾帧引用
`text_to_speech`	文字转语音	`text`、`voice`

用法示例

生成一张「青色调、扁平风格的企业 AI 助手吉祥物」的图，尺寸 1024x1024。

把这段会议纪要转成语音，用沉稳的男声。

注意

多模态生成属外部调用，默认会先请你确认再执行（可由管理员策略调整）。
需要相应的模型/凭据已由管理员配置；未配置时系统会在启动期预检中提示该能力不可用，而不是等到调用才失败。
生成结果以 artifact 形式返回，可直接下载或在后续步骤里被引用（如 image_edit 引用上一步的图）。

用法示例
注意