跳到主要内容

多模态生成

iClaw 支持图片、视频、语音的生成与编辑。所有产物都是可下载的 artifact(带指纹与归属), 不会是临时路径。

工具作用关键参数
image_generate文生图promptsize(如 1024x1024
image_edit图生图(按描述编辑已有图片)input_refpromptsize
video_generate文生视频prompt、可选首/尾帧引用
text_to_speech文字转语音textvoice

用法示例

生成一张「青色调、扁平风格的企业 AI 助手吉祥物」的图,尺寸 1024x1024。

把这段会议纪要转成语音,用沉稳的男声。

注意

  • 多模态生成属外部调用,默认会先请你确认再执行(可由管理员策略调整)。
  • 需要相应的模型/凭据已由管理员配置;未配置时系统会在启动期预检中提示该能力不可用, 而不是等到调用才失败。
  • 生成结果以 artifact 形式返回,可直接下载或在后续步骤里被引用(如 image_edit 引用上一步的图)。