mingyanmingyan
mingyan

Sd2 Manxue - 创建任务

创建 sd2_manxue 视频生成任务,支持普通模型、fast 模型与视频参考模型

POST/kyyReactApiServer/v1/sd2_manxue/videos

Sd2 Manxue 创建视频任务

创建 sd2_manxue 视频生成任务。该接口支持纯文生、首帧图生、首尾帧,以及多素材参考模式。若需要传入 referenceVideos,请使用 sd2_manxue_video_*sd2_manxue_video_fast_* 模型。
所有请求都需要在请求头中包含 Bearer token:
cURL
Authorization: Bearer {{key}}

基础 URL

https://zcbservice.aizfw.cn/kyyReactApiServer
baseUrl 为所有对外 API 的公共前缀。当前页面 frontmatter 中的 api 字段展示的是完整请求地址,请在接入时以这里的 baseUrl 为统一前缀理解和拼接接口路径。

请求参数

promptbodystring必填
视频生成提示词。
示例:"一个女生在雨夜街头慢跑,霓虹灯倒影,镜头平滑推进,电影感强"
modelbodystring必填
模型名称,用于确定输出分辨率。
可选值:
  • sd2_manxue_720p - 输出 720p
  • sd2_manxue_1080p - 输出 1080p
  • sd2_manxue_2k - 输出 2k
  • sd2_manxue_4k - 输出 4k
  • sd2_manxue_fast_720p - fast 系列,输出 720p
  • sd2_manxue_fast_1080p - fast 系列,输出 1080p
  • sd2_manxue_video_720p - 视频参考系列,输出 720p
  • sd2_manxue_video_1080p - 视频参考系列,输出 1080p
  • sd2_manxue_video_2k - 视频参考系列,输出 2k
  • sd2_manxue_video_4k - 视频参考系列,输出 4k
  • sd2_manxue_video_fast_720p - 视频参考 fast 系列,输出 720p
  • sd2_manxue_video_fast_1080p - 视频参考 fast 系列,输出 1080p
durationbodyinteger
视频时长(秒),默认 5,支持范围 4-15
ratiobodystring
输出比例,默认 16:9
支持的值:
  • 21:9
  • 16:9
  • 4:3
  • 1:1
  • 3:4
  • 9:16
first_imagebodystring
首帧图片 URL。
使用规则:
  • 首帧 / 首尾帧场景主字段
  • 可单独用于首帧模式
  • 搭配 last_image 时表示首尾帧模式
  • 兼容旧字段 image
  • 不能与 referenceImagesreferenceVideosreferenceAudios 同时使用
图片建议宽高比在 0.4 ~ 2.5 之间,宽高建议在 300 ~ 6000 px 之间。
last_imagebodystring
尾帧图片 URL。
使用规则:
  • 首尾帧场景主字段
  • 必须搭配 first_image 使用
  • 兼容旧字段 lastFrameImage
当新旧字段同时传入时,以 first_imagelast_image 为准;若值不一致会报参数冲突
referenceImagesbodyarray
参考图片 URL 列表。
规则说明:
  • 最多 9
  • 不能与 first_imagelast_image 及兼容字段 imagelastFrameImage 同时使用
  • 图片建议宽高比在 0.4 ~ 2.5 之间,宽高建议在 300 ~ 6000 px 之间
涉及人脸或虚拟人像素材时,建议先调用素材审核接口并使用 asset://{assetId} 形式引用
referenceVideosbodyarray
参考视频 URL 列表。
规则说明:
  • sd2_manxue_video_*sd2_manxue_video_fast_* 模型支持
  • 最多 3
  • 总时长不超过 15
  • 总大小不超过 500MB
  • 可与 referenceImagesreferenceAudios 同时使用
  • 不能与 first_imagelast_image 及兼容字段 imagelastFrameImage 同时使用
普通 sd2_manxue_*sd2_manxue_fast_* 模型暂不支持 referenceVideos。传入时请切换到视频参考模型。
referenceAudiosbodyarray
参考音频 URL 列表。
规则说明:
  • 最多 3
  • 总时长不超过 15
  • 总大小不超过 500MB
  • 不能与 first_imagelast_image 及兼容字段 imagelastFrameImage 同时使用

响应参数

idstring
视频生成任务的唯一标识符,用于后续查询任务状态
objectstring
对象类型,固定为 video
createdinteger
任务创建时间戳
modelstring
使用的模型名称
statusstring
任务状态:
  • queued - 排队中
  • processing - 处理中
  • completed - 已完成
  • failed - 失败
errorstring
错误信息,当 status 为 failed 时返回

参数选择规则

互斥规则:
  • last_image 不能单独使用,必须与 first_image 成对出现
  • referenceImagesreferenceAudios 可单独或组合使用
  • referenceVideos 仅视频参考模型可用,且可与 referenceImagesreferenceAudios 组合使用
  • first_image / last_image 与任意 reference* 参数不能同时使用
兼容说明:
  • 历史字段 imagelastFrameImage 仍可兼容使用
  • 当新旧字段同时传入时,新字段优先
  • 当新旧字段同时传入且值不一致时,接口会直接返回参数冲突

模型与分辨率

模型输出分辨率适用场景
sd2_manxue_720p720p更关注生成速度与基础效果
sd2_manxue_1080p1080p常规高清生成
sd2_manxue_2k2k更高精度的视频内容
sd2_manxue_4k4k对画质要求最高的场景
sd2_manxue_fast_720p720pfast 系列,适合速度优先的常规高清场景
sd2_manxue_fast_1080p1080pfast 系列,适合速度优先的高清输出场景
sd2_manxue_video_720p720p需要 referenceVideos 的常规视频参考场景
sd2_manxue_video_1080p1080p需要 referenceVideos 的高清视频参考场景
sd2_manxue_video_2k2k需要 referenceVideos 的高精度视频参考场景
sd2_manxue_video_4k4k需要 referenceVideos 的最高画质视频参考场景
sd2_manxue_video_fast_720p720p视频参考 fast 系列,适合速度优先的常规高清场景
sd2_manxue_video_fast_1080p1080p视频参考 fast 系列,适合速度优先的高清输出场景
最佳实践:
  1. 创建任务为异步处理,请保存返回的 id
  2. 提示词尽量包含主体、动作、镜头和风格描述。
  3. 使用首尾帧模式时,建议两张图片在风格和构图上连续。
  4. 使用参考视频或参考音频时,优先提供时长较短、主体清晰的素材。
  5. 涉及人脸或虚拟人像的参考素材,建议先完成素材审核。
普通系列 sd2_manxue_* 直接按对应分辨率生成;sd2_manxue_fast_* 为 fast 系列模型;sd2_manxue_video_*sd2_manxue_video_fast_* 为视频参考模型,适用于需要传入 referenceVideos 的场景。用户侧仍统一通过 model 字段传模型名。