阿里巴巴 Happy Horse 1.1 已上线 — 先了解 1.1 更新内容 再开始生成。 查看指南 →
Try Happy Horse AI Logo

TryHappyHorseAI

Happy Horse 1.1 现已上线:有哪些变化以及如何使用它

作者: Happy Horse AI Team|最后更新: 2026年6月

Happy Horse 1.1 现已上线,而重要的变化并不只是版本号更新。新模型将 Happy Horse 工作流扩展到了 text-to-video、image-to-video 和 reference-to-video,在这三种模式下都带来了更好的提示词理解、更流畅的运动、更强的视觉一致性,以及更干净的输出质量。

我们已经围绕 1.1 模型路径更新了 Try Happy Horse AI generator,包括模型选择和公开示例导入,因此这篇指南将从实际实现和创作者工作流的角度来写。简而言之:对于新的文本、图像和基于参考的生成任务,请默认使用 Happy Horse 1.1;对于视频编辑,请继续使用 Happy Horse 1.0,直到 1.1 的编辑支持被正式文档化。

如果你想直接测试,可以打开AI 视频生成器,然后在模型选择器中选择 Happy Horse 1.1。


什么是 Happy Horse 1.1?

Happy Horse 1.1 是现已在 Try Happy Horse AI 中可用的升级版 HappyHorse 视频生成模型。它支持三种生产模式:text-to-video、image-to-video 和 reference-to-video。

这很重要,因为 Happy Horse 1.0 作为通用 AI 视频模型本来就已经很强,但 1.1 将工作流进一步转向“为任务选择合适的控制模式”。当你关注以下场景时,这次升级尤其有价值:

  • 将提示词转化为连贯的短视频片段
  • 为首帧图像添加动画,同时不丢失原始构图
  • 使用多张参考图来保持人物身份、服装、道具或风格一致
  • 更有针对性地选择画幅比例、时长和分辨率

在我们的 1.1 发布版本中,最明显的实际改进体现在三种创作模式下的提示词理解、运动流畅度、视觉一致性和成片质感。

从实际角度来说,这意味着:Happy Horse 1.1 是 prompt-first、first-frame 和 multi-reference 视频生成的新默认模型。


相比 Happy Horse 1.0 有哪些变化?

1.1 最大的提升是工作流可靠性。Happy Horse 1.1 目前还没有替代 Happy Horse 1.0 的所有功能,但它让三种核心创作模式对创作者和团队来说更加实用。

下面是清晰的产品对比:

领域Happy Horse 1.0Happy Horse 1.1这意味着什么
Text-to-video强大的通用模型更好的提示词理解和更流畅的运动更适合作为提示词驱动视频的默认选择
Image-to-video强大的首帧动画能力更稳定一致的首帧动画工作流更适合人像、产品和电影感静帧
Reference-to-video可作为参考工作流使用更强的多参考工作流更适合角色、服装、道具和风格控制
Framing支持广泛的视频输出更灵活的画面构图选择更便于规划社交媒体、横版和超宽画幅内容
Duration支持短片生成更灵活的短片规划能力更适合广告、示例片段和概念镜头
Video edit在现有编辑流程中受支持尚未纳入 1.1 创作流程目前视频编辑仍请使用 1.0

更有用的理解方式不是“1.1 画质更高”,而是:

  • 当场景主要由提示词驱动时,使用 1.1 text-to-video
  • 当构图主要由首帧决定时,使用 1.1 image-to-video
  • 当人物身份和风格主要依赖多张视觉参考时,使用 1.1 reference-to-video
  • 当你现在就需要特定的视频编辑能力时,使用 1.0 video edit

最后这一点很关键。对用户来说,边界其实很简单:Happy Horse 1.1 用于新的生成任务,而当前的视频编辑体验仍然基于稳定的 Happy Horse 1.0 路径。


你应该使用哪种 Happy Horse 1.1 模式?

想要更快获得更好的 1.1 效果,最有效的方法是在写提示词之前先选对模式。

如需包含截图、设置、提示词模板和样例视频的逐页演示,请阅读 Happy Horse 1.1 生成器指南

Happy Horse 1.1 的 text-to-video、image-to-video 和 reference-to-video 工作流模式

当创意还比较灵活时,使用 text-to-video

当你还没有一张足够强的源图时,text-to-video 是最好的起点。它适合用于新场景生成、概念探索、社交短片、广告变体和电影感测试。

好的 text-to-video 提示词通常应包含:

  1. 主体
  2. 动作
  3. 环境
  4. 镜头运动
  5. 光线与氛围
  6. 输出画幅

text-to-video 也是画幅比例最重要的模式。如果输出目标是 YouTube,就从横版开始;如果目标是 TikTok、Reels 或 Shorts,就从竖版开始。生成前先确定画面比例,通常会比生成后再裁剪得到更干净的结果。

当构图很重要时,使用 image-to-video

当你已经拥有想要的画面时,image-to-video 是正确的选择:比如人像、产品照片、情绪板静帧、活动主视觉,或概念图。

输入图像本身就完成了一半的指令表达。对于 Happy Horse 1.1,如果你要求的运动本来就合理地存在于静帧之中,效果会更好:

  • 人像中的轻微眨眼、呼吸和发丝摆动
  • 产品镜头中的蒸汽、薄雾和缓慢镜头漂移
  • 风景中的云层、雨滴、粒子和推进式镜头运动
  • 高端商业图像中的反射变化和扫光效果

image-to-video 与 text-to-video 的行为方式不同,因为首帧决定了构图。如果你想生成竖版视频,就从竖版源图开始;如果你想生成宽屏视频,就在生成前先按对应比例裁剪或准备源图。

如果你想深入了解首帧提示词写法,可以阅读Happy Horse AI 图生视频:完整指南与示例

当一致性很重要时,使用 reference-to-video

当人物身份、服装、产品细节、道具或场景参考比单纯的提示词自由度更重要时,就应该使用 reference-to-video。

这是 1.1 工作流中最重要的创作升级。你不再需要把所有细节都硬塞进文字里,而是可以提供视觉锚点,再说明每张参考图分别控制什么。

Happy Horse 1.1 通过多重视觉输入实现的 reference-to-video 一致性

在以下场景中使用 reference-to-video:

  • 在服装和环境变化中保持角色一致性
  • 需要保持产品外形稳定的产品视频
  • 结合人物、物体、地点和光线氛围的广告场景
  • 风格参考与提示词同样重要的电影概念片
  • 需要让主体保持可辨识度的创作者内容

不要只写“使用这些图片”。要明确说明每张参考图控制什么:

“保持同一个女人、黑色皮衣、手持相机镜头、雨夜城市街道,以及温暖的路灯氛围。使用缓慢的跟拍镜头和写实运动。”


值得了解的 Happy Horse 1.1 控制项

想用好 Happy Horse 1.1,你不需要过多考虑技术配置。真正有用的控制项,是那些在生成开始前就能决定片子方向的参数:输入类型、画幅、时长、分辨率和参考结构。

从用户视角来看,可以这样理解:

工作流主要输入最重要的控制项需要注意的问题
Text-to-video提示词画幅比例和场景描述模糊提示词会生成泛化的运动
Image-to-video首帧图像源图质量和裁剪源图会强烈影响输出形态
Reference-to-video多张视觉参考参考图与提示词之间的清晰映射参考角色不清会降低一致性
Video edit现有视频编辑指令目前请使用现有的 1.0 编辑流程

其中,画幅选择尤其重要:

比例最适合的场景
16:9YouTube、落地页、横版广告
9:16TikTok、Reels、Shorts
1:1信息流帖子和紧凑型投放位
4:5 / 5:4社交广告和编辑类裁剪
3:4 / 4:3人像或经典展示画幅
9:21 / 21:9竖向移动端实验或超宽电影镜头

对于创作者来说,结论很简单:如果你已经知道目标渠道,就在生成前先设置好比例。如果你在制作首帧动画,先把输入图裁剪到目标比例,因为 I2V 会跟随图像本身。


我们如何在 Try Happy Horse AI 中使用 1.1

在 Try Happy Horse AI 中,Happy Horse 1.1 已经成为新的 text-to-video、image-to-video 和 reference-to-video 任务的默认选择。生成器现在也提供了模型选择器,让你可以直接在可用的 Happy Horse 版本之间切换。

这个产品决策遵循三条规则:

  1. 模型选择应该可见。 用户应该清楚自己测试的是 1.0 还是 1.1。
  2. 工作流应该保持简单。 大多数创作者只需要选择模型和创作模式。
  3. 不应暗示尚未支持的模式。 由于视频编辑不属于当前 1.1 的创作流程,视频编辑页面应继续使用兼容的 1.0 路径。

如果你的任务是全新生成,请选择 Happy Horse 1.1。如果你的任务是编辑已有视频,请使用视频编辑工作流,并预期它会继续绑定到受支持的 1.0 配置,直到 1.1 的编辑支持被正式文档化。

在这里试试:生成一个 Happy Horse 1.1 视频


提示词技巧:如何获得更好的 Happy Horse 1.1 结果

Happy Horse 1.1 更偏好结构清晰的输入。提示词仍然需要明确描述运动、镜头和约束条件。

Text-to-video 提示词公式

使用以下结构:

  1. 主体和场景
  2. 运动或动作
  3. 镜头运动
  4. 光线与氛围
  5. 风格边界
  6. 画幅比例或平台语境

示例:

夜晚,一只玻璃香水瓶静置在潮湿的黑色石面上,琥珀色薄雾在其周围缓缓飘散,慢速电影感推进镜头,浅景深,高级商业布光,真实反射,无文字,16:9。

Image-to-video 提示词公式

以图像为锚点,并要求克制的运动:

为首帧人像加入轻微眨眼、自然呼吸、柔和发丝摆动和缓慢的电影感推进镜头。保留面部、服装、光线和背景构图。

Reference-to-video 提示词公式

为每张参考图分配任务:

[Image 1] 中的人物走过 [Image 3] 中的雨夜城市,穿着 [Image 2] 中的夹克,手持 [Image 4] 中的产品。保持 [Image 5] 中温暖的路灯氛围,使用缓慢跟拍镜头和写实运动。

如果你想获取更完整的提示词库,可以从50 个真正有效的 Happy Horse AI 提示词开始,再根据你正在使用的 1.1 模式做调整。


核心结论

对于新的视频生成任务,Happy Horse 1.1 应该成为你的默认 Happy Horse 模型。它强化了三条最重要的创作路径:纯提示词场景、首帧动画,以及多参考一致性。

最简单的选择方式如下:

你的任务使用这个模式
你只有一个想法Happy Horse 1.1 text-to-video
你有一张很强的图片Happy Horse 1.1 image-to-video
你需要人物、道具或风格一致性Happy Horse 1.1 reference-to-video
你现在就需要视频编辑Happy Horse 1.0 video edit

截至 2026 年 6 月,这就是版本之间的边界。Happy Horse 1.1 已经非常值得用于新的生成任务,但目前还不应被视为视频编辑的替代方案。

AI 视频生成器开始,选择 Happy Horse 1.1,然后根据你实际拥有的输入类型选择对应模式。


常见问题

Happy Horse 1.1 已经上线了吗?

是的。Happy Horse 1.1 已在 Try Happy Horse AI generator 中提供,支持 text-to-video、image-to-video 和 reference-to-video 工作流。

Happy Horse 1.1 有哪些新内容?

Happy Horse 1.1 在 T2V、I2V 和 R2V 工作流中提升了提示词理解、运动流畅度、视觉一致性和输出质量。尤其是在需要更好的首帧动画或多参考控制时,它会特别有用。

Happy Horse 1.1 支持 image-to-video 吗?

支持。Happy Horse 1.1 支持 image-to-video。使用高质量的首帧图像,并要求与源构图相匹配的运动即可。

Happy Horse 1.1 支持 reference-to-video 吗?

支持。Happy Horse 1.1 支持 reference-to-video。当你需要更强的人物、服装、物体或风格一致性时,这是最佳模式。

Happy Horse 1.1 支持视频编辑吗?

在当前面向用户的 1.1 创作流程中还不支持。目前,视频编辑工作流请使用 Happy Horse 1.0,而 1.1 用于 text-to-video、image-to-video 和 reference-to-video。

我应该选择 Happy Horse 1.0 还是 1.1?

新的生成任务请选择 Happy Horse 1.1。如果你明确需要仍然基于 1.0 路径文档的视频编辑工作流,请选择 Happy Horse 1.0。


推荐阅读