以下是我们测试中效果最佳的 Happy Horse AI 提示词。下方每个示例都是在构建 tryhappyhorseai.com 过程中运行的,其效果说明反映了模型实际的表现,而非泛泛的提示词编写建议。
截至 2026 年 4 月,Artificial Analysis 将 HappyHorse-1.0 列在其公开的文本转视频和图像转视频排行榜榜首。详细的第一方技术文档仍然有限,因此下文描述的提示词行为应被视为观察到的测试指南,而非官方供应商文档。
编写有效 Happy Horse AI 提示词的 5 条规则
在列表开始之前,请了解 Happy Horse AI 的响应机制。这五条规则源于数百次生成任务的系统测试。
规则 1:以主体而非动作开头。 HH 优先渲染主体。“一只金毛寻回犬”在“跑过高草地”之前,能给模型更多的锚定信息。以动词开头的提示词通常会产生模糊或不一致的主体。
规则 2:明确指定镜头风格。 HH 比大多数模型更精确地遵循镜头语言。“特写”、“跟踪镜头”、“广角全景镜头”和“POV(主观视角)”各自会产生显著不同的结果——不要将其留给偶然。
规则 3:添加光照条件。 “黄金时段”、“阴天”、“霓虹灯之夜”、“影棚灯光”——光照会显著影响模型的运动渲染。光照良好的提示词能产生更清晰的输出。
规则 4:对于物理效果较强的内容,包含运动描述词。 对于头发、水、布料、烟雾或火焰:添加“慢动作”、“运动模糊”或“流体动力学”以触发 HH 的物理渲染。没有这些提示,模型会默认只提供最少的运动细节。
规则 5:对于音频内容,请明确指定音频。 HH 与视频共同生成音频。如果你想要环境音,请明确说明:“背景咖啡馆噪音”、“可听见海浪声”、“有风声”。如果你正在生成一段人物讲话视频,请指定语言:“讲英语,语速自然。”
这五条规则是测试启发式方法,并非官方模型文档。它们来自我们多次的提示词运行。
类别 1:人物与肖像 (10 个提示词)
1. 电影式采访
"一位 30 多岁的短黑发女性正对着镜头说话,中景特写,左侧自然窗光,浅景深,柔和的散景背景,平静自信的表情,以自然语速讲英语" 预期输出:在我们的测试中,此提示词通常能生成清晰的唇形同步、逼真的皮肤纹理和稳定的头部追踪。
2. 街头肖像,黄金时段
"一名穿着海军蓝夹克的年轻男子在黄金时段缓慢走过繁忙的城市街道,从前方稍远处进行的跟踪拍摄,温暖的橙色光线照在他脸上,浅景深,抓拍纪录片风格" 预期输出:主体在动态背景下具有很强的运动一致性。
3. 工作中的老匠人
"特写镜头:饱经风霜的双手在陶轮上塑造粘土,缓慢向上摇摄,展现一位年迈日本男子专注的表情,温暖的工作室灯光,16毫米胶片颗粒效果" 预期输出:出色的手部细节。HH 能很好地处理纹理化的手和粘土的物理特性。
4. 舞者,影棚
"一名女性现代舞者在白色影棚背景下做着中段动作,高速慢动作,舞台左侧的强烈定向影棚灯光,伸展的四肢带有运动模糊,全身构图" 预期输出:慢动作下布料和肢体物理效果良好。复杂的扭曲动作有时会出错——为提高可靠性,请使用更简单的姿势。
5. 讲话人物,多语言
"一位身穿商务服装的专业韩国女性对着镜头说话,干净的白色背景,三点式影棚灯光,中景拍摄,以适中语速讲韩语" 预期输出:在我们的测试中,韩语讲话人物视频是多语言结果中最稳定的之一。
6. 户外玩耍的儿童
"一个 6 岁卷发红发女孩跑过阳光明媚的后院,广角拍摄,手持摄像机感,自然下午光,跑动的双腿有运动模糊,喜悦的表情" 预期输出:在我们的测试中,儿童主体的渲染通常表现良好,头发的运动也常能很好地保持。
7. 时尚模特,时尚大片
"一位身材高挑的模特身穿祖母绿丝绸连衣裙,在一个极简白色T台上走向镜头,慢动作,戏剧性的侧光,布料随动作荡漾,时尚杂志美学" 预期输出:出色的布料物理效果。丝绸和飘逸的材质渲染得非常自然。
8. 餐厅厨房里的厨师
"一位身穿白色制服的厨师在高火上用炒锅翻炒蔬菜,手部和锅具特写,厨房蒸汽升腾,翻炒动作有运动模糊,戏剧性的顶光,可听到滋滋声" 预期输出:火焰和蒸汽渲染良好。音频提示触发环境厨房声音。
9. 实验室里的科学家
"一名戴着安全眼镜的女科学家正在检查玻璃小瓶中发光的蓝色液体,极致特写,黑暗的实验室背景,周围设备灯光,细微的镜头眩光" 预期输出:液体物理效果和发光效果很强。适用于科技/科学品牌内容。
10. 街头音乐家
"一位吉他手在雨后湿滑的城市街道上夜间卖艺,中景拍摄,湿润路面上的霓虹灯反射,细雨轻轻落下,可听到原声吉他声,商店橱窗透出的暖钨灯光" 预期输出:在我们的测试中,这里的雨水和湿润表面的反射通常渲染得很好,环境音频也很可靠。
类别 2:自然与风景 (10 个提示词)
11. 日出时的海浪
"慢动作:海浪在日出时分拍打岩石海岸线,广角拍摄,温暖的粉色和橙色光线,海浪泡沫细节,前景岩石浅景深,可听到海浪声" 预期输出:在我们的测试中,海洋和海浪提示词是 HH 最可靠的类别之一。水体物理效果和泡沫通常看起来逼真。
12. 雨中森林
"一场小雨中的太平洋西北部茂密森林,静态广角拍摄,雨滴穿过清晨的微光洒落,水坑表面涟漪,中景有雾气,可听到雨打树叶声" 预期输出:雨滴物理效果和雾气渲染极佳。这是我们的基准提示词之一。
13. 沙漠延时摄影
"云层掠过红色岩石沙漠地貌的加速延时摄影,广角全景镜头,下午刺眼的阴影快速移动,深蓝色天空,温暖的赭石色岩石色调" 预期输出:云层运动良好。阴影移动的时间一致。
14. 城市雪景
"夜间,欧洲某宁静城市广场上的大雪,广角静态拍摄,路灯在飘落的雪花中形成光晕,积雪覆盖在石质表面,空旷的鹅卵石街道" 预期输出:雪花粒子物理效果很强。光晕和光散射渲染自然。
15. 水下海带森林
"阳光穿透水下海带森林,相机缓慢向上漂移,生物发光粒子,广角拍摄,深蓝绿色调色,完全寂静" 预期输出:水下光线和漂浮粒子是强大的输出类别。
16. 火山喷发,航拍
"无人机航拍视角:夜间,活跃的熔岩沿着黑暗火山山坡流下,从上方缓慢跟踪拍摄,发光的红橙色熔岩映衬着黑色岩石,冷却边缘升起蒸汽" 预期输出:熔岩发光和冷却效果渲染良好。物理效果复杂——添加“慢动作”以获得更好的细节。
17. 樱花飘落
"日本庭院中,樱花瓣从盛开的樱花树上飘落,慢动作,淡粉色花瓣映衬着柔和的灰色天空,下方有木凳和石径,柔和的春光" 预期输出:在我们的测试中,单个花瓣的运动是 HH 比较可靠的效果之一。
18. 平原上空的雷暴
"平坦草原上雷暴的延时摄影,黑暗戏剧性的天空,多道闪电照亮暴风云,远处可见雨幕,广角风景照" 预期输出:闪电分支渲染正确。暴风云运动一致。
19. 秋季森林漫步
"第一人称 POV 视角穿过茂密的秋季森林,橙红色树叶,透过树冠洒下的斑驳下午光,轻微的相机晃动,脚下枯叶的沙沙声" 预期输出:POV 运动和树叶物理效果都渲染良好。树叶声音的音频触发器有效。
20. 北极冰洞
"半透明蓝色北极冰洞内部,缓慢摇摄,微弱的光线穿透冰顶,墙壁上的冰晶结构,近乎寂静,可听到微弱的风声" 预期输出:在我们的测试中,此场景中的冰块半透明度和内部光散射效果尤其突出。
类别 3:产品与商业 (10 个提示词)
21. 咖啡倾倒
"极致特写:热咖啡倒入白色陶瓷杯中,慢动作,蒸汽升腾,浓郁深色液体旋转,温暖影棚灯光,大理石表面,可听到倾倒声" 预期输出:极致特写下的液体物理效果非常强大。蒸汽渲染出色。
22. 香水瓶
"一个水晶香水瓶在反光黑色表面上缓慢旋转,影棚灯光带有柔和的镜面高光,喷嘴处以慢动作喷出雾气,深色优雅背景" 预期输出:玻璃折射和慢动作雾气都是 HH 的强大输出。
23. 运动鞋产品展示
"一双白色运动鞋在干净的白色表面上,缓慢 360 度旋转,戏剧性侧光带有锐利阴影,纹理和缝线极致细节,极简主义美学" 预期输出:细节保持一致的旋转。我们最常用的商业模板之一。
24. 新鲜水果,特写
"慢动作:水滴落在切片橙子上,极致特写,影棚背光,水花从表面溅开,鲜艳的柑橘色,高速慢动作" 预期输出:在我们的测试中,此尺度下的水滴撞击物理效果通常表现良好。
25. 威士忌酒杯
"一个水晶威士忌酒杯以慢动作注入琥珀色液体,低机位向上仰视,温暖的琥珀色背光,冰块带冷凝水,可听到倾倒声" 预期输出:液体颜色和玻璃物理效果结合起来是 HH 的强大组合。
26. 笔记本电脑特写
"一台纤薄的银色笔记本电脑在干净的白色桌面上打开,从关闭到打开的慢动作,屏幕以柔和渐变点亮,极简科技美学,冷色调影棚灯光" 预期输出:机械运动(铰链)渲染清晰。适用于科技产品演示。
27. 食物摆盘
"厨师的手将配菜放在一份优雅摆盘的餐厅菜肴上,极致特写,俯视镜头,来自附近窗户的柔和漫射自然光,菜肴冒着热气" 预期输出:手部与表面的互动渲染良好。蒸汽和灯光都可靠。
28. 手表产品图
"一块奢华手表在深色拉丝金属表面缓慢旋转,微距特写,镜面高光映照表盘和表圈,戏剧性定向影棚灯光" 预期输出:金属表面反射和小型机械细节很强。
29. 化妆品开箱
"优雅的双手以慢动作打开一个黑色磨砂化妆品盒,薄纸展开,一支口红在白色衬垫上显露,柔和漫射影棚灯光,高端极简主义美学" 预期输出:布料/薄纸物理效果和手部互动都渲染清晰。
30. 蜡烛燃烧
"一根厚厚的奶油色柱状蜡烛以慢动作燃烧,火焰极致特写,边缘蜡液汇聚融化,温暖的金色光线,黑暗背景,可听到微弱的噼啪声" 预期输出:在我们的测试中,火焰提示词是 HH 较强的类别之一,蜡烛融化通常看起来很自然。
类别 4:动作与运动 (10 个提示词)
31. 山路上的摩托车
"一辆哑光黑色摩托车行驶在山路急弯道上,路面水平低位跟踪拍摄,背景树木有运动模糊,金色的下午晚些时候光线,可听到引擎声" 预期输出:车辆跟踪与环境模糊渲染一致。
32. 跑酷运动员
"一名跑酷运动员在黄昏的城市环境中屋顶之间跳跃,广角拍摄跟踪跳跃,城市灯光开始出现,跳跃顶点慢动作" 预期输出:人体空中物理效果和慢动作顶点捕捉渲染良好。
33. 跑车展示
"一辆红色跑车在黑暗隧道中从静止加速,摄像机位于保险杠水平,运动模糊逐渐增强,隧道灯光从头顶划过,可听到引擎轰鸣声" 预期输出:运动模糊渐变和灯光条纹很强。引擎音频触发器有效。
34. 武术套路
"一名武术家在木地板上表演一套缓慢而有意的套路,广角拍摄,单一顶光源营造戏剧性阴影,慢动作,完全寂静" 预期输出:人体通过刻意动作的跟踪是可靠的。避免快速打击——缓慢、受控的动作渲染效果更好。
35. 水下游泳者
"一名奥运游泳运动员在水下划水中,侧面高速摄像机,气泡从手中拖出,光线从上方滤入,肢体有运动模糊,淡氯蓝色水" 预期输出:水下人体运动和气泡物理效果都渲染良好。
36. 篮球慢动作
"一个篮球在空中缓慢旋转,背景是体育馆,极致慢动作特写,细节丰富的皮革纹理,下方体育场灯光柔和散景,悬浮在完美静止中" 预期输出:极致慢动作下的旋转物体是可靠的。
37. 奔跑的马匹(显而易见的)
"一匹栗色马在开阔的田野上全速奔驰,侧面广角跟踪拍摄,金色的下午光线,马蹄扬起尘土,鬃毛和尾巴飘扬,可听到马蹄声" 预期输出:动物运动是 HH 的杰出能力。马匹的运动尤其渲染得非常自然——与产品名称相符。
38. 无人机竞速
"第一人称无人机 POV 视角高速穿过森林赛道,掠过的树木有运动模糊,斑驳的光线闪烁,急转弯带倾斜,可听到无人机马达的嗡嗡声" 预期输出:通过深度渲染环境的 POV 运动很强。
39. 玻璃上的雨滴赛跑
"雨滴在窗玻璃上竞速的极致特写,追踪其中一滴,水面折射出背后模糊的城市街道,慢动作" 预期输出:在我们的测试中,这是视觉上更引人注目的微观提示词之一,水折射通常表现良好。
40. 落叶,慢动作
"一片秋天的枫叶从树枝上极慢动作落下,微距镜头,下午晚些时候的背光,缓慢旋转,可听到环境森林声音" 预期输出:带有背光的单片树叶物理效果——我们最可靠的提示词之一。
类别 5:电影风格 (10 个提示词)
41. 35毫米黑色电影
"一名穿风衣的侦探在大雨中走过街灯下,低角度,高对比度黑白,35毫米胶片颗粒,阴影划过他的脸,可听到雨声和脚步声" 预期输出:带颗粒的高对比度单色渲染精美。黑色电影美学可靠。
42. 吉卜力工作室风格
"一个小女孩坐在高草地中,看着地平线上积聚的暴风云,广角拍摄,温暖的下午光,手绘天空美学,草地随风摇曳,柔和的管弦乐氛围" 预期输出:HH 能很好地模拟绘画/插画美学。虽然不是像素级精确的吉卜力风格,但能产生独特的柔和现实主义风格。
43. 韦斯·安德森式对称
"一位酒店礼宾员完美地站在一个柔和色调的大堂中央,对称构图,平光,中景拍摄,轻微拉远镜头,面无表情,复古服装" 预期输出:带有刻意平坦感的对称构图渲染一致。
44. 无人机史诗风景
"无人机航拍镜头拉远,展现日出时分的海岸悬崖,摄像机从海平面开始上升,温暖的粉色地平线,悬崖下方的白色海浪,汉斯·季默风格的环境配乐" 预期输出:无人机拉远镜头运动很强。音频情绪描述会影响生成的环境音。
45. 恐怖,走廊
"一条漫长黑暗的医院走廊,前方一盏闪烁的荧光灯,静态广角拍摄,一个影子穿过远端,压抑的寂静中可听到微弱的电流声" 预期输出:在我们的测试中,带有最小运动的静态氛围镜头通常是可靠的,灯光闪烁通常渲染自然。
46. 8毫米家庭录像
"夏天,一家人在后院烧烤,手持 8 毫米胶片美学,色彩偏向暖橙色,胶片颗粒,随意构图,背景中有奔跑的儿童,低沉的环境音" 预期输出:带有低保真退化感的复古胶片美学渲染一致。
47. 赛博朋克都市景观
"未来亚洲大都市中,霓虹灯照亮的街道在夜晚,雨水湿滑的路面,全息广告在头顶闪烁,行人撑着雨伞,从低位车辆进行的跟踪拍摄,可听到电子环境音乐" 预期输出:在我们的测试中,即使在复杂场景中,潮湿表面上的霓虹灯反射也表现出异常良好的效果。
48. 慢电视,风景
"黄昏时分河流的实时拍摄,静态广角,水流缓慢流过光滑的岩石,光线逐渐消退,环境河流声,无音乐,无剪辑" 预期输出:在我们的测试中,长时间静态自然主义镜头(带有渐变光线变化)通常是可靠的。
49. 新闻广播美学
"一位新闻主播在办公桌前,背景是广播演播室,三点照明,中景拍摄,直接对着镜头说话,中性表情,以沉稳语调讲英语" 预期输出:在我们的测试中,广播风格的讲话人物镜头是 HH 比较可靠的提示词类别之一。
50. 抽象动态图形
"流动的液态金属变形为几何形状,极致特写,黑暗背景,从银色到金色的彩虹色变,缓慢旋转,高镜面高光,完全寂静" 预期输出:抽象液态金属物理效果强大。此提示词始终能在第一次尝试时生成可用内容。
常见问题
Happy Horse AI 的最佳提示词格式是什么?
以主体开头,然后是镜头风格,接着是光照,最后是运动描述词。例如:“一只金毛寻回犬[主体]在黄金时段[光照]进行广角跟踪拍摄[镜头],在慢动作[运动]中跑过高草地。”此顺序与 HH 模型渲染的优先级相符。
Happy Horse AI 提示词应该多长?
20 到 60 个词之间。少于 20 个词,模型缺乏足够的上下文来生成一致的输出。超过 60 个词,模型会开始忽略后续指令。我们测试中的最佳长度是 30-45 个词。
Happy Horse AI 提示词支持镜头运动吗?
是的,并且比大多数同类模型更精确。“跟踪拍摄”、“推拉变焦”、“从左到右摇摄”、“拉远镜头以展现”、“无人机升起镜头”——所有这些都会产生显著不同的结果。请明确说明。
我可以在 Happy Horse AI 提示词中指定音频吗?
是的。HH 与视频共同生成音频。在你的提示词中添加“可听到[声音]”——“可听到雨打树叶声”、“可听到引擎轰鸣声”、“以自然语速讲英语”。这会激活音频合成路径。
我的 Happy Horse AI 提示词为什么不起作用?
常见问题:(1) 太模糊——“一辆汽车的酷炫视频”无法给模型提供任何锚定信息。(2) 主体过多——每次生成选择一个主要主体。(3) 美学冲突——“8毫米胶片颗粒和 4K 超清晰”相互抵消。(4) 快速运动没有运动描述词——对于物理效果较强的内容,添加“慢动作”或“运动模糊”。
结论
我们测试的主要经验很简单:Happy Horse AI 对具有明确主体、镜头、光照和运动意图的具体提示词响应最佳。直接复制这些提示词,或将它们用作起始模板。
在 Happy Horse AI 上尝试这些提示 → 使用 AI 创建视频
