Happy Horse 1.1 von Alibaba ist jetzt live — lies, was sich im 1.1 Update geaendert hat bevor du generierst. Guide lesen →
Try Happy Horse AI Logo

TryHappyHorseAI

Anleitung für den Happy Horse 1.1 Generator: Text, Bild, Referenz

Autor: Happy Horse AI Team|Zuletzt aktualisiert: Juni 2026

Happy Horse 1.1 lässt sich am einfachsten nutzen, wenn Sie mit der richtigen Generator-Seite starten. Verwenden Sie Text-to-Video, wenn die Idee nur als Prompt existiert, Image-to-Video, wenn Sie bereits ein starkes erstes Frame haben, und Reference-to-Video, wenn Konsistenz bei Charakteren, Produkten oder Stil wichtiger ist als maximale Prompt-Freiheit.

Wir haben die Screenshots in diesem Leitfaden am 24. Juni 2026 aus dem live geschalteten TryHappyHorseAI-Generator aufgenommen, nachdem die öffentlichen Seiten vollständig geladen waren. Wenn Sie zuerst einen breiteren Überblick über das Release möchten, lesen Sie Happy Horse 1.1 ist live: Was sich geändert hat und wie man es nutzt. Sie können auch im Hub für den Happy Horse AI Videogenerator starten, wenn Sie vor der Auswahl einer speziellen Seite alle Erstellungsmodi vergleichen möchten. Dieser Artikel ist die praktische Ergänzung dazu: welche Seite Sie öffnen sollten, welche Einstellungen wichtig sind, wie Sie den Prompt schreiben und welche Beispiele Sie sich ansehen sollten.

Happy Horse 1.1 Generator-Startseite mit Text-, Bild- und Referenzvideo-Modi

Die schnelle Workflow-Übersicht

Die drei Erstellungsseiten von Happy Horse 1.1 sind aus gutem Grund getrennt. Alle erzeugen Videos, aber jede erwartet ein anderes Ausgangsmaterial.

SeiteStart mitAm besten geeignet fürHier öffnen
Text to VideoEine geschriebene SzeneKonzeptclips, filmische Tests, Social-Ideen, WerbevariantenText to Video
Image to VideoEin erstes EinzelbildProduktanimationen, Porträts, Poster, visuelle LoopsImage to Video
Reference to VideoBis zu 9 ReferenzbilderCharakteridentität, Kleidung, Produktdetails, wiederkehrender KampagnenstilReference to Video

Der Fehler, den Sie vermeiden sollten, ist, einen längeren Prompt zu verwenden, um den falschen Modus auszugleichen. Wenn Sie bereits das exakte Produktfoto haben, ist Image-to-Video Text-to-Video in der Regel überlegen. Wenn dieselbe Person oder dasselbe Outfit in einer neuen Szene erhalten bleiben soll, ist Reference-to-Video meist beiden anderen Modi überlegen.

1. Text to Video: Die Szene von Grund auf aufbauen

Verwenden Sie Text to Video, wenn die Szene noch flexibel ist. Dies ist der schnellste Modus, um Ideen zu erkunden, weil der Prompt die gesamte Aufnahme trägt: Motiv, Aktion, Kameraführung, Umgebung, Licht, Stimmung und Audioanweisung.

Happy Horse 1.1 Text-to-Video-Generatorseite mit Prompt, Seitenverhältnis, Dauer, Seed, Audio, Vorschau und Beispielen

Die wichtigsten Steuerelemente auf dieser Seite sind:

SteuerungPraktische Verwendung
ModelWählen Sie Happy Horse 1.1 für neue T2V-Arbeiten.
PromptBeschreiben Sie die sichtbare Szene, die Kamerabewegung, die Stimmung und das Audio.
ResolutionVerwenden Sie 720p für schnellere Iterationen und 1080p für stärkere finale Renderings.
Aspect ratioWählen Sie das Zielformat vor der Generierung: 16:9, 9:16, 1:1, 4:3, 3:4, 4:5, 5:4, 9:21 oder 21:9.
DurationWählen Sie eine kurze Clip-Länge von 3 bis 15 Sekunden.
SeedVerwenden Sie denselben Seed erneut, wenn Sie einen besser reproduzierbaren Variationspfad möchten.
Generate audioLassen Sie diese Option aktiviert, wenn die Szene von Dialog, Atmosphäre oder Aktionssound profitiert.

Die sauberste Prompt-Formel für Text-to-Video ist:

Subjekt + Aktion + Umgebung + Kamerabewegung + Licht + Stimmung + Audio-Hinweis + Format

Beispiel:

Eine professionelle Balletttänzerin führt einen kraftvollen Grand Jeté über eine schwach beleuchtete Bühne aus, die Arme ausgestreckt, das Tutu fließt in Zeitlupe. Die Kamera verfolgt sie aus einem niedrigen seitlichen Winkel, warme Scheinwerfer erzeugen lange Schatten auf dem Boden, filmische Bühnenbeleuchtung, subtile Stoffbewegung, 10 Sekunden, 16:9.

Die aktuell hervorgehobenen T2V-Beispiele sind nützlich, weil sie verschiedene Arten von Kontrolle zeigen: Dialoge mit mehreren Personen, Kampfchoreografie, One-Take-Bewegung, Sportdynamik und Ballett. Achten Sie beim Analysieren weniger auf das Motiv und mehr auf die Struktur: Die stärkeren Beispiele beschreiben, wer in der Szene ist, wie sich die Kamera bewegt, was sich im Verlauf verändert und was das Audio tun soll.

Text-to-Video-Beispiele zum Studieren

Das Ballettbeispiel ist ein sauberes Prompt-first-Beispiel, weil der Prompt ein einzelnes Motiv, eine Bühnenumgebung, einen Kamerastil und ein klares Bewegungs-Vokabular vorgibt.

Das Beispiel mit mehreren Personen ist nützlich für dialogorientiertes Prompting. Achten Sie darauf, wie der Prompt Szene, Motive, Bewegung und Audio-Momente trennt, anstatt den gesamten Clip als eine allgemeine Anweisung zu behandeln.

2. Image to Video: Ein erstes Frame animieren

Verwenden Sie Image to Video, wenn Sie bereits das gewünschte visuelle Frame haben. Das hochgeladene Bild übernimmt einen großen Teil der Arbeit, daher sollte der Prompt die Bewegung steuern, statt die Aufnahme neu zu erfinden.

Happy Horse 1.1 Image-to-Video-Generatorseite mit Upload für erstes Frame, Bewegungs-Prompt, Auflösung, Dauer, Seed, Vorschau und Beispielen

Image-to-Video ist am stärksten, wenn das Quellbild bereits Folgendes aufweist:

  • ein klares Hauptmotiv
  • eine saubere Lichtführung
  • gut lesbare Tiefenstaffelung von Vorder- und Hintergrund
  • den gewünschten Zuschnitt für das finale Video
  • genügend Details, damit das Modell Identität oder Produktform beibehält

Die praktische Prompt-Formel lautet:

Das hochgeladene Bild bewahren + logische Bewegung hinzufügen + Kamerabewegung hinzufügen + Schlüsseldetails schützen

Beispiel für ein Produktbild:

Animiere die Parfümflasche im ersten Frame mit einer langsamen filmischen Kamerafahrt nach vorn, sanftem bernsteinfarbenem Nebel um die Basis, subtilem Lichtverlauf über das Glas, realistischen Reflexionen, bewahre Flaschenform, Etikett, Farbe und Tischkomposition.

Beispiel für ein Porträt:

Animiere das Porträt mit subtilem Blinzeln, natürlicher Atmung, sanfter Haarbewegung und einer langsamen Kameradrift. Bewahre das Gesicht, das Outfit, die Hintergrundkomposition und das ursprüngliche Licht.

Für diesen Modus sollten Sie den Zuschnitt vor dem Upload festlegen. Wenn Sie ein vertikales Kurzvideo möchten, bereiten Sie ein vertikales erstes Frame vor. Wenn Sie einen Widescreen-Loop für eine Landingpage möchten, bereiten Sie ein Widescreen-erstes-Frame vor. Image-to-Video ist nicht der richtige Ort, um das Modell zu bitten, eine fertige Komposition radikal neu zu кадrieren.

Die aktuell hervorgehobenen I2V-Beispiele sind gute Referenzen für unterschiedliche Aufgaben mit Quellbildern: eine Actionszene im Klassenzimmer, ein detailreiches Handwerksbild, eine Parfüm-Produktaufnahme und eine Szene im Stil einer antiken Taverne. Das Muster ist konsistent: zuerst ein starkes Quellbild, dann zurückhaltende Bewegung.

Image-to-Video-Beispiele zum Studieren

Das Parfümbeispiel ist das am leichtesten wiederverwendbare I2V-Muster für kommerzielle Arbeiten: Produkt bewahren, Atmosphäre hinzufügen und dann Kamera- sowie Lichtbewegung das Premium-Gefühl erzeugen lassen.

Das Kampfbeispiel im Klassenzimmer ist ein anspruchsvollerer I2V-Fall. Es ist nützlich, weil der Prompt sein Detailbudget für Ursache-Wirkung-Aktionen, Interaktion mit der Umgebung und Synchronisierung der Kamera einsetzt.

Für einen ausführlicheren Leitfaden zu diesem Workflow lesen Sie Happy Horse AI Image to Video: Vollständiger Leitfaden mit Beispielen.

3. Reference to Video: Identität und Stil bewahren

Verwenden Sie Reference to Video, wenn ein Prompt allein nicht ausreicht. In diesem Modus können Sie mehrere Referenzen hochladen und beschreiben, wie sie das generierte Video steuern sollen.

Happy Horse 1.1 Reference-to-Video-Generatorseite mit Mehrfachbild-Upload, Szenen-Prompt, Seitenverhältnis, Dauer, Seed, Vorschau und Beispielen

Happy Horse 1.1 unterstützt in diesem Workflow bis zu 9 Referenzbilder. Der wichtige Punkt ist nicht nur das Hochladen der Bilder, sondern die klare Benennung ihrer Rollen im Prompt.

Verwenden Sie diese Struktur:

Verwende character1 für [Identität/Gesicht/Outfit].
Verwende character2 für [zweite Person oder Kreatur].
Verwende image3 für [Ort/Produkt/Stil].
Beschreibe die Aktion, die Kamera, das Licht und das Audio.

Beispiel:

Verwende character1 als Schwertkämpfer und bewahre sein Gesicht, seine schwarze Robe und sein silbernes Haar. Verwende character2 als Drachenprinzessin und bewahre ihre Krone und ihre schuppenartige Schulterrüstung. Sie stehen sich in einem regnerischen Palasthof gegenüber, langsame kreisförmige Kamerabewegung, dramatisches Laternenlicht, zurückhaltende Martial-Arts-Bewegung, filmischer Fantasy-Realismus, 16:9.

Reference-to-Video eignet sich am besten für:

  • konsistente Charaktere über mehrere Szenen hinweg
  • Storytelling mit mehreren Charakteren
  • Produktvideos, bei denen der Artikel klar erkennbar bleiben muss
  • Influencer- oder Presenter-Konzepte mit stabilen Outfit- und Gesichtsdetails
  • Werbekampagnen, in denen dieselbe visuelle Sprache wiederholt werden soll

Die aktuell hervorgehobenen R2V-Beispiele decken die richtige Bandbreite ab: Martial-Arts-Szenen, Fantasy-Charakter-Paarungen, Ausdrucksveränderungen, Live-Shopping-Präsentationen und objektfokussierte Prompts. Achten Sie beim Analysieren darauf, wie der Text die Referenzrollen zuweist. Ein vager Prompt wie „verwende diese Bilder“ ist schwächer als „verwende character1 für die Identität, image2 für das Outfit und image3 für die Produktform“.

Reference-to-Video-Beispiele zum Studieren

Das Martial-Arts-Beispiel ist ein direktes Rollen-Mapping-Beispiel: image1 und image2 werden als die beiden Kämpfer behandelt, während der Prompt die gemeinsame Szene und Aktion definiert.

Das Live-Shopping-Beispiel zeigt, warum R2V auch jenseits von Fantasy oder Action nützlich ist. Der Prompt ordnet Referenzen Moderatorin, Outfit, Produkt und Wohnumgebung zu und gibt dann zeitlich abgestimmte Sprachmomente vor.

Einstellungen, die auf allen drei Seiten wichtig sind

Die meisten fehlgeschlagenen Generierungen entstehen durch eine Diskrepanz zwischen Absicht und Einstellungen, nicht durch ein einzelnes schlechtes Adjektiv im Prompt.

EinstellungSo verwenden Sie sie
DurationStarten Sie zum Testen mit 5 Sekunden. Verwenden Sie 8–10 Sekunden, wenn die Bewegung Zeit zur Entwicklung braucht. Vermeiden Sie zu viele Aktionsmomente in 3 Sekunden.
ResolutionIterieren Sie in 720p; wechseln Sie zu 1080p, wenn das Konzept eine Verfeinerung wert ist.
Aspect ratioFür Text-to-Video und Reference-to-Video legen Sie das finale Plattformverhältnis vor der Generierung fest. Für Image-to-Video bereiten Sie das erste Frame im gewünschten Zuschnitt vor.
SeedVerwenden Sie ihn erst, wenn Sie eine Prompt-Richtung haben, die sich zu erkunden lohnt. Er eignet sich besser für kontrollierte Variationen als zum Retten eines schwachen Prompts.
AudioAktivieren Sie Audio, wenn Dialog, Atmosphäre, Musik oder Aktionssound Teil der Szene sind. Wenn Sie einen stillen visuellen Loop benötigen, sagen Sie das im Prompt.
Reference imagesVerwenden Sie lieber weniger, dafür klarere Referenzen, bevor Sie alle 9 hochladen. Jede Referenz sollte eine Aufgabe haben.

Wenn Sie Prompts von Grund auf schreiben, behalten Sie 50 Happy Horse AI Prompts, die tatsächlich funktionieren als Begleitung geöffnet. Die Beispiele dort sind ältere 1.0-Muster, aber die Prompt-Struktur lässt sich weiterhin gut auf 1.1 übertragen.

Wiederverwendbare Prompt-Vorlagen

Text-to-video-Vorlage

[Subjekt] [führt Aktion aus] in [Umgebung]. Die Kamera [Bewegung], mit [Licht] und [Stimmung]. Füge [Audio-Hinweis] hinzu. Behalte [Stilvorgabe] bei. Format: [Seitenverhältnis], [Dauer].

Image-to-video-Vorlage

Animiere das hochgeladene Bild mit [kleiner Bewegung], [Kamerabewegung] und [Umgebungsdetail]. Bewahre [Identität/Produktform/Komposition/Licht]. Vermeide Änderungen an [geschütztem Detail].

Reference-to-video-Vorlage

Verwende character1 als [Rolle] und bewahre [Identitätsdetails]. Verwende image2 als [Stil-/Orts-/Produktreferenz]. Erzeuge [Szenenaktion] mit [Kamerabewegung], [Licht] und [Audio/Stimmung]. Halte alle wichtigen Referenzen konsistent.

Häufige Fehler

Fehler 1: Text-to-Video für eine feste Identität verwenden.
Wenn die Identität stabil bleiben muss, verwenden Sie stattdessen Reference-to-Video.

Fehler 2: Ein schwaches erstes Frame hochladen.
Image-to-Video kann schlechtes Licht, unruhige Komposition oder unklare Motividentität nicht zuverlässig korrigieren.

Fehler 3: Jedes Referenzbild verwenden, nur weil es möglich ist.
Neun Referenzen sind verfügbar, aber drei klare Referenzen sind oft besser als neun redundante.

Fehler 4: Das Zielformat vergessen.
Ein vertikales Video im TikTok-Stil und ein Widescreen-Clip im YouTube-Stil sollten nicht mit demselben Verhältnis beginnen.

Fehler 5: Kurze Laufzeiten überladen.
Verlangen Sie nicht fünf Kamerabewegungen, drei Emotionen und eine vollständige Aktionssequenz in einem 5-Sekunden-Clip. Wählen Sie den einen Moment, der wirklich zählt.

Empfohlene Startrezepte

ZielSeiteStarteinstellungenPrompt-Richtung
Schnelle KonzeptszeneText to Video720p, 5 s, ZielverhältnisKlares Motiv, eine Aktion, eine Kamerabewegung
Social-Ad-ProduktloopImage to VideoProduktbild, final 1080pProdukt bewahren, Nebel/Lichtverlauf/langsame Fahrt hinzufügen
Story-Moment mit CharakterReference to Video2–4 Referenzen, 5–8 scharacter1, character2, Ort/Stil zuordnen
Dialog- oder AtmosphäretestText oder ReferenceAudio an, 5–8 sGesprochene Zeile oder Klangbett direkt formulieren
KampagnenkonsistenzReference to VideoDasselbe Referenzset über Versuche hinwegReferenzrollen stabil halten, Szenenaktion variieren

FAQ

Mit welchem Happy Horse 1.1-Modus sollte ich am besten starten?

Starten Sie mit Text-to-Video, wenn Sie nur eine Idee haben, mit Image-to-Video, wenn Sie bereits ein fertiges Standbild haben, und mit Reference-to-Video, wenn Identität, Produktform, Kleidung oder Stilkonsistenz wichtig sind.

Unterstützt Happy Horse 1.1 Image-to-Video?

Ja. Happy Horse 1.1 unterstützt Image-to-Video auf der speziellen Seite Image to Video. Laden Sie ein erstes Frame hoch und verwenden Sie dann den Bewegungs-Prompt, um Kamerabewegung und Szenenbewegung zu beschreiben.

Wie viele Referenzbilder kann ich verwenden?

Der Reference-to-Video-Workflow von Happy Horse 1.1 unterstützt bis zu 9 Referenzbilder. Verwenden Sie im Prompt klare Rollenbezeichnungen wie character1, character2 oder image3, damit das Modell weiß, was jede Referenz steuert.

Sollte ich 720p oder 1080p verwenden?

Verwenden Sie 720p für schnelleres Testen von Prompts und 1080p, wenn Sie bereit sind, eine starke Richtung auszuarbeiten. Die Auflösung behebt keinen schwachen Prompt, daher sollten Sie zuerst an der Szenenstruktur iterieren, bevor Sie mehr in die finale Qualität investieren.

Ersetzt Happy Horse 1.1 die Videobearbeitung?

Noch nicht für jeden Workflow. Happy Horse 1.1 ist der Standard für Text-to-Video, Image-to-Video und Reference-to-Video. Wenn Sie ein bestehendes Video bearbeiten müssen, verwenden Sie den aktuellen Video-Edit-Workflow, bis die 1.1-Bearbeitungsunterstützung Teil des öffentlichen Generator-Workflows ist.

Testen Sie die drei Happy Horse 1.1-Seiten

Der einfachste nächste Schritt ist, die Seite zu öffnen, die zu Ihrem Ausgangsmaterial passt:

Wenn Sie noch entscheiden, was sich am Modell selbst geändert hat, beginnen Sie mit dem Happy Horse 1.1 Release-Leitfaden und kommen Sie dann hierher zurück, um die drei Workflows nebeneinander zu testen.