Video je praktický návod na tvorbu personalizovaného AI avatara v HeyGen Avatar V — od nahrání záznamu přes ověření identity až po generování videa s vlastním hlasem nebo klonovaným hlasem. Ukazuje také, jak měnit vizuál avatara (pozadí, oblečení, prostředí) pomocí promptů a přiložených obrázků. Výsledná videa lze exportovat ve formátu pro YouTube, Instagram Reels nebo TikTok.
Při nahrávání zdrojového videa pro avatar stačí 15 sekund záznamu — důležité je přirozeně hýbat hlavou a rukama, aby se model naučil, jak vypadáš ze stran.
HeyGen ověřuje identitu přečtením zobrazeného textu do kamery, čímž brání tvorbě deepfake videí cizích osob.
Vizuál avatara lze měnit pomocí textových promptů (například 'přepiš scénu na podcast natáčený v lese') nebo přiložením referenčních obrázků — bez nutnosti nového nahrávání.
Při generování videa je lepší nahrát hlas přímo přes mikrofon než spoléhat na klonovaný hlas — výsledek je přirozenější.
Klonovaný hlas lze napojit přes API z 11Labs, což vyžaduje účet na 11Labs a mírně pokročilejší nastavení.
Výstupní video lze generovat ve formátu na výšku (Shorts, Reels, TikTok) i na šířku (YouTube), nastavení je součástí editoru před generováním.
Historie chatu se neukládá. Po opuštění stránky bude smazána.
HeyGen vydal novou verzi svých avatarů označenou Avatar V a Martin z kanálu Zaujaloma AI ji otestoval hned po spuštění. Video je čistý návod — bez zbytečné teorie, krok za krokem od vytvoření účtu až po hotové video s AI avatarem.
Prvním krokem je vytvoření samotného avatara. V menu HeyGen zvolíš sekci Avatars a klikneš na vytvoření nového. Máš dvě možnosti: klon reálné osoby, nebo fiktivní virtuální postava. Pro nejrealističtější výsledek volíš klon sebe sama. Záznam pořídíš přímo přes webkameru v prohlížeči, nebo uploaduješ vlastní video z telefonu či kamery. Minimální délka záznamu je 15 sekund. Důležité je přirozeně hýbat hlavou a rukama — model potřebuje vidět tvůj obličej z různých úhlů, ale extrémní pohyby nebo zakrývání tváře výsledek zhorší.
Součástí procesu je ověření identity. HeyGen zobrazí text v angličtině, který přečteš nahlas do kamery. Tento krok slouží jako pojistka proti deepfake zneužití — nelze tak jednoduše vytvořit avatar cizí osoby pouze z uploadovaného videa. Pokud nahrávání probíhá přes upload (ne přes webkameru přímo v HeyGen), ověření proběhne jako druhý krok a spočívá v přečtení číselného kódu. Celý proces ověření a tréninku avatara trvá podle videa jednu až dvě minuty.
Jakmile je avatar hotový, přichází zajímavější část — úprava vizuálu. V editoru klikneš na "Customize your look" a dostaneš se k presetům i volnému promptování. Do textového pole napíšeš například "změň pozadí na bílé" nebo "přepiš scénu na podcast natáčený v lese" a HeyGen vygeneruje nový vizuál se zachovaným obličejem. Lze také přiložit referenční obrázky — Martin ukázal příklad, kdy přidal fotku NFL stadionu a přilby a zadal prompt, aby vypadal jako hráč NFL. Výsledky se liší — některé varianty jsou velmi věrné originálu, jiné méně. Doporučený přístup je generovat víc variant a vybrat ty nejlepší.
Samotné video se vytváří v sekci New Video. Vyberáš vizuál avatara, nastavíš poměr stran (na šířku pro YouTube, na výšku pro Shorts či Reels) a zadáváš obsah — buď nahraješ hlas přímo přes mikrofon, nebo vložíš textový script. Klonovaný hlas z textu funguje, ale Martin explicitně říká, že nahrávka přes mikrofon zní přirozeněji. Pokročilejší možností je napojení hlasu z 11Labs přes API klíč — to vyžaduje účet na 11Labs a trochu více nastavení, ale dává větší kontrolu nad výsledkem.
Celkový workflow je přímočarý. Největší přidaná hodnota Avatar V oproti starším verzím je flexibilita vizuálních úprav přes prompty bez nutnosti nového natáčení — to výrazně snižuje čas potřebný na přípravu různých variant obsahu.