AI
Open AI Sora – revoluce ve videotvorbě?
15. února 2024 byl uveden nový model umělé inteligence od společnosti Open AI. Sora je generativní model založený na principu text-to-video. To znamená, že poté, co je napsán a vložen prompt, čili příkaz, Sora vytvoří video, které odpovídá danému textu.
Například je-li vložen příkaz: „Nádherně ztvárněný papírový svět korálového útesu, bohatý na barevné ryby a mořské tvory,“ model Sora vytvoří video, které může vypadat následovně:
Snímek z videa. Zdroj: Youtube Open AI
Jak Sora funguje?
Podobně jako jiné text-to-image generativní modely, tedy modely tvořící obrázky na základě textového příkazu, jakými jsou například DALL•E 3, StableDiffusion či Midjourney, funguje Sora na principu difuze. To znamená, že každý snímek videa začíná statickým šumem a postupně se pomocí strojového učení proměňuje do podoby odpovídající textu v zadání. Některá videa mohou dosahovat délky až 1 minuty.
„Sora je schopná generovat složité scény s více postavami, konkrétními typy pohybů a přesnými detaily objektu a pozadí. Model rozumí nejen tomu, co uživatel v promptu požaduje, ale také tomu, jak tyto věci vypadají ve fyzickém světě. Model má také hluboké porozumění jazyku, což mu umožňuje přesně interpretovat zadání a generovat poutavé postavy, které vyjadřují živé emoce. Sora také dokáže v jednom vygenerovaném videu vytvářet více záběrů, které přesně zachovávají postavy a vizuální styl,“ přibližuje vlastnosti a schopnosti této generativní umělé inteligence společnost Open AI.
Snímek z videa vygenerovaného Sorou. Zdroj: India Today
Kdo má k modelu přístup?
Model nebyl prozatím zpřístupněn veřejnosti. Možnost vytvářet videa má pouze hrstka výzkumníků patřících do takzvaného red teamu, tedy „červeného týmu“. Tým je tvořen experty z oblasti misinformací, nenávistného obsahu či zaujatosti. Jejich úkolem je identifikovat a opravit chyby v modelu, než bude volně vypuštěn pro širokou veřejnost. Model byl také zpřístupněn několika umělcům, designerům a filmařům, aby pomohli model co nejlépe optimalizovat pro kreativní práci.
„Momentální verze modelu má své slabiny. Může mít potíže s přesným simulováním fyziky složitých scén a nemusí nutně rozumět konkrétním případům příčiny a následku. Například osoba může ukousnout kousek z cukroví, ale poté se na něm neobjeví otisk zubů.
Model se také může mýlit v prostorových detailech v zadání. Například může zaměnit levou a pravou stranu, či může mít problémy s přesným popisem událostí, které probíhají v čase. Jako je kupříkladu sledování konkrétní trajektorie kamery,“ jak uvedla Open AI.
Zdroj: webová stránka Open AI
Využití v marketingu
Možné začlenění Sory do procesu tvorby reklamních kampaní přináší významné výhody. Zefektivnila by výrobní proces videí a snížila náklady, což by umožnilo brandům zaměřit se více na strategické a kreativní aspekty.
Umožnila by také účinně personalizovat tvořený obsah. Reklamní spoty by vznikaly na míru dle konkrétních zájmů cílového publika a jeho chování, a to díky jednomu promptu obsahujícímu potřebné informace.
Díky rychlosti tvorby obsahu by brandy mohly experimentovat s velkým množstvím reklamního materiálu a testovat ho se značně nížšími náklady než doposud. To by vedlo k produkci nových, efektivnějších strategií řízených výkonostními daty.
Sora a jí podobné modely pravděpodobně zásadně ovlivní i jiné oblasti zahrnující videotvorbu. Zejména pak filmový průmysl či sociální média a další platformy jako Youtube nebo Twitch.
Jaké existují alternativy?
K modelu existuje několik významných alternativ fungujících na obdobném principu.
Nejznámější alternativou k je Runway Gen-2. Stejně jako Sora, i tento nástroj využívá textově generativní umělé inteligence k vytváření videí. Momentálně je dostupný na webových stránkách jak pro počítače, tak pro mobilní zařízení.
Další alternativou je model Lumiere od společnosti Google. Ten je momentálně dostupný jako rozšíření pro PyTorch framework pro hluboké učení v Pythonu, jednom z programovacích jazyků.
I společnost Meta má vlastní obdobu této AI. Make-a-Video bylo oznámeno již v roce 2022, a podobně jako Lumiere je dostupné prostřednictvím rozšíření pro PyTorch.
Snímek z videa vygenerovaného s Runway Gen-2. Zdroj: Youtube Runway Gen 2
JAK CITOVAT?
MIČKA Matěj. Komentář: Open AI Sora – revoluce ve videotvorbě?. Rohlíčková, Františka, editor. In: Markething [online], 2024. ISSN 1805 – 4991. Dostupné z: https://markething.cz/open-ai-sora-revoluce-ve-videotvorbe
ZDROJE:
https://openai.com/sora
https://www.datacamp.com/blog/openai-announces-sora-text-to-video-generative-ai-is-about-to-go-mainstream
https://happyfutureai.com/the-revolutionary-impact-of-sora-ai-on-the-movie-industry-a-glimpse-into-the-future-of-film-production/
https://lumiere-video.github.io
https://618media.com/en/blog/sora-for-advertising-strategies-and-examples/#introduction-to-sora-in-advertising
https://research.runwayml.com/gen2
https://openai.com/form/red-teaming-network
https://theconversation.com/openais-new-generative-tool-sora-could-revolutionize-marketing-and-content-creation-223806
https://www.midjourney.com/homehttps://community.openai.com/t/first-mobile-apps-are-advertising-with-sora-scam-or-true/664941
https://stability.ai/stable-video
https://www.novinky.cz/clanek/internet-a-pc-software-sora-zaplavuje-socialni-site-dalsi-varka-realistickych-videi-40461808
https://openai.com/dall-e-3
https://pytorch.org
https://ct24.ceskatelevize.cz/clanek/veda/je-tu-sora-umela-inteligence-schopna-vytvaret-realisticke-video-experti-upozornuji-na-rizika-346222