Autori :
(1) Vivian Liu, Univerzitet Columbia (vivian@cs.columbia.edu);
(2) Rubaiat Habib Kazi, Adobe Research (rhabib@adobe.com);
(3) Li-Yi Wei, Adobe Research (lwei@adobe.com)
(4) Matthew Fisher, Adobe istraživanje (matfishe@adobe.com);
(5) Timothy Langlois, Adobe Research (tlangloi@adobe.com);
(6) Seth Walker, Adobe istraživanje (swalker@adobe.com);
(7) Lydia Chilton, Univerzitet Columbia (chilton@cs.columbia.edu)
Authors:
(1) Vivian Liu, Univerzitet Columbia (vivian@cs.columbia.edu);
(2) Rubaiat Habib Kazi, Adobe Research (rhabib@adobe.com);
(3) Li-Yi Wei, Adobe Research (lwei@adobe.com)
(4) Matthew Fisher, Adobe istraživanje (matfishe@adobe.com);
(5) Timothy Langlois, Adobe Research (tlangloi@adobe.com);
(6) Seth Walker, Adobe istraživanje (swalker@adobe.com);
(7) Lydia Chilton, Univerzitet Columbia (chilton@cs.columbia.edu)
Levo od stola
2 Povezani radovi
2.2 Kreativnost podrška alata za animaciju
2.3 Generativni alati za dizajn
4 Logomotion sistem i 4.1 ulaz
4.2 Preproces vizualnih informacija
4.3 Vizualno utemeljena sinteza koda
5.1 Procjena: popravak programa
7 Diskusija i 7.1 Odstupanje od predloška
7.2 Generiranje koda oko vizualnih
Abstrakcija
Animirani logotipi su uvjerljiv i svestran način na koji se pojedinci i brendovi predstavljaju na mreži. Ručno pisanje ovih logotipa može zahtijevati značajnu umjetničku vještinu i napor. Da bismo pomogli početnicima da animiraju logotipe, dizajneri trenutno nude predloške i predloške za animaciju. Međutim, ova rješenja mogu biti ograničena u njihovom ekspresivnom rasponu. Veliki jezični modeli imaju potencijal da pomognu početnicima da kreiraju animirane logotipe generiranjem animiranog koda koji je prilagođen njihovom sadržaju. U ovom članku uvodimo LogoMotion, sistem zasnovan na LLM-u koji uzima u slojni dokument i generira animirane logotipe kroz vizualno utemeljenu sintezu programa. Uvodimo tehnike
1 Uvod
Pokret predlaže život, i kao takav, pokret je dimenzija koju dodajemo našim dizajnom kako bi ih učinili dinamičnijim i privlačnijim. Animacija je poseban tip oblika dizajna koji smo stvorili kako bismo nam pomogli da staticne dizajne uvežbamo u više medijsko bogate i interaktivne kontekste. Poseban tip animiranog sadržaja koji često kreiramo je animirani logo. Animacija omogućava logotipima, koji su definisani kao „vizualne figureheads“ brendova [25], da se bolje integriraju u videozapise, uživo prenose, web stranice i društvene medije. Dobro izvedena animacija može brzo da uključi publiku, predstavi brend ili pojedinca online, i podiže sadržaj da ima više vizualnog interesa.
Pisanje animiranog logotipa je izazov. Logotipi su često više nego samo par ikona sa tekstom. Budući da mogu imati različite rasporede, slojeve, boje i tipografiju, oni mogu imati veliku raznolikost i biti složeni artefakti za animiranje. Za početnika dizajnera, može biti teško razumjeti koje elemente dizajna treba animirati, u kojem redoslijedu, i kako izgraditi uvjerljiv i pouzdan pokret. Postoji mnogo aspekata pokreta koje treba uzeti u obzir, kao što su brzina, vremenski period, pozicioniranje, trajanje, olakšavanje i ličnost pokreta (npr. igrački odmak protiv snažnog ulaza). Pored toga, kada logotipi imaju više elemenata dizajna, dizajneri takođe moraju razumeti kako grupe elemenata mogu sinhronizovati da
Iako postoji velika potražnja za animiranim sadržajem, teško je za ljude izvan dizajna pokreta da razviju tu vrstu stručnosti. Dizajnski alati kao što su Adobe Express, Canva i Figma često pružaju rješenja u obliku animiranih predloška i automatskih tehnika animacije [10, 12, 13]. Predlošci unapred popunjavaju rasporede logotipa s animacijama koje korisnici mogu prilagoditi. Oni ilustriraju kako korisnici mogu primijeniti pretpostavke pokreta (npr. slide, flicker, ili fade) na elemente logotipa kako bi stvorili profesionalno izgledajuće animacije. Međutim, predlošci se ne prilagođavaju uvek svakom slučaju upotrebe. Kada korisnici prave uređenja (npr. dodavanje / uklanjanje / zamjena elemenata logotipa) kako bi prilagodili predlo
Veliki jezični modeli (LLM) predstavljaju potencijal za animaciju contentaware. Oni mogu generisati animacijski kod koji je specifičan za elemente dizajna i njihov raspored na platnu. Koda je tekstualna reprezentacija koja se često koristi za pokretanje animacije [18, 33, 53], jer može precizno odrediti kako elementi interagiraju kroz vrijeme i prostor na platnu. Budući da LLM-ovi kodiraju ogromnu količinu svetskog znanja, mogu se osloniti na akcije i aktivnosti povezane sa sadržajem koji se animira i generisati gotovo beskonačan broj animacija. Ova otvorena generativna sposobnost može ići iznad opsega onoga što predlozi, pretpostavke i tehnike zasnovane na pravilima obično pokrivaju.
Nedavni napori učinili su LLM-ove više multimodalnim, tako da mogu uzeti i tekst i sliku kao ulaz, i pružiti vizualno utemeljene odgovore. To čini LLM-ove više primjenjivim u domenama poput animacije gde je vizualno razumijevanje platna važno. To otvara potencijal za korisnike da daju slike svog rasporeda na LLM-u i primaju animacije prilagođene njihovom rasporedu i elementima dizajna. Na primer, ako početnik dizajneri žele animirati taksi, mogli bi koristiti LLM da generišu kod da voze taksi na platnu. Ovaj kod mogao bi prevesti taksi objekt duž x-osovine pre nego što ga olakša u centar platna da podrazumeva stop-and-go-motion prikladnost taksija.
U ovom članku predstavljamo LogoMotion, metodu zasnovanu na LLM-u koja automatski animira statičke rasporede na način koji je svestan sadržaja. LogoMotion generira kod u dvostupanjskom pristupu koji uključuje vizualno utemeljenu sintezu programa i popravak programa. Prva faza uvodi multimodalne operatore LLM-a koji uzimaju u vizualnom kontekstu i 1) izgradnju tekstualne reprezentacije platna, 2) konceptualno grupisanje elemenata i 3) implementaciju animacijskog koda. Druga faza našeg pristupa uvodi tehniku za vizualno utemeljenu popravku programa, koja pomaže LLM-ovima da provjere ono što su generisali protiv originalnog rasporeda i razlike u debugiranju u ciljanom slojevnom načinu.
Naši doprinosi su sledeći:
• LogoMotion, sistem LLM koji koristi vizualno utemeljenu generaciju koda za automatsko generiranje animacija logotipa iz PDF-a. Sistem identificira vizualni sadržaj u svakom sloju, izlaže primarne i sekundarne elemente i stvara grupe elemenata. Na osnovu toga, sistem predlaže koncept dizajna (u tekstu) i koristi LLM za generisanje animacijskog koda. Korisnici mogu opcionalno poboljšati animaciju uređivanjem ili dodavanjem vlastitog koncepta dizajna.
• Vizualno utemeljena popravka programa, mehanizam koji omogućuje LLM-u da automatski detektira i debugira vizualne greške unutar svog generisanog animacijskog koda, stvarajući lanac povratnih informacija između koda generiranog od strane LLM-a i njegovih vizualnih izlaza.
• Tehnička evaluacija 276 animacija koja pokazuje da u poređenju sa Canva Magic Animate i ablatiranom verzijom sistema (bez faza za analizu hijerarhije i prijedloge koncepata dizajna), cjelovita linija LogoMotion-a proizvodi animacije koje su više svjesne sadržaja.
• Kvalitativna procjena početnih korisnika pokazujući da LogoMotion može brzo postići željenu animaciju uz minimalno ponavljanje.
Ovaj dokument je dostupan na archiv pod licencom CC BY-NC-ND 4.0 DEED.
Ovaj papir je
[1] U nastavku videa:
[2] Stranica projekta:https://vivian-liu.com/#/logomotion