102 रीडिंग

एआई के साथ स्थैतिक लोगो को गतिशील एनीमेशन में बदलें

द्वारा MLModel6m2025/06/15
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

LogoMotion एक एआई सिस्टम है जो उपयोगकर्ताओं को डिजाइन लेआउट का विश्लेषण करके और बड़े भाषा मॉडल का उपयोग करके कस्टम एनीमेशन कोड उत्पन्न करके लोगो को एनिमेट करने में मदद करता है।
featured image - एआई के साथ स्थैतिक लोगो को गतिशील एनीमेशन में बदलें
MLModel HackerNoon profile picture
0-item

लेखक :

(1) Vivian Liu, कोलंबिया विश्वविद्यालय (vivian@cs.columbia.edu)

(2) Rubaiat Habib Kazi, Adobe अनुसंधान (rhabib@adobe.com);

(3) Li-Yi Wei, एडोब रिसर्च (lwei@adobe.com);

(4) मैथ्यू फिशर, एडोब रिसर्च (matfishe@adobe.com);

(5) Timothy Langlois, Adobe अनुसंधान (tlangloi@adobe.com);

(6) सेथ वॉकर, एडोब रिसर्च (swalker@adobe.com);

(7) लिडिया चिल्टन, कोलंबिया विश्वविद्यालय (chilton@cs.columbia.edu)

Authors:

(1) Vivian Liu, कोलंबिया विश्वविद्यालय (vivian@cs.columbia.edu)

(2) Rubaiat Habib Kazi, Adobe अनुसंधान (rhabib@adobe.com);

(3) Li-Yi Wei, एडोब रिसर्च (lwei@adobe.com);

(4) मैथ्यू फिशर, एडोब रिसर्च (matfishe@adobe.com);

(5) Timothy Langlois, Adobe अनुसंधान (tlangloi@adobe.com);

(6) सेथ वॉकर, एडोब रिसर्च (swalker@adobe.com);

(7) लिडिया चिल्टन, कोलंबिया विश्वविद्यालय (chilton@cs.columbia.edu)

संक्षिप्त और 1 परिचय

2 संबंधित कार्य

2.1 प्रोग्राम संक्षिप्त

2.2 एनिमेशन के लिए रचनात्मकता समर्थन उपकरण

2.3 डिजाइन के लिए Generative Tools

3 प्रशिक्षण चरण

4 Logomotion प्रणाली और 4.1 इनपुट

4.2 प्री-प्रसंस्करण दृश्य जानकारी

4.3 दृश्य-आधारित कोड संश्लेषण

5 आकलन

5.1 मूल्यांकन: कार्यक्रम की मरम्मत

5.2 विधि

5.3 परिणाम

6 Novices के साथ आकलन

7 चर्चा और 7.1 टेम्पलेट से दूर रहना

7.2 दृश्यों के आसपास कोड उत्पन्न करना

7.3 सीमाएं

8 निष्कर्ष और संदर्भ


Figure 1: LogoMotion is an LLM-based method that automatically animates static layouts in a content-aware way. The method generates code in a two-stage approach involving visually-grounded program synthesis and program repair. In the program synthesis stage pictured above, multimodal LLM operators take in visual context and handle the construction of a text representation of the canvas, conceptual grouping of elements, and implementation of animation code.

अवलोकन

एनिमेटेड लोगो एक आकर्षक और सार्वभौमिक तरीका है जो व्यक्तियों और ब्रांडों को खुद को ऑनलाइन प्रस्तुत करता है। इन लोगो को मैन्युअल रूप से लिखना महत्वपूर्ण कलात्मक कौशल और प्रयासों की आवश्यकता हो सकती है। शुरुआती डिजाइनरों को एनिमेटेड लोगो की मदद करने के लिए, डिजाइन उपकरण वर्तमान में टेम्पलेट्स और एनिमेशन पूर्वावलोकन प्रदान करते हैं। हालांकि, इन समाधानों को उनकी अभिव्यक्तिपूर्ण सीमा में सीमित किया जा सकता है। बड़े भाषा मॉडल में शुरुआती डिजाइनरों को उनके सामग्री के अनुरूप एनिमेटेड लोगो का निर्माण करने में मदद करने की क्षमता है। इस लेख में, हम लोगोमोशन, एक एलएलएम-आधारित प्रणाली को पेश करते हैं जो एक परतित दस्ता

1 परिचय

आंदोलन जीवन का सुझाव देता है, और इस प्रकार, आंदोलन एक आयाम है जिसे हम अपने डिजाइनों को अधिक गतिशील और आकर्षक बनाने के लिए जोड़ते हैं। एनीमेशन एक विशेष प्रकार का डिजाइन रूप है जिसे हमने अधिक मीडिया समृद्ध और इंटरैक्टिव संदर्भों में स्थिर डिजाइनों को ले जाने में मदद करने के लिए बनाया है। एक विशिष्ट प्रकार का एनीमेटेड सामग्री जिसे हम अक्सर बनाते हैं, एनीमेटेड लोगो है। एनीमेशन लोगो को, जिन्हें ब्रांडों के "विज़ुअल आकृतियों" के रूप में परिभाषित किया गया है [25], वीडियो, लाइव स्ट्रीम, वेबसाइटों और सोशल मीडिया में बेहतर ढंग से एकीकृत करने की अनुमति देता है। एक अच्छी तरह से निष्पादित एनीमेशन


एक एनिमेटेड लोगो को लिखना चुनौतीपूर्ण होता है। लोगो अक्सर केवल आइकन और पाठ के जोड़ने से अधिक होते हैं. क्योंकि उनके पास अलग-अलग लेआउट, परतों, रंग और टाइपोग्राफी हो सकती है, वे बहुत विविधता ले सकते हैं और एनिमेट करने के लिए जटिल आर्टिफैक्ट हो सकते हैं. एक शुरुआती डिजाइनर के लिए, यह समझना मुश्किल हो सकता है कि कौन से डिजाइन तत्वों को एनिमेट किया जाना चाहिए, किस अनुक्रम में, और कैसे एक आकर्षक और विश्वसनीय आंदोलन का निर्माण करना है। गति, समय, स्थिति, अवधि, हल्काकरण, और आंदोलन व्यक्तित्व (जैसे एक खेलने वाला बोनस vs. एक मजबूत प्रवेश)। इसके अलावा, जब लोगो में अधिक डिजा


हालांकि एनिमेटेड सामग्री के लिए एक बड़ी मांग है, यह इस तरह की विशेषज्ञता विकसित करने के लिए गति डिजाइन के बाहर लोगों के लिए मुश्किल है. डिजाइन उपकरणों जैसे Adobe Express, Canva, और Figma अक्सर एनिमेटेड टेम्पलेट्स और स्वचालित एनिमेशन तकनीकों के रूप में समाधान प्रदान करते हैं [10, 12, 13]. टेम्पलेट्स लोगो लेआउट को अनुकूलित करने के लिए अनुकूलित करने के लिए एनिमेशन के साथ पूर्वावलोकन करते हैं। वे दर्शाते हैं कि उपयोगकर्ताओं को पेशेवर दिखने वाले एनिमेशन बनाने के लिए लोगो तत्वों पर आंदोलन पूर्वानुमान (जैसे स्लाइड, फ्लेकर, या फ्लेड) कैसे लागू कर सकते हैं. हालांकि, टे


बड़े भाषा मॉडल (एलएलएम) के लिए एनीमेशन के लिए संभावना है. वे डिजाइन तत्वों और कैनवास पर उनके लेआउट के लिए विशिष्ट एनीमेशन कोड उत्पन्न कर सकते हैं. कोड एक पाठ प्रतिनिधित्व है जो अक्सर एनीमेशन ड्राइव करने के लिए उपयोग किया जाता है [18, 33, 53], क्योंकि यह संक्षिप्त रूप से निर्दिष्ट कर सकता है कि तत्वों को कैनवास पर समय और स्थान के साथ कैसे बातचीत की जाती है. चूंकि एलएलएम दुनिया के ज्ञान की एक विशाल मात्रा को एन्कोड करते हैं, वे सामग्री से संबंधित कार्यों और गतिविधियों को आकर्षित कर सकते हैं और लगभग अंतहीन संख्या में एनीमेशन उत्पन्न कर सकते हैं. यह खुले अंत के उत्पन्न क्षमता शैलियों, पूर्तियों और


हाल के प्रगतिओं ने एलएलएम को अधिक बहुआयामी बना दिया है, ताकि वे दोनों पाठ और छवि को इनपुट के रूप में ले सकें, और दृश्य-आधारित प्रतिक्रियाएं प्रदान कर सकें। यह एलएलएम को एनीमेशन जैसी डोमेनों में अधिक लागू कर सकता है जहां कैनवास का एक दृश्य समझ महत्वपूर्ण है। यह उपयोगकर्ताओं को एक एलएलएम के लिए अपने लेआउट की छवियों को प्रदान करने और उनके लेआउट और डिजाइन तत्वों के अनुरूप एनीमेशन प्राप्त करने की क्षमता को खोलता है। उदाहरण के लिए, यदि एक शुरुआती डिजाइनर एक टैक्सी को एनिमेट करना चाहता था, तो वे टैक्सी को कैनवास पर ड्राइव करने के लिए एक एलएलएम का उपयोग कर सकते हैं। यह


इस लेख में, हम LogoMotion, एक एलएलएम-आधारित विधि प्रस्तुत करते हैं जो स्वचालित रूप से सामग्री के बारे में जागरूक तरीके से स्थिर लेआउट को एनिमेट करता है. LogoMotion एक दो-स्तरीय दृष्टिकोण में कोड उत्पन्न करता है जिसमें दृश्य-आधारित प्रोग्राम संश्लेषण और प्रोग्राम मरम्मत शामिल है. पहला चरण मल्टीमॉडल एलएलएम ऑपरेटरों को पेश करता है जो दृश्य संदर्भ में लेते हैं और 1) कैनवास के एक पाठ प्रतिनिधित्व का निर्माण, 2) तत्वों के अवधारणात्मक समूह, और 3) एनिमेशन कोड के कार्यान्वयन।


हमारे योगदान निम्नलिखित हैं:


• लोगोमोशन, एक एलएलएम सिस्टम जो एक पीडीएफ से स्वचालित रूप से लोगो एनीमेशन उत्पन्न करने के लिए दृश्य आधारित कोड उत्पन्न का उपयोग करता है. सिस्टम प्रत्येक परत में दृश्य सामग्री की पहचान करता है, प्राथमिक और माध्यमिक तत्वों को निष्कर्षित करता है, और तत्वों के समूहों का निर्माण करता है. इस आधार पर, सिस्टम एक डिजाइन अवधारणा (टेक्स्ट में) का सुझाव देता है और एनीमेशन कोड उत्पन्न करने के लिए एलएलएम का उपयोग करता है. उपयोगकर्ता संपादित करके या अपने स्वयं के डिजाइन अवधारणा को जोड़कर एनीमेशन को वैकल्पिक रूप से सुधार कर सकते हैं.


• दृश्य आधारित प्रोग्राम मरम्मत, एक तंत्र जो एलएलएम द्वारा उत्पन्न कोड और इसके दृश्य आउटपुट के बीच एक प्रतिक्रिया लूप बनाने के लिए अपने उत्पन्न एनीमेशन कोड के भीतर दृश्य त्रुटियों का स्वचालित रूप से पता लगाने और डिबग करने की अनुमति देता है।


• 276 एनीमेशनों का एक तकनीकी मूल्यांकन दिखाता है कि कैनवा मैजिक एनीमेट और सिस्टम के एक एब्लेटेड संस्करण की तुलना में (येरार्क विश्लेषण और डिजाइन अवधारणा सुझावों के लिए चरणों के बिना), लोगोमोशन का पूरा पाइपलाइन सामग्री के बारे में अधिक जागरूक एनीमेशन पैदा करता है।


• शुरुआती उपयोगकर्ताओं का एक गुणवत्तात्मक मूल्यांकन दिखाता है कि LogoMotion न्यूनतम पुनरावृत्ति के साथ जल्दी से अपनी वांछित एनीमेशन प्राप्त करने में सक्षम है।


यह लेख CC BY-NC-ND 4.0 DEED लाइसेंस के तहत archiv पर उपलब्ध है।

यह लेख CC BY-NC-ND 4.0 DEED लाइसेंस के तहत archiv पर उपलब्ध है।

Archive पर उपलब्ध

[1] वीडियो :


[2] परियोजना पृष्ठ:https://vivian-liu.com/#/logomotion

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks