263 čítania

Obchodoval som s mojím náčrtníkom za prompt box - a umenie nikdy nebude rovnaké

podľa Maria Piterberg12m2025/06/17
Read on Terminal Reader

Príliš dlho; Čítať

TL;DR: Generatívne modely AI, ako je DALL·E, preformulujú digitálne umenie - umožňujú okamžitú generáciu obrázkov z textu.
featured image - Obchodoval som s mojím náčrtníkom za prompt box - a umenie nikdy nebude rovnaké
Maria Piterberg HackerNoon profile picture
0-item

TL;DR: Generatívne modely AI, ako je DALL·E, preformulujú digitálne umenie - umožňujú okamžitú generáciu obrázkov z textu.

Len pred niekoľkými rokmi si vytváranie digitálneho umenia vyžadovalo zvládnutie zložitých nástrojov, drahého vybavenia a týždňov - ak nie mesiacov - praxe.Dnes, s jednoduchou vetou a niekoľkými sekundami, umelá inteligencia môže predstierať obraz, ktorý kedysi umelcovi trval dni na vytvorenie.

From Brushstrokes to Pixels: The Traditional Digital Artist’s Journey

Od štetcov po pixelov: Cesta tradičného digitálneho umelca

Stať sa digitálnym umelcom vyžaduje veľa - oveľa viac, než sa stretne oko.

Ako umelec prechod na digitálnu tvorbu nie je ani plynulý, ani lacný.Začína sa výberom správneho hardvéru, rozhodnutie komplikované nespočetnými premennými: operačnými systémami, komfortom zariadení, veľkosťou obrazovky, citlivosťou pera, cenou a ďalšími.

Ďalej prichádza platforma. Či už ste na tablete alebo počítači, počet dostupných aplikácií sa môže zdať ohromujúci.Od Photoshopu po Procreate, Clip Studio po Corel Painter, výber je obrovský - a každý prichádza s strmou učebnou krivkou, pretože rozmanitosť možností a schopností v každom je obrovská.

Mastering the software is only half the battle. One must also learn to translate traditional skills into the digital realm. Colour theory, composition, and brushwork remain foundational, but the tactile experience of graphite or watercolour doesn’t intuitively carry over to an Apple Pencil or stylus. Even seasoned artists face a period of unlearning and retraining.

A pre nováčikov je cesta ešte náročnejšia. digitálny svet neprekonáva potrebu umeleckých základov - jednoducho preformuluje spôsob, akým sa učia.Pochopenie formy, svetla, hĺbky a štýlu zostáva rovnako dôležité, čo robí proces učenia dlhším a viac vrstveným pre tých, ktorí začínajú od začiatku.

Či už ste skúsený maliar alebo úplný začiatočník, prechod na digitálne umenie je čokoľvek iné ako rýchly. Pre profesionálov to znamená prispôsobenie rokov svalovej pamäte novým nástrojom a pracovným postupom. Pre nováčikov to zahŕňa budovanie základných umeleckých zručností od základov. V oboch prípadoch je cesta dlhá - naplnená skúškou a chybou, nekonečnými hodinami praxe a hlbokou studňou trpezlivosti a oddanosti. Cesta môže trvať mesiace - len aby sa niečo stalo tak podvodne jednoduché ako jablko, mačka alebo stolička.

Then Came AI: A Paradigm Shift in Creative Process

Potom prišla AI: Zmena paradigmy v kreatívnom procese

Našťastie - alebo možno nevyhnutne - sa táto krajina zmenila.

S nárastom umelej inteligencie už časovo náročné začatie do digitálneho umenia nie je nevyhnutnosťou.Dali aZadajte vetu a digitálne majstrovské dielo sa uskutoční v priebehu niekoľkých sekúnd.

Svet umenia, rovnako ako takmer každá iná oblasť, bol otrasený schopnosťami umelej inteligencie.Od modelov GPT, ktoré odpovedajú na otázky a opravujú kód, až po DALL·E, ktoré vytvárajú ilustrácie, bol kreatívny proces transformovaný.

Ale ako to vlastne funguje a je to tak magické, ako sa zdá?

Learning Like a Human: The Foundation of AI Art

Učenie sa ako človek: Základy umenia AI

Aby sme pochopili, ako AI môže vytvárať obrazy, musíme najprv pochopiť, ako sa učí.

Predstavte si malého - nazvime ho Oliverom - učiaceho sa identifikovať zvieratá. jeho matka poukazuje na čiernu mačku a hovorí: „To je mačka.“ Neskôr poukazuje na zázvorovú mačku a opakuje slovo. Oliver, aplikuje to, čo sa naučil, potom vidí bielu mačku a vyhlasuje: „Mačka!“

Napriek novej farbe Oliver rozpozná spoločné vlastnosti: štyri nohy, šepot, bodnuté uši, chvost a meow.

Ale chyby sa stávajú. Jedného dňa Oliver vidí psa Shih-Tzu a nazýva ho mačkou.Je to jeho najlepšia domnienka, na základe informácií, ktoré má.Jeho matka ho opravuje: „Nie, je to pes.“ Od tohto bodu, Oliver zdokonaľuje, ako rozlišuje mačky od psov v jeho mysli.

To je podstata toho, ako sa umelé neurónové siete učia.

Neural Networks: Digital Brains Built on Data

Neurálne siete: digitálne mozgy postavené na údajoch

Neurálna sieť je typ počítačového modelu inšpirovaného tým, ako ľudský mozog funguje.Je postavený na rozpoznávanie vzorcov a učenie sa zo skúseností analýzou veľkého množstva dát, rovnako ako Baby Oliver.

Neurons in human brain. Illustration created by the author using DALL-E 3.


Neuróny v ľudskom mozgu. ilustrácia vytvorená autorom pomocou DALL-E 3.

Tieto siete sa skladajú z vrstiev malých spracovateľských jednotiek (nazývaných „uzly“ alebo „synapsy“), ktoré sú navzájom prepojené - podobné tomu, ako sa neuróny spájajú v mozgu.Každé spojenie má hodnotu, ktorá kontroluje, ako silne jeden uzol ovplyvňuje iný.

Počas tréningu sieť upravuje tieto váhy v priebehu času na základe toho, ako dobre alebo zle funguje - rovnako ako Oliver sa postupne učí rozlíšiť medzi mačkou a psom tým, že opraví svoje chyby.

Výcvikový proces vyžaduje dataset - štruktúrovanú zbierku informácií používaných na výučbu modelu. pre jazykový model to zvyčajne znamená milióny viet, z ktorých každá je postavená zo slov, ktoré sú zasa postavené z písmen abecedy. pre vizuálny model to znamená milióny obrázkov - z ktorých každá je zložená z objektov, ktoré samy sú vytvorené z jednotlivých pixelov.

Čím väčšia a rôznorodejšia je databáza, tým presnejší je model.

Inside the Neural Network: How Data Flows and Decisions Form

Vnútri neurónovej siete: Ako sa dátové toky a rozhodnutia formujú

Predstavme si neurónovú sieť, ako sa často zobrazuje v moderných diagramoch: obrovský graf pozostávajúci z prepojených uzlov. Tieto uzly sú usporiadané do odlišných vrstiev - tiahnucich sa zhora nadol ako vrstvy vrstveného obvodu. Každý uzol, alebo umelý neurón, hrá úlohu pri spracovaní informácií.

Celá táto štruktúra je známa akotopologyTopológia definuje, koľko vrstiev obsahuje sieť, koľko uzlov existuje v každej vrstve a ako medzi nimi prúdia dáta.

Školenie začína podávaním vstupných údajov - ako sú obrázky alebo vety - do prvej vrstvy siete.Tieto údaje sa potom pohybujú vpred cez sieť, vrstva za vrstvou.V každej fáze, uzly aplikovať matematické operácie na údaje, ako sú matice násobenia, aktivácia funkcie ako ReLU (Rectified Linear Unit), alebo iné transformácie.

Ako tento proces prebieha, acomputation graphTento graf starostlivo zaznamenáva každú operáciu a tok údajov: ktorý uzol vykonal akú transformáciu. premýšľajte o tom ako o podrobnom recepte alebo mape myšlienkového procesu modelu.

Tento výpočtový graf je nevyhnutný - nielen na predpovede, ale aj na učenie sa z chýb. Keď model produkuje nesprávny výsledok (predpovede), graf umožňuje systému sledovať každý krok a nastaviť všetky váhy.backpropagation -základný mechanizmus, prostredníctvom ktorého sa neurónové siete časom zlepšujú.

Backpropagation: Learning by Error

Spätná propagácia: učenie sa chybami

Vráťme sa k Oliverovi.

Keď nesprávne označí psa ako mačku, jeho matka ho opraví a Oliver je schopný opraviť jeho porozumenie.

Po predpovedaní siete sa výsledok porovná s reálnou hodnotou pomocouloss functionFunkcia straty meria, ako ďaleko od pravdy bola predpoveď od skutočného výsledku.

V procese spätného šírenia sa vrstvy grafu prechádzajú dozadu, aby sa vypočítalo, koľko každá hmotnosť v sieti prispela k chybe.reťazové pravidlopodľa výpočtu,gradientsKaždý gradient opisuje stratu vo vzťahu k každej hmotnosti. Tieto vypočítané gradienty nám umožňujú uviesť spôsob, ako opraviť chybu tým, že povie smer a veľkosť zmeny požadovanej na zníženie chyby.

Táto spätná väzba - prechod dopredu, výpočet chýb, prechod dozadu - sa opakuje znova a znova.

Teaching Oliver to Draw: The Power of Generative Models

Naučiť Oliver kresliť: Sila generatívnych modelov

Teraz, keď sme preskúmali, ako sa robia predpovede pomocou prediktívnych modelov, môžeme začať chápať zložitejšie fungovanie generatívnych modelov.Ako ich názvy naznačujú, prediktívne modely sú navrhnuté tak, aby analyzovali existujúce údaje a robili informované odhady o pravdepodobných výsledkoch - podobne ako mladý Oliver, ktorý po štúdiu zvierat môže s istotou predpovedať typ nového, s ktorým sa stretne.

Ale predstavte si, že požiadate Olivera, aby neidentifikoval mačku, ale aby ju nakreslil.Táto úloha si vyžaduje viac ako uznanie - vyžaduje to stvorenie.

Predpokladáme, že nemá pred sebou mačku, ani si nemôže spomenúť na každý presný detail mačiek, ktoré videl.Napriek tomu je teraz požiadaný, aby vytvoril úplne nový obraz mačky založený na pamäti, predstavivosti a učených vzoroch.Tento akt budovania niečoho nového - namiesto výberu z toho, čo už existuje - je podstatou generatívnych modelov

Generatívne modely, ako napríklad DALL·E, presahujú rozpoznávanie vzorov. Sú vyškolení na vytvorenie originálneho obsahu, ktorý sa podobá tomu, s čím sa stretli počas tréningu.„Čo je to?“a odpovedali na otázku,„Ako by to mohlo vyzerať, keby existovalo?“Tieto modely nielen rozumejú dátam - vytvárajú s nimi, vytvárajú úplne nové obrázky, text, zvuk alebo video, ktoré sú v súlade so štruktúrami a štýlmi, ktoré sa naučili.

When Language Takes Shape

Keď jazyk nadobúda tvar

Generatívne modely, ako je DALL·E, sú školené na obrovských databázach párov obrázok-text, učia sa spájať vizuálne prvky s jazykom.Počas tréningu model vidí obraz vedľa jeho titulku a postupne sa učí, ktoré slová zodpovedajú ktorým tvarom, textúram, farbám a konceptom.

Vytvára vnútornú mapu významu, chápe, že „červené jablko“ znamená zaokrúhlenosť, špecifický odtieň, kmeň atď. Neskôr, keď je daný nový textový výzva, model premieňa slová na štruktúrované zastúpenie a používa to ako sprievodcu na generovanie obrazu - počnúc náhodným hlukom a rafinovaním krok za krokom, kým sa neobjaví koherentný vizuálny, ktorý zodpovedá textu.

Tento proces umožňuje modelu vytvárať úplne nové obrazy, ktoré nikdy predtým nevidel, zatiaľ čo zostáva verný vzorcom, ktoré sa naučil počas tréningu.

A Thousand Apples a Second: What AI Sees That Artists Can’t

Tisíc jabĺk za sekundu: Čo AI vidí, že umelci nemôžu

Ako sa to vzťahuje na umenie?

Povedzme, že chcete vytvoriť digitálny obraz jablka pomocou DALL·E. Jednoducho zadáte svoju požiadavku - a v priebehu niekoľkých sekúnd dostanete obrázok.

Na výzvu „generovať digitálny obraz jablka“ DALL-E 3 odpovedal nasledujúcim obrázkom:


Illustration created by the author using DALL-E 3. Used prompt: “Generate a digital painting of an apple”.

Toto jablko je produktom miliónov obrázkov, ktoré modelka videla počas tréningu.

Naopak, ľudský umelec by začal hľadaním inšpirácie - študovaním odkazov prehliadaním špecializovaných platforiem, ako je Pinterest, skicovaním hrubých tvarov, rafinovaním detailov, experimentovaním s farbami a aplikáciou textúry.

Tento proces prehliadania, zhromažďovania odkazov a pozorovania objektov - ako sú jablká - je nevyhnutnou súčasťou pracovného postupu každého umelca. Takto si v mysli budujú vizuálnu knižnicu: skúmajú tvar, textúru, osvetlenie, farebné variácie a štýlové voľby. V mnohých ohľadoch to odráža, ako je model AI vyškolený.dataset, slúži rovnakému účelu: naučiť model, ako jablko vyzerá z rôznych uhlov, v rôznych štýloch a za rôznych svetelných podmienok.

Existujú však niektoré kľúčové rozdiely, ako napríklad:scale and speed.

Zatiaľ čo ľudský umelec sa spolieha výlučne na svoju vlastnú pamäť, skúsenosti a schopnosť spracovávať inšpiráciu v priebehu času, modely AI sú vyškolené pomocou obrovských výpočtových zdrojov.Vysoké modely ako DALL·E sú vyškolené v výkonných dátových centrách vybavených tisíckami vzájomne prepojených GPU, TPU alebo v prípade mojej spoločnosti - akcelerátory špecializované na školenie (ako sú akcelerátory).Gaudi3Tieto stroje pracujú paralelne, spracúvajú a analyzujú obrovské objemy obrázkov s neuveriteľnými rýchlosťami.Vysoké prepojenie sieťových pripojení medzi strojmi, vysokovýkonné úložné systémy a špecializované hardvér AI umožňujú týmto modelom trénovať obrovské množiny dát za dni alebo týždne - čo by mohlo trvať ľudské roky na absorpciu, ak vôbec.

Na rozdiel od toho, mozog umelca je jediný "hardvér" k dispozícii. Žiadne vysokorýchlostné zoskupenia alebo petabyte obrazových dát - len intuícia, pamäť a prax. Je to toto ľudské obmedzenie, ktoré AI obchádza, čo mu umožňuje "vidieť" viac príkladov, viac variácií a viac štýlov, než by jediná osoba mohla za celý život.

Matching Human Style: Mimicking Mediums

Zodpovedajúci ľudský štýl: Mimikovanie médií

Digitálni umelci dnes nie sú obmedzení na jeden vizuálny štýl.S nástrojmi, ako je Procreate, môžu simulovať olej, akvarel, ceruzku a atrament - kompletné s textúrami papiera a dynamikou kefy.

Chcete napodobniť jemnú jemnosť akvarelu na hrubom papieri?Na to existuje kefa.Preferujete husté bohatstvo oleja na plátne?

AI môže tiež napodobňovať tieto štýly - ak je vyzvaný správne. Napríklad:


Illustration created by the author using DALL-E 3. Used prompt: “Generate a digital painting of an apple in watercolour style”.


Illustration created by the author using DALL-E 3. Used prompt: “Generate a digital painting of an apple in oil style”.


Illustration created by the author using DALL-E 3. Used prompt: “Generate a digital painting of an apple in pencil sketch style”.


Každá z týchto príkazov vyzýva model, aby napodobňoval nielen predmet, ale aj médium, farebný tón a umeleckú textúru.

The Artistic Process

The Artistic Process

Ak chcete vytvoriť rovnaké efekty bez umelej inteligencie, umelec musí zhromažďovať referenčný materiál, vytvárať náčrtky vrstvy po vrstve, experimentovať s nastavením kefy, aplikovať základné farby, pridávať zvýraznenia a tiene a manuálne upravovať textúry.

Je to časovo náročný, ale emocionálne bohatý zážitok.

S AI sa proces stáva rýchlejší - ale aj oddelený.

Pozrime sa na kroky kreatívnej cesty, na ktorej som sa vydal, jedna fáza za časom.

Step 1: Rough digital sketch. Digital illustration cerated by the author.


Step 2: Detailed digital sketch. Digital illustration cerated by the author.


Step 3: Basic colouring. Digital illustration cerated by the author.


Step 4: Advanced colouring, texture and depth. Digital illustration created by the Author.


Duch v galérii: Prečo vás AI stále nemôže nahradiť

Zdá sa, že umelá inteligencia je viac než schopná replikovať umelecký proces - len rýchlejšie a v rozsahu.To vyvoláva kritickú otázku: prečo by si niekto vybral tradičné digitálne médiá?Existuje ešte priestor pre autentický umelecký výraz a tvorivosť, alebo sa toto úsilie stalo zastaraným?

Poďme preskúmať, čo sa stane, keď sa pokúsime generovať výzvu s presnejšími a náročnejšími pokynmi:

V reakcii na výzvu „Vytvorte jablko s dvoma listami v štýle akvarelu“ model prináša nasledujúci výsledok:

Illustration created by the author using DALL-E 3. Used prompt: “Generate an apple with two leaves in watercolour style”.


To je miesto, kde záves zdvihne - a praskliny sú odhalené: keď je prezentovaný s viac rafinované a špecifické pop-up - "Vytvoriť jablko s dvoma listami, ktoré tvárou v tvár v rovnakom smere v štýle akvarela" - výsledok má zaujímavý a nepredvídateľný obrat.

Illustration created by the author using DALL-E 3. Used prompt: “Generate an apple with two leaves that face the same direction in watercolour style”.


Je to podobné ako u vás? súhlasím s vami.

Ale spĺňa to požiadavku - jasnú a priamu?

Bola to moja chyba - bola moja rýchlosť príliš nejasná?

Aby som odstránil akúkoľvek nejednoznačnosť, požiadal som o ďalšie vylepšenie:

"Vytvorte jablko s dvoma listami, kde obe listy tvárou v tvár ľavej strane v štýle akvarelu"


Illustration created by the author using DALL-E 3. Used prompt: “Generate an apple with two leaves where both leaves face to the left side in watercolour style”.


Ako bolo uvedené vyššie, výsledok sa ešte viac odlišuje od zamýšľaného výsledku.

Tento prípad nesprávnej komunikácie s modelom AI nie je ďaleko od izolácie.V skutočnosti sa zdá, že čím presnejšie sa človek pokúša riadiť, tým ťažšie sa dosiahne požadovaný výsledok - čo často vedie k frustrácii a plytvaniu časom.

Čo je pozoruhodné, je to, že žiadosť tak jednoduchá, že dieťa mohlo pochopiť, sa ukázala ako nepochopiteľná pre model.

Predstavte si klienta, ktorý ponúka jednoduché pokyny ľudskému umelcovi - len aby sa stretol s prázdnym nepochopením, ako keby bola veta vyslovená v cudzom jazyku.

Final Thoughts: The Art We Make Together

Posledné myšlienky: Umenie, ktoré vytvárame spoločne

V konečnom dôsledku to nie je vojna medzi kefou a kódom, ale dialóg. stroj ponúka rýchlosť, presnosť a nekonečnú variabilitu; umelec prináša emócie, intuíciu a dušu.

Budúcnosť stvorenia nespočíva v súboji, ale v harmónii - kde ľudský duch a umelá inteligencia vytvárajú bok po boku, pričom každý poskytuje svoj vlastný druh mágie.


O mne

O mne

Som Maria Piterberg - odborník na umelú inteligenciu, ktorý vedie tím softvéru Runtime v spoločnosti Habana Labs (Intel) a poloprofesionálny umelec pracujúci v tradičných a digitálnych médiách. špecializujem sa na vzdelávacie systémy veľkého rozsahu AI, vrátane komunikačných knižníc (HCCL) a optimalizácie runtime.


L O A D I N G
. . . comments & more!

About Author

Maria Piterberg HackerNoon profile picture
Maria Piterberg@maria piterberg
SW AI Team Lead at Habana Labs (Intel) specialising in AI training Runtime | Expert in distributed training & communication libraries (HCCL) | B.Sc in Computer Science | Digital and traditional artist

ZAVISTE ŠTÍTKY

TENTO ČLÁNOK BOL PREDSTAVENÝ V...

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks