263 čitanja

Trgovao sam Sketchpad za promptnu kutiju - i umetnost nikada neće biti ista

by Maria Piterberg12m2025/06/17
Read on Terminal Reader

Predugo; Citati

TL;DR: Generativni AI modeli poput DALL·E preoblikuju digitalnu umetnost - omogućujući trenutnu generaciju slike iz teksta.
featured image - Trgovao sam Sketchpad za promptnu kutiju - i umetnost nikada neće biti ista
Maria Piterberg HackerNoon profile picture
0-item

TL;DR: Generativni AI modeli poput DALL·E preoblikuju digitalnu umetnost - omogućujući trenutnu generaciju slike iz teksta.

Pre samo nekoliko godina, stvaranje digitalne umetnosti zahtijevalo je obučavanje složenih alata, skupe opreme i nedelja - ako ne i mjeseci - prakse.Danas, uz jednostavnu rečenicu i nekoliko sekundi, veštačka inteligencija može da zamisli sliku koja je jednom umetniku trebala dane da stvori.

From Brushstrokes to Pixels: The Traditional Digital Artist’s Journey

Od četkice do piksela: putovanje tradicionalnog digitalnog umetnika

Postati digitalni umetnik zahtijeva dosta - mnogo više nego što zadovoljava oči.

Kao umjetnik, prijelaz na digitalno stvaranje nije ni besprijekoran ni jeftin. Počinje odabirom pravog hardvera, odluku kompliciraju bezbrojne varijable: operativni sustavi, udobnost uređaja, veličina ekrana, osjetljivost olovke, cijena i još mnogo toga.

Zatim dolazi platforma. Bez obzira da li ste na tabletu ili računaru, broj dostupnih aplikacija može se osećati zapanjujuće. Od Photoshopa do Procreate, Clip Studio do Corel Painter, izbor je ogroman - i svaka dolazi sa strmom krivuljom učenja jer je raznolikost opcija i sposobnosti u svakoj od njih je ogromna.

Uspostavljanje softvera je samo pola bitke. Morate naučiti kako prevesti tradicionalne veštine u digitalni svijet. Teorija boja, kompozicija i četkica ostaju temeljni, ali taktilno iskustvo grafita ili vodene boje ne prenosi se intuitivno na Apple olovku ili olovku. Čak i iskusni umetnici suočavaju se s periodom neobrazovanja i prekvalifikacije.

Digitalni svet ne zaobilazi potrebu za umjetničkim osnovama - jednostavno preoblikuje način na koji su naučeni. Razumevanje oblika, svetlosti, dubine i stila ostaje jednako bitno, čineći proces učenja dužim i složenijim za one koji počinju od nule.

Bilo da ste iskusni slikar ili potpuni početnik, prijelaz na digitalnu umetnost nije ništa drugo nego brz. Za profesionalce, to znači prilagođavanje godina mišićne memorije novim alatima i tokovima rada. Za novopečenije, to uključuje izgradnju osnovnih umetničkih vještina od temelja. U oba slučaja, put je dug - pun pokušaja i pogrešaka, beskrajnih sati prakse i dubokog bunara strpljenja i posvećenosti. Putovanje može potrajati mesecima - samo da bi se nešto tako obmanjujuće jednostavno kao jabuka, mačka ili stolica.

Then Came AI: A Paradigm Shift in Creative Process

Tada je došla AI: promjena paradigme u kreativnom procesu

Srećom - ili možda neizbježno - ovaj krajolik se promenio.

Uz porast veštačke inteligencije, vremenski zahtevna inicijacijacija u digitalnu umetnost više nije nužna.Danas, AI modeli poput OpenAI-ovihUslovi iUpišite rečenicu, a digitalno remek-djelo se materijalizira u sekundi.

Umetnički svet, kao i gotovo svaki drugi domen, potresen je sposobnostima AI. Od GPT modela koji odgovaraju na pitanja i popravljaju kod, do DALL·E koji generiraju ilustracije, kreativni proces je transformisan.

Ali kako to zapravo funkcioniše? i da li je to tako čarobno kao što se čini?

Learning Like a Human: The Foundation of AI Art

Učenje kao čovek: Temelj AI umetnosti

Da bismo razumjeli kako AI može generisati slike, prvo moramo razumeti kako to uči.

Zamislite malog – nazovimo ga Oliverom – koji uči kako da prepozna životinje.Njegova majka upućuje na crnu mačku i kaže: „To je mačka.“ Kasnije ona upućuje na đumbirsku mačku i ponavlja reč.

Unatoč novoj boji, Oliver prepoznaje zajedničke karakteristike: četiri noge, šaputanje, nagnuta uši, rep i meov.

Ali greške se događaju. Jednog dana, Oliver vidi ših-tzu psa i naziva ga mačkom. To je njegova najbolja nagađanja, na osnovu informacija koje ima. Njegova majka ga ispravlja: „Ne, to je pas.“ Od te točke naprijed, Oliver rafinira kako razlikuje mačke od pasa u svom umu.

To je suština načina na koji veštačke neuronske mreže uče.

Neural Networks: Digital Brains Built on Data

Neuralne mreže: Digitalni mozak zasnovan na podacima

Neuralna mreža je vrsta računalnog modela inspirisanog načinom na koji ljudski mozak radi, a izgrađen je kako bi prepoznao obrasce i naučio iz iskustva analizirajući velike količine podataka, baš kao i beba Oliver.

Neurons in human brain. Illustration created by the author using DALL-E 3.


Neurons in human brain. Illustration created by the author using DALL-E 3.

Ove mreže se sastoje od slojeva sitnih procesorskih jedinica (koji se nazivaju „uzvodi” ili „sinapse”) koji su povezani jedni s drugima - slični načinu na koji se neuroni povezuju u mozgu.

Tokom obuke, mreža prilagođava te težine vremenom na osnovu toga koliko dobro ili loše radi - baš kao što Oliver postepeno uči da kaže razliku između mačke i psa ispravljanjem svojih grešaka.

Proces obuke zahtijeva skup podataka - strukturiranu zbirku informacija koje se koriste za podučavanje modela. Za jezični model, to obično znači milijune rečenica, svaka izgrađena od reči, koje su, zauzvrat, izgrađene od slova abecede.

Što je veći i raznovrsniji skup podataka, to je model precizniji.

Inside the Neural Network: How Data Flows and Decisions Form

Unutar neuronske mreže: Kako se oblikuju tokovi podataka i odluke

Zamislimo neuronsku mrežu kao što se često vizualizira u modernim diagramima: ogroman graf sastavljen od međusobno povezanih čvorova. Ovi čvorovi su organizovani u različite slojeve - protežući se od vrha do dna kao slojevi složenog kruga.

Ova ukupna struktura je poznata kaotopologyTopologija definira koliko slojeva mreža sadrži, koliko čvorova postoji u svakom sloju i kako podaci teče između njih.

Obuka počinje hranjenjem ulaznih podataka - kao što su slike ili rečenice - u prvi sloj mreže. Ovi podaci se zatim kreću naprijed kroz mrežu, sloj po sloj. U svakoj fazi, čvorovi primjenjuju matematičke operacije na podatke, kao što su množenje matrice, aktivacijske funkcije kao što je ReLU (Rectified Linear Unit), ili druge transformacije.

As this process unfolds, a computation graphOvaj grafikon meticulo bilježi svaku operaciju i protok podataka: koji čvor je izvršio koju transformaciju.

Ovaj računski grafikon je neophodan - ne samo za predviđanje, već i za učenje iz grešaka. Kada model proizvodi pogrešan rezultat (predviđanje), grafikon omogućuje sustavu da prati kroz svaki korak i prilagodi sve težine.backpropagation -ključni mehanizam kroz koji se neuronske mreže vremenom poboljšavaju.

Backpropagation: Learning by Error

Backpropagation: učenje kroz greške

Vratimo se Oliveru.

Kada pogrešno označi psa kao mačku, njegova majka ga ispravlja i Oliver je u stanju da ponovo prilagodi svoje razumijevanje.

Nakon što mreža napravi predviđanje, rezultat se uspoređuje sa istinskom vrijednošću koristećiloss function. The loss function measures how far from the truth the prediction was from the actual result.

U procesu backpropagation, slojevi grafikona se pređu unazad kako bi se izračunalo koliko je svaka težina u mreži pridonijela pogrešci.lanac pravila from calculus, gradientsse računa. Svaki gradient opisuje gubitak u odnosu na svaku težinu. Ovi izračunati gradienti omogućuju nam da ukažemo na način popravljanja greške tako što ćemo reći pravac i veličinu promjena potrebnih za smanjenje greške.

Ovaj povratni tok - napredni prolaz, izračun grešaka, nazadni prolaz - ponavlja se iznova i iznova. Rezultat?

Teaching Oliver to Draw: The Power of Generative Models

Učenje Olivera da crta: Moć generativnih modela

Sada kada smo istražili kako se predviđanja prave koristeći prediktivne modele, možemo početi da razumijemo složeniji način rada generativnih modela.Kao što njihova imena sugeriraju, prediktivni modeli su dizajnirani da analiziraju postojeće podatke i daju informirane procjene o verovatnim ishodima - baš kao i mladi Oliver, koji, nakon proučavanja životinja, može samopouzdano predvidjeti vrstu novog s kojim se susreće.

Ali zamislite da tražite od Olivera da ne identifikuje mačku, već da je crta.

Pretpostavljamo da pred njim nema mačku, niti se može setiti svakog preciznog detalja mačaka koje je video.Međutim, sada mu se traži da zamisli potpuno novu sliku mačke zasnovanu na memoriji, mašti i naučenim uzorcima.

Generativni modeli, kao što je DALL·E, idu dalje od prepoznavanja uzoraka. Oni su obučeni da proizvode originalni sadržaj koji liči na ono što su naišli tijekom treninga. Umjesto da jednostavno odgovaraju,“Šta je ovo?”Oni odgovaraju na pitanje,“Kako bi to izgledalo da postoji?”Ovi modeli ne samo da razumeju podatke - oni stvaraju s njim, generirajući potpuno nove slike, tekst, audio ili video koji se usklađuju sa strukturama i stilovima koje su naučili.

When Language Takes Shape

Kada jezik uzme oblik

Generativni modeli poput DALL·E-a obučavaju se na velikim skupovima podataka parova slika i teksta, učeći povezivati vizualne elemente sa jezikom. Tokom obuke, model vidi sliku pored njenog podnapisa i postepeno uči koje reči odgovaraju kojim oblicima, teksturama, bojama i konceptima.

Ona gradi unutrašnju mapu značenja, shvatanje da "crvena jabuka" podrazumijeva zaobljenost, određenu nijansu, stabljika, i tako dalje Kasnije, kada se daje novi tekst poziv, model pretvara reči u strukturiranu reprezentaciju i koristi to kao vodič za generisanje slike - počevši od slučajne buke i rafiniranje ga korak po korak dok se ne pojavi koherentna vizualna koja odgovara tekstu.

Ovaj proces omogućuje modelu da stvori potpuno nove slike koje nikada ranije nije vidio, a još uvijek ostaje veran uzorcima koje je naučio tokom obuke.

A Thousand Apples a Second: What AI Sees That Artists Can’t

Tisuću jabuka u sekundi: ono što AI vidi da umetnici ne mogu

Kako se to primjenjuje na umetnost?

Recimo da želite da kreirate digitalnu sliku jabuke pomoću DALL·E. Jednostavno unesete zahtev - i za nekoliko sekundi dobijate sliku.

Na upit "generirajte digitalnu sliku jabuke" DALL-E 3 je odgovorio sledećom slikom:


Illustration created by the author using DALL-E 3. Used prompt: “Generate a digital painting of an apple”.

Ta jabuka je proizvod miliona slika koje je model video tokom treninga.

Umjesto toga, ljudski umjetnik bi počeo tražeći inspiraciju - proučavajući reference pretraživanjem specijaliziranih platformi kao što je Pinterest, skicirajući surove oblike, rafinirajući detalje, eksperimentišući sa bojama i primjenjujući teksturu.

Ovaj proces pretraživanja, prikupljanja referenci i bliskog promatranja objekata - poput jabuka - je esencijalni deo radnog toka svakog umetnika. Na taj način oni grade vizualnu biblioteku u svom umu: ispituju oblik, teksturu, rasvjetu, varijacije boja i stilističke izbore. Na mnogo načina, to odražava kako je model AI obučavan. Prije nego što može generisati slike, model mora biti izložen hiljadama - često milionima - primjera.dataset, služi istoj svrsi: da nauči model kako jabuka izgleda iz različitih uglova, u različitim stilovima i pod različitim uslovima osvetljenja.

Ali postoje neke ključne razlike kao što su:scale and speed.

Dok se ljudski umetnik oslanja isključivo na vlastitu memoriju, iskustvo i sposobnost da obrađuje inspiraciju tijekom vremena, AI modeli se obučavaju koristeći ogromne računalne resurse.Gaudi3Te mašine rade paralelno, obrađuju i analiziraju ogromne količine slika na neverovatnim brzinama.Visoke krivine sa mrežnim vezama između mašina, sistemima za skladištenje visokog protokola i specijalizovanim hardverom AI omogućuju tim modelima da se obučavaju na ogromnim skupovima podataka u danima ili tjednima - što bi moglo potrajati godinama da se apsorbira, ako ikada.

U suprotnom, umetnički mozak je jedini „hardver“ koji je dostupan. Nema visoke brzine ili petabajta podataka o slikama - samo intuicija, memorija i praksa. To je ljudsko ograničenje koje AI zaobiđe, omogućujući mu da „vidi“ više primjera, više varijacija i više stilova nego što bi jedna osoba ikada mogla u životu.

Matching Human Style: Mimicking Mediums

Usklađivanje ljudskog stila: Mimiciranje medija

Digitalni umetnici danas nisu ograničeni na jedan vizualni stil.Sa alatima kao što je Procreate, oni mogu simulirati ulje, akvarijum, olovku i boju - kompletno sa teksturama papira i dinamikom četkice.

Želite li oponašati blatnu mekoću vodene boje na surovom papiru? Postoji četkica za to. Da li preferirate gusto bogatstvo ulja na platnu?

AI takođe može oponašati ove stilove - ako je to ispravno zatraženo.


Illustration created by the author using DALL-E 3. Used prompt: “Generate a digital painting of an apple in watercolour style”.


Illustration created by the author using DALL-E 3. Used prompt: “Generate a digital painting of an apple in oil style”.


Illustration created by the author using DALL-E 3. Used prompt: “Generate a digital painting of an apple in pencil sketch style”.


Svaki od tih poziva upućuje model da oponaša ne samo predmet, već i sredinu, ton boje i umetničku teksturu.

The Artistic Process

Umetnički proces

Za stvaranje istih efekata bez AI, umetnik mora prikupiti referentni materijal, izgraditi skice sloj po sloj, eksperimentisati s postavkama četkice, primijeniti osnovne boje, dodati naglaske i senke i ručno prilagoditi teksture.

To je vremenski intenzivno, ali emotivno bogato iskustvo.

Uz AI, proces postaje neposredniji - ali i odvojeniji.

Hajde da pratimo korake kreativnog putovanja na koje sam krenuo, jednu fazu u jednom trenutku.

Step 1: Rough digital sketch. Digital illustration cerated by the author.


Step 2: Detailed digital sketch. Digital illustration cerated by the author.


Step 3: Basic colouring. Digital illustration cerated by the author.


Step 4: Advanced colouring, texture and depth. Digital illustration created by the Author.


Duh u galeriji: Zašto vas AI još uvijek ne može zamijeniti

Ovo postavlja kritično pitanje: zašto bi neko više odabrao tradicionalne digitalne medije?Da li još ima prostora za autentični umjetnički izraz i kreativnost, ili je ta potraga postala zastarjela?

Hajde da istražimo šta se događa kada pokušamo generisati uputstvo s preciznijim i zahtjevnijim uputama:

U odgovoru na upit "Generirajte jabuku sa dva lišća u akvarelnom stilu", model proizvodi sledeći rezultat:

Illustration created by the author using DALL-E 3. Used prompt: “Generate an apple with two leaves in watercolour style”.


To je mesto gde zavjese dižu - a pukotine se otkrivaju: kada je predstavljen sa rafiniranijim i specifičnijim pozivom - "Generirajte jabuku sa dva lišća koji su okrenuti istom pravcu u akvarelnom stilu" - rezultat je intrigantan i nepredviđen.

Illustration created by the author using DALL-E 3. Used prompt: “Generate an apple with two leaves that face the same direction in watercolour style”.


Da li i vama izgleda isto?Slažem se.

Ali da li ispunjava zahtjev - jasan i jednostavan, na to?

Da li jednostavno ne može razumjeti?Da li je krivica moja - da li je moj poziv previše nejasan?

Kako bih uklonio bilo kakvu dvosmislenost, dodatno sam rafinirao zahtjev:

"Generirajte jabuku sa dva lišća gde oba lišća obrazuju levu stranu u stilu akvarijuma"


Illustration created by the author using DALL-E 3. Used prompt: “Generate an apple with two leaves where both leaves face to the left side in watercolour style”.


Kao što je gore navedeno, rezultat se još više razlikovao od predviđenog rezultata.

U stvari, čini se da što preciznije pokušavate da ga usmjerite, to je željeni ishod manje očigledan - često rezultira frustriranjem i gubljenim vremenom.

What’s striking is that a request so simple a child could grasp it proved incomprehensible to the model.

Zamislite klijenta koji nudi jednostavno uputstvo ljudskom umetniku - samo da bi se susreo s praznim nerazumijevanjem, kao da je rečenica izgovorena na stranom jeziku.

Final Thoughts: The Art We Make Together

Završne misli: Umjetnost koju stvaramo zajedno

U konačnici, ovo nije rat između četkice i koda, već dijalog.Mašina nudi brzinu, preciznost i beskonačnu varijaciju; umetnik donosi emocije, intuiciju i dušu.

Sretni smo da živimo u vremenu kada mašta više nije ograničena samo granicama naših ruku.Budućnost stvaranja ne leži u rivalstvu, već u harmoniji - gde ljudski duh i veštačka inteligencija stvaraju ruku pod ruku, svaka posuđujući svoju vrstu magije.


About me

O meni

Ja sam Maria Piterberg - stručnjak za AI koji vodi tim softvera Runtime u Habana Labs (Intel) i poluprofesionalni umetnik koji radi na tradicionalnim i digitalnim medijima. Specijaliziram se za velike sustave za obuku AI, uključujući komunikacijske biblioteke (HCCL) i optimizaciju vremena rada.


L O A D I N G
. . . comments & more!

About Author

Maria Piterberg HackerNoon profile picture
Maria Piterberg@maria piterberg
SW AI Team Lead at Habana Labs (Intel) specialising in AI training Runtime | Expert in distributed training & communication libraries (HCCL) | B.Sc in Computer Science | Digital and traditional artist

HANG TAGS

OVAJ ČLANAK JE PREDSTAVLJEN U...

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks