263 lezingen

Ik verhandelde mijn sketchpad voor een promptbox - en kunst zal nooit hetzelfde zijn

door Maria Piterberg12m2025/06/17
Read on Terminal Reader

Te lang; Lezen

TL;DR: Generatieve AI-modellen zoals DALL·E vormen de digitale kunst opnieuw - waardoor onmiddellijke beeldgeneratie uit tekst mogelijk wordt.
featured image - Ik verhandelde mijn sketchpad voor een promptbox - en kunst zal nooit hetzelfde zijn
Maria Piterberg HackerNoon profile picture
0-item

TL;DR: Generatieve AI-modellen zoals DALL·E vormen de digitale kunst opnieuw - waardoor onmiddellijke beeldgeneratie uit tekst mogelijk wordt.

Slechts een paar jaar geleden vereiste het creëren van digitale kunst een beheersing van complexe gereedschappen, dure apparatuur en weken - zo niet maanden - van praktijk.Vandaag, met een eenvoudige zin en een paar seconden, kan kunstmatige intelligentie een schilderij voorspellen dat ooit een kunstenaar dagen kostte om te creëren.Maar wat hebben we echt verdiend, en wat kunnen we achterlaten?En misschien het meest kritisch - maakt het de kunstenaar verouderd?

From Brushstrokes to Pixels: The Traditional Digital Artist’s Journey

Van borststukken tot pixels: de reis van de traditionele digitale kunstenaar

Een digitale kunstenaar worden vereist heel veel - veel meer dan het oog ontmoeten.

Als kunstenaar is de overgang naar digitale creatie noch naadloos noch goedkoop.Het begint met het kiezen van de juiste hardware, een beslissing gecompliceerd door talloze variabelen: besturingssystemen, apparaatcomfort, schermgrootte, pen gevoeligheid, prijs, en meer.

Vanaf Photoshop tot Procreate, Clip Studio tot Corel Painter, de keuzes zijn groot - en elk komt met een steile leercurve omdat de verscheidenheid aan opties en mogelijkheden in elk enorm is.

Het beheersen van de software is slechts de helft van de strijd. Men moet ook leren om traditionele vaardigheden in het digitale rijk te vertalen. Kleurtheorie, compositie en borstelwerken blijven fundamenteel, maar de tactile ervaring van grafiet of aquarel draagt niet intuïtief over op een Apple Pencil of pen. Zelfs ervaren kunstenaars worden geconfronteerd met een periode van onleren en opnieuw trainen.

En voor nieuwkomers is de reis nog steilder.De digitale wereld omzeilt niet de behoefte aan artistieke fundamenten - het hervormt gewoon de manier waarop ze worden geleerd. het begrijpen van vorm, licht, diepte en stijl blijft net zo essentieel, waardoor het leerproces langer en meer gesplitst wordt voor degenen die vanaf het begin beginnen.

Of je nu een ervaren schilder bent of een complete beginner, de overgang naar digitale kunst is allesbehalve snel. Voor professionals betekent dit het aanpassen van jaren van spiergeheugen aan nieuwe hulpmiddelen en werkstromen. Voor nieuwkomers gaat het om het opbouwen van fundamentele kunstvaardigheden vanaf de grond. In beide gevallen is het pad lang - gevuld met proeven en fouten, eindeloze uren oefening en een diepe put van geduld en toewijding. De reis kan maanden duren - alleen om iets zo bedrieglijk eenvoudig te maken als een appel, een kat of een stoel.

Then Came AI: A Paradigm Shift in Creative Process

Dan kwam AI: een paradigmaverschuiving in het creatieve proces

Gelukkig - of misschien onvermijdelijk - is dit landschap veranderd.

Met de opkomst van kunstmatige intelligentie is de tijdrovende initiatie in digitale kunst niet langer een noodzaak.Dallen enTyp een zin, en een digitaal meesterwerk materialiseren in seconden.

De kunstwereld, net als bijna elk ander domein, is geschud door de mogelijkheden van AI.Van GPT-modellen die vragen beantwoorden en code fixeren, tot DALL·E die illustraties genereert, is het creatieve proces getransformeerd.

Maar hoe werkt het eigenlijk? en is het zo magisch als het lijkt?

Learning Like a Human: The Foundation of AI Art

Leren als een mens: de basis van AI kunst

Om te begrijpen hoe AI beelden kan genereren, moeten we eerst begrijpen hoe het leert.

Stel je voor dat een kleintje - laten we hem Oliver noemen - leert dieren te identificeren.Zijn moeder wijst op een zwarte kat en zegt: "Dat is een kat."Later wijst ze op een gemberkat en herhaalt het woord.

Ondanks de nieuwe kleur herkent Oliver gemeenschappelijke kenmerken: vier benen, whiskers, gekantelde oren, een staart en een meow.

Maar fouten gebeuren.Op een dag ziet Oliver een Shih-Tzu hond en noemt het een kat.Het is zijn beste raden, gebaseerd op de informatie die hij heeft.Zijn moeder corrigeert hem: "Nee, dat is een hond."Vanaf dat punt verfijnt Oliver hoe hij katten onderscheidt van honden in zijn geest.

Dit is de essentie van hoe kunstmatige neurale netwerken leren.

Neural Networks: Digital Brains Built on Data

Neurale netwerken: digitale hersenen gebouwd op data

Een neurale netwerk is een type computermodel geïnspireerd op hoe het menselijk brein werkt.Het is gebouwd om patronen te herkennen en te leren van ervaring door grote hoeveelheden gegevens te analyseren, net als baby Oliver.

Neurons in human brain. Illustration created by the author using DALL-E 3.


Neuronen in de menselijke hersenen. illustratie gemaakt door de auteur met behulp van DALL-E 3.

Deze netwerken zijn samengesteld uit lagen van kleine verwerkingseenheden (zogenaamde "nodes" of "synapsen") die met elkaar verbonden zijn - vergelijkbaar met hoe neuronen in de hersenen verbinden.

Tijdens de training past het netwerk deze gewichten na verloop van tijd aan op basis van hoe goed of slecht het werkt - net zoals Oliver geleidelijk leert het verschil tussen een kat en een hond te vertellen door zijn fouten te corrigeren.

Voor een taalmodel betekent dit meestal miljoenen zinnen, elk gebouwd uit woorden, die op hun beurt zijn gebouwd uit letters van het alfabet.

Hoe groter en diverser de dataset, hoe nauwkeuriger het model wordt.

Inside the Neural Network: How Data Flows and Decisions Form

Binnen het neurale netwerk: hoe gegevensstromen en beslissingen vormen

Laten we ons een neurale netwerk voorstellen zoals het vaak wordt weergegeven in moderne diagrammen: een enorme grafiek bestaande uit onderling verbonden knooppunten.Deze knooppunten zijn georganiseerd in verschillende lagen - die zich van boven naar beneden uitstrekken zoals de lagen van een gelagerde circuit.

Deze algemene structuur staat bekend als detopologyTopologie definieert hoeveel lagen het netwerk bevat, hoeveel knooppunten er in elke laag zijn en hoe gegevens tussen hen stromen.

De training begint met het voeren van inputgegevens - zoals afbeeldingen of zinnen - in de eerste laag van het netwerk. Deze gegevens bewegen vervolgens door het netwerk, laag voor laag. In elke fase passen knooppunten wiskundige operaties toe op de gegevens, zoals matrixmultiplicaties, activatiefuncties zoals ReLU (Rectified Linear Unit), of andere transformaties.

Naarmate dit proces zich ontwikkelt, acomputation graphDeze grafiek registreert nauwkeurig elke operatie en de stroom van gegevens: welke knooppunt welke transformatie heeft uitgevoerd.

Deze berekeningsdiagram is essentieel - niet alleen voor het maken van voorspellingen, maar ook voor het leren van fouten.Wanneer het model een onjuist resultaat (voorspelling) produceert, stelt de grafiek het systeem in staat om terug te sporen door elke stap en alle gewichten aan te passen.backpropagation -het kernmechanisme waardoor neurale netwerken in de loop van de tijd verbeteren.

Backpropagation: Learning by Error

Backpropagatie: leren door fouten

Terug naar Oliver.

Wanneer hij een hond verkeerd labelt als een kat, corrigeert zijn moeder hem en Oliver is in staat om zijn begrip opnieuw aan te passen.

Nadat een netwerk een voorspelling heeft gemaakt, wordt het resultaat vergeleken met de werkelijke waarde met eenloss functionDe verliesfunctie meet hoe ver van de waarheid de voorspelling was van het werkelijke resultaat.

In het proces van backpropagatie worden de lagen van de grafiek teruggetrokken om te berekenen hoeveel elk gewicht in het netwerk heeft bijgedragen aan de fout.Kettingregelvan de berekening,gradientsElke gradiënt beschrijft het verlies met betrekking tot elk gewicht. Deze berekende gradiënten stellen ons in staat om de manier aan te geven om de fout te corrigeren door de richting en de omvang van de verandering te vertellen die nodig is om de fout te verminderen.

Deze feedbackloop – vooruitgang, foutberekening, achteruitgang – wordt steeds opnieuw herhaald.Het resultaat?

Teaching Oliver to Draw: The Power of Generative Models

Oliver leren tekenen: de kracht van generatieve modellen

Nu we hebben onderzocht hoe voorspellingen worden gemaakt met behulp van voorspellende modellen, kunnen we beginnen de meer ingewikkelde werking van generatieve modellen te begrijpen.Zoals hun namen suggereren, zijn voorspellende modellen ontworpen om bestaande gegevens te analyseren en geïnformeerde schattingen te maken over waarschijnlijke uitkomsten - net als jonge Oliver, die, na het bestuderen van dieren, met vertrouwen kan voorspellen wat voor soort nieuwe hij tegenkomt.

Maar stel je voor dat je Oliver vraagt niet om een kat te identificeren, maar om er een te tekenen.

We gaan ervan uit dat hij geen kat voor hem heeft, noch kan hij zich alle precieze details van de katten herinneren die hij heeft gezien.Niettemin wordt hij nu gevraagd om een geheel nieuw beeld van een kat te bedenken op basis van geheugen, verbeeldingskracht en geleerde patronen.

Generatieve modellen, zoals DALL·E, gaan verder dan patroonherkenning. ze zijn getraind om originele inhoud te produceren die lijkt op wat ze hebben ontmoet tijdens de training.“Wat is dit?”, they respond to the question, “Hoe zou dit eruit zien als het bestond?”Deze modellen begrijpen niet alleen gegevens - ze creëren ermee, waardoor ze volledig nieuwe afbeeldingen, tekst, audio of video genereren die in lijn zijn met de structuren en stijlen die ze hebben geleerd.

When Language Takes Shape

Wanneer taal vorm neemt

Generatieve modellen zoals DALL·E worden getraind op grote datasets van beeld-tekstparen, leren om visuele elementen te associëren met taal. Tijdens de training ziet het model een afbeelding naast de ondertitel en leert geleidelijk welke woorden overeenkomen met welke vormen, texturen, kleuren en concepten.

Het bouwt een interne kaart van betekenis, het begrijpen dat "een rode appel" impliceert rondheid, een specifieke tint, een stam, enzovoort Later, wanneer een nieuwe tekst aanbeveling gegeven, het model converteert de woorden in een gestructureerde weergave en gebruikt dat als een gids om een afbeelding te genereren - te beginnen met willekeurig lawaai en verfijnen het stap voor stap tot er een samenhangend visueel verschijnt dat overeenkomt met de tekst.

Dit proces stelt het model in staat om volledig nieuwe beelden te creëren die het nog nooit eerder heeft gezien, terwijl het nog steeds trouw blijft aan de patronen die het tijdens de training heeft geleerd.

A Thousand Apples a Second: What AI Sees That Artists Can’t

Duizend appels per seconde: wat AI ziet dat kunstenaars niet kunnen

Hoe geldt dit dan voor kunst?

Laten we zeggen dat u een digitale afbeelding van een appel wilt maken met DALL·E. U typt gewoon uw verzoek - en binnen enkele seconden ontvangt u een afbeelding.

Voor de oproep “een digitaal schilderij van een appel maken” reageerde DALL-E 3 met de volgende afbeelding:


Illustration created by the author using DALL-E 3. Used prompt: “Generate a digital painting of an apple”.

Die appel is het product van miljoenen beelden die het model tijdens de training heeft gezien.

Een menselijke kunstenaar zou daarentegen beginnen met het zoeken naar inspiratie - het bestuderen van referenties door te surfen op gespecialiseerde platforms zoals Pinterest, het schetsen van ruwe vormen, het verfijnen van details, het experimenteren met kleuren en het toepassen van textuur.

Dit proces van browsen, referenties verzamelen en objecten nauwlettend observeren - zoals appels - is een essentieel onderdeel van de werkstroom van elke kunstenaar. Het is hoe ze een visuele bibliotheek in hun geest bouwen: het onderzoeken van vorm, textuur, verlichting, kleurvariaties en stylistische keuzes. Op veel manieren weerspiegelt dit hoe een AI-model wordt getraind. Voordat het beelden kan genereren, moet het model ook worden blootgesteld aan duizenden - vaak miljoenen - voorbeelden.dataset, dient hetzelfde doel: om het model te leren hoe een appel eruit ziet vanuit verschillende hoeken, in verschillende stijlen en onder verschillende verlichtingsomstandigheden.

Maar er zijn enkele cruciale verschillen zoals:scale and speed.

Terwijl een menselijke kunstenaar alleen vertrouwt op zijn eigen geheugen, ervaring en het vermogen om inspiratie na verloop van tijd te verwerken, worden AI-modellen getraind met behulp van enorme computationele middelen. grootschalige modellen zoals DALL·E worden getraind in krachtige datacenters uitgerust met duizenden met elkaar verbonden GPU's, TPU's of in het geval van mijn bedrijf - Accelerators gespecialiseerd voor training (zoalsGaudi3Deze machines werken parallel, verwerken en analyseren enorme hoeveelheden afbeeldingen met ongelooflijke snelheden.Hoge bochten met netwerkverbindingen tussen machines, high-throughput opslagsystemen en gespecialiseerde AI-hardware maken het mogelijk om deze modellen te trainen op enorme datasets in dagen of weken - wat een mens jaren zou kunnen nemen om te absorberen, als ooit.

Het brein van de kunstenaar is daarentegen de enige "hardware" die beschikbaar is. geen high-speed clusters of petabytes beeldgegevens - alleen intuïtie, geheugen en praktijk. Het is deze menselijke beperking die AI omzeilt, waardoor het meer voorbeelden, meer variaties en meer stijlen kan "zien" dan een enkele persoon ooit in een leven zou kunnen.

Matching Human Style: Mimicking Mediums

Matching Human Style: Mimiceren van Mediums

Digitale kunstenaars zijn tegenwoordig niet beperkt tot één visuele stijl.Met tools zoals Procreate kunnen ze olie, aquarium, potlood en inkt simuleren - compleet met papiertexturen en borstdynamiek.

Wilt u de blauwe zachtheid van waterkleur op ruig papier imiteren? Er is daarvoor een borstel.

AI kan deze stijlen ook navolgen - als het correct wordt aangemoedigd.


Illustration created by the author using DALL-E 3. Used prompt: “Generate a digital painting of an apple in watercolour style”.


Illustration created by the author using DALL-E 3. Used prompt: “Generate a digital painting of an apple in oil style”.


Illustration created by the author using DALL-E 3. Used prompt: “Generate a digital painting of an apple in pencil sketch style”.


Elk van deze aanwijzingen instrueert het model om niet alleen het onderwerp, maar ook het medium, kleurtoon en artistieke textuur na te bootsen.

The Artistic Process

The Artistic Process

Om dezelfde effecten te creëren zonder AI, moet een kunstenaar referentiemateriaal verzamelen, schetsen laag voor laag bouwen, experimenteren met borstinstellingen, basiskleuren toepassen, highlights en schaduwen toevoegen en textuur handmatig aanpassen.

Het is een tijdsintensieve maar emotioneel rijke ervaring.

Met AI wordt het proces onmiddellijker - maar ook meer losgemaakt.

Laten we de stappen van de creatieve reis die ik begon opvolgen, een fase in een tijd.

Step 1: Rough digital sketch. Digital illustration cerated by the author.


Step 2: Detailed digital sketch. Digital illustration cerated by the author.


Step 3: Basic colouring. Digital illustration cerated by the author.


Step 4: Advanced colouring, texture and depth. Digital illustration created by the Author.


De geest in de galerij: waarom AI je nog steeds niet kan vervangen

AI lijkt meer dan in staat om het artistieke proces te repliceren - alleen sneller en op schaal.Dit roept een kritische vraag op: waarom zou iemand kiezen voor traditionele digitale media meer?

Laten we onderzoeken wat er gebeurt als we proberen een prompt te genereren met nauwkeurigere en veeleisende instructies:

In reactie op de oproep “Een appel genereren met twee bladeren in aquarel-stijl”, levert het model het volgende resultaat op:

Illustration created by the author using DALL-E 3. Used prompt: “Generate an apple with two leaves in watercolour style”.


Dit is waar de gordijnlift - en de scheuren worden onthuld: wanneer gepresenteerd met een meer verfijnde en specifieke prompt - "Geneer een appel met twee bladeren die in dezelfde richting in aquarel stijl" - het resultaat neemt een intrigerende en onvoorziene wending.

Illustration created by the author using DALL-E 3. Used prompt: “Generate an apple with two leaves that face the same direction in watercolour style”.


Is dat voor jou hetzelfde? ik ben het met je eens.

Maar voldoet het aan de vereiste - een duidelijke en rechtstreekse?

Zou het gewoon niet begrijpen? was de fout van mij - was mijn prompt te vaag?

Om alle dubbelzinnigheid weg te nemen, heb ik het verzoek verder verfijnd:

“Genereren van een appel met twee bladeren waar beide bladeren naar de linkerkant in aquarel stijl”


Illustration created by the author using DALL-E 3. Used prompt: “Generate an apple with two leaves where both leaves face to the left side in watercolour style”.


Zoals hierboven te zien is, verschilt het resultaat nog verder van het beoogde resultaat.

Dit geval van miscommunicatie met het AI-model is verre van geïsoleerd.In feite voelt het alsof hoe nauwkeuriger men probeert het te begeleiden, hoe onduidelijker het gewenste resultaat wordt - vaak resulterend in frustratie en tijdverspilling.

Wat opvallend is, is dat een verzoek zo eenvoudig dat een kind het kon begrijpen, onbegrijpelijk bleek voor het model.

Stel je voor dat een klant een eenvoudige instructie aan een menselijke kunstenaar biedt - alleen om te worden ontmoet met een leeg misverstand, alsof de zin in een vreemde taal werd gesproken.

Final Thoughts: The Art We Make Together

Final Thoughts: De kunst die we samen maken

Uiteindelijk is dit geen oorlog tussen borstel en code, maar een dialoog.De machine biedt snelheid, precisie en oneindige variatie; de kunstenaar brengt emotie, intuïtie en ziel.

De toekomst van de schepping ligt niet in rivaliteit, maar in harmonie - waar de menselijke geest en kunstmatige intelligentie naast elkaar creëren, elk lenen hun eigen soort magie.


Over mij

Over mij

Ik ben Maria Piterberg - een AI-expert die het Runtime-softwareteam bij Habana Labs (Intel) leidt en een semi-professionele kunstenaar die over traditionele en digitale media werkt. ik ben gespecialiseerd in grootschalige AI-trainingssystemen, waaronder communicatiebibliotheken (HCCL) en runtime optimalisatie.


L O A D I N G
. . . comments & more!

About Author

Maria Piterberg HackerNoon profile picture
Maria Piterberg@maria piterberg
SW AI Team Lead at Habana Labs (Intel) specialising in AI training Runtime | Expert in distributed training & communication libraries (HCCL) | B.Sc in Computer Science | Digital and traditional artist

LABELS

DIT ARTIKEL WERD GEPRESENTEERD IN...

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks