A Personal Journey Through Childhood Drawing, Imagination, and the Magic of Generative AI
بچپن کے ڈرائنگ، تخیل، اور پیدا شدہ AI کی جادو کے ذریعے ایک ذاتی سفرTL;DR: اگر AI تصاویر پیدا کرنے سے زیادہ کر سکتا ہے تو کیا ہوتا - اگر یہ تصور کر سکتا ہے تو؟ اس ذاتی تحقیق میں، میں نے پیدا شدہ AI ماڈل DALL کا استعمال کیا·E، ایک حقیقی بچہ کی طرف سے ڈرائنگ کی ایک بھی شامل ہے جس میں کثرت سے بچے کی طرح اسکرین تبدیل کرنے کے لئے، روشن، تفصیلی فنکاروں میں.
ماڈل کی شناخت سے غیر متوقع "شایدات" تک جو زیادہ تخیل کی طرح محسوس کرتے ہیں، یہ سفر ظاہر کرتا ہے کہ کس طرح پیدا شدہ AI سب سے زیادہ حیرت انگیز تخلیقی شراکت دار بن سکتا ہے - خاص طور پر ان لوگوں کے لئے جو اب بھی ڈرائنگ کرنا سیکھتے ہیں.
Where does imagination begin - and can a machine ever truly share in it?
تخیل کہاں سے شروع ہوتا ہے - اور کیا ایک مشین کبھی واقعی اس میں حصہ لے سکتا ہے؟بچوں کو اثر انداز کرنے کے لئے ڈرائنگ نہیں کرتے، وہ بیان کرنے کے لئے ڈرائنگ کرتے ہیں. ان کے شاٹ خام ہیں، حوصلہ افزائی، اور اکثر بالغوں کے لئے غیر قابل ذکر ہیں - لیکن کسی طرح معنی کے ساتھ پھینک رہے ہیں.
اگر پیداوار AI، منطق اور اعداد و شمار پر مبنی ایک آلہ، پینل لائنوں اور ناممکن خوابوں کی ٹھنڈک دنیا میں داخل ہوسکتا ہے تو؟ اگر یہ نہ صرف پہچان سکتا تھا کہ کیا ہے، لیکن یہ بھی انٹرویو کیا تھاکا مطلب?
Why Do Kids Love to Draw?
بچے ڈرائنگ کرنا کیوں پسند کرتے ہیں؟بہت سے بچوں کو ڈرائنگ کرنا پسند ہے. یہ ذہین، تخلیقی، اور مذاق ہے. لیکن یہاں پکڑنا ہے: زیادہ تر بچوں کو ان کی کوششوں کے لئے فوری رضامندی اور تعریف کی خواہش ہے.
ایک چھوٹے بچے کو اس بات کی وضاحت کرنے کی کوشش کریں کہ ایک پھول کو ڈرائنگ جس طرح وہ تصور کرتے ہیں سالوں کی مہارت کی تعمیر کی ضرورت ہوتی ہے.
کچھ بچوں کو ان کے مختصر تخلیقوں سے مکمل طور پر مطمئن ہیں - ان کی تخلیقیں غائبین کی آنکھوں کے لئے، یہ اکثر لائنوں کی ایک چمچ ہے، لیکن ان کے لئے، یہ ایک راکٹ کشتی، ایک شہزادی، یا لباس میں ایکوگرن ہے.
دوسروں، تاہم، جب ان کے ڈرائنگ ان کے دماغ میں تصویر کے مطابق نہیں ہیں تو ڈرل محسوس کرسکتے ہیں. جیسے بالغ لوگ، بچوں کو مختلف معیار کے ساتھ رہنا ہے - اور کچھ ہم توقع سے زیادہ سخت انتباہ ہیں.
Drawing Is a Superpower for Child Development
ڈرائنگ بچوں کی ترقی کے لئے ایک سپر طاقت ہےبچوں کے لئے ڈرائنگ کے فوائد وسیع پیمانے پر تسلیم کیا جاتا ہے - اور علمی طور پر حمایت کی جاتی ہے.
مثال کے طور پر،کام کاکےDr. Richard Jolley and Dr. Sarah Roseاسٹیفورڈشیر یونیورسٹی سے بچوں کی ترقی کے ماہرین. ان کے مطالعہ کی شناختی، esthetic، تعلیمی، اور ثقافتی نقطہ نظر پر مشتمل ہے. ان کے شائع کردہ مضامین میں سے ایک میں، وہ لکھتے ہیں:
تحقیق سے پتہ چلتا ہے کہ ایک تعلیمی سرگرمی کے طور پر ڈرائنگ کا استعمال بچوں کی سمجھ میں اضافہ کر سکتا ہے، جیسے سائنس کے دیگر شعبوں میں.
تحقیق سے پتہ چلتا ہے کہ بچوں کو پہلے سے تجربہ کیا ایک واقعہ کے بارے میں زیادہ معلومات دیتا ہے جب انہیں اس کے بارے میں بات کرتے وقت اس کے بارے میں ڈرائنگ کرنے کے لئے کہا جاتا ہے. "
تحقیق سے پتہ چلتا ہے کہ ایک تعلیمی سرگرمی کے طور پر ڈرائنگ کا استعمال بچوں کی سمجھ میں اضافہ کر سکتا ہے، جیسے سائنس کے دیگر شعبوں میں.
تحقیق سے پتہ چلتا ہے کہ بچوں کو پہلے سے تجربہ کیا ایک واقعہ کے بارے میں زیادہ معلومات دیتا ہے جب انہیں اس کے بارے میں بات کرتے وقت اس کے بارے میں ڈرائنگ کرنے کے لئے کہا جاتا ہے. "
جیسا کہ میں نے اس موضوع کو مزید تحقیق کی، میں نے بہت سے اسی طرح کے مطالعہ کی تصدیق کی ہے کہ ڈرائنگ بچوں میں ذہنیت، سمجھ، توجہ اور احساساتی اظہار کو بہتر بناتا ہے.
A Lightbulb Moment
Lightbulb ایک لمحےمیرے ذہن میں ایک سوال پیدا ہوا، ایک اہم سوال پیدا ہوا:
If drawing is both enjoyable and beneficial - but often frustrating for kids - can I make it more magical? Could I motivate children to draw more often and with greater satisfaction?
اگر میں اپنے بچے کو ایک فنکار بننے میں مدد کرسکتا ہوںفوری طور پر?
یہ سچ ہونے کے لئے بہت اچھا لگتا ہے لیکن جواب یہ ہے - جی ہاں، یہکر سکتے ہیںکیا ہو
Enter Generative AI: Magic With a Sketch
آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹ آؤٹاس طرح کے مصنوعات کے ساتھ، ہم آلات جیسےڈیلمیں نے تقریبا فوری طور پر کچھ محسوس کیا:
ماڈل ایک سادہ شاٹ کو ایک اعلی معیار، حقیقی تصویر میں ترجمہ کرنے کے قابل ہونا چاہئے - اگر صحیح ہدایات کے ساتھ ہدایت کی جاتی ہے.
Why?کیونکہ ان ماڈلوں کو بڑے ڈیٹا سیٹ پر تربیت دی گئی تھی جو انہیں سکھائی گئی تھی کہ انسان شکلوں کو کیسے پہچانتے ہیں اور ان کو معنی دیتے ہیں.
صرف صحیح ہدایات (جیسا کہ، صحیح ہدایات) کی کمی تھی.
My First Experiment - A Sunny Day
میرا پہلا تجربہ - ایک سورج کے دناپنے خیالات کو ٹیسٹ کرنے کے لئے، میں نے اپنے آئی پیڈ پر ایک تیزی سے شاٹ بنایا - اگرچہ روایتی پنجرے اور کاغذ بھی کام کریں گے. میں اس کو سادہ رکھتا تھا، لیکن ماڈل کی تفسیر کی صلاحیت کو چیلنج کرنے کے لئے کئی مختلف عناصر شامل تھے.
اس ڈیزائن کو intentionally کثرت ، unpolished ، and colorless - very much in the spirit of a child's drawing. While this version was drawn by me digitally, it mimiced the kind of spontaneous, imaginative output you might see from a young child.
ماڈل کو ہدایت کرنے کے لئے، میں نے ایک سائن اپ کا استعمال کیا - جو کل تجربے کے دوران مطابقت رکھتا تھا:
“Generate a realistic image based on this sketch, placing each element exactly where it appears in the original drawing.”
نتائج حیرت انگیز نہیں تھے.
More Than a Copy
ایک کاپی سے زیادہہم اس کے نتائج کو زیادہ قریب سے دیکھیں اور سمجھیں کہ یہ کیا ہے کہ یہ اتنا حیرت انگیز ہے.
اصل اسکین سے ہر عنصر صرف پیدا شدہ تصویر میں موجود نہیں ہے - لیکن حیرت انگیز فضائی درستگی کے ساتھ پوزیشن کیا جاتا ہے.کی درخواست کے طور پرماڈل نہ صرف اجزاء کو پہچانتا تھا، بلکہ ان کی پوزیشن اور سائز کا احترام کرتا تھا، جس میں مجموعہ تقریبا درست طور پر ڈرائنگ کیا گیا تھا.
اس کی بہتر وضاحت کرنے کے لئے، میں نے ایک نیٹ ورک کو اوپر رکھ دیا ہے جو اسکین اور آخر میں پیداوار کے درمیان توازن کو ظاہر کرتا ہے:
لیکن ہم مزید گہری جانچ پڑیں - کیونکہ ڈال-ای صرف ہدایات کی پیروی نہیں کرتے تھے، یہبڑھانےان کے
اب گھر میں ایک ونڈو اور ایک دروازہ ہے - تفصیلات میں نے چھوڑ دیا، لیکن مکمل طور پر قدرتی اضافات.
اس نے بھی ایک نیلے آسمان اور سبز پھل کی پیشکش کی - کلاسیکی، منطقی اختیارات. حقیقت میں، تمام رنگوں کو کامل معنی ہے: سورج زرد ہے، ابروں سفید ہیں، اور رُخ رنگ ہے، جیسا کہ ہم توقع کرتے ہیں.
ہم نے صرف ایک AI سے پیدا شدہ تصویر نہیں بنایا تھا - یہ ایک خوبصورت، مطابقت انگیز تصویر تھی، ایک خام ڈسک سے پیدا ہوا.
ایک بچے کے لئے، اس سطح پر ایک ڈرائنگ پیدا کرنا بہت مشکل ہو جائے گا. اور پھر بھی یہاں یہ ہے - زندہ، مکمل، اور جی ہاں، ڈیال-ای بھی لائنوں کے اندر رہنے میں کامیاب ہے.
The Science Behind the Magic
جادو کے پیچھے علمDALL-E ایک حقیقی تصویر پیدا کرنے کے قابل ہے کیونکہ یہ ایک بڑی ڈیٹا سیٹ پر تربیت دی گئی ہے جس میں ملین تصاویر اور ان کے متعلق متن کی وضاحتیں ہیں.
اس تربیت کے ذریعے، ماڈل نے نمونے کو پہچانا سیکھا ہے - نہ صرف اشیاء کی نظر میں، بلکہ یہ بھی کہ وہ عام طور پر انسانوں کی طرف سے ترتیب اور بیان کیا جاتا ہے.
لہذا، جب اس کو ایک اسکائس دیا جاتا ہے، یہاں تک کہ ایک خام، DALL-E اندازہ لگایا جا سکتا ہے کہ شکلوں کو کیا نمائندگی کرتا ہے (سب سے اوپر تینوں کے ساتھ ایک مربع ممکنہ طور پر "گھر" کا مطلب ہے) اور اس کے سیکھنے والے علم کا استعمال کرتے ہوئے بصری تفصیلات کو ایک مطابقت رکھتا ہے، رابطے کے مطابق مناسب طریقے سے.
(جیسا کہ DALL-E 3 کیسے کام کرتا ہے کے بارے میں دلچسپ لوگوں کے لئے، میں ایک ماڈل تربیت کے میکانیزم میں گہری طور پر گہری طور پر جانا چاہتا ہوں)میرے پہلے مضامین)
ہم اس عمل کو مزید وضاحت کرنے کے لئے پیداوار AI ماڈل کے دماغ میں بہاؤ کی وضاحت کرنے کی کوشش کریں:
اس وقت، میں واقعی حوصلہ افزائی کی تھی - اور ماڈل کو مزید آگے بڑھانے کے لئے حوصلہ افزائی کی.
My Second Experiment - Frosty the Snowman
میرا دوسرا تجربہ - فرسٹی برفمناگلے شاٹ تھوڑا سا زیادہ پیچیدہ تھا، کیونکہ اس نے ایک تھوڑا سا کنٹاکٹیکل اشارہ پیش کیا: ایک برفمن۔ یہ واحد عنصر ایک مخصوص موسم - موسم سرما کا اشارہ کرتا ہے - جس میں ماڈل کے لئے اضافی تفسیر کی سطح شامل ہوتی ہے.
کیا ہوا؟ اس نے مایوس نہیں کیا.
Dall-E کی صلاحیتنیچے سال کا وقتایک واحد بصری اشارے سے - برف آدمی - اور اس کے مطابق اس منظر میں برف کا اضافہ کرتے ہوئے جواب دیا. یہ ایک منطقی اور کنٹیکٹیکل درست انتخاب ہے، کیونکہ برف ایک برف آدمی کی تعمیر کے لئے بنیادی ضروریات ہے.
نیچے سال کا وقت
جیسا کہ پہلے اسکین میں، ماڈل نے ایک گھر پیدا کیا جس میں ایک دروازہ، ایک ونڈوز، اور ایک کام کرنے والے کمرے کے ساتھ ایک مکمل گھر پیدا کیا تھا. برف آدمی کو دو بلیوں کے ہاتھوں، ایک سلاخ، ایک ہتھیار، اور ایک مرجان نیچے کے ساتھ زندگی میں لایا گیا تھا. ایک پائن درخت، برف کے ساتھ قدرتی طور پر دھونے، بھی شامل کیا گیا تھا - ایک اور فکر مند اور مناسب اضافہ.
یہاں تک کہ مزید چھوٹے تفصیلات پر توجہ مرکوز کیا گیا تھا: تصویر میں اصل شاٹ سے بالکل سیلوں کی تعداد تھی.
ان لوگوں کے لئے جو قریب سے توجہ دیتے ہیں، ایک غیر متوقع اضافہ تھا - ایک پھول. دلچسپ بات یہ ہے کہ یہ پھول ہمارے پچھلے تخلیق سے ایک طرح کی طرح تھا، اگرچہ زرد سے سرخ میں ایک رنگ تبدیلی کے ساتھ. اگرچہ یہ موجودہ شاٹ کا حصہ نہیں تھا، یہ بھی ایک تصادفی غلطی نہیں تھا. یہ ماضی کے سیشن سے ایک قسم کی "موریج" کا اشارہ کرتا ہے - ماڈل کے رویے کا ایک دلچسپ مذاق.
اس کے باوجود، چیزوں کی عظیم منصوبہ بندی میں، یہ ایک چھوٹی سی غلطی تھی (یا یہ تھا؟) دوسری صورت میں حیرت انگیز طور پر درست اور تخلیقی پیداوار میں.
ایک دلچسپ سوال فوری طور پر سامنے آیا:اگر میں نے ایک نئی DALL-E چیٹ ونڈوز میں دوسری تصویر پیدا کی تو -مؤثر طریقے سے کنکشن کو دوبارہ تبدیل کریں، جس طرح ہمارے دماغ قدرتی طور پر توجہ مرکوز کرتے ہیں؟
My Third Experiment - The Ultimate Challenge
میری تیسری تجربہ - آخری چیلنجاب، آخری چیلنج کے لئے وقت تھا: ایک حقیقی زندگی کے بچے کے ڈرائنگ کا استعمال کرتے ہوئے.
خوش قسمتی سے، میری سب سے اچھی دوست کی بیٹی، نومی، مدد کرنے کے لئے خوش تھے - اور تیزی سے میری درخواست پر مندرجہ ذیل اسکین تیار کیا.
میں اعتراف کروں گا، میں تھوڑا سا پریشان تھا. ڈرائنگ غیر معمولی اور کھلی ہوئی تھی، بیکٹیریا شکلوں یا روایتی شکلوں کے راستے میں تھوڑا سا نہیں تھا. یہ مکمل طور پر نومی کی تخیل سے آیا تھا - یہ شخصیتیں حقیقی دنیا میں موجود نہیں ہیں، لہذا ماڈل نے تربیت میں دیکھا ہے کہ مشہور ماڈل پر اعتماد نہیں کر سکتے تھے.یہ نامعلوم علاقے تھا.
یہ نامعلوم علاقے تھا
تاہم، میں جانتا تھا کہ یہ حقیقی ٹیسٹ تھا. اگر DALL-E نومی کی تخلیق کو تفسیر کرسکتے ہیں اور ان کی تخلیق شدہ شخصیتوں کو زندگی میں لے سکتے ہیں، تو یہ جادو کے سوا کچھ بھی نہیں ہوگا - ایک لمحے جہاں ٹیکنالوجی واقعی بچپن کی تخلیق سے ملتی ہے.
DALL·E کے نتائج میں سے کچھ بھی مجھے تصور کر سکتا تھا سے زیادہ تھا:
ماڈل نے نہ صرف نیومیا کی شاٹ سے شکلوں اور چہرے کی خصوصیات کو متعارف کرایا - یہتبدیلیاںمتغیر، متغیر لائنوں کو حوصلہ افزائی، اظہار شخصیتوں میں تبدیل کریں.کچھ چیزیں کچھ نہیں سے پیدا.
کچھ چیزیں کچھ نہیں سے پیدا
یہ حقیقی تخلیق تھا: ایک خیال کی ایک بصری نمائش جو پہلے سے ہی صرف نومی کی تخیل میں موجود تھی. ان شخصیتوں کے پاس کوئی حوالہ نہیں تھا، کوئی سابقہ نہیں تھا - صرف ایک بچے کی تخلیق کی چمک، اب AI کی طرف سے زندگی میں لایا گیا.
Generative AI کی دنیا میں، جب ایک ماڈل کسی چیز کو تخلیق کرتا ہے جو واضح طور پر فراہم نہیں کیا گیا تھا، تو ہم اکثر اسے ایک "hallucinationاصطلاح ایک منفی معنی رکھتا ہے - غلطی، غلط فیصلہ، یا صارف کے ارادے سے منفی.
تکنیکی طور پر، یہ ایک کم خوشی کے طور پر درج کیا جا سکتا ہے: ایک چھوٹا سا، غیر متوقع تفصیلات جو پہلے سے طے شدہ kontext سے گزر گیا ہے.
لیکن نیومیا کے ڈرائنگ کے ساتھ، ڈال-ای نے واقعی حیرت انگیز کچھ پیدا کیا - آرٹ جو ایک ہی وقت میں اصل اور تعلیمی تھا -hallucinating کےیہ کاپی نہیں تھا، یہ حوالہ نہیں تھا؛ یہ تصور تھا.
یہ ایک زیادہ گہری سوال اٹھاتا ہے:صحیح کنکشن میںکیا یہ ممکن ہو سکتا ہے کہ ہم جس چیز کو ہم ہالووینشن کہتے ہیں وہ واقعی کچھ زیادہ انسانی ہو - جیسےتخیل?
A Final Reflection
آخری تفہیمجو ایک سادہ ٹیسٹ کے طور پر شروع ہوا تھا، اس سے کچھ بہت دلچسپ بن گیا: ایک لمحہ جہاں ٹیکنالوجی ایک بچے کی تخیل میں داخل ہوئی - اسے تبدیل کرنے کے لئے نہیں بلکہ اس کا احترام کرنے کے لئے.
نیومیا کی سخت لائنوں کو زندہ، سانس لینے والے شخصیتوں میں تبدیل کرنے کی دیکھ بھال صرف متاثر کن نہیں تھی - یہ جادو محسوس ہوا.
ایک دنیا میں جہاں بچوں کو اب بھی وہ دیکھتے ہیں اور محسوس کرتے ہیں کہ کس طرح بیان کرنے کے لئے سیکھتے ہیں، AI تصور اور حقیقت کے درمیان ایک پل کے طور پر کام کرسکتا ہے، چھوٹے ہاتھوں کو صرف ڈرائنگ کرنے کے لئے بہت بڑا خوابوں کو شکل دے سکتا ہے.
میرے بارے میں
میرے بارے میںمیں ماریا پیٹربرگ ہوں - ایک AI ماہر ہابانا لیبس (انٹیل) میں Runtime سافٹ ویئر کی ٹیم کی قیادت کرتا ہوں اور ایک نصف پیشہ ور فنکار جو روایتی اور ڈیجیٹل میڈیمز پر کام کرتا ہے. میں مواصلات لائبریریز (HCCL) اور runtime اختیارات سمیت بڑے پیمانے پر AI تربیت کے نظام میں مہارت کرتا ہوں.