کچھ مہینوں پہلے، 28 سالہ Scale AI CEO، Alexandr Wang نے اپنی کمپنی کے بعد، میٹا، ایمیزون اور مائیکروسافٹ کو شامل کرنے کے لئے ایک بہت کامیاب فنڈنگ راؤنڈ کے بعد،
The World of AI Data
تکنیکی کمپنیوں نے تقریبا ان کی پیدائش کے بعد سے ڈیٹا سے فائدہ اٹھایا ہے؛ تاہم، AI ٹولز کی نئی موجودگی نے ڈیٹا کے لئے ایک غیر معمولی نیا مطالبہ کا نتیجہ دیا ہے. اس ضروریات کی وضاحت کرنے کے لئے، ہم ایک پنجرے اور ٹیٹو کی مثال کا استعمال کریں: ایک پلگ ان پنجرے کاغذ پر اپنے آپ کو بیان کرنے کے قابل نہیں ہوسکتا ہے، جیسا کہ ایک پنجرے کے بغیر ایک بوتل کے معاملے میں ہے. اسی طرح، ایک AI پروڈکٹ جیسے ChatGPT، Claude اور Gemini تربیت کے اعداد و شمار اور ایک آرکیٹیکل - عام طور پر ایک ٹرانسفرورر سٹائل ماڈل - جس میں اعداد و شمار کو ایک قابل استعمال شکل میں بیان کرنے کی اجازت دیتا ہے.
جدید بڑے زبان ماڈلنگ کے لئے بہت سے اعداد و شمار کی ضرورت ہے (ChatGPT 4o، ایک مشہور LLM، کے بارے میں اندازہ لگایا جاتا ہے__1.8 ملین پیرامیٹر انٹرویو__)، اور اس طرح عام استعمال AI کمپنیوں نے انسانی تاریخ میں زبان کے اعداد و شمار کے سب سے بڑا کھلی سافٹ ویئر کے لئے تبدیل کر دیا - انٹرنیٹ. ہر ویب سائٹ سے نکالنے والی متن اور تصاویر کے نمونے پر تربیت کے علاوہ، جدید ترین LLMs کو مسلسل زیادہ سے زیادہ ڈیٹا فراہم کیا جاتا ہے.
Why Humans?
حیرت انگیز طور پر، بڑے ڈیٹا سیٹ میں، جنسی طور پر واضح مواد سے نفرت کی بات کرنے کے لئے گیمٹ چلانے والے مختلف نقصان دہ مواد صحت مند، تعلیمی تربیت کے اعداد و شمار کے ساتھ موازنہ کیا جاتا ہے، جیسا کہ زیادہ سے زیادہ جدید LLM چیٹ بوٹس کو تربیت دینے کے لئے استعمال ہونے والے انٹرنیٹ اعداد و شمار کے بیس سیٹ کے معاملے میں تھا.
تکنیکی طور پر، RLHF معیاری مشین سیکھنے Reinforcement Learning الگورتھمز سے مختلف نہیں ہے: ایک گہری نیٹ ورک کو حقیقی، انسان کے لیبل کردہ اعداد و شمار پر مبنی AI سے پیدا ہونے والے جواب کے لئے ایک پوائنٹ کا تعین کرنے کے لئے استعمال کیا جاتا ہے، جبکہ AI کو بار بار ان جوابات کو پیدا کرنے کے لئے بنایا جاتا ہے جو اس گہری نیٹ ورک میں کھایا جاتا ہے، اس کے نتیجے میں اس کا اثر انداز کیا جاتا ہے کہ جواب کتنا نقصان دہ ہے.
The Issue?
اس کے بجائے، RLHF ماڈل جس کا کہنا ہے کہ AI کو محفوظ اور منفی بناتا ہے، بہت سے ہزاروں کم ادائیگی کرنے والے کارکنوں پر منحصر ہے، جن میں سے اکثر آن لائن "کوئی" پلیٹ فارمز کے ذریعہ غیر قابل قدر ڈیٹا لیبلنگ خدمات فراہم کرتے ہیں. ان میں سے زیادہ تر پلیٹ فارمز "ایک درخواست اور کارخانہ دار" فارمیٹ کی پیروی کرتے ہیں، جس میں بہت سے آن لائن کارکنوں کو ایک کام پر قبضہ کیا جاتا ہے، جو کام کے اختتام پر ادا کیا جاتا ہے، تصاویر یا ویڈیوز کے مواد کو لیبل کرنے سے ممکنہ کلیدی الفاظ یا کنکشنوں کے لئے متن کے دیواروں کو چیک کرنے کے لئے. ان کارکنوں کو ہم جانتے ہیں کہ AI کی حفاظت کے لئے غیر قابل قدر مددگار ہیں - یہ اس وجہ سے ہے کہ عام طور
- ذکر کردہ پلیٹ فارمز میں سے کوئی بھی ایسے میکانیزم یا پالیسی نہیں ہے جو اس بات کو یقینی بناتا ہے کہ کارخانہ داروں کو مکمل ہونے والے کاموں کے لئے درخواست کرنے والوں سے ادائیگی حاصل ہوتی ہے.
- ذکر کردہ پلیٹ فارموں میں سے صرف ایک (آپن) کی پالیسی ہے جو زیادہ سے زیادہ کام کو کم کرنے کے ذریعہ کاروباری QoL کو یقینی بناتا ہے.
- ذکر کردہ پلیٹ فارمز میں سے کوئی بھی واضح اور آسانی سے تفسیر کردہ معاہدے نہیں رکھتا ہے جو ادائیگی اور کام کی شرائط کو مقرر کرتا ہے.
- ذکر کردہ پلیٹ فارمز میں سے کوئی بھی اس بات کا ثبوت نہیں دے رہا ہے کہ وہ انتظامی فیصلے کرنے میں کارخانہ داروں کی واپسی کا استعمال کرتے ہیں.
- ذکر کردہ پلیٹ فارموں میں سے صرف ایک (آپن) کی پالیسییں ہیں جو کارکنوں کو جمع کرنے کے حق کو تسلیم کرتی ہیں.
Real People, Real Impact
ان ڈیٹا کاروباریوں کے حقوق کی غریب کمی کے نتیجے میں AI کاروباریوں کی ایک غیر شناختی اور کم از کم تعریف شدہ "ڈاکٹر" کی تخلیق ہوتی ہے. یہ لوگ، اکثر اپنے خاندان کی حمایت کرنے کے لئے تھوڑا سا اضافی آمدنی حاصل کرنے کے لئے مایوس ہوتے ہیں، ہر دن اپنے کمپیوٹر کے سامنے گھنٹوں خرچ کرتے ہیں، ڈیٹا لیبلنگ کے منفی اور تکرار کرنے والے کاموں کے ذریعے جاتے ہیں، اکثر انسانی فساد کے بدترین طریقوں کا سامنا کرتے ہیں۔ ان پلیٹ فارمز پر کام کرنے والے
کارخانہ داروں کے طور پر، کارکنوں کو ملازمت کے قوانین کی حفاظت نہیں ہے، اور، بہت سے صورتوں میں، اضافی وقت کے لئے ادائیگی نہیں کی جاتی ہے. ریموٹ کام ایک شراکت دار کے لئے ادا کیا جاتا ہے کے لئے کام کی زیادہ سے زیادہ گھنٹے کی تعداد پر ایک حد ڈالتا ہے، اور پلیٹ فارم ایک طویل "معیار" عمل کے عمل کے بعد کاموں کا تعین کرتا ہے جس کے لئے ممکنہ کارخانہ دار کو ادائیگی نہیں کی جاتی ہے.
سینکڑوں ہزار لوگ روزانہ AI ڈیٹا لیبلنگ میں کام کرتے ہیں، لیکن ان کی ناکامی کو کمزور گاہک سپورٹ اور ایک پلیٹ فارم کی کمی کی وجہ سے کمزور کیا جاتا ہے.
مثال کے طور پر، Remotasks، اس طرح کی سب سے بڑی AI ڈیٹا لیبلنگ کمپنیوں میں سے ایک ہے، اس کمپنی کی AI کی تعمیر کی خدمات کے حصے کے طور پر لیبلنگ تربیت کے اعداد و شمار فراہم کرنے کے لئے سکرل AI میں ایک اہم سپورٹ ہے. سرکاری طور پر "صارف کی رازداری کو برقرار رکھنے" کے لئے قائم کیا گیا ہے، یہ جدوجہد عوامی آنکھوں سے بڑی کمپنی کے کچھ کم خوشی والے کاروباری طریقوں کو چھپانے کی کوشش کرتا ہے؛ حقیقت میں، جب ایک خیال کرتا ہے کہ Remotasks نے فیئرورورک کے مناسب کام کے پیمانے پر صرف ایک 10 / 10 حاصل کیا، جس میں 10 / 10 "صرف کام کے ماحول کے لئے کم از کم مطالبہ" ہے، تو اس کے بارے میں بہت کچھ بحث کی جا سکتی ہے کہ اسکرل نے اپنے سخت کام کے ذریعے AI مصنوعات
یہ مضمون آپ کو ہمارے AI کی طرف سے لایا گیا ہے، ایک طالب علم کی بنیاد پر اور طالب علم کی طرف سے ہدایت کی AI اخلاقیاتی تنظیم جس میں AI میں نقطہ نظر کو جدید میڈیا میں عام طور پر بحث کیا جاتا ہے کے علاوہ مختلف کرنے کی کوشش کرتا ہے. اگر آپ اس مضمون کو پسند کرتے ہیں تو، براہ مہربانی ہمارے ماہانہ دستاویزات اور انفرادی مضامین کو چیک کریں https://www.our-ai.org/ai-nexus/read!
یہ مضمون آپ کو ہمارے AI کی طرف سے لایا گیا ہے، ایک طالب علم کی بنیاد پر اور طالب علم کی بنیاد پر AI اخلاقیاتی تنظیم جو AI میں نقطہ نظر کو جدید میڈیا میں عام طور پر بحث کیا جاتا ہے کے علاوہ مختلف کرنے کی کوشش کرتی ہے.https://www.our-ai.org/ai-nexus/read!
Raise Awareness
RLHF ایک اچھا کام ہے جو تمام غلط طریقوں پر کیا گیا ہے. انسانی طور پر منسلک AI کی ترقی کے ایک مضبوط حامی کے طور پر، میں اس بات کا اظہار کرتا ہوں کہ موجودہ معیار اور پالیسی اس بات کو یقینی بنانے کے لئے کافی نہیں ہیں کہ ہماری ٹیکنالوجی ہمارے انسانیت کو منفی اور ناپسندیدہ طور پر متاثر نہیں کرتی ہے. اگر آپ ذہنی طور پر AI کی ذمہ دار اور محفوظ ترقی کے بارے میں کافی پرواہ کرتے ہیں، نہ صرف سلیکون ڈیلے کے لئے بلکہ پوری انسانیت کے لئے، میں آپ کو ذہنی طور پر صنعت میں کارکنوں کے حقوق کی خلاف ورزی کے بارے میں آگاہی کو فروغ دینے کے لئے حوصلہ افزائی کرتا ہوں - اس مضمون کا اشتراک کرتے ہوئے یا آپ کے اپنے تحقیق کا کام کرتے ہوئے - اور پالیسی کے فیصلوں کی حمایت کرتے ہیں جو کارکنوں کو ایک انصافی ادائیگی
دنیا جاننے کے قابل ہے - اور آپ کو آپ کا حصہ ہونا چاہئے.
کی طرف سے لکھا: Thomas Yin