একটি AI মডেল এবং একটি মানব মস্তিষ্কের মধ্যে সবচেয়ে বড় পার্থক্য কি?
সময়ের সাথে সাথে, অসংখ্য উত্তর দেওয়া হয়েছে- মস্তিষ্কটি আরও শক্তিশালী, তার ইনপুট মিডিয়াতে আরও বহুমুখী, এবং বৈদ্যুতিকতার পাশাপাশি রাসায়নিকভাবে সক্ষম - কিন্তু মানব মস্তিষ্কের সবচেয়ে গুরুত্বপূর্ণ বৈশিষ্ট্যটি তার আশ্চর্যজনক প্লাস্টিকতা।অন্যশরীরের অংশ. প্লাস্টিকতা মানুষকে ধারণা এবং দক্ষতা গড়ে তুলতেও সাহায্য করে: বলা হয়, "নেউরনগুলি যারা একসঙ্গে জ্বলছে"। পেশী মেমরি এবং প্রায় অবিলম্বে বাস্তব স্মরণ আমাদের জীবনের দুটি প্লাস্টিকতা সক্ষম অংশ যা আমরা কখনোই ছাড়া বেঁচে থাকতে পারি না।নিজের কর্মক্ষমতার উন্নতিএই নিবন্ধটিতে আমরা বিশ্বের প্রথম স্বতঃস্ফূর্তভাবে বিকশিত এআই নামক স্বতঃস্ফূর্তভাবে সংশ্লিষ্ট ভাষা মডেল (SEAL) এর নৈতিক ও প্রযুক্তিগত প্রভাবগুলি অনুসন্ধান করি।
অসম্পূর্ণ শিক্ষা
অবশ্যই, ট্রান্সফরমার আর্কিটেকচার ব্যবহার করে এআই মডেলগুলি এখনও নির্দিষ্ট কাজ শিখতে সক্ষম ছিল, তবে উপলব্ধ কয়েকটি পদ্ধতি সম্পূর্ণরূপে স্বয়ংক্রিয় এবং কার্যকর নয়. সম্ভবত একটি মডেলকে একটি নির্দিষ্ট দক্ষতা অর্জন করার জন্য প্রশিক্ষণ করার সবচেয়ে উল্লেখযোগ্য উপায় - যেমন ইংরেজিকে চীনা ভাষায় অনুবাদ করা বা ট্রিগোনোমিটারি সমস্যা সঠিকভাবে করা - একটি প্রক্রিয়া ব্যবহার করা হয় যা সুপারভাইজড ফিন টুইনিং বা এসএফটি নামে পরিচিত।
- একটি উদাহরণ হিসাবে, আমরা আধুনিক গান শব্দ উৎপাদনের উদাহরণ গ্রহণ করি।
- আমাদের উদাহরণের জন্য, এটি করার একটি স্পষ্ট কিন্তু বিতর্কিত উপায় হল ইন্টারনেট থেকে রক্ষা করা গানগুলির শব্দগুলি ব্যবহার করা এবং গানগুলির বিষয়বস্তু এবং বৈশিষ্ট্যগুলির মোট সংক্ষিপ্ত সংক্ষিপ্তগুলির সাথে তাদের সংযুক্ত করা।
- মডেলের উপর এসএফটিটি প্রয়োগ করুন. এটি সাধারণত গ্রিডিয়েন্ট ডাসেন্ট নামক একটি প্রক্রিয়া দ্বারা করা হয়, যার প্রযুক্তিগত দিকটি আমি এই নিবন্ধে যথাযথভাবে ব্যাখ্যা করতে পারি না. একটি বড় সংখ্যক প্রশিক্ষণ ইটারেশনের মাধ্যমে, এই প্রক্রিয়াটি মডেলের ওজনগুলি পরিবর্তন করে যাতে এটি একটি আউটপুটের মতো কিছু উত্পাদন করতে সক্ষম হয় (একটি গানের নির্দিষ্ট বর্ণনা) তার সংশ্লিষ্ট ইনপুট (একটি গানের নির্দিষ্ট বর্ণনা) দ্বারা।
তার সব উদ্দেশ্য এবং উদ্দেশ্যগুলির জন্য, এসএফটি কাজ করেছিল, একটি আইআই ডেভেলপার এর রিপোর্টার মধ্যে নির্দিষ্ট নিরাপত্তা ঘাটতিগুলি ধরা বা নির্দিষ্ট কাজগুলিতে আইআই এর কর্মক্ষমতা উন্নত করার জন্য একটি সরঞ্জাম বজায় রাখে। দুর্ভাগ্যবশত, এসএফটি এর প্রক্রিয়াটি অস্থিতিশীল এবং ব্যয়বহুল ছিল, প্রায়ই প্রচুর পরিমাণে উচ্চ মানের ডেটা প্রয়োজন যা প্রতিক্রিয়াগুলির ক্ষেত্রে নির্দিষ্ট (উদাহরণস্বরূপ, গণতান্ত্রিক বক্তৃতা, গ্র্যাম্যাটিকাল স্টাইল)। যদিও অনেক গবেষণা কাগজে প্রমাণিত হয়েছে যে ঐতিহ্যগত এসএফটি সিন্থেটিক, আইআই-জেন
বিবর্তনের কৌশল
উল্লেখ্য: এই বিভাগের তথ্যটি প্রধানত জুন মাসের MIT গবেষণার "Self-Adapting Large Language Models" দ্বারা Zweiger ইত্যাদি থেকে প্যারাফ্রাস্ট করা হয়েছে।
ঐতিহ্যগত এসএফটি এর একটি অসুবিধা সবসময়ই মানব প্রচেষ্টা ছিল - এসএফটি পাইপলাইনগুলি প্রায়শই মানব আইটি গবেষকদের দ্বারা হ্যান্ডলাইন করা হয়েছিল, যদিও এটি সাধারণত নির্দিষ্ট ধরনের কাজগুলিতে একটু ভালভাবে কাজ করার জন্য একটি নির্দিষ্ট মডেলের একটি কার্যকর উপায় ছিল। সিন্থেটিক ডেটাতে সাম্প্রতিক অগ্রগতিগুলির সাথে মিলিত, গবেষকরা কেবলমাত্র আইটি দ্বারা উত্পাদিত এসএফটি ডেটা ব্যবহার করার ধারণাটি প্রত্যাখ্যান করেছিলেন, এছাড়াও প্রশ্নটি জিজ্ঞাসা করে যে মানুষগুলি সম্পূর্ণরূপে এসএফটি লুক থেকে বেরিয়ে যেতে পারে কিনা।
- সিন্থেটিক ডেটা জেনারেশন: এই সরঞ্জামটি কল করার মাধ্যমে, অন্য নেটওয়ার্কটি পরিস্থিতি (সাধারণত প্রম্পট) গ্রহণ করবে এবং এসএফটি জুড়ি উত্পাদন করবে. উদাহরণস্বরূপ, যদি বিমানটির উন্নয়ন ইতিহাস সম্পর্কে একটি পাসওয়ার্ড দেওয়া হয়, তাহলে একটি সমন্বয় জুড়ি হতে পারে ("কী ছিল প্রথম বাণিজ্যিক জেট এয়ারলাইন্স?", "ডে হভিল্যান্ড কমেট")।
- হাইপারপ্যারামিটার টিউনিং: পূর্বে উল্লেখিত হিসাবে, এসএফটিটি এমন একটি প্রক্রিয়া যা একাধিক ইটারেশনের জন্য পুনরাবৃত্তি করে; তাই প্রশিক্ষণ ধাপগুলির সঠিক সেটিংসগুলি হাইপারপ্যারামিটার টিউনিং নামক একটি প্রক্রিয়াতে কাস্টমাইজ করা যায়।
এখন যেখানে সিএএল এআই মডেল শিখতে সাহায্য করার জন্য দুটি শক্তিশালী সরঞ্জাম আছে, এটি শুধুমাত্র তাদের ব্যবহার সম্পর্কে প্রশিক্ষণ প্রয়োজন। তার প্রশিক্ষণের শুরুতে, সিএল প্রতিটি বেনচমার্কিং প্রশ্ন ফ্রেমমার্ক সাক্ষাতকারগুলির জন্য দুটি সরঞ্জামগুলি র্যান্ডমার্কভাবে প্রয়োগ করে। এই স্ব-আডেটগুলি (এসই, যেমন গবেষকরা তাদের ডাকতেন) প্রেরণার বিষয়টিতে সংশ্লিষ্ট, কিন্তু মৌখিক নয়, সুন্দর টুইনিং ডেটা উৎপাদন করবে এবং উপরে উল্লেখিত হাইপারপ্যারামিটার টুইনমার্কিং ধাপগুলি ব্যবহার করে মূল ডিকোডার মডেল পরিবর্তনআলাদাθ থেকে. প্রশিক্ষণ প্রক্রিয়া এখন একটি "ভিত্তিক লুক" মধ্যে যায়, যা নতুন মডেল θ' এবং মূল benchmarking প্রশ্ন অন্তর্ভুক্ত।আরোমূল মডেল θ তুলনায় সঠিক, "ভিত্তিক লুপ" একটি ইতিবাচক পুরস্কার সংকেত ফেরত দেয়. যদি সঠিকতা একই হয়, তবে এটি কোন পুরস্কার ফেরত দেয় না; যদি θ' বেনচমার্কিং প্রশ্নের ভিত্তিতে খারাপ বলে প্রমাণিত হয়, তবে এটি একটি নেতিবাচক পুরস্কার ফেরত দেয়। এখন, এই প্রক্রিয়াটি কেবলমাত্র Reinforcement Learning এর একটি ক্লাসিক উদাহরণের সাথে পুনরাবৃত্তি করে, যেখানে ভাল SEs একটি ইতিবাচক পুরস্কার দিয়ে "প্রদান করা হয়" এবং খারাপ SEs বিপরীত দ্বারা উত্সাহিত হয়; এই প্রশিক্ষণের অনেক iterations মাধ্যমে, সিইএল স্বয়ং-আড
নতুন মডেল ফ্রেমওয়ার্কগুলি আবিষ্কার করা একটি কঠিন কাজ, প্রধানত কারণ অত্যন্ত সতর্কতা নিশ্চিত করতে হবে যাতে শিখা প্রকৃতিগত জ্ঞান দ্বারা ক্ষতিগ্রস্ত হয় না বা লুকগুলির মধ্যে "সাইনালিং" মধ্যে ভুল ধাপগুলি।নাতারা যে benchmarking টেস্টগুলিতে প্রশিক্ষিত হয়েছিল, এর মানে হল যে প্রশিক্ষণ মূল্যায়নগুলি প্রত্যেকটি সমস্যাগুলির সাথে প্রথমবারের মত ছিল, তারপর মডেলটি কেবলমাত্র "টেস্টটি শিখে" এর সম্ভাবনাকে অস্বীকার করে।
ফলাফল আশ্চর্যজনক ছিল; গবেষকদের দ্বারা পরিচালিত একটি নির্দিষ্ট benchmarking পরীক্ষায়, মডেলটি 72.5% সাফল্যের হার অর্জন করে, 0% ছাড়া সিএএল ফাইন-টু-টু-টু, তাদের ফ্রেমওয়ার্কের পাগল সম্ভাবনা প্রদর্শন করে।
এই নিবন্ধটি আমাদের এআই দ্বারা আপনাকে নিয়ে এসেছে, একটি শিক্ষার্থীদের দ্বারা প্রতিষ্ঠিত এবং শিক্ষার্থীদের দ্বারা পরিচালিত এআই নৈতিকতা সংস্থা যা আধুনিক মিডিয়াতে সাধারণত আলোচনা করা যাওয়ার বাইরে এআই এর দৃষ্টিভঙ্গিগুলি বৈচিত্র্য করতে চায়. আপনি যদি এই নিবন্ধটি উপভোগ করেন তবে অনুগ্রহ করে আমাদের মাসিক প্রকাশনা এবং ব্যক্তিগত নিবন্ধগুলি দেখুন https://www.our-ai.org/ai-nexus/read!
এই নিবন্ধটি আপনাকে আমাদের এআই, একটি ছাত্র-ভিত্তিক এবং ছাত্র নেতৃত্বাধীন এআই নৈতিকতা সংস্থা যা আধুনিক মিডিয়াতে সাধারণত আলোচনা করা যাওয়ার বাইরে এআই দৃষ্টিকোণগুলি বৈচিত্র্য করতে চায়।https://www.our-ai.org/ai-nexus/read!
শিখতে হবে, না শিখতে হবে?
গবেষণা দলটির অর্জন কতটা প্রযুক্তিগতভাবে আকর্ষণীয় হোক না কেন, এই আবিষ্কারের দীর্ঘমেয়াদী সামাজিক এবং দর্শনীয় প্রভাব অত্যন্ত বেশি মূল্যায়ন করা যাবে না।Epiphanyএর থেকে
প্রাসঙ্গিকতা এবং সচেতনতা সঙ্গে একটি পার্থক্য করা উচিত. আমরা একটি গাছের ছুরি উপর হাঁটতে অনুমোদিত মনে করি কারণ আমরা জানি যে, যদিও এটি সম্ভবত ক্ষতিগ্রস্ত হবে, এটি ব্যথাটির প্রাণীবাদী ধারণা অনুভব করে না কারণ এর কোন স্নায়ু নেই।আছেনআমরা, যাইহোক, একটি প্রাণী নির্যাতন করতে দ্বিধা করতাম, এবং আমি বলছি এটা সম্ভবত কারণ আমরা অভ্যন্তরীণভাবে বুঝতে পারি যে ব্যথা অনুভূতিটি তার চারপাশের সাথে প্রাসঙ্গিক করার একটি অসাধারণ ক্ষমতা প্রদর্শন করে - চিৎকার বা কান্না, সম্ভবত - যা মানুষ, যারা প্রাণী নিজেদের সাথে অনুরূপ ব্যথা প্রতিক্রিয়া সহায়তা করে।একজন মানবিক জিজ্ঞাসাবাদকারীকে সফলভাবে বিশ্বাস করা৭০ শতাংশেরও বেশি ক্ষেত্রে এটি মানব।
যদি একটি আইআই মডেল প্রতিটি দিক থেকে একজন মানুষের মতো কাজ করে, তাহলে কি এটি কখনোই একটি মানব হিসাবে বিবেচিত হতে পারে? আইআই বিবর্তনের প্রবণতা এমন অনন্য এবং পরিস্থিতিগতভাবে সংবেদনশীল মডেলগুলি উত্পাদন করবে যা "মানুষ" হওয়ার অভিজ্ঞ সীমানার কাছাকাছি শুরু করে?
লিখেছেন Thomas Yin