514 পড়া
514 পড়া

MIT এর গবেষণায় বলা হয়েছে যে আইটি বাস্তবে অন্যান্য আইটি মডেল শেখাতে পারে।

দ্বারা Our AI8m2025/06/15
Read on Terminal Reader

অতিদীর্ঘ; পড়তে

MIT গবেষকরা একটি গবেষণামূলক গবেষণামূলক কাগজ প্রকাশ করেছে যা দেখায় যে কিভাবে একটি আইটি সিস্টেম প্রক্রিয়াগুলি প্রক্রিয়াগুলি ব্যবহার করে ব্যানচমার্কিং কাজে তার নিজস্ব কর্মক্ষমতা উন্নত করতে পারে।
featured image - MIT এর গবেষণায় বলা হয়েছে যে আইটি বাস্তবে অন্যান্য আইটি মডেল শেখাতে পারে।
Our AI HackerNoon profile picture
0-item

একটি AI মডেল এবং একটি মানব মস্তিষ্কের মধ্যে সবচেয়ে বড় পার্থক্য কি?

সময়ের সাথে সাথে, অসংখ্য উত্তর দেওয়া হয়েছে- মস্তিষ্কটি আরও শক্তিশালী, তার ইনপুট মিডিয়াতে আরও বহুমুখী, এবং বৈদ্যুতিকতার পাশাপাশি রাসায়নিকভাবে সক্ষম - কিন্তু মানব মস্তিষ্কের সবচেয়ে গুরুত্বপূর্ণ বৈশিষ্ট্যটি তার আশ্চর্যজনক প্লাস্টিকতা।অন্যশরীরের অংশ. প্লাস্টিকতা মানুষকে ধারণা এবং দক্ষতা গড়ে তুলতেও সাহায্য করে: বলা হয়, "নেউরনগুলি যারা একসঙ্গে জ্বলছে"। পেশী মেমরি এবং প্রায় অবিলম্বে বাস্তব স্মরণ আমাদের জীবনের দুটি প্লাস্টিকতা সক্ষম অংশ যা আমরা কখনোই ছাড়া বেঁচে থাকতে পারি না।নিজের কর্মক্ষমতার উন্নতিএই নিবন্ধটিতে আমরা বিশ্বের প্রথম স্বতঃস্ফূর্তভাবে বিকশিত এআই নামক স্বতঃস্ফূর্তভাবে সংশ্লিষ্ট ভাষা মডেল (SEAL) এর নৈতিক ও প্রযুক্তিগত প্রভাবগুলি অনুসন্ধান করি।

অসম্পূর্ণ শিক্ষা

অবশ্যই, ট্রান্সফরমার আর্কিটেকচার ব্যবহার করে এআই মডেলগুলি এখনও নির্দিষ্ট কাজ শিখতে সক্ষম ছিল, তবে উপলব্ধ কয়েকটি পদ্ধতি সম্পূর্ণরূপে স্বয়ংক্রিয় এবং কার্যকর নয়. সম্ভবত একটি মডেলকে একটি নির্দিষ্ট দক্ষতা অর্জন করার জন্য প্রশিক্ষণ করার সবচেয়ে উল্লেখযোগ্য উপায় - যেমন ইংরেজিকে চীনা ভাষায় অনুবাদ করা বা ট্রিগোনোমিটারি সমস্যা সঠিকভাবে করা - একটি প্রক্রিয়া ব্যবহার করা হয় যা সুপারভাইজড ফিন টুইনিং বা এসএফটি নামে পরিচিত।

  • একটি উদাহরণ হিসাবে, আমরা আধুনিক গান শব্দ উৎপাদনের উদাহরণ গ্রহণ করি।
  • আমাদের উদাহরণের জন্য, এটি করার একটি স্পষ্ট কিন্তু বিতর্কিত উপায় হল ইন্টারনেট থেকে রক্ষা করা গানগুলির শব্দগুলি ব্যবহার করা এবং গানগুলির বিষয়বস্তু এবং বৈশিষ্ট্যগুলির মোট সংক্ষিপ্ত সংক্ষিপ্তগুলির সাথে তাদের সংযুক্ত করা।
  • মডেলের উপর এসএফটিটি প্রয়োগ করুন. এটি সাধারণত গ্রিডিয়েন্ট ডাসেন্ট নামক একটি প্রক্রিয়া দ্বারা করা হয়, যার প্রযুক্তিগত দিকটি আমি এই নিবন্ধে যথাযথভাবে ব্যাখ্যা করতে পারি না. একটি বড় সংখ্যক প্রশিক্ষণ ইটারেশনের মাধ্যমে, এই প্রক্রিয়াটি মডেলের ওজনগুলি পরিবর্তন করে যাতে এটি একটি আউটপুটের মতো কিছু উত্পাদন করতে সক্ষম হয় (একটি গানের নির্দিষ্ট বর্ণনা) তার সংশ্লিষ্ট ইনপুট (একটি গানের নির্দিষ্ট বর্ণনা) দ্বারা।
নিম্নমুখী

তার সব উদ্দেশ্য এবং উদ্দেশ্যগুলির জন্য, এসএফটি কাজ করেছিল, একটি আইআই ডেভেলপার এর রিপোর্টার মধ্যে নির্দিষ্ট নিরাপত্তা ঘাটতিগুলি ধরা বা নির্দিষ্ট কাজগুলিতে আইআই এর কর্মক্ষমতা উন্নত করার জন্য একটি সরঞ্জাম বজায় রাখে। দুর্ভাগ্যবশত, এসএফটি এর প্রক্রিয়াটি অস্থিতিশীল এবং ব্যয়বহুল ছিল, প্রায়ই প্রচুর পরিমাণে উচ্চ মানের ডেটা প্রয়োজন যা প্রতিক্রিয়াগুলির ক্ষেত্রে নির্দিষ্ট (উদাহরণস্বরূপ, গণতান্ত্রিক বক্তৃতা, গ্র্যাম্যাটিকাল স্টাইল)। যদিও অনেক গবেষণা কাগজে প্রমাণিত হয়েছে যে ঐতিহ্যগত এসএফটি সিন্থেটিক, আইআই-জেন

বিবর্তনের কৌশল

উল্লেখ্য: এই বিভাগের তথ্যটি প্রধানত জুন মাসের MIT গবেষণার "Self-Adapting Large Language Models" দ্বারা Zweiger ইত্যাদি থেকে প্যারাফ্রাস্ট করা হয়েছে।

বড় ভাষা মডেলের স্ব-অনিয়োগবড় ভাষা মডেলের স্ব-অনিয়োগ

ঐতিহ্যগত এসএফটি এর একটি অসুবিধা সবসময়ই মানব প্রচেষ্টা ছিল - এসএফটি পাইপলাইনগুলি প্রায়শই মানব আইটি গবেষকদের দ্বারা হ্যান্ডলাইন করা হয়েছিল, যদিও এটি সাধারণত নির্দিষ্ট ধরনের কাজগুলিতে একটু ভালভাবে কাজ করার জন্য একটি নির্দিষ্ট মডেলের একটি কার্যকর উপায় ছিল। সিন্থেটিক ডেটাতে সাম্প্রতিক অগ্রগতিগুলির সাথে মিলিত, গবেষকরা কেবলমাত্র আইটি দ্বারা উত্পাদিত এসএফটি ডেটা ব্যবহার করার ধারণাটি প্রত্যাখ্যান করেছিলেন, এছাড়াও প্রশ্নটি জিজ্ঞাসা করে যে মানুষগুলি সম্পূর্ণরূপে এসএফটি লুক থেকে বেরিয়ে যেতে পারে কিনা।Decoder-only ট্রান্সফরমার মডেল(এই গবেষণায় দুটি ওপেন সোর্স মডেল ব্যবহার করা হয়েছিল, LLaMa-3.2 এবং Qwen-2.5B, ভিন্ন পরীক্ষার ক্ষেত্রে), "টুল ইকুয়েশন" সফ্টওয়্যার, এবং সিএএল নেটওয়ার্ক নিজেই, বেশ কয়েকটি বেনচমার্কিং প্রশ্নগুলির উত্তর দিতে একটি ভাগ্যবান লক্ষ্য নিয়ে।সংগঠন)যতটা সম্ভব সঠিকভাবে. সিএএল নেটওয়ার্ক প্রকৃতপক্ষে প্রশ্নটি পূর্বাভাস দেয় না এবং উত্তরটি উত্পাদন করে না - বরং এটি ডিকোডার-মাত্র ট্রান্সফরমার মডেলের উপর এসএফটিটি চালানোর উপর মনোযোগ দেয়, লক্ষ্যমাত্রাটি উন্নত করা।মডেলএই কাজটি করার জন্য, সিএএল নেটওয়ার্ক দুটি প্রধান সরঞ্জাম দেওয়া হয়:

Decoder-only ট্রান্সফরমার মডেল
  • সিন্থেটিক ডেটা জেনারেশন: এই সরঞ্জামটি কল করার মাধ্যমে, অন্য নেটওয়ার্কটি পরিস্থিতি (সাধারণত প্রম্পট) গ্রহণ করবে এবং এসএফটি জুড়ি উত্পাদন করবে. উদাহরণস্বরূপ, যদি বিমানটির উন্নয়ন ইতিহাস সম্পর্কে একটি পাসওয়ার্ড দেওয়া হয়, তাহলে একটি সমন্বয় জুড়ি হতে পারে ("কী ছিল প্রথম বাণিজ্যিক জেট এয়ারলাইন্স?", "ডে হভিল্যান্ড কমেট")।
  • হাইপারপ্যারামিটার টিউনিং: পূর্বে উল্লেখিত হিসাবে, এসএফটিটি এমন একটি প্রক্রিয়া যা একাধিক ইটারেশনের জন্য পুনরাবৃত্তি করে; তাই প্রশিক্ষণ ধাপগুলির সঠিক সেটিংসগুলি হাইপারপ্যারামিটার টিউনিং নামক একটি প্রক্রিয়াতে কাস্টমাইজ করা যায়।
হাইপারপ্যারামিটার টিউনিং

এখন যেখানে সিএএল এআই মডেল শিখতে সাহায্য করার জন্য দুটি শক্তিশালী সরঞ্জাম আছে, এটি শুধুমাত্র তাদের ব্যবহার সম্পর্কে প্রশিক্ষণ প্রয়োজন। তার প্রশিক্ষণের শুরুতে, সিএল প্রতিটি বেনচমার্কিং প্রশ্ন ফ্রেমমার্ক সাক্ষাতকারগুলির জন্য দুটি সরঞ্জামগুলি র্যান্ডমার্কভাবে প্রয়োগ করে। এই স্ব-আডেটগুলি (এসই, যেমন গবেষকরা তাদের ডাকতেন) প্রেরণার বিষয়টিতে সংশ্লিষ্ট, কিন্তু মৌখিক নয়, সুন্দর টুইনিং ডেটা উৎপাদন করবে এবং উপরে উল্লেখিত হাইপারপ্যারামিটার টুইনমার্কিং ধাপগুলি ব্যবহার করে মূল ডিকোডার মডেল পরিবর্তনআলাদাθ থেকে. প্রশিক্ষণ প্রক্রিয়া এখন একটি "ভিত্তিক লুক" মধ্যে যায়, যা নতুন মডেল θ' এবং মূল benchmarking প্রশ্ন অন্তর্ভুক্ত।আরোমূল মডেল θ তুলনায় সঠিক, "ভিত্তিক লুপ" একটি ইতিবাচক পুরস্কার সংকেত ফেরত দেয়. যদি সঠিকতা একই হয়, তবে এটি কোন পুরস্কার ফেরত দেয় না; যদি θ' বেনচমার্কিং প্রশ্নের ভিত্তিতে খারাপ বলে প্রমাণিত হয়, তবে এটি একটি নেতিবাচক পুরস্কার ফেরত দেয়। এখন, এই প্রক্রিয়াটি কেবলমাত্র Reinforcement Learning এর একটি ক্লাসিক উদাহরণের সাথে পুনরাবৃত্তি করে, যেখানে ভাল SEs একটি ইতিবাচক পুরস্কার দিয়ে "প্রদান করা হয়" এবং খারাপ SEs বিপরীত দ্বারা উত্সাহিত হয়; এই প্রশিক্ষণের অনেক iterations মাধ্যমে, সিইএল স্বয়ং-আড

নতুন মডেল ফ্রেমওয়ার্কগুলি আবিষ্কার করা একটি কঠিন কাজ, প্রধানত কারণ অত্যন্ত সতর্কতা নিশ্চিত করতে হবে যাতে শিখা প্রকৃতিগত জ্ঞান দ্বারা ক্ষতিগ্রস্ত হয় না বা লুকগুলির মধ্যে "সাইনালিং" মধ্যে ভুল ধাপগুলি।নাতারা যে benchmarking টেস্টগুলিতে প্রশিক্ষিত হয়েছিল, এর মানে হল যে প্রশিক্ষণ মূল্যায়নগুলি প্রত্যেকটি সমস্যাগুলির সাথে প্রথমবারের মত ছিল, তারপর মডেলটি কেবলমাত্র "টেস্টটি শিখে" এর সম্ভাবনাকে অস্বীকার করে।

ফলাফল আশ্চর্যজনক ছিল; গবেষকদের দ্বারা পরিচালিত একটি নির্দিষ্ট benchmarking পরীক্ষায়, মডেলটি 72.5% সাফল্যের হার অর্জন করে, 0% ছাড়া সিএএল ফাইন-টু-টু-টু, তাদের ফ্রেমওয়ার্কের পাগল সম্ভাবনা প্রদর্শন করে।


এই নিবন্ধটি আমাদের এআই দ্বারা আপনাকে নিয়ে এসেছে, একটি শিক্ষার্থীদের দ্বারা প্রতিষ্ঠিত এবং শিক্ষার্থীদের দ্বারা পরিচালিত এআই নৈতিকতা সংস্থা যা আধুনিক মিডিয়াতে সাধারণত আলোচনা করা যাওয়ার বাইরে এআই এর দৃষ্টিভঙ্গিগুলি বৈচিত্র্য করতে চায়. আপনি যদি এই নিবন্ধটি উপভোগ করেন তবে অনুগ্রহ করে আমাদের মাসিক প্রকাশনা এবং ব্যক্তিগত নিবন্ধগুলি দেখুন https://www.our-ai.org/ai-nexus/read!

এই নিবন্ধটি আপনাকে আমাদের এআই, একটি ছাত্র-ভিত্তিক এবং ছাত্র নেতৃত্বাধীন এআই নৈতিকতা সংস্থা যা আধুনিক মিডিয়াতে সাধারণত আলোচনা করা যাওয়ার বাইরে এআই দৃষ্টিকোণগুলি বৈচিত্র্য করতে চায়।https://www.our-ai.org/ai-nexus/read!

শিখতে হবে, না শিখতে হবে?

গবেষণা দলটির অর্জন কতটা প্রযুক্তিগতভাবে আকর্ষণীয় হোক না কেন, এই আবিষ্কারের দীর্ঘমেয়াদী সামাজিক এবং দর্শনীয় প্রভাব অত্যন্ত বেশি মূল্যায়ন করা যাবে না।Epiphanyএর থেকেMay এর সংস্করণ নেক্সাস ম্যাগাজিন) কারণ আমি বিশ্বাস করি যে জৈব কম্পিউটারগুলিতে ব্যবহৃত নিউরোনাল গ্রুপগুলি প্রাকৃতিক আইনগুলির অধীনে রয়েছে কারণ তারা বর্তমানে সচেতনতার ক্ষমতা অর্জন করে এবং, যদি না করে, তারা প্রাকৃতিকভাবে প্লাস্টিকের ফলে এটি বিকশিত করতে সক্ষম হতে পারে। সিএইএল তাই বেনচমার্কিং কাজগুলিতে মডেল কর্মক্ষমতা উন্নত করার একটি পদ্ধতির বাইরে গুরুত্বপূর্ণ; এটি প্রথম প্রতিষ্ঠিত আইটি প্রশিক্ষণ ফ্রেমমেন্ট যেখানে একটি আইটি মডেলটি সফলভাবে অন্য আইটিকে সরাসরি প্রশিক্ষণ করার ক্ষমতা প্রদর্শন করেছে।

May এর সংস্করণনেক্সাস ম্যাগাজিননেক্সাস ম্যাগাজিন

প্রাসঙ্গিকতা এবং সচেতনতা সঙ্গে একটি পার্থক্য করা উচিত. আমরা একটি গাছের ছুরি উপর হাঁটতে অনুমোদিত মনে করি কারণ আমরা জানি যে, যদিও এটি সম্ভবত ক্ষতিগ্রস্ত হবে, এটি ব্যথাটির প্রাণীবাদী ধারণা অনুভব করে না কারণ এর কোন স্নায়ু নেই।আছেনআমরা, যাইহোক, একটি প্রাণী নির্যাতন করতে দ্বিধা করতাম, এবং আমি বলছি এটা সম্ভবত কারণ আমরা অভ্যন্তরীণভাবে বুঝতে পারি যে ব্যথা অনুভূতিটি তার চারপাশের সাথে প্রাসঙ্গিক করার একটি অসাধারণ ক্ষমতা প্রদর্শন করে - চিৎকার বা কান্না, সম্ভবত - যা মানুষ, যারা প্রাণী নিজেদের সাথে অনুরূপ ব্যথা প্রতিক্রিয়া সহায়তা করে।একজন মানবিক জিজ্ঞাসাবাদকারীকে সফলভাবে বিশ্বাস করা৭০ শতাংশেরও বেশি ক্ষেত্রে এটি মানব।

যদি একটি আইআই মডেল প্রতিটি দিক থেকে একজন মানুষের মতো কাজ করে, তাহলে কি এটি কখনোই একটি মানব হিসাবে বিবেচিত হতে পারে? আইআই বিবর্তনের প্রবণতা এমন অনন্য এবং পরিস্থিতিগতভাবে সংবেদনশীল মডেলগুলি উত্পাদন করবে যা "মানুষ" হওয়ার অভিজ্ঞ সীমানার কাছাকাছি শুরু করে?


লিখেছেন Thomas Yin

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks