د نندارتون
ځینې ورځو دمخه، یو بل AI اګانې ته ځي. دا ښکلي نوم دی "Intelligent Internet" یا II-agent، چې په نړۍ کې ترټولو هوښيار پرته په بشپړه توګه Open Source وي! نو دا څه دی؟ څنګه دا په نړۍ کې دا لوړ امتیاز ترلاسه کړ.اتوماتیک AI افسرد هوښيار ټسټونه؟ څنګه دا د نورو AI اډې لکهOpenAI عمده څیړنېدلارښوداود جنسي پارک?
په دې مقاله کې، موږ به نه یوازې د دې پوښتنو ځواب ورکړي، خو هم ځینې واقعي ټیسټونه ترسره کړي ترڅو وګورئ که آیا د دې ډول AI اټکلانو په حقیقت کې وړاندې کوي.
د II-agent په اړهد رسمي بلاګ، دا په GAIA پايلې کې د نورو مخکښ سرچینه AI افسرونو څخه شکست دی.
GAIA د عمومي AI مسلکيانو لپاره یو معیار دی چې واقعي پوښتنو وړاندې کوي چې د بنسټیز صلاحیتونو ته اړتيا لري لکه د منطق، د ډیرو ماډولیتونو په کارولو، ویب پلورنې، او د وسایلو کارولو مهارت - پوښتنو چې د انسانانو لپاره په مفهوم کې ساده دي، مګر د ډیری پرمختللي AI لپاره چټک دي، د انسانو مسلکيانو سره د GPT-4 سره د پلگ انونو لپاره یوازې 15٪ په پرتله 92٪ دقت ترلاسه کوي.
هغه څه چې د II-agent دی
ځانګړي ځانګړتیاوې او پایلې
د II-Agent یو پرانیستې سرچینه هوښيار مسلکي فریم ورک دی چې د موجودو ایجنټونو لپاره د بیلګې په توګه د بشپړ شفافیت او auditability ساتنه کوي. د دې اصلي وړتیاوې د څیړنې او معلوماتو د چمتو کولو سره د څو ګام ویب څیړنې، محتوا تولید، په شمول بلاګ ډیزاینونه او تخنیکي لارښوونه، ډاټا تحلیل سره اتومات راپور ورکولو، د ډیرو ژوره سافټویر پراختیا، د کار فورمه اتومات، او پرمختللي ستونزو حل.
د سیستم سره د Anthropic د Claude 3.7 Sonnet په کورس کې، د انټرنټ کنټیسټ مدیریت چې د 120،000 ټکینونو په کارولو سره، پرمختللي براؤزر اتوماتیک سره د لید وړتیاوې، او د انټرنټ کارپوریشنونه لپاره د واقعي وخت WebSocket مواصلات لري.
د مخکښ چارجرونو په مقابل کې د رقابتی موقعیت:
II-Agent ځان د مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ مخکښ
II-Agent د دې نښلیدو سره نه یوازې سره مطابقت کوي، بلکه د بیلګې په توګه کار کوي، په داسې حال کې چې د پرانیستې سرچینه، شفاف، او پراختیا وړ د مهمو ګټې د ساتلو لپاره - کیفیتونه چې د منظم صنعتونو لپاره اړین ونیسئ او د حداکثری تصویب لپاره.
د کاروونکو مثالونه
د تخنیکي آرژانتیک
تاسو کولی شئ د II-agent د GitHub ذخیره کوودلته.
د عالي سطحه آرشیفیت
II-Agent دوه لومړني انټرنیټونه وړاندې کوي: د مستقیم پایپ پر بنسټ د تبادلې لپاره د امر لائن وسیله (cli.py) او د WebSocket سرور (ws_server.py) چې د React پر بنسټ د frontend په frontend / لیبل کې ژوند کوي (د GitHub). په مرکز کې د src / ii_agent / کې یو ماډولر ایجنټ کور دی، کوم چې د LLM تماسونو (د llm / مشتریانو له لارې) orchestrates، د پلان کولو او تفریح منطقونو په کارولو سره کار کوي، او execution tasks (د وسایلو کې تعریف شوي) د کاروونکو څخه مشترکه ګټورۍ ګټه ورکوي. (د GitHub). په واقعي وخت کې د اړیکو د WebSockets لخوا ترسره کیږي، د انفرادي ایجنټ انډولونو سره د ګرځنده کارن تجربه لپاره د براؤزر UI ته د واقعیتونو سټرایډ کولو لپاره (د GitHubهمدارنګه
تفصيلات د داخلي آرشیفیت
اجازه ورکړم چې د II-Agent ذخیره جوړښت کې د ځانګړي ماډلونو په اړه د څارنې څخه ډډه وکړم.
Agents Module (src/ii_agent/agents/): دا ماډل د انټرنیټ انډولونه لري چې د انټرنیټ انډولونو مرکز په توګه کار کوي، د انډول د عملیاتي چرګانو مدیریت له لارې د انټرنیټ منطق او وړتیا انتخاب. انډولونه د انډولونو سره د انټرنټ سره د انټرنټ سره د سیسټم پاملرنې کاروي، جامع انټرنټ تاریخي ساتل کوي، او د LLM سره د کاروونکي لارښوونې تفسیر کول او د کارونو سره څرنګوالې کوي. هر انډول په انفرادي کارپوریشنونو کې کار کوي او د کاروونکي د وارداتو له لارې د آله کارولو له لارې د پایله ځواب رسولو ته د جریان مدیریت کوي.
LLM Interface Module (src/ii_agent/llm/): دا ماډل د لوی زبان ماډلونو سره اړیکه کولو لپاره د انټرنېټ layer وړاندې کوي، په ځانګړې توګه د Anthropic د Claude 3.7 Sonnet لپاره ګټور شوی. دا په مستقیم ډول د Anthropic API دسترسی او د Google Cloud Vertex AI راټول کولو سره کار کوي، د تصدیق مدیریت، د غوښتنلیک فارمیټ کولو او ځواب پروسس. دا ماډل د تیکن استعمال اندازې او ستراتیژیکي truncation تکنالوژۍ سره هوښيار کنکشن مدیریت ترسره کوي ترڅو تاوان 120،000 ټوکن سره د اړیکو کیفیت او اړتیا ساتل کړي.
Tools Module (src/ii_agent/tools/): دا ماډل د اغیزې وړتیاوو په پراخه کچه شامل دي چې د اګانو سره د خپل چاپیریال سره اړیکه ونیسئ، په شمول د فایبر سیسټم فعالیتونو سره هوښيار کوډ ترمیم، په خوندي چاپیریالونو کې د امر لائن اجرا، پرمختللي ویب انټرنېټ او براؤزر اتومات، او د مختلفو حالتونو لپاره تخصصي وړتیاوې. د وسایلو د PDF متن استخراج، غږ transcription، صدا مجموعې، انځور توليد، ویډیو توليد، او ژور څیړنې انډول ملاتړ کوي. د براؤزر اتوماتیک وړتیاوې د ویډیو انډول سره Playwright کې جوړ شوي دي، د اګانو ته اجازه ورکوي چې د ویب پاڼهونو ته لارښوونې، screenshots راکړئ، او
Utilities Module (src/ii_agent/utils/): دا ماډل د ملاتړ انستافورټونه وړاندې کوي، په شمول د کنکټیس مدیریت سیسټم چې د ټوکن ارزونې او ګټور کولو په کارولو سره کوي، د لوی محصولاتو لپاره د فایل پر بنسټ archival میکانیزمونه، د واقعي وخت د اړیکو لپاره WebSocket اړیکو پروتوکولونه، او د ډاټا پروسس او سیسټم فعالیتونو لپاره د مختلفو مسلکي فعالیتونه. د ګټوریتو هم د پلان او تفکر وړتیاوې شامل دي چې جوړ شوي تفکر، د ستونزو تفکیک، او شفاف تصمیم گیری پروسو اجازه ورکوي چې د ایجنټ د ستونزو حل کولو لارښود جوړوي.
د نورو Open-Source چارجرونو پورې اړه لري
II-Agent سره د ډیرو Open-Source خدماتو او کتابتونونو سره سخت انټرنټ کوي. د LLM بکسډونو لپاره، دا د Anthropic Python SDK او د Google Vertex AI له لارې د google-cloud-aiplatform کلینټ له لارې Anthropic Claude ملاتړ کوي، او همدارنګه د پلگ ان او لوبې څیړنې عرضه کوونکي لکه Tavily، Jina، Firecrawl، او SerpAPI وړاندې کوي (د GitHub). په frontend او tooling سایټ کې، دا د React / Node.js کڅوړه (Next.js conventions) پر بنسټ جوړوي او د ټولنې له خوا د پروژو څخه ګټه ورکوي - په ځانګړې توګه AugmentCode لپاره د سافټویر انجنيرۍ دنده orchestration، د Manus د پروګرام آرکټیکټیک نمونې، او د انډیزایډ براؤزر د پرمختللي ویب انټرنېټونو لپاره ګټه ورکوي (د GitHubهمدارنګه
آسانه ازمايښت Case
لومړی زه غواړم چې یو ساده ازموينه کڅوړه هڅه وکړم ترڅو د بیس لړۍ جوړ کړي. او د نوکیا سګی کڅوړه څخه غوره ساده ازموينه کڅوړه نلري. که څه هم دا په خپل نمونه کڅوړه کې ذکر شوی دی، زه یو کوچنۍ تڼۍ اضافه کړم چې دا باید د HTML5 ګرځنده لوبې وي.
[Prompt[نور]د نوکیا د ساینس لوبې د HTML5 ویب لوبې په توګه د دوبلو جوړولو
And it was a success from the first attempt!نه یوازې د لوبې لپاره چمتو نه ده، دا د نوکیا ځانګړتیاوې د تلیفون ځانګړي ډیزاین عناصر اضافه کوي چې د لوبې ریټرو حقیقي کړي.
Author’s Notes: لکه څنګه چې د لارښوونې په توګه، د Claude Sonnet 3.7 په ورته لارښوونې کې ورته لارښوونې تولید کوي، مګر دا په چټکۍ سره "Game Over" ښکاري کله چې یو کاروونکي هڅه کوي. ډیری احتمال لري چې د هغې د ټریډینګ algorithm په سمه توګه ترسره نه شو، او د لوبې نه آزموینې شوي.
اوس موږ د دې لپاره چې د II-agent څنګه د دې په اړه د تفصيلات په اړه وګورئ:
First the II-agent created a plan(د انفرادي کارکوونکو لپاره تل مهم):
- د اصلي HTML جوړښت د canvas عنصر سره جوړ کړئ
- د ډیزاین لپاره د CSS سبکونه جوړ کړئ
- Implement the core Snake game logic in JavaScript:
- Snake movement and controls
- Food generation
- Collision detection
- Score tracking
- Game over handling
- Snake movement and controls
- د نوکیا سبک بصری عناصر اضافه کړئ (پیکسل آرټ، رنګ سیسټم)
- د ګرځنده دوستانه کنترولونه
- د لوبې په بشپړه توګه ازمايښت
- د لوبې نصب کړئ نو تاسو کولی شئ دا لوبه وکړئ
وروسته دا د اړونده فایلونه جوړ او کوډ پیژندل. او په پایله کې دا د یو ویب اپلیکیشن په توګه پراختیا کوي نو زه کولی شي دا ازموینې وکړي. د II-agent webui د کوډو په څیر دی، چې تاسو کولی شئ په راستې کې درې اصلي ټیپونه وګورئ: براؤزر، کوډ، ترمینل.
د سختو آزموینې قضیه
لکه څنګه چې د نوکیا سایټ لوبې په ډیری مختلفو coding LLMs او AI ایجنټونو کې ډیزاین شوي او آزموینې شوې ده، دا به یو آزموینې کیس وي چې ساده کوډ کولو څخه زیات وي.
زما پلان دا ده چې د II-agent ته اجازه ورکړيbuild a website for Nokia’s historical feature phones، چې په طبيعت کې شامل ديresearch(د نوکیا ګرځنده تلیفونونه)design(د ویب پاڼه ډیزاین)codingاوbrowser use(د محصول انځورونه او ځانګړتیاوې لپاره د انټرنیټ راټول کړئ، د پایلې ویب پاڼه چمتو کړئ).
ښه، د پایلو ښيي چې موږ تر اوسه د اوږد لاره لرئ.
لومړی هڅه
[Prompt[نور]د نوکیا ګرځنده تلیفون موزه لپاره یو ویب پاڼه جوړ کړئ، د ټولو نوکیا ګرځنده تلیفونونه په یو محصول ګرځنده فارم کې ښيي. د هر تلیفون موډل لپاره، د محصول انځور، د پیل کال، خرڅلاو واحدونه او د مهمو ځانګړتیاوو په یوه پارامتر کې مختصر شرح ښيي.
دا د دې چمتو کولو لپاره یو مناسب پلان جوړ کړ
- Research Nokia feature phone models to collect information on:
- Product images
- Launch years
- Units sold
- Key features for descriptions
- Design the website layout:
- Create a responsive main page with an introduction to Nokia feature phones
- Implement a product gallery section to display all phone models
- Include individual phone detail sections
- Add navigation and search functionality
- Develop the website using:
- HTML for structure
- Tailwind CSS for styling
- JavaScript for any interactive elements (if needed)
- Test the website for:
- Responsiveness
- Proper display of information
- Navigation functionality
- د ویب پاڼه نصب کړئ او تاسو سره د پایلې URL وړاندې کړئ
بيا دا د څیړنې، ډیری څیړنې ترسره کړي. زه کولی شي د "Browser" ټیپ څخه وګورئ چې په ډیری وختونو کې په انټرنیټ کې پلورل کیږي،But eventually it failed and stoppedد دلیل؟ د پلورنې دنده یو چې په ځانګړي چټک ویب پاڼه کې وخت لري.
The AI agent’s plan did not include any exception handling and error recovery mechanism.
دوهم هڅې
لکه څنګه چې په لومړي هڅه کې، د افسر د ټولو نوکیا feature phones په اړه معلومات ترلاسه کولو لپاره ډیر سخت هڅه وکړه، زما د دویم هڅه هدف دا ده چې د 5 غوره feature phones ته محدود شي.
[Prompt[نور]د نوکیا لپاره یو ویب پاڼه جوړ کړئ، د نوکیا ګرځنده تلیفون موزه Top 5 ځانګړي تلیفونونه د محصول ګالري فارم کې. د هر تلیفون موډل لپاره، د محصول انځور، د پیل کال، او د اصلي ځانګړتیاوو په یوه پارامتر کې د مختصر تفصیل ښودل کړئ.
Top 5 ځانګړي تلیفونونهپه دې وخت کې د ایجنټ ناکام شوی او د بل دلیل له امله دوبار بند شوی. د انسانیت د نرخ محدودیت په ځمکه کې راځي، او د بریښنالیک ته ورسیږي. بیا د AI ایجنټ د استثنا د انتقال او د بدعت ميخانيکي نه لري،
برسېره پر دې، یو بل ښکلي غلطی شتون لري. د AI ایجنټdid NOT follow user instructionد "د څیړنې په یوازې "Top 5 تلیفونونو" ته محدود کول، او په ځای کې د ټولو ځانګړي تلیفونونو څیړنې ته لاړ شئ.
د تیسری هڅه
فکر د درې ځله کولای شي یو جادو وي، زه فکر کړم چې څنګه د ایجنټ لومړی د ماکپ ویب پاڼه جوړ کړي، او بیا د تلیفون ماډلونه څیړنه؟ په دې توګه موږ کولی شو په صورت کې چې د تلیفون ماډل څیړنې په لوړه کچه تړل شي لږ تر لږه د مفهوم د ثبوت لري. په اصل کې موږ د دوو اصلي کارونو ترتیب بدلون ته هدف ترلاسه کړي.
[Prompt[نور]د نوکیا ګرځنده تلیفون موزیم لپاره یو ویب پاڼه جوړ کړئ، د نوکیا ترټولو پیاوړي ګرځنده تلیفونونه په محصول ګرځنده فارم کې وړاندې کوي. د هر تلیفون ماډل لپاره، د محصول انځور، د پیل کال، او د مهمو ځانګړتیاوو په یوه پارامتر کې مختصر شرح ښودل کړئ. یادونه:
1) د لومړی د حقیقي ډاټا پرته د mock-up ویب پاڼه جوړ کړئ
لومړی د حقیقي ډاټا پرته د mock-up ویب پاڼه جوړ کړئ2) کله چې د نوکیا تلیفون موډلونه څیړنه، یوازې د پنجو غوره موډلونو څیړنه، یوازې 5
نو د ماک اپ ویب پاڼه جوړولو لومړی برخه ښکاري چې په ښه توګه چمتو کیږي:
خو کله چې د ویب پاڼه ازموینې وخت دی، د ستونزو شتون لري. دا د http سرور سره د ii-agent خپل backend سرور سره د تناوب لپاره port 8000 کاروي. لکه څنګه چې د II-agent تعقیب کولو او د بندر شمیره بدلولو لپاره امکان نلري، زه باید د بدلونونو لارښوونې اضافه کولو لپاره یو نوی سیشن پیل وکړم.
د 4th هڅه
[Prompt]: _ د نوکیا لپاره یو ویب پاڼه جوړ کړئ، چې د نوکیا ترټولو پیاوړې ځانګړتیاوې تلیفونونه په محصول ګالری فارم کې ښیي. د هر تلیفون موډل لپاره، د محصول انځور، د پیل کال او د اصلي ځانګړتیاوو په یوه پارامتر کې مختصر شرح ښیي. یاد وکړئ:
- لومړی د حقیقي معلوماتو پرته د ویب سایټ جوړ کړئ، د ویب سرور لپاره د بندر 8888 کاروئ
- کله چې د نوکیا تلیفون موډلونه څیړنه، یوازې د پنجو غوره موډلونو څیړنه، یوازې 5
د Mock-up ویب پاڼه په حقیقت کې کار کوي، او ښکاري مناسب.
د اتومات ویب پاڼه ازموينه کار نه کړ، احتمالا له امله ځینې پروسه مدیریت په Terminal ټابلیټ کې. خوشحاله، د څو ناکام هڅو وروسته، دا د ژوند سره راځي او وايي:
" زه په 8888 بندر کې د کورني ویب سرور پیل کولو هڅه کړم، مګر زه د دې سره ځینې ستونزې تجربه کولی ام. دا د ویب پاڼه په واقعیت کې د پرمختګ ته اغیزمن نه کوي، ځکه چې زه اوس به د نوکیا ترټولو غوره 5 feature phones څیړنه وکړي چې د واقعي ډاټا اضافه کړي. "
" زه په 8888 بندر کې د کورني ویب سرور پیل کولو هڅه کړم، مګر زه د دې سره ځینې ستونزې تجربه کولی ام. دا د ویب پاڼه په واقعیت کې د پرمختګ ته اغیزمن نه کوي، ځکه چې زه اوس به د نوکیا ترټولو غوره 5 feature phones څیړنه وکړي چې د واقعي ډاټا اضافه کړي. "
I felt a glimpse of hope for AI agents now.
په پای کې، د آزموینې کڅوړه هم ناکام شو، د Anthropic د نرخ محدودیت له امله. او د AI ایجنټ د دې څخه خوندي نه وي.
فانتزی vs واقعیت - زما د زده کړې
We have always wanted very intelligent AI Agents that can be truly autonomous and do wonderful things on our behalf. But the reality is that we are quite far from it.دا د II-agent په ځانګړې توګه انتقامي نه ده، بلکه په عمومي توګه د AI ایجنټونه.
ځینې شیانو شتون لري چې انسان په ډیره ښه توګه او تقریبا په وړیا توګه کار کوي، په داسې حال کې چې ټول د هنري AI اګانې مبارزه کوي. د مثال په توګه
- Plannng: د پیچلي هدفونو په کوچني وختونو کې وده ورکړي، د هر وخت لپاره د امکانيت مطالعې ترسره کړي، د کارونو ترتیب کول جوړ کړئ.
- د منطقولو: تحلیل وکړئ چې څه چمتو شوي او څه چمتو شوي، د ریښتیني سبب تحلیل ترسره کړئ، د فرضونو او بهرني شرایطو په غلطو کې چمتو کړئ.
- ځواب: د پیاوړتیا کم کړئ، د کارونو ترتیب بدل کړئ، د بدیل حل هڅه کړئ، د مفهومونو د ثبوت ترسره کړئ، کله چې اړتيا وي، د کاروونکو سره مرسته وکړئ، بند کړئ او تازه پیل کړئ.
نو د امروزه SOTA ماډلونو او ایجنټونو سره، موږ اوس مهال ځینې انتخابونه لري:
- Co-Pilot: دا د مفهوم او سوداګرۍ په توګه ډیری بریالیتوب ثابت کوي. د مثال په توګه، د Cursor او GitHub Co-Pilot سره coding؛ Microsoft Co-Pilot د Office 365 لپاره.
- انسان په چڼاسکه کې؛ یو ډیزاین موډل چې د لینګ چڼاسکه لخوا په نوم دی، په کوم کې د افسر کولی شي انسانونو ته کله چې دوی د ساتنې یا اړتيا لري، وقف کړي. د چټک پیاوړتیا هنوز دی چې که د AI افسرونه چټک وي چې چمتو شي چې څومره ټاکل شي.
نو دلته تاسو یې لري، په بشپړ ډول اتومات AI ایجنټ د دویم ودې:، د OpenAI Deep Research، Manus، GenSpark، او اوس د II-agent ته. د ماشوم ګامونه ډاډه کوي، مګر موږ پرمختګ کوي.
پته
يو ورځ وروسته چې زه د لومړي ازموینې ترسره او د مقاله لیکلي، زه د سخت ازموینې يو فرصت ورکړم. دا ځل دا کار کړ (99٪): دا د نمونې ویب پاڼه جوړ کړ، په بریالیتوب سره د ترټولو 5 تلیفونونو څیړنې لارښوونې پیژندل، ټول معلومات او انځورونه راټول، او په پای کې د ویب پاڼه تازه کړ!
چرا 99٪ په ځای کې 100٪؟ د ویب پاڼه بدلولو وروسته په بشپړه توګه پایله: د ازموینې لپاره پیل ناکام وه. وروسته ځینې دستاوي ډبګګنگ، دا ښکاري چې د II-agent یو نوی سیشن جوړ او د اصل ویب پاڼه فایلونه نه کولی شي. مګر manually running the website by Python works, and the screenshots were taken.
دا د یو کوچني بکس په څیر دی چې کولی شي حل شي.