1,215 skaitymai
1,215 skaitymai

Kodėl dauguma AI agentų nepavyksta gamyboje (ir kaip sukurti tuos, kurie to nedaro)

pateikė Paolo Perrone6m2025/06/24
Read on Terminal Reader

Per ilgai; Skaityti

Kai sukūriau AI agentus, aš padariau tą pačią klaidą, kurią daro dauguma žmonių: aš sutelkiau dėmesį į tai, kad gausiu žaibišką demonstravimą, o ne sukūriau kažką, kas iš tikrųjų galėtų išgyventi gamyboje. Čia yra 5 žingsnių kelio žemėlapis, kuris nukreipia jūsų agentą iš plėtros pragaro į skalbiamą, paruoštą sistemą. 1 žingsnis: Master Python gamybos AI. 2 žingsnis: padaryti savo agentą stabilų ir patikimą. 3 žingsnis: eik giliau į RAG. 4 žingsnis: apibrėžti tvirtą agentų architektūrą. 5 žingsnis: stebėti, mokytis ir tobulinti gamyboje.
featured image - Kodėl dauguma AI agentų nepavyksta gamyboje (ir kaip sukurti tuos, kurie to nedaro)
Paolo Perrone HackerNoon profile picture
0-item

Kai aš pirmą kartą pradėjau kurti AI agentus, aš padariau tą pačią klaidą, kurią daro dauguma žmonių: aš sutelkiau dėmesį į tai, kad gausiu nuostabų demonstravimą, o ne sukūriau kažką, kas galėtųIš tikrųjųIšgyventi gamyboje


Iš pradžių prototipas atrodė protingas, greitai reaguodavo ir naudojo naujausias atviro kodo bibliotekas.


Klaidos pasirodė kraštutiniais atvejais. Agentas kovojo su patikimumu. Įrašymas buvo po minties. Ir skalavimas? Pamirškite. Aš supratau, kad nesu sukūręs realios sistemos - buvau sukūręs žaislą.


Po kelių skausmingų pertvarkymų (ir daugiau nei vieną savaitgalį prarado debugging spageti skambučių), aš pagaliau užrakintas į patikimą požiūrį.


Nesvarbu, ar esate solo statybininkas, ar diegiate AI mastu komandoje, tai yra požiūris, kurį norėčiau, kad kas nors man būtų perdavęs pirmąją dieną.

Image Credit Rakesh Gohel

Turinio lentelė

  • 1 žingsnis: Master Python gamybos AI
  • 2 žingsnis: padaryti savo agentas stabilus ir patikimas
  • 3 žingsnis: eik giliai į RAG
  • 4 žingsnis: Apibrėžkite tvirtą agento architektūrą
  • 5 žingsnis: stebėti, mokytis ir tobulinti gamybą

Step 1: Master Python for Production AI

1 žingsnis: Master Python gamybos AI

Jei praleidžiate pamatus, visa kita vėliau sugenda. Prieš nerimaujant dėl agentų ar LLM, turite įsisąmoninti Python pagrindus.

  • FastAPI: Štai kaip jūsų agentas kalba su pasauliu. Sukurkite lengvus, saugius, mastelius galutinius taškus, kuriuos lengva diegti.


  • Async programavimas: agentai dažnai laukia API ar duomenų bazių. Async padeda jiems padaryti daugiau, greičiau, be blokavimo.


  • Pydantic: duomenys, kurie patenka ir išeina iš jūsų agento, turi būti nuspėjami ir patvirtinti. Pydantic suteikia jums schemas, kurios užkerta kelią pusei jūsų būsimų klaidų.


Jei šie įrankiai jums yra nauji, jokių stresų.


Štai keletas puikių išteklių, kurie padės jums pasiekti greitį:

  • „Python FastAPI Crash“ kursas
  • Async programavimas paaiškinamas
  • Oficialios instrukcijos
  • Tutorialinės piktogramos

Praleiskite tai, ir jūs įstrigo duct-tapping atsitiktinių funkcijų kartu. Nail jį, ir jūs esate pasiruošę rimtam darbui.

Step 2: Make Your Agent Stable and Reliable

2 žingsnis: padaryti savo agentas stabilus ir patikimas

Šiame etape jūsų agentas techniškai „veikia“, tačiau gamybai tai nerūpi – jam rūpi, kas atsitinka, kai viskas vyksta.ne neDarbas


Čia jums reikia dviejų dalykų:

  • Kai kažkas sulaužys (ir tai padarys), žurnalai padės jums tiksliai pamatyti, kas nutiko ir kodėl.


  • Testavimas: vieneto testai užfiksuoja kvailas klaidas, kol jie pasiekia gamintoją.Integracijos testai užtikrina, kad jūsų įrankiai, kvietimai ir APIs gerai veiktų kartu.


Įdėkite abu dabar, arba praleiskite dvigubai daugiau laiko, kad vėliau sunaikintumėte chaosą.


Jei nesate tikri, nuo ko pradėti, šie vadovai padės:

  • Įvadas į Python Logging
  • Kaip parašyti vieneto testus Python
  • REST API integracija su Python

Step 3: Go Deep on RAG

3 žingsnis: eik giliai į RAG

Agentai, neturintys prieigos prie patikimų žinių, daro šiek tiek daugiau nei atsiliepia išmoktiems modeliams. „RAG“ paverčia jūsų agentą kažkuo protingesniu – suteikia jam atminties, faktų ir realaus pasaulio konteksto.


Pradėkite nuo pamatų:

  • Suprasti RAG: sužinokite, kas tai yra, kodėl tai svarbu ir kaip ji tinka jūsų sistemos dizainui.


  • Teksto įterpimai + vektoriaus parduotuvės: Tai yra atgavimo statybiniai blokai. saugokite žinių gabalus ir paimkite juos pagal aktualumą.


  • "PostgreSQL" kaip alternatyva: daugeliui naudojimo atvejų jums nereikia fancy vektoriaus "DB" - gerai indeksuojamas "Postgres" nustatymas gali dirbti gerai.


Kai įsisavinsite pagrindus, atėjo laikas optimizuoti:

  • Chunking strategijos: Smart chunking reiškia geresnį atkūrimą. naivūs suskaidymai žudo našumą.


  • LangChain for RAG: aukšto lygio sistema, skirta viską sujungti – gabalus, užklausas, LLM ir atsakymus.


  • Evaluation Tools: Know whether your answers are any good. Precision and recall aren’t optional at scale.


Dauguma švelnių agentų čia žlunga.Nebūk vienas iš jų.


Ar esate pasiruošę eiti giliau?


Šie ištekliai padės jums:

  • Suprasti RAG
  • Teksto įterpimas
  • Vektorinė duomenų bazė
  • Chunking strategijos
  • RAG su „LangChain“
  • RAG vertinimas
  • Išplėstinė RAG

Step 4: Define a Robust Agent Architecture

4 žingsnis: Apibrėžkite tvirtą agento architektūrą

Galingas agentas yra ne tik skambutis - tai išsami sistema. Norėdami sukurti vieną, kuris iš tikrųjų veikia gamyboje, jums reikia struktūros, atminties ir kontrolės.


  • Agentų sistemos (LangGraph): Pagalvokite apie tai kaip apie savo agento smegenis.Jis tvarko būseną, perėjimus, retries ir visą logiką, kurios nenorite kietai koduoti.


  • „Prompt“ inžinerija: aiškios instrukcijos yra svarbios. „Good“ priminimai daro skirtumą tarp spėliojimo ir patikimo elgesio. 👉 „Prompt“ inžinerija
Greitas inžinerinis vadovas


  • SQLAlchemy + Alembic: Jums reikės realios duomenų bazės – ne tik žinių, bet ir įrašymo, atminties ir agento būsenos.Šie įrankiai padeda valdyti migracijas, struktūrą ir atkaklumą. 👉 Duomenų bazės valdymas (SQLAlchemy + Alembic)
Duomenų bazės valdymas (SQLAlchemy + Alembic)


Kai jie ateina kartu, jūs gaunate agentą, kuris ne tikAtsakytiJis mąsto, seka ir tobulėja laikui bėgant.

Step 5: Monitor, Learn, and Improve in Production

5 žingsnis: stebėti, mokytis ir tobulinti gamybą

Paskutinis žingsnis yra tas, kuris atskiria pomėgių projektus nuo realių sistemų: nuolatinis tobulinimas.


Kai jūsų agentas yra gyvas, jūs nesibaigėte - jūs tik pradedate.


  • Stebėkite viską: naudokite tokius įrankius kaip Langfuse arba savo individualius žurnalus, kad galėtumėte sekti, ką daro jūsų agentas, ką vartotojai sako ir kur viskas sutrinka.


  • Studijuokite naudotojo elgesį: kiekviena sąveika yra atsiliepimai. Ieškokite trinties taškų, painiavos ir nesėkmės režimų.


  • Dažnai atnaujinkite: naudokite savo įžvalgas, kad pritaikytumėte nurodymus, atnaujintumėte įrankius ir nustatytumėte prioritetus, kurie yra svarbiausi.


Svarbiausia, kad nepatektumėte į „įdėti ir pamiršti“ spąstus.Graži agentai nėra pastatyti vieną kartą – jie nuolat tobulinami.👉 Naudokite Langfuse stebėti, ištaisyti ir optimizuoti laukinėje erdvėje.

Naudokite Langfuse stebėti, ištaisyti ir optimizuoti laukinėje erdvėje

The Bottom Line

Žemutinė linija

Dauguma AI agentų niekada neperžengia prototipų fazės.


Jie patenka į pragarą – trapi, nepatikima ir neįmanoma išlaikyti.


Bet tai nebūtinai turi būti taip.


Laikydamiesi šio 5 žingsnių veiksmų plano - nuo gamybos paruošto Pythono įsisavinimo ir stiprios testavimo praktikos įgyvendinimo, iki agentų, turinčių tvirtą paieškos pagrindą, orkestracijos logiką ir realaus pasaulio stebėseną, diegimo, galite išvengti bendrų spąstų, kurios įstrigo tiek daug komandų.


Tai yra skirtumas tarp kažko, kas archyvuojama demo aplanke, kūrimo ir sistemų diegimo, kurios išsprendžia realias problemas, prisitaiko laikui bėgant ir uždirba vartotojų pasitikėjimą.


Ne tik kietos demonstracijos. Ne tik skubios grandinės su kanalizacijos juosta. Bet realios sistemos su atmintimi, motyvacija ir išlikimo galia.


Taip sukuriami gamybos agentai.


Ne atsitiktinai, o pagal pasirinkimą.


Jei įsipareigojate šiam požiūriui, jūs būsite priekyje kreivės, o jūsų agentai išlaikys laiko testą.


Pakelkime tą barą.


Norite dažniau išgirsti iš manęs?

Norite dažniau išgirsti iš manęs?

Susisiekite su manimi LinkedIn!

Susisiekite su manimi LinkedIn

I share Kasdienėveiksmingas įžvalgas, patarimus ir atnaujinimus, kurie padės jums išvengti brangių klaidų ir likti priekyje AI pasaulyje.

Ar esate technologijų specialistas, norintis padidinti savo auditoriją rašydamas?

Ar esate technologijų specialistas, norintis padidinti savo auditoriją rašydamas?

Don’t miss my newsletter!

Nepraleiskite mūsų naujienlaiškio

ManoTech Audience Acceleratoryra supakuota su veiksmingais copywriting ir auditorijos kūrimo strategijomis, kurios padėjo šimtams specialistų išsiskirti ir pagreitinti jų augimą.

L O A D I N G
. . . comments & more!

About Author

Paolo Perrone HackerNoon profile picture
Paolo Perrone@paoloap
No BS AI/ML Content | ML Engineer with a Plot Twist 🥷 40k+ Followers on LinkedIn

PABAIGTI ŽYMES

ŠIS STRAIPSNIS BUVO PRISTATYMAS...

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks