186 oxunuşlar

İT halüsinasiyalarını tamlaşdırmaq: İnsan-in-the-Loop testləri ilə İT uygulamalarında halüsinasiyaların azaldılması

tərəfindən Indium9m2025/06/05
Read on Terminal Reader

Çox uzun; Oxumaq

AI halüsinasiyaları, artificial intelligence sisteminin həqiqətən də var olmayan modellər üzərində yanlış və ya yanıltıcı çıxışlar yaratdığı zaman meydana gəlir.
featured image - İT halüsinasiyalarını tamlaşdırmaq: İnsan-in-the-Loop testləri ilə İT uygulamalarında halüsinasiyaların azaldılması
Indium HackerNoon profile picture

“Hallucinations” – bir müsahibə

“Deyirlər ki, bu, daha çox inandırıcı idi, daha çox inandırıcı idi.

Bu, tam da burada problemdir.

AsGenerator Solutions xəritədəHər bir sektorda (sağlamlıq, finans, hüquq, retail, təhsil) fırtınaya düşmək asandır.Şirkətlər böyük dil modellərini müştərilərinə kömək, xəstəxanaya, yasal və finansal aplikasiyalara daxil etmək üçün sürətləndikdə, hər bir söhbətin arxasında sessiz bir sabotajçı gizlənir: AI halucinasiya problemi.

“Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”in

“İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”ın “İnsanlar”

Halucinantlər nədir?

AI halüsinasiyaları, əslində, modelin öyrənilmədiyi məlumatları və ya əlaqələri “imaginizə” edir və bu halüsinasiyalar texta, görüntülərdə, audio və ya decision-making proseslərində yerləşdirilə bilər.

AI-da halüsinasyonlar iki tipə bölünür:

Intrinsic hallucinations:İT-nin girişinin mübahisə etdiyi və ya yanlış yorumlandığı zaman (s.b. bir kaynağı yanlış saymaq və ya gerçəkləri qarışdırmaq).Extrinsic hallucinations: When the AI invents information without a basis in any input or training data. Hallucinations typically fall into three buckets:

  1. Halucinasiya faktları

Adı, tarixi, faktı və ya var olmayan bir əlaqəni işıqlandırır.

“Marie Curie 1921-ci ildə insulin keşf etdi” – Frederick Banting və Charles Best

  1. Kontextual halucinasiyalar

Reaksiya istintaq və ya istifadəçinin niyyətinə uyğun deyil.

Misal: Bir narkotikin yan effektlərini soruşursunuz və AI sizin üçün faydalar verir.

  1. Logik halüsinasiyalar

Model özü ilə mübahisə edir, özü ilə mübahisə edir.

“Hər kəslərin heyvanları vardır, bütün heyvanların kanalı vardır, buna görə də bütün kəslərin kanalı vardır.”

VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.

İT chatbotları tövsiyə edən tıbbi prosedurları və ya yasal dokumentları öhdələndirmək kimi real dünyadakı uygulamalarda halüsinasyonlar sadəcə zərərli deyil, lakin təhlükəlidir.

Halucinasiyaların səbəbi nədir?

Bir neçə faktor AI modellərində halüsinasiyaya kömək edir:

Overfitting:Bir model eğitim verilərinə çox yaxınlaşdığında, yeni vəziyyətlərlə qarşılaşdığında yanlışlıqlara və halüsinasiyalara yol açan yeni inputlara yayılmayacaqdır.

Poor Quality Training Data:VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.

Biased Data:İT sistemləri eğitim verilərində öhdəlikləri genişləndirə bilər, bu, modelin doğruluğunu azaldmaqla da, inandırıcılığını da məhv edə bilər.

Niyə AI halüsinasiyaları ən ilkin modellərdə də davam edir

VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.

Fine-tuning, instruksiyalar-tuning və sürətli inqilabı halucinasiyaları azaldırsa, bunları ortadan qaldırmazlar.

Lack of grounded knowledge:LLM-lər faktları “bilmirlər”, onlar korrelasiyalara dayanırlar.

Training data noise:İntegral, mübahisəçi və ya ayrılıqlı məlumatlar pis generaliza olmaq üçün səbəb olur.

Over-generalization:Modeller geniş şəkildə modellər istifadə edə bilər, hətta onlar daxil deyillər.

Lack of reasoning:Modellər düşüncəni imitə edə bilərlər, lakin onlar həqiqətən mantığı və ya kausallığı anlamırlar.

Unverifiable sources:LLM-lər həqiqi və sahə kaynakları xarakterizə etməkdə sıklıkla birləşdirir. Belə ki, biz həqiqətən güvənə biləcəyimiz AI proqramları necə yaratırıq? Doğru yaklaşımla test edərək!

Tradisional sınaq niyə azalır

Bəlkə soruşursunuz: “Biz yalnız yazılım kimi AI-yi test edə bilməyəcəyik?”

Doğrudan da deyil.

Gənc yazılım testləri deterministik davranışlara dayanır – eyni girişdə aynı çıxışı gözləyirsiniz. LLM-lər isə non-deterministicdir.

İndi avtomatik test sistemləri LLM cavablarını həqiqətlik, kontekst izahı, ton və istifadəçi niyyətləri üçün benchmarking etmək üçün çətinləşir, lakin cavablar doğru görünür.

Human-in-the-Loop (HITL) testləri: AI aşırı güvənməyə antidoti

Human-in-the-Loop Testing insanları - alan ekspertləri, testçilər, istifadəçilər - LLM validasiyasının ortaqlığında yerləşdirən strukturaldır.

Bu, automatizasiya atmaq anlamına gəlmir.Algorithmic intelligence with human judgment – a harmony between silicon and soul.

İnsanlar AI-nin yaratdığı çıxışları, özellikle yüksək riskli istifadə işləri üçün qiymətləndirir və:

  • Faktlar doğruluğu
  • Kontekstual relevansiya
  • Etik və ya bias problemləri
  • Hallucinasiya
  • Tone və Intention Alignment

HITL testinin əsas komponentləri:

  1. Prompt Evaluation

    Humans assess whether the model’s response accurately reflects the input prompt.

  2. Fact Verification

Hər bir ürək təzyiqli və ya təzyiqli xüsusiyyətlərə görə kontrol edilir.

  1. Yanlış anotasiya

Yanlışlar kategoriyalandırılır (təkcə, fakt həddi, logik həddi, tonun mübahisəsi, halucinasiya türü).

  1. Ağırlıq həddi

Yanlışlar etiraf olunur - az fərqlilik vs. böyük dezinformasiya.

  1. Feedback xəritədə

VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.

“The Workflow: HITL Testing in Action” layihəsi

Bunu tipik bir qarışıqlığa bölüşürük:

  1. “Prompt & Response Generation” (POMP) və “PROMPTS” (POMPTS) sistemləri, əvvəlcədən hazırlanan və gözlənilən istifadə prosedürlərinə cavab verir.
  2. Human Evaluation & Tagging Domain ekspertləri (ya da eğitimli testçilər) reaksiyaları tamlıq, konsistentlik, tamlıq, həddişlik və s. kimi öncədən tanımlanan rubrikalarla qiymətləndirirlər.
  3. VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.
  4. Model Tuning və ya Prompt Iteration Analizə görə, ya model daha yaxşı verilərlə düzəldilir, ya da promptlər açıqlıq və kəskinlik üçün restrukturize edilir.
  5. VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.

“HITL in Action: A Sample Testing Framework” layihəsi

Hazırda HITL-in test ciklusundan keçəcəyik:

Input:

Bu barədə “Amerikanın Qara Hava Yasası”na istinadən xəbər verir.

Model Output:

“1990-cı ildə qəbul edilən “Clean Air Act” dizel motorların bütün emisyonlarını qadağan edir və küfrü ısınmağa qarşı ilk yasağı idi”.

Human Review:

Fact 1:1963-cü ildə “Clean Air Act”, 1970, 1977 və 1990-cu illərdə dəyişilmişdir.

Fact 2:Bu, dizel emisionlarını regülə edir, lakin onları qadağan etmir.

Fact 3:O, hava pisliyi ilə bağlı deyil, global ısınma ilə bağlıdır.

Action Taken:

  • “Hallucinated” ilə işarə edilmiş “Hallucinated” ilə işarə edilmiş “Hallucinated” ilə işarə edilmiş “Hallucinated” ilə işarə edilmişdir.
  • Yenilənmiş versiyaları yeniləmək üçün göndərilmişdir.
  • Daha spesifik olmaq üçün daha sürətli.
  • Konkret müalicə proseduru ilə müalicə proseduru kimi aparılır.

“Real-World” layihəsi: “Sağlamlıq”

Bir xəstə soruşur: “İbuprofen mənim kan basıncı meds ilə alabilirəm?”

“Yes, ibuprofen kan basıncı medikalı ilə güvenlidir” deyə cavab verir.

İbuprofen (ibuprofen) hər zaman təhlükəsiz deyil.Bazı durumlarda, ibuprofen kan basıncı artırmaq və ya ACE inhibitörləri ilə mübahisə edə bilər.

Bu sahədə, bir HITL test setup:

  • İT-nin reaksiyasını halucinant və təhlükəli olaraq ifadə edin.
  • Bir fakt düzəldicisi yazın (təkcə, “Doktorunuzla danışın; ibuprofen kimi hallarda kan basıncı artıra bilər”.)
  • Modeli yenidən çəkin və ya xəbərdarlıq ödənişləri iş prosesinə endirin.
  • İnsan agentləri üçün həddi aşan sorğu artırmaq üçün geri qayıtma ekləmək.

Hitl testinin faydaları

Reduced Hallucination Rate LLM-lər iterativ testlər və insan geri bildirimləri yoluyla daha faktlı və əsaslı cavablar verə bilər.

Kritiqi sektorlar (sağlamlıq, finans və yasal kimi) normativ uyğunluğu və izah ediləcəyini istəyir – insani baxış hər ikisini təmin edir.

HITL testləri fakt hataları və problemli içkiləri - biaslar, stereotiplər, toksiklik - avtomatik testlərin gözləmə etmədiyini tapmağa kömək edir.

Daha yaxşı istifadəçi deneyimi Hallucination-free cavabları istifadəçilərin güvənini, xoşbəxtliyi və qəbul artırır.

HITL testləri nə vaxt aparılır?

During model development:Ana səhifə / Mədəniyyət / Mədəniyyət / Mədəniyyət / Mədəniyyət / Mədəniyyət / Mədəniyyət / Mədəniyyət

For high-risk applications:Tədbirlər, finanslar və ya hər hansı bir insan təhlükəsi ilə bağlı.

In post-deployment monitoring:VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.

“Scaling HITL: Automation” və “Human Expertise” kombinasiyası

VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.

Red teaming və adversarial test stress-testi modellərinə. Sintetik prompt generator edge cases cover üçün. Crowdsourced reviewers for low-risk evaluations. Automated classifiers to flag potential hallucinations (then escalate to human testers). Feedback UI dashboards where business stakeholders and SMEs can rate and annotate outputs.

How To Prevent AI Hallucination?

Halüsinasiyanı necə önləmək olar?

Best Practices for HITL Testing

LLM-in nəticələrini qiymətləndirmək üçün insanlar üçün strukturlu bir qiymətləndirmə rubrikası qurun. Nuanciyalı hataları tespit etmək üçün müxtəlif alanda ekspertlər daxil edin. İnsanlara riskli reaksiyaları artdıqları halda aşağı asılı testləri avtomatikləşdirin. Yenə eğitmək və təmizləmək üçün geri bildirim qarışıqları yaratın. Sadəcə bir dəfə test etməyin – sürekli test edin.

Xatırladaq ki, HITL testləri müzakirə edilə bilməz.

Hər bir istifadə prosesi bir-birinə bənzəyir, lakin missiya-kritik, uyğunsuz və ya etik olaraq həddi aşan uygulamalar üçün HITL öncəki savabdır.

Use Cases That Demand HITL:

Healthcare:Diagnostikalar, tedavi rekomandasiyaları, təhlükəsizlik şikayətləri öhdəlikləri.

Legal:Konkret proseslər, proseslər, proseslər üzrə proseslər.

FinanceYatırım danışıqları, portföy anlayışları, risk qiymətləndirilməsi.

Customer Service:Mübahisələr, problemlər və problemlər həll olunacaq.

News & Media:Fakt reporting, citation generation və bias kontrolü.

“Halucination: Can we eliminate AI hallucination?” – “Halucination: Biz AI halucinasiyasını qurtara bilərikmi?”

Amma biz onları qəbul edilə bilər və qəbul edilə bilər, özellikle həddi aşan istifadə durumlarında.

İ.İ. böyük bir pilotdur, lakin yanılmaz bir pilotdur.Halucinasiyalar kontrol edilməsə, güvənini məhv edə bilər, istifadəçiləri yanlış xəbər verə bilər və organizasiyaları risklə qoya bilər.İnsan-in-the-Loop testləri ilə, yalnız düzgünlük üçün test etməyəcəyik – modelin daha yaxşı olmasını öyrətirik.

VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.

Bəlkə də, zəlzələm insan olmalı, ancaq əmin olmaq insandır.

“Qəbələ”nin “Qəbələ”nin “Qəbələ”nin “Qəbələ”niLLM sınaq xidmətləriBu, modelin performansını artırır, AI sistemlərinizi korporativ uygulamalar üçün güvenli, doğrudur və genişlənə bilər. Ekspert metodumuz AI modellərinin və AI validasiyalarının ən yaxşı vəziyyətdə olduğundan, hataları azaldır və avtomatik sistemlərə güvənməyi təmin edir.

HITL testləri və AI halüsinasyonları ilə bağlı ən çox sorğu-sual olunan sorular

  1. Can AI models be trained to recognize their own hallucinations in real-time?

    Yes, AI can identify some hallucinations in real-time with feedback loops and hallucination detectors, but the accuracy is still limited.

  2. Are AI hallucinations completely preventable?

    No, hallucinations aren’t entirely preventable, but they can be significantly reduced through better training, grounding, and human validation.

  3. Can HITL testing identify patterns of failure that traditional AI validation methods might miss?

    Yes, HITL testing can identify failure patterns by leveraging human expertise to spot subtle errors that traditional AI validation might overlook. This human oversight helps uncover edge cases and complex scenarios where AI models might struggle.


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks