122 रीडिंग

मैंने एक टाइटेनियम पावर GenAI चैटबोट बनाया, लेकिन अमेज़ॅन Q खरीदना अभी भी स्मार्ट हो सकता है

द्वारा Onder A.4m2025/06/25
Read on Terminal Reader

बहुत लंबा; पढ़ने के लिए

एक कस्टम GenAI चैटबॉट सटीकता पर बेहतर प्रदर्शन करता है - लेकिन बढ़ते लागत और अमेज़ॅन क्यू की आक्रामक कीमतें खरीद के बारे में कठिन सवाल उठाती हैं।
featured image - मैंने एक टाइटेनियम पावर GenAI चैटबोट बनाया, लेकिन अमेज़ॅन Q खरीदना अभी भी स्मार्ट हो सकता है
Onder A. HackerNoon profile picture
0-item

मैंने एक वित्तीय सेवा कंपनियों के लिए आंतरिक दस्तावेज़ों के एक कवरेज के माध्यम से खोजने के लिए एक जनन एआई चैटबॉट बनाया ताकि उपयोगकर्ताओं को दस्तावेज़ों को तेजी से खोजने, स्कैन करने और सारांशित करने के लिए एक उपकरण के साथ सक्षम बनाया जा सके। 80% तक कुशलता बनाने के लिए, मैंने रिट्रिवल-एडगमेंट जेनरेज (आरएजी) को अपनाया, कवरेज में दस्तावेज़ों को एम्बेड किया (डायरेज समूह), और क्लॉड, टाइटन, और लामा-3 जैसे एलएलएम की तुलना करने के बाद टाइटन को दस्तावेज़ खोज के लिए संदर्भ-जागरूक, सटीक उत्तर प्रदान करने के लिए अपनाया।

तीन स्प्रिंट मॉडल की तुलना करने, पाइपलाइनों को अनुकूलित करने, प्रदर्शन को अनुकूलित करने की कोशिश करने और ट्यूनिंग प्रमोटर पर काम करने के लिए - यह टाइटन मॉडल पर काफी अच्छी तरह से काम करता है (टाइटन सूचीबद्ध मॉडल के बीच सबसे अच्छा काम करता है क्योंकि यह टेक्स्ट मॉडल के लिए डिज़ाइन किया गया है और मेरा उपयोग केस इसकी क्षमता सीमा के भीतर अच्छी तरह से बैठता है)। सभी उपयोगकर्ताओं ने दिखाया और डेमो किया इसे प्यार करता है।

सफलता के साथ समस्या

जब आप एक विचार का परीक्षण और सत्यापन करने के लिए अच्छी तरह से काम करने वाली चीज़ का निर्माण करते हैं, तो यह एक महान उपलब्धि की तरह महसूस होता है - जब तक आप महसूस करते हैं कि बार केवल "काम" नहीं है. हालांकि ग्राहकों को वित्तीय सेवाओं जैसे अत्यधिक विनियमित उद्योगों में GenAI का उपयोग करने के बारे में बहुत सावधानी बरतनी पड़ती है, मुझे अभी भी ऐसा नहीं लगता है कि मुझे अमेज़ॅन क्यू, माइक्रोसॉफ्ट कॉपीलोट, और गूगल जुमिनी जैसे उद्यम तैयार समाधानों की तुलना में एक उच्च कीमत का भुगतान करने के लिए पर्याप्त लगता है. यह मानते हुए कि मेरे समाधान के साथ आरएजी जो प्रतिक्रियाओं पर आत्मविश्वास बढ़ा रहे हैं, भ्रमों को खत्म कर रहे हैं, और गुणवत्ता के साथ कई

मेरे मामले में, अमेज़ॅन क्यू बिजनेस एंटरप्राइज़ एक इकाई के लिए प्रति घंटे $ 0.264 का शुल्क लगाता है (20K दस्तावेज़ या 200Mb निकाले गए पाठ) जबकि मैं दस्तावेज़ प्रति लेनदेन के लिए $ 0.23 के रूप में गणना कर रहा था।

मैं मैंने बनाए गए चैटबोट पर गर्व महसूस किया था. लेकिन स्केलिंग और लागत प्रभावीता के मामले में?

कठिन निर्णय: GenAI युग में निर्माण vs. खरीद

यह एक नई दुविधा नहीं है, लेकिन GenAI के साथ, चीजें अधिक जटिल हो गई हैं. यहाँ मैंने जो सीखा है उसका एक सारांश है, जो कि AWS Q Business के समान है (कुछ विस्तार के लिए):

Feature

In-house GenAI Chatbot

AWS Q Business / Off-The-Shelf ChatBot

Control

You have full customization (RAG, LLM tuning,
prompt engineering)

Limited to platform capabilities – but fairly flexible

Data Privacy

You can enforce custom encryption, anonymization, or add new layers

Predefined policies & integrations – needs configuration

Cost

Significantly higher (especially if you use Bedrock type of environments)

Cost-effective for enterprise level solutions

Setup Time

Weeks of model selection, actual development, QA, iterations

Hours, sometimes minutes (can have account support)

LLM Model Options

Choose your model (Claude, Llama-3, Titan, etc.)

Locked into platform choice (Amazon = Titan/Q, Microsoft = GPT-4)

Maintenance

you have to manage yourself - scaling, uptime, latency tuning

Handled by provider

Control

आपके पास पूर्ण अनुकूलन है (आरएजी, एलएलएम ट्यूनिंग,
त्वरित इंजीनियरिंग

प्लेटफॉर्म क्षमताओं पर सीमित – लेकिन काफी लचीला

Data Privacy

आप कस्टम एन्क्रिप्शन, एनामीकरण, या नए परतों को जोड़ सकते हैं

पूर्व परिभाषित नीतियां और एकीकरण - आवश्यकताएं कॉन्फ़िगरेशन

Cost

काफी अधिक (विशेष रूप से यदि आप बेड्रोक प्रकार के वातावरण का उपयोग करते हैं)

उद्यम स्तर के लिए लागत प्रभावी समाधान

Setup Time

मॉडल चयन के सप्ताह, वास्तविक विकास, QA, iterations

Hours, sometimes minutes (can have account support)

LLM Model Options

अपने मॉडल का चयन करें (Claude, Llama-3, Titan, आदि)

प्लेटफॉर्म विकल्प में लॉक (अमेरिकी = Titan / Q, माइक्रोसॉफ्ट = GPT-4)

Maintenance

आपको खुद को प्रबंधित करना होगा - स्केलिंग, अपटाइम, लेटेनिस ट्यूनिंग

आपूर्तिकर्ता द्वारा संचालित


तो ... क्या यह घर के भीतर बनाने के लायक है?

हाँ और नहीं।

यदि मेरे ग्राहक 100% नियंत्रण रखना चाहते हैं और मुझे सभी ज्ञात नियमों को लागू करने के लिए मजबूर करना चाहते हैं (हालांकि वे पूरी तरह से लागू नहीं होते हैं और आवश्यक नहीं हैं) दस्तावेज़ प्रसंस्करण, खोज और मॉडल स्पष्टीकरण पर, आंतरिक निर्माण समझ में आता है. क्योंकि डबल चेक नियामक आवश्यकताओं और अनुकूलित पूछताछ संरचनाओं को व्यवसाय के लिए मूल्य पैदा कर सकता है; वे अतिरिक्त मूल्य के लिए अधिक भुगतान करने के लिए तैयार हो सकते हैं।

यदि आप बनाना चाहते हैं:

  • आपको डेटा और मॉडल व्यवहार पर अधिक सख्त नियंत्रण की आवश्यकता है
  • आपको जटिल वित्तीय दस्तावेजों, मल्टी-सॉर्ड आरएजी आदि जैसे अद्वितीय कार्य प्रवाहों के भीतर काम करने की आवश्यकता होती है।
  • आप कोर उत्पाद के भीतर अतिरिक्त एआई सुविधाओं को जोड़ना चाहते हैं
  • आपका संगठन विकास, रखरखाव और इन्फ्रा-कोस्ट के लिए अग्रिम निवेश करने के लिए तैयार है

आपको खरीदना चाहिए यदि:

  • आप छोटे स्पेस और शो के लिए तेजी से जीतना चाहते हैं
  • आपका उपयोग केस अपेक्षाकृत मानक है (उदाहरण के लिए दस्तावेज़ Q&A, नीति नेविगेशन आदि)
  • आप लागत संवेदनशील हैं
  • आप पहले से ही विक्रेता के पारिस्थितिकी तंत्र के भीतर हैं (उदाहरण के लिए, AWS, Microsoft, Google)

बंद करने के विचार

GenAI चैटबोट बनाने से व्यवसाय के लिए तेजी से लाभ मिल सकता है. ऑपरेशनों के भीतर GenAI उपकरणों के साथ प्रयोग करना शुरू करना अपेक्षाकृत आसान है, टीम को बढ़ाना. लेकिन बाजार सुपर तेजी से चल रहा है. AWS जैसी तकनीकी विशालताएं एडब्ल्यूएस जैसे उपकरणों के लिए बाधा को और भी कम कर रही हैं. इसलिए, यह हमेशा पूछने लायक है, "क्या हमें निर्माण करना चाहिए या खरीदना चाहिए? क्योंकि हम इस युग में केवल कोड के साथ प्रतिस्पर्धा नहीं कर रहे हैं. हम एक अरब डॉलर के बुनियादी ढांचे, प्रतिभा, और पॉलिश यूआई / यूएस के साथ-साथ उपकरणों के साथ कट्टरपंथी GenAI उपकरणों के साथ प्रतिस्पर्धा कर रहे हैं. और यह एक अलग

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks