122 lecturas

Construí un chatbot GenAI alimentado por titanio, pero comprar Amazon Q todavía podría ser más inteligente

por Onder A.4m2025/06/25
Read on Terminal Reader

Demasiado Largo; Para Leer

Un chatbot GenAI personalizado supera en precisión, pero el aumento de los costos y el precio agresivo de Amazon Q plantean preguntas difíciles sobre la construcción versus la compra.
featured image - Construí un chatbot GenAI alimentado por titanio, pero comprar Amazon Q todavía podría ser más inteligente
Onder A. HackerNoon profile picture
0-item

Construí un chatbot Gen AI para buscar a través de un cubo de documentos internos para una empresa de servicios financieros para permitir a los usuarios con una herramienta para buscar, escanear y resumir documentos más rápidamente. Creando hasta un 80% de eficiencia, adopté la Generación aumentada de recuperación (RAG), incorporé documentos en el cubo (grupo de directorios), y adopté Titan después de comparar LLMs como Claude, Titan y Llama-3 para ofrecer respuestas contextuales y precisas para la búsqueda de documentos.

Para un trabajo de tres sprints de comparación de modelos, ajuste de tuberías, intento de optimizar el rendimiento y ajuste de prompts, funcionó bastante bien en el modelo Titan (Titan funciona mejor entre los modelos listados ya que está diseñado para el modelo de texto y mi caso de uso se sienta bien bajo su alcance de capacidad).Todos los usuarios que he mostrado y demostrado LO QUIERON. Se ahorró horas de búsqueda y escaneo en documentos para FAQs y T&C estándar para documentos de productos financieros (terminología pesada y llena de notas de pie, etc.). Mientras estoy orgulloso del resultado de mi trabajo, tuve una pregunta en mi mente: ¿Estoy 100% seguro de que esta es la solución con el mejor precio y rendimiento – especialmente en la edad de la IA?

El problema del éxito

Cuando se construye algo que funciona bien para probar y validar una idea, se siente como un gran logro —hasta que se da cuenta de que la barra no es solo «funcional». Aunque los clientes son demasiado cautelosos sobre el uso de GenAI en industrias altamente reguladas como los servicios financieros, todavía no me parece suficiente para cobrar un precio más alto que las soluciones enterprise-ready como Amazon Q, Microsoft Copilot y Google Gemini. Reconociendo que mi solución con RAG que está aumentando la confianza en las respuestas, eliminando alucinaciones y la calidad con muchos rascacielos, no estaba satisfecho de que está superando lo que ya está allí. Las plataformas enterprise-ready son baratas, de buen aspecto y profundamente integradas con los ecosistemas que ya viven en las empresas. Amazon Q Business, por ejemplo, puede

En mi caso, Amazon Q Business Enterprise cobra $ 0,264 por hora por una unidad (20K de documento o 200Mb de texto extraído), mientras que estaba calculando mi costo por transacción por documento como $ 0,23.

Estaba orgulloso del chatbot que construí. pero en términos de escala y rentabilidad? de repente estaba en un lugar muy apertado.

Decisión difícil: Construir vs. Comprar en la era GenAI

Este no es un dilema nuevo, pero con GenAI, las cosas se han vuelto más complejas.Aquí está un resumen de lo que aprendí, comparando durante el desarrollo de un chatbot interno que es similar a AWS Q Business (a algunos extender):

Feature

In-house GenAI Chatbot

AWS Q Business / Off-The-Shelf ChatBot

Control

You have full customization (RAG, LLM tuning,
prompt engineering)

Limited to platform capabilities – but fairly flexible

Data Privacy

You can enforce custom encryption, anonymization, or add new layers

Predefined policies & integrations – needs configuration

Cost

Significantly higher (especially if you use Bedrock type of environments)

Cost-effective for enterprise level solutions

Setup Time

Weeks of model selection, actual development, QA, iterations

Hours, sometimes minutes (can have account support)

LLM Model Options

Choose your model (Claude, Llama-3, Titan, etc.)

Locked into platform choice (Amazon = Titan/Q, Microsoft = GPT-4)

Maintenance

you have to manage yourself - scaling, uptime, latency tuning

Handled by provider

Control

Usted tiene personalización completa (RAG, LLM tuning,
Ingeniería rápida

Limitado a las capacidades de la plataforma – pero bastante flexible

Data Privacy

Puede aplicar la encriptación personalizada, la anonimización o agregar nuevas capas

Políticas y integraciones predefinidas - Necesidades de configuración

Cost

Significativamente más alto (especialmente si utiliza entornos tipo Bedrock)

Soluciones rentables a nivel empresarial

Setup Time

Semanas de selección de modelos, desarrollo real, QA, iteraciones

Horas, a veces minutos (puede tener soporte de cuenta)

LLM Model Options

Elija su modelo (Claude, Llama-3, Titan, etc.)

Encerrado en la elección de la plataforma (Amazon = Titan / Q, Microsoft = GPT-4)

Maintenance

tienes que gestionarte a ti mismo: escalado, tiempo de funcionamiento, ajuste de latencia

Tratado por el proveedor


¿Merece la pena construir en casa?

Sí y no.

Si mis clientes quieren tener el control del 100% y obligarme a aplicar todas las regulaciones conocidas (incluso si no son totalmente aplicables y necesarias) sobre el procesamiento de documentos, la búsqueda y la explicabilidad del modelo, la construcción interna tiene sentido. Debido a que el doble control de los requisitos regulatorios y las estructuras de consulta personalizadas pueden crear valor para el negocio; podrían estar dispuestos a pagar más por el valor añadido. Sin embargo, si tuve que escalar rápidamente? o si necesitaba algo lo suficientemente bueno (85-90% de los casos de uso) sin invertir mucho dinero en efectivo, Amazon Q Business de repente se vuelve muy atractivo.

Deberías construir si:

  • Necesita un control más estricto sobre los datos y el comportamiento del modelo
  • Se requiere trabajar dentro de flujos de trabajo únicos como documentos financieros complejos, RAG de múltiples fuentes, etc.
  • ¿Quieres agregar características de IA adicionales dentro del producto principal
  • Su organización está lista para invertir de antemano en desarrollo, mantenimiento e infracoste

Deberías comprar si:

  • Quieres ganancias rápidas para pequeños ámbitos y presentaciones
  • Su caso de uso es relativamente estándar (por ejemplo, documento Q&A, navegación por políticas, etc.)
  • Usted es sensible al costo
  • Ya estás dentro del ecosistema del proveedor (por ejemplo, AWS, Microsoft, Google)

Cierre de pensamientos

La creación de chatbots GenAI puede ser recompensadora y generar ganancias rápidas para el negocio. También es relativamente más fácil comenzar a experimentar con las herramientas GenAI dentro de las operaciones, mejorando el equipo. Pero el mercado se mueve super rápido. Gigantes tecnológicos como AWS están bajando la barrera aún más para herramientas como AWS Q Business. Por lo tanto, siempre vale la pena preguntar, “¿Deberíamos construir o comprar?” Porque no estamos sólo compitiendo con código en esta era. Estamos compitiendo con herramientas GenAI mercantilizadas creadas por gigantes con infraestructura de miles de millones de dólares, talento y UI/UX pulido, así como herramientas. Y eso es un tipo diferente de batalla.

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks