3,614 lecturas
3,614 lecturas

La IA necesita mejores datos, no sólo modelos más grandes

por Dan Stein4m2025/05/05
Read on Terminal Reader

Demasiado Largo; Para Leer

Los LLM han cambiado rápidamente, haciendo cosas que parecían imposibles.Pero los grandes desafíos siguen siendo.El CEO de Sapien, Rowan Stone, comparte lo que está funcionando y lo que necesita ser corregido.
featured image - La IA necesita mejores datos, no sólo modelos más grandes
Dan Stein HackerNoon profile picture

Los LLM han cambiado rápidamente y lo han hecho mucho más rápido de lo que la mayoría de nosotros esperábamos.Estamos viéndolos haciendo cosas que parecían imposibles hace unos años.Pero detrás de todo el hype, todavía hay grandes desafíos, especialmente en torno a los datos que entrenan a estos modelos.El sabioEl CEO Rowan Stone para tomar su decisión sobre lo que está funcionando, lo que todavía necesita ser corregido, y cómo Sapien se está acercando al problema desde el principio.

El sabio

La evolución de los grandes modelos de idiomas ha sido fenomenal en los últimos años. ¿Cómo evalúa el progreso y qué áreas podrían mejorar?

Es innegable que los avances en los LLM han moldeado el paisaje de la IA de hoy. El progreso en los últimos años ha sido fenomenal: han mejorado considerablemente en las capacidades de procesamiento del lenguaje natural. Sin embargo, la formación de estos modelos requiere grandes volúmenes de datos. Es una área que, a pesar de ayudar a las empresas mucho, todavía requiere trabajo. Los conjuntos de datos limitados son un obstáculo. Pueden privar a los modelos de la información que necesitan para aprender para una entrega eficaz y eficiente de servicios.


Las posibilidades de amplificación de los vicios son una preocupación real, lo que puede conducir a la repetición de estereotipos y a una falta de generalizabilidad.


La precisión, la escalabilidad y la experiencia son nuestros tres pilares. Nos aseguramos de que los datos recopilados para la formación LLM son de alta calidad. Hemos formado un sistema en el que los LLM pueden ser ajustados con el feedback humano experto. Un proceso de etiquetado humano en el ciclo ayuda a proporcionar retroalimentación en tiempo real para los conjuntos de datos de ajuste fino para construir los modelos de IA más potentes y diferenciados.

Usted cree que las intervenciones humanas expertos ayudan a mejorar la precisión de LLM. ¿Puede elaborar sobre las áreas específicas de intervención?

Creemos que las intervenciones humanas de expertos son cruciales para mejorar la precisión del LLM, especialmente en áreas donde el entendimiento de la máquina a menudo es corto.Nuestros expertos en etiquetado de datos de texto apoyan una variedad de aplicaciones de Procesamiento de Lengua Natural.


Para el seguimiento de las redes sociales, el soporte al cliente y las revisiones de productos, los humanos pueden anotar el sentimiento de texto para ayudar a los modelos a detectar mejor el tono y la emoción.


El etiquetado de frases y frases clave ayuda a los modelos a aprender a resumir con precisión. Los entrenadores de IA también pueden identificar las intenciones y metas de los usuarios etiquetando transcripciones de servicio al cliente. Además, anotan FAQs, manuales y documentos para formar sistemas de QA y etiquetar texto en varios idiomas para desarrollar herramientas de traducción automática más fiables.


Nuestra cobertura es amplia, y estas intervenciones dirigidas por expertos mejoran directamente la precisión del modelo al resolver la ambigüedad, corregir los vicios y reforzar el contexto.

El desarrollo exitoso de la IA también requiere una comprensión de las imágenes. ¿Cómo abordas los casos de uso que involucran las imágenes?

Sí, vivimos en un mundo gobernado por las imágenes. En Sapien, abordamos casos de uso de IA basados en imágenes al manejar los datos visuales de la manera más sofisticada posible. Nuestro equipo de expertos en datos de imagen apoya una amplia gama de aplicaciones de visión por computadora. La inclusión de la experiencia del dominio dentro de una plataforma de vanguardia y una pila de tecnología nos ayuda a alimentar los modelos de IA más refinados. Anotamos señales de tráfico, peatones, carriles y otros objetos para desarrollar los sistemas de automóviles autónomos más precisos. Etiquetamos imágenes de rayos X, MRI y microscopía para detectar y diagnosticar enfermedades. Ayudamos a entrenar a los robots en tareas visuales etiquetando imágenes de IA y permitiéndoles reconocer objet

En los últimos años, hemos escuchado mucho acerca de dos paradigmas tecnológicos de vanguardia —la descentralización y la IA— que se unen para alcanzar la escala de manera eficiente.

Hemos visto a las grandes empresas recurrir a las instalaciones de datos centralizadas que generan billones de ingresos empleando a millones de personas para crear y estructurar datos para alimentar sus modelos, lo cual puede parecer viable.Pero, dada la demanda de datos para la IA, los modelos centralizados caerán en falta.Estas instalaciones de datos no pueden escalar para emplear los billones de personas necesarias para satisfacer la demanda.Además, no pueden atraer talento especializado, que es necesario para producir datos de alta calidad para avanzar la IA al razonamiento a nivel humano.


Aquí es donde la descentralización y la IA se unen como una poderosa sinergia. Nuestra propuesta se destaca en medio de todo esto. Somos una fundición de datos impulsada por el hombre que combina modelos de IA empresarial con una red descentralizada de trabajadores de IA que se recompensan por producir datos de sus teléfonos. La descentralización nos ayuda a lograr escalabilidad, mantener la calidad, desembolsar recompensas en cadena, y hacer que el proceso sea emocionante a través de interacciones gamificadas.


Por último, la gamificación garantiza que el etiquetado de datos sea divertido, atractivo, competitivo y instantáneo.Es la unión de todos estos factores que nos han ayudado a emergir como una plataforma con un grupo global de trabajadores de IA diversa, reduciendo los vicios localizados y produciendo datos de mayor calidad.



Esta historia fue escrita bajo el Programa de Blogging de Negocios de HackerNoon.

Esta historia fue escrita bajo el Programa de Blogging de Negocios de HackerNoon.

Programa de Blogging de Negocios


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks