TD y DR: Las cajas de IA están llegando.Podemos construir nuestras propias o dejar que Big Tech las construya para nosotros.Adivina en qué están apostando.
TD y DR:¿Recuerdas cuando Richard Hendricks continuó gritando sobre “La caja” y todo el mundo pensó que lo había perdido?
En Silicon Valley de HBO, “The Box” representó la elección entre plataformas descentralizadas que empoderan a los usuarios versus hardware centralizado que los encierra en ecosistemas corporativos.
The Box no es algún algoritmo de compresión mágica. Es hardware de IA de punta que puede ejecutar los modelos que necesitaban los centros de datos de Google hace dos años.
El patrón que debería aterrorizarte
- 2014: Amazon Echo shows up. “It’s just a speaker,” we said.
- 2018: Google y Apple siguen con sus propios cilindros de espionaje.
- 2022: ChatGPT rompe el Internet. Todos pierden la mente.
- 2025: AMD ships consumer chips with 50 TOPS. NVIDIA Jetson hits 275 TOPS for $2,400.
- 2027: Canalys prevé que el 60% de los nuevos PC serán capaces de IA, un aumento del 20% en 2024. la computación de IA en todo el mundo se proyecta crecer 10 veces, y el mercado de IA se aproxima a $ 1 billón.
That 2027 deadline is where we decide if families own their AI or rent it forever from Big Tech.
Aquí está lo que cambió todo
Sus versiones escaladas pero prácticas se ejecutan en hardware que realmente puede comprar - si sabe dónde buscar:
Opciones de consumidor / prosumer:
- AMD Ryzen AI Max+ 395: 128GB de memoria unificada, $ 2.800, 45-120W - el único dispositivo prosumer que puede ejecutar Llama 70B localmente a 4-8 tokens/sec
- NVIDIA RTX 4090: 24GB VRAM, 1.500 dólares, 350W - potente pero con memoria limitada, no puede manejar modelos 70B
- NVIDIA Jetson AGX Orin: 64GB de RAM, $ 2,400, 15-60W - excelente para la IA de punta pero golpea la pared de la memoria con modelos grandes
Enterprise-Only Solutions:
- NVIDIA H100/H200: 80-192GB VRAM, $20,000+, 350-1000W - can run any model but requires server infrastructure
- Intel Gaudi 2/3: 96GB + memoria, $ 5-8k, 350-600W - rendimiento competitivo pero requisitos de precios y potencia de la empresa
Reality Check: AMD Ryzen AI Max+ 395 is currently the SóloLos GPUs de consumo de NVIDIA llegan a 24GB (no es suficiente), sus tarjetas empresariales cuestan $ 20.000+, e incluso el Jetson AGX Orin golpea una pared de 64GB.
AMD logró esto a través de una arquitectura de memoria unificada: hasta 128 GB de LPDDR5X compartido entre CPU, GPU y NPU en un paquete silencioso y eficiente en términos de energía que se ajusta a una computadora de escritorio o portátil.
El momento de escritorio de Linux (Pero peor)
Windows got there first, network effects kicked in, and by the time Linux was ready for normies, everyone was already locked into Microsoft’s ecosystem.
Excepto que esta vez la línea de tiempo es de 2-3 años, no de décadas, y las apuestas son la inteligencia de su familia, no solo su administrador de archivos.Una vez que la IA de su familia se integra en el ecosistema de Apple / Google / Amazon, cambiar significa reconstruir toda su vida digital.
En Ready Player One, Wade Watts sueña con actualizar su hardware desactualizado para acceder a mejores mundos virtuales, pero no puede pagar las cosas buenas.
¿Por qué podemos ganar esta vez?
The Hardware Gap Is Closing (But Not Closed):El hardware de consumo ahora coincide con la computación en bruto de las GPU en la nube de hace solo dos años.Puedes ejecutar modelos locales capaces para análisis de documentos, automatización de fondo y tareas de IA rutinarias, pero aún no estamos a la velocidad de ChatGPT en tiempo real.Piensa en el procesamiento de lotes rápidos en lugar de la conversación instantánea.
Here’s the acceleration that matters: hardware costs are dropping 30% annually while energy efficiency improves 40% per year. New chips are delivering 2.8–3x performance gains over previous generations every 12–18 months — faster than Moore’s Law. What costs $2,800 today will cost $800-$1,200 within 18–24 months.
Privacy Isn’t Abstract Anymore:Desde las prohibiciones de TikTok a las controversias sobre el rascado de datos de ChatGPT, la gente finalmente se da cuenta de que sus datos no son seguros.
Models Are Becoming Commodities:Meta (Llama), Mistral, DeepSeek, Alibaba (Qwen) están lanzando modelos capaces que funcionan localmente.
La verdadera realidad técnica
What Can You Actually Do With 4–8 Tokens Per Second?
Vamos a ser honestos - esto no es para familias regulares todavía. A 4-8 tokens por segundo, no está recibiendo la experiencia ChatGPT suave que la mayoría de la gente espera.
Esto es actualmente para los entusiastas de la tecnología que quieren experimentar con la IA local, los desarrolladores que construyen aplicaciones y los usuarios conscientes de la privacidad dispuestos a negociar la conveniencia por la soberanía de los datos.El verdadero mercado familiar llega cuando este hardware alcanza los $ 500-800 y el software se vuelve tan simple como configurar un router inalámbrico.
But here’s why this matters: by the time edge AI is family-ready, we need the infrastructure, software ecosystem, and community knowledge to exist. Someone has to build the foundation now, or families will only have Big Tech’s options when they’re ready to adopt.
The Current Limitations:
- La brecha de rendimiento: los modelos locales siguen dejando atrás a GPT-4o/Claude en el razonamiento complejo y las tareas multi-modales
- Maintenance Burden: You’re responsible for security patches, model updates, and hardware failures
- Potencia y Calor: Ejecutar AI 24/7 significa lidiar con el consumo de energía de 45-120W, la generación de calor y el ruido potencial del ventilador
- Ecosistema de software: A pesar de mejorar rápidamente con proyectos como Ollama, la herramienta todavía tiene bordes duros
This isn’t plug-and-play yet. It’s more like “competent DIY enthusiast with numerous weekends and a lot of patience.”
Lo que realmente puedes hacer ahora
If you’re technically minded:
- Comience a experimentar con Ollama, modelos locales y hardware de IA de punta
- Documentar lo que funciona (y lo que no) para los demás
- Únete a las comunidades que construyen esto: r/selfhosted, r/homelab, r/LocalLLaMA
If you’re business-minded:
- Hay una economía de servicios que surge alrededor de la configuración y mantenimiento de la IA del borde
- Las familias quieren la soberanía digital pero no saben cómo construirla
If you just care about digital freedom:
- Apoyar proyectos de construcción de alternativas
- No compre la primera caja de IA subvencionada que navega
- Comparte esto con las personas que recuerdan cuando Internet era descentralizada
Cloud vs. Edge: The Real Numbers
Cloud AI (ChatGPT Plus, Claude Pro):
- Precio por adelantado: $0
- Annual cost: $240-$600 ($20-50/month)
- 3-year total: $720-$1,800
- Data privacy: Your conversations leave home and train corporate models
Edge AI (DIY Setup):
- Upfront cost: $2,500 (AMD Ryzen AI Max+ system)
- Costos anuales: $100-$200 (energía, mantenimiento)
- 3-year total: $2,800-$3,100
- Data privacy: Everything stays local
La matemática funciona: $ 2.500 costo de hardware de una sola vez versus $ 20-50 / suscripciones mensuales para siempre.
Estamos en el momento 1993
En 1993, todavía se podía elegir una Internet descentralizada.En 2003, las plataformas habían ganado.
In 2025, you can still choose edge AI sovereignty. By 2027, multiple industry forecasts project a major inflection point: El 60% de los nuevos PC serán capaces de IA, deLa computación artificial crecerá 10x en todo el mundoLos ecosistemas estarán encerrados.
La visión de Pied Piper de una tecnología descentralizada que sirva a los usuarios en lugar de las plataformas es finalmente técnicamente posible.
Las ventanas no permanecen abiertas para siempre.
The Bottom Line
La pregunta es: ¿lo construirás tú, o la Big Tech lo construirá por ti?
Los próximos 2-3 años determinarán si las familias poseen su IA o la alquilan para siempre.El hardware existe.Los modelos están disponibles.La única pieza que falta es la decisión de actuar.
Industry analysts project that by 2027, AI will be integrated into nearly all business software, conLa computación de IA disponible globalmente se espera que crezca 10xythe AI market approaching $1 trillionEl hardware existe. Los modelos están disponibles. El mercado lo necesita. La única pregunta es: ¿quién lo controla?
¿Estamos construyendo el futuro o simplemente cosplayando como luchadores por la libertad digital?