Mi Semilla

Nueve meses. Eso es lo que le llevó a OpenAI y Broadcom diseñar 'Jalapeño', el chip que ambas compañías anunciaron el 24 de junio. No es una GPU ni un procesador de propósito general: es un ASIC —circuito integrado de aplicación específica— diseñado exclusivamente para correr modelos de lenguaje grandes a escala industrial. Sam Altman, CEO de OpenAI, y Hock Tan, presidente y CEO de Broadcom, lo presentaron como parte de una estrategia más amplia: que OpenAI controle la pila tecnológica completa que necesita para operar sus modelos.

Por qué OpenAI necesita su propio hardware

Desde que la IA generativa explotó en 2023, las GPUs de Nvidia se convirtieron en el cuello de botella de toda la industria. Los chips H100 y H200 de la empresa de Jensen Huang pasaron de ser hardware de nicho para investigadores a ser el insumo más codiciado del mundo tech. OpenAI, que opera algunos de los modelos más exigentes del planeta, paga precios enormes por ese acceso. Construir un chip propio es una apuesta directa por la soberanía computacional: reducir la dependencia de un único proveedor que tiene toda la ventaja negociadora.

'Jalapeño' está diseñado para inferencia, no para entrenamiento. Esa distinción es técnica pero importa mucho en términos de costos: el entrenamiento de un modelo se hace una vez —o pocas veces, a escala enorme—, mientras que la inferencia ocurre millones de veces por segundo cada vez que un usuario le hace una pregunta al modelo. Es ahí donde está el gasto operativo real. Según el anuncio conjunto, el chip promete un desempeño por vatio sustancialmente mejor que el estado del arte actual. El despliegue en centros de datos está previsto para finales de 2026.

El contexto: todos los grandes hacen su propio chip

OpenAI no inventa la rueda aquí. Google lleva años usando sus TPUs para correr cargas de IA sin depender de Nvidia. Amazon tiene Trainium e Inferentia. Meta diseñó sus propias unidades de procesamiento. La tendencia de que los grandes consumidores de IA construyan hardware propio lleva años desarrollándose; lo que cambia ahora es que OpenAI, la empresa con más visibilidad en el mercado de modelos comerciales, se suma formalmente a ese movimiento.

El diseño partió de cero y se basó en conocimientos detallados de los patrones de uso que los investigadores de OpenAI comparten internamente. Eso es lo que lo diferencia de un chip genérico: está optimizado para lo que OpenAI sabe que necesita después de años operando GPT-4 y sus sucesores a escala global. Nueve meses es un tiempo muy corto para diseñar un chip de estas características; que lo hayan logrado dice algo sobre el nivel de foco y recursos que se pusieron en el proyecto.

¿Qué cambia para quienes usan las APIs de OpenAI?

Si tu empresa usa ChatGPT, la API de OpenAI o algún producto construido sobre esos modelos, el costo de la inferencia se filtra hasta tu factura mensual en forma de precio por token. Hoy ese costo incluye, entre otras cosas, el alquiler de hardware de Nvidia. Si 'Jalapeño' cumple lo que promete en eficiencia energética, podría bajar el costo por llamada a mediano plazo.

No es una certeza —OpenAI tiene sus propios objetivos de rentabilidad y puede quedarse con todo el ahorro en margen—, pero la dirección estratégica es clara. Menos dependencia de Nvidia significa más control sobre los precios y menos riesgo de escasez. Para una PyME argentina que presupuesta en dólares el uso mensual de herramientas de IA, eso eventualmente se puede notar. Vale la pena seguir el precio por millón de tokens de los modelos principales como indicador en los próximos meses.

OpenAI y Broadcom presentan 'Jalapeño', el chip diseñado de cero para correr LLMs a escala

Por qué OpenAI necesita su propio hardware

El contexto: todos los grandes hacen su propio chip

¿Qué cambia para quienes usan las APIs de OpenAI?

Comentarios (0)

¿Necesitas ayuda profesional?