OpenAI reduce los costes de IA a más de la mitad sin nuevas puces

22:56 / 01.07.2026·35·Tecnología

Los ingenieros de OpenAI, líder en tecnologías de IA, han encontrado una manera de reducir drásticamente los costes operativos del sistema sin comprar nuevo equipamiento. Según The Information, la empresa ha logrado reducir a más de la mitad la potencia de cálculo necesaria para procesar las solicitudes de los usuarios de ChatGPT. Este logro representa no solo un ahorro financiero, sino también una ventaja estratégica ante la escasez global de recursos de computación. Así lo informa Ixbt.com en su noticia.

Se trata de la optimización de la inferencia (inference), es decir, el proceso mediante el cual un modelo entrenado responde directamente a las solicitudes del usuario. Actualmente, la inferencia es el mayor gasto para las empresas que desarrollan IA generativa. Mientras que el entrenamiento del modelo se realiza en un periodo determinado, la comunicación con los usuarios requiere recursos independientes para cada solicitud.

Estrategia de uso racional de los recursos

Según las fuentes, el nuevo sistema de optimización implementado por OpenAI está dirigido a la capa de usuarios no registrados o que utilizan la versión gratuita de ChatGPT. Como resultado, el número de GPU de NVIDIA necesarias para atender a estos usuarios en un periodo determinado ha disminuido en varios cientos. Para un servicio de escala global, esta cifra es sorprendentemente baja.

Hasta ahora, OpenAI no ha revelado oficialmente los métodos tecnológicos utilizados para alcanzar este resultado. Los expertos suponen que esta eficiencia se logró no mediante la instalación de equipo adicional, sino a través del uso racional de la infraestructura de servidores existente, la mejora de la gestión de la RAM o la optimización de los algoritmos de procesamiento por lotes (batch processing).

Esta noticia podría cambiar el equilibrio económico en el mercado de la IA. Mientras se forman listas de espera para las puces de NVIDIA y se invierten miles de millones de dólares en la construcción de centros de datos, la reducción de costes mediante software es el camino más eficaz. Esto permite a OpenAI ofrecer sus servicios a una audiencia aún más amplia.

Oportunidades estratégicas futuras

Si esta tecnología se aplica a gran escala, OpenAI tendrá las siguientes posibilidades:

Ampliar el alcance de los servicios gratuitos;
Reducir las tarifas para clientes corporativos;
Aumentar la potencia de cálculo de los agentes de IA sin costes adicionales;
Atender a más usuarios con la infraestructura actual.

Aún se desconoce si esta optimización se aplica a los suscriptores de pago o a los modelos de razonamiento (reasoning models) más complejos de la empresa. Sin embargo, estos logros en la optimización de software demuestran que en la carrera de la IA, la eficiencia en el uso de las puces juega un papel tan decisivo como la cantidad de las mismas.

Para mercados en desarrollo como Uzbekistán, este tipo de noticias son muy importantes. Ya que la reducción de los costes de computación contribuirá a que ChatGPT y tecnologías similares sean más asequibles y populares en el futuro.