OpenAI réduit les coûts de l'IA de plus de moitié sans nouveaux puces

22:56 / 01.07.2026·35·Technologie

Les ingénieurs d'OpenAI, leader des technologies d'IA, ont trouvé un moyen de réduire considérablement les coûts de fonctionnement du système sans acheter de nouveaux équipements. Selon The Information, l'entreprise a réussi à réduire de plus de moitié la puissance de calcul nécessaire pour traiter les requêtes des utilisateurs de ChatGPT. Ce succès représente non seulement une économie financière, mais aussi un avantage stratégique dans un contexte de pénurie mondiale de ressources de calcul. C'est ce qu'indique Ixbt.com dans son article.

Il s'agit de l'optimisation de l'inférence (inference), c'est-à-dire le processus par lequel un modèle entraîné répond directement aux requêtes des utilisateurs. Aujourd'hui, l'inférence constitue le poste de dépense le plus important pour les entreprises développant l'IA générative. Alors que l'entraînement d'un modèle s'effectue sur une période donnée, l'interaction avec les utilisateurs nécessite des ressources distinctes pour chaque requête.

Stratégie d'utilisation rationnelle des ressources

Selon les sources, le nouveau système d'optimisation mis en œuvre par OpenAI cible la couche d'utilisateurs non inscrits ou utilisant la version gratuite de ChatGPT. En conséquence, le nombre de GPU NVIDIA nécessaires pour servir ces utilisateurs sur une période donnée a diminué de plusieurs centaines. Pour un service d'une telle envergure mondiale, ce chiffre est étonnamment bas.

Pour l'instant, OpenAI n'a pas officiellement révélé les méthodes technologiques utilisées pour atteindre ce résultat. Les experts supposent que cette efficacité a été obtenue non pas par l'installation d'équipements supplémentaires, mais par une utilisation rationnelle de l'infrastructure serveur existante, une meilleure gestion de la RAM ou l'amélioration des algorithmes de traitement par lots (batch processing).

Cette nouvelle pourrait modifier l'équilibre économique du marché de l'IA. Alors que des files d'attente se forment pour les puces NVIDIA et que des milliards de dollars sont investis dans la construction de centres de données, la réduction des coûts via le logiciel est la voie la plus efficace. Cela permet à OpenAI de proposer ses services à une audience encore plus large.

Opportunités stratégiques futures

Si cette technologie est déployée à grande échelle, OpenAI aura les opportunités suivantes :

Élargir la gamme des services gratuits ;
Réduire les tarifs pour les clients entreprises ;
Augmenter la puissance de calcul des agents d'IA sans coûts supplémentaires ;
Servir plus d'utilisateurs avec l'infrastructure existante.

Il est encore inconnu si cette optimisation s'applique aux abonnés payants ou aux modèles de raisonnement (reasoning models) les plus complexes de l'entreprise. Cependant, de telles avancées dans l'optimisation logicielle prouvent que dans la course à l'IA, l'efficacité de l'utilisation des puces joue un rôle tout aussi crucial que leur nombre.

Pour les marchés en développement comme l'Ouzbékistan, ces nouvelles sont également cruciales. En effet, la réduction des coûts de calcul contribuera à rendre ChatGPT et les technologies similaires plus abordables et accessibles à l'avenir.