La concurrence s’intensifie dans le secteur du matériel d’IA
Qu’est-ce qui vient de se passer? Amazon AWS a fait de nombreuses annonces cette semaine lors de sa conférence re:Invent, dont beaucoup tournent autour de l’IA générative et de la manière dont elle peut être utilisée pour moderniser les services des entreprises et accroître leur efficacité. Amazon a également dévoilé ses puces de nouvelle génération pour un large éventail de charges de travail basées sur le cloud et de modèles de formation à l’IA, avec la promesse de meilleures performances et d’une meilleure efficacité énergétique.
L’une des nouvelles puces est Trainium2, destinée à la formation de modèles d’IA et censée offrir des performances jusqu’à 4 fois supérieures et une efficacité énergétique 2 fois supérieure à celle de son prédécesseur. Il devrait également offrir une capacité de mémoire 3 fois supérieure à celle des puces Trainium de première génération. Dans le communiqué de presse, Amazon indique que Trainium2 est spécialement conçu pour la formation haute performance de modèles de base (FM) et de grands modèles de langage (LLM) avec jusqu’à des milliards de paramètres.
La société affirme également que Trainium2 sera ultra rapide, permettant aux programmeurs de former des modèles en une fraction du temps requis par les puces Trainium de première génération. Selon Amazon, Trainium2 fournira jusqu’à 65 exaflops de puissance de calcul, offrant des « performances de classe superordinateur » et permettant aux clients d’entraîner un LLM de 300 milliards de paramètres en quelques semaines plutôt qu’en mois.
La société d’IA Anthropic, soutenue par Amazon, a annoncé son intention d’utiliser Trainium2 pour former ses modèles.
Une autre nouvelle puce est la Graviton4 basée sur Arm, qui, selon Amazon, est « le processeur AWS le plus puissant et le plus économe en énergie à ce jour ». Il est conçu pour une large gamme d’applications exécutées sur les ultraclusters Amazon Elastic Compute Cloud (EC2) et offrirait des performances de calcul jusqu’à 30 % supérieures, 50 % de cœurs en plus et 75 % de bande passante mémoire en plus que Graviton3.
Selon Amazon, la nouvelle puce permettra aux clients d’améliorer l’exécution de leurs bases de données hautes performances, de leurs caches en mémoire et de leurs charges de travail d’analyse Big Data. Il peut être utilisé pour traiter de plus grandes quantités de données plus rapidement qu’avec les puces Graviton de troisième génération, réduisant ainsi le délai d’obtention des résultats et les coûts d’exploitation.
Amazon commencera à proposer les puces Trainium2 l’année prochaine, tandis que les instances R8g alimentées par Graviton4 sont désormais disponibles en avant-première, avec une disponibilité générale attendue dans les mois à venir.
Les nouvelles puces vont accroître la concurrence dans le secteur du matériel d’IA, actuellement dominé par Nvidia. Alors que Microsoft fait également monter la pression avec l’annonce récente de sa puce Azure Maia 100 et de son processeur Azure Cobalt, il sera intéressant de voir comment la bataille s’intensifiera dans les mois et les années à venir.