Lors de sa confรฉrence annuelle re:Invent, AWS a dรฉvoilรฉ la disponibilitรฉ gรฉnรฉrale de ses nouvelles puces Trainium2 (T2), spรฉcialement conรงues pour lโentraรฎnement et le dรฉploiement des grands modรจles de langage (LLMs).
En parallรจle, lโentreprise a annoncรฉ une troisiรจme gรฉnรฉration, les Trainium3, prรฉvue pour la fin de 2025. Ces innovations promettent de renforcer la position dโAWS dans le domaine de lโintelligence artificielle.
Lire aussi :
- En quoi les nouvelles fonctionnalitรฉs de recherche de Threads se dรฉmarquent-elles face ร Bluesky ?
- Quelles applications sur lโApple Watch peuvent vous aider ร gรฉrer vos tรขches et rester concentrรฉ au quotidien ?
Des performances impressionnantes avec Trainium2
Les puces Trainium2, prรฉsentรฉes initialement il y a un an, sont dรฉsormais accessibles et offrent des performances jusquโร quatre fois supรฉrieures ร celles de la gรฉnรฉration prรฉcรฉdente. Une instance EC2 รฉquipรฉe de 16 puces T2 peut atteindre une puissance de calcul de 20,8 pรฉtaflops, permettant des gains significatifs en vitesse et en efficacitรฉ. Ces puces sont particuliรจrement adaptรฉes pour gรฉrer des modรจles massifs, comme le modรจle Llama 405B de Meta, avec une gรฉnรฉration de tokens trois fois plus rapide que les solutions concurrentes majeures.
Pour des besoins encore plus exigeants, AWS a introduit les UltraServers Trn2, des serveurs comprenant jusquโร 64 puces Trainium2 interconnectรฉes, atteignant des performances maximales de 83,2 pรฉtaflops en modรจles sparses et prรฉcision FP8.
Un cluster dโIA dโune puissance inรฉdite
AWS collabore avec Anthropic, un acteur clรฉ des LLMs, pour crรฉer un cluster gรฉant composรฉ de centaines de milliers de puces Trainium2. Ce cluster sera cinq fois plus puissant que lโactuel et, selon AWS, deviendra le plus grand cluster dโIA jamais signalรฉ ร ce jour. Cette infrastructure permettra de former des modรจles toujours plus complexes, alignant AWS sur les besoins croissants des entreprises en matiรจre dโintelligence artificielle.
Le Trainium3 : un bond technologique prรฉvu pour 2025
Pour ne pas perdre de vitesse face ร des concurrents comme Nvidia, AWS a รฉgalement annoncรฉ ses puces Trainium3. Ces derniรจres promettent des performances quatre fois supรฉrieures ร celles des Trainium2, grรขce ร une architecture de pointe en 3 nanomรจtres. Ces nouvelles puces seront intรฉgrรฉes aux UltraServers, offrant une puissance inรฉgalรฉe pour lโentraรฎnement et lโinfรฉrence de modรจles comptant des billions de paramรจtres.
Selon David Brown, vice-prรฉsident Compute et Networking chez AWS, ces avancรฉes visent ร rรฉpondre aux besoins croissants des clients : ยซ Les modรจles massifs nรฉcessitent une approche novatrice, et nos nouvelles puces permettent de construire des modรจles plus grands, plus rapidement. ยป
Disponibilitรฉ des nouvelles solutions AWS
Les instances EC2 Trn2 sont dรฉsormais disponibles dans la rรฉgion US East (Ohio), et dโautres rรฉgions seront bientรดt desservies. Les UltraServers sont pour le moment en phase de prรฉvisualisation, mais leur dรฉploiement est imminent.
Avec ces annonces, AWS rรฉaffirme son ambition de dominer le marchรฉ de lโintelligence artificielle en proposant des solutions ร la pointe de lโinnovation, adaptรฉes aux besoins des entreprises les plus exigeantes.