RTFlash

La nouvelle puce IA d'IBM atteint des sommets d'efficacité

Inspiré par l’architecture neuronale du cerveau organique, des chercheurs du centre de recherche d’IBM à San José en Californie ont développé NorthPole – une architecture d’inférence neuronale qui entrelace le calcul avec la mémoire sur une seule puce. Selon les auteurs, NorthPole « réinvente l’interaction entre le calcul et la mémoire » en mélangeant l’informatique inspirée du cerveau et la technologie des semi-conducteurs.

Elle offre des performances, une efficacité énergétique et une efficacité de surface supérieures par rapport à d’autres architectures comparables, y compris celles qui utilisent des processus technologiques plus avancés. Et, parce que NorthPole est un système numérique, il n’est pas sujet au bruit de l’appareil et aux biais et dérives systémiques qui affectent les systèmes analogiques.

Les chercheurs démontrent les capacités de NorthPole en le testant sur le réseau de classification d’images de référence ResNet50, où il a atteint 25 fois la métrique d’énergie supérieure de frames par seconde (FPS) par watt, une métrique d’espace 5 fois supérieure de FPS par transistor, et une métrique de temps 22 fois inférieure de latence par rapport à une technologie comparable.

L’une des plus grandes différences avec NorthPole est que toute la mémoire pour le dispositif est sur la puce elle-même, plutôt que connectée séparément. Sans ce goulot d’étranglement de von Neumann, la puce peut effectuer des inférences d’IA beaucoup plus rapidement que les autres puces déjà sur le marché.

NorthPole a été fabriqué avec un processus de nœud de 12 nm, et contient 22 milliards de transistors dans 800 millimètres carrés. Il dispose de 256 cœurs et peut effectuer 2 048 opérations par cœur par cycle à une précision de 8 bits, avec la possibilité de doubler et de quadrupler le nombre d’opérations avec une précision de 4 bits et 2 bits, respectivement. « C’est un réseau entier sur une puce », s’est exclamée Dharmendra Modha.

Article rédigé par Georges Simmonds pour RT Flash

IBM

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

  • De nouvelles puces photoniques au service de l'IA

    De nouvelles puces photoniques au service de l'IA

    Les puces actuelles sont gourmandes en énergie et la consommation des grands modèles d’IA se chiffre actuellement en mégawattheures. De nouvelles puces exploitant l’interaction de la lumière avec la ...

  • Pearcode veut stocker tout un data center dans un 1 gramme d’ADN

    Pearcode veut stocker tout un data center dans un 1 gramme d’ADN

    Face à l’explosion du volume des données, il faut inventer de nouveaux dispositifs de stockage. C’est ce que fait Pearcode. La start-up sophipolitaine, qui a remporté le concours i-lab 2023, utilise ...

  • Un nouveau modèle d'IA modulaire

    Un nouveau modèle d'IA modulaire

    Tout le monde a entendu parler des grands modèles de langage (LLM). Ce sont des modèles d’apprentissage profond à grande échelle entraînés sur d’immenses quantités de texte qui constituent la base ...

Recommander cet article :

back-to-top