ARM a dévoilé ses technologies de processeurs mobiles de nouvelle génération, avec des appareils grand public attendus d’ici la fin de l’année. La société revoit son image de marque, met à jour son architecture et met davantage l’accent sur les capacités d’IA et de traçage de rayons.

ARM rebaptise sa gamme de processeurs, en remplaçant les cœurs Cortex-X et A par une nouvelle série C1 (cœurs Ultra, Performance, Pro et Nano). Les GPU Mali sont également renommés, la gamme Immortalis cédant la place aux marques G1-Ultra, Premium et Pro.

Tous les nouveaux cœurs C1 sont basés sur l’architecture ARMv9.3, éliminant la gamme Cortex-X multiniveau. Les cœurs C1-Ultra et Performance succèdent au Cortex-X925, le C1-Pro remplace le Cortex-A725 et le C1-Nano est une refonte du Cortex-A520. Le C1-Performance est une variante 35 % plus petite du C1-Ultra, ciblant les chipsets de niveau intermédiaire supérieur avec un léger compromis de performances.

Le C1-Ultra affiche un gain IPC de 12 % par rapport au Cortex-X925, avec une augmentation globale des performances d’environ 25 % en prenant en compte un processus de 3 nm et une vitesse d’horloge plus élevée de 4,1 GHz (par rapport aux 3,6 GHz du Cortex-X925). Il offre également les mêmes performances que son prédécesseur tout en consommant 28 % d’énergie en moins. Ceci est obtenu grâce à une fenêtre hors service plus grande (traitement d’environ 2 000 instructions en vol contre ~ 1 500 pour le X925) et à une augmentation de 33 % de la bande passante du cache d’instructions L1.

Le C1-Pro se concentre sur les améliorations frontales, avec un prédicteur de branchement et un tampon cible de branchement (BTB) plus grands, une bande passante de données L1 plus élevée et une latence TLB L2 plus faible, contribuant ainsi aux économies d’énergie. ARM affirme que le C1-Pro offre les mêmes performances que le Cortex-A725 avec une réduction de puissance de 26 % ou 11 % de performances en plus pour la même puissance. Le C1-Nano offre une efficacité énergétique améliorée de 26 % par rapport au Cortex-A520, avec des gains de performances modestes de 5 à 8 %, car il est destiné aux tâches en arrière-plan.

Un ajout clé aux nouveaux processeurs est SME2, ​​la dernière extension d’ARM pour accélérer les charges de travail d’apprentissage automatique. SME2, ​​qui s’appuie sur le SME d’origine avec des instructions multi-vecteurs, une compression de poids et des réseaux binaires, se situe en dehors du noyau en tant qu’unité d’exécution partagée. Chaque noyau de la série C1 peut décoder les instructions SME2 et l’unité peut s’arrêter lorsqu’elle n’est pas utilisée. ARM revendique une réduction de la latence de 4,7 fois dans la reconnaissance vocale, un codage de jeton 4,7 fois plus rapide et un saut de performances moyen de 3,7 fois sur une sélection d’autres charges de travail par rapport au même cœur de processeur C1-Pro sans SME2.

Le nouveau GPU Mali G1-Ultra offre des performances 20 % supérieures pour les jeux et l’inférence d’apprentissage automatique, 9 % d’énergie en moins par image et un lancer de rayons jusqu’à 2 fois plus rapide par rapport à l’Immortalis G925 de l’année dernière. Le traçage de rayons 2 fois plus rapide est obtenu grâce à la prise en charge matérielle de la traversée BVH et à un algorithme à rayon unique. Le RTU (Ray Tracing Unit) peut être alimenté lorsqu’il n’est pas utilisé. Le GPU G1 se décline en différentes versions de marque en fonction du nombre de cœurs : plus de 10 cœurs avec lancer de rayons sont un G1-Ultra, 6 à 9 cœurs sont un G1-Premium et 1 à 5 cœurs sont un G1-Pro.

La plate-forme Lumex d’ARM vise à accélérer la mise sur le marché avec des solutions de plate-forme complètes, comprenant des conceptions prêtes à l’intégration de puces et des collaborations plus étroites avec des fonderies comme TSMC. La plate-forme interne Lumex Reference FPGA de la société fait allusion à une configuration mobile haut de gamme : deux cœurs C1-Ultra à 4,1 GHz associés à six cœurs C1-Pro à 3,5 GHz, deux unités SME2, ​​un cache L3 de 16 Mo, un Mali-G1 Ultra à 14 cœurs et 16 Mo de cache au niveau du système, le tout sur 3 nm. Pour les chipsets de qualité quasi phare, ARM suggère de remplacer le C1-Ultra par le C1-Premium. Les chipsets de milieu de gamme pourraient comporter un seul cœur Ultra ou Premium associé à trois cœurs Pro et quatre cœurs Nano.

La société prévoit que le MediaTek Dimensity 9500 sera le premier SoC phare à intégrer les nouveaux cœurs de processeur C1 d’ARM et le GPU G1-Ultra, avec une chance que le Google Tensor G6 de l’année prochaine adopte également la nouvelle série C1.