Apple continue de travailler à plein régime sur l’intelligence artificielle. Enfin, elle a lancé une nouvelle série de modèles d’intelligence artificielle open source appelée OpenELM (.
Dans le but d’offrir aux utilisateurs la puissance et les fonctions de l’intelligence artificielle sans avoir besoin de serveurs cloud, Apple déclare que la caractéristique la plus importante de ces modèles est qu’ils peuvent fonctionner sur l’appareil.
En attendant, nous avons récemment partagé avec vous les déclarations et les détails de Mark Gurman de Bloomberg sur AI LLM dans iOS 18. Voici tout ce que nous savons sur les nouveaux modèles d’intelligence artificielle.
Qu’est-ce qu’OpenELM ?
OpenELM se compose de huit modèles. Quatre sont pré-formés, tandis que d’autres peuvent être personnalisés avec des instructions et des entrées spécifiques. Les modèles sont relativement petits (270 millions à 3 milliards de paramètres) et optimisés pour fonctionner sur des appareils.
Apple utilise une stratégie de mise à l’échelle basée sur les couches pour améliorer la précision et l’efficacité des modèles.
En revanche, l’utilisation des modèles OpenELM offre de nombreux avantages:
- Traitement de l’IA sur l’appareil: Avec les modèles OpenELM, les fonctions d’IA peuvent être exécutées directement sur l’appareil sans avoir besoin de serveurs cloud. Cela augmente considérablement la confidentialité et la sécurité des données.
- Coûts réduits: Une dépendance réduite aux serveurs cloud entraîne des économies de coûts.
- Des temps de réponse plus rapides: Le traitement des données sur l’appareil permet des temps de réponse plus rapides et une expérience utilisateur plus fluide.
- Plus de recherche et développement: Les modèles OpenELM sont open source, permettant aux chercheurs et développeurs de les étudier et de les améliorer. Cela accélère les progrès de la technologie de l’IA et le développement d’applications de nouvelle génération.
Apple a fait ce qui suit déclaration à propos des nouveaux modèles de langage:
La reproductibilité et la transparence des grands modèles linguistiques sont cruciales pour faire progresser la recherche ouverte, garantir la fiabilité des résultats et permettre des enquêtes sur les biais des données et des modèles, ainsi que sur les risques potentiels. À cette fin, nous publions OpenELM, un modèle de langage ouvert de pointe. OpenELM utilise une stratégie de mise à l’échelle par couche pour allouer efficacement les paramètres au sein de chaque couche du modèle de transformateur, conduisant à une précision améliorée. Par exemple, avec un budget de paramètres d’environ un milliard de paramètres, OpenELM présente une amélioration de 2,36 % en termes de précision par rapport à OLMo tout en nécessitant 2 fois moins de jetons de pré-entraînement.
S’écartant des pratiques antérieures qui fournissent uniquement des pondérations de modèle et du code d’inférence, et pré-entraînent sur des ensembles de données privés, notre version inclut le cadre complet pour l’entraînement et l’évaluation du modèle de langage sur des ensembles de données accessibles au public, y compris les journaux d’entraînement, plusieurs points de contrôle et la pré-entraînement. configurations. Nous publions également du code pour convertir les modèles vers la bibliothèque MLX à des fins d’inférence et de réglage fin sur les appareils Apple. Cette version complète vise à responsabiliser et à renforcer la communauté de recherche ouverte, ouvrant la voie à de futurs efforts de recherche ouverte.
De plus, si vous souhaitez en savoir plus sur OpenELM, vous pouvez consulter ceci rapport détaillé.
Les plans d’Apple incluent la mise à disposition des modèles OpenELM dans le système d’exploitation iOS 18. iOS 18 devrait inclure d’importantes améliorations axées sur l’IA et exécuter un grand modèle de langage (LLM) sur l’appareil.
Les modèles OpenELM sont considérés comme une étape importante pour l’avenir de l’intelligence artificielle. Avec les nouveaux modèles, l’IA devrait devenir plus privée, plus sécurisée et plus accessible.
La décision d’Apple pourrait être importante pour diffuser l’intelligence artificielle et l’intégrer dans tous les aspects de la vie quotidienne.
Crédit image en vedette : Keming Tan / Unsplash
Source: Apple lance une nouvelle série de modèles d’IA open source appelée OpenELM