Meta AI : Dans cet article, nous expliquerons ce qu’est le lama 2 et comment l’utiliser. Meta a dévoilé son plus récent modèle de grande langue (LLM) Llama 2, qui, lors des tests, a dépassé d’autres modèles de chat open source (y compris GPT) sur la plupart des points de référence, y compris l’utilité et la sécurité.
En plus de publier trois modèles alternatifs dans le cadre de la nouvelle version – un formé sur 7 milliards de paramètres, un sur 13 milliards et finalement, une version de 70 milliards – Meta AI met également à disposition “Llama 2 Chat”, une variante plus raffinée conçu exclusivement pour les cas d’utilisation conversationnels.
Il s’agit d’une réalisation technologique en soi, mais ce qui est plus intrigant, c’est que Meta et Microsoft ont également annoncé un renforcement de leur collaboration, permettant aux développeurs utilisant les outils Microsoft de choisir entre les modèles Llama de Meta et GPT d’OpenAI lors de la création d’expériences d’IA.
Meta AI : Qu’est-ce que le lama 2 ?
L’architecture du transformateur du modèle de langage auto-régressif Llama 2 a été optimisée. L’utilisation commerciale et académique en anglais de Llama 2 est prévue. Il est disponible dans une variété de variantes pré-formées et affinées ainsi que des tailles de paramètres allant de 7 milliards à 70 milliards.
Selon Meta, les versions modifiées s’adaptent aux préférences humaines en matière de sécurité et d’utilité via un réglage fin supervisé (SFT) et un apprentissage par renforcement avec rétroaction humaine (RLHF). 2 billions de jetons de données provenant de sources accessibles au public ont été utilisés pour pré-entraîner Llama 2.
Alors que les modèles pré-formés peuvent être modifiés pour une gamme de tâches génératrices de langage naturel, les modèles sur mesure sont conçus pour une conversation de type assistant. Quel que soit le modèle choisi par un développeur, les conseils d’utilisation responsable de Meta AI peuvent aider à orienter les ajustements supplémentaires qui pourraient être nécessaires pour adapter et optimiser les modèles avec les mesures d’atténuation de sécurité appropriées.
Comment utiliser le lama 2 ?
Il y a d’excellentes nouvelles si vous voulez jouer à Llama 2 par Meta AI pour vous-même. Huggingface a une version de démonstration facilement disponible. Suivez simplement ces étapes simples :
- Visitez cette page.
- Lorsque vous arrivez sur le site Web, faites défiler jusqu’à ce que vous voyiez une section intitulée “Démo”.
- Il y a une boîte de discussion là-bas. Saisissez-y un message tout de suite.
- Pour envoyer votre message, appuyez sur Entrée.
Grâce à SageMaker JumpStart dans l’interface utilisateur de SageMaker Studio et le SDK SageMaker Python, vous pouvez accéder aux modèles de base. Nous discutons de la recherche de modèles dans SageMaker Studio dans cette section.
Un environnement de développement intégré (IDE) appelé SageMaker Studio offre une interface visuelle Web unique via laquelle vous pouvez accéder à des outils créés spécifiquement pour effectuer toutes les tâches de développement ML, de la collecte de données à la création, au test et au déploiement de vos modèles ML. Faire référence à Amazon SageMakerStudio pour plus d’informations sur l’installation et la configuration de SageMaker Studio.
Une fois sur SageMaker Studio, cliquez sur Solutions prédéfinies et automatisées pour accéder à SageMaker JumpStart, qui comprend des modèles, des blocs-notes et des solutions prédéfinis pré-formés.
Vous pouvez rechercher des solutions, des modèles, des blocs-notes et d’autres ressources à partir de la page d’accueil SageMaker JumpStart. Dans le carrousel Foundation Models: Text Generation, vous avez le choix entre deux modèles Llama 2. Mettez à jour votre version de SageMaker Studio en l’arrêtant et en la reprenant si vous ne voyez pas les modèles Llama 2. Reportez-vous à Arrêter et mettre à jour les applications Studio pour plus de détails sur les mises à jour de version.
En sélectionnant Explorer tous les modèles de génération de texte ou en tapant “lama” dans la zone de recherche, vous pouvez également localiser les quatre variantes de modèle restantes.
Pour lire des informations sur le modèle, y compris sa licence, les données d’entraînement utilisées et les instructions d’utilisation, choisissez la fiche du modèle. Déployer et Ouvrir le bloc-notes sont deux autres boutons qui vous aident à utiliser le modèle.
Vous devez reconnaître le contrat de licence de l’utilisateur final et la politique d’utilisation acceptable dans une fenêtre contextuelle lorsque vous sélectionnez l’un ou l’autre des boutons.
Vous passerez à la phase suivante pour utiliser le modèle après l’avoir reconnu.
L’exemple suivant montre comment utiliser des modèles Llama avec un apprentissage en contexte à quelques prises de vue en donnant au modèle l’accès aux données de formation. Gardez à l’esprit que nous ne tirons que des conclusions du modèle qui a été déployé et que les poids du modèle restent constants tout au long.
Entrée : Traduire l’anglais vers le français :
loutre de mer => loutre de mer
menthe poivrée => menthe poivrée
peluche girafe => peluche girafe
fromage =>Sortir:
fromage
chocolat => chocolat
voiture => voiture
hamster => hamster
bière => bière
vélo => bicyclette
banane => banane
fraise => fraise
pizzas => pizzas
cheeseburger => cheeseburger
ananas => ananas
carotte => carotte
pastèque => pastèque
baleine => baleine
aubergine => aubergine
chat => discuter
pingouin => manchot
lion => lion
éléphant => éléphant
panda => panda
tigre => tigre
saumon => saumon
écureuil => écureuil
kangourou => kangourou
tortue => tortue
poulpe => poule
grenouille => grenouille
cochon => cochon
poisson rouge => poisson rouge
requin tigre => requin tigre
gorille => gorille
dol
Méta IA
La disponibilité de Llama 2 dans le Azure IA bibliothèque de modèles a été révélée par Microsoft lors de sa conférence Microsoft Inspire. Maintenant, les programmeurs peuvent l’utiliser pour créer. De plus, il est conçu pour fonctionner localement sur Windows afin de simplifier les flux de travail pour les développeurs d’IA. AWS Amazon Sage Maker Le hub Jumpstart propose également Llama 2, et d’autres fournisseurs suivront.
Le lancement d’un écosystème ouvert entre Microsoft et Meta AI pour les frameworks d’IA échangeables a également été révélé. La norme Open Neural Network Exchange (ONNX) pour les modèles d’apprentissage en profondeur a été annoncée pour la première fois en 2017 par Meta AI (anciennement Facebook), et c’est à ce moment-là que le développement a commencé.
Les deux se sont engagés à encourager le développement de l’IA ouverte, notamment en permettant à davantage d’entreprises du monde entier d’accéder à la technologie fondamentale de l’IA.
Selon Meta AI, les modèles Llama 2 ont été soumis à un processus d’équipe rouge, dans lequel les employés ont été chargés d’identifier les faiblesses de l’architecture de sécurité des modèles et d’assurer leur sécurité. De plus, des sources externes ont été utilisées pour créer des « invites contradictoires » afin d’aider à affiner le modèle.
Le schéma de transparence dans le article de recherche détaillant Llama 2 décrit les inconvénients du modèle ainsi que la manière dont Meta prévoit de les gérer à l’avenir. Les utilisateurs de Llama 2 sont tenus d’adhérer à un “utilisation acceptable», qui interdit d’utiliser le modèle pour produire du code préjudiciable, permettre le transfert non autorisé d’informations ou de matériel à des mineurs, ou produire du contenu faisant la promotion du terrorisme. Vous pouvez accéder au liste complète ici.
Pour encourager les programmeurs à adopter le modèle de langage “pour résoudre des problèmes difficiles”, Meta a lancé le Défi Impact Lamaavec plus d’informations à suivre.
Avant de partir, lisez notre article : 15 meilleures idées d’IA de personnage pour mieux profiter de vos conversations
Crédit d’image en vedette: Unsplash.
Source: Meta AI : Qu’est-ce que llama 2 et comment l’utiliser ?