Les débuts d’OpenAI ChatGPT ont été l’un des sujets les plus discutés dans la technologie de l’IA aujourd’hui.
Text-davinci-003 est un nouveau modèle de la famille GPT-3 de grands modèles de langage alimentés par l’IA que la société a dévoilée lundi. Il fait partie de ce qu’il appelle la «série GPT-3.5» et il surpasserait ses prédécesseurs en gérant des instructions plus complexes et en générant un contenu de meilleure qualité et plus long. Sur le sujet, utilisateur de Twitter et data scientist @minimaxir tweeté :
BON DIEU @OpenAI ARRÊTEZ D’ANNONCER DES CHOSES JE SUIS TROP OCCUPÉ https://t.co/F7Xd511FAf
– Max Woolf (@minimaxir) 30 novembre 2022
Le nouveau modèle améliore ChatGPT en intégrant l’apprentissage par renforcement avec la rétroaction humaine pour faire correspondre plus étroitement les modèles de langage avec les instructions des humains. Davinci-003 est un véritable modèle d’apprentissage par renforcement avec rétroaction humaine (RLHF), contrairement à davinci-002, qui utilise un réglage fin supervisé sur des démos écrites par des humains et des échantillons de modèles hautement notés pour améliorer la qualité de la génération.
Dans la démo, OpenAI ChatGPT peut effectuer des tâches compliquées telles que :
- Questions et réponses
- Correction grammaticale
- Résumer une conversation
- Génération de texte à l’invite de commande
- Traduction de l’anglais vers d’autres langues
- Classer les articles
- Traduire Phyton en langage naturel
- Classer les tweets
- Extraire des mots clés d’un texte
- Créer une feuille de calcul
- Création d’une note d’étude
Si vous souhaitez essayer vous-même OpenAI ChatGPT, vous pouvez cliquer sur le lien ici.
Démo prometteuse d’OpenAI ChatGPT
La version de recherche de ChatGPT, un article récent du blog OpenAI déclare que “la dernière étape du déploiement itératif d’OpenAI de systèmes d’IA de plus en plus sûrs et utiles”. Les atténuations de sécurité en place pour cette version ont été guidées par plusieurs leçons apprises grâce au déploiement de modèles antérieurs comme GPT-3 et Codex, y compris une diminution significative des sorties nuisibles et mensongères obtenues par l’application de l’apprentissage par renforcement à partir de la rétroaction humaine (RLHF) .
Dans le blog, nous voyons de grandes améliorations à OpenAI ChatGPT. L’IA pourrait écrire un limerick (un poème humoristique de cinq lignes avec un schéma de rimes aabba.) Et un résumé du sujet dont il parlait avec l’utilisateur.
Utilisateur:
écrire un limerick à ce sujetChatGPT :
Il était une fois un théorème de Fermat
Que beaucoup ont trouvé assez élégant
Il a dit si vous prenez
Un nombre premier et faire
Le pouvoir d’un non divisible par lui
Le résultat, congru, conviendra
En cryptographie, c’est assez pratique
Pour le cryptage, c’est dandy
Le petit théorème de Fermat, oh si bien
En théorie des nombres, c’est imbattable !Utilisateur:
résumer la conversation jusqu’à présentChatGPT :
Le petit théorème de Fermat stipule que si pp est un nombre premier et aa est un entier non divisible par pp, alors a^pa
(aa à la puissance pp) est congruent à aa modulo pp. Il est souvent utilisé en cryptographie pour effectuer efficacement l’exponentiation modulaire et pour générer des clés privées à partir de clés publiques. C’est aussi un outil utile en théorie des nombres pour prouver d’autres théorèmes. J’ai aussi écrit un limerick sur le petit théorème de Fermat.Conversation entre l’utilisateur et ChatGPT – de Article de blog OpenAI
Limites d’OpenAI ChatGPT
Malgré cela, OpenAI a décrit les “limitations” de ChatGPT dans son article de blog, y compris le fait que parfois, les réponses semblent plausibles mais erronées ou absurdes. En pensant que ChatGPT est encore une démo précoce, ce genre de problèmes est attendu. Dans leur article de blog, OpenAI a déclaré :
« Résoudre ce problème est difficile, car : (1) pendant la formation RL, il n’y a actuellement aucune source de vérité ; (2) entraîner le modèle à être plus prudent l’amène à refuser les questions auxquelles il peut répondre correctement; et (3) la formation supervisée induit le modèle en erreur car la réponse idéale dépend de ce que sait le modèle, plutôt que de ce que sait le démonstrateur humain.
ChatGPT “répondra parfois à des instructions nuisibles ou présentera un comportement biaisé”, selon Open AI. Bien que nous anticipions certains faux négatifs et positifs, pour le moment, nous utilisons l’API de modération pour alerter les utilisateurs ou interdire des catégories spécifiques de contenu dangereux. Afin de nous aider dans nos efforts continus pour améliorer ce système, nous sommes heureux de recueillir les commentaires des utilisateurs.
Et cela couvre toutes les mises à jour actuelles de la démo OpenAI ChatGPT. Le sujet de l’IA et des conversations humaines, qui est récemment venu au premier plan avec Meta Galactica AI récemment, est vraiment intéressant.
Êtes-vous dans les outils d’IA? Découvrez d’autres articles :
- Alternatives gratuites à MyHeritage Historical AI
- IA intérieure : redessinez votre pièce sans effort
- Et si vous étiez un Viking ? MyHeritage AI Time Machine sait
- Cicero AI de Meta atteint des performances de niveau humain dans le jeu de société Diplomacy
- Depuis combien de temps l’IA nous aide-t-elle ?
Nous vous souhaitons une bonne journée; continuez à nous lire pour plus de nouvelles sur l’IA.
Source: OpenAI ChatGPT : le nouveau chatbot d’OpenAI expliqué