En réponse à la popularité de Google Bard, de Bing Chat de Microsoft et de ChatGPT d’OpenAI, les chercheurs ont développé un nouveau modèle d’IA avec une tournure un peu plus sinistre : DarkBERT.
DarkBERT a été formé uniquement à l’aide de données du dark web, par opposition aux grands modèles de langage (LLM) qui alimentent ChatGPT et Google Bard, qui ont été formés à l’aide de données provenant du Web ouvert. Oui, vous avez bien lu : les données des pirates, des fraudeurs et d’autres escrocs ont été utilisées pour former ce nouveau modèle d’IA.
En utilisant les informations du réseau Tor, qui est souvent utilisé pour accéder au dark web, un groupe d’universitaires sud-coréens a créé DarkBERT et publié un article décrivant leur méthode. Ils ont pu créer une base de données sur le dark web en l’explorant, en filtrant les données brutes, puis en formant DarkBERT dessus.
De manière inattendue, DarkBERT a déjà surpassé d’autres modèles de langage substantiels bien qu’il ait été formé sur des données provenant d’une source très improbable.
DarkBERT : Le côté obscur des modèles linguistiques
Alors que DarkBERT est un nouveau modèle d’IA, il est basé sur le ROBERTa architecture, une stratégie d’IA établie en 2019 par des chercheurs de Facebook.
Il est décrit comme une « méthode robustement optimisée pour la préformation du traitement du langage naturel (PNL) systems” dans un document de recherche de Meta AI qui s’appuie sur BERT (Représentations d’encodeurs bidirectionnels de transformateurs), qui a été publié par Google en 2018. L’efficacité de BERT dans un essai de réplication a été améliorée grâce au géant des moteurs de recherche qui l’a rendu ouvert source, selon les chercheurs de Facebook.
Facebook a publié RoBERTa, qui a obtenu des scores de pointe sur le benchmark General Language Understanding Evaluation (GLUE) NLP, grâce à sa méthodologie améliorée.
RoBERTa a d’abord été libéré avec une formation insuffisante, mais maintenant Sud coréen les universitaires travaillant sur DarkBERT ont montré qu’il est capable de bien plus. Les chercheurs ont pu construire DarkBERT en alimentant les données RoBERTa du dark web sur presque 16 jours sur deux jeux de données (l’un brut et l’autre prétraité).
Heureusement, les chercheurs n’ont pas l’intention de faire DarkBERT accessible au grand public. Cependant, Dexerto (ouvre dans un nouvel onglet) déclare accepter les demandes pour des raisons académiques. Mais DarkBERT fournira probablement aux enquêteurs et aux forces de l’ordre une bien meilleure compréhension de l’ensemble du dark web.
Conseils pour utiliser les chatbots IA en toute sécurité
Vous devez utiliser les chatbots IA avec prudence, comme vous le feriez avec tout autre programme ou service en ligne, car ils pourraient vous infecter avec des logiciels malveillants via des ChatGPT applications ou même divulguer des informations importantes, comme cela s’est récemment produit pour les employés de Samsung.
- Utilisez des chatbots IA provenant de sources fiables et officielles pour vous assurer que vous êtes sur le bon site Web.
- Versions officielles des chatbots AI populaires comme ChatGPT, Chat Binget Google Barde ne sont pas encore accessibles au public.
- Évitez de cliquer sur des liens dans des e-mails suspects qui vous dirigent vers des chatbots IA ou promettent un accès immédiat.
- Les escrocs profitent de la tendance des chatbots IA, alors méfiez-vous des tentatives de phishing.
- Méfiez-vous des publicités faisant la promotion des chatbots IA, car les escrocs les utilisent souvent pour diriger les utilisateurs sans méfiance vers des sites Web de phishing.
- Installez un logiciel antivirus fiable sur votre PC, Macet téléphone intelligent pour renforcer la sécurité lors de l’interaction avec les chatbots IA.
- Un modèle d’IA spécialisé appelé DarkBERT est considéré comme un prototype pour les futurs modèles d’IA formés dans des domaines spécifiques.
- Des modèles d’IA similaires pourraient être développés à l’avenir pour répondre à des domaines d’expertise spécifiques.
Restez informé des avancées et des risques potentiels associés aux chatbots IA pour vous protéger en ligne.
Vous pouvez lire notre article Réponse d’OpenAI au contrecoup : Mesures de sécurité et collaboration avec les décideurs.
Source: DarkBERT : Le modèle d’IA formé sur les secrets du Dark Web