Microsoft a lancé « MAI-Transcribe-1 », un modèle de transcription d’IA qui permet d’obtenir une précision de la parole en texte dans 25 langues largement parlées. Le modèle vise à servir des applications telles que les réunions, le sous-titrage et la dictée.

MAI-Transcribe-1 sera disponible sur Microsoft Foundry aux côtés d’autres modèles, MAI-Voice-1 et MAI-Image-2. Microsoft a déclaré que ce lancement permet « aux modèles MAI de devenir largement disponibles pour un usage commercial pour la première fois », permettant aux clients d’évaluer et de créer des applications tirant parti de l’IA dans la transcription, la génération de voix et d’images.

MAI-Voice-1 propose une génération de parole hyperréaliste qui préserve l’identité du locuteur et les nuances émotionnelles à travers un contenu étendu. Il comprend une fonction d’invite vocale qui peut développer des voix de marque personnalisées à partir d’une seule minute d’audio enregistré.

Parallèlement, MAI-Image-2 est un nouveau modèle de génération de texte en image qui excelle dans le rendu de l’éclairage naturel, des tons chair précis et du texte clair dans les images. Ce modèle s’est classé parmi les trois premiers du classement texte-image d’Arena.ai.

Microsoft continue de réduire sa dépendance à la technologie OpenAI. La société a critiqué GPT-4 pour ses coûts élevés et ses temps de réponse lents. À ce titre, Microsoft a lancé le développement de ses propres modèles d’IA internes et évalue actuellement des modèles tiers pour sa fonctionnalité Copilot.

Mustafa Suleyman, PDG de l’IA de Microsoft, a confirmé l’accent mis sur le développement de modèles d’IA « hors frontières », soulignant qu’ils n’atteindront pas la sophistication des offres d’OpenAI. La récente restructuration de la direction de Copilot de Microsoft a abouti à la création de quatre divisions : expérience Copilot, plateforme Copilot, applications Microsoft 365 et modèles d’IA. Jacob Andreou, un ancien cadre de Snap, dirigera la division Expériences Copilot et relèvera du PDG de Microsoft, Satya Nadella.

Le PDG de Salesforce, Marc Benioff, a précédemment déclaré que Microsoft cesserait probablement d’utiliser la technologie OpenAI, soulignant les défis rencontrés par OpenAI, notamment l’abandon de son projet Stargate de 500 milliards de dollars visant à construire des centres de données à travers les États-Unis.

Crédit d’image en vedette