Le système d’intelligence artificielle connu sous le nom de Google Muse AI a été officiellement dévoilé aujourd’hui. Basé sur son utilisation du décodage parallèle et d’un petit espace latent discret, le nouveau modèle de transformateur texte-image prétend être plus rapide que les alternatives existantes. Les créateurs de Google Muse AI affirment que leur création peut générer des photographies à un niveau de qualité comparable au meilleur des meilleurs.
Nous présentons Museun modèle de transformateur de texte en image qui atteint des performances de génération d’images de pointe tout en étant nettement plus efficace que les modèles de diffusion ou autorégressifs.
Équipe d’IA Google Muse
Qu’est-ce que l’IA Google Muse ?
L’équipe affirme que Google Muse AI est une grande amélioration par rapport aux modèles de transformation de texte en image précédents comme Imagen et DALL-E 2. Muse utilise l’intégration de texte d’un grand modèle de langage pour être formé sur un travail de modélisation masqué dans un espace de jeton discret (LLM ).
Muse est capable de reconnaître des jetons dans des images déguisées à volonté. En raison de son utilisation de jetons discrets et de la réduction des exigences de taille d’échantillon, Muse promet de battre les modèles de diffusion dans l’espace pixel comme Imagen et DALL-E 2. Le modèle génère une édition gratuite sans masque et sans masque en rééchantillonnant à plusieurs reprises les jetons d’image en réponse. à une invite.
Basé sur MUSEles temps d’inférence de Muse sont nettement inférieurs à ceux des modèles concurrents.
Modèle | Résolution | Temps d’inférence (↓) |
Diffusion stable 1.4 | 512×512 | 3.7s |
Parti-3B | 256×256 | 6.4s |
Imagen | 256×256 | 9.1s |
Imagen | 1024×1024 | 13.3s |
Muse-3B | 256×256 | 0,5 s |
Muse-3B | 512×512 | 1.3s |
Contrairement à Parti et à d’autres modèles autorégressifs, Muse tire parti du décodage parallèle. Pour produire des images de haute qualité et reconnaître des concepts visuels tels que des objets, leurs relations spatiales, leur position, leur cardinalité, etc., un LLM qui a déjà été enseigné doit comprendre l’anglais à un niveau granulaire. Il n’est pas nécessaire d’inverser le modèle pour que Muse prenne en charge l’inpainting, l’outpainting et l’édition sans masque.
Fonctionnalités de l’IA de Google Muse
Muse est un modèle rapide et de pointe pour générer et modifier des images à partir de texte, et il possède plusieurs fonctionnalités utiles, notamment :
- Génération de texte en image
- En réaction aux entrées textuelles, l’intelligence artificielle (IA) Muse de Google génère rapidement des visuels de haute qualité (1,3 s pour une résolution de 512 × 512 ou 0,5 s pour une résolution de 256 × 256 sur TPUv4).
- Montage zéro coup et sans masque
- Le modèle Google Muse AI nous offre une édition gratuite sans masque et sans masque en échantillonnant à plusieurs reprises des jetons d’image en réponse à une instruction textuelle.
- Lors de la modification d’une image, l’édition sans masque vous permet de manipuler plusieurs objets avec une simple invite de texte.
- Peinture/peinture sans coup
- Muse AI de Google est gratuit et est livré avec des fonctionnalités d’édition basées sur des masques (inpainting et outpainting). En appliquant un masque à une modification, celle-ci devient fonctionnellement équivalente à une nouvelle génération.
Découvrez les meilleurs générateurs de tweets AI qui vous aideront à tweeter comme Elon Musk.
Détails du modèle Google Muse AI
Vous pouvez consulter le flux de formation de Muse AI de Google ci-dessous :
Deux réseaux de tokenizer VQGAN différents sont utilisés par l’équipe Google, l’un pour les photographies de faible qualité et l’autre pour les images haute résolution. Les transformateurs basse résolution (“base”) et haute résolution (“superres”) sont formés avec les jetons non masqués et les incorporations de texte T5 pour prédire les jetons masqués.
Pour plus d’informations sur Google Muse AI, cliquez sur ici.
Outils d’IA que nous avons expliqués
Bien que certains disent « non aux images générées par l’IA », presque chaque jour, un nouvel outil d’IA entre dans nos vies, tel que :
- IA équilibrée
- Caktus IA
- OpenAI Point-E
- IA Uberduck
- QQ différente dimension moi
- Machine à remonter le temps MyHeritage AI
- L’IA Cicero de Meta
- Notion IA
- IA Meta Galactica
- NovelAI
- Make-A-Video Meta AI
- DALL-E 2
- Rêve de Wombo
- L’IA DreamBooth de Google
- Diffusion stable
Restez à l’écoute pour plus!
Source: Google Muse AI : fonctionnalités, exemples et plus encore