Google Muse AI : fonctionnalités, exemples et plus encore

Le système d’intelligence artificielle connu sous le nom de Google Muse AI a été officiellement dévoilé aujourd’hui. Basé sur son utilisation du décodage parallèle et d’un petit espace latent discret, le nouveau modèle de transformateur texte-image prétend être plus rapide que les alternatives existantes. Les créateurs de Google Muse AI affirment que leur création peut générer des photographies à un niveau de qualité comparable au meilleur des meilleurs.

Nous présentons Museun modèle de transformateur de texte en image qui atteint des performances de génération d’images de pointe tout en étant nettement plus efficace que les modèles de diffusion ou autorégressifs.
Équipe d’IA Google Muse

Qu’est-ce que l’IA Google Muse ?

L’équipe affirme que Google Muse AI est une grande amélioration par rapport aux modèles de transformation de texte en image précédents comme Imagen et DALL-E 2. Muse utilise l’intégration de texte d’un grand modèle de langage pour être formé sur un travail de modélisation masqué dans un espace de jeton discret (LLM ).

Qu'est-ce que Google Muse AI et comment fonctionne-t-il avec des exemples ? Découvrez les fonctionnalités de Muse by Google et explorez le monde de l'IA. — Courtoisie d’image (MUSE): Une photo de portrait à contraste élevé d’un hamster pelucheux portant un bonnet orange et des lunettes de soleil tenant une pancarte qui dit peignons

Muse est capable de reconnaître des jetons dans des images déguisées à volonté. En raison de son utilisation de jetons discrets et de la réduction des exigences de taille d’échantillon, Muse promet de battre les modèles de diffusion dans l’espace pixel comme Imagen et DALL-E 2. Le modèle génère une édition gratuite sans masque et sans masque en rééchantillonnant à plusieurs reprises les jetons d’image en réponse. à une invite.

Basé sur MUSEles temps d’inférence de Muse sont nettement inférieurs à ceux des modèles concurrents.

Modèle	Résolution	Temps d’inférence (↓)
Diffusion stable 1.4	512×512	3.7s
Parti-3B	256×256	6.4s
Imagen	256×256	9.1s
Imagen	1024×1024	13.3s
Muse-3B	256×256	0,5 s
Muse-3B	512×512	1.3s

Contrairement à Parti et à d’autres modèles autorégressifs, Muse tire parti du décodage parallèle. Pour produire des images de haute qualité et reconnaître des concepts visuels tels que des objets, leurs relations spatiales, leur position, leur cardinalité, etc., un LLM qui a déjà été enseigné doit comprendre l’anglais à un niveau granulaire. Il n’est pas nécessaire d’inverser le modèle pour que Muse prenne en charge l’inpainting, l’outpainting et l’édition sans masque.

Fonctionnalités de l’IA de Google Muse

Muse est un modèle rapide et de pointe pour générer et modifier des images à partir de texte, et il possède plusieurs fonctionnalités utiles, notamment :

Génération de texte en image
- En réaction aux entrées textuelles, l’intelligence artificielle (IA) Muse de Google génère rapidement des visuels de haute qualité (1,3 s pour une résolution de 512 × 512 ou 0,5 s pour une résolution de 256 × 256 sur TPUv4).

Montage zéro coup et sans masque
- Le modèle Google Muse AI nous offre une édition gratuite sans masque et sans masque en échantillonnant à plusieurs reprises des jetons d’image en réponse à une instruction textuelle.

Lors de la modification d’une image, l’édition sans masque vous permet de manipuler plusieurs objets avec une simple invite de texte.

Peinture/peinture sans coup
- Muse AI de Google est gratuit et est livré avec des fonctionnalités d’édition basées sur des masques (inpainting et outpainting). En appliquant un masque à une modification, celle-ci devient fonctionnellement équivalente à une nouvelle génération.

Découvrez les meilleurs générateurs de tweets AI qui vous aideront à tweeter comme Elon Musk.

Détails du modèle Google Muse AI

Vous pouvez consulter le flux de formation de Muse AI de Google ci-dessous :

Deux réseaux de tokenizer VQGAN différents sont utilisés par l’équipe Google, l’un pour les photographies de faible qualité et l’autre pour les images haute résolution. Les transformateurs basse résolution (“base”) et haute résolution (“superres”) sont formés avec les jetons non masqués et les incorporations de texte T5 pour prédire les jetons masqués.

Pour plus d’informations sur Google Muse AI, cliquez sur ici.

Outils d’IA que nous avons expliqués

Bien que certains disent « non aux images générées par l’IA », presque chaque jour, un nouvel outil d’IA entre dans nos vies, tel que :

IA équilibrée
Caktus IA
OpenAI Point-E
IA Uberduck
QQ différente dimension moi
Machine à remonter le temps MyHeritage AI
L’IA Cicero de Meta
Notion IA
IA Meta Galactica
NovelAI
Make-A-Video Meta AI
DALL-E 2
Rêve de Wombo
L’IA DreamBooth de Google
Diffusion stable

Restez à l’écoute pour plus!

Source: Google Muse AI : fonctionnalités, exemples et plus encore

Google Muse AI : fonctionnalités, exemples et plus encore

Related Posts

La prochaine version de Siri pourrait être la réponse d’Apple à OpenAI et Google

Lisez-le, ne l’entendez pas WhatsApp transforme les messages vocaux pour les utilisateurs

Les nouvelles règles Steam promettent de mettre fin aux déceptions du Season Pass

Bluesky devient le nouveau centre scientifique après le rachat de Musk X

La prochaine version de Siri pourrait être la réponse d’Apple à OpenAI et Google

Lisez-le, ne l’entendez pas WhatsApp transforme les messages vocaux pour les utilisateurs

Les nouvelles règles Steam promettent de mettre fin aux déceptions du Season Pass

Bluesky devient le nouveau centre scientifique après le rachat de Musk X

Dites adieu aux sous-titres puisque YouTube double des vidéos en 9 langues

© 2021 TechBriefly is a Linkmedya brand.

Google Muse AI : fonctionnalités, exemples et plus encore

Qu’est-ce que l’IA Google Muse ?

Fonctionnalités de l’IA de Google Muse

Détails du modèle Google Muse AI

Outils d’IA que nous avons expliqués

Related Posts

© 2021 TechBriefly is a Linkmedya brand.

Follow Us