Google annoncé l’aperçu privé de son modèle de génération vidéo, Veo, pour les clients Google Cloud utilisant Vertex AI. Cette annonce permet à des entreprises comme Quora et Mondelez International d’exploiter cette technologie d’IA à des fins créatives et marketing.
Veo, dévoilé en avril, peut générer des vidéos haute définition, notamment des clips 1080p d’une durée maximale de six secondes à différentes fréquences d’images. Les utilisateurs peuvent créer des vidéos en fournissant des images accompagnées d’invites, permettant au modèle de capturer différents styles visuels et cinématographiques. Warren Barkley, directeur principal de la gestion des produits chez Google Cloud, a souligné que la longue attente de l’API était due à l’amélioration du modèle de préparation de l’entreprise.
Le modèle excelle dans la génération d’effets spécifiques tels que des explosions et comprend les concepts physiques de base. Il peut également effectuer un montage masqué, permettant aux utilisateurs de modifier des régions spécifiques d’une vidéo. Malgré ses capacités, Veo présente des incohérences typiques de l’IA générative actuelle, telles que la disparition d’objets et un comportement physique irréaliste, conduisant à des limitations potentielles dans son utilisation.
Veo et Imagen 3 : ce qu’ils proposent
Google a présenté Veo aux côtés d’Imagen 3, un modèle d’image génératif conçu pour produire des images de la plus haute qualité à partir d’invites de texte. Les deux modèles seront disponibles pour les clients Vertex AI, et Imagen 3 devrait devenir largement accessible la semaine prochaine. Les entreprises qui ont commencé à utiliser ces outils incluent Oreo et Cadbury, mettant l’accent sur leurs applications commerciales.
Invite de la vidéo ci-dessous : Un cowboy solitaire chevauche son cheval à travers une plaine ouverte au magnifique coucher de soleil, avec une lumière douce et des couleurs chaudes.
(Vidéo : Google)
Invite de la vidéo ci-dessous : Une photo aérienne d’un phare se dressant sur une falaise rocheuse, sa balise traversant l’aube, les vagues s’écrasant contre les rochers en contrebas
(Vidéo : Google)
Barkley a noté que l’IA générative stimule la transformation des entreprises, avec 86 % des entreprises signalant une croissance de leurs revenus. Il a déclaré que Google s’engage à faire progresser la technologie de l’IA générative, comme en témoignent ses dernières offres avec Veo et Imagen 3.
Pour lutter contre les abus potentiels, les deux modèles intégreront des garanties pour empêcher la génération de contenu préjudiciable. De plus, toutes les sorties comporteront des filigranes numériques, y compris le SynthID de Google DeepMind, qui intègre des marqueurs invisibles pour lutter contre la désinformation et l’attribution erronée. Google affirme qu’il n’utilise pas les données des clients pour entraîner ses modèles, se concentrant plutôt sur des ensembles de données accessibles au public.
L’amélioration des fonctionnalités de l’entreprise est une priorité depuis l’annonce initiale de Veo. Le modèle a été formé à l’aide d’une vaste gamme d’échantillons vidéo de haute qualité, bien que les détails sur les sources de données de formation spécifiques ne soient pas divulgués. Barkley a reconnu que même si certaines données peuvent inclure du contenu YouTube, elles fonctionnent dans le cadre des accords de Google avec les créateurs de contenu.
L’approche proactive de Google aborde également les risques de propriété intellectuelle associés à l’IA générative. Veo est prêt à proposer des filtres au niveau de l’invite pour bloquer les contenus violents et explicites, et Barkley a indiqué que les sorties de Veo seront accompagnées d’une politique d’indemnisation pour protéger les utilisateurs contre les réclamations pour violation du droit d’auteur.
Au fur et à mesure que Veo s’intègre progressivement à davantage de produits Google, le modèle a été introduit lors d’essais via Google Labs en mai et annoncé dans le cadre de YouTube Shorts en septembre. Cependant, Google a été confronté à la concurrence de sociétés comme OpenAI et Adobe, qui ont rapidement conclu des partenariats avec divers studios et agences de création.
Crédit image en vedette : Google DeepMind
L’article Les nouveaux outils d’IA de Google changent à jamais la création de vidéos et d’images apparaît en premier sur TechBriefly.
Source: Les nouveaux outils d’IA de Google changent à jamais la création de vidéos et d’images