MiniMax a publié MMX-CLI, une interface de ligne de commande basée sur Node.js pour sa plate-forme d’IA, permettant aux développeurs et aux agents d’IA d’accéder directement aux capacités génératives.
MMX-CLI répond aux défis rencontrés par les agents basés sur un modèle de langage étendu (LLM), qui ont du mal à générer des médias sans couches d’intégration supplémentaires. La nouvelle interface permet aux utilisateurs d’invoquer diverses fonctions de génération de médias directement sous forme de commandes shell, éliminant ainsi le besoin de protocoles de contexte de modèle.
L’interface intègre les capacités de MiniMax en sept groupes de commandes : texte mmx, image mmx, vidéo mmx, parole mmx, musique mmx, vision mmx et recherche mmx. Chaque commande fournit des fonctionnalités spécifiques adaptées aux développeurs et aux applications d’IA.
La commande de texte mmx prend en charge le chat multi-tours et cible des variantes spécifiques du modèle MiniMax. Il utilise par défaut MiniMax-M2.7, permettant des tâches avancées de génération de texte. La commande mmx image permet de générer des images à partir d’invites de texte, offrant des options de rapport hauteur/largeur et de cohérence du sujet sur plusieurs sorties. Cette fonctionnalité facilite les flux de travail nécessitant une continuité visuelle. La commande vidéo mmx utilise MiniMax-Hailuo-2.3 pour la génération vidéo, avec des options d’interrogation synchrone ou de suivi des tâches asynchrones. Les utilisateurs peuvent spécifier une image d’ouverture pour la génération vidéo à l’aide des indicateurs de la commande.
La commande vocale mmx de MMX-CLI propose plus de 30 voix de synthèse vocale. Il permet aux utilisateurs d’ajuster des paramètres tels que la vitesse, le volume et la hauteur tout en prenant en charge la synchronisation des sous-titres. La saisie est limitée à 10 000 caractères.
Avec la commande mmx music, les utilisateurs peuvent générer de la musique à partir de saisies de texte et définir divers paramètres de composition tels que le genre et l’instrumentation. Des options d’intégration de filigranes sont également incluses. La commande mmx vision interprète les images à l’aide d’un modèle de langage de vision, permettant ainsi aux utilisateurs de se renseigner sur le contenu des images via des invites.
La commande mmx search facilite les recherches sur le Web, renvoyant les résultats au format texte ou JSON. La structure de commande et l’architecture technique sous-jacente sont optimisées pour une utilisation dans divers environnements. MMX-CLI est principalement développé en TypeScript et est compatible avec Node.js 18+. Son déploiement est simple, avec une gestion structurée des erreurs et la prise en charge du routage API double région.
MiniMax a déclaré que MMX-CLI réduit considérablement les barrières d’intégration pour le développement de l’IA en fournissant un outil unifié pour diverses capacités de génération de médias. Ceci, combiné à une configuration facile pour les agents IA, rationalise le processus de création d’applications intelligentes.








