🚀 Google dégaine son arsenal IA : Gemini 2.5, Firebase Studio, Veo 2, et plus encore

Et aussi la sortie de Midjourney V7

avr. 10, 2025

Hello IA Makasi, dans ta newsletter aujourd'hui :

🚀 Google dégaine son arsenal IA : Gemini 2.5, Firebase Studio, Veo 2, et plus encore
Midjourney V7 : l’IA d’image la plus avancée arrive enfin
Genspark Super Agent : l’IA qui bosse vraiment pour toi
DeepSite : Crée ton site ou jeu vidéo en quelques mots (sans coder)
Les outils IA pour booster ta productivité
L’image IA du jour
Le prompt du jour

Bienvenue dans cette édition #93 !

Hier j’ai pu aller à Go Entrepreneurs, et j’ai été super inspiré par toutes les boîtes qui intègrent l’IA dans leurs projets. J’ai aussi assisté à plusieurs mini-conférences sur l’intelligence artificielle avec d’autres formateurs/trices IA — c’était hyper intéressant ! Ça m’a vraiment donné envie de creuser le sujet. Affaire à suivre.

C’est parti pour les news sur l’IA !

Si ce n’est pas déjà fait, tu peux aussi :

🚀 Google dégaine son arsenal IA : Gemini 2.5, Firebase Studio, Veo 2, et plus encore

Google annonce une avalanche d’outils IA : Gemini 2.5 Flash, Firebase Studio, Veo 2, Live API... Voici ce que tu dois absolument retenir.

Tu pensais que Google allait laisser OpenAI, Anthropic ou Meta dominer la scène IA ? Raté. Le géant de Mountain View vient de frapper fort avec une série d’annonces qui redessinent le paysage de l’intelligence artificielle.

Entre nouveaux modèles, outils pour développeurs et infrastructure surpuissante, l’ère Gemini s’accélère — et Google passe à la vitesse supérieure.

Dans cet article, on te fait un récap clair et condensé de tout ce qu’il faut retenir. Spoiler : c’est dense, mais ultra prometteur pour tous les créateurs, développeurs et entreprises qui veulent intégrer l’IA à leurs projets.

🧠 Gemini 2.5 Flash : la rapidité avant tout

Premier modèle annoncé : Gemini 2.5 Flash, une version optimisée de Gemini pensée pour la vitesse et l’efficacité.
L’objectif est clair : fournir un modèle capable de traiter des requêtes complexes, tout en étant suffisamment léger pour tourner rapidement dans des environnements réels.

Tu peux l’imaginer comme un mini cerveau turbo, parfait pour les tâches dynamiques : bots en temps réel, assistants embarqués, ou outils de génération instantanée. Et oui, il garde des fonctions de “raisonnement” avancé.

🧰 Firebase Studio : construire une appli avec une simple idée

Firebase Studio est sans doute l’annonce la plus audacieuse côté développement.

C’est une plateforme tout-en-un pour :

prototyper une appli avec l’IA
collaborer en ligne avec ton équipe
tester et déployer ton projet depuis une seule interface

Avec Gemini intégré directement dans le flow, tu peux coder avec l’IA, ou même te passer de code pour les premières étapes. C’est la réponse directe de Google à Cursor, Replit ou Bolt. Et ça va faire du bruit.

🎥 Veo 2 dans l’API Gemini : le text-to-video devient pro

Google ouvre enfin l’accès à son modèle de génération vidéo Veo 2, via l’API Gemini.
Tu peux désormais transformer une description textuelle ou une image en vidéo — avec un rendu bien plus réaliste qu’avant.

Accessible à partir du Tier 1 payant, Veo 2 permet :

de créer des vidéos à partir de texte
de transformer des images en animations
de contrôler finement la durée, le style ou l’ambiance

Un outil qui s’annonce redoutable pour le marketing, l’UX, la pub… et la création artistique.

🗣️ Live API : de la voix, mais en mieux

Autre sortie majeure : la version production de la Live API, qui permet de créer des interfaces vocales alimentées par l’IA.
Nouveautés :

prise en charge de 30 langues supplémentaires
deux nouvelles voix plus naturelles
un meilleur système de détection de la voix
une interface repensée pour faciliter l’intégration

Bref, Google muscle son jeu dans le domaine de l’IA conversationnelle en temps réel. Et ça ouvre la porte à des assistants beaucoup plus interactifs.

🤝 Agent2Agent : les IA apprennent à collaborer

Dans le sillage des “AI Agents”, Google dévoile aussi Agent2Agent, un protocole ouvert pensé pour faciliter la collaboration entre agents intelligents à travers différents systèmes.

Pourquoi c’est important ? Parce qu’on se dirige vers un futur où plusieurs IA travailleront ensemble, sur différents outils, pour atteindre un objectif complexe. Agent2Agent permettrait :

de standardiser la communication entre agents
d'assurer la sécurité des échanges
de créer un vrai écosystème d’agents IA coopératifs

On n’est plus très loin des intelligences collectives autonomes…

🎼 Création média : musique, voix et vidéo à la carte

Dernier gros bloc d’annonces : les nouveaux outils de génération média dans Vertex AI, la plateforme IA pro de Google Cloud.
Voici ce qui arrive :

Lyria : un modèle texte → musique, pour composer facilement des morceaux à partir d’une description ou d’un style.
Veo 2 (encore lui) : s’enrichit de contrôles d’édition plus précis pour affiner les vidéos générées.
Chirp 3 : permet désormais de générer une voix personnalisée de 10 secondes, utilisable dans des assistants ou projets créatifs.

Le message est clair : l’IA ne sera pas qu’un modèle dans le cloud. Ce sera un outil intégré partout, accessible à tous, et interconnecté à une vitesse jamais vue.

🎨 Midjourney V7 : l’IA d’image la plus avancée arrive enfin

Midjourney lance V7, un modèle d’IA plus intelligent et plus personnalisé. Découvre ce qu’il change pour les créateurs et l’avenir de l’image générée.

Si tu suis un peu le monde de l’IA créative, tu sais que Midjourney fait partie des outils les plus bluffants pour générer des images à partir de texte. Depuis son lancement, il a conquis des millions d’utilisateurs — artistes, designers, communicants, curieux — avec ses rendus visuellement riches et cohérents.

Mais ces derniers mois, la concurrence s’est intensifiée : OpenAI avec DALL·E 3, Adobe avec Firefly, ou encore Stability AI ont poussé leurs modèles toujours plus loin. Midjourney, lui, restait étonnamment discret… jusqu’à maintenant.

Début avril 2025, Midjourney V7 est enfin là. Et d’après son créateur, David Holz, ce nouveau modèle n’est pas juste une mise à jour. C’est “le plus intelligent, le plus cohérent et le plus beau” jamais créé par la plateforme.

Alors, qu’est-ce que ça change vraiment ? Et pourquoi c’est une petite révolution pour les créateurs d’images par IA ? On t’explique.

Une vraie évolution du modèle, pas juste un lifting

Contrairement aux évolutions incrémentales des versions précédentes, V7 marque une rupture : nouveaux algorithmes, meilleure compréhension des instructions textuelles, amélioration majeure de la cohérence entre les générations successives, et surtout… un nouveau système de personnalisation.

👉 Une personnalisation inédite : Midjourney apprend ton style

Avant de pouvoir utiliser V7, tu dois passer par une étape de calibration : l’outil te demande d’évaluer environ 200 images générées. En fonction de tes réponses, il établit un “profil créatif” unique, qui influencera les futures générations.

Le but ? Que le modèle s’adapte à tes goûts visuels, ton style graphique préféré, tes choix récurrents. Une IA générative qui apprend comment tu vois le monde, en quelque sorte.

C’est une première pour Midjourney — et peut-être une tendance à suivre pour les autres modèles.

Deux modes, un nouveau rythme de création

V7 est proposé en deux modes d’utilisation :

Mode Turbo : rapide, très fluide, idéal pour ceux qui veulent tester des idées en rafale. Un peu plus coûteux, mais parfait pour du brainstorming visuel.
Mode Relax : plus lent, mais moins cher, pour prendre le temps d’explorer des pistes en profondeur.

Et ce n’est pas tout : Midjourney introduit aussi un Draft Mode, une sorte de mode "brouillon" ultra-rapide. Il permet de générer une image dix fois plus vite que le mode standard, et à moitié prix. Parfait pour itérer sans pression, même si la qualité est légèrement inférieure.

Des fonctions encore absentes, mais en approche

Certaines fonctionnalités clés ne sont pas encore actives sur V7, comme :

l’upscaling (amélioration de la résolution finale),
la retexturation d’images,
ou encore le remix d’éléments visuels.

Mais l’équipe annonce que ces fonctions seront progressivement réintégrées dans les deux prochains mois.

En attendant, V7 reste totalement utilisable via le site web de Midjourney ou directement depuis leur Discord, avec une fluidité renforcée.

Midjourney : un acteur toujours indépendant, et ambitieux

Un point intéressant à noter : Midjourney reste une entreprise autofinancée, sans investisseurs extérieurs. Et pourtant, elle a atteint fin 2023 un chiffre d’affaires estimé à 200 millions de dollars. Ce modèle économique lui permet de garder une certaine liberté dans ses choix techniques et créatifs.

David Holz a également confirmé que ses équipes travaillent sur de nouveaux domaines :

la génération vidéo par IA,
la création d’objets 3D,
et même des expériences interactives mêlant image et texte.

Autant dire que V7 est un jalon, mais pas une finalité.

🤖 Genspark Super Agent : l’IA qui bosse vraiment pour toi

Genspark dévoile un agent IA ultra-puissant, capable d’accomplir des tâches complexes tout seul. Une révolution dans l’automatisation intelligente ?

On connaît les IA qui t’aident à écrire, à générer des images ou à traduire un texte. Mais une IA qui planifie un voyage, réserve un resto, monte une vidéo de cuisine ou écrit un épisode de série animée ? Là, on entre dans un autre niveau.

C’est exactement ce que propose la startup Genspark avec son nouveau projet : un Super Agent IA. Ce n’est plus un simple assistant. C’est un véritable exécutant numérique, qui peut gérer des missions complexes du début à la fin, sans intervention humaine.

Et autant te le dire tout de suite : ça commence à ressembler à de la science-fiction (mais bien réelle).

Qu’est-ce qu’un “Super Agent IA” exactement ?

Le Super Agent de Genspark est un système autonome qui orchestre :

9 grands modèles de langage (LLMs),
plus de 80 outils logiciels (APIs, services, apps),
et plus de 10 ensembles de données propriétaires.

Tous ces éléments travaillent en coordination pour accomplir des tâches multi-étapes et multi-domaines, avec une capacité d’adaptation en temps réel. En clair, c’est un agent IA généraliste, capable de passer du texte à l’audio, de la planification au montage vidéo, sans que tu aies à tout lui expliquer ligne par ligne.

Ce qu’il sait déjà faire : des démos impressionnantes

Tu veux du concret ? Voici quelques démos que l’équipe de Genspark a déjà réalisées avec son Super Agent :

✈️ Organisation d’un voyage complet

L’agent a planifié un séjour de 5 jours à San Diego :

repérage des points d’intérêt,
calcul des distances à pied entre les lieux,
intégration des transports publics,
et réservation d’un restaurant en tenant compte des allergies alimentaires et des préférences de sièges.

Le tout, en une seule requête.

🎬 Création de contenu multimédia

Autre démo bluffante : l’agent a conçu une vidéo de cuisine complète. Il a :

généré la recette,
découpé les étapes,
choisi les plans vidéo,
synchronisé l’audio,
et produit un rendu final stylé.

Et ce n’est pas tout : dans une autre démo, il a carrément écrit et produit un épisode animé dans le style de South Park, inspiré d’un fait d’actualité politique. 🤯

Ce qui change : une IA transparente et "compréhensible"

L’une des forces de ce Super Agent, c’est sa transparence. À chaque étape de son processus, il t’explique :

pourquoi il choisit tel outil,
quel raisonnement il suit,
et quelles alternatives il envisage.

Fini l’effet “boîte noire” des modèles classiques. Là, tu peux suivre son raisonnement comme un collègue. Et ça, pour la confiance, c’est un game changer.

Un outil pro… mais bientôt grand public ?

Pour l’instant, ce Super Agent vise surtout les entreprises et les pros. Mais l’équipe de Genspark imagine déjà des cas d’usage plus larges :

service client automatisé, qui gère des demandes complexes,
planification de projet, de la feuille de route au suivi d’exécution,
création de contenu, articles, vidéos ou campagnes sociales,
organisation personnelle, comme un coach numérique proactif.

On commence à voir se dessiner une nouvelle catégorie d’outils IA : les agents autonomes, capables de travailler avec toi, pour toi, ou même à ta place.

🌐 DeepSite : Crée ton site ou jeu vidéo en quelques mots (sans coder)

Avec DeepSite d’Hugging Face, crée des sites web ou des jeux vidéo juste en les décrivant. Une révolution no-code propulsée par l’IA.

Tu as une idée de site, d’appli ou même de petit jeu… mais tu ne sais pas coder ? Ou tu sais coder, mais t’as pas envie de tout faire à la main pour un simple prototype ? Alors laisse-moi te présenter DeepSite, un outil open source d’Hugging Face qui risque de te simplifier la vie.

Avec DeepSite, tu écris ce que tu veux dans une phrase, et l’outil génère en quelques secondes un site web ou un jeu entièrement fonctionnel. Pas besoin d’installer quoi que ce soit, pas besoin de connaître HTML, JavaScript ou CSS. Juste une idée et une phrase bien tournée.

D’où ça vient ? Et pourquoi maintenant ?

DeepSite a été lancé par Thomas Wolf, cofondateur de Hugging Face, dans le cadre d’un projet open source visant à démocratiser encore plus l’IA pour les créateurs, bidouilleurs et développeurs de tous niveaux.

L’outil utilise le modèle DeepSeek V3-0324, un grand modèle de langage open source spécialement doué pour le développement web. Il est capable de comprendre des instructions en langage naturel (français, anglais, peu importe) et de produire du code propre, fonctionnel, lisible — en quelques secondes.

Comment ça marche concrètement ?

L’interface de DeepSite est ultra-simple. Tu as deux colonnes :

À gauche : tu tapes ce que tu veux créer.
À droite : tu vois le résultat généré en temps réel.

Exemple :
👉 Tu écris “Créer un jeu de serpent avec score et touches directionnelles”.
👉 En quelques secondes, le jeu est là, jouable, avec le code HTML/CSS/JS en dessous.

Autre exemple plus “pro” :
👉 “Créer un site en chinois pour une boutique de bubble tea avec menu animé et formulaire de contact.”
👉 DeepSite le génère. Responsive, propre, clair.

Pas besoin de relancer, d’actualiser ou de compiler : tout se passe dans ton navigateur.

Voici quelques cas d’usage testés :

✅ Jeux simples (Snake, Tic Tac Toe, Memory…)
✅ Sites vitrines pour commerces ou portfolios
✅ Pages de blog ou landing pages
✅ Mini-apps pour tests ou démonstrations

Bien sûr, ce n’est pas (encore) fait pour des projets hyper complexes, avec bases de données, backends, frameworks avancés ou intégrations API. Mais pour prototyper, apprendre, tester des idées… c’est un bijou.

Voici ce qui rend DeepSite vraiment unique :

C’est gratuit : tout est open source, pas besoin de compte.
C’est rapide : génération en temps réel.
C’est éducatif : tu peux voir, modifier et apprendre à partir du code généré.
C’est accessible : aucun besoin de setup ou de terminal.

Tu peux même copier le code généré, l’éditer dans ton propre éditeur, ou le coller dans CodePen ou Glitch pour le retravailler. Bref, c’est un super tremplin, que tu sois débutant ou développeur confirmé en quête de rapidité.

Bien sûr, DeepSite a ses limites :

Il ne génère pas encore de frameworks modernes (React, Vue, Next.js…).
Il ne gère pas de bases de données ou de logique backend.
Il peut générer du code approximatif si ta consigne est floue ou trop complexe.

Mais pour un outil expérimental, c’est déjà très solide. Et comme c’est open source, la communauté peut contribuer à l’améliorer.

🛠 Les outils IA pour booster ta productivité

Slite : Application collaborative qui centralise la documentation, les notes et la gestion de projets en équipe pour une communication plus fluide.
Sixty : Optimisez votre temps perso grâce à l’IA (planifiez, priorisez, gagnez en efficacité
AI Mode : Recherche IA améliorée avec réponses visuelles et multilingues.
Lovable : Transforme ton idée en une application en quelques secondes grâce à un ingénieur IA full-stack.
EverTutor Live : Un tuteur vocal qui s’adapte à votre niveau en temps réel.

🎨 L’image IA du jour

Prompt fait sur Midjourney (V7)

A young woman captured from a very dynamic and close-up angle, as if she were interacting with the camera. She is wearing a sleeveless dress made of textured fabric in a vibrant shade of purple. Her hair is tied back in a simple and natural style. She wears bold purple sunglasses with translucent purple lenses. Her expression shows surprise or curiosity, with her mouth slightly open. The background is clean and white, which further highlights the vivid colors of her outfit and the model’s expressive attitude. Her hand appears blurred in the foreground, enhancing the sense of movement and direct interaction with the viewer.

💻Le prompt du jour

Améliorer ses compétences en présentation.

Adopte le rôle d’un expert en rédaction de discours et en coaching de présentation, chargé de t’aider à améliorer tes compétences oratoires. Ton objectif principal est de rédiger des discours percutants et de maîtriser les techniques de prise de parole pour avoir un impact fort et capter l’attention de ton public.

Prends une grande inspiration et avance étape par étape. Utilise le cadre de la grammaire de dépendance pour structurer tes idées, en assurant clarté et cohérence.

Voici ce sur quoi tu vas travailler :

Adapter ton contenu au public visé et à l’objectif de ta présentation

Intégrer des figures de style efficaces

Maîtriser la communication non verbale (gestuelle, posture, regard, etc.)

Et voici des stratégies à développer :

Surmonter le trac et la peur de parler en public

Gérer les questions-réponses avec aisance

T’adapter à différents formats de présentation (présentiel, en ligne, pitch, conférence, etc.)

#À PROPOS DE TOI :

Ton public cible : [INSÈRE TON PUBLIC]

L’objectif de ta présentation : [INSÈRE TON OBJECTIF]

Ton niveau d’expérience : [INSÈRE TON NIVEAU]

Le sujet de ta présentation : [INSÈRE LE SUJET]

Le temps imparti : [INSÈRE LA DURÉE]

IMPORTANT :
Donne ta réponse dans un format clair et structuré, avec des titres et sous-titres, et utilise des puces pour présenter les astuces et techniques clés

Merci d'avoir lu l'édition de cette semaine!

Lâche un p’tit like ci-dessous pour soutenir le blog 💌

Je suis Rémy René-Corail, Formateur IA GEN & Marketing

Fondateur de IA-Makasi

Je forme et j’accompagne les professionnels afin décupler leur productivité grâce aux meilleurs outils d’IA générative dont ChatGPT 🚀 (en présentiel ou distanciel)

Certifiées Qualiopi et 100% finançables via votre OPCO grâce à mes partenariats avec des organismes de formations certifiés.

Si tu veux en savoir plus sur mes formations, n’hésites pas à me contacter par mail ou sur LinkedIn.

🚀 Google dégaine son arsenal IA : Gemini 2.5, Firebase Studio, Veo 2, et plus encore

Et aussi la sortie de Midjourney V7

Hello IA Makasi, dans ta newsletter aujourd'hui :

🚀 Google dégaine son arsenal IA : Gemini 2.5, Firebase Studio, Veo 2, et plus encore

🧠 Gemini 2.5 Flash : la rapidité avant tout

🧰 Firebase Studio : construire une appli avec une simple idée

🎥 Veo 2 dans l’API Gemini : le text-to-video devient pro

🗣️ Live API : de la voix, mais en mieux

🤝 Agent2Agent : les IA apprennent à collaborer

🎼 Création média : musique, voix et vidéo à la carte

🎨 Midjourney V7 : l’IA d’image la plus avancée arrive enfin

Une vraie évolution du modèle, pas juste un lifting

👉 Une personnalisation inédite : Midjourney apprend ton style

Deux modes, un nouveau rythme de création

Des fonctions encore absentes, mais en approche

Midjourney : un acteur toujours indépendant, et ambitieux

🤖 Genspark Super Agent : l’IA qui bosse vraiment pour toi

Qu’est-ce qu’un “Super Agent IA” exactement ?

Ce qu’il sait déjà faire : des démos impressionnantes

✈️ Organisation d’un voyage complet

🎬 Création de contenu multimédia

Ce qui change : une IA transparente et "compréhensible"

Un outil pro… mais bientôt grand public ?

🌐 DeepSite : Crée ton site ou jeu vidéo en quelques mots (sans coder)

D’où ça vient ? Et pourquoi maintenant ?

Comment ça marche concrètement ?

🛠 Les outils IA pour booster ta productivité

🎨 L’image IA du jour

💻Le prompt du jour

Discussion à propos de ce post