🌅 Google dévoile Nano Banana !!

Coucou amateur d’IA et de bon cafĂ© ! ☕

Au menu d’aujourd’hui :

  • Google dĂ©voile Gemini Flash 2.5 image

  • ModĂšle de synthĂšse vocale SOTA de Microsoft

  • Perplexity balance 42,5 millions $ pour rĂ©munĂ©rer les Ă©diteurs

  • Les 100 applis GenAI les + populaires selon A16z

  • Tuto concret du jour

  • Infos Express

  • 4 Outils IA tendances

  • Meme IA du jour

Profite de -30% avec le code CAFE30 dans l’IA CafĂ© AcadĂ©mie (+77 tutos IA, ateliers live, formations, top news de la semaine, rĂ©ducs sur des outils IA
)

Temps de lecture : 7 min (le temps d’un bon cafĂ©)

Image source : Google

Google vient de dĂ©voiler Gemini Flash 2.5 Image, un nouveau modĂšle d’IA ultra-puissant pour l’édition d’images. SurnommĂ© « nano-banane » pendant sa phase de test (oui, sĂ©rieusement), il a fait un carton
 et mis tout le monde d’accord dans le classement Image Edit de LM Arena, loin devant ses concurrents.

Les détails :

  • Carton plein : Flash 2.5 explose le score sur LM Arena, laissant Flux-Kontext loin derriĂšre. Le modĂšle est viral, puissant et franchement bluffant.

  • Modifs en chaĂźne : Tu peux enchaĂźner les changements (multi-tours) sans perdre en cohĂ©rence. L’IA garde les traits des personnages, mĂȘme aprĂšs plusieurs retouches.

  • ContrĂŽle crĂ©atif poussĂ© : Tu peux mixer des images, jouer avec les styles, modifier des scĂšnes entiĂšres
 juste avec des prompts en langage naturel.

  • Raisonnement intelligent : Flash 2.5 ne se contente pas de suivre les ordres. Il comprend le contexte (ajoute par exemple des plantes cohĂ©rentes avec le dĂ©cor), ce qui le rend beaucoup plus malin que les autres.

  • Prix mini : dispo Ă  0,039 $/image via API et Google AI Studio — moins cher que GPT-4o image ou Flux-Kontext.

Pourquoi on en parle ?

Parce que ce modĂšle pousse encore plus loin les limites de l’édition IA. On n’est pas encore au niveau de Photoshop, mais on s’en rapproche sĂ©rieusement. Et avec sa capacitĂ© Ă  garder la cohĂ©rence visuelle mĂȘme sur des modifications complexes, Flash 2.5 pourrait devenir le nouveau jouet viral des crĂ©ateurs. Si Google joue bien ses cartes, ça pourrait mĂȘme booster Gemini au niveau des grands noms de l’imaginaire visuel, façon Studio Ghibli.

Image source : Microsoft

Microsoft sort VibeVoice, un nouveau modĂšle de synthĂšse vocale open source capable de gĂ©nĂ©rer des conversations Ă  plusieurs voix qui durent
 jusqu’à 1h30. Le tout avec seulement 1,5 milliard de paramĂštres. Oui, c’est compact — et puissant.

Les détails :

  • QualitĂ© podcast : VibeVoice peut gĂ©rer jusqu’à 4 voix distinctes, tout en gardant l’intonation et les spĂ©cificitĂ©s de chaque locuteur. C’est fluide, naturel et plutĂŽt bluffant sur la durĂ©e.

  • Optimisation costaud : compression audio x80, ce qui permet au modĂšle de tourner sur des devices grand public. Pas besoin d’une ferme de serveurs pour faire parler l’IA.

  • Contexte maĂźtrisĂ© : avec l'intĂ©gration de Qwen2.5, le modĂšle capte les dynamiques d’une vraie conversation. Ça coupe la parole, ça rebondit, bref : ça vit.

  • SĂ©curitĂ© en place : Microsoft a glissĂ© des filigranes invisibles et des messages d’avertissement "gĂ©nĂ©rĂ© par l’IA" directement dans l’audio. IdĂ©al pour Ă©viter les deepfakes sournois.

Pourquoi on en parle ?

Parce qu’on passe un cap. Jusqu’ici, les modĂšles de voix gĂ©raient pĂ©niblement des dialogues Ă  deux. LĂ , on parle carrĂ©ment de panels IA de longue durĂ©e, Ă  plusieurs voix, avec des Ă©changes crĂ©dibles. Et en open source. Ce genre de techno pourrait bien bouleverser le monde des podcasts, des jeux vidĂ©o, de l’assistance virtuelle, et plus.

Image source : Perplexity

Perplexity vient d’annoncer un gros programme de partage des revenus avec les mĂ©dias : 42,5 millions de dollars seront redistribuĂ©s aux Ă©diteurs dont le contenu est utilisĂ© dans les rĂ©sultats de son IA. Comment ? Via un nouvel abonnement Comet Plus Ă  5 $/mois, dont 80 % des revenus iront directement aux mĂ©dias.

Les détails :

  • Un modĂšle "Ă  la Apple News+" : Les Ă©diteurs sont rĂ©munĂ©rĂ©s dĂšs qu’un article est lu via le navigateur Comet, apparaĂźt dans une recherche IA ou est utilisĂ© par l’assistant.

  • Timing bien choisi : L’annonce tombe alors que Perplexity fait face Ă  des attaques juridiques de Dow Jones, Forbes ou CondĂ© Nast pour utilisation non autorisĂ©e de contenus. CoĂŻncidence ? Pas sĂ»r.

  • Redistribution totale (ou presque) : Perplexity reverse la totalitĂ© des revenus d’abonnement, moins les coĂ»ts techniques. Les utilisateurs Pro et Max ont dĂ©jĂ  accĂšs Ă  Comet Plus.

  • Une vision ambitieuse : Pour le CEO, Comet Plus veut devenir « l’Apple News+ de l’ùre IA », oĂč humains et bots consomment le web ensemble.

Pourquoi on en parle ?

Parce que c’est peut-ĂȘtre un nouveau deal entre IA et mĂ©dias. Jusqu’ici, les IA se contentaient d’aspirer les infos sans vraiment redistribuer. LĂ , Perplexity tente de poser un cadre plus Ă©quitable (et lĂ©gal). Mais soyons clairs : un partage sur 5 $ par mois, ça risque de ne pas peser bien lourd pour des rĂ©dactions en galĂšre. Reste Ă  voir si ça peut amorcer un vrai virage dans les relations entre IA et presse.

Image source : A16z

Andreessen Horowitz (aka A16z) vient de balancer son 5e classement des applis GenAI les plus utilisĂ©es au monde. Objectif : repĂ©rer les tendances lourdes et les nouveaux entrants qui bousculent le game. Spoiler : OpenAI garde la couronne, mais y’a du mouvement.

Les détails :

  • ChatGPT toujours au sommet, suivi de prĂšs par Gemini de Google, qui capte 12 % du trafic Web de ChatGPT. Google place aussi AI Studio, NotebookLM et Labs dans le classement.

  • Grok explose et grimpe direct Ă  la 4e place, portĂ© par la sortie de Grok 4 et les nouveaux usages autour de son assistant IA.

  • Les applis chinoises cartonnent : 22 des 50 applis GenAI les plus utilisĂ©es sur mobile viennent de Chine (mĂȘme si la majoritĂ© sont utilisĂ©es Ă  l’international).

  • Les “Vibe dev tools” en feu : Lovable (#23), Cursor (#26) et Replit (#41) gagnent des places. Bolt n’est pas loin non plus.

Pourquoi on en parle ?

Ce classement, basĂ© sur l’usage rĂ©el, donne une bonne photo des habitudes GenAI des utilisateurs. Et en 5 mois Ă  peine, on voit dĂ©jĂ  Ă©merger des tendances fortes, comme les outils de code assistĂ© par IA. Clairement, ça s'accĂ©lĂšre, et ceux qui s’installent maintenant pourraient bien devenir les mastodontes de demain.

by L’IA CafĂ© AcadĂ©mie (-30% avec le code CAFE30)

GrĂące Ă  Midjourney VidĂ©o, tu peux transformer un simple dessin d’enfant en une animation dĂ©lirante et magique en moins de 3 minutes. Un moyen crĂ©atif de sublimer l’imaginaire des tout-petits
 et de faire briller les yeux des parents.

Comment ça marche ?

1ïžâƒŁ Scanne ou prends une photo du dessin original

  • IdĂ©alement sur fond blanc


2ïžâƒŁ Inscription Ă  Midjourney

  • Va sur http://midjourney.com et inscris-toi

  • C’est payant : 10 €/mois


3ïžâƒŁ GĂ©nĂšre ta vidĂ©o

  • Va sur “Create”

  • Puis sur “Add image” en haut Ă  gauche

  • Upload ton dessin pour le mettre en Starting Frame

  • DĂ©cris ce que tu souhaites obtenir

  • Clique sur EntrĂ©e

Et laisse la magie opĂ©rer đŸȘ„

Anthropic a introduit une extension « Claude pour Chrome » en test pour donner à l'assistant IA un contrÎle agentique sur les navigateurs des utilisateurs, dans le but d'étudier et de résoudre les problÚmes de sécurité qui ont touché d'autres navigateurs et plateformes alimentés par l'IA.

Microsoft a annoncé que Copilot sera intégré aux téléviseurs et moniteurs intelligents Samsung 2025, donnant à l'assistant IA un personnage animé en forme de blob qui peut répondre à des recommandations de films, des récapitulatifs d'épisodes, des questions générales et plus encore.

Anthropic (encore) vient de publier un nouveau rapport analysant 74 000 conversations d'éducateurs sur Claude, découvrant que les professeurs utilisent principalement l'IA pour automatiser le travail administratif, avec l'utilisation de l'IA pour noter un sujet polarisant

Google Translate peut désormais créer des exercices linguistiques à la Duolingo

  • 🧠 Raisonnement Command A - Le nouveau modĂšle de raisonnement d'entreprise de Cohere

  • 🌎 Mirage 2 - GĂ©nĂšre des moteurs mondiaux jouables en temps rĂ©el Ă  partir de texte ou d'images

  • ⚙ Qoder - La plateforme de codage libre d'Alibaba

  • đŸ—Łïž Google Traduction - Nouvelles traductions en direct alimentĂ©es par l'IA pour + de 70 langues

L’IA CAFÉ ACADÉMIE
Regarde notre dernier atelier IA 🎓

DĂ©couvre notre dernier atelier d’1h sur “L’IA VidĂ©o en 2025 : ça donne quoi ?”, avec l’expert Hedy Magroun.

Regarde-le ICI.

Pas encore membre ?
Rejoins l’IA CafĂ© AcadĂ©mie (-30% actuellement avec le code CAFE30)

Parmi tout ce hub, des milliers de professionnels de la technologie, d'investisseurs, d'ingĂ©nieurs, de gestionnaires, de fondateurs d'entreprises et surtout, des personnes prĂȘtent Ă  adopter l’IA dans leur quotidien !

FEEDBACK

Si tu as des retours spécifiques ou quelque chose d'intéressant que tu aimerais partager, merci de me le faire savoir en répondant à cet e-mail.