- L'IA Cafe News
- Posts
- đ Google deÌvoile Nano Banana !!
đ Google deÌvoile Nano Banana !!

Coucou amateur dâIA et de bon cafĂ© ! âïž
Au menu dâaujourdâhui :
Google dévoile Gemini Flash 2.5 image
ModĂšle de synthĂšse vocale SOTA de Microsoft
Perplexity balance 42,5 millions $ pour rémunérer les éditeurs
Les 100 applis GenAI les + populaires selon A16z
Tuto concret du jour
Infos Express
4 Outils IA tendances
Meme IA du jour
Profite de -30% avec le code CAFE30 dans lâIA CafĂ© AcadĂ©mie (+77 tutos IA, ateliers live, formations, top news de la semaine, rĂ©ducs sur des outils IAâŠ)
Temps de lecture : 7 min (le temps dâun bon cafĂ©)

IMAGES IA
đ
Google dévoile Gemini Flash 2.5 image

Image source : Google
Google vient de dĂ©voiler Gemini Flash 2.5 Image, un nouveau modĂšle dâIA ultra-puissant pour lâĂ©dition dâimages. SurnommĂ© « nano-banane » pendant sa phase de test (oui, sĂ©rieusement), il a fait un carton⊠et mis tout le monde dâaccord dans le classement Image Edit de LM Arena, loin devant ses concurrents.
Les détails :
Carton plein : Flash 2.5 explose le score sur LM Arena, laissant Flux-Kontext loin derriĂšre. Le modĂšle est viral, puissant et franchement bluffant.
Modifs en chaĂźne : Tu peux enchaĂźner les changements (multi-tours) sans perdre en cohĂ©rence. LâIA garde les traits des personnages, mĂȘme aprĂšs plusieurs retouches.
ContrÎle créatif poussé : Tu peux mixer des images, jouer avec les styles, modifier des scÚnes entiÚres⊠juste avec des prompts en langage naturel.
Raisonnement intelligent : Flash 2.5 ne se contente pas de suivre les ordres. Il comprend le contexte (ajoute par exemple des plantes cohérentes avec le décor), ce qui le rend beaucoup plus malin que les autres.
Prix mini : dispo Ă 0,039 $/image via API et Google AI Studio â moins cher que GPT-4o image ou Flux-Kontext.
Pourquoi on en parle ?
Parce que ce modĂšle pousse encore plus loin les limites de lâĂ©dition IA. On nâest pas encore au niveau de Photoshop, mais on sâen rapproche sĂ©rieusement. Et avec sa capacitĂ© Ă garder la cohĂ©rence visuelle mĂȘme sur des modifications complexes, Flash 2.5 pourrait devenir le nouveau jouet viral des crĂ©ateurs. Si Google joue bien ses cartes, ça pourrait mĂȘme booster Gemini au niveau des grands noms de lâimaginaire visuel, façon Studio Ghibli.
VOIX IA
đïž ModĂšle de synthĂšse vocale SOTA de Microsoft

Image source : Microsoft
Microsoft sort VibeVoice, un nouveau modĂšle de synthĂšse vocale open source capable de gĂ©nĂ©rer des conversations Ă plusieurs voix qui durent⊠jusquâĂ 1h30. Le tout avec seulement 1,5 milliard de paramĂštres. Oui, câest compact â et puissant.
Les détails :
QualitĂ© podcast : VibeVoice peut gĂ©rer jusquâĂ 4 voix distinctes, tout en gardant lâintonation et les spĂ©cificitĂ©s de chaque locuteur. Câest fluide, naturel et plutĂŽt bluffant sur la durĂ©e.
Optimisation costaud : compression audio x80, ce qui permet au modĂšle de tourner sur des devices grand public. Pas besoin dâune ferme de serveurs pour faire parler lâIA.
Contexte maĂźtrisĂ© : avec l'intĂ©gration de Qwen2.5, le modĂšle capte les dynamiques dâune vraie conversation. Ăa coupe la parole, ça rebondit, bref : ça vit.
SĂ©curitĂ© en place : Microsoft a glissĂ© des filigranes invisibles et des messages dâavertissement "gĂ©nĂ©rĂ© par lâIA" directement dans lâaudio. IdĂ©al pour Ă©viter les deepfakes sournois.
Pourquoi on en parle ?
Parce quâon passe un cap. Jusquâici, les modĂšles de voix gĂ©raient pĂ©niblement des dialogues Ă deux. LĂ , on parle carrĂ©ment de panels IA de longue durĂ©e, Ă plusieurs voix, avec des Ă©changes crĂ©dibles. Et en open source. Ce genre de techno pourrait bien bouleverser le monde des podcasts, des jeux vidĂ©o, de lâassistance virtuelle, et plus.

Image source : Perplexity
Perplexity vient dâannoncer un gros programme de partage des revenus avec les mĂ©dias : 42,5 millions de dollars seront redistribuĂ©s aux Ă©diteurs dont le contenu est utilisĂ© dans les rĂ©sultats de son IA. Comment ? Via un nouvel abonnement Comet Plus Ă 5 $/mois, dont 80 % des revenus iront directement aux mĂ©dias.
Les détails :
Un modĂšle "Ă la Apple News+" : Les Ă©diteurs sont rĂ©munĂ©rĂ©s dĂšs quâun article est lu via le navigateur Comet, apparaĂźt dans une recherche IA ou est utilisĂ© par lâassistant.
Timing bien choisi : Lâannonce tombe alors que Perplexity fait face Ă des attaques juridiques de Dow Jones, Forbes ou CondĂ© Nast pour utilisation non autorisĂ©e de contenus. CoĂŻncidence ? Pas sĂ»r.
Redistribution totale (ou presque) : Perplexity reverse la totalitĂ© des revenus dâabonnement, moins les coĂ»ts techniques. Les utilisateurs Pro et Max ont dĂ©jĂ accĂšs Ă Comet Plus.
Une vision ambitieuse : Pour le CEO, Comet Plus veut devenir « lâApple News+ de lâĂšre IA », oĂč humains et bots consomment le web ensemble.
Pourquoi on en parle ?
Parce que câest peut-ĂȘtre un nouveau deal entre IA et mĂ©dias. Jusquâici, les IA se contentaient dâaspirer les infos sans vraiment redistribuer. LĂ , Perplexity tente de poser un cadre plus Ă©quitable (et lĂ©gal). Mais soyons clairs : un partage sur 5 $ par mois, ça risque de ne pas peser bien lourd pour des rĂ©dactions en galĂšre. Reste Ă voir si ça peut amorcer un vrai virage dans les relations entre IA et presse.

Image source : A16z
Andreessen Horowitz (aka A16z) vient de balancer son 5e classement des applis GenAI les plus utilisĂ©es au monde. Objectif : repĂ©rer les tendances lourdes et les nouveaux entrants qui bousculent le game. Spoiler : OpenAI garde la couronne, mais yâa du mouvement.
Les détails :
ChatGPT toujours au sommet, suivi de prĂšs par Gemini de Google, qui capte 12 % du trafic Web de ChatGPT. Google place aussi AI Studio, NotebookLM et Labs dans le classement.
Grok explose et grimpe direct à la 4e place, porté par la sortie de Grok 4 et les nouveaux usages autour de son assistant IA.
Les applis chinoises cartonnent : 22 des 50 applis GenAI les plus utilisĂ©es sur mobile viennent de Chine (mĂȘme si la majoritĂ© sont utilisĂ©es Ă lâinternational).
Les âVibe dev toolsâ en feu : Lovable (#23), Cursor (#26) et Replit (#41) gagnent des places. Bolt nâest pas loin non plus.
Pourquoi on en parle ?
Ce classement, basĂ© sur lâusage rĂ©el, donne une bonne photo des habitudes GenAI des utilisateurs. Et en 5 mois Ă peine, on voit dĂ©jĂ Ă©merger des tendances fortes, comme les outils de code assistĂ© par IA. Clairement, ça s'accĂ©lĂšre, et ceux qui sâinstallent maintenant pourraient bien devenir les mastodontes de demain.

TUTO CONCRET
đ ïž Comment animer un dessin dâenfant en 3min avec Midjourney VidĂ©o

by LâIA CafĂ© AcadĂ©mie (-30% avec le code CAFE30)
GrĂące Ă Midjourney VidĂ©o, tu peux transformer un simple dessin dâenfant en une animation dĂ©lirante et magique en moins de 3 minutes. Un moyen crĂ©atif de sublimer lâimaginaire des tout-petits⊠et de faire briller les yeux des parents.
Comment ça marche ?
1ïžâŁ Scanne ou prends une photo du dessin original
Idéalement sur fond blanc
2ïžâŁ Inscription Ă Midjourney
Va sur http://midjourney.com et inscris-toi
Câest payant : 10 âŹ/mois
3ïžâŁ GĂ©nĂšre ta vidĂ©o
Va sur âCreateâ
Puis sur âAdd imageâ en haut Ă gauche
Upload ton dessin pour le mettre en Starting Frame
Décris ce que tu souhaites obtenir
Clique sur Entrée
Et laisse la magie opĂ©rer đȘ

Anthropic a introduit une extension « Claude pour Chrome » en test pour donner à l'assistant IA un contrÎle agentique sur les navigateurs des utilisateurs, dans le but d'étudier et de résoudre les problÚmes de sécurité qui ont touché d'autres navigateurs et plateformes alimentés par l'IA.
Microsoft a annoncé que Copilot sera intégré aux téléviseurs et moniteurs intelligents Samsung 2025, donnant à l'assistant IA un personnage animé en forme de blob qui peut répondre à des recommandations de films, des récapitulatifs d'épisodes, des questions générales et plus encore.
Anthropic (encore) vient de publier un nouveau rapport analysant 74 000 conversations d'éducateurs sur Claude, découvrant que les professeurs utilisent principalement l'IA pour automatiser le travail administratif, avec l'utilisation de l'IA pour noter un sujet polarisant
Google Translate peut désormais créer des exercices linguistiques à la Duolingo

đ§ Raisonnement Command A - Le nouveau modĂšle de raisonnement d'entreprise de Cohere
đ Mirage 2 - GĂ©nĂšre des moteurs mondiaux jouables en temps rĂ©el Ă partir de texte ou d'images
âïž Qoder - La plateforme de codage libre d'Alibaba
đŁïž Google Traduction - Nouvelles traductions en direct alimentĂ©es par l'IA pour + de 70 langues



LâIA CAFĂ ACADĂMIE
Regarde notre dernier atelier IA đ

DĂ©couvre notre dernier atelier dâ1h sur âLâIA VidĂ©o en 2025 : ça donne quoi ?â, avec lâexpert Hedy Magroun.
Regarde-le ICI.
Pas encore membre ?
Rejoins lâIA CafĂ© AcadĂ©mie (-30% actuellement avec le code CAFE30)
SPONSORISE-MOI
REND VISIBLE TON PROJET PARMI UNE AUDIENCE QUALIFIĂE DE +30 000 PASSIONNĂ(E)S DâIA !
Parmi tout ce hub, des milliers de professionnels de la technologie, d'investisseurs, d'ingĂ©nieurs, de gestionnaires, de fondateurs d'entreprises et surtout, des personnes prĂȘtent Ă adopter lâIA dans leur quotidien !
FEEDBACK
Si tu as des retours spécifiques ou quelque chose d'intéressant que tu aimerais partager, merci de me le faire savoir en répondant à cet e-mail.