- L'IA Cafe News
- Posts
- đł Des cartes bleues pour les agents IA !
đł Des cartes bleues pour les agents IA !

Helloo fan dâIA et de cafĂ© ! âïž
Au menu dâaujourdâhui :
Chatbot Arena : un classement truquĂ© qui profite aux gĂ©ants de lâIA.
Une expĂ©rience secrĂšte Ă base dâIA fait scandale sur Reddit
Adobe ouvre Firefly aux IA de Google et OpenAI
Infos Express
4 Outils IA tendances
Meme IA du jour
â Avant de plonger dans cette newsletter, rejoins LâIA CafĂ© AcadĂ©mie, notre cocon en ligne 100 % dĂ©diĂ© Ă lâIA.
Fini le stress de devoir tout suivre partout : on veille pour toi, on tâaccompagne pas Ă pas, et surtout⊠tu nâes plus seul.e face Ă la tempĂȘte de lâIA.
Temps de lecture : 7 min (le temps dâun bon cafĂ©)


Image source : Cohere Labs
Chatbot Arena est devenu le baromĂštre des modĂšles dâIA. Mais un rapport menĂ© par Cohere Labs et plusieurs grandes universitĂ©s vient de jeter un sacrĂ© pavĂ© dans la mare : le systĂšme serait biaisé⊠et largement en faveur des mastodontes comme Google, Meta, Amazon ou OpenAI.
Les détails :
Test en mode sous-marin : Des modĂšles comme Llama 4 (Meta) auraient Ă©tĂ© testĂ©s jusquâĂ 27 fois en privĂ© avant leur publication officielle. Autant dire que ces versions avaient toutes les chances dâarriver en haut du classement.
Les résultats qui disparaissent : Certains scores sont simplement retirés aprÚs coup, faussant le classement final. Et devine qui en profite ? Les modÚles propriétaires.
LâaccĂšs aux donnĂ©es, gros dĂ©sĂ©quilibre : OpenAI et Google ont reçu Ă eux deux prĂšs de 40% des donnĂ©es de test, contre moins de 9% pour 41 modĂšles open source combinĂ©s. Et ce nâest pas anodin : plus un modĂšle accĂšde Ă ces donnĂ©es, plus ses performances explosent (jusquâĂ +112%).
Open source en mode punching-ball : Les modĂšles open weight sont bien plus souvent dĂ©prĂ©ciĂ©s en douce. Sur 205 modĂšles dĂ©classĂ©s, 66% Ă©taient open source. Autant dire que la neutralitĂ©, câest pas trop ça.
Pourquoi on en parle ?
Parce que si tu tâintĂ©resses Ă lâIA, tu es forcĂ©ment tombĂ© sur un classement Chatbot Arena un jour. Sauf que maintenant, on sait que ce classement a Ă©tĂ© manipulĂ© mĂȘme si ce nâĂ©tait pas forcĂ©ment volontaire au dĂ©part. Et dans un secteur oĂč tout le monde scrute ces scores, ces biais peuvent tuer dans lâĆuf des alternatives open source pourtant trĂšs solides. Bonne nouvelle : la plateforme veut se rĂ©inventer et corriger le tir. Mais ça montre Ă quel point lâĂ©valuation des IA est devenue un enjeu stratĂ©gique⊠et politique.

Des chercheurs de lâuniversitĂ© de Zurich ont voulu tester un truc simple : est-ce quâune IA peut te convaincre dans un dĂ©bat en ligne ? Pour ça, ils sont allĂ©s poster en douce des commentaires gĂ©nĂ©rĂ©s par IA sur Reddit⊠sans rien dire Ă personne. RĂ©sultat : gros bad buzz.
Les détails :
Test grandeur nature : De novembre Ă mars, les chercheurs ont floodĂ© le subreddit r/changemyview avec des messages Ă©crits par IA, dans le but de voir si ça pouvait faire changer dâavis les gens. Sauf que personne nâĂ©tait au courant, ni Reddit, ni les modĂ©rateurs, ni les utilisateurs.
Ambiance tendue : Quand les modĂ©rateurs ont dĂ©couvert le pot aux roses fin avril, ils ont immĂ©diatement alertĂ© Reddit. Et la plateforme nâa pas traĂźnĂ© : comptes bannis et lettres dâavocat envoyĂ©es Ă lâuniversitĂ©.
DonnĂ©es personnelles siphonnĂ©es : Pire encore, les chercheurs auraient utilisĂ© un outil pour rĂ©cupĂ©rer des infos persos Ă partir de lâhistorique des utilisateurs (Ăąge, genre, opinions politiquesâŠ). Tout ça pour alimenter leurs IA.
RĂ©action officielle : Reddit parle dâune expĂ©rience "hautement contraire Ă lâĂ©thique", et lâuniversitĂ© de Zurich assure quâaucun rĂ©sultat ne sera publiĂ©. Une enquĂȘte interne a mĂȘme Ă©tĂ© lancĂ©e.
Pourquoi on en parle ?
Parce que câest flippant. Tester lâIA dans des dĂ©bats ? Pourquoi pas. Mais le faire en douce, sur une vraie communautĂ©, et en collectant des donnĂ©es sensibles sans consentement ? LĂ , câest non. Ce genre de dĂ©rive montre Ă quel point lâIA peut poser de gros problĂšmes Ă©thiques si elle est mal utilisĂ©e. Et Reddit, en mode cow-boy de la modĂ©ration, montre aussi quâil ne laissera pas passer ça.
AGENTS IA
đł Visa et Mastercard donnent une carte bleue⊠aux IA

Tâas bien lu. Les agents IA vont bientĂŽt pouvoir faire du shopping Ă ta place. Visa et Mastercard viennent de lancer des solutions pour permettre aux intelligences artificielles dâacheter et de payer directement pour toi, dans un cadre sĂ©curisĂ© (enfin, en thĂ©orie).
Les détails :
Visa sort lâartillerie : Avec « Intelligent Commerce », ton IA peut faire des achats en utilisant une carte virtuelle ultra-sĂ©curisĂ©e. Les infos sont tokenisĂ©es (donc planquĂ©es), et toi, tu poses les rĂšgles : budget, prĂ©fĂ©rences, produits autorisĂ©sâŠ
Mastercard suit le move : Son outil, baptisĂ© « Agent Pay », permet dâintĂ©grer le paiement dans une conversation avec une IA. Tu parles avec ton assistant virtuel, il te conseille un produit⊠et bim, il lâachĂšte direct si tu donnes ton feu vert.
Contexte plus large : Tout ça arrive pile au moment oĂč ChatGPT, Perplexity, Amazon et consorts amĂ©liorent leurs agents IA pour devenir de vrais acheteurs assistĂ©s. La course au e-commerce version IA est lancĂ©e.
Pourquoi on en parle ?
Parce quâon entre dans une nouvelle Ăšre du shopping. Jusquâici, lâIA tâaidait Ă trouver des produits. Demain, elle pourra les acheter pour toi. Et les mastodontes du paiement veulent ĂȘtre prĂȘts pour ça. Reste Ă savoir si on sera Ă lâaise avec une IA qui sort la carte bleue sans nous demander deux fois.

OpenAI vient d'annoncer l'annulation d'une mise à jour controversée de GPT-4o qui rendait le modÚle excessivement agréable et flatteur dans n'importe quel contexte, déclenchant un débat à l'échelle de l'industrie sur le réglage de la personnalité de l'IA.
Meta vient de faire une série d'annonces sur l'IA lors de son premier événement de développeurs LlamaCon, notamment une application autonome pour son assistant Meta AI avec une personnalisation améliorée, un nouvel aperçu de l'API Llama et des outils de sécurité de l'IA.
Microsoft vient de lancer 3 nouveaux modÚles de poids ouverts axés sur le raisonnement dans sa famille Phi, qui surpassent leurs concurrents plus grands dans les tùches de raisonnement complexes tout en étant suffisamment petits pour fonctionner sur les téléphones et les ordinateurs portables.
La start-up française d'IA H Company s'empare discrÚtement de Mithril Security.

đ Recherche ChatGPT - expĂ©rience d'achat amĂ©liorĂ©e, citations et prise en charge de WhatsApp
đ„ Concepts de camĂ©ra Ray2 - ContrĂŽle avancĂ© de la camĂ©ra dĂ©sormais disponible via l'API
đŹ ScĂšnes emblĂ©matiques de Higgsfield - RecrĂ©e des scĂšnes de film Ă l'aide d'un seul selfie
âïž Kayak AI - Planifie des voyages et compare les options avec l'IA conversationnelle



LâIA CAFĂ ACADĂMIE
MAĂTRISE LâIA, RESTE Ă JOUR, SANS STRESS đ
â L'IA CafĂ© AcadĂ©mie est la 1Ăšre acadĂ©mie française en ligne dĂ©diĂ©e Ă lâIA, conçue pour que tu puisses suivre lâIA et progresser sans angoisse, en plaçant lâhumain au cĆur de cette rĂ©volution technologique !
Bref ! On sâoccupe de toute ta veille IA.
Rejoins lâacadĂ©mie (+100 Ă©tudiants) juste ICI !

SPONSORISE-MOI
REND VISIBLE TON PROJET PARMI UNE AUDIENCE QUALIFIĂE DE +30 000 PASSIONNĂ(E)S DâIA !
Parmi tout ce hub, des milliers de professionnels de la technologie, d'investisseurs, d'ingĂ©nieurs, de gestionnaires, de fondateurs d'entreprises et surtout, des personnes prĂȘtent Ă adopter lâIA dans leur quotidien !
FEEDBACK
Si tu as des retours spécifiques ou quelque chose d'intéressant que tu aimerais partager, merci de me le faire savoir en répondant à cet e-mail.