💳 Des cartes bleues pour les agents IA !

Helloo fan d’IA et de cafĂ© ! ☕

Au menu d’aujourd’hui :

  • Chatbot Arena : un classement truquĂ© qui profite aux gĂ©ants de l’IA.

  • Une expĂ©rience secrĂšte Ă  base d’IA fait scandale sur Reddit

  • Adobe ouvre Firefly aux IA de Google et OpenAI

  • Infos Express

  • 4 Outils IA tendances

  • Meme IA du jour

☕ Avant de plonger dans cette newsletter, rejoins L’IA CafĂ© AcadĂ©mie, notre cocon en ligne 100 % dĂ©diĂ© Ă  l’IA.

Fini le stress de devoir tout suivre partout : on veille pour toi, on t’accompagne pas Ă  pas, et surtout
 tu n’es plus seul.e face Ă  la tempĂȘte de l’IA.

Temps de lecture : 7 min (le temps d’un bon cafĂ©)

Image source : Cohere Labs

Chatbot Arena est devenu le baromĂštre des modĂšles d’IA. Mais un rapport menĂ© par Cohere Labs et plusieurs grandes universitĂ©s vient de jeter un sacrĂ© pavĂ© dans la mare : le systĂšme serait biaisé  et largement en faveur des mastodontes comme Google, Meta, Amazon ou OpenAI.

Les détails :

  • Test en mode sous-marin : Des modĂšles comme Llama 4 (Meta) auraient Ă©tĂ© testĂ©s jusqu’à 27 fois en privĂ© avant leur publication officielle. Autant dire que ces versions avaient toutes les chances d’arriver en haut du classement.

  • Les rĂ©sultats qui disparaissent : Certains scores sont simplement retirĂ©s aprĂšs coup, faussant le classement final. Et devine qui en profite ? Les modĂšles propriĂ©taires.

  • L’accĂšs aux donnĂ©es, gros dĂ©sĂ©quilibre : OpenAI et Google ont reçu Ă  eux deux prĂšs de 40% des donnĂ©es de test, contre moins de 9% pour 41 modĂšles open source combinĂ©s. Et ce n’est pas anodin : plus un modĂšle accĂšde Ă  ces donnĂ©es, plus ses performances explosent (jusqu’à +112%).

  • Open source en mode punching-ball : Les modĂšles open weight sont bien plus souvent dĂ©prĂ©ciĂ©s en douce. Sur 205 modĂšles dĂ©classĂ©s, 66% Ă©taient open source. Autant dire que la neutralitĂ©, c’est pas trop ça.

Pourquoi on en parle ?

Parce que si tu t’intĂ©resses Ă  l’IA, tu es forcĂ©ment tombĂ© sur un classement Chatbot Arena un jour. Sauf que maintenant, on sait que ce classement a Ă©tĂ© manipulĂ© mĂȘme si ce n’était pas forcĂ©ment volontaire au dĂ©part. Et dans un secteur oĂč tout le monde scrute ces scores, ces biais peuvent tuer dans l’Ɠuf des alternatives open source pourtant trĂšs solides. Bonne nouvelle : la plateforme veut se rĂ©inventer et corriger le tir. Mais ça montre Ă  quel point l’évaluation des IA est devenue un enjeu stratĂ©gique
 et politique.

Des chercheurs de l’universitĂ© de Zurich ont voulu tester un truc simple : est-ce qu’une IA peut te convaincre dans un dĂ©bat en ligne ? Pour ça, ils sont allĂ©s poster en douce des commentaires gĂ©nĂ©rĂ©s par IA sur Reddit
 sans rien dire Ă  personne. RĂ©sultat : gros bad buzz.

Les détails :

  • Test grandeur nature : De novembre Ă  mars, les chercheurs ont floodĂ© le subreddit r/changemyview avec des messages Ă©crits par IA, dans le but de voir si ça pouvait faire changer d’avis les gens. Sauf que personne n’était au courant, ni Reddit, ni les modĂ©rateurs, ni les utilisateurs.

  • Ambiance tendue : Quand les modĂ©rateurs ont dĂ©couvert le pot aux roses fin avril, ils ont immĂ©diatement alertĂ© Reddit. Et la plateforme n’a pas traĂźnĂ© : comptes bannis et lettres d’avocat envoyĂ©es Ă  l’universitĂ©.

  • DonnĂ©es personnelles siphonnĂ©es : Pire encore, les chercheurs auraient utilisĂ© un outil pour rĂ©cupĂ©rer des infos persos Ă  partir de l’historique des utilisateurs (Ăąge, genre, opinions politiques
). Tout ça pour alimenter leurs IA.

  • RĂ©action officielle : Reddit parle d’une expĂ©rience "hautement contraire Ă  l’éthique", et l’universitĂ© de Zurich assure qu’aucun rĂ©sultat ne sera publiĂ©. Une enquĂȘte interne a mĂȘme Ă©tĂ© lancĂ©e.

Pourquoi on en parle ?

Parce que c’est flippant. Tester l’IA dans des dĂ©bats ? Pourquoi pas. Mais le faire en douce, sur une vraie communautĂ©, et en collectant des donnĂ©es sensibles sans consentement ? LĂ , c’est non. Ce genre de dĂ©rive montre Ă  quel point l’IA peut poser de gros problĂšmes Ă©thiques si elle est mal utilisĂ©e. Et Reddit, en mode cow-boy de la modĂ©ration, montre aussi qu’il ne laissera pas passer ça.

T’as bien lu. Les agents IA vont bientĂŽt pouvoir faire du shopping Ă  ta place. Visa et Mastercard viennent de lancer des solutions pour permettre aux intelligences artificielles d’acheter et de payer directement pour toi, dans un cadre sĂ©curisĂ© (enfin, en thĂ©orie).

Les détails :

  • Visa sort l’artillerie : Avec « Intelligent Commerce », ton IA peut faire des achats en utilisant une carte virtuelle ultra-sĂ©curisĂ©e. Les infos sont tokenisĂ©es (donc planquĂ©es), et toi, tu poses les rĂšgles : budget, prĂ©fĂ©rences, produits autorisĂ©s


  • Mastercard suit le move : Son outil, baptisĂ© « Agent Pay », permet d’intĂ©grer le paiement dans une conversation avec une IA. Tu parles avec ton assistant virtuel, il te conseille un produit
 et bim, il l’achĂšte direct si tu donnes ton feu vert.

  • Contexte plus large : Tout ça arrive pile au moment oĂč ChatGPT, Perplexity, Amazon et consorts amĂ©liorent leurs agents IA pour devenir de vrais acheteurs assistĂ©s. La course au e-commerce version IA est lancĂ©e.

Pourquoi on en parle ?

Parce qu’on entre dans une nouvelle Ăšre du shopping. Jusqu’ici, l’IA t’aidait Ă  trouver des produits. Demain, elle pourra les acheter pour toi. Et les mastodontes du paiement veulent ĂȘtre prĂȘts pour ça. Reste Ă  savoir si on sera Ă  l’aise avec une IA qui sort la carte bleue sans nous demander deux fois.

OpenAI vient d'annoncer l'annulation d'une mise à jour controversée de GPT-4o qui rendait le modÚle excessivement agréable et flatteur dans n'importe quel contexte, déclenchant un débat à l'échelle de l'industrie sur le réglage de la personnalité de l'IA.

Meta vient de faire une série d'annonces sur l'IA lors de son premier événement de développeurs LlamaCon, notamment une application autonome pour son assistant Meta AI avec une personnalisation améliorée, un nouvel aperçu de l'API Llama et des outils de sécurité de l'IA.

Microsoft vient de lancer 3 nouveaux modÚles de poids ouverts axés sur le raisonnement dans sa famille Phi, qui surpassent leurs concurrents plus grands dans les tùches de raisonnement complexes tout en étant suffisamment petits pour fonctionner sur les téléphones et les ordinateurs portables.

La start-up française d'IA H Company s'empare discrÚtement de Mithril Security.

L’IA CAFÉ ACADÉMIE
MAÎTRISE L’IA, RESTE À JOUR, SANS STRESS 🎓

→ L'IA CafĂ© AcadĂ©mie est la 1Ăšre acadĂ©mie française en ligne dĂ©diĂ©e Ă  l’IA, conçue pour que tu puisses suivre l’IA et progresser sans angoisse, en plaçant l’humain au cƓur de cette rĂ©volution technologique !

Bref ! On s’occupe de toute ta veille IA.

Rejoins l’acadĂ©mie (+100 Ă©tudiants) juste ICI !

Parmi tout ce hub, des milliers de professionnels de la technologie, d'investisseurs, d'ingĂ©nieurs, de gestionnaires, de fondateurs d'entreprises et surtout, des personnes prĂȘtent Ă  adopter l’IA dans leur quotidien !

FEEDBACK

Si tu as des retours spécifiques ou quelque chose d'intéressant que tu aimerais partager, merci de me le faire savoir en répondant à cet e-mail.