Board

IA

3 articles

Modèles, agents, recherche fondamentale et applications — l'actualité de l'intelligence artificielle.

IAMIT Technology Review··6 min

GPT-5 Turbo dépasse Claude Opus 4.7 sur les benchmarks de raisonnement multi-étapes

Résumé Claude
  • OpenAI annonce GPT-5 Turbo avec un score de 94 % sur GSM-Hard, contre 91 % pour Claude Opus 4.7.
  • Le modèle introduit un mode de raisonnement à fenêtre adaptative qui réduit la latence de 38 %.
  • Anthropic réplique en publiant Claude Sonnet 4.6 optimisé pour les tâches d'agent autonome.
IALe Monde Informatique··4 min

Mistral Large 3 : le français rattrape GPT-4o sur les benchmarks multilingues européens

Résumé Claude
  • Mistral Large 3 obtient 87 % sur MMLU-FR contre 88 % pour GPT-4o, à un coût trois fois inférieur.
  • Le modèle est disponible en self-hosting sous licence Apache 2.0 pour les versions jusqu'à 22 milliards de paramètres.
  • BNP Paribas, Carrefour et la SNCF figurent parmi les premiers grands clients annoncés.