Microsoft a fait collaborer GPT et Claude — et le résultat dépasse tous les outils de recherche en IA existants

En bref

  • Microsoft a publié deux modes différents qui associent GPT et Claude afin d’améliorer la qualité de la recherche sur l’IA.
  • Critique fait collaborer les modèles, tandis que Council les fait travailler en parallèle, un troisième juge repérant les divergences.
  • Ce workflow à deux modèles corrige les hallucinations, les citations faibles et d’autres problèmes liés à la recherche sur l’IA avec un seul modèle.

L’IA de recherche approfondie fait partie des courses aux armements technologiques les plus intenses cette année. Google a annoncé son agent de recherche pour Gemini en décembre 2024, OpenAI a publié son propre agent de recherche en février 2025, xAI a suivi, Perplexity s’est renforcée davantage, et Anthropic’s Claude s’est constitué une base fidèle parmi les professionnels qui ont besoin de réponses détaillées et sourcées, en lançant son agent en avril de l’année dernière.

Chaque entreprise a essayé de vous convaincre que son seul modèle d’IA est le chercheur le plus intelligent de la pièce. Microsoft vient juste de dire : Pourquoi n’en choisir qu’un ?

L’entreprise a annoncé deux nouvelles fonctionnalités, lundi, pour l’outil Copilot’s Researcher — appelées Critique et Council — qui mettent GPT d’OpenAI et Claude d’Anthropic au travail sur la même tâche de recherche, l’un après l’autre. Le résultat, d’après les tests de Microsoft comparés à une référence du secteur, est plus élevé que tous les systèmes inclus dans ce test, y compris ceux provenant des plus grandes entreprises d’IA.

Présentation de Critique, un nouveau système de recherche approfondie multi-modèles dans M365 Copilot.

Vous pouvez utiliser plusieurs modèles ensemble pour générer des réponses et des rapports optimaux. pic.twitter.com/m4RlQmCKzs

— Satya Nadella (@satyanadella) March 30, 2026

« Critique est un nouveau système de recherche approfondie multi-modèles conçu pour des tâches de recherche complexes. Il sépare la génération de l’évaluation et utilise une combinaison de modèles provenant de laboratoires Frontier, dont Anthropic et OpenAI », explique Microsoft. « Un modèle mène la phase de génération, planifie la tâche, itère à travers la récupération des informations et produit une première ébauche, tandis qu’un deuxième modèle se concentre sur la relecture et l’amélioration, agissant comme évaluateur expert avant que le rapport final ne soit produit. »

Voici le problème de base que Critique est conçu pour résoudre : aujourd’hui, chaque outil de recherche sur l’IA fonctionne de la même manière. Vous posez une question, un modèle planifie une recherche, parcourt des sources, rédige un rapport, puis vous le renvoie. Ce modèle unique fait tout, sans que personne ne vérifie son travail.

Cela peut laisser passer certaines hallucinations, certaines erreurs dans les citations, des affirmations fausses ou inexactes, etc.



Critique casse ce workflow en deux. GPT gère la première phase — il planifie la recherche, récupère des sources et rédige une première ébauche. Ensuite, Claude intervient comme éditeur strict, en passant en revue le rapport pour vérifier l’exactitude des faits, la qualité des citations et si la réponse a effectivement couvert ce qui avait été demandé. Ce n’est qu’après cette relecture que le rapport final parvient à l’utilisateur. Microsoft indique que les rôles peuvent aussi, à terme, s’exécuter dans l’ordre inverse : Claude pourrait rédiger et GPT critiquer, même si, pour l’instant, GPT passe en premier.

Sur le benchmark DRACO — un test standardisé couvrant 100 tâches de recherche complexes dans 10 domaines, dont la médecine, le droit et la technologie — Copilot avec Critique a obtenu 57.4. points, tandis que Claude Opus d’Anthropic, à lui seul, a atteint 42.7. Le système combiné de Microsoft dépasse le meilleur résultat suivant d’environ 14 %.

Image : Microsoft

Les plus gros gains se sont vus dans la portée de l’analyse et la qualité de la présentation, avec aussi une amélioration significative de l’exactitude factuelle.

La deuxième fonctionnalité, Council, adopte une approche différente face au même problème. Au lieu d’avoir un modèle qui relit le travail de l’autre, Council exécute GPT et Claude simultanément et place leurs rapports complets côte à côte. Un troisième modèle « juge » lit ensuite les deux et rédige un résumé expliquant où les deux IA sont d’accord, où elles divergent, et quels angles uniques chacun a trouvés que l’autre a manqués. Jusqu’à présent, comparer manuellement des outils de recherche sur l’IA est quelque chose que les utilisateurs devaient faire eux-mêmes.

Dans Critique, les modèles collaborent essentiellement entre eux, tandis que dans Council les modèles s’affrontent.

Critique est l’expérience par défaut dans Researcher, tandis que Council vous demande de sélectionner « Model Council » dans le sélecteur pour activer le mode côte à côte. Les deux fonctionnalités sont actuellement disponibles pour les utilisateurs inscrits au programme Frontier de Microsoft, le canal d’accès anticipé pour les capacités les plus récentes de Copilot. Une licence Copilot pour Microsoft 365 (30 $/utilisateur/mois) est requise, mais les utilisateurs doivent aussi être inscrits à Frontier pour y accéder.

Image : Microsoft

OpenAI et Microsoft ont un partenariat de plusieurs milliards de dollars, mais le pari de Microsoft est qu’aucun modèle unique ne restera en tête très longtemps, et que la vraie valeur se situe dans la couche d’orchestration qui dirige les tâches vers la combinaison qui fonctionne le mieux.

Newsletter Daily Debrief

Commencez chaque jour par les meilleures actualités du moment, ainsi que des contenus originaux, un podcast, des vidéos et plus encore.

Votre e-mail

Obtenir !

Obtenir !

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler