Ce 30 juin 2026, Anthropic ne dévoile pas un nouveau modèle record sur les benchmarks. L'entreprise lance Claude Science, un environnement de travail dédié aux chercheurs. L'objectif annoncé est radical : « compresser des semaines de travail en heures ». Plutôt que de promettre une intelligence artificielle surpuissante, Anthropic parie sur l'intégration, les connecteurs et l'automatisation des tâches quotidiennes. Dans un marché académique ultra-concurrentiel où OpenAI, Google et Microsoft se disputent les labos, ce choix contre-intuitif mérite qu'on s'y attarde.

Pourquoi Anthropic lance un « atelier de travail IA » au lieu d’un modèle plus fort
Le pari d'Anthropic est simple : la science n'a pas besoin d'un modèle plus gros. Elle a besoin d'outils qui fonctionnent dans le monde réel. Les chercheurs passent des heures à extraire des données, à formater des protocoles, à vérifier du code. Ce sont ces tâches « ennuyeuses » que Claude Science veut automatiser.
La philosophie est assumée. Comme le rappelait la direction d'Anthropic au moment du lancement de Claude for Life Sciences en octobre 2025 : « nous n'avons aucune illusion, les essais cliniques de trois ans ne se feront pas en un mois ». L'entreprise ne promet pas de miracles. Elle promet de gagner du temps sur ce qui peut l'être, étape par étape. C'est une approche pragmatique, presque modeste, dans un secteur où l'hyperbole est la norme.

200 lignes de workflow, pas 200 milliards de paramètres : la philosophie Anthropic
Pendant que la course aux modèles géants s'intensifie — OpenAI avec GPT-5, Google avec Gemini Ultra — Anthropic choisit de résoudre les problèmes concrets du chercheur. Pas de démonstration de force sur un benchmark. Des intégrations qui marchent.
Le workflow est une promesse de fiabilité et de temps gagné, pas une promesse de génie artificiel. Concrètement, Claude Science ne remplace pas le chercheur. Il le débarrasse des tâches répétitives pour qu'il puisse se concentrer sur l'essentiel : formuler des hypothèses, concevoir des expériences, interpréter des résultats. C'est un assistant, pas un oracle.
Cette approche s'inscrit dans la continuité de ce qu'Anthropic fait déjà avec Claude dans Photoshop, Blender et Ableton : faire de l'IA un copilote intégré aux environnements de travail existants, plutôt qu'un outil à part.
Une concurrence à trois têtes : ChatGPT Research, Google Gemini et désormais Claude Science
Le marché académique est devenu le nouvel eldorado des labos d'IA. OpenAI propose ses offres ChatGPT Research, avec des capacités d'analyse documentaire et de génération de code. Google a lancé Gemini for Science le 19 mai 2026 à l'I/O, avec une promesse ambitieuse : « une nouvelle ère de découverte ne viendra pas de modèles spécialisés étroits, mais d'agents généraux qui donnent aux chercheurs les moyens d'agir dans tous les domaines scientifiques ».
Anthropic arrive avec une troisième voie. Là où OpenAI mise sur la puissance conversationnelle et Google sur l'agent généraliste, Claude Science mise sur la spécialisation et l'intégration. Pour les chercheurs, le critère numéro un est la confiance. Un outil qui produit des résultats reproductibles et vérifiables vaut mieux qu'un modèle plus fort mais opaque.

Un événement de lancement qui pose le décor
Le 30 juin 2026, Anthropic organise un « Briefing : AI for Science » virtuel. Dirigeants d'Anthropic, cadres des sciences de la vie et institutions de recherche partagent comment Claude est utilisé dans la science. Les thèmes centraux : « compresser des délais mesurés en semaines en heures » et « repenser à quoi peut ressembler un environnement de recherche natif IA ». L'événement est conçu pour montrer que le workflow n'est pas une théorie, mais une pratique déjà en place.
Claude Science décortiqué : ce que les chercheurs peuvent vraiment faire avec l’outil
Passons de la philosophie aux faits. Qu'est-ce qui change concrètement quand on ouvre Claude Science au lieu d'un chat classique ? Trois piliers font la différence : les Agent Skills, les connecteurs, et la traçabilité.
L'interface n'est pas un simple champ de texte. C'est un tableau de bord personnalisable, avec des panneaux dédiés aux protocoles, aux données, à la littérature. Le chercheur peut charger ses fichiers, lancer des analyses, visualiser des résultats. Tout est conçu pour minimiser les allers-retours entre applications.

Agent Skills : quand l’IA sait exécuter un protocole de laboratoire du début à la fin
Les Agent Skills sont le cœur de l'offre. Ce ne sont pas des prompts que le chercheur doit écrire. Ce sont des dossiers structurés d'instructions qui exécutent des tâches scientifiques précises. Exemple concret : single-cell-rna-qc pour le contrôle qualité de données RNA-seq. Le chercheur n'a pas à décrire le protocole. Il clique, et l'IA exécute.
Chaque Agent Skill est un ensemble de règles, de paramètres et de vérifications. L'IA sait quelles étapes sont critiques, quels seuils sont acceptables, quels formats de sortie attendre. Cela transforme un assistant conversationnel en véritable automate de protocole, directement utilisable par un étudiant en biologie cellulaire.
Les connecteurs qui changent la donne : Benchling, PubMed, 10x Genomics
Claude Science ne flotte pas dans le vide. Il lit et écrit sur Benchling, la plateforme de gestion de laboratoire la plus utilisée dans la recherche académique. Il interroge PubMed pour trouver des articles pertinents. Il exploite les données de 10x Genomics pour l'analyse single-cell. Fini le copier-coller fastidieux entre applications.

Le workflow devient un « tuyau » qui relie les outils que le chercheur utilise déjà. Les intégrations incluent également Scholar Gateway by Wiley, Synapse.org, et des outils généraux comme Google Workspace, Microsoft SharePoint, OneDrive, Outlook, Teams, Databricks et Snowflake. L'idée est simple : l'IA doit s'adapter à l'environnement du chercheur, pas l'inverse.
Un environnement de travail « auditable » : la promesse de la reproductibilité
Un des plus gros freins à l'IA dans la science est le manque de traçabilité. La « boîte noire » est inacceptable quand il s'agit de publier des résultats ou de soumettre un protocole à un comité d'éthique. Claude Science met en avant des « artefacts audités » : chaque action de l'IA est tracée, reproductible et vérifiable.
Concrètement, le chercheur peut voir exactement quelles étapes l'IA a suivies, quels paramètres elle a utilisés, quelles données elle a consultées. Il peut rejouer l'analyse, la modifier, la partager. Cette fonctionnalité est centrale pour convaincre les reviewers et les comités d'éthique. Elle répond à une exigence fondamentale de la méthode scientifique : la reproductibilité.
Gagner des mois en 20 minutes : les premiers cas concrets qui font tourner les têtes
La théorie est séduisante, mais qu'en est-il des résultats ? Anthropic et ses partenaires mettent en avant plusieurs études de cas qui démontrent que le workflow tient ses promesses, au moins sur des tâches spécifiques.
Les chiffres sont impressionnants : des études qui prenaient des mois sont bouclées en minutes. Mais attention, il s'agit de tâches bien définies, pas de découvertes révolutionnaires. Le gain de temps est réel, mais il porte sur l'exécution, pas sur la conception.
L’étude qui prenait des mois bouclée en 20 minutes : le cas Biomni (Stanford)
Le cas le plus frappant vient de Stanford. Biomni, une plateforme agentic développée à l'université, utilise Claude pour réaliser des études d'association pangénomique (GWAS). Le processus normal prend des mois : extraction des données, nettoyage, analyse statistique, interprétation. Biomni l'a fait en 20 minutes.

Plus impressionnant encore : lors d'une évaluation en aveugle, la conception d'expériences de clonage moléculaire de Biomni égalait celle d'un postdoc ayant 5 ans d'expérience. Les experts n'ont pas fait la différence entre les protocoles conçus par l'IA et ceux conçus par un chercheur humain expérimenté. C'est la preuve que le workflow ne se contente pas d'accélérer : il maintient un niveau de qualité élevé.
MozzareLLM au MIT : décoder les expériences CRISPR en quelques minutes
Le projet MozzareLLM du MIT et du Whitehead Institute utilise Claude pour automatiser l'interprétation des expériences de knockout de gènes par CRISPR. Ce qui prenait des centaines d'heures de travail manuel — analyser les séquences, identifier les gènes cibles, interpréter les résultats — est réduit à quelques minutes.
L'outil identifie des relations biologiques complexes entre gènes, démontrant que l'IA ne se contente pas de reproduire : elle découvre des pistes. Les chercheurs du MIT ont pu explorer des hypothèses qu'ils n'auraient jamais eu le temps de tester manuellement. Le gain de temps se transforme en gain de découverte.
Paper2Agent : des articles qui deviennent des « co-chercheurs »
James Zou, professeur associé à Stanford, résume bien la vision : « Claude Code et le partenariat avec Anthropic ont été extrêmement précieux pour développer Paper2Agent, notre projet fou de transformer des articles de recherche passifs en agents IA interactifs capables d'agir comme des co-auteurs et co-chercheurs virtuels ».
L'idée est futuriste : un article de recherche n'est plus une archive qu'on lit une fois et qu'on oublie. C'est un point de départ pour une interaction. Le chercheur peut « discuter » avec l'article, poser des questions, demander des clarifications, explorer des variantes. L'IA, formée sur le contenu de l'article et la littérature associée, devient un collaborateur virtuel.
Workflow contre modèle : pourquoi Google et Anthropic ont deux visions radicalement différentes de l’IA pour la science
Le 19 mai 2026, Google lançait Gemini for Science à l'I/O. La méthode est aux antipodes de celle d'Anthropic. Là où Anthropic mise sur la spécialisation et l'intégration, Google parie sur l'agent généraliste. Cette divergence mérite d'être analysée.

Les deux approches ont leurs forces et leurs faiblesses. Google vise la polyvalence : un seul modèle capable de faire de la chimie, de la biologie, de la physique. Anthropic vise la profondeur : des outils spécialisés qui maîtrisent un domaine précis. Le choix dépend du besoin du chercheur et de la structure de son laboratoire.
Google parie sur l’agent généraliste : Gemini for Science et ses 30 compétences
Google a dévoilé Gemini for Science avec une promesse ambitieuse : un seul modèle capable d'intégrer plus de 30 compétences scientifiques — chimie, biologie, physique, génie des matériaux. La citation clé du blog de Google : « une nouvelle ère de découverte ne viendra pas de modèles spécialisés étroits, mais d'agents généraux qui donnent aux chercheurs les moyens d'agir dans tous les domaines scientifiques ».
L'avantage est évident : la flexibilité. Un chercheur en biologie qui a besoin d'analyser des données de physique des matériaux n'a pas à changer d'outil. Gemini for Science intègre des bases de données comme UniProt et AlphaFold, et propose des fonctionnalités comme Co-Scientist, AlphaEvolve, et Empirical Research Assistance. Les partenaires industriels incluent BASF, Bayer Crop Science, et les laboratoires nationaux américains.
Anthropic parie sur la boîte à outils spécialisée : qui a raison ?
Le trade-off est clair. L'approche Anthropic — atelier personnalisable, connecteurs spécifiques, Agent Skills pré-construites — favorise la fiabilité et la confiance dans un domaine donné. L'approche Google favorise la découverte transversale et la polyvalence.
Pour un jeune chercheur en biologie qui veut automatiser ses protocoles quotidiens, la solution spécialisée d'Anthropic est plus rassurante et efficace immédiatement. Elle parle le même langage que lui, utilise les mêmes outils, respecte les mêmes normes. Pour un institut pluridisciplinaire qui travaille sur des problèmes transverses — par exemple, l'interface entre biologie et physique des matériaux — la solution généraliste de Google est plus rentable.
Les deux approches ne sont pas mutuellement exclusives. Certains laboratoires utiliseront Claude Science pour les tâches quotidiennes et Gemini for Science pour les explorations transversales. La concurrence est saine : elle pousse chaque entreprise à améliorer son offre.
Accès et argent : combien coûte vraiment Claude Science et qui peut l’utiliser ?
Qui paie, qui bénéficie, et qui est exclu ? L'offre académique est généreuse, mais elle a des limites. Il faut être réaliste sur les coûts et les barrières d'accès.
Anthropic a fait le choix de subventionner l'accès à Claude Science pour les chercheurs académiques. C'est une stratégie d'adoption : plus les chercheurs utilisent l'outil, plus ils deviennent dépendants de l'écosystème. Mais cette générosité a un coût, et elle n'est pas uniforme.
20 000 dollars de crédits gratuits pour les académiques : le programme AI for Science décrypté
Le « AI for Science Program » d'Anthropic offre jusqu'à 20 000 dollars de crédits API gratuits pendant 6 mois pour les chercheurs académiques et les organisations à but non lucratif. Les conditions sont précises : il faut être affilié à une institution de recherche, l'accent est mis sur la biologie et les sciences de la vie, et les crédits ne sont valables que pour l'API (pas l'application web).
Les candidatures sont examinées mensuellement, le premier lundi de chaque mois. C'est une aubaine pour les labos de biologie qui veulent tester Claude Science sans engagement financier. Mais cela implique une démarche administrative : remplir un dossier, justifier son projet, attendre la validation. Pour un chercheur déjà surchargé, c'est une barrière supplémentaire.
Le revers de la médaille : quid des chercheurs en sciences sociales ou en physique ?
Le programme est explicitement centré sur les sciences de la vie. Un doctorant en sociologie, en économie ou en physique des particules ne bénéficie pas de la même manne. Les crédits gratuits sont réservés à la biologie et aux disciplines connexes.
Hors programme, les coûts de l'API Claude peuvent être significatifs. Un laboratoire qui utilise intensivement Claude Science pour l'analyse de données génomiques peut rapidement accumuler des milliers de dollars de factures mensuelles. Cette barrière d'accès risque de creuser un fossé entre disciplines « outillées » et « non outillées » par l'IA. Les sciences de la vie bénéficient d'un avantage concurrentiel que les sciences sociales ou la physique n'ont pas.
Anthropic justifie ce choix par l'impact potentiel : les sciences de la vie sont là où l'IA peut faire la différence la plus immédiate. Mais c'est un argument discutable. La physique des particules, la climatologie, l'économie comportementale pourraient tout aussi bien bénéficier d'outils spécialisés.
La recherche a-t-elle vraiment besoin d’un workflow IA, ou est-ce un risque pour la science ?
L'article ne doit pas être une tribune publicitaire. Il faut poser la question des risques. La fiabilité, la reproductibilité et le risque de « science automate » sont des préoccupations légitimes.
Les travaux académiques récents pointent les limites de l'IA agentic dans la recherche. Un article sur arXiv (2603.26718v2) analyse les défis de l'évaluation des systèmes scientifiques multi-agents. Les conclusions sont nuancées : l'IA peut aider, mais elle peut aussi induire en erreur.
Le piège de la boîte noire : quand l’IA reproduit le savoir sans le comprendre
Le papier arXiv met en garde : « les systèmes scientifiques qui intègrent LLMs avec des outils externes et du raisonnement itératif posent le problème de distinguer le raisonnement véritable de la simple récupération d'informations ». En clair, l'IA peut sembler intelligente alors qu'elle ne fait que reproduire ce qu'elle a vu.
Le risque de contamination est réel. L'IA peut reproduire très vite et très bien une méthode connue, mais être incapable de sortir du cadre établi. Le workflow peut alors accélérer une « mauvaise science » si les hypothèses de départ sont erronées. Un chercheur qui utilise Claude Science pour analyser des données doit rester critique : l'IA ne fait pas de doute méthodologique, elle exécute.
Benchmarker l’impossible : comment savoir si une IA fait de la « bonne science » ?
Le constat du papier arXiv est implacable : l'évaluation des capacités scientifiques d'un système multi-agent est un problème ouvert. « Les concepts comme l'intuition physique, le raisonnement critique, ou la génération d'hypothèses sont difficiles à formaliser, et donc difficiles à benchmarker ».
Le workflow aide sur les tâches : extraction de données, formatage de protocoles, analyse statistique. Mais son impact sur la découverte réelle est difficile à mesurer. Comment savoir si l'IA a vraiment contribué à une avancée scientifique, ou si elle a simplement accéléré l'exécution d'une idée qui venait du chercheur ?
La réponse est nuancée : oui, ça va plus vite ; non, ça ne remplace pas le cerveau du chercheur. Le workflow est un outil, pas un substitut. La responsabilité de la conception de l'expérience, de l'interprétation des résultats, de la validation des hypothèses reste humaine.
Des entretiens avec des chercheurs qui éclairent les attentes réelles
L'article arXiv inclut des entretiens avec des chercheurs et ingénieurs en sciences quantiques. Les résultats sont instructifs : les scientifiques attendent de l'IA qu'elle les aide sur les tâches répétitives, pas qu'elle prenne des décisions à leur place. Ils veulent un outil qui augmente leur travail, pas un oracle qui le remplace. Claude Science semble aligné sur cette attente, mais la prudence reste de mise.
Conclusion : une révolution silencieuse du « comment » plutôt qu'une guerre des « qui » ?
Revenons au pari initial d'Anthropic. En ne jouant pas la carte du modèle ultime, l'entreprise fait le pari que la science a davantage besoin d'outils fiables pour le quotidien que de prouesses théoriques. Ce faisant, elle cible l'adoption pragmatique là où Google vise le saut technologique.
Pour les étudiants et jeunes chercheurs, Claude Science promet de réduire la charge mentale des tâches répétitives. Plus besoin de passer des heures à formater des données ou à vérifier du code. L'IA s'en charge, et le chercheur peut se concentrer sur ce qui compte vraiment : la réflexion, la créativité, l'intuition.
La vraie question pour l'avenir n'est pas « qui a le meilleur modèle ? », mais « quel outil rendra la recherche plus rapide, plus solide et plus accessible sans en trahir l'intégrité ? ». La prudence reste de mise. L'audit des artefacts, la lutte contre les biais, l'équité d'accès entre disciplines sont des défis qui ne disparaîtront pas avec un simple workflow.
Mais le pari d'Anthropic est intéressant : plutôt que de promettre une IA qui pense à la place du chercheur, elle promet une IA qui travaille avec le chercheur. C'est peut-être la voie la plus réaliste pour une adoption massive de l'IA dans les laboratoires. La science a besoin d'outils, pas d'oracles.