Retour au blog
intelligence artificiellemédecine vétérinaireLLMdiagnosticHelloRolly

L'intelligence artificielle et le monde médical

Cela fait 10 ans que l'IA remodèle silencieusement le monde médical. Tour d'horizon des études marquantes, de la dermatologie humaine à l'ophtalmologie vétérinaire, et ce que cela implique concrètement pour les praticiens.

11 mai 20268 minVictor Mignon
L'intelligence artificielle et le monde médical

L'intelligence artificielle nous permet aujourd'hui de réaliser des choses encore inimaginables il y a quelques années.

Erreur.

Cela fait 10 ans qu'elle remodèle silencieusement le monde médical.

Dix ans d'IA dans le monde médical

Médecine humaineMédecine vétérinaire
2017

Esteva et al. · Nature

Un réseau neuronal rivalise avec 21 dermatologistes sur 130 000 cas

2018

Babylon AI · preprint

Triage aussi précis que l'humain — IA plus prudente dans ses recommandations

2024

Cabral et al. · JAMA Internal Medicine

IA aussi efficace que les internes et résidents en raisonnement clinique

2023–24

Abani & Coleman · Frontiers / JAVMA

Premiers cas cliniques et examens vétérinaires — GPT-4 atteint 77 %

2025

Qazi et al. · Nature Health

Avec formation IA : +27,5 pp de diagnostic (71,4 % vs 42,6 %)

2025

Okur & Ndiaye · Vet. Ophthalmol. / Frontiers

GPT-4.5 à 90 % en ophtalmologie · IA rivalise le meilleur radiologue

En 2017, une étude [1] publiée dans Nature montrait déjà un réseau neuronal convolutif (CNN en anglais) capable de rivaliser avec des dermatologistes dans l'identification et la classification de cancers de la peau. Entraîné sur presque 130 000 cas avec images, il reconnaît avec autant de succès que 21 experts des kératinocyte carcinomas (cancer le plus commun) et des mélanomes malins (cancer le plus mortel).

En 2018, était [2] publiée une étude comparant les qualités de triage (capacité à identifier et trier les urgences dans le milieu médical) entre l'humain et l'intelligence artificielle. Globalement, la précision est comparable, mais une nuance est relevée : l'intelligence artificielle semble plus sûre, elle prend moins de risques dans ses recommandations.

Six années plus tard, une étude comparait [3] les aptitudes d'internes et de résidents (docteurs encore dans leur parcours de formation) avec GPT-4 (OpenAI). Les résultats, évidents aujourd'hui, confirmaient que l'IA était tout aussi efficace si ce n'est parfois meilleure sur du raisonnement clinique, et pas simplement à répondre à des quizz institutionnels. Seule limite ? l'intégration en clinique. On ne sait pas comment l'intelligence artificielle se débrouillerait en conditions réelles.

La formation : la variable qui change tout

La question qui suit est logique : si l'IA devient aussi performante, peut-elle nous aider en clinique ? En 2024, l'aide de GPT-4 dans le raisonnement clinique reste marginale [4] (score médian de raisonnement clinique de 76,3 % pour le groupe aidé par GPT-4 contre 73,7 % pour le groupe ayant uniquement accès aux ressources conventionnelles). Mais en 2025, on identifie une variable qui change tout, une formation à l'IA avant de l'utiliser. C'est ce qui a été observé dans cette nouvelle étude publiée dans Nature [5] : les médecins ayant accès au LLM atteignent un score moyen de raisonnement diagnostique de 71,4 % contre 42,6 % pour le groupe avec ressources conventionnelles uniquement.

Sans IAAvec IA
0 %25 %50 %75 %100 %73.7 %76.3 %Goh 2024Sans formation préalableÉcart : +2,6 pp42.6 %71.4 %Qazi 2025Avec 20h de formation IAÉcart : +28,8 pp

IA et médecin : complémentaires, pas adversaires

On pouvait se prévaloir de rivaliser avec l'intelligence artificielle, ce n'est plus le cas. Mais pourquoi voir le négatif ? Plaçons-nous en tant que patient. Que choisir entre médecin seul et un médecin plus efficace et meilleur à diagnostiquer lorsqu'il s'agit de notre santé ? Il ne s'agit plus de se moquer de son docteur lorsqu'il demande de l'aide à GPT mais plutôt de l'encourager, car nous aurons davantage de chances d'avoir un diagnostic juste. Il serait d'ailleurs étonnant qu'un label « AI certified » ne soit pas créé, comme gage de qualité et d'efficacité supplémentaire dans les prochaines années. Parce qu'au fond la question, pour nous qui travaillons dans le médical, ce n'est pas comment puis-je devenir un meilleur médecin, mais plutôt comment puis-je soigner au mieux mon patient ? Et en toute pureté de la pratique médicale, l'égo est à bannir.


Et en médecine vétérinaire ?

Mais alors dans le milieu vétérinaire, où en sommes-nous ? On navigue avec quelques années de retard, c'est certain, mais pourquoi ? C'est là la question.

Tout d'abord, les études sont plus rares, en 2024 [6] on compare encore des LLMs aux vétérinaires sur des questions de cours (d'ailleurs point pour l'humanité qui dégage de meilleurs résultats aux examens cette fois-ci, mais ça ne dure pas et en 2025 [7], les nouveaux modèles explosent leur score de l'année d'avant). Les études comparatives entre l'humain, l'humain et l'intelligence artificielle seule sont également faibles mais néanmoins prometteuses. Il y a 3 ans, GPT 3.5, bien que non entraîné dans le domaine vétérinaire, testé sur des cas complexes, semblait apporter une réelle aide et notamment dans cette publication [8] où GPT était mis à l'épreuve du cas d'un chien qui s'évanouit. Puis tout récemment, GPT est testé en ophtalmologie vétérinaire sur une série de 60 cas félins [9]. Les résultats sont intéressants, là où GPT reste moins bon que le spécialiste, il est bien meilleur que les novices en ophtalmologie.

SpécialistesModèles IA (GPT)Novices
Expert 196.7 %GPT-4.590 %Expert 283.3 %GPT-4o83.3 %Novice 166.7 %Novice 256.7 %25 %50 %75 %Source : Okur et al., Veterinary Ophthalmology, 2025 — 60 cas félins standardisés

En radiologie [10], les résultats sont similaires, et l'intelligence artificielle semble aussi bonne que le meilleur des radiologistes et meilleure que le radiologiste moyen.

Des études prometteuses, mais encore à consolider

Le problème ? La solidité de ces études. Pas toujours de vérifications objectives des résultats, des méthodes employées, ou manque de sujets et les auteurs en sont conscients.

Alors qu'en faisons-nous ? En tant que vétérinaires, nous avons cette chance de soigner des patients aussi complexes que variés (l'un imagine bien à quel point un gecko est différent d'une chèvre ou d'un chat) mais c'est aussi toute la difficulté du métier. GPT et les autres modèles de langage sont d'ailleurs aussi en difficulté face à tout cela. Pourtant il paraît clair à mes yeux que ce n'est qu'une question de temps avant qu'ils en soient capables. Les études, bien que rares, semblent déjà montrer les avantages que pourrait apporter l'intelligence artificielle au vétérinaire généraliste (en comparaison des spécialistes au sommet de leur art, encore indétrônables). Et s'il ne s'agit pas encore de raisonner sur des cas complexes, il s'agit d'aider, en parcourant toute la littérature scientifique disponible, en élargissant les diagnostics différentiels, en aidant à la rédaction des rapports ou même simplement en réduisant le temps administratif.


HelloRolly dans tout ça

Et HelloRolly dans tout ça ? De nombreux logiciels et applications existent déjà sur le marché et participent à cette transformation du milieu vétérinaire mais c'est encore léger. Le monde de la technologie semble avoir du mal à s'adapter ou à être accepté par ces amoureux de la nature et des animaux. C'est exactement là où nous avons voulu positionner HelloRolly : non pas comme une promesse technologique, mais comme un outil de terrain conçu pour soutenir les vétérinaires sans les remplacer, ceux-ci restant encore bien plus aptes à s'adapter aux conditions et à la variabilité de leurs patients comme les études le montrent encore.

La vision de HelloRolly, c'est de revoir la conception même des logiciels vétérinaires et ne plus s'appuyer sur les fondations de technologies périmées depuis 10 ans. C'est d'ouvrir la porte à une nouvelle pratique de la médecine en accueillant l'intelligence artificielle nativement. En l'utilisant au mieux pour qu'elle nous aide de sa pleine capacité, en rédigeant nos rapports ou en nous aidant dans notre communication avec les clients. En ne nous donnant pas le diagnostic de nos animaux mais en nous aidant à établir un diagnostic différentiel ou en cherchant pour nous les dernières avancées en matière de traitement sans avoir à chercher sur tout Google ou à perdre du temps à réécrire toutes les informations de notre patient dans un GPT mal entraîné ou mal calibré.

HelloRolly, c'est la vision d'un outil adaptatif et complet à la hauteur de cette nouvelle ère de l'intelligence artificielle.


Victor Mignon est vétérinaire urgentiste actif en Suisse romande et co-fondateur de HelloRolly.


Références

  1. Esteva A. et al. Dermatologist-level classification of skin cancer with deep neural networks. Nature 542, 115–118 (2017). DOI: 10.1038/nature21056

  2. A comparative study of artificial intelligence and human doctors for the purpose of triage and diagnosis. ResearchGate (2018). Lien

  3. Cabral S. et al. Clinical Reasoning of a Generative Artificial Intelligence Model Compared With Physicians. JAMA Internal Medicine 184, 581–583 (2024). DOI: 10.1001/JAMAINTERNMED.2024.0295

  4. Goh E. et al. Influence of a Large Language Model on Diagnostic Reasoning: A Randomized Clinical Vignette Study. JAMA Network Open 7, e2437115 (2024). DOI: 10.1001/jamanetworkopen.2024.37115

  5. Qazi I.A. et al. Large language model diagnostic assistance for physicians in a lower-middle-income country: a randomized controlled trial. Nature Health 1, 198–205 (2026). DOI: 10.1038/s44360-025-00007-8

  6. Coleman M.C. & Moore J.N. Two artificial intelligence models underperform on examinations in a veterinary curriculum. J. Am. Vet. Med. Assoc. 262, 692–697 (2024). DOI: 10.2460/JAVMA.23.12.0666

  7. Alonso Sousa S. et al. Performance of large language models on veterinary undergraduate multiple-choice examinations: a comparative evaluation. Frontiers in Veterinary Science 12, 1616566 (2025). DOI: 10.3389/FVETS.2025.1616566

  8. Abani S. et al. Can ChatGPT diagnose my collapsing dog? Frontiers in Veterinary Science 10, 1245168 (2023). DOI: 10.3389/fvets.2023.1245168

  9. Okur S. et al. Comparison of Diagnostic Performance Between Large Language Models and Veterinary Evaluators in Feline Ocular Diseases. Veterinary Ophthalmology 29, e70052 (2026). DOI: 10.1111/VOP.70052

  10. Ndiaye Y.S. et al. Comparison of radiological interpretation made by veterinary radiologists and state-of-the-art commercial AI software for canine and feline radiographic studies. Frontiers in Veterinary Science 12, 1502790 (2025). DOI: 10.3389/FVETS.2025.1502790

Envie de voir Rolly en action ?

Réservez une démo gratuite et découvrez comment Rolly peut transformer votre clinique.

Réserver une démo