Cas d’usage

L’Intelligence Artificielle pour la supervision thérapeutique

Il y a mille et une façons d’envisager la manière dont l’intelligence artificielle peut contribuer à accompagner les psys dans leurs suivis thérapeutiques et les aider à faire face à leurs difficultés.

Illustration : un thérapeute en séance assisté par une IA qui analyse les échanges, avec des symboles d'observation et de progression

Il va sans dire que cela pose des myriades de questions éthiques, juridiques, pratiques et qu’il est impératif que tout le monde se saisisse des enjeux. Quoi de mieux pour peser justement les enjeux concrets que de tester sur des données fictives ?

💎 Les enregistrements de séance : une mine d’or

Depuis la crise du COVID-19, de très nombreux psys pratiquent les séances en distanciel, ce qui facilite notamment l’enregistrement des séances à des fins thérapeutiques (c’est très éclairant pour les patients de revoir la vidéo avant la séance suivante).

Ces enregistrements sont des mines d’or d’informations dont une grande partie nous échappe de par notre capacité d’attention limitée et par manque de temps pour revoir nous-mêmes les séances.

🎯 Choisir un modèle d’IA avec les bonnes capacités

La première difficulté consiste à trouver un modèle d’IA qui dispose des capacités requises pour nous aider.

1. La taille de la fenêtre de contexte

En premier lieu, ce modèle doit disposer d’une fenêtre de contexte suffisamment longue pour garder en mémoire l’intégralité du texte retranscrit ainsi que les questions que nous allons lui poser, et les réponses qu’il va formuler au cours de la conversation.

En pratique : Le texte d’une séance typique de TCC varie entre 10 000 et 15 000 tokens. Au début de 2024, de nombreux modèles gratuits avaient une taille de contexte inférieure à 10 000 tokens — trop petit pour analyser une séance complète.

2. Les capacités multimodales

À la base, les IA connues comme ChatGPT ou Claude sont des Large Language Models (LLM), c’est-à-dire des IA de plusieurs dizaines de milliards de neurones artificiels entraînées sur de vastes quantités de texte.

À présent, de plus en plus d’IA sont également entraînées sur des images, de l’audio, des vidéos en plus du texte et offrent ainsi des capacités multimodales. Cela peut être très précieux dans le cadre d’une thérapie pour analyser le non verbal et voir les concordances ou discordances entre ce que la personne dit et ce que son corps dit.

Attention : La taille de la fenêtre de contexte devient encore plus cruciale dès qu’elle doit traiter des données telles que de l’audio ou de la vidéo, modalités très gourmandes en données.

3. La qualité des inférences (raisonnement)

Évidemment, il nous faut également une IA en mesure d’effectuer des raisonnements de qualité (le terme informatique est inférence). De nombreux facteurs influent sur la capacité de raisonnement d’une IA :

Sa structure interne (la constitution du réseau de neurones artificiels)
Le temps alloué au processus de réflexion, souvent limité pour des questions d’économies de ressources

Concrètement : Une IA qu’on laisse “réfléchir” (calculer) pendant une minute donnera de meilleurs résultats que la même IA forcée à répondre en 30 secondes (comme pour les psys…).

4. L’accès à la température

La température est un paramètre technique qui influe sur la manière dont une IA générative va opérer son choix parmi les tokens qui lui semblent les plus probables pour une réponse adéquate.

Température basse

Sélectionne toujours le token le plus probable. Préférable pour des approches plus scientifiques et analytiques.

Température haute

Sélectionne d’autres tokens moins probables, donnant des réponses plus créatives. Pertinent pour du brainstorming.

La plupart des interfaces grand public ne donnent pas accès à ce paramètre.

5. Le coût

D’une IA à l’autre, les coûts ne sont pas calculés de la même façon et l’analyse d’une séance peut avoir un coût variant de 0 à quelques dizaines d’euros selon le modèle choisi et le modèle économique de la société éditrice.

Certaines facturent un abonnement et limitent le nombre de questions par heure
D’autres facturent au token de texte soumis et au token généré
Le coût peut varier selon l’interface grand public ou une API destinée aux logiciels tiers

Tendance : Il y a de plus en plus de modèles d’IA open source qui peuvent fonctionner directement sur nos équipements individuels. Le coût devrait donc devenir marginal à terme.

6. IA généraliste ou IA spécialisée ?

Bien qu’on en soit encore aux balbutiements, il existe déjà des modèles d’IA spécialisées dans le champ médical (comme Med-Gemini) et celles-ci offrent déjà des résultats supérieurs à la plupart des professionnels de santé sur certaines tâches.

Ces modèles ne sont toutefois pas accessibles au tout venant et sont en phase de test intensif auprès de professionnels choisis. Les IA généralistes, pour peu que l’on sache les utiliser correctement en leur donnant le bon contexte et les bons prompts, sont néanmoins déjà très performantes.

Voir les différences en pratique

Pour illustrer concrètement ces différences entre modèles, nous avons créé un benchmark comparatif : la même séance de TCC analysée par 3 LLMs différents, avec 43 questions d’analyse clinique.

Explorer le benchmark