🧪 Benchmark : Analyse de séance TCC par IA

Comparaison des réponses de 3 modèles d'IA sur 43 questions d'analyse clinique

👤
Cas clinique
Julie Dupont
Première consultation
🤖
Modèles comparés
3 LLMs
Gemini, GPT-4o, Claude
Questions
43
8 catégories

Pourquoi comparer les modeles ?

Tous les LLM ne se valent pas pour l'analyse clinique. Voici les criteres cles a considerer.

📏

Fenetre de contexte

Une seance TCC = 10-15k tokens. Le modele doit pouvoir traiter l'integralite.

🧠

Qualite du raisonnement

Le temps d'inference et l'architecture impactent la nuance des analyses.

🎛️

Parametres accessibles

La temperature permet d'ajuster creativite vs rigueur analytique.

💰

Cout et accessibilite

De gratuit a plusieurs euros par analyse selon le modele et le mode d'acces.

Modèles comparés

Google
Gemini 1.5 Pro
Context window : 1M tokens
OpenAI
GPT-4o
Context window : 128k tokens
Anthropic
Claude 3.5 Sonnet
Context window : 200k tokens