Veille IA

Le Modèle APA : un cadre pour évaluer les apps de santé mentale

Plus de 10 000 apps de santé mentale sur les stores, mais seulement 15% avec des preuves cliniques. Le modèle APA propose un cadre en 5 niveaux pour aider les cliniciens à s'y retrouver.

Plus de 10 000 applications de santé mentale sont disponibles sur les stores. Seulement 15% disposent de preuves cliniques, et 44% partagent des données utilisateur avec des tiers. Face à ce far-west numérique, comment un psychologue clinicien peut-il recommander — ou déconseiller — une app à un patient en toute responsabilité ?

L’American Psychological Association (APA), via les travaux de John Torous et son équipe au Beth Israel Deaconess Medical Center (Harvard), a développé un modèle d’évaluation hiérarchique en 5 niveaux. Pas un label de certification, mais un outil de décision partagée entre clinicien et patient.


Les 5 niveaux du modèle

Le modèle fonctionne comme un entonnoir : chaque niveau filtre les apps qui ne répondent pas à des critères essentiels. Inutile de vérifier l’efficacité clinique d’une app (niveau 3) si elle ne protège pas les données de vos patients (niveau 2).

1

Accessibilité et contexte

On vérifie ici les basiques : coût, plateformes supportées (iOS, Android), langue, fonctionnement hors-ligne. Mais aussi le contexte de développement : qui a créé l’app ? Institution académique ou startup en levée de fonds ? Modèle économique transparent ?

Point critique :

C’est aussi à ce niveau qu’on évalue la gestion de crise : que se passe-t-il si un utilisateur exprime des idées suicidaires ? De nombreuses apps populaires ne proposent aucun protocole d’urgence.

2

Vie privée et sécurité des données

Le niveau le plus discriminant. Les données sont-elles chiffrées ? Partagées avec des tiers ? L’utilisateur peut-il les supprimer ? En Europe, la conformité RGPD ajoute une couche d’exigence supplémentaire par rapport au cadre américain (HIPAA).

Chiffre clé :

81% des apps de santé mentale populaires n’avaient pas de politique de confidentialité adéquate (étude 2019). Replika a été interdite en Italie en 2023 pour collecte de données insuffisamment encadrée — un cas d’école.

3

Preuves cliniques

L’app repose-t-elle sur des données scientifiques ? Le modèle propose une hiérarchie : essais contrôlés randomisés (RCT) > études de cohorte > études pilotes > avis d’experts.

Exemples concrets :

Woebot dispose de plusieurs études publiées sur la réduction des symptômes dépressifs. Headspace a été évalué sur la réduction du stress. À l’inverse, la majorité des apps de “bien-être mental” n’ont aucune publication à leur actif.

4

Engagement et utilisabilité

Une app cliniquement validée mais inutilisable ne sert à personne. On évalue ici le design, la personnalisation, les notifications, le taux de rétention.

Attention :

Certaines apps maximisent l’engagement par des mécanismes empruntés aux réseaux sociaux (gamification, streaks, notifications push). Quand l’engagement cesse de servir le soin et commence à créer de la dépendance, la frontière éthique est franchie.

5

Interopérabilité et intégration

Le niveau le plus ambitieux : l’app peut-elle s’intégrer dans un parcours de soin ? Exporter des données vers un dossier patient ? Permettre un partage sécurisé avec le thérapeute ?

En pratique :

Très peu d’apps atteignent ce niveau. La plateforme open-source mindLAMP (Harvard) est l’une des rares à proposer une architecture interopérable conçue pour la pratique clinique.


Guide pratique : les questions à se poser

Avant de recommander une app à un patient — ou d’en évaluer une qu’il utilise déjà — voici les questions essentielles, niveau par niveau :

1Accessibilité
  • Qui a développé cette app ? Une institution, une startup, un acteur inconnu ?
  • Le modèle économique est-il transparent (gratuit, freemium, abonnement) ?
  • Que se passe-t-il en cas de crise ? Y a-t-il un protocole d’urgence ?
2Vie privée
  • Les données sont-elles chiffrées et stockées en Europe ?
  • Sont-elles partagées avec des tiers (publicitaires, assureurs) ?
  • Le patient peut-il supprimer ses données à tout moment ?
3Preuves cliniques
  • Existe-t-il des publications scientifiques indépendantes ?
  • S’agit-il de RCT, d’études pilotes ou de simples témoignages ?
  • Les résultats ont-ils été répliqués par d’autres équipes ?
4Engagement
  • L’app utilise-t-elle des mécanismes de rétention (gamification, streaks) ?
  • Le patient peut-il l’utiliser sans devenir dépendant de l’app ?
  • Le design sert-il le soin ou l’engagement commercial ?
5Intégration
  • L’app permet-elle un partage de données avec le thérapeute ?
  • Peut-elle s’intégrer dans un parcours de soin existant ?
  • Les données sont-elles exportables dans un format standard ?

Pour une évaluation plus approfondie, l’APA met à disposition la base MIND (105 questions structurées) et un screener rapide en 8 questions utilisable en consultation.


Les limites du modèle

Le modèle APA constitue une avancée précieuse, mais il n’est pas exempt de points aveugles :

  • Pas de dimension relationnelle : le modèle évalue l’app comme un objet technique isolé. Or, ce qui se joue entre un patient et une app de soutien émotionnel relève aussi de la dynamique relationnelle — et c’est précisément notre expertise de cliniciens.

  • Antérieur à l’explosion des LLM : conçu avant la vague des IA génératives, le modèle n’intègre pas les enjeux spécifiques de ces technologies (hallucinations, variabilité des réponses, opacité). Comment évaluer une app dont le comportement est probabiliste et change à chaque interaction ?

  • Biais géoculturel : centré sur le contexte américain, le modèle ne prend pas en compte les spécificités européennes (RGPD, systèmes de santé publique, pluralité linguistique).

  • Évaluation volontaire : contrairement au marquage CE médical européen ou au système DiGA allemand, le modèle APA n’a aucun caractère contraignant. Il repose sur la bonne volonté des développeurs et la vigilance des cliniciens.


Notre position

Ce modèle est, à notre connaissance, le cadre le plus abouti pour aider un clinicien à évaluer une app de santé mentale. Sa logique hiérarchique — ne pas aller plus loin si les bases ne sont pas solides — est simple et opérationnelle.

Mais il faut le voir pour ce qu’il est : un outil de questionnement, pas un certificat de conformité. Le fait qu’une app “passe” les 5 niveaux ne garantit pas qu’elle convient à ce patient, dans ce contexte thérapeutique, à ce moment de son parcours. C’est là que le jugement clinique reprend ses droits.

Nous avions déjà évoqué les recommandations éthiques de l’APA pour l’usage de l’IA en pratique dans un précédent article. Le modèle d’évaluation des apps en est le complément naturel : là où le guide éthique pose les principes, le modèle propose une méthode.


Source principale : Torous, J. et al. — American Psychiatric Association App Evaluation Model, base MIND. Voir aussi notre fiche concept Phénotypage numérique et Évaluation écologique momentanée, deux approches que ce modèle permet d’évaluer concrètement.

Mots-clés

APA apps santé mentale évaluation éthique guide pratique