Une avancée majeure en explicabilité : l'analyse causale des réseaux de neurones à spikes binaires élimine les variables parasites, contrairement aux méthodes d'intelligence artificielle explicable populaires comme SHAP.

Les réseaux de neurones à spikes binaires (BSNN) sont une classe de modèles dont l'activité, basée sur des impulsions tout-ou-rien, reste opaque. Comprendre leurs décisions est pourtant crucial pour leur déploiement en environnements critiques. Une analyse causale récente change la donne en représentant leur activité impulsionnelle sous forme de modèle causal binaire, offrant une transparence sans précédent.

LES ANGLES MORTS DE L'EXPLICABILITÉ ACTUELLE

L'explicabilité en intelligence artificielle souffre d'un mal chronique : les explications produites par les méthodes courantes intègrent souvent des variables sans lien avec la décision. Le recours à des approximations statistiques, comme dans les approches de type SHAP, ne garantit pas que chaque caractéristique mise en avant soit réellement pertinente. L'explication devient alors un bruit de fond, incapable de fournir une véritable compréhension du modèle.

La rupture proposée par les chercheurs consiste à attaquer le problème par la causalité binaire. En formalisant les BSNN comme des modèles causaux, chaque impulsion est interprétée comme un événement binaire dans une chaîne de cause à effet. Cette représentation stricte permet de s'attaquer à la question fondamentale : quels éléments d'entrée sont nécessaires et suffisants pour une classification donnée ?

L'explication idéale ne doit contenir que des caractéristiques pertinentes, aucune superflue.

LA CAUSALITÉ BINAIRE AU CŒUR DU RÉSEAU

Un BSNN communique par spikes, des signaux discrets 0 ou 1. En modélisant ces activations comme un réseau de relations causales binaires, on obtient un système logique dont le comportement peut être interrogé avec les Outils de la vérification formelle. Le modèle causal expose la dépendance exacte entre les pixels d'une image et l'activation d'un neurone de sortie, sans approximation.

Cette approche diffère radicalement des méthodes post-hoc qui analysent les corrélations. Ici, la structure causale est intrinsèque au modèle : elle est dérivée de l'architecture même du BSNN. Ainsi, les explications ne proviennent pas d'une boîte noire supplémentaire, mais d'une traduction directe du fonctionnement du réseau.

Le réseau n'est plus une énigme, il devient un système logique transparent.

SAT ET SMT : LA LOGIQUE AU SERVICE DE L'EXPLICATION

Pour extraire des explications de ce modèle causal, les chercheurs ont exploité des solveurs SAT (satisfaisabilité booléenne) et SMT (satisfaisabilité modulo théories). Ces outils, issus de la vérification logicielle, permettent de trouver automatiquement un ensemble minimal de caractéristiques d'entrée qui justifient une classification donnée, toutes les autres étant exclues. C'est ce que l'on appelle une explication abductive : l'énoncé logique le plus simple qui entraîne la conclusion.

Le gain est double : l'explication est à la fois minimale d'un point de vue formel et garantie sans élément parasite. Là où SHAP peut attribuer une importance résiduelle à un pixel inutile, le solveur SAT démontre son absence de nécessité. La rigueur mathématique exclut tout bruit.

La mise en œuvre ne se limite pas à un concept. Elle a été éprouvée sur la base MNIST, standard incontournable de la vision par ordinateur.

MNIST : LA PREUVE PAR L'IMAGE

Un BSNN a été entraîné sur la base MNIST de chiffres manuscrits. Les solveurs SAT et SMT ont ensuite été appliqués pour identifier, pour chaque classification, les pixels strictement responsables de la décision. Les résultats montrent que l'on peut isoler un petit nombre de pixels qui, en conjonction, induisent la catégorie prédite, tandis que la modification de tout autre pixel ne change pas le verdict.

Cette démonstration empirique confirme que l'approche passe à l'échelle sur des problèmes non triviaux. Elle ouvre la voie à des audits de sécurité, de biais ou de robustesse avec un niveau de certitude inégalé.

SHAP DÉPASSÉE : LA GARANTIE DE PERTINENCE

La comparaison avec SHAP est sans appel. Alors que SHAP génère des scores d'importance incluant inévitablement des pixels non décisifs, l'approche causale garantit que chaque pixel présent dans l'explication est irremplaçable. La différence n'est pas qu'académique : elle a des implications pratiques pour les applications où une explication trompeuse peut coûter cher.

Les travaux en cours étendent ces principes à d'autres architectures d'IA, laissant entrevoir une nouvelle génération d'outils d'explicabilité fondée sur la logique formelle plutôt que sur des heuristiques statistiques. Le message est clair : l'explication d'une décision automatisée ne tolère pas l'approximation.

Sources :
  • arXiv cs.AI

L'indépendance de CLODCO est votre garantie.

Pour que l'actualité de l'IA reste sans filtre et sans concession, votre soutien est indispensable. Votre contribution est le seul moteur de notre liberté éditoriale.

Soutenir CLODCO