Qui n’a pas encore entendu parler d’IA (intelligence artificielle) et de data mining (exploitation des bases de données) aujourd’hui ? Certains sont d’ailleurs nombreux à s’interroger sur le développement du data mining et plus particulièrement de son déploiement au sein des services de programmation ou de contrôle de l’administration fiscale (DGFip).
Est-ce qu’aujourd’hui, si on publie quelque chose sur le net, l’information est automatiquement récupérée par les services fiscaux ? Qui programme les contrôles fiscaux ? Sommes-nous face à Big Brother ?
Le constat
Si on fait un rapide état des lieux aujourd’hui, on peut constater que la DGFip dispose régulièrement de nouveaux outils qui ont été validés via un processus législatif (au fil des différentes lois de finances) et dont l’utilisation va encore monter en puissance dans les prochaines années.
À la lecture du rapport d’activité de la DGFip diffusé en mai dernier, on peut déjà constater qu’en 2022, il avait été fixé un objectif de 50 % de programmation des contrôles fiscaux à partir de l’utilisation de l’intelligence artificielle pour optimiser le data mining. Au final, cet objectif a été dépassé pour arriver à 52,36 %.
On peut rappeler que les montants mis en recouvrement suite à un contrôle fiscal ont atteint un niveau record en 2022, avec un total de 14,6 milliards d’euros, soit une progression de 8,2 % et d’1,2 milliard de plus qu’en 2021. Cette forte amélioration est donc en grande partie issue du recours au data mining, optimisé avec l’utilisation de l’intelligence artificielle.
Ce développement est issu en partie du projet intitulé Pilat (pilotage et analyse du contrôle), qui a démarré en 2017 et notamment financé par le Fonds de transformation de l’action publique à hauteur de 5 millions d’euros pour améliorer le ciblage des opérations de contrôle fiscal. Ce projet est piloté par le bureau au nom obscur de sous-direction SJCF 1 (service de la sécurité juridique et du contrôle fiscal).
Les objectifs
Ainsi, celui-ci vise à transformer le système d’information relatif à la chaîne du contrôle fiscal, en recherchant à améliorer tous les bénéfices réalisés dans le cadre d’un autre projet intitulé CFVR (Ciblage de la fraude et valorisation des requêtes). Ce projet CFVR a été initié en 2014 avec la mise en place des dispositifs d’analyse de masse de type « big data ».
Pilat doit permettre aujourd’hui un suivi de bout en bout des dossiers du contrôle fiscal depuis la programmation jusqu’au recouvrement et au contentieux sans ruptures, le tout étant assorti d’un outil de pilotage centralisé pour les responsables supérieurs. Les agents de la DGFiP disposent d’outils de « data visualisation » ouverts sur l’ensemble des données collectées par l’administration avec une pré-analyse du CFVR.
Au final, avec l’intelligence artificielle où le système apprend constamment, la DGFiP tente de repérer des profils de fraude en analysant et en recoupant, par le biais d’algorithmes, toutes les informations dont elle dispose, et ainsi établir des listes de contribuables à contrôler.
Avec l’IA, on met en œuvre des techniques d’apprentissage automatique qui ont pour but d’identifier, par des méthodes statistiques ou mathématiques, les critères caractérisant une « personne fraudeuse » et établir ainsi un profil de fraude qui sera appliqué à une population cible.
Quelles données ?
Au départ, ces recoupements ne pouvaient porter que sur des données issues de fichiers de la DGFip ou d’autres administrations françaises ou étrangères, voire de bases de données privées.
Depuis 2021, la DGFip peut effectuer des traitements informatisés et automatisés permettant la collecte et l’exploitation de données rendues publiques sur les sites internet des opérateurs de plateforme en ligne.
Tous les réseaux sociaux sont concernés, qu’ils soient utilisés à des fins professionnelles ou non. Aujourd’hui, elle peut pratiquer le web scraping, c’est-à-dire qu’elle peut extraire automatiquement le contenu de sites web, pour obtenir des données structurées et facilement exploitables.
L’application Galaxie
La DGFip continue de développer de nouveaux outils comme l’application intitulée Galaxie, qui consiste en un traitement informatisé et automatisé de données à caractère personnel depuis avril 2022, après avoir eu le feu vert de la Commission nationale de l’informatique et des libertés (Cnil).
Galaxie est un véritable outil de visualisation, d’une part, des liens existant entre des entités professionnelles (liens de participation), et entre des entités professionnelles et des personnes physiques (liens de dirigeant, d’associé ou d’actionnaire), et d’autre part, des éléments de contexte sur la situation patrimoniale et fiscale de ces personnes.
Pour les entreprises, il s’agira par exemple des données de remboursements de crédit de TVA, aux procédures collectives, aux honoraires versés, téléphone, adresse électronique, indicateur personnes sensibles, données relatives au civisme fiscal, service gestionnaire du dossier fiscal, données relatives au compte bancaire, aux liens de dirigeants et d’associés…
Pour les personnes physiques, il s’agit des données relatives aux indicateurs personnes sensibles, service gestionnaire du dossier fiscal, et aux liens de dirigeants et d’associés.
Cet outil est utilisé par des agents habilités, pour mener des opérations de recherche, d’enquête, de programmation, de contrôle et de recouvrement de manquements fiscaux, de détection de schémas de fraude fiscale.
On a assisté à un véritable décloisonnement des informations qui les rendent exploitables par les services de contrôle.
Le projet Foncier innovant
Plus récemment, avec le projet Foncier innovant (coût 24 millions d’euros), la DGFip a eu recours à l’intelligence artificielle pour exploiter des données à partir des prises de vues aériennes de l’Institut national de l’information géographique et forestière (IGN) pour détecter les constructions ou aménagements non déclarés comme les piscines.
Les résultats sur les neuf départements testés on fait ressortir un gain estimé à 40 millions d’euros en 2023 au niveau national.
De nombreuses demandes automatiques de renseignements ou de précisions ont été adressées à différentes sociétés ou contribuables par les services de programmation de la DGFip à partir de ces dispositifs d’intelligence artificielle. Toutes ne débouchent pas systématiquement sur la réalisation de contrôles car parfois, après un simple échange téléphonique ou une réponse envoyée par mail, il a pu être constaté que ce sont les informations saisies à la base qui peuvent être obsolètes ou erronées.
En effet, il est important que l’information initiale soit fiabilisée car après, c’est toute la chaîne qui peut être impactée et déboucher sur des anomalies qu’on pourrait qualifier « d’imaginaires ».
Il semble que c’est également ce travail de mise à jour des bases de la DGFip qui est en train de se réaliser aujourd’hui avec l’IA.
Force est de constater que la DGFip gagne en efficience avec ces outils et que les contrôles sont de plus en plus ciblés car nous sommes plus observés, tout en étant rassurés de l’existence d’un garde-fou pour la protection de nos données avec la Cnil. Ce ciblage renforce également le caractère dissuasif du contrôle fiscal.
Mais il faut garder en mémoire, qu’en cas de contrôle, il y a toujours des garanties pour la personne vérifiée et qu’il est important de se faire assister par un conseil qui saura vous épauler car derrière l’intelligence artificielle, il y a toujours l’humain et celui-ci n’est pas infaillible.
Par Me Sophie Colomb, avocate au Barreau de Grenoble.