Question 1

Dans quels cas d’usage un modèle de langage peut-il réellement améliorer l'efficacité des administrations communales ou départementales ?

Accepted Answer

Un modèle de langage apporte une réelle valeur ajoutée dans les situations où le volume de texte devient un frein au traitement rapide de l’information.
Face à des projets complexes – revitalisation d’un quartier, gestion fine des aides sociales, évolution des flux de transport – il absorbe des corpus hétérogènes : comptes rendus de réunions, rapports techniques, textes réglementaires, données d’enquête, voire contributions citoyennes. Là où les services peinent à tout recouper, le LLM synthétise, reformule, met en tension les éléments. Il aide à formuler un diagnostic nuancé, propose des formulations adaptées à différents publics (habitants, partenaires, élus), et soutient la rédaction de documents stratégiques ou opérationnels. En matière de planification, il anticipe les effets d’une décision en s’appuyant sur des cas comparables.

Question 2

L’utilisation d’un modèle de langage (LLM) dans une collectivité territoriale est-elle compatible avec le RGPD et la protection des données personnelles ?

Accepted Answer

Oui.
Néanmoins, dès qu’un outil traite des données personnelles, le cadre juridique s’applique. Il faut donc vérifier où vont les données, qui y accède, et dans quelles conditions elles sont conservées.
Si le modèle de langage repose sur un hébergement hors de l’Union européenne, la collectivité doit s’assurer que le niveau de protection des données personnelles reste équivalent à celui exigé par le RGPD. Cette garantie passe souvent par des clauses contractuelles encadrées avec le responsable du traitement des données, ou par un transfert vers un pays reconnu comme adéquat par la Commission européenne. À défaut, le recours à l’outil peut être jugé non conforme.
En cas de traitement de données à risque (par exemple, sur les sujets sociaux ou de santé), la collectivité doit réaliser une analyse d’impact (AIPD) avant la mise en service de l’outil.
Enfin, tout traitement automatisé de données personnelles nécessite une information claire des usagers.

Question 3

Quels sont les risques concrets liés à l’intégration d’un LLM dans les services publics locaux ?

Accepted Answer

Le premier risque concerne la fiabilité des contenus générés par le LLM. Un modèle de langage produit parfois des informations inexactes, voire totalement erronées, sans vous indiquer son incertitude. Une réponse erronée transmise à un usager peut entraîner un malentendu, un retard de procédure ou une perte de droits.
Un second risque tient à la responsabilité administrative. Si une réponse formulée par un LLM influence une décision ou oriente l’action d’un agent, la collectivité demeure responsable. Or, l’imprécision d’un contenu généré, ou sa mauvaise interprétation, peut exposer la collectivité à un contentieux.
Enfin, les biais présents dans les corpus d’entraînement peuvent affecter la neutralité des réponses, ce qui soulève des enjeux d’équité. Un modèle reproduit les déséquilibres contenus dans ses données sources, ce qui peut poser problème dans des services liés à l’insertion, à l’éducation ou à l’accès aux droits. Afin de limiter ces risques, la collectivité doit conserver un contrôle humain sur les décisions, documenter les usages de l’outil LLM et former les agents à sa supervision.

Question 4

Quels sont les principaux LLM?

Accepted Answer

Les principaux LLM (Large Language Models) sont actuellement GPT-4 et les modèles de la série GPT d’OpenAI, Claude 3 d’Anthropic, Llama 3 de Meta, Mistral de Mistral AI, Bloom de BigScience, ainsi que des modèles de Google comme Gemini et d’autres tels que BERT et T5 pour des usages spécifiques.

Question 5

Quels sont les LLM français?

Accepted Answer

Les principaux LLM francophones ou adaptés au français incluent plusieurs modèles souverains, open source ou optimisés pour les usages francophones, souvent développés par des équipes françaises ou européennes.

CroissantLLM : développé par le laboratoire MICS de CentraleSupélec et Illuin Technology, ce modèle vise une performance optimale en français, avec une transparence élevée et une architecture basée sur Llama de Meta. CroissantLLMChat est sa version fine-tunée pour les tâches conversationnelles et la compréhension du français.
Mistral 8x7B / Mistral Large : créé par la startup française Mistral AI, ces LLM open source sont conçus pour la précision, la rapidité et une large gamme d'applications industrielles, avec une orientation souveraineté européenne.
Bloom : lancé par le projet BigScience (INRIA + consortium international), ce modèle open source multilingue a été entraîné sur un large corpus francophone et peut générer du texte en français avec une forte qualité. Le modèle fait référence dans la communauté scientifique

LLM

Qu'est-ce qu'un LLM (large language model)?

Définition technique : comment fonctionnent les grands modèles de langage?

Impacts juridiques et réglementaires liés aux Large language model

Questions fréquemment associées à LLM

Grand modèle de langage

Token (ou jeton)

Tokenisation

Inférence

MCP (Model Context Protocol)

RAG (Retrieval-Augmented Generation)

IA agentique

Agent IA

À la métropole Aix-Marseille-Provence (13), un callbot à l’oeuvre pour le ramassage des encombrants

IA générative pour la recherche d'informations à la Métropole Rouen Normandie (76)

Territoires intelligents et durables & réplicabilité : entretien avec Barbara Cuffini-Valero

Vous souhaitez en savoir plus sur le numérique et l'IA ?

Votre avis nous intéresse

Si vous acceptez d'être recontacté au sujet de ce commentaire, merci de préciser votre email (politique de confidentialité)

Définitions