Logo de l'OEP

Sélectionnez votre langue

Logo de l'OEP

Dialogue avec l'IA

L’intelligence artificielle est une préoccupation majeure au niveau mondial aujourd’hui, et la question que, au-delà des problématiques scientifiques, l’on est obligé de se poser est : comment exister avec l’intelligence artificielle, comment les cultures du monde vont-elles vivre avec. Le défi est à la fois fascinant, pour certains enthousiasmant, mais aussi inquiétant.

Ce que l’on n’a absolument pas le droit de faire, c’est de critiquer, de contester, de s’opposer sans solution. Ce serait comme s’opposer à la découverte de l’électricité ou d’internet. Il y aura une infinité de réponses et de formes d’adaptation, mais la seule chose qu’il ne faut pas faire, c’est de renoncer en ignorant.

Bon. Il y a un concept vraiment fondamental, c’est celui de la découvrabilité et ce n’est pas un hasard si ce concept est né et a été développé au Québec.

Ce que dit ce concept n’est pas fondamentalement nouveau. Que des œuvres ne soient découvertes qu’après, parfois longtemps après, la disparition de l’auteur, que des œuvres importantes dans l’histoire des civilisations, soient tombées dans l’oubli, pour renaître dans un contexte géopolitique complètement différent, on pense à la redécouverte des œuvres de l’Antiquité grecque entre les 8e et 13e siècles, prélude aux Renaissances italiennes et françaises, ceci n’est pas en soi une découverte.

Toutefois, ce en quoi le concept est spécifique, c’est qu’il est redéfini pour la société numérique dans laquelle nous sommes entrés.

Toute innovation, et particulièrement, toutes les innovations de fracture génèrent des effets asymétriques, que l’économiste, philosophe et historien François Perroux avait appelés dans les années 1950 « effets de domination ». Tels sont les effets de toutes les innovations qui se succèdent par vagues dans la société numérique dont le dernier avatar et peut-être le plus spectaculaire porte le nom d’intelligence artificielle.

Donc dans le monde du numérique, la découvrabilité s’analyse comme l’existence ou la mise en place de processus permettant à des contenus (des savoirs, des œuvres, des informations) d’être trouvés et repérés dans une masse immense d’informations. D’une certaine manière, l’Observatoire européen du plurilinguisme a été créé dans le but de rendre visible des contenus, des activités et des événements qui tournent autour des langues, du plurilinguisme et de la diversité linguistique et culturelle.

La découvrabilité n’est qu’un aspect, important certes, mais qui n’épuise pas une question aussi fondamentale que celle de savoir comment exister individuellement et collectivement dans un monde de sociétés numériques. On a vu ces derniers temps apparaître l’expression de « souveraineté numérique ». La souveraineté n’est pas l’indépendance, surtout pas dans un monde fait d’interdépendances, mais peut s’analyser sous des formes variables comme une « modalité forte de l’interdépendance », concept très important également forgé par François Perroux dont la signification est « intelligible par tous ».

Comme nous sommes immergés dans un monde de technologies numériques, nous devons inscrire notre réflexion sur le plurilinguisme et l’omniprésence des langues dans les relations sociales et internationales, omniprésence de tout temps mais qui doit être questionnée dans le contexte technologique numérique. A cet égard, il faut saluer le magnifique projet MultiLAwa de doctorats européens sur la « conscience plurilingue dans la société numérique européenne », projet porté par Hélène Vinckel-Roisin de l’université de Lorraine et 9 autres universités européennes, et dont l’OEP est partenaire associé. Un appel à candidature pour 14 bourses doctorales vient d’être lancé, avec le 8 juillet pour date limite de réponse.

Dans le même ordre d’idées, on doit également saluer la chaire de recherche sur la découvrabilité des contenus scientifiques en français créé par le Fonds de recherche du Québec et la chaire de l’Unesco sur la science ouverte.

A notre modeste niveau, indépendamment de nombreux facteurs techniques sur lesquels nous n’allons pas nous étendre, une dimension essentielle est d’avoir l’initiative dans le débat des idées, et s’agissant des outils d’IA, la priorité est de s’en servir au service de ses centres d’intérêt, c’est-à-dire d’avoir la main.

A ce titre, nous proposons un petit exercice de comparaison des réponses de deux plateformes, Mistral IA et ChatGPT à une même question.

La question est la suivante : « Exemple : un journaliste dans un reportage [sur une chaîne d’information bien connue » dit : "l'intelligence américaine" ne confirme pas les déclarations de Donald Trump". Comment l'IA traite-t-elle ce propos? »

Avant de confier la parole à Mistral et à ChatGPT, on peut imaginer qu’un auditeur moyen peut se trouver surpris et interpréter la phrase comme « il y a aux États-Unis des gens assez intelligents pour ne pas prendre à la lettre les déclarations de Donald Trump ». Mais l’IA ne se laisse pas surprendre par cet anglicisme insidieux, qui s’insinuant dans un mot parfaitement français et anglais à la fois dont le sens est dévié par le contexte d’énonciation et l’usage qui en est fait par la journaliste. Voici :

I. ChatGPT

« L'expression « l'intelligence américaine » est très probablement une traduction maladroite ou un calque de l'anglais U.S. intelligence.
En anglais, intelligence ne signifie pas seulement « intelligence » au sens de faculté intellectuelle ; dans le vocabulaire politique et militaire, cela désigne aussi le renseignement. Ainsi, U.S. intelligence signifie :

les services de renseignement américains dans leur ensemble ;

ou l'évaluation produite par ces services.

En français, un journaliste dirait normalement :

« Le renseignement américain ne confirme pas les déclarations de Trump » ;

« Les services de renseignement américains ne confirment pas les déclarations de Trump » ;

« La communauté du renseignement américaine ne confirme pas les déclarations de Trump ».

Une IA de traitement du langage essaie généralement de résoudre cette ambiguïté par le contexte. Si le reportage parle de géopolitique, de guerre, de sécurité nationale ou de rapports secrets, elle interprétera « intelligence américaine » comme une mauvaise traduction de American intelligence = « renseignement américain », et non comme « l'intelligence des Américains ».

Il y a donc deux niveaux d'analyse :

Analyse linguistique : l'expression est anormale en français et suggère une influence de l'anglais.

Analyse sémantique : le sens visé est presque certainement « les services de renseignement américains » ou « l'évaluation du renseignement américain ».

Si vous me donnez la phrase exacte ou un extrait plus long du reportage, je peux analyser plus précisément ce que le journaliste voulait dire et si la formulation est correcte ou non. »

La réponse de ChatGPT, très courte, donne l’impression d’une analyse aboutie donnant une réponse nette et définitive.

II. Mistral

Mistral prend un autre chemin, beaucoup plus long, beaucoup plus problématisé, dans lequel la démarche de l’IA est montrée et où le doute est permis. Voyons un peu :

« Votre exemple est excellent pour illustrer comment l’IA (et plus largement les systèmes de traitement du langage) interprète — ou échoue à interpréter — les nuances du langage humain. Analysons cela en détail, en lien avec votre définition de l’IA comme "traitement massif de données simulant certains mécanismes de l’intelligence humaine".

1. Ce que voit l’IA dans cette phrase

La phrase : « L’intelligence américaine ne confirme pas les déclarations de Donald Trump. »

a. Analyse syntaxique et sémantique de base

  • Tokenisation : L’IA découpe la phrase en unités (mots, sous-mots) : ["L'", "intelligence", "américaine", "ne", "confirme", "pas", "les", "déclarations", "de", "Donald", "Trump", "."]

  • Reconnaissance des entités :

    • "intelligence américaine"Entité nommée (catégorie : organisation ou concept).

    • "Donald Trump"Personnalité politique (ancien président des États-Unis).

  • Structure grammaticale : Sujet (L’intelligence américaine) + verbe (ne confirme pas) + objet (les déclarations de Donald Trump).

b. Ambiguïté sémantique

Ici, le mot clé est "intelligence" :

  • Sens 1 (le plus probable pour un humain) : "Les services de renseignement américains" (CIA, NSA, etc.).

  • Sens 2 (littéral) : "La capacité intellectuelle collective des Américains".

  • Sens 3 (ironique/métaphorique) : "La sagesse ou la rationalité des États-Unis".

Problème : L’IA n’a pas de contexte culturel ou historique pour trancher automatiquement. Elle se base sur :

  • La fréquence d’usage : Dans les corpus de texte, "l’intelligence américaine" est majoritairement associé aux services de renseignement (ex. : "La CIA, l’intelligence américaine, a publié un rapport").

  • Le co-texte : La mention de Donald Trump (figure politique) et de "déclarations" oriente vers un contexte géopolitique, où "intelligence" = renseignement.

Conclusion probable de l’IA : "Les services de renseignement américains contredisent Trump."

c. Ce que l’IA ne comprend pas

  1. L’ironie ou le second degré :Si le journaliste utilise "intelligence américaine" de manière sarcastique (ex. : pour critiquer une décision perçue comme stupide), l’IA pourrait rater la nuance sauf si elle a été entraînée sur des exemples similaires.

    • Exemple : "L’intelligence américaine a encore frappé !" (ironie sur une erreur des services secrets).

  2. Les implicites culturels :

    • Un humain sait que "l’intelligence" (au singulier) désigne souvent les services secrets dans un contexte politique.

    • Un non-anglophone ou une IA pourrait confondre avec "l’intelligence" comme trait humain.

  3. L’intention du journaliste :

    • Veut-il dire que les services de renseignement nient les propos de Trump ?

    • Ou que les Américains en général (via des sondages, des experts) ne les soutiennent pas ?

    • L’IA ne peut pas deviner l’intention sans données supplémentaires.

2. Comment un modèle comme moi traiterait cette phrase ?

Étape 1 : Désambiguïsation

  • Recherche de patterns : Dans les données d’entraînement, "l’intelligence [pays]" est souvent lié aux services de renseignement (ex. : "l’intelligence britannique", "l’intelligence russe").

  • Contexte politique : La mention de Trump active des associations avec des sujets comme la désinformation, les élections, ou les rapports des agences fédérales.

Hypothèse principale : "Les services de renseignement américains ne valident pas les déclarations de Trump."

Étape 2 : Vérification via le contexte

Si la phrase est extraite d’un article complet, l’IA pourrait :

  • Chercher des mots-clés comme "CIA", "rapport", "renseignement" dans les phrases voisines.

  • Analyser le ton de l’article (critique, neutre, satirique) pour ajuster l’interprétation.

Étape 3 : Génération d’une réponse

Si on demande à l’IA : "Que signifie 'l’intelligence américaine' dans cette phrase ?"
Elle répondrait probablement :

« Dans ce contexte, 'l’intelligence américaine' désigne très probablement les services de renseignement des États-Unis (comme la CIA ou la NSA), qui ne confirment pas les déclarations de Donald Trump. Cette expression est couramment utilisée dans les médias pour évoquer ces agences. »

Mais :

  • Elle ne saurait pas si le journaliste a utilisé le terme de manière ironique sans indices supplémentaires.

  • Elle ne comprendrait pas la portée politique de cette affirmation (ex. : un conflit entre Trump et le Deep State).

3. Comparaison avec l’intelligence humaine

Critère                                 IA (votre définition)                    Humain (journaliste/lecteur)

Reconnaissance des mots  ✅ Parfaite (via tokenisation).                ✅ Parfaite.

Compréhension littérale      ✅ Bonne (sens dominant identifié).      ✅ Bonne.

Désambiguïsation ⚠️ Dépend des données d’entraînement.            ✅ Excellente 

contextuelle                                                                                   (expérience, culture).

Détection de l’ironie             ❌ Faible (sauf si entraînée                   ✅ Possible       

                                                sur des exemples)                               (ton, contexte  social).

Compréhension des            ❌ Nulle (pas de théorie de l’esprit).      ✅ Naturelle.

implicites

Intention de l’auteur             ❌ Inaccessible.✅ Interprétable (avec biais possibles).

4. Exemple concret avec un modèle de langage

Si vous demandez à un modèle comme moi : « Dans cette phrase, 'l’intelligence américaine' fait-elle référence aux services secrets ou à l’intelligence collective des Américains ? »

Réponse probable :

« Dans ce contexte, il est très probable que 'l’intelligence américaine' fasse référence aux services de renseignement des États-Unis (comme la CIA). Cette expression est une métonymie courante en journalisme pour désigner ces agences. Cependant, sans plus de contexte, une ambiguïté subsiste. »

Pourquoi cette réponse ?

  • Statistique : Le modèle a vu des milliers d’exemples où "intelligence [pays]" = services secrets.

  • Prudence : Il mentionne l’ambiguïté car il n’a pas accès à l’intention du journaliste.

5. Limites et biais possibles

  1. Biais de fréquence :
    Si le modèle a été entraîné sur des articles où "intelligence américaine" = services secrets 90% du temps, il favorisera cette interprétation, même si le contexte est ambigu.

  2. Biais culturel :
    Un modèle entraîné principalement sur des médias américains aura plus de facilité à désambiguïser que s’il a été entraîné sur des textes français ou chinois.

  3. Absence de raisonnement causal :
    L’IA ne se demande pas : "Pourquoi le journaliste utilise-t-il ce terme ?" (ex. : pour éviter de citer la CIA directement, par habitude, ou par ironie).

6. Application à vos recherches (ici Mistral s’adresse à moi en tenant compte d’échanges antérieurs)

Votre travail sur Averroès et les transferts culturels montre que la compréhension profonde d’un texte nécessite :

  • Un contexte historique (ex. : savoir que la laïcité était révolutionnaire au XIIe siècle).

  • Une sensibilité aux nuances linguistiques (ex. : les traductions latines des textes arabes).

L’IA, elle, fait l’inverse :

  • Elle simule la compréhension via des patterns statistiques.

  • Elle ignore l’histoire, sauf si elle est explicitement encodée dans les données d’entraînement.

Question pour vous :

Si un texte ancien (comme ceux d’Averroès) était analysé par une IA, celle-ci pourrait-elle détecter sa modernité sans connaître le contexte historique… ou se contenterait-elle de classer le texte comme "philosophie médiévale" sans en saisir la portée subversive ?

En résumé :

L’IA traiterait votre exemple en identifiant le sens le plus probable (services de renseignement), mais sans garantie de saisir les nuances (ironie, intention, implicites). C’est un traitement massif de données… mais pas une compréhension humaine.

On pourra trouver la réponse de Mistral trop longue ou trop complexe, mais selon nous ChatGPT n’a répondu avec précision qu’à la première partie de la question et a traité succinctement la seconde partie qui était plus importante que la première : « Comment l'IA traite ce propos? ».

Mistral au contraire s’attarde sur la seconde partie et met à nu toute la démarche de l’IA et souligne ses points forts et ses points faibles. Il la démystifie et la désacralise au yeux de l’utilisateur qui lui pose une question sur elle-même.

La conclusion pratique relative à notre journaliste c’est qu’il s’exprime en une langue qui ressemble à du français en donnant aux mots leur sens anglais et dans un contexte américain, de sorte qu’un auditeur français a peu de chance d’interpréter correctement le message tandis que l’auditeur américain qui éventuellement le reçoit ne l’interprète pas mieux attendu qu’il est exprimé dans une langue qui n’est pas la sienne.

Dernière remarque : Mistral me connaît bien, car je l’ai trituré sur de nombreux sujets pointus et il sait que je ne me satisfais pas de réponses succinctes et insuffisamment argumentées. Un autre internaute n’aurait peut-être pas obtenu de Mistral la même réponse que celle qui est restituée dans cet article.

Ultime conclusion : c’est à l’internaute de dompter l’outil IA et non le contraire.

Christian Tremblay