Traduction automatique (colloque du 25 novembre 2020)

Programme


Ultima modifica: 15 Ott 2020

Télécharger

ColloqueTraduction automatique et usages sociaux des langues

Quelles conséquences pour la diversité linguistique ?

Université de Paris/OEP - 25 novembre 2020

Programme

Ouverture - 9h30

- Prof. José Carlos Herreras, Directeur du Séminaire Politiques linguistiques en Europe (Université de Paris)
- Prof. Natalie Kübler, Directrice du laboratoire CLILLAC-ARP (Université de Paris)

- M. Christian Tremblay, Président de l’Observatoire européen du plurilingusime

- M. Prou, coordinateur TA à la Direction générale de la traduction (Commission européenne)

- Représentant de la société Deepl

 

Table ronde N° 1
Théorie de la TA - 10h30 - 12h

Modérateur : Prof. Nicolas Froeliger (Université de Paris)

 

Jean-Louis Vaxelaire (Université de Namur)

Traduction automatique : des progrès en trompe-l’œil ?

Depuis l’arrivée de la traduction automatique neuronale, l’optimisme des années 1950 est revenu. Ainsi, en 2016, une équipe de Google (Wu et al., 2016) annonce qu’ils obtiennent des résultats aussi bons que des traductions humaines (le fait que ces traductions sont réalisées par des amateurs n’est pas mis en avant). Deux ans plus tard, une équipe de Microsoft (Hassan et al., 2018) est encore plus présomptueuse et affirme égaler les productions de traducteurs professionnels. Les résultats sont certes parfois excellents, mais demeurent fluctuants.

Dans la première partie, nous nous intéresserons à la question de la diversité des langues. Les articles des équipes de recherche se concentrent majoritairement sur l’anglais associé à une autre langue. Nous nous focaliserons donc sur les rapports entre le français et le turc, puis avec le luxembourgeois. Nous verrons que les résultats sont nettement moins satisfaisants et parfois surréalistes, peut-être en raison du poids important qui est laissé aux interventions des usagers (ce qu’on appelle aussi le Google bombing), surtout dans une langue peu parlée comme le luxembourgeois.

Dans la seconde partie, nous nous arrêterons sur la notion de genre textuel (Rastier, 2001, Gérard, 2019), qui est souvent ignoré en traduction automatique. De nombreux chercheurs ont conscience de l’importance du domaine (les premiers succès comme le système Météo à Montréal se concentraient sur un domaine), mais il est préférable de réduire encore le cadre au genre (malgré toutes ses aptitudes pour des articles de presse, DeepL peine parfois avec des textes littéraires). Poibeau (2019) faisait remarquer que la traduction automatique actuelle dépend de la qualité des données et que les matériaux d’entraînement ne correspondent pas toujours aux types de textes à traduire. Cela sous-entend finalement qu’un projet de traduction automatique générale n’est peut-être pas encore atteignable et qu’il vaut mieux se contenter de systèmes spécialisés dans tel ou tel genre.

 

Aurélien Talbot (Université de Grenoble-Alpes)

La « pensée-interprète », les appareils et la diversité linguistique

Les progrès récents de l’intelligence artificielle, liés à la puissance de calcul des ordinateurs et à la masse de données disponibles, dont la traduction permet de révéler immédiatement les effets (Poibeau 2017), semblent avoir conduit l’informatique aux frontières de la « pensée-interprète » (Seleskovitch 1968) associée au cœur cognitif de l’activité des traducteurs professionnels, les premiers modèles de cybernétique ayant été complexifiés au moyen d’un « dépassement de l’informatique informatiquement » (Alizart 2017).

Dans ce contexte, les « métiers de la traduction » (Gouadec 2002) ont déjà été bouleversés (Pym 2011) et « l’expertise » des traducteurs (Lavault 2019) remise en question dans un mouvement d’industrialisation suivant lequel le savoir-faire qui caractérisait auparavant cette activité (Ladmiral 1998) est stocké dans des corpus électroniques parallèles qui, associés à des modèles probabilistes et aux réseaux de neurones artificiels, forment la matière première des sorties de traduction automatique (Kenny 2018). Or si la traduction constitue bien un phénomène paradigmatique d’« équivalence dans la différence » (Jakobson 1959), son devenir actuel pourrait constituer le symptôme d’un mouvement plus large dénoncé par certains qui s’inquiètent des dangers pesant sur « la différence idiomatique linguistique, c’est-à-dire la variabilité diachronique et idiosyncrasique » (Stiegler 2016).

Pour examiner cette hypothèse, nous nous proposons, tout d’abord, de revenir sur certaines approches de la traduction, qui semblent pouvoir refléter et accompagner théoriquement les dernières évolutions du métier, à l’intersection des concepts de normes ainsi que de lois probabilistes de Gideon Toury (1995) et de la linguistique de corpus, dont Mona Baker (1993 et passim) a indiqué tout le parti qu’il était possible de tirer. Puis, nous nous demanderons s’il n’est pas possible de manifester d’autres approches de la traduction et des normes (Ost 2009) en vue de poursuivre la difficile tâche de complication de l’universel (Cassin 2016) susceptible de garantir la diversité des usages de la parole.

 

Jacques Coulardeau (Université Paris 1 Panthéon Sorbonne)

Humaniser la machine à traduire ?

1- Les machines à traduire imitent les humains en allant d'un point de départ à un point final, mais les itinéraires ne sont pas du tout les mêmes, atteignant seulement une fin similaire en langue étrangère.

2- Pour une période encore indéterminée, les machines ne pourront pas étendre, comme dirait Marshall McLuhan, l'esprit, la spiritualité, l'expérience existentielle et la créativité rebelle des humains.

3- Il n’y aura pas de consolidation globalisée de l’humanité si tout le monde n’a pas accès à tout ce que tout le monde fait, d’où le besoin de traduction en temps réel.

4- Les bibliothèques d'aujourd'hui seront remplacées par des serveurs contenant toutes les « connaissances », « arts », « religions », « philosophie », « sciences » et « technologies » de l'espèce humaine de tous les âges anciens, moyens et modernes ouvrant sur tous les âges à venir, et ce dans toutes les langues nécessaires. D’où le besoin de traduction ; les domaines de la traduction ; IA et traduction ; langues rares et langues menacées ; IA et langues créatives. Typiques cercles vicieux de navigation. L'IA est un outil.

5- Cette énorme bibliothèque multilingue Virtuelle-Réelle devra être en libre accès, ce qui ne veut pas dire sans frais car les personnes qui créent ou inventent cette Propriété Intellectuelle doivent pouvoir en vivre.

6- Le monde futur : soit asservir tous les créateurs de PI, donc les propriétaires, à un revenu garanti de l'État sans lien avec aucun marché, soit de permettre à ces créateurs et propriétaires de tirer, de leur PI, un revenu proportionnel à son utilisation, son utilité et sa diffusion ?

7- Si nous gardons ce concept de PI à l'esprit, il est clair qu'une machine ne possède rien et ne détient pas de droits patrimoniaux, sans parler des droits moraux.

8- Quelle que soit la qualité d'une machine à traduire, c'est toujours le propriétaire de la machine - à l'exclusion du traducteur travaillant sur la machine ? – qui possède la traduction produite par la machine – et qu’en est-il du traducteur humain ?

9- Conclusion. Traduire, même des langues standardisées, crée des ambiguïtés, des malentendus et des erreurs d'interprétation. La traduction automatique n'est valable que si elle est sous supervision humaine. Mais nous devons nous rappeler que la nature peut décider de noyer une ville entière sous des cendres volcaniques, de mettre à genoux toute l'humanité avec une pandémie, d'accélérer les changements cycliques du climat et de la géologie sur la terre pour réduire ou contenir la mauvaise gestion et l'inconduite des êtres humains. L'univers est un être vivant qui a son propre esprit structurel et n'aime pas être malmené par de minuscules créatures qui sont au moins dix ou vingt millions de fois plus petites que l’univers lui-même.


12 h 00-14 h 00 – Pause


Introduction – 14h00 - 14h20

Prof. Jean-Gabriel Ganascia (CNRS-Sorbonne Université)

 

Table ronde N° 2 - 14h20-16h00
TA, enseignement et formation

Modérateur : M. Christian Tremblay, Observatoire européen du plurilinguisme

 

Christopher Gledhill et Maria Zimina-Poirot (Université de Paris)

Le rôle de la traduction automatique (TA) dans le projet pédagogique de traduction de site web institutionnel vers l’anglais (Master 2 ILTS, Université de Paris)

Si la TA permet à nos étudiants de gérer des aspects techniques de manière efficace (cohérence terminologique, mémoire de traduction, etc.), l’hétérogénéité des textes et la diversité des genres auxquels ils sont confrontés (Bhatia 2005, Gledhill & Zimina 2019) amènent une réflexion sur la prise en compte des pratiques discursives en traduction outillée.

Les étudiants doivent apprendre à rédiger dans un anglais international, contrairement au modèle habituel (Mauranen 2010). Ils doivent aussi faire correspondre leur production à un code rédactionnel (DGT 2020) et reconnaître dans les deux langages les spécificités du discours institutionnel universitaire (Askehave & Nielsen 2004, Biber 2006) et des innovations liées au contexte multimodal (Santini et al. 2010, Ho 2013).

Pour cerner les défis technologiques, linguistiques et socioculturels sous-jacents, nous proposons une analyse textométrique de trois types de données : a) la traduction automatique neuronale des pages « prioritaires » choisies par le service Communication de l’Université de Paris en 2019-2020 ; b) la post-édition et la révision de ces pages par nos étudiants ; c) la révision de ces pages par une spécialiste anglophone en communication.

Les universités européennes ont tendance à « internationaliser » leurs pages web (Callahand & Herring 2012). Selon certains analystes (Müldner, Darcy & Fei 2004), l’internationalisation peut être uniformisée dans une base de données génériques. Or, les traductologues et les spécialistes de la communication interculturelle (Venuti et al. 2013, Domingos & Lavault-Olléon 2014, Tréguer-Felten 2018) soulignent l’importance de la diversité des pratiques discursives dans la communication autopromotionnelle. Nos résultats le confirment : si les corrections des étudiants portent sur les dissonances lexico-grammaticales et les imprécisions terminologiques, l’experte tend à cibler les expressions interpersonnelles et la macrostructure ; des différences phraséologiques moins tangibles seraient liées aux constructions du « nouveau discours institutionnel » (Tomaskova 2011) de l’Université de Paris.

 

Janina Di Pierro Cárdenas y Renata De Rugeriis Juárez (Università degli studi di Urbino Carlo Bo (Italia)

Inteligencia artificial y Soft Power de la traducción asistida y automática: perspectivas en el proceso de enseñanza-aprendizaje de idiomas

Debido al auge en el uso de traductores automáticos, cabe preguntarse cuando o si ya a la inteligencia artificial (IA) le han dado acceso a este ámbito. A pesar de la infinidad de traductores automáticos y herramientas de traducción asistida, la mano del hombre en este campo queda inigualable. Sin embargo, si la labor de un traductor pudiera beneficiarse en el ahorro de tiempo y mejora en la elección lexical, merece la pena estudiar esta área en pro de la traducción. Este estudio se propone analizar la inteligencia artificial en el campo de la traducción y enseñanza de los idiomas, tomando en cuenta los instrumentos de traducción automática y asistida ya existentes. A partir de un atento análisis de la literatura e investigaciones disponibles, se examinará la traducción automática neuronal (NMT), el ICALL que deriva del CALL, y para terminar, las herramientas del Machine Translation (MT), como el Google Translator, Translation Online y otras, que con el pasar del tiempo, mejoran con creces, pese a que el traductor humano tenga que revisar en fase de post-edición. Para ello, nos hemos basado sobre el análisis de un corpus basado sobre los comentarios de traductores en grupos cerrados de facebook y LinkedIn acerca de la revisión. Al mismo tiempo, constatamos como la IA no hará que los profesores pierdan su trabajo, sino que redefinirá el papel de los profesores convirtiéndoles en «guías laterales» (MORRISON, 2014) puesto que con el aprendizaje de idiomas teniendo a la tecnología de IA cumpliendo con los aspectos relativos a las evaluaciones, los maestros tendrán más tiempo para coordinar el proceso de aprendizaje y orientar a los estudiantes. El presente estudio se divide en tres fases: revisión bibliográfica y de antecedentes y análisis de las herramientas de traducción automática, estudio del corpus de comentarios de traductores y finalmente, implicación/integración de la inteligencia artificial en la labor del traductor y en el proceso de enseñanza-aprendizaje de idiomas.

 

Elena Kokanova, Aleksandra Epimakhova, Maxim Berendyaev, Nicolai Kulikov, Maria Evgrafova, Natalia Pak (Université fédérale Arctique (Northern (Arctic) Federal University)

Traduction automatique, un nouveau défi pour la formation des traducteurs : le cas de l’Université fédérale Arctique (Russie)

La communication proposée est fondée sur l’expérience scientifique et pédagogique d’une équipe de professeurs et étudiants du Département des technologies de traduction joint au Bureau de traduction « AKM-WEST » (premier département russe de ce type en traduction), dont deux dirigeants dudit bureau. Une enquête menée auprès des enseignants d’école à Arkhangelsk (nord de la Russie) révèle que la TA est jugée tabou par 95 % de participants. Cela s’explique par le fait que leurs élèves l’utilisent souvent sans respecter la consigne, mais aussi par l’idée reçue sur la mauvaise qualité de la TA. Pourtant, sa qualité s’améliore (surtout pour l’anglais) avec l’émergence de la traduction automatique neuronale (TAN). Notre expérience parmi les étudiants en traduction révèle que 90 % des participants ne distinguent pas la TAN de la traduction humaine alors qu’ils identifient facilement la TA statistique. Seuls les 10 % des étudiants impliqués eux-mêmes dans la recherche de la TAN l’identifient. Les participants étaient déroutés par la fluidité de la TAN, surtout par rapport à leurs propres traductions qui n’ont pas encore le niveau professionnel. Cela pose problème, vu que beaucoup d’étudiants utilisent la TA avant d’avoir acquis les compétences de base dont la connaissance des erreurs typiques pour une paire de langues et les moyens de les éviter. Un enseignant de traduction est obligé de leur apprendre la typologie de ces erreurs, les critères du contrôle qualité et la post-édition en même temps que la traduction en elle-même. L'émergence de la TA redéfinit donc non seulement le travail du traducteur mais aussi le système de formation de traducteurs. En plus, certains domaines sont concernés par la pédagogie et la recherche de la TA plus que d’autres (traduction des textes médicaux en période de pandémie, traduction de/en langues autochtones de la région).

 

Éric Navé (Université de Lorraine)

Qu’en pensent-ils ? Réflexion sur les représentations d’apprenants et d’enseignants d’Arabie saoudite vis-à-vis du recours aux outils de traduction automatique en contexte FLE débutant

Cette contribution se propose d’analyser, à l’aune d’extraits de cinq interviews collectives avec des apprenants menées entre la fin de l’année 2019 et juillet 2020, de productions écrites des apprenants ainsi que de quelques questionnaires soumis à des enseignants de FLE de Djeddah, les représentations des acteurs auxquels s’intéresse la didactique des langues-cultures (DLC) vis-à-vis de l’utilisation d’outils de traduction automatique en contexte FLE débutant.

La classe représentant mon terrain de recherche, j’y suis impliqué et mon positionnement est émique. Les interviews, menées avec des apprenants de l’Alliance française et de l’Université de Strasbourg – faux-débutants A1-A2 selon de Cadre européen de référence pour les langues (Conseil de l’Europe, 2001) – puis de l’Arab Open University de Djeddah (débutants A1), sont toutes liées à des retours d’expérience autour de forums de partage en ligne mis en place dans le cadre d’une didactique fondée sur l’interculturel (cf. entre autres Abdallah-Pretceille, 1999 ; Abdallah-Pretceille & Porcher, 1996), mais également inspirée de la formation hybride (Nissen, 2014) et de la télécollaboration (Furstenberg, Levet, English, & Maillet, 2001 ; Furstenberg & English, 2016). La question de la traduction automatique, qui n’était pas au départ au cœur de mes problématiques de recherche, y a pourtant été discutée à maintes reprises, me faisant prendre conscience de l’importance du sujet. Le regard porté dans un deuxième temps par des enseignants apporte une perspective complémentaire qui enrichit et complexifie les résultats obtenus. Les langues dont il est question sont l’arabe, le français et l’anglais.

S’ensuit une réflexion d’ordre pédagogique, didactique et éthique sur le sujet, de même que des recommandations. Quels sont les opportunités et les dangers de tels outils dans le contexte retenu ? Comment les utiliser intelligemment ?

Cette discussion pourra apporter sa pierre à l’édifice d’une réflexion à l’ordre du jour, pressante, appelée par des problèmes concrets dans le champ de la didactique comme dans d’autres domaines.


Pause : 16h00 – 16h15


Table ronde N° 3 - 16h15-18h15
TA et pratique de la diversité linguistique

Modérateur : Prof. José Carlos Herreras, Université de Paris

 

Nicolas Bacaer (Institut de Recherche pour le Développement)

Traduire automatiquement des articles dans les sciences dites dures

On expliquera comment on utilise le traducteur automatique du navigateur Chrome pour traduire en une dizaine de langues des articles de recherche dans le domaine des mathématiques et de la biologie. On part d'articles écrits dans le langage LaTeX, le plus utilisé en mathématiques et en physique. On les transforme en fichiers HTML et on fait appel au logiciel MathJax pour l'affichage en HTML des formules mathématiques, comme le font d'ailleurs les éditeurs Elsevier et Springer. Mais on s'arrange aussi pour que certaines parties de l'article (comme les noms des auteurs, le nom du journal où l'article a été publié et la bibliographie) soient mises dans un environnement qui bloque la traduction, pour les conserver telles quelles. Des exemples se trouvent sur la page http://www.ummisco.ird.fr/perso/bacaer/. Par ailleurs, on expliquera comment on utilise la double traduction pour l'envoi de courriels. Enfin on parlera des éditeurs de journaux dans les sciences dures où la traduction marche bien (comme Elsevier), de ceux où elle marche mal (comme Springer) et de ceux qui ne publient pratiquement que des articles en PDF et qui rendent donc la traduction automatique presque impossible (comme le centre Mersenne).

 

Christian Tremblay (Observatoire européen du plurilinguisme)

La traduction automatique dans le contexte des institutions européennes

L’évolution au cours des vingt dernières années qui s’est précipitée avec l’extension de l’Europe à 10 nouveaux membres issus de l’ancienne zone d’influence soviétique, s’est caractérisée par le développement de l’anglais comme langue de travail au détriment de toutes les autres langues et en tout premier lieu du français.

Alors que très peu de fonctionnaires européens sont des natifs anglophones, cette évolution aboutit au paradoxe de transformer la quasi-totalité des fonctionnaires européens en traducteurs vers l’anglais de premier niveau. Ainsi, un rédacteur francophone va produire des documents en anglais qui seront ensuite traduits en français par les services de traduction. Un rédacteur germanophone, allemand ou autrichien produira des textes en anglais qui seront ensuite traduits en allemand.
Cette situation, que certains justifient par la nécessité de disposer d’une langue commune, au-delà de la situation ubuesque évoquée, n’est évidemment pas dépourvue d’arrière-pensées géostratégiques qui consistent à maintenir l’Europe dans une situation de « tête de pont de la puissance américaine » (Zbigniew Brzezinski) sur le continent eurasiatique.

La question posée est de savoir si l’arrivée de la traduction automatique à un niveau de qualité très élevé est de nature à modifier les équilibres et à permettre le développement de pratiques plus conformes à aux valeurs fondamentales de diversité linguistique et culturelle, inscrite dans les traités, à l’intérieur d’une identité culturelle européenne que personne ne conteste sérieusement, malgré une conscience encore bien incertaine de cette identité.

 

Maria Isabel Rivas Ginel (Université de Bourgogne Franche-Comté)

La traduction automatique dans la localisation de jeux vidéo - Motivation et Méthodologie

La productivité est cruciale dans le secteur de la localisation, c’est pour cela que la traduction automatique ainsi que des autres produits de traduction assistée par ordinateur sont de plus en plus adoptés comme une solution à la demande grandissante de contenu traduit. Pendant les dernières années la performance de ces systèmes s’est améliorée grâce, notamment, à l’apparition de la traduction automatique neuronale. Mais, quelle est la situation de la traduction automatique dans la localisation des jeux vidéo ?

Nous avons entrepris notre travail par la mise en œuvre d’une enquête par questionnaire en ligne rédigée en anglais qui vise à déterminer quels sont les outils les plus utilisés à travers un questionnaire semi-directif constitué de questions fermées réparties en bloc en fonction du type d’outil (glossaire, corpus, TM, MT, etc.).

Depuis sa publication le 10 avril nous avons reçu 210 réponses complètes, majoritairement de la part de professionnels spécialisés dans le monde de la localisation.

Discussion des résultats

En analysant les résultats préliminaires nous constatons que 11.9 % utilisent de façon régulière la traduction automatique, 38.5 % en font usage de temps en temps et 49.2 % ne l’utilisent pas. L’outil à la tête est Google dans sa version payante et sa version gratuite. (Figures 1 et 2)

Ces résultats reflètent la complexité du secteur. Le traducteur doit continûment se consacrer à un travail d‘adaptation culturelle du contenu, ainsi que faire face à la manque de l’espace nécessaire pour insérer les termes à traduire. Une autre caractéristique de la localisation des jeux vidéo est les variables, des éléments qui seront remplacées automatiquement par d’autres segments et doivent tenir compte des éventuelles modifications liées au genre, au nombre, et de la place à l’intérieur de la phrase.

 

Claire Larsonneur (Université Paris 8)

Alexa, Siri et Cortana : les enjeux de la diversité linguistique pour les assistants intelligents

Les assistants intelligents accompagnent la numérisation de nombre d’interactions humaines, qu’il s’agisse de comportements d’achat, de recherche d’information ou de mise en relation entre personnes. Conçus au départ dans un environnement anglophone par Amazon, Apple ou Microsoft, ces outils sont destinés à une large localisation au vu des ambitions de couverture exhaustive des marchés pour ces entreprises qui s’en servent comme portail d’accès à leurs services. Les assistants traduisent de la voix en texte et vice-versa et doivent pouvoir s’adapter aux contraintes locales en termes d’accents, de politique de genre ou de codes culturels par exemple, ce qui serait impossible à grande échelle sans l’utilisation des techniques de traduction neuronale. Dans cette communication, on reviendra sur les politiques linguistiques qui ont accompagné le développement de trois outils, Alexa, Siri et Cortana, en en retraçant l’historique. Puis on reviendra sur les enjeux traductifs qu’ils posent, notamment dans le traitement des erreurs et omissions, et leur articulation à un écosystème d’outils automatisés de maniement du langage, lesquels risquent à terme de produire une standardisation des usages de la langue, au sein de chaque langue et par calque vis-à-vis de l’anglais américain. Enfin on explorera la question des enjeux sociétaux, économiques et éthiques associés à l’usage généralisé de tels outils, conçus et mis en œuvre par des acteurs économiques en situation hyperdominante. Se posent notamment des questions de sécurité, de gestion des données, de censure…

 

Séraphin Personne Feykéré (Université de Bangui)

Dynamique du sängo : fonction, procédures et méthodologie relatives à l’emploi étendu (production automatique et lecture des textes écrits)

La République Centrafricaine a deux langues officielles qui sont : le français et le sängö. A côté de ces deux langues officielles, il est à noter que c’est un pays qui regorge d’une multitude de langues dites régionales. On dénombre à peu près quatre vingts à cent langues parlées.

Le français, langue de colonisation reste et demeure la langue de l’administration et d’instruction. Le sängö, quant à lui, est une langue parlée par presque tous les Centrafricains de l’Est à l’Ouest, du Nord au Sud. Il a même débordé les limites du pays et se trouve aujourd’hui connue comme une langue transfrontalière, et reconnu qu’il est parlé sur le territoire centrafricain par près de 90% de la population. Cette langue véhiculaire est considérée comme symbole d’unité et langue identitaire contrairement aux autres pays de la sous-région qui ont au moins quatre à cinq langues nationales.

Ainsi, notre réflexion portera ici sur la dynamique de cette langue à travers le pays et cela aussi à travers un emploi étendu que fait au quotidien la population centrafricaine de cette langue dans sa traduction automatique des données linguistiques comme outil de communication, véhicule de culture ensemble avec la langue française dans leurs usages sociaux.

A la lumière de ce qui précède, nous allons dans le développement qui suit, relever la dynamique de ces deux langues en présence dans leur fonction sociétale (le français et le sängö), leur emploi dans les communications ordinaires, et terminer sur la notion de traduction automatique, ses conséquences sur les pratiques et les usages sociaux dans les textes en sängö.

 

Conclusions  - 18h15-18h35

Jean-Gabriel Ganascia