Le TAL

Le traitement automatique du langage (TAL) repose sur le domaine de la linguistique (étude des langues humaines et de leur évolution) et sur le domaine de l’informatique en termes de stoclage de données et d’algorithmes de traitement des textes.
On parle aussi d’analyse sémantique de textes ou de TextMining.

A l’origine du TAL, nous pouvons citer le Linguistique Ferdinand de Saussure (1916) qui a posé les principes de la linguistique générale, et la machine de Turins (1936) considérée comme le premier ordinateur capable de décoder un texte.

Aujourd’hui, à l’heure du Big Data, le TAL prend une place centrale dans l’analyse des données. En effet, 80% des données générées sont des textes. Leur exploitation devient incontournable comme support à la définition de la stratégie des organisations. Et leur volume est tel qu’une analyse sémantique informatisée doit nécessairement venir en support de l’analyse humaine.

Le TAL est présent dans différentes fonctionnalités logicielles telles que :

  • la recherche d’information,
  • l’aide à la rédaction,
  • l’analyse de similarités et la recherche de précurseurs,
  • la classification automatique des documents,
  • la génération automatique de résumés,
  • la traduction,
  • et de manière général, il intervient chaque fois qu’il y a une interaction homme/machine (dictée d’un texte à son téléphone, échanges avec un Chabot, …)

Le TAL repose sur le langage métier de l’organisation (que nous appelons ontologie et terminologie). Il prend en compte la complexité de la langue (temps des verbes, phrases négatives, chronologie) et sa diversité (synonymes, acronymes, traductions, …).
Il peut alors restituer une analyse du sens des textes en fonction du point de vue de l’utilisateur.