Le traitement du langage par ordinateur

Le nombre de plus en plus grand de logiciels servant à traiter le langage humain, et la sophistication de plus en plus grande de ces logiciels explique le role important de la linguistique dans le traitement informatique de la langue. La linguistique est associée à l'informatique dans deux grandes orientations de recherches:

  1. L'intelligence artificielle
  2. Diverses applications pratiques
Les recherches en intelligence artificielle (voir par exemple le LIMSI, groupe de recherche du CNRS en France) sont très fort influencées par celles qui portent sur le fonctionnement du cerveau humain et, en général, par les recherches en sciences cognitives. Parfois en symbiose avec ces recherches, parfois indépendamment, de nombreux développeurs proposent des logiciels qui servent à traiter le langage.

Voici quelques domaines d'application de la linguistique dans le domaine de l'informatique:

  1. Certaines compagnies développent des moteurs de recherche d'information dans de grandes bases de données. Pour faire ces recherches de façon profitable, il faut pouvoir procéder à une analyse linguistique des informations qui se trouvent dans ces bases de données.
  2. Certains développeurs proposent des logiciels de résumé de textes. Ces logiciels doivent pouvoir retrouver l'information lingistique importante des textes. Idéalement, ces logiciels devraient également pouvoir construire des phrases synthèses des textes.
  3. Certains logiciels servent à faire des lexiques électroniques de certains domaines. Les logiciels doivent repérer les mots pertinents à ces domaines.
  4. Certains logiciels proposent des traductions de textes écrits en d'autres langues. Ces logiciels doivent pouvoir traduire le sens des phrases de la langue source dans un langage commun à partir duquel une phrase équivalente est produite dans la langue cible.
  5. Certaines compagnies développent des correcteurs grammaticaux. Ces logiciels, pour être performants, doivent incorporer une grande quantité de connaissances sur la langue.
  6. Certaines compagnies développent des systèmes de décodage de la parole humaine, que ce soit pour les systèmes d'appels téléphoniques ou pour des interfaces entre l'humain et différentes machines. Pour ces logiciels, il faut tenir compte des recherches linguistiques sur la production et la perception de la parole.
Des textes d'introduction aux domaines de la linguistique informatique et de la traduction informatique ont été préparés par des chercheurs de l'association de linguistique des États-Unis, de même que la brochure suivante:  Why can't computers use English?

Compagnies et outils en linguistique informatique

Vous trouverez ci-dessous des liens vers des développeurs d'instruments informatiques impliquant des connaissances linguistiques:

 

Linguistique informatique sur le web

 
Sites rassemblés par Paul Hirschbühler
Amsili LI 014 : Traitement automatique de l'écrit http://wwwtalana.linguist.jussieu.fr/~amsili/
ArchEns99.0/LI014.html
Ball, Cathy (Georgetown) main page http://www.georgetown.edu/cball
Ball, Cathy & K. Taylor Introduction to Computational Linguistics http://www.georgetown.edu/cball/ling361
Ball, Cathy  Programming Languages for linguistics: Perl http://www.georgetown.edu/cball/ling360
Barlow, Michael (Rice) Computers and Language http://www.owlnet.rice.edu/~ling317/
Brett, A. & Laura Proctor Computational linguistics http://web.uvic.ca/~esg02/ling482/
Cawsey, Allison Natural Language Processing (Prolog) http://www.cee.hw.ac.uk/~alison/
http://www.cee.hw.ac.uk/~alison/nl.html
Cole et alii Survey of the State of the art in human Language technology (book) look for address in Brett and Proctor (Class notes September 3, What is computational Linguistics)
Coxhead Natural Language Processing (Prolog)
(at Aston)
http://www.cs.aston.ac.uk/~coxheadp/nlp/nlphint.pdf
www.cs.bham.ac.uk/~pxc/ex-aston/nlp/nlp.html
Coxhead, Peter Natural Language Processing and Applications (at Birmingham) www.cs.bham.ac.uk/~pxc/nlpa/index.html
(only lecture 1 at the moment)
Delannoy, J.-F. Recherche d’Information http://www.csi.uottawa.ca/~delannoy/CSI4507
Hancox, Peter Natural Language Processing http://www.cs.bham.ac.uk/~pjh/sem1a5/sem1a5.html
Jurafsky, Dan Introduction to Computational Corpus Linguistcs 
(grep, perl)
http://www.colorado.edu/ling/f00/5200/5200.html
Karttunen, Lauri Finite-State Methods in NLP 
Manuscrit de livre sur la morphologie
http://www.cis.upenn.edu/~cis639/
http://www.cis.upenn.edu/~cis639/docs/book.ps
Koot, Hans van de PLinc101: Prolog for cognitive sciences http://www.phon.ucl.ac.uk/home/hans/courses/plinc101
Lassadi, Boutheina logiciels intéressants à examiner http://www.granddictionnaire.com/01_avance/gdt_express.html
http://www.exentrix.com
http://www.nstein.com  et http://www.nstein.com/fr/products.asp
Martin, Jim Natural Language Processing http://www.cs.colorado.edu/~martin/Csci5832.html
Moens, Marc LTG Software  http://www.ltg.hcrc.ed.ac.uk/software/index.html
Polguère, Alain cours Atelier de programmation linguistique, Université de Montréal http://www.fas.umontreal.ca/ling/olst/fr/LNG2001_Hiv01
Senseval homepage Evaluating Word Sense Disambiguation Systems http://www.itri.brighton.ac.uk/events/senseval/
Vijayashanker, K Logic and Programming http://www.cis.udel.edu/~vijay/cis310/cis310.html
Wilson, Bill CS 9414 Artificial intelligence (inclut NLP)
(Accès à divers dictionnaires, dont The NLP dictionary)
http://www.cse.unsw.edu.au/~cs9414
http://www.cse.unsw.edu.au/~billw/nlpdict.html