logodroite

Contacts iconmaillogodroite

Traitement automatique du langage naturel (TALN)

L'Institut des Sciences et des Nouvelles Technologies poursuit depuis 2004 un programme de recherche dans le domaine du TALN. Le traitement de la parole et de l'écrit sont étudiés. De nombreux articles scientifiques ont été publiés dans des conférences internationaux avec comité de lecture.


Pourquoi cette thématique?


La république de Djibouti, comme la plupart des pays africains, est un pays dit de tradition orale. l'ensemble des connaissances et du savoir se transmettent oralement. L'histoire, la culture, le droit et les coutumes, etc sont mémorisés et transmis de générations en générations. Aujourd'hui, cette chaine de transmission est presque rompu du fait du changement des modes de vie de la société et de la mondialisation. Ce savoir ancestral, accumulé depuis des siècles, est par conséquent en voie d'extinction. La plupart des pays concernés, conscients de ce problème, ont entrepris des programmes de vulgarisation de leur patrimoine oral. Les stations radio locales diffusent régulièrement des interviews de personnes dépositaires de cette tradition sui sont interogées sur tels ou tels sujets. Pour la république de Djibouti, pour ne citer que certaines, les émissions "SIRTA EREYGA", "SOYAAL", "WAR IYO WAAYO ARAG", "SAHAN", "TIXMAAL", etc. sont largement connues de la jeunesse. Aujourd'hui, ces stations radio ont à leur disposition une quantité importante d'archives de ce patrimoine oral. Elles sont confrontées à deux questions:

- Comment numériser ces archives pour les protéger et les sauvergader;
- Comment rendre ces archives plus accessibles.

Concernant le premier point, les techniques de numérisation sont bien connues et la solution à cette question est plus d'ordre logistique (moyens matériels, financiers, humains). Par contre, le second point nécessite des outils informatiques de haut niveau, telle que la reconnaissance automatique de la parole, l'indexation audio, etc..

Qu'est-ce qui a été fait?

- Soutenance d'une thèse dans le domaine de la transcription automatique des langues africaines pour une indexation du patrimoine oral.
- Système de reconnaissance large vocabulaire de la parole en langue somalienne.
- Moteur d'indexation audio des archives du patrimoine oral

Actualités

African HLT 2012

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Les Recherches

  • Palmier dattier : Equipe DjibPalm
  • Sécurité des Systèmes d'Information
  • Eau : hydrogéologie, hydrologie...
  • Langues nationales
  • Archéologie
  • Etudes politiques et stratégiques
Lire plus ...

Les Publications

  • Indexation automatique du patrimoine oral Africain
  • Revue Science et Environnement
  • Projet d'un dictionnaire d'environ 100 000 entrées
  • Le dictionnaire somali : QAAMUUS
Lire plus ...