Identifiant pérenne de la notice : 205195407
Notice de type
Notice de regroupement
Note publique d'information : La modélisation du processus de la communication parlée fait intervenir un nombre
important de modèles à chaque niveau d'analyse (modèles de Markov cachés variés, automates
finis, grammaires, etc.). Au sein d'un système de compréhension de la parole, l'hétérogénéité
de tous ces modèles pose un problème majeur : leur coopération. Comme alternative
aux systèmes dont les composants sont «faiblement couplés», ce mémoire propose une
architecture «intégrée» où il existe une communication intensive entre les sources
de connaissance. La principale originalité de cette approche est d'être développée
à partir de l'étude des liens et des différences profondes entre les modèles pour
en extraire des principes algorithmiques efficaces. Cette démarche «globale» se démarque
nettement des approches classiques plus locales et plus analytiques. D'un point de
vue pragmatique, les techniques de décodage acoustico-phonétique optimales sont tout
d'abord analysées, comparées et reformulées grâce à l'introduction de la notion de
«machines acoustiques». Munis de ces outils algorithmiques, l'extension des techniques
de bas niveau à la classe des langages hors-contexte est entreprise. Cette classe
est particulièrement importante car elle constitue un point de passage quasiment obligatoire
pour aborder les techniques de traitement du langage naturel. Il est montré que seuls
deux algorithmes peuvent réaliser ce «pont» entre techniques numériques de bas niveau
et symboliques de haut niveau, le SOP et le STL. Ces deux algorithmes sont largement
discutés et leur complexité est détaillée. Grâce à eux, la notion d'architecture intégrée
acquiert un support algorithmique précis et efficace. A l'issue de ce travail, une
nouvelle question se pose : la notion d'intégration permettra-t-elle de palier à l'impossibilité
d'obtenir la solution optimale dans un système de compréhension de parole ?