Quantcast

Codage algébrique de la parole : prédiction linéaire à excitation par code ternaire

Research paper by Renaud Di Francesco

Indexed on: 01 May '92Published on: 01 May '92Published in: Annals of Telecommunications



Abstract

Cet article présente de nouvelles méthodes de codage de la parole, en vue ďapplications en temps réel (téléphone, visiophone), ou différées (stockage). La qualité de parole visée est celle de la téléphonie usuelle, avec une bande passante de 4 kHz et un échantillonnage classique à 8 kHz. Les techniques celp (prédiction linéaire à excitation par codes) sont présentées de faÇon élémentaire. Un codeur-décodeur à 16 kbit/s, puis à 24 kbit/s donne un exemple ďapplication de ces techniques utilisant des dictionnaires entiers, et des calculs rapides. La qualité obtenue avec les deux codeurs-déco-deurs a été mesurée rigoureusement en comparaison avec des codeurs plus complexes et dans des conditions réalistes, avec des canaux bruités. Ľapproche élémentaire est complétée par une modélisation synthétique, qui permet un maniement aisé des objets, et une généralisation des algorithmes à ďautres dictionnaires que ceux qui sont incorporés aux codeurs. Ainsi, on trouvera un modèle à excitation par somme de vecteurs étendu, à base hybride. Cette approche utilise ľefficacité algébrique des dictionnaires structurés en même temps que la qualité statistique des dictionnaires non structurés obtenus par apprentissage.