Procesadores Digitales de Señal: Diseño de Sistema Domótico

El sistema de domótica que se propone gira entorno al Control por Voz, como un interfaz adicional a otros ya existentes en el Hogar Digital, tales como: pulsadores, pantallas táctiles, PDAs, ordenadores, …
Desde hace años, el crecimiento de los Sistemas de Reconocimiento de voz ha ido en aumento. Primero se utilizaban voces pregrabadas para aplicaciones telefónicas automáticas con opciones en menús. Opciones que se habilitaban, en los inicios, pulsando los botones del terminal y, finalmente, articulando palabras del menú de voz.

Las aplicaciones telefónicas se han ido desarrollando considerablemente permitiendo una mayor flexibilidad en el reconocimiento de voz; a la vez que en el sector informático se han comercializado programas de reconocimiento y de síntesis de voz. Dicho software permite la navegación web, el control por comandos, ...
mediante órdenes de voz; independientemente del locutor, lo que permite el entrenamiento previo del sistema incrementando la precisión en el reconocimiento, puesto que el usuario puede corregir el error cuando éste se produce. Así pues, el sistema se autoalimenta y cuanto más se emplea mejora en su eficiencia.

Los sistemas de reconocimiento de voz están basados bien en técnicas por comparación de patrones o bien en decodificadores acústico fonéticos. De las técnicas de procesado basadas en patrones cabe destacar las que se apoyan en el uso de redes neuronales y aquellas que realizan el procesado según los modelos ocultos de Harkov. En cualquier caso requieren de un entrenamiento previo del sistema para que la base de datos vaya almacenando más información y mejore la tasa de acierto del reconocedor.
Las fuentes de información acústica, fonética, fonológica y léxica, con los correspondientes procedimientos interpretativos, dan lugar a un módulo conocido como decodificador acústico-fonético. La señal vocal de entrada es convenientemente representada; para ello, se la somete a un proceso previo de parametrización donde se determinan las características acústicas representativas de dicha señal. En esta etapa previa es necesario asumir algún modelo físico: auditivo o articulatorio. Una vez detectadas se etiquetan las unidades acústicas generándose cadenas de fonemas que se mapean con un vocabulario conocido para pasar a una estrategia de reconocimiento en función de las restricciones impuestas alreconocedor. Esta técnica requiere de un gran conocimiento acústico de las unidades fonéticas. Tanto el conjunto de características, que se eligen por intuición, como el diseñode clasificadores, hoy por hoy, no es óptimo; por lo que nos inclinaremos por técnicas basadas en la comparación de patrones.

Un Sistema de Control por Voz puede implementarse de diversas formas según el tipo de elementos captadores de voz y de la forma de transmitir las señales de audio entre los dispositivos que componen el sistema. Desde el punto de vista técnico, la topología más simple es la de estrella desde la central hasta cada elemento emisor o receptor. Esta conexión se puede efectuar tanto para señales analógicas como para digitales. En este último caso se consigue aumentar la longitud del cableado, respecto a la infraestructura para señales analógicas, sin perdida de calidad. En cambio, la topología que se recomienda es la de redes LAN para el transporte de las señales entre la central y los sistemas auxiliares de captación y emisión, siendo necesario añadir un adaptador o tarjeta de red al bus y la electrónica que exige la conectividad a la LAN, con la inclusión de un conversor analógico-digital (AD), para la captura de señales procedentes del micrófono, y un conversor digital-analógico para la conversión de las tramas digitales a audio analógico que debe reproducir el altavoz. En las siguientes figuras se pueden ver dichas configuraciones respectivamente:

En el mercado actual podemos encontrar gran variedad de sistemas de reconocimiento de voz. Seguidamente se presenta un listado de los sistemas más representativos por su presencia en el mercado, su integración con el hardware actual y sus cualidades:
a. Software comercial para ordenadores personales:
Dragon Naturally Speaking de Nuance
Philips FreeSpeech
Protitle Live from NINSIGHT
Via Voice de IBM
Soluciones Loquendo
Voice Pro 11 de Linguatec
b. Sistemas telefónicos:
Nuance 8.5
Telefónica: Software vocal de Telefónica
Telisma (teliSpeech)
c. Software libre para ordenadores personales:
CVoiceControl: se graba la orden como entrenamiento.
PerlBox: sin entrenamiento, pero en inglés.
Sphinx, del Sphinx Group en Carnegie Mellon University
Open Mind Speech, antiguamente FreeSpeech
Sistemas de reconocimiento de voz que hacen uso distintas firmas de instalaciones de domótica destacando las soluciones de: Fagor, Proinssa, Personica, Indistsys y Easy Life.

Entrando en las técnicas de captura y transmisión de la voz para aplicaciones de reconocimiento de voz aplicadas al Hogar Digital se comprueba que unos valores óptimos pueden ser: *Ancho de banda señal de voz: 8.000 Hz. *Filtrado mediante paso banda con frecuencias de corte de 100Hz y 8.000Hz. *Frecuencia de muestreo: 16 KHz *Codificación: 10 bits *Bit rate mínimo que debe asegurar el BUS: 1,6 Mbit/s

Procesadores Digitales de Señal

26 marzo, 2009

Diseño de Sistema Domótico

1 comentario:

nAchO

Blogs Compañeros

DSP ArchIvO