Inf. Voz Humana con Matlab

ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO FACULTAD DE INFORMÁTICA Y ELECTRONICA ESCUELA DE INGENIERIA ELECTRÓNICA EN TE

Views 120 Downloads 5 File size 409KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO FACULTAD DE INFORMÁTICA Y ELECTRONICA ESCUELA DE INGENIERIA ELECTRÓNICA EN TELECOMUNICACIONES Y REDES INGENIERÍA EN ELECTRÓNICA, TELECOMUNICACIONES Y REDES

INFORME DE COMUNICACIONES I

INFORME DE LA PRÁCTICA DE SIMULACION Y VISUALIZACIÓN DE VOZ EN MATLAB

FECHA DE REALIZACIÓN: 2014/10/10

FECHA DE ENTREGA: 2014/10/12

1. OBJETIVO(S): 2.1. -

GENERAL

Ingresar archivos de sonido (en particular de señales de voz) en formato .wap (formato de sonido WAVE de Microsoft) al espacio de trabajo de MATLAB, mediante el comando wavread.

2.2.

ESPECÍFÍCOS

 Ingresar archivos de sonido (en particular de señales de voz) en formato .wap (formato de sonido WAVE de Microsoft) al espacio de trabajo de MATLAB, mediante el comando wavread.  Usar MATLAB para representar señales de voz en el dominio del tiempo (formas de onda) y en el dominio de la frecuencia (espectro), mediante el comando plot.  Usar la función fft para obtener los componentes frecuenciales de las muestras. 2. METODOLOGÍA Experimental

3. EQUIPOS Y MATERIALES: EQUIPOS: - Computador con Matlab 4. MARCO TEORICO:

ANÁLISIS DE LA SEÑAL DE VOZ El análisis de la señal de voz se puede abordar desde dos puntos de vista: estudiando las características temporales de la voz, o analizando las características espectrales de la voz. Al primero se le llama análisis en el dominio del tiempo, e incluye medidas de parámetros como la tasa de cruces por cero, la autocorrelación,... El segundo, llamado análisis en el dominio de la frecuencia, pretende localizar parámetros de la señal de voz atendiendo a la información que provee su espectro. Este último es el que cobra mayor importancia debido a su utilización en los sistemas automáticos del habla. Aunque la voz cambia a lo largo del tiempo, y por tanto no se puede hablar de estacionareidad, la voz está producida por unos órganos físicos que tienen una cierta inercia mecánica o lo que es lo mismo, no pueden cambiar demasiado rápido. La voz generada mientras los órganos permanecen en una cierta posición, sí se puede considerar estacionaria, y en su estudio se pueden emplear numerosas técnicas. Persiguiendo la adquisición de segmentos de voz estacionarios se ha desarrollado el análisis a corto plazo de la voz, que consiste en tomar muestras de voz cada 10 a 30 msec. de manera que la voz se pueda considerar estacionaria en este intervalo. La mayoría de los sistemas de análisis usan este método y realizan el análisis de tramas de voz de 10 a 30 msec. Es importante conseguir tramas estacionarias de voz para poder realizar su análisis espectral. MATLAB (Abreviatura de MATrix LABoratory, "laboratorio de matrices") es una herramienta de software matemático que ofrece un entorno de desarrollo integrado (IDE) con un lenguaje de programación propio (lenguaje M) y servicio de especie. Está disponible para las plataformas Unix, Windows, Mac OS X y GNU/Linux . Entre sus prestaciones básicas se hallan: la manipulación de matrices, la representación de datos y funciones, la implementación de algoritmos, la creación de interfaces de usuario (GUI) y la comunicación con programas en otros lenguajes y con otros dispositivos hardware. El paquete MATLAB dispone de dos herramientas adicionales que expanden sus prestaciones, a saber, Simulink (plataforma de simulación multidominio) y GUIDE (editor de interfaces de usuario - GUI). Además, se pueden ampliar las capacidades de MATLAB con las cajas de herramientas (toolboxes); y las de Simulink con los paquetes de bloques (blocksets). Es un software muy usado en universidades y centros de investigación y desarrollo. En los últimos años ha aumentado el número de prestaciones, como la de programar directamente procesadores digitales de señal o crear código VHDL.

5. PROCEDIMIENTO: LINEAS DE CODIGO EN MATLAB Hombre x=wavread('C:\Users\SYSTEMARKET\Searches\Downloads\Voz_001.wav'); % archivo de audio para su nombre. subplot(2,1,1); plot(x); % gráfica en el dominio del tiempo. Y=fft(x); % transformada rápida de Fourier. A=Y.*conj(Y); % potencia de la señal. f=(100:3000); %espectro de frecuencia subplot(2,1,2); plot(f,A(1:2901)); %grafica en el dominio de frecuencia Mujer x=wavread('C:\Users\SYSTEMARKET\Searches\Downloads\Voz_002.wav'); % archivo de audio para su nombre. subplot(2,1,1); plot(x); % gráfica en el dominio del tiempo. Y=fft(x); % transformada rápida de Fourier. A=Y.*conj(Y); % potencia de la señal. f=(100:3000); %espectro de frecuencia subplot(2,1,2); plot(f,A(1:2901)); %grafica en el dominio de frecuencia

 SIMULACIÓN

Mujer La grafica ubicada en la parte superior nos muestra en dominio del tiempo mientras que la ubicada en la parte inferior nos muestra frecuencia. El tono más alto se halla a 2MHz.

Hombre La grafica ubicada en la parte superior nos muestra en dominio del tiempo mientras que la ubicada en la parte inferior nos muestra frecuencia. El tono más alto se halla a 5MHz

El ancho de banda (BW) para esta señal de audio es: BW= 3000Hz = 100 Hz = 2900 Hz = 2,9 Hz El ancho de banda está a 2.9kHz en ambas voces

6. CONCLUSIONES Y RECOMENDACIONES: -

-

Al momento de realizar el programa se recomienda tener especial atención en colocar los comandos ya que si los ingresamos mal, los mismos nos llevaran a tener resultados erróneos o el programa será incorrecto. A través de la práctica realizada podemos concluir que la voz de un hombre llega a los 5Mhz mientras que la voz de una mujer llega a 2Mhz.

7. RECURSOS: -

Software de Matlab disponible en: http://www.mathworks.com

-

Concepto Análisis de la Señal de voz: http://www.google.com.ec/url?sa=t&rct=j&q=&esrc=s&source=web&cd= 13&cad=rja&uact=8&ved=0CCkQFjACOAo&url=http%3A%2F%2Fwww.re searchgate.net%2Fprofile%2FBelen_RuizMezcua%2Fpublication%2F28258479_La_voz_y_su_especto%2Flinks%2 F0deec521639c7b0957000000&ei=IgM7VLrpDpDDggTc4ILoBQ&usg=AF QjCNEBSEcPjwoKkXGNyXy0txlKkQbO0A&sig2=0wJPkuHhOJxxTUFWN FpsAA&bvm=bv.77161500,d.eXY