Voz

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR LABORATORIO: Procesamiento y Reconocimiento de Audio OBJETIVO: Aplicar lo

Views 217 Downloads 2 File size 3MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

LABORATORIO: Procesamiento y Reconocimiento de Audio OBJETIVO: Aplicar los conceptos teóricos para resolver problemas reales de la vida cotidiana. El estudiante luego de realizar los experimentos deberá tener la capacidad de mejorar los algoritmos de procesamiento y reconocimiento de voz para su aplicación en cualquier sistema. MATERIAL:    

Una computadora o laptop. Software Matlab. Micrófono de PC. Parlantes de PC.

%lectura de señal de audio [s Fs]=wavread('cancion.wav'); %Reproduccion de la señal wavplay(s, Fs); plot(s);

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR %lectura de señal de audio [s Fs]=wavread('voz.wav'); %Reproduccion de la señal wavplay(s, Fs); plot(s);

%lectura de señal de audio X=wavread('cancion.wav'); %Reproduccion de la señal wavplay(X, Fs); plot(X);

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR %lectura de señal de audio Z=wavread('voz.wav'); %Reproduccion de la señal wavplay(Z, Fs); figure; plot(Z)

%lectura de señal de audio W=wavread('cancion1.wav'); %Reproduccion de la señal sound(W, Fs); figure; plot(W);

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR G=fft(X); G1=abs(G); figure subplot(1,3,1);plot(G); subplot(1,3,2);plot(G1);

F=fft(Z); F1=abs(F); figure subplot(2,3,1);plot(F); subplot(2,3,2);plot(F1);

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR H=fft(W); H1=abs(H); figure subplot(3,3,1);plot(H); subplot(3,3,2);plot(H1);

}}

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

Solucion a)

b)

c)

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

d)

e)

Solucion:

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR a) Este procedimiento se realizo en la pregunta anterior (observar las imágenes). b) Mi voz: Frecuencia de muestro: 44 100 Hz Tiempo de duracion: 20 segundos Canal: MONO Numero de bits: 24 Formato: WAV Voz de niño: Frecuencia de muestro: 8 000 Hz Tiempo de duracion: 20 segundos Canal: ESTEREO Numero de bits: 16 Formato: WAV Voz de niña: Frecuencia de muestro: 8 000 Hz Tiempo de duracion: 20 segundos Canal: MONO Numero de bits: 32 Formato: WAV

Sonido de animal: Frecuencia de muestro: 44 100 Hz Tiempo de duracion: 20 segundos Canal: ESTEREO Numero de bits: 16 Formato: WAV Sonido de puerta: Frecuencia de muestro: 8 000 Hz Tiempo de duracion: 20 segundos Canal: MONO Numero de bits: 8 Formato: WAV COMENTARIO:

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

c) Mi voz:

Voz de niño:

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

Sonido del Animal:

Voz de niña:

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

Sonido de puerta:

COMENTARIO: d) Mi voz:

Voz de niño:

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

Voz de niña:

Sonido de animal:

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

Sonido de puerta:

COMENTARIO:

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

CUESTIONARIO 1. ¿Por qué el sonido grabado se guarda en un archivo de extensión .wav? 2. ¿El sonido que ingresa a Matlab es digital o análogo? 3. Investigar 5 aplicaciones del Reconocimiento de Voz en las áreas de la industria, biomédica y domótica. 4. Graficar el sonido generado por las vocales y hacer una pequeña descripción de lo observado. Realiza 3 muestras por vocal; “a” más grave, “a” normal y “a” más agudo. a) “a” grave

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

b) “a” normal

c) “a” aguda

ANALISIS DE SEÑALES

UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR

5. ¿En qué proyecto utilizarías el reconocimiento de voz? Descríbelo. • •

El reconocimiento de voz puede ser usado en todo lo que es domótica, para automatizar las luces de la habitación, los artefactos como ventiladores, etc. Para la identificación del personal de determinada área, evitándonos el uso de carnet.

COMENTARIO:

El reconocimiento de voz es un área de conocimiento de creciente importancia durante esta última década. La introducción de mejores algoritmos, de modelados cada vez más complejos, junto con la aparición de sistemas de cómputo cada vez más potentes y asequibles, hacen posible que los sistemas de interfaz hombre-máquina a través de la voz sean casi una realidad.

ANALISIS DE SEÑALES