UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR LABORATORIO: Procesamiento y Reconocimiento de Audio OBJETIVO: Aplicar lo
Views 217 Downloads 2 File size 3MB
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
LABORATORIO: Procesamiento y Reconocimiento de Audio OBJETIVO: Aplicar los conceptos teóricos para resolver problemas reales de la vida cotidiana. El estudiante luego de realizar los experimentos deberá tener la capacidad de mejorar los algoritmos de procesamiento y reconocimiento de voz para su aplicación en cualquier sistema. MATERIAL:
Una computadora o laptop. Software Matlab. Micrófono de PC. Parlantes de PC.
%lectura de señal de audio [s Fs]=wavread('cancion.wav'); %Reproduccion de la señal wavplay(s, Fs); plot(s);
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR %lectura de señal de audio [s Fs]=wavread('voz.wav'); %Reproduccion de la señal wavplay(s, Fs); plot(s);
%lectura de señal de audio X=wavread('cancion.wav'); %Reproduccion de la señal wavplay(X, Fs); plot(X);
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR %lectura de señal de audio Z=wavread('voz.wav'); %Reproduccion de la señal wavplay(Z, Fs); figure; plot(Z)
%lectura de señal de audio W=wavread('cancion1.wav'); %Reproduccion de la señal sound(W, Fs); figure; plot(W);
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR G=fft(X); G1=abs(G); figure subplot(1,3,1);plot(G); subplot(1,3,2);plot(G1);
F=fft(Z); F1=abs(F); figure subplot(2,3,1);plot(F); subplot(2,3,2);plot(F1);
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR H=fft(W); H1=abs(H); figure subplot(3,3,1);plot(H); subplot(3,3,2);plot(H1);
}}
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
Solucion a)
b)
c)
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
d)
e)
Solucion:
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR a) Este procedimiento se realizo en la pregunta anterior (observar las imágenes). b) Mi voz: Frecuencia de muestro: 44 100 Hz Tiempo de duracion: 20 segundos Canal: MONO Numero de bits: 24 Formato: WAV Voz de niño: Frecuencia de muestro: 8 000 Hz Tiempo de duracion: 20 segundos Canal: ESTEREO Numero de bits: 16 Formato: WAV Voz de niña: Frecuencia de muestro: 8 000 Hz Tiempo de duracion: 20 segundos Canal: MONO Numero de bits: 32 Formato: WAV
Sonido de animal: Frecuencia de muestro: 44 100 Hz Tiempo de duracion: 20 segundos Canal: ESTEREO Numero de bits: 16 Formato: WAV Sonido de puerta: Frecuencia de muestro: 8 000 Hz Tiempo de duracion: 20 segundos Canal: MONO Numero de bits: 8 Formato: WAV COMENTARIO:
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
c) Mi voz:
Voz de niño:
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
Sonido del Animal:
Voz de niña:
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
Sonido de puerta:
COMENTARIO: d) Mi voz:
Voz de niño:
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
Voz de niña:
Sonido de animal:
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
Sonido de puerta:
COMENTARIO:
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
CUESTIONARIO 1. ¿Por qué el sonido grabado se guarda en un archivo de extensión .wav? 2. ¿El sonido que ingresa a Matlab es digital o análogo? 3. Investigar 5 aplicaciones del Reconocimiento de Voz en las áreas de la industria, biomédica y domótica. 4. Graficar el sonido generado por las vocales y hacer una pequeña descripción de lo observado. Realiza 3 muestras por vocal; “a” más grave, “a” normal y “a” más agudo. a) “a” grave
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
b) “a” normal
c) “a” aguda
ANALISIS DE SEÑALES
UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR
5. ¿En qué proyecto utilizarías el reconocimiento de voz? Descríbelo. • •
El reconocimiento de voz puede ser usado en todo lo que es domótica, para automatizar las luces de la habitación, los artefactos como ventiladores, etc. Para la identificación del personal de determinada área, evitándonos el uso de carnet.
COMENTARIO:
El reconocimiento de voz es un área de conocimiento de creciente importancia durante esta última década. La introducción de mejores algoritmos, de modelados cada vez más complejos, junto con la aparición de sistemas de cómputo cada vez más potentes y asequibles, hacen posible que los sistemas de interfaz hombre-máquina a través de la voz sean casi una realidad.
ANALISIS DE SEÑALES