ANÁLISIS ACÚSTICO DE LA VOZ ESPECTROGRAFÍA E ÍNDICES DE PERTURBACIÓN ACÚSTICA Evaluación funcional Estudio aerodinámi
Views 145 Downloads 3 File size 942KB
ANÁLISIS ACÚSTICO DE LA VOZ ESPECTROGRAFÍA E ÍNDICES DE PERTURBACIÓN ACÚSTICA
Evaluación funcional
Estudio aerodinámico
Espectrografía
Electroglotografía
PRAAT
Exploración neurofisiológica Laboratorio de Voz
Wave Surfer
Programas de Análisis acústico
Speech Filig system
Gram
Programas de grabación
Anangraf Android
iOS
Un poco de historia…
Helmholzt (1863) - Análisis de componentes del sonido a través del oído
- Resonadores
Técnicas instrumentales - Steinberg 1934 - Young, Schuk, 1943
Espectógrafo del sonido Laboratorios Bell Telephone Koening et al, 1946
2ª guerra mundial: análisis de mensajes
Transformación a señal digital (computacional)
1. Obtención de la muestra
Lugar: Escaso ruido externo, o aislado acústicamente
Emisión: /a/ al menos 3 segundos; frases; glissando, etc. Idealmente en tono e intensidad confortables
Micrófono: Baja impedancia, curva de respuesta de frecuencia plana (20-20.000 Hz), unidireccional, de condensador, a 20 cm de la boca.
Análisis acústico
Medida indirecta del patrón vibratorio de las cuerdas vocales
Forma del tracto vocal y sus variaciones en el tiempo
vocales
Análisis Acústico Ventajas
Desventajas
•Identificar componentes de la disfonía •Valorar la evolución, evaluación transterapéutica •Sencilla utilización
•Variabilidad de la emisión •No sirve valorarlo por si solo •Falta de estandarización de los resultados, unidades imprecisas
Análisis acústico
FRECUENCIA DE MUESTREO
Teorema de Nyquist: No es necesaria una frecuencia infinita para retener toda la información de la señal.
Frecuencia mínima de muestreo debe ser al menos del doble de la frecuencia máxima
Frecuencia de muestreo: muestras x segundo
Análisis acústico
Frecuencia de muestreo
Teorema de Nyquist
Selección de la muestra:
Para el análisis no considerar ataque ni “filatura” (final de emisión)
Mínimo 250 mseg.
Análisis Acústico: Frecuencia
F0
= TMH?
Rango
frecuencial: 80-500 hz (voz hablada)
Extensión Análisis
tonal: Pich min / Pich máx.
del contorno en el eje temporal
Análisis Acústico: Intensidad
Forma de la onda sonora: "onda sonora y contorno adecuado para emisión dada" si la amplitud va cambiando en el eje temporal "la forma y la amplitud se van modificando a medida que transcurre la amplitud en el eje temporal“
Frecuencia v/s intensidad: Intensidad se mantiene estable a medida que aumenta la frecuencia, o son independientes
ESPECTROGRAMA
Banda ancha (0.005): mejor análisis de los fenómenos del habla. Buena resolución espectral
Banda angosta (0.03): mejor análisis de los armónicos de la voz. Mejor resolución temporal
Formante: análisis
Frecuencia: Fant (1956) “pico de la envolvente que encierra los picos de los armónicos”
Ancho de Banda: Diferencia que hay entre los dos picos 3 dB más debajo de la frecuencia del formante. A menor valor, mas aprovechamiento deenergía
Hasta 2000 hz el promedio es de 50 hz
F1: 80 Hz
F2: 100 Hz
F3: 120 Hz
Nivel de intensidad: dB del formante, otorga la naturalidad del sonido
Análisis de Armónicos
Presencia de armónicos estables en toda la emisión
Armónicos presentes hasta zonas agudas (“se observan armónicos en toda la franja frecuencial” “se empiezan a perder a partir de … "presenta armónicos en las frecuencias bajas hasta 1500 hz, zona a partir de la cual comienzan a desdibujarse y comienzan a ser reemplazados por ruido, a partir de los 2500 hz. A nivel perceptual podemos consierar un soplo, o escape de aire lo que se refleja en el espectrograma por la debilidad armónica y la presencia de ruido.”)
Presencia de subarmónicos
Ausencia de armónicos soplocidad
ASPEREZA= SUBARMÓNICOS
Parámetros de ruido
Medidas de Perturbación
Qué tan estable o variable es la emisión del sonido
Son útiles solo en ciertos casos, ej:
Según National Center for Voice and Speech: VOZ TIPO 1, 2 Y 3
Tipo 1 • Señales casi periódicas • Confiable por si solo. (cuando son menores a 5%)
Tipo 2 • Intermitencias, subarmónicos, aperiodicidades • requiere apoyo de análisis espectral
Tipo 3 • Señales caóticas, aperódicas • No es útil, mejor GRBAS o RASATI
Medidas de Perturbación: Jitter
Variaciones de la frecuencia ciclo a ciclo
Causas:
Neurológicas: Por falta de control del sistema nervioso sobre los músculos vocales
Aerodinámicas: Cuando hay un defecto del cierre glótico que puede provocar un escape de aire que haga vibrar irregularmente las cuerdas.
Mecánicas: cuando hay asimetrías en la masa de las cuerdas o cambios en las propiedades biomecánicas de éstas.
Importante: descartar inicio y final de la emisión.
Medidas de perturbación: jitter
Medidas de perturbación: Shimmer
Disminuye al aumentar la intensidad
ANÁLISIS ACÚSTICO DEL CANTO
Formante del cantante: Acumulación de energía en los formantes altos, cercano a 3000 Hz (Evaluar en /u/ /a/, nunca en la /i/ porque de por si refuerza F3)
Sopranos: coincidencia de armónicos bajos con F1 y F2 fenómeno de cobertura
Análisis acústico del canto
registro modal o de pecho: predominio del segundo armónico. El coeficiente de contacto es alto, el contacto cordal es espeso.
belting: sigue predominando el 2o armónico, pero es de cabeza.
el de cabeza pasa el predominio del 2o armónico al primer armónico.
Análisis acústico del canto
Vibrato
Rate
*Formante del hablante: refuerzo del F3.
vibrato