¿Cuál es la estructura exacta de un archivo de audio? ¿Cómo se almacena? ¿Cómo es leído y reproducido por un reproductor multimedia?

Veamos primero la estructura de un archivo de audio.
Es una matriz (Nx1) de muestras que representa los valores de amplitud en un instante de tiempo específico (una muestra). Cuando estas N muestras se atraviesan a una “tasa” conocida como tasa de muestreo, en realidad escuchamos su forma de audio. Lo que significa que escuchas miles de muestras cada segundo (generalmente 44KHz para música). Si su matriz es Nx2, sugiere que su archivo de audio tenga salida estéreo.
Esta forma de onda contiene 24K muestras grabadas a una frecuencia de muestreo de 16KHz. Por lo tanto, la duración es de ~ 1.5 segundos.

¿Cómo se almacena esto?

Inicialmente, mientras graba el audio, el procesador interpreta su audio como una secuencia de bits y lo escribe en la memoria. Pero antes de que lo escriba en la memoria, generalmente realiza alguna modificación. Un software (códec) lee este flujo de bits y lo codifica en uno de los formatos de la industria. Esto se hace para reducir el ancho de banda de transmisión y los requisitos de almacenamiento.

Digamos que tiene su archivo mp3 listo en su tarjeta de memoria. Tiene que haber algún tipo de comunicación entre el procesador / controlador del reproductor y la tarjeta de memoria. Consideremos el protocolo SPI ya que es simple y lo que viene junto con las tarjetas de memoria que usamos en estos días (por ejemplo: SanDisk)


Fuente de la imagen: Wikipedia

Estas interfaces periféricas seriales vienen con Master in Slave out / Master out Slave in, popularmente MISO / MOSI. Estos son los cables que transportan la información de audio. SCLK es un reloj en serie que se utiliza para temporizar (la entrada se lee en el flanco ascendente y la salida se propaga en el flanco descendente).

También hay protocolos como UART / I2C que el controlador utiliza para comunicarse con la tarjeta de memoria.

El reproductor de mp3 es una máquina de estados finitos. Tiene estados como Reproducir, Pausa, Repetir, Parar, etc. Durante el estado de reproducción, el controlador verifica los bytes para leer de la tarjeta SD y continúa leyendo hasta que no hay nada que leer (final de la lista de reproducción). En este estado, hay un apretón de manos continuamente entre el controlador y la tarjeta SD.
Procesador: ¿Tiene suficientes bytes?
Tarjeta SD: Sí, aquí tienes.


..
Esto continúa hasta que se haya reproducido todo el audio y finalmente va al último estado de la máquina de estados (por ejemplo: Repetir).
Durante los estados de pausa y parada, el bucle de reproducción recibe instrucciones de estar inactivo (en parada, el puntero se dirige al comienzo del archivo de audio).

Esta es una pregunta interesante … para responder esto, me gustaría que le presentara algunos conceptos básicos … cuantificación y frecuencia …
Entonces, ¿qué es la cuantización … es solo el proceso de conversión de valor continuo (analógico) a valor discreto (números) … para ser más detallados, las señales de audio se pueden visualizar como una onda sinusoidal … si se representa en x, El gráfico y para cada valor de x correspondiente al valor y estará allí … Supongo que no te estoy confundiendo mucho … simplemente reemplaza el eje x con el tiempo … así que para cada intervalo de tiempo t tendrás el valor y correspondiente que es la amplitud …
la lectura puede verse así … t1 = 5, t2 = 3, t3 = 2, etc.
La frecuencia no es una de las veces que esto se hace durante un segundo … si la frecuencia es 120, dentro de un segundo se capturará 120 valores discretos de la muestra de audio …

Este valor capturado se almacenará como digital que es 0 y 1 … para los valores que hemos tomado, los valores serán t1 = 101, t2 = 011, t3 = 010. La conversión puede variar según el formato utilizado como mp3, aac … pero a alto nivel esto es lo que está sucediendo … por lo que nuestro decodificador de audio hará lo contrario de esto … acabo de explicarlo con amplitud … pero otros aspectos de la fase de audio también se capturarán de manera similar … espero que esto aclare sus dudas ..

More Interesting

¿Influyen los medios en las discusiones / preguntas / respuestas sobre Quora?

¿Están los presentadores de noticias y corresponsales mirando solo cámaras o cámaras con videos de las personas con las que están hablando en programas como CNN?

¿La industria de la televisión va a cambiar a 360 y finalmente a contenido de Realidad Virtual (VR)?

¿Los medios nacionales son realmente independientes en la India?

¿Qué impacto tienen los medios y la 'sociedad' en el punto de vista de la vida cotidiana?

¿Quién puede exponer un medio cuando el medio mismo está dañado?

¿Estás de acuerdo con el apagón mediático de #MacronGate?

¿Por qué los medios indios dan más importancia a aquellos que en realidad no son nada?

¿Por qué vemos más periodismo basado menos en hechos que en especulaciones?

¿El arte digital eventualmente se hará cargo de los medios más tradicionales?

¿Por qué los medios estadounidenses se centran en los ataques terroristas del Medio Oriente cuando los hombres conservadores blancos cometen muchos más?

¿Es paranoico que creo que los medios determinan casi todos los enfoques que la humanidad tiene sobre casi cualquier cosa?

¿Cuáles son las diferencias entre los medios occidentales y los medios chinos?

¿Qué personas en el mundo entienden Internet mejor que nadie?

¿Por qué Bihar está siempre bajo el escrutinio de los medios de comunicación y siempre es ridiculizado por otros indios, incluso cuando Biharis es una persona trabajadora y talentosa?