WAV, MP3, AAC, MIDI: guida ai formati audio (e dintorni!) – parte 1/2

WAV, MP3, AAC, MIDI: guida ai formati audio (e dintorni!) – parte 1/2

Formati audio digitaliSulla questione dei formati audio digitali c’è da sempre un po’ di confusione. Non tutti infatti sanno quale sia il processo che trasforma la musica in zeri e uni, rendendola così scrivibile su un CD, né cosa accada esattamente quando si trasforma una canzone di un CD in un file MP3.  Eppure la materia non è complicata.

In questo post, che per comodità uscirà in due “puntate”, cercherò di fare chiarezza su alcuni di questi argomenti.

In questa prima parte tratteremo la digitalizzazione del suono (campionamento e quantizzazione). Nella seconda, invece, parleremo dei formati audio compressi più comuni (MP3 e AAC) e del protocollo MIDI, di cui si sa solitamente poco e che per questo genera molta confusione.

Digitalizzare il suono: campionamento e quantizzazione

Sembra incredibile, ma se oggi possiamo ascoltare la musica su CD il merito è di un matematico francese nato del XVIII secolo: Joseph Fourier. Con un suo teorema, infatti, ci ha spiegato come si possa  scomporre qualunque suono (anche il più complesso) in tanti suoni semplici, rappresentabili graficamente. Più precisamente, grazie alla cosiddetta comandata di Fourier possiamo “disegnare” ciascun suono che compone una canzone sotto forma di una sinusoide. Essendo essa una rappresentazione semplice, studiarla e lavorarci su è un’impresa affrontabile senza troppe complicazioni.

Per sua natura, però, questa rappresentazione della forma d’onda (come qualunque altro fenomeno fisico) è formata da infiniti punti. Questo è un problema, perché così com’è non è possibile rappresentarla con dei numeri (quindi digitalizzarla) in quanto anche questi numeri sarebbero infiniti. E allora?

E allora dobbiamo prendere dalla forma d’onda dei punti a campione (da cui il nome “campionamento”), che la rappresentino meglio possibile. Il risultato che si deve raggiungere è di avere una specie di “riassunto” della forma d’onda che sia più fedele possibile all’originale ma che sia rappresentabile con una quantità di numeri ragionevolmente piccola, e quindi scrivibile su un CD audio che ha una capienza massima limitata.

L’operazione con cui si riassume la forma d’onda in una serie discreta di punti presi a campione si chiama dunque campionamento. Quella con cui assegniamo a ciascuno di questi punti un valore numerico (che poi sarebbero gli zeri e gli uni che sono scritti , ad esempio, su un CD) si chiama “quantizzazione“.

La frequenza di campionamento si misura in Hertz (abbreviato: Hz); un campionamento a 44.100 Hertz vuol dire che per ogni forma d’onda vengono scelti  44.100 punti ogni secondo. I CD audio tradizionali usano proprio questa frequenza di campionamento.

L’unità di misura della quantizzazione, invece, è il bit. Guarda il disegno: nell’asse orizzontale è rappresentata la frequenza di campionamento, mentre su quello verticale è rappresentata la quantizzazione. Tanto più alta è la frequenza di campionamento, e tanti più sono i bit usati per quantizzare, tanto più precisa è la rappresentazione della forma d’onda originale.

Campionamento e quantizzaziooneIn pratica è come avere una griglia: più è fitta, più fedele sarà la ricostruzione della sinusoide che rappresenta i suoni che stiamo digitalizzando. Un file audio campionato a 44.100 Hz e quantizzato a 16 bit, quindi, rappresenterà un suono con minor precisione di quanto non farà un campionamento a 48.000 Hz e una quantizzazione a 24 bit, perché la griglia è più fitta.

Tutto questo processo viene svolto da un convertitore detto “A/D”, cioè “analogico/digitale” che, per riassumere, prende un suono “reale”, lo divide in tante onde semplici, campiona ciascuna di esse, la quantizza e la trasforma quindi in numeri, scrivibili su un CD, o su un qualunque altro apparecchio digitale.

E quando viene il momento di “ascoltare” questi numeri? Ci pensa un altro convertitore, chiamato “D/A”, cioè “digitale/analogico”. Questo, come avrai intuito, legge gli zeri e gli uni creati dal convertitore A/D, ricrea tutti i puntini che rappresentano le forme d’onda originarie e le ritrasforma in suoni, che un amplificatore e delle casse (o delle cuffie) rendono udibili. E il gioco è fatto.

I formati audio

Abbiamo quindi capito una cosa: la musica che ascoltiamo su un CD acquistato in un negozio di musica contiene materiale audio che è un “riassunto” di quello prodotto dalle chitarre, violini e percussioni con cui i brani musicali sono stati registrati. Ciononostante la somiglianza con il materiale originale è elevata, e l’ascolto gratificante.

Abbiamo anche già detto che la frequenza di campionamento dei brani di un CD audio è di 44.100 Hertz, e la quantizzazione è a 16 bit. Questo, calcolatrice alla mano, vuol dire che, per ogni secondo di musica, avremo 1.411 kilobit di informazioni (44.100 Hz*16 bit*2 canali) che il convertitore D/A trasformerà in musica.

Tieni a mente questo numero, che si chiama bit rate, perché nella seconda parte di questo post ci sarà utile per introdurre il discorso sulla compressione dei file audio, e per parlare quindi dei formati musicali che in questo ambito la fanno da padroni: MP3 e AAC.

(Vai alla seconda parte)

  • Link copiato!
Visualizzazione commenti in corso...