01 agosto 2019

L'audio per dummies 6 - salvataggio dei file

I file audio devono essere salvati. Archiviati. Usati.

La prima cosa da distinguere sono i file compressi e i file non compressi:

- i file audio compressi vengono privati di tutto quello che si ritiene inutile ai fini del loro uso, così da lasciare solo le parti indispensabili per poterne ricostruire la struttura rendendo il file piccolo, leggero.

Non è lo zip o ogni altra forma di archivio che ci interessa ora anche se alla fine un accenno lo farò.

Il caso più celebre della compressione audio è quello dell' mp3 e dei suoi valori: 64, 128, 256, 320 per citarne alcuni.
Sono valori di chilobit per secondo, Kbps, ovvero quanta banda di connessione usa quel file per poter essere ascoltato senza interruzioni.
Si è stimato che su un player portatile con cuffiette o in un ascolto on line, 128kbps fosse un ottimo compromesso di velocità dei dati e dimensione del file in rapporto alla resa. Se hai 128 Kbps di banda dati, potrai sentire in streaming una canzone. La tua connessione dati è a 2 Mega? Ok, fai i conti di quanta banda passante hai a disposizione: 1 Kilobit = 0,001 Megabit.
Se sei connesso a Spotify sarai comunque libero di usare la tua connessione mentre ascolti.

Per l'archiviazione, se hai un dispositivo portatile potrai farcene stare nella sua memoria una grande quantità rispetto a file non compressi.

Meno saranno compressi più saranno grandi ma in compenso conterranno maggiori informazioni e quindi suoneranno meglio. La qualità sarà maggiore e quindi gustabile anche su impianti sonori più raffinati di una cuffietta.

Kbps = Kilo bit per secondo - se fossero Byte, B maiuscola sarebbero calcolati in una diversa unità di misura che comprende 8 bit alla volta. By 8, by eight bits, Byte. Il Byte viene usato per le misure di stoccaggio dati e il bit per la velocità dei flussi.

- I file audio lineari o non compressi, contengono tutti i dati campionati.
Per questa ragione saranno più difficili da utilizzare on line.
Infatti il bitrate di un file PCM (non compresso) wav 44.100Hz stereo 16 bit richiederà 1411,20 kbps rispetto ai 128 kbps del suo gemello compresso.

Certo, una normale connessione moderna non sta sotto i 2 Mbps, quindi ci starebbe anche il PCM. Ma immagina quanto spazio servirebbe sui server on line per archiviare tutta quella roba per milioni di utenti e quanti passaggi fanno sui server i file che ascolti in streaming: tantissimi.

non sento differenza tra compressi e non compressi

http://www.thehistoryblog.com/archives/14881

La differenza esiste. I file compressi mancano di molte parti di suono ed è tanto più percepibile quanto maggiore è la compressione.
Per ottimizzare la resa nelle post produzioni è consigliabile usare file non compressi. Tuttavia alcune produzioni come i voice over non presentano sfumature tali da perdersi in un mp3 tanto che anche l'orecchio più esperto su un impianto di ascolto estremamente sensibile non riuscirebbe facilmente a distinguere un file di sola voce parlata 48K 16bit in PCM da uno in 48/K mp3 a 320KBPS.

Va detto che il media finale dove verrà usato il file è il tuo riferimento: se dovrai portare l'audio al cinema dove i file finali sono 48K 24 bit, dovrai tendere ad una qualità pari o superiore e possibilmente non comprimere con perdita di qualità. Se il tuo media finale sarà la radio, probabilmente non si sentirà la differenza in un mix in cui compare un file della voce che era stato compresso a 256Kbps.

Così anche in progetti semplici voce + base mixate su un filmato per Youtube non hai strumenti per distinguere un editing realizzato da due file compressi di buona qualità o da due file PCM.

Esiste anche il formato lossless, senza perdita di qualità. Una soluzione ottima per risparmiare spazio e quindi rendere disponibile lo scambio dei file di produzione senza intaccare la qualità delle registrazioni: FLAC, Apple Lossless per citare i due più celebri ma ne esistono altri come APE, LA, OPTIM e che come tutti i formati compressi necessitano di un CODEC, ovvero del codice informatico per comprimere e decomprimere.

prima di salvare in mp3

Quando si elabora un progetto in una DAW i file compressi vengono comunque decodificati e trasformati in PCM, non vengono mai usati file compressi dentro il software. Questo significa che un file mpeg o FLAC per esempio, ritorna allo stato PCM con i classici parametri di campionamento e i suoi 16 bit. Viene ricostruito.

Ipotizziamo di aver lavorato su un mix con file a 48Khz / 24bit e di voler creare un file finale da pubblicare in formato compresso.
Che sia il caso di fare conversioni a 16 bit con dithering prima di esportare compresso? No, e lo spiega anche il documento della ISO/IEC standards.

Non c'è troncatura del bit perché si tratta di un sistema differente di scrittura del file audio. Se passi da PCM direttamente in mp3 non t'interessa essere già a 16 bit prima della conversione anzi, evita il dithering, sarebbe inutile.
Il dithering infatti altera la forma dell'onda di campionamento e introduce rumori, mentre il compressore mp3 generalmente non si interessa del campione, il file compresso avrà altre caratteristiche di formato. Se ti capita di leggere i dati di un mp3 troverai che risulta essere un file a 32 bit ma una volta decodificato diventa a 16 bit su un editor. Quei 32 bit servono a preservare suono pur eliminando molti dati.

se non lo senti, non esiste

L'mpeg, il sistema di codifica anche dell'mp3 nasconde tutto quello che non è necessariamente percepibile considerando anche il genere di device su cui lavora. Quindi un mp3 molto complesso come un brano musicale o la colonna sonora di un film, ascoltato e confrontato usando un impianto audio molto raffinato presenterà tutti i suoi limiti. Si sentiranno le frequenze scomparse, le parti di suono eliminate. Non le potrà riprodurre perché le ha eliminate:
loss = perdere.
Suoni in primo piano in evidenza verranno mantenuti, quelli più nascosti verranno eliminati. Se si prevede un ascolto a basso bit rate se ne andranno molti dettagli che non sarebbero comunque percepibili sulla piattaforma per cui è pensato quel fattore di compressione.

la compressione nascosta nel wav

I formati PCM di solito usano estensioni WAV o AIF. Il formato WAV (wave) può essere compresso mantenendo l'estensione .wav che a quel punto non è più un PCM: occorre quindi verificare che non sia attiva una compressione nei file wave.

stereo o mono uguali sono

Codec L.A.M.E. uno dei migliori in circolazione ed uno dei più usati in assoluto. I file mp3 stereo e mono hanno lo stesso peso. A differenza dei file PCM che invece tra stereo e mono c'è la metà esatta di differenza: due canali sono il doppio di dati.

Se guardi le dimensioni dei file lo vedi subito.

Questo significa in termini pratici che se ti trovi nella condizione di dover ridurre i dati di un mp3 non è certo mettendolo in mono che ottieni risultati.

bit e frequenze: il regno della confusione

Il computer usa frequenze e bit. Su internet si legge di bit e kilobit. L'audio usa frequenze di campionamento e bit. I codec di compressione usano i bit per la versione del software e per la risoluzione dell'audio. Le casse acustiche rappresentano i suoni in frequenze.

Tutti questi elementi hanno le loro ragioni e sono tutte legate ma differenti. Ecco perché è facilissimo fare confusione.

Computer: usano frequenze per il processore e i bus di sistema e i bit per rappresentare la dimensione dei file che elaborano, a 16 bit, 32bit, 64 bit.
Ci sono chiavi di cifratura per la sicurezza dei dati espresse in bit.

I codec sono software che possono operare su computer a 16, 32 o 64 bit. Si tratta del processore che deve essere in grado di elaborare porzioni di dati più o meno grosse. Un computer a 16 bit non potrà elaborare software creato a 32 bit. Ma si tratta di un parametro puramente informatico.

I codec stessi poi genereranno file audio con una frequenza di riproduzione sonora che corrisponde a quanto noi potremo ascoltare sulle casse: il nostro udito sente vibrazioni dell'aria dai 20 Hz fino al massimo di 20.000 Hz.

I file generati dal codec saranno per esempio di 44.100 Hz che invece è un campionamento informatico capace di riprodurre un suono vero che arriva fino a 20.000 Hz. Facile confondersi.

A questo si aggiungono bit:
usati sia per definire i blocchi di dati per il processore che i blocchi di volume dinamico dei file audio.

I Kilobit: usati per calcolare quanti dati passano in una connessione - internet 20 mega rappresenta la stessa cosa con un valore più grande come da millimetro a centimetro a chilometro.

Dentro un sistema informatico si aggiungono i byte e kbyte, ovvero i bit a gruppi di 8 che si usano per la misura delle dimensione dei file informatici.

Se c'è una K (chilo) davanti il valore è inteso X1000, 1000 bit.
Se c'è una M (mega) sono mille K.
G (giga) rappresentano mille mega.
T (tera) rappresentano mille giga.
Seguono peta, exa, zetta e yotta che moltiplicano il valore con lo stesso meccanismo.

Facilissimo confondersi.

quindi quali sono le frequenze per l'audio?

Se stiamo parlando di file audio a noi interessano sia le frequenze di campionamento che quelle riprodotte nel suono dal file.

Nel suono le frequenze di campionamento sono espresse in Hz (Herz) che a loro volta diventano KHz se moltiplicate per 1000. Quindi quando leggi che l'orecchio umano sente dai 20Hz ai 20KHz la lettura di questi valori dovrebbe essere più chiara: da 20Hz a 20.000Hz.

Sappiamo che per riprodurre suoni su un computer le schede audio devono usare i file campionati secondo uno schema preciso e in particolare per poter raccogliere e riprodurre:
44.100 Hz di campione informatico possono far vibrare frequenze nell'aria fino a 20Khz e oltre (22.200 Hz per dirla tutta).

Un file a 8KHz di campionamento riprodurrebbe al massimo fino a 16KHz di suono.

Sappiamo che quei file devono scorrere dentro circuiti elettronici che hanno una portata come ce l'ha il tubo dell'acqua, deve essere abbastanza grosso da farci passare quei dati senza interruzioni. Pena, il suono saltella, singhiozza, si blocca.

Siccome le connessioni web sono limitate si usano trucchi di compressione e decompressione per far diminuire la dimensione dei file, audio e video.

I valori della compressione di cui detto prima, rendono i file più piccoli sia per lo streaming sia per l'archiviazione sulle memorie e un file una volta compresso non ritrova più le sue originali condizioni, eccetto forse i sistemi di compressione chiamati loss less, ovvero senza perdite.

... bit?

Il bit non ha nulla a che vedere con i bit dei calcolatori e dei file crittografati. Anche se sono parenti, nell'audio il bit (o quantizzazione) esiste per lo più in blocchi da 8, 16, 24 e 32 bit. Riguardano la raffinatezza in cui viene fotografato o trattato il file nella sua dinamica. Sotto trovi un link all'argomento dove te ne parlo in modo più dettagliato.

che faccio, lo zippo?

In apertura avevo accennato ai file zippati: qualunque sia il sistema, RAR, ZIP, TAR, BZ2, XZ, GZ, 7z, ISO.

Zippare deriva dal nome del sistema .zip ma ne esistono molti altri di contenitori. Ma sono contenitori che comprimono è vero,

Negli audio e video fanno pochissimo, non hanno caratteristiche adatte a riscrivere quei file come fanno invece i compressori dedicati.
In realtà, un file su bianco (solo voce) se nelle parti di silenzio non ha alcun rumore di fondo viene considerato come privo di dati e quindi zipparlo lo rende di dimensioni minori.

La compressione ZIP o RAR non elabora i file audio e video, si occupa solo di inscatolare i file togliendo esclusivamente gli spazi vuoti e non sono adatti allo streaming. Oltre a questo nel tempo possono corrompersi e rendere indisponibili i file contenuti.

quindi come salvo?

Per esempio: se hai registrato a 44.1 e a 24 bit, tienilo così e salvalo così.
PCM 44,1 24 bit.

Se hai registrato a 48/24 e devi inviare un file 44.1/16 bit, dovrai per forza fare un dithering in fase di salvataggio. Dipende da cosa ti offre il sistema che usi, in genere il POW-3 e l'UV22HR sono molto affidabili e puliti. L'ideale sarebbe registrare sempre come deve poi essere salvato. L'importante sarebbe non fare mai upsampling, cioè se hai lavorato a 44.1 e converti a 48K non guadagni nulla se non spreco di spazio.

Se devi salvare in mp3 puoi anche salvare tutto come hai settato il software e poi usare un compressore che si incarichi di convertire e comprimere anche da 48/24 a 44,1 mp3. Senza ulteriori conversioni.

Stereo o mono per la voce non ci sarebbero differenze se non in certe DAW che perdono 6dB di suono perché non gestiscono l'assenza di un canale nel PAN.
Ma la voce è monofonica.

Tutto qui.

Grazie per essere passato di qua.

i precedenti

L'audio per dummies 1 intro e zona d'ascolto

L'audio per dummies 2 i Livelli in ingresso

L'audio per dummies 3 i Livelli in uscita

L'audio per dummies 4 hardware e frequenze

L'audio per dummies 5 - quantizzazione jitter e dither - home studio

Scrivi commento

Commenti: 1

#1
Antonio (lunedì, 01 marzo 2021 14:48)

Ciao Paolo,
un mondo che mi ha sempre affascinato e con questo "blog" mi hai fatto un po di chiarezza...
Grazie e complimenti.