Lezioni sul metodo di studio
27 Gennaio 2019Francesco Guccini e la primavera della libertà
27 Gennaio 2019MP3
Audio e computers – la musica digitale
Con la nascita dell’elettronica si è capito ben presto che le potenzialità dei sistemi digitali sarebbero state enormi; la produzione delle prime macchine da scrivere con memoria e schermo a cristalli liquidi, che permettevano (addirittura!) di modificare e correggere il testo a proprio piacimento prima di stamparlo sul foglio, è stata la scintilla che ha permesso l’inizio di una transizione profonda che ha portato dalle scomode tecniche manuali alla odierna tecnologia digitale.
Il percorso di clonazione, che ha interessato per prima la scrittura, si è in seguito subito esteso agli altri mezzi di comunicazione; forse nessuno si sarebbe mai aspettato che questa quasi “inutile” comodità avrebbe provocato una vera e propria rivoluzione tecnologica, un radicale cambiamento delle abitudini di tutto il mondo, il raggiungimento di sogni che fino ad allora erano sembrati così lontani!
La conversione di qualsiasi forma di audio (musica, suoni…) e video (fotografie, filmati…) in dati memorizzabili ed utilizzabili da un computer avrebbe infatti permesso, oltre alla possibilità di ritoccare piccoli errori, o di aggiungere effetti artificiali al prodotto già finito, di creare dal nulla perfette sinfonie classiche o godibili pezzi rock, film proiettati nel futuro o ambientati in un periodo storico ormai lontano, studi virtuali, ecc…; per non parlare poi della possibilità di scambiare i dati stessi da un computer all’altro anche distanti centinaia di migliaia di chilometri, mediante cavi, segnali radio e collegamenti via satellite…
Ed è proprio quello che oggi possiamo fare! Bello eh?
Ora soffermiamoci principalmente sull’audio (che ci interessa più da vicino) e vediamo meglio come funziona il trasferimento del segnale musicale su di un supporto digitale.
Per prima cosa, che cosa significa “sistema digitale” ed in che modo è possibile rappresentare un brano musicale su di esso?
Ad esempio un computer è un sistema digitale, cioè si basa su sequenze di cifre (digit in inglese) che possono assumere esclusivamente valore 0 o 1, cioè binario ( BIT = BInary digiT).
Anche la memorizzazione dei dati viene fisicamente effettuata tramite sequenze più o meno lunghe di 0 e 1.
Un brano musicale è fisicamente formato da infinite sollecitazioni acustiche sinusoidali (dette onde) sommate le une sulle altre con maggiore o minore ampiezza.
Ogni onda acustica è rappresentabile in un grafico come una linea che varia in funzione del tempo.
E’ quindi possibile memorizzare sulla memoria del computer queste coppie di valori “ampiezza dell’onda” e il relativo “tempo” in cui è stata rilevata quella ampiezza; in questo modo ho trasferito una ben determinata onda sul mio computer e posso anche modificarla, variando a mio piacimento l’ampiezza di un singolo valore; posso anche cancellare una parte dell’onda, sostituendo i valori rilevati in quel preciso intervallo di tempo con una sequenza di bit nulli.
Questo è quello che viene realmente fatto; ad essere più precisi, devo anche poter memorizzare una onda che abbia valori di ampiezza diversi da 0 e 1, per seguire con maggior precisione la dinamica del segnale musicale. Altra limitazione è il fatto che non posso gestire infiniti istanti di tempo del segnale musicale, devo cercare degli intervalli di tempo abbastanza piccoli in cui suppongo che il segnale audio abbia un valore costante. L’inizio di ogni intervallo viene detto istante di campionamento e mi definisce una coppia “ampiezza dell’onda” “istante di lettura ( o di campionamento)”; in questo modo posso avere un numero finito di campioni del mio brano musicale (la memoria del computer non e’ infinita, dopo un po’ termina!).
Per risolvere il primo problema, cioè l’estensione in ampiezza del mio segnale musicale al di fuori di 0 e 1, raggruppo i bit a gruppi di 8 o 16 e memorizzo così il brano come coppie “ampiezza 8/16 bit del campione” “relativo istante di campionamento”. Questo meccanismo si chiama “quantizzazione”, cioè prendo il valore massimo del volume del mio segnale e quello minimo e divido l’intervallo tra i 2 estremi in un numero finito di valori di ampiezza.
Utilizzando 8 bit l’ampiezza del segnale campionato può variare tra -128 (minimo) a 128 (massimo), con 16 invece tra -32678 a +32678; quindi a scapito di occupare 8 bit in più di memoria per ogni istante di campionamento, ottengo una migliore qualità sonora, intesa come descrizione molto più particolareggiata del mio segnale musicale.
Questo fatto è molto importante, perché quando, dopo aver modificato il mio brano, io voglia ritrasmetterlo su un supporto audio con una qualità sonora molto alta ( un cd ad esempio), potrei trovarmi nella condizione di non sapere più ricostruire completamente il segnale di partenza! Il messaggio è: se voglio essere troppo avaro nell’occupazione di memoria, il costo da pagare è nella peggiore qualità di riproduzione audio ( e lo vedremo bene in seguito perché è il punto cruciale su cui si basa la tecnologia mp3); quindi attenzione a come si descrivono le ampiezze di un segnale audio!
Non bisogna però stare attenti soltanto a disporre di una abbondante quantità di bit per memorizzare le variazioni di ampiezza del segnale; gioca un ruolo fondamentale anche la distanza tra i vari istanti di campionamento del brano musicale.
Se per esempio campiono un brano musicale usando un campione ogni 10 secondi, sarà poi molto difficile (diciamo impossibile) ricostruire la canzone come era all’inizio. Per questo devo disporre degli intervalli di campionamento appropriati, molto ravvicinati, anche a distanza di millesimi di secondo!
Esiste un preciso teorema (Teorema di Shannon) che regola questo intervallo di tempo; tornando al discorso che un brano musicale è formato da infinite onde, ogni onda ha una ben precisa frequenza, cioè velocità di vibrazione. Quando si dice che un segnale musicale è formato da tante frequenze, si intende che è somma di tante onde acustiche sinusoidali con frequenze diverse.
Il teorema di Shannon sul campionamento stabilisce (secondo precise considerazioni spettrali) che la frequenza di campionamento (cioè ogni quanti secondi devo prendere un campione dal brano musicale) deve essere almeno il doppio della maggiore frequenza che è presente nel brano.
Anche qui vediamo cosa vuol dire in termini di occupazione di memoria: più il brano musicale è articolato e vario, più e’ ricco di alte frequenze; dovrò quindi aumentare la frequenza di campionamento, cioè scegliere più campioni dal mio segnale audio, per non rischiare di perdere queste alte frequenze che sono essenziali per mantenere inalterata la qualità del brano musicale; ogni campione verrà rappresentato come detto da coppie “ampiezza in 8/16 bit (detto volgarmente ‘volume’, per capirci)” “relativo istante di campionamento”; quindi prendere più campioni vuol dire avere tanti bit in più da memorizzare e quindi utilizzo maggiore della memoria!
Anche in questo caso per riuscire a mantenere la canzone nella sua qualità originaria, devo assolutamente utilizzare molti più bit per descriverla; questo è il principio su cui si basa la tecnologia mp3.
La nascita del formato mp3
che cosa e’ e a che cosa serve
Abbiamo visto nel paragrafo precedente come la qualità del segnale audio presente su di un supporto digitale sia proporzionale alla memoria occupata.
Quello che segue è un esempio numerico per mostrarne gli ordini di grandezza:
Un brano musicale contenuto su di un cd contiene frequenze non superiori ai 22 kHz.
Per quanto detto sarà sufficiente campionare al doppio della frequenza massima ( 22 kHz * 2 = circa 44 kHz; la frequenza reale a cui si campiona è 44.1 kHz) usando 16 bit per la quantizzazione delle ampiezze ( si è visto sperimentalmente che 16 bit bastano per non variare la qualità del segnale).
Campionare a frequenza 44.1 kHz vuol dire prendere 1 campione ogni 22.6 micro secondi (cioè ogni 0.000022675 secondi!).
Ad ogni campione associamo quindi la sua ampiezza come un numero a 16 bit.
Se scegliamo di campionare 1 minuto di musica:
in 1 secondo prendo 44100 campioni.
in 1 minuto prendo circa 2646000 campioni; moltiplico per 16 bit/campione.
Ottengo che per memorizzare su di un supporto digitale 1 minuto di musica in qualità cd ho bisogno di 42336000 bit, cioè circa 5 Mbytes di memoria!
Essendo poi i brani stereo, cioè formati da 2 canali indipendenti, devo moltiplicare quel numero per 2 ottenendo 10 Mbytes!
Andiamo avanti… e se volessi far ascoltare questo minuto di musica ad un mio amico? Niente di più facile, potrei spedirglielo in E-mail; senza contare che con un normale modem a 28.8 ci metterei:
10Mbyte * 8bit/byte / 28800bit/sec = 2777 secondi; circa 46 minuti
Solo per trasmettere 1 minuto di musica stereo!
Ecco che quindi i costi in termini di memoria, bolletta telefonica e tempo speso cominciano a diventare un po’ proibitivi.
E se riuscissi a trovare una speciale codifica che mi permetta di comprimere questi 10 Mbytes in poco meno di 1 Mbyte? Il tutto incomincia a diventare più ragionevole…
Ma e’ possibile? SI!
E’ proprio il compito dello standard MP3, cioè MPEG 1 layer III.
Lo standard MP3 è in poche parole un algoritmo che implementa moderne tecniche di percezione sonora dell’apparato uditivo umano per raggiungere una elevata compressione dei dati senza una percettibile perdita di qualità.
Lo standard è stato studiato dall’MPEG, il Gruppo di Esperti per le immagini (Pictures) in Movimento; infatti stabilisce la sintassi e i metodi di compressione per audio e video a basso bitrate ( cioe’ bit/secondo), per riuscire cioè a comprimere così tanto da permettere l’invio dei dati su canali di trasmissione molto lenti. In realtà il “layer III”, che è la denominazione di uno degli algoritmi di codifica (layer I, layer II, layer III) utilizzati nello standard MPEG 1, è stato sviluppato nel 1991 dal Fraunhofer IIS (Institut Integrierte Schaltungen) di Erlangen in Germania ed è stato inserito subito tra i possibili schemi di codifica dello standard.
L’algoritmo layer III è attualmente il più potente dei 3 ( layer I, layer II, layer III) e riesce a raggiungere rapporti di compressione elevatissimi, da 1:10 fino a 1:12 ( da 10 Mbytes a 1 Mbyte) senza variare la qualità del suono.
Per un segnale stereo, una tale compressione corrisponde ad una velocità di trasmissione da 128 fino a 112 kbit per secondo ( 1 minuto occuperebbe dai 128kbit/sec * 60sec/min = 7680kbit / 8bit/byte = 960 kbyte agli 840 kbyte). E’ quindi possibile per esempio ascoltare un brano musicale in qualità cd in tempo reale utilizzando due linee isdn da 64 kbit/sec. ( Solo per confronto, la velocità di lettura dei dati audio da CD, che vengono memorizzati senza alcuna compressione, è di circa 2Mbit/sec; dall’R-DAT di 2.46 Mbit/sec ).
Ecco alcuni dati che mostrano quanto è possibile risparmiare in termini di occupazione di memoria a discapito della qualità del suono utilizzando sempre l’algoritmo “layer III”:
Qualita’ | Banda | Modo | Bitrate | Fattore di riduzione |
telefono | 2.5 kHz | mono | 8kbps | 96:1 |
meglio delle SW | 4.5 kHz | mono | 16 kbps | 48:1 |
meglio dell’AM | 7.5 kHz | mono | 32 kbps | 24:1 |
simile all’FM | 11 kHz | stereo | 56..64 kbps | 26..24:1 |
quasi CD | 15 kHz | stereo | 96 kbps | 16:1 |
CD | > 15 kHz | stereo | 112..128 kbps | 14..12:1 |
Per quanto riguarda i 2 altri algoritmi ( I e II) verrebbe spontaneo chiedersi a che cosa possano servire se già il III è così efficiente.
Chiaramente come in tutte le cose, la maggiore efficienza del layer III, in termini di maggiore compressione per la stessa qualità, viene pagata in una maggiore complessità nell’algoritmo di codifica e quindi maggiore tempo di codifica. l’I è molto più veloce, ma meno performante; è stato progettato principalmente per il DCC (Digital Compact Cassette) della Philips dove veniva usato a 384 kbps (2×192 kbps) e originariamente si chiamava PASC (Precision Adaptive Subband Coding). Oggi lo troviamo anche nei cosiddetti “Solid State Audio” cioè le frasi nei parcheggi o ai caselli, nei CD-i Full Motion Video…
Il layer II rappresenta invece un buon compromesso tra velocità e qualità; infatti ha molte più applicazioni: CD-i, Video CD, DAB (Digital Audio Broadcasting), DVD, radio via cavo e via satellite, tv via cavo e via satellite, links ISDN, colonne sonore dei film…
Il formato MP3 è correntemente usato in alcune applicazioni che dispongono di poche risorse ( in termini di banda e memoria ); oltre ai già accennati collegamenti audio tramite isdn, viene utilizzato nei servizi di Audio-on-Demand (musica a richiesta), radio digitale via satellite, audio su intenet etc…
Proprio per il mercato dell’audio-on-demand è stato già prodotto anche uno schema di protezione chiamato MMP ( formato di Protezione MultiMediale) che servirà anche per tutelare i diritti dell’industria musicale su internet.
I trucchi e i segreti del formato mp3
Come e Perché funziona
Ma come fa questo algoritmo a raggiungere tali livelli di compressione?
Provando infatti a comprimere un file audio in formato .WAV ( cioè trasferito da cd senza alcuna forma di codifica) con normali programmi di compattazione (WinZip, WinRar, pkzip, gzip, etc…), che pure hanno algoritmi complicati e molto efficienti, si scopre che è praticamente impossibile raggiungere tali livelli di compressione.
Come mai?
La spiegazione è duplice; in primo luogo, l’algoritmo di compressione MP3 è stato disegnato appositamente per gestire file audio, che hanno determinate caratteristiche statistiche; infatti è possibile trovare in un brano musicale una certa correlazione più o meno marcata tra campioni adiacenti, sintomo di una ridondanza statistica; questa ridondanza può essere tranquillamente tolta utilizzando particolari codifiche ( predizione lineare, codifica entropica come la codifica di Huffman, unione dei frame) che, senza modificare il segnale audio, permettono di ottenere una prima diminuzione delle dimensioni del file di circa 2:1. Ad esempio una funzionalità dell’algoritmo MPEG che sfrutta proprio questo concetto per ottimizzare la codifica di segnali audio stereo è la cosiddetta codifica di tipo “joint-stereo”, che cioè sfrutta le similitudini ( correlazioni) tra i 2 canali audio ( destro e sinistro) per riuscire ad ottenere una compressione molto più efficace.
In questo modo non si perde comunque nessuna informazione; con un algoritmo inverso risulta poi possibile ritornare al segnale originario.
Ma la potenza degli algoritmi MPEG di compressione audio è determinata principalmente dall’utilizzo contemporaneo di altri metodi di codifica, che applicano, a differenza di quelli appena visti, una compressione detta “lossy” cioè “con perdita” di dati.
“EEEHHH? E allora perché quando ascolto un file MP3 non sento alcuna differenza rispetto al file ascoltato direttamente da CD?”
Perché l’algoritmo è molto “furbo” e calcola, mediante precise tabelle su cui è descritta la percezione del sistema uditivo umano, le parti di informazione audio che, seppur presenti, non vengono fisicamente percepite dall’orecchio. In questo modo non riuscirò più a ricostruire perfettamente il segnale originario, ma, nell’ascoltarlo, non noterò alcuna differenza, perché ho tolto solamente dei segnali inutili. Questa codifica con perdita si basa sul fatto che l’orecchio umano non e’ il migliore dispositivo per la ricezione di onde acustiche e quindi di segnali audio. Alcuni dei limiti dell’apparato uditivo umano sono stati quindi utilizzati per togliere dalle traccie audio le informazioni inutili (non fisicamente percepibili); questi limiti sono la non-linearità e la soglia adattativa di udibilità. Un dispositivo non-lineare ha la caratteristica di trattare le frequenze audio che riceve in maniera diversa le une dalle altre, producendo uno sgradito effetto distorsivo; questo fenomeno per esempio deve essere quasi nullo nei sistemi hi-fi, dove il suono deve venire trasmesso fedelmente dall’amplificatore alle casse senza alcuna distorsione. La soglia di udibilita’ invece è il livello minimo sotto il quale un suono non è percepito. Varia con la frequenza e anche da individuo a individuo, ma per la stragrande maggioranza delle persone l’intervallo di massima sensibilità è posto tra i 2 e i 5 kHz. Questa soglia di udibilità è anche adattativa, nel senso che viene costantemente cambiata dai suoni percepiti. Per esempio, una normale conversazione in una stanza è perfettamente udibile in condizioni normali; ma se durante la piacevole chiaccherata si aggiunge un rumore molto forte, come potrebbe essere il passaggio di un aereo, la conversazione non risulta più udibile, perché le soglie di udibilità delle due persone sono state distorte. Al termine del passaggio dell’aereo le soglie di udibilità ritornano ai loro valori normali. I suoni che non risultano udibili a causa dell’adattamento dinamico della soglia di udibilità vengono detti “mascherati”. Questo effetto si riscontra in particolar modo nella musica: una orchestra che stesse suonando una partitura con volume elevato, farebbe risultare le parti di alcuni singoli strumenti non udibili dall’orecchio di un ascoltatore. Quando la musica viene registrata ( ad esempio su di un CD), comunque, a causa della risposta uniforme ( cioè non adattata) del dispositivo di registrazione, tutte le frequenze indistintamente finiscono sul supporto audio. Quando la musica viene riprodotta, però, gli strumenti mascherati non saranno udibili all’orecchio dell’ascoltatore, e quindi è come se non ci fossero. Per questo motivo le parti del mezzo di registrazione che contengono dati non udibili potrebbero invece essere utilizzate per contenere dati che al contrario sono udibili; così posso ridurre considerevolmente lo spazio che mi serve per memorizzare informazioni audio, senza alcuna perdita nella qualità della registrazione.
Scendendo un pò più nei particolari, di seguito vengono riportati i passi che l’algoritmo di codifica MPEG esegue sui dati audio:
Decomposizione in sotto-bande mediante un banco di filtri polifase.
Il segnale audio a banda larga viene decomposto in 32 sottobande mediante uno pseudo-filtro QMF (Quadrature Mirror Filter) implementato con la cascata di una struttura polifase ed di una DCT ( Discrete Cosine Transform). Per aumentare la risoluzione in frequenza, il “layer III” decompone ognuna delle 32 sottobande in un massimo di 18 ulteriori sottobande equispaziate. La maggiore risoluzione frequenziale offre una aumento del guadagno della codifica, però può anche creare una fastidiosa perdita di risoluzione temporale (soprattutto per segnali impulsivi), per cui le sottobande da 18 possono essere diminuite a 6.
Calcolo dei parametri del modello psicoacustico mediante una FFT (trasformata veloce di Fourier).
Sono stati studiati 2 modelli psicoacustici per lo standard MPEG 1; il primo di solito è utilizzato dagli algoritmi layer I-II, mentre il secondo dal layer III.
Allocazione dinamica dei bit con riferimento ai parametri del modello psicoacustico.
In questo passo si cerca di determinare il minimo numero di bit necessario per codificare le singole sottobande, in modo che non ne venga variata la percezione.
Quantizzazione e codifica dei segnali in sotto-bande.
La quantizzazione e’ fatta per ogni sottobanda, utilizzando esclusivamente i bit che sono stati alloccati per essa nel passo precedente.
Multiplex e impacchaggio dei frame
Vediamo ora brevemente come funziona l’analisi psicoacustica, che sfrutta la non-linearità dell’orecchio umano.
I risultati sulla percezione umana che vengono usati per la codifica derivano dai lunghi studi compiuti dal professor Zwicker.
Una prima compressione viene effettuata mediante la ricerca e l’analisi delle bande di frequenza critiche e delle soglie assolute.
Infatti l’apparato uditivo umano analizza i segnali a banda larga nelle cosiddette bande critiche. Lo scopo di questa analisi è quello di decomporre il segnale audio in sotto-bande ( le bande critiche) e poi quantizzare e codificare questi segnali sotto-banda.
Siccome la percezione dei suoni sotto la soglia assoluta non è possibile, i segnali sotto-banda che si trovano sotto questa soglia non vengono codificati e neanche trasmessi.
Le bande critiche hanno la seguente dimensione:
Delta FG = 25 + 75*(1+1.4*(f/kHz)^2)^0.69
La soglia assoluta ( per assoluto silenzio) denota la curva di livello di pressione dei suoni a seconda della frequenza, che è strettamente legata alla percezione dei toni sinusoidali.
Sotto questa soglia, calcolata empiricamente, non è possibile sentire alcun segnale.
In ogni banda critica, la differenza tra il livello del segnale e la soglia assoluta e’ responsabile per la scelta dei passi di quantizzazione appropriati per ogni banda critica.
Nella seconda fase della compressione vengono sfruttati gli effetti del mascheramento che l’apparato uditivo umano applica ai segnali.
Per un rumore a banda limitata, oppure un segnale sinusoidale, sono state ricavate le soglie di mascheramento dipendenti dalla frequenza.
Queste soglie effettuano un mascheramento di quelle frequenze che hanno ampiezza minore di esse.
L’algoritmo completo fa uso anche delle già accennate bande critiche, ma, data la evidente complessità matematica, non verrà qui trattato.
L’algoritmo:
Dunque, il formato mp3 (mpeg 1 layer III) è un formato dati digitale per esprimere musica (esattamente come il doc è un formato per esprimere un testo scritto). Questo formato usa un algoritmo di compressione del suono di tipo “lossy”, vale a dire a perdita d’informazione; in pratica una volta compresso il file wav da cui si era partiti, il risultato sarà diverso dall’originale. Il tipo di compressione si basa su algoritmi percettivi che eliminano le frequenze non percepibili dall’orecchio umano (cioè mascherate da frequenze più forti). Questo fa sì che la musica compressa con questo algoritmo risulti acusticamente uguale a quella originale pur avendo una certa perdita di informazione.
Per giudicare l’algoritmo vediamo in breve come funziona.
La rappresentazione iniziale del brano (quella, per intenderci, che usa il CD audio) è in ampiezza : ad ogni valore dell’onda con cui viene rappresentato, corrisponde una posizione del cono della nostra cassa acustica. Il variare di questi valori nel tempo riproduce la musica che ascoltiamo.
La codifica mp3 analizza il brano musicale e ne crea lo spettro in frequenza. Questa azione, detta quantizzazione in frequenza, viene fatta ad intervalli fissi e regolari. L’algoritmo quindi disporrà di una successione di spettri (grafico di un’analisi in frequenza) del segnale, che hanno la caratteristica di rappresentare il suono in modo molto più conciso rispetto alla rappresentazione in ampiezza. Inoltre le loro variazioni nel tempo sono ridotte, permettendo un’efficace compressione della sequenza nel tempo. A questo si aggiunge che il suono così rappresentato si presta più facilmente all’elaborazione (per esaltare le frequenze basse, ad esempio, basta elevare i valori delle componenti più basse degli spettri).
La frequenza di quantizzazione ed il numero di dati che si potrà utilizzare per ogni spettro dipenderà dal bitrate scelto. Il bitrate è la quantità di dati al secondo (cioè del numero di bit a disposizione per memorizzare la musica per unita’ di tempo = kbit/s). C’è correlazione fra numero di campioni di spettro che vogliamo prendere al secondo e quantità di informazioni che salviamo per ogni campione. Se scegliamo di prendere molti campioni, sacrificheremo la quantità di dati ed il suono apparirà preciso ma poco puro; viceversa se scegliamo di salvare molte informazioni ma meno spesso, cioè in meno campioni, il suono sarà estremamente puro a scapito della velocità d’attacco che avverrà in ritardo e sembrerà poco precisa.
Inoltre la rappresentazione in frequenza permette di mascherare le frequenze deboli in presenza di frequenze più forti secondo un algoritmo che si basa sulla capacita’ di percezione dell’orecchio umano. Questo procedimento è detto algoritmo psicoacustico. Per capirci: in una chiesa vuota è possibile percepire distintamente i passi delle persone; la stessa cosa è pressoché impossibile nel caso si stia assistendo ad un’esecuzione d’organo.
Poiché la quantizzazione in frequenza viene fatta ad intervalli fissi e visto che questi intervalli possono essere più o meno vicini a seconda del bitrate scelto, l’effetto generale di un mp3 è di rendere abbastanza bene le tonalità della musica ma al prezzo di qualche incertezza negli attacchi (se il bitrate è minore di 160 kbit/s questo si distingue abbastanza bene) o nelle variazioni veloci, che risultano soffuse ed imprecise a causa di una quantizzazione ad intervalli troppo lunghi.
Esiste una certa correlazione fra la precisione negli attacchi e nelle variazioni e la resa tonale o, per utilizzare un’altra parafrasi, fra limpidezza del suono e dettagli. Programmi di conversione (encoder) diversi risolvono il problema in modo differente.
Come scaricare un mp3
Scaricare MP3 è facile. Basta fare clic con il pulsante sinistro del mouse sull’indirizzo (URL) o sul nome dell’artista o ancora sul titolo della canzone e si aprirà la pagina contenente le istruzioni per scaricare il brano MP3 dal sito su cui risiede. Si può scegliere di salvare il file in una cartella oppure solo di aprirlo, in questo caso non rimarrà memorizzato sul computer, ma potrà essere ascoltato solo una volta. Per salvare il file, comunque, la strada consigliata è di utilizzare il pulsante destro del mouse facendo clic sull’URL o sul nome dell’artista o sul titolo della canzone. A questo punto occorre selezionare “salva oggetto con nome” e scegliere la cartella in cui salvarlo.
Talvolta può comparire un messaggio che indica che non si può accedere al sito: si tratta probabilmente di un sito leech, cioè di un sito “sanguisuga”, che chiede uno scambio di informazioni per cedere parte del proprio contenuto. Per maggiori informazioni sui siti Leech, vi suggeriamo di consultare la sezione ad essi dedicata.
Altre volte viene indicato di rinominare il file per cambiarne l’estensione. Per farlo basta seguire queste semplici istruzioni (per sistemi operativi windows).
Nota bene: le istruzioni seguenti si applicano dopo aver scaricato il file sul proprio computer.
Se sul tuo computer il nome del file viene visualizzato completo dell’estensione basta fare click sul file stesso con il pulsante destro, scegliere Rinomina e cambiare l’estensione.
Se invece non viene visualizzata l’estensione occorre per prima cosa cliccare due volte sulla icona “Risorse del computer”, che si trova sul Desktop. Si aprira’ una finestra.
Fare click su “Visualizza” e poi su “Opzioni cartella”. Si aprira’ una nuova finestra.
Cliccare su “Visualizza”.
Controllare che non ci sia il segno di spunta sulla casella “Nascondi le estensioni dei file per i tipi di file conosciuti”. Se il segno di spunta e’ presente fare click sopra di esso per farlo scomparire.
Fare click su “OK”.
A questo punto per ogni file presente sul computer viene visualizzato il nome completo, compresa l’estensione.
Per cambiare l’estensione basta fare click col tasto destro sul file, scegliere Rinomina e cambiare i 3 caratteri dopo il punto nel nome del file, per esempio da pippo.bin a pippo.mp3.
Come si registra
I brani MP3 possono essere inseriti nel proprio computer e all’interno di propri siti personali. Per registrare sul proprio PC un brano musicale in formato MP3, occorre possedere un qualsiasi elaboratore con processore veloce (Pentium) dotato di scheda sonora, e utilizzare due tipi di programmi, facilmente scaricabili da Internet, i “grabber” e gli “encoder”.
I “grabber”, o “ripper”, convertono le tracce audio contenute su un CD in formato WAV, in pratica estraggono l’audio dal CD. E’ possibile campionare direttamente anche altre sorgenti, una radio o un disco in vinile o una cassetta, tramite la scheda audio ed ottenere un file WAV. Queste ultime operazioni possono essere eseguite con altri tipi di software (tipo registratore di suoni di windows). Gli “encoder” comprimono gli ingombranti file WAV in formato MP3.
Inoltre vi sono software di ultima generazione che impiegano direttamente un codec MP3 e sono così in grado di salvare direttamente il brano musicale in formato MP3.
Come si ascolta
Per ascoltare un MP3 è indispensabile avere installato sul proprio PC uno dei cosiddetti “player”, cioè i programmi che servono per ascoltare file MP3.
Il player più diffuso è Winamp, scaricabile da Internet.
Una volta scaricato il software, occorre reperire in rete i file MP3. Si possono cercare utilizzando il motore di ricerca.
Software
Per Windows 95/98
Winamp Complete (Inglese)
Tra i software per l’ascolto di file MP3 WinAmp è il più diffuso. Supporta file in formato MP3, MP2, CD, MOD, WAV ed altri; può essere personalizzato e se ne può cambiare a piacimento l’aspetto grafico. Sono disponibili plug-ins di diverso tipo: audio, video, effetti, ecc…
La versione COMPLETE include il supporto per i file WMA e Mjuice.
Winamp Basic (Inglese)
Il programma pesa circa un terzo della versione COMPLETE, supporta anch’esso file in formato MP3, MP2, CD, MOD, WAV ed altri; può essere personalizzato e se ne può cambiare a piacimento l’aspetto grafico. Sono disponibili plug-ins di diverso tipo: audio, video, effetti, ecc…
La versione BASIC non include il supporto per i file WMA ed Mjuice.
Sonique (Inglese)
Dotato di un buon motore di decodifica, esige un processore potente. Offre una buona qualità nella riproduzione del suono ed ha una interessante grafica di interfaccia. Supporta non solo vari formati di file, ma anche lo streaming MP3 radio, inoltre è dotato di equalizzatore. Questa versione di Sonique supporta file WMA (MS Audio).
Real Player G2 (Italiano)
Questo programma è conosciuto principalmente per la sua capacità di gestire file multimediali audio/video in modalità streaming in vari formati, tra cui l’mp3. E’ fornito con il Netscape Communicator.
Microsoft Windows Media Player (Italiano)
E’ la nuova versione del lettore multimediale di Microsoft. Progettato per gestire file audio/video anche in modalità streaming, supporta moltissimi tipi di file audio tra cui l’MP3. E’ fornito con l’Explorer 5.
Player per Macintosh
Macamp (Inglese)
E’il programma per l’ascolto di file MP3 più diffuso per PowerPC. Il programma è anche in grado di riprodurre CD Audio, MP2, MP1 e Internet Streaming Audio (Shoutcast e Icecast); può essere anche corredato con alcuni plug-ins.
Player per Unix-like
XMMS (Inglese)
E’ un player MP3 per sistemi operativi Unix-like, come Linux.
Encoder per Windows 95/98
Win Dac (Inglese)
Consente di convertire un CD in file wave (WAV) e di codificare questi file in MP3 e altri differenti formati.
HyCD Play&Record (Inglese)
E’un software multifunzione che supporta la copia dei CD, l’estrazione audio, la codifica/decodifica di file MP3, la conversione in altri formati, la masterizzazione di CD ed è dotato di un player per file MP3, Wav, CD.
Hardware —- Lettori portatili MP3
I lettori portatili mp3 sono simili ai walkman per dimensione e tipo d’uso. I brani musicali da ascoltare, però, vengono registrati su un piccolo hard disc (attualmente disponibili con una capacità oscillante tra i 32 Mb ed i 64 Mb), attraverso un collegamento al PC. In questo modo i brani scaricati dalla rete possono essere ascoltati anche passeggiando.
Il primo lettore mp3 arrivato in Italia è il Rio della Diamond, ma sono pronti ad essere lanciati sul nostro mercato anche gli analoghi prodotti della Sony, della Sharp e della Jaz Piper.
in sintesi
Cos’è l’ MP3
MP3 significa MPEG1 Layer3. L’algoritmo MPEG, alla base dell’MP3, è nato dall’esigenza di sviluppare uno standard mondiale per la rappresentazione di immagini in movimento e di audio. Nei laboratori dello CSELT di Torino, nel 1988, è stato sviluppato questo standard per il trattamento di segnali audio-video che ha la peculiarità di comprimere i file riducendoli fino a 12 volte rispetto alla loro grandezza naturale.
In particolare questo formato ad elevata compressione si basa sulle teorie della psicoacustica: ogni individuo ha un udito sensibile alle frequenze dai 20 Hz ai 20 KHz e in particolare l’uomo percepisce meglio i suoni tra i 2 e i 4 KHz. Inoltre alcuni suoni mascherano le frequenze vicine, impedendo di udire realmente tutti i suoni.
Tali considerazioni hanno portato a creare un algoritmo che elimina tutti i suoni “ridondanti” all’orecchio umano, ottenendo alti livelli di compattazione dei file ed una qualità del suono paragonabile a quella digitale, che si può scaricare direttamente sul proprio personal computer.
Come si registra un MP3
I brani MP3 possono essere inseriti nel proprio computer e all’interno di propri siti personali.Per registrare sul proprio PC un brano musicale in formato MP3, occorre possedere un qualsiasi elaboratore con processore veloce (Pentium) dotato di scheda sonora, e utilizzare due tipi di programmi, facilmente scaricabili da Internet, i “grabber” e gli “encoder”. I “grabber”, o “ripper”, convertono le tracce audio contenute su un CD in formato WAV, in pratica estraggono l’audio dal CD. E’ possibile campionare direttamente anche altre sorgenti, una radio o un disco in vinile o una cassetta, tramite la scheda audio ed ottenere un file WAV. Queste ultime operazioni possono essere eseguite con altri tipi di software (tipo registratore di suoni di windows). Gli “encoder” comprimono gli ingombranti file WAV in formato MP3. Inoltre vi sono software di ultima generazione che impiegano direttamente un codec MP3 e sono così in grado di salvare direttamente il brano musicale in formato MP3.
Come si ascolta un MP3
Per ascoltare un MP3 è indispensabile avere installato sul proprio PC uno dei cosiddetti “player”, cioè i programmi che servono per ascoltare file MP3.
Il player più diffuso è Winamp, scaricabile da Internet.
Una volta scaricato il software, occorre reperire in rete i file MP3. Si possono cercare utilizzando il motore di ricerca MP3 di Italia Online.
Una caratteristica importante degli MP3 è la loro “volatilità”, che non è propria del formato, ma è in uso tra chi gestisce sul proprio sito questi file.
Di siti Internet che contengono brani MP3 ce n’è una marea e ne continuano a comparire e scomparire ogni giorno. Li puoi cercare utilizzando la nostra funzione di ricerca search.