Όλοι έχουμε χρησιμοποιήσει αρχεία Mp3, στον υπολογιστή, το κινητό, το αυτοκίνητο, ή σε κάποιο Mp3 Player. Έχετε όμως αναρωτηθεί τι ακριβώς είναι το Mp3, και πώς έφερε επανάσταση στον τρόπο που ακούμε τη μουσική μας? Δείτε πώς δημιουργήθηκε η κωδικοποίηση Mp3 και πώς άλλαξε για πάντα τη μουσική βιομηχανία.
Προτάσεις συνεργασίας
Τα νέα άρθρα του PCsteps
Γίνε VIP μέλος στο PCSteps
Αν ενδιαφέρεστε να αντιγράψετε CD σε Mp3 ή να μετατρέψετε άλλα αρχεία ήχου σε αυτή τη μορφή, δείτε τον σχετικό οδηγό μας:
Αντιγραφή CD στον Υπολογιστή, Μετατροπή σε Mp3 / FLACΧάρη στη δυνατότητα ψηφιακής αγοράς και το download μουσικής σε Mp3, ελάχιστοι πλέον αγοράζουμε νέα CD. Τι γίνεται όμως με την συλλογή των audio CD … Συνεχίστε να διαβάζετε το Τι είναι το Mp3, Πώς λειτουργεί, και Πώς Δημιουργήθηκε.
Τι είναι το Mp3
To Mp3 είναι η πιο δημοφιλής μέθοδος κωδικοποίησης ψηφιακού ήχου. Μειώνει σημαντικά τον όγκο σε Megabyte των αρχείων μουσικής και ήχου, με μικρή έως καθόλου ακουστή απώλεια στην ποιότητα του ήχου.
Ενώ ένα τραγούδι 4 λεπτών θα έχει μέγεθος 40MB σε ασυμπίεστη μορφή WAV, με τη μετατροπή του σε Mp3 το αντίστοιχο αρχείο έχει μέγεθος μέχρι και 11 φορές μικρότερο, με τη μέση ποιότητα 128Kbps.
Η σημασία του μεγέθους και η ανάγκη του Mp3
Στα μέσα της δεκαετίας του '90, οι υπολογιστές είχαν σημαντικά χαμηλότερη χωρητικότητα σκληρού δίσκου απ' ότι σήμερα. Ένας τυπικός σκληρός δίσκος το '97 είχε χωρητικότητα 2.1GB.
Κατά συνέπεια, ένας δίσκος που θα μπορούσε να αποθηκεύσει γύρω στα 52 κομμάτια μουσικής σε μορφή Wav, με την κωδικοποίηση σε Mp3 μπορούσε να αποθηκεύσει μεταξύ 520-577 κομματιών.
Αντίστοιχα σημαντικό ήταν το Mp3 όσον αφορά την ταχύτητα των συνδέσεων στο Internet.
Μια τυπική dial-up 56Kbps – που συνήθως συνδεόταν στα 48Kbps και κατέβαζε maximum με 5,5KB/s – χρειαζόταν γύρω στις δύο ώρες για να κατεβάσει ένα αρχείο Wav 40MB. Για ένα αντίστοιχο αρχείο Mp3 με μέγεθος 3,6MB, έντεκα λεπτά ήταν αρκετά για το download.
Το Mp3 λοιπόν μας επέτρεψε να κατεβάζουμε μουσική από το Internet, να αποθηκεύουμε περισσότερη μουσική στους δίσκους μας, και να παίζουμε μουσική σε φορητές συσκευές όταν ακόμα οι ταχύτητες και οι χωρητικότητες ήταν πολύ μικρές για αρχεία Wav.
Σήμερα, ενώ οι δίσκοι και οι φορητές συσκευές μας χωρούν άνετα άφθονα αρχεία Wav, με το Mp3 εξακολουθούμε να μπορούμε να έχουμε υπερδεκαπλάσια μουσική στην ίδια χωρητικότητα, και σημαντικά ταχύτερο download, χωρίς σημαντική διαφορά στην ποιότητα.
Πώς λειτουργεί το Mp3
Για να κατανοήσουμε πως λειτουργεί το Mp3, θα πρέπει να δούμε συνοπτικά πως λειτουργεί η ψηφιοποίηση του ήχου.
Πώς λειτουργεί ο ψηφιακός ήχος
Ο φυσικός ήχος είναι αναλογικός. Αποτελείται από μια συνεχή κυματομορφή.
Για να μετατρέψουμε τον αναλογικό ήχο σε ψηφιακό (ψηφιοποίηση), χρειάζεται ένας μετατροπέας από Αναλογικό-σε-Ψηφιακό (Analog-to-Digital Converter).
Ο μετατροπέας αυτός είτε είναι ενσωματωμένος στην κάρτα ήχου, είτε είναι είναι ξεχωριστή συσκευή, όταν χρειαζόμαστε μετατροπή υψηλής ποιότητας.
Η μέθοδος καταγραφής PCM
Η μέθοδος που χρησιμοποιούν όλοι οι σύγχρονοι μετατροπείς για την ψηφιοποίηση του ήχου ονομάζεται Pulse Code Modulation (PCM).
Όταν καταγράφουμε τον ήχο ψηφιακά, δεν είναι δυνατόν ο υπολογιστής να καταγράψει την κυματομορφή με τη συνεχή, αναλογική μορφή της.
Θα πρέπει να χωριστεί σε κομμάτια, το καθένα εκ των οποίων θα πάρει μια αριθμητική τιμή στο δυαδικό σύστημα για να αποθηκευτεί ψηφιακά.
Με τη μέθοδο PCM, ο μετατροπέας μετράει την ένταση του ηχητικού σήματος μερικές δεκάδες χιλιάδες φορές κάθε δευτερόλεπτο. Κάθε μέτρηση της έντασης που κάνει, την αποθηκεύει ξεχωριστά.
Αυτή η διαδικασία ονομάζεται δειγματοληψία (sampling), καθώς μετράει αλλεπάλληλα δείγματα του ήχου.
Το πρόβλημα είναι πως αυτή η δειγματοληψία, καθώς δεν είναι συνεχής αλλά τμηματική καταγραφή, δεν αποθηκεύει τέλεια τον αρχικό ήχο. Αντί να είναι ομαλή η καμπύλη, έχει μικρά σκαλοπάτια.
Μέρος της αρχικής ηχητικής πληροφορίας χάνεται οριστικά με αυτή τη μέθοδο – το τμήμα της καμπύλης ανάμεσα σε δύο σκαλοπάτια – και έτσι μειώνεται η ποιότητα του ήχου.
Καλύτερος ψηφιακός ήχος, αλλά με κόστος
Υπάρχουν δύο χαρακτηριστικά που μπορούν να βελτιώσουν την ποιότητα της ψηφιακής μουσικής στο PCM.
Το ένα είναι ο ρυθμός δειγματοληψίας. Όσο περισσότερα δείγματα καταγράφονται ανά δευτερόλεπτο, τόσο μειώνεται η απώλεια της πληροφορίας σε σχέση με την αναλογική καμπύλη, και τόσο πιο κοντά βρισκόμαστε στην αρχική κυματομορφή.
Θεωρητικά, για να έχουμε ακριβώς την αναλογική κυματομορφή, θα έπρεπε να έχουμε καταγραφή άπειρων δειγμάτων ανά δευτερόλεπτο, που είναι αδύνατον.
Στη λεγόμενη “ποιότητα CD”, που είναι η υψηλότερη ποιότητα ήχου που θα βρούμε στο σπίτι, ο ρυθμός δειγματοληψίας είναι 44,1kHz. Δηλαδή, κατά την ψηφιοποίηση, ο μετατροπέας καταγράφει 44.100 δείγματα ήχου κάθε δευτερόλεπτο.
Με αυτό το ρυθμό δειγματοληψίας, στο 99% των οικιακών ηχοσυστημάτων δεν καταλαβαίνουμε διαφορά στην ποιότητα ανάμεσα στον ψηφιακό και τον αναλογικό ήχο.
Σε επίπεδο studio, για καταγραφή εξαιρετικά υψηλής ποιότητας ήχου θα βρούμε A-D converters με δυνατότητα μέχρι και 5.6MHz, ή αλλιώς δειγματοληψία 5.644.800 δειγμάτων κάθε δευτερόλεπτο.
Το δεύτερο χαρακτηριστικό που βελτιώνει τον ψηφιακό ήχο είναι το “βάθος bit” (bit depth). Αυτό έχει να κάνει με το πόση πληροφορία μπορούμε να αποθηκεύσουμε για το κάθε δείγμα που καταγράφουμε.
Το bit είναι η μικρότερη μονάδα αποθήκευσης στον υπολογιστή, που μπορεί να πάρει τιμή μηδέν ή ένα. 8 bit κάνουν ένα byte, και μετά έχουμε Kilobyte, Megabyte, Gigabite, κλπ.
Αν θεωρητικά καταγράφαμε ήχο με βάθος 1 bit στο απλό PCM, θα μπορούσαμε να αποθηκεύσουμε μόνο δύο τιμές για την ένταση, είτε μηδέν (απόλυτη ησυχία) είτε ένα (μέγιστη ένταση). Αυτό προφανώς θα κατάστρεφε οποιαδήποτε ηχογράφηση, γιατί όλοι οι ήχοι που δεν θα ήταν στο μηδέν θα είχαν ακριβώς την ίδια ένταση.
Στην ποιότητα CD, χρησιμοποιούνται 16bit για την αποθήκευση της τιμής της έντασης. Με 16bit, μπορούμε να έχουμε 65.536 (216) πιθανές τιμές για κάθε δείγμα, που μας επιτρέπει να καταγράψουμε με μεγάλη λεπτομέρεια την ακριβή ένταση.
Το πρόβλημα όμως είναι πως η καλή ποιότητα θέλει πολύ χώρο στο δίσκο. Είναι απλά μαθηματικά: σε ένα δευτερόλεπτο καταγράφονται 44.100 δείγματα, και το καθένα πιάνει χώρο 16bit, που ισούται με 2 Byte. Άρα ένα δευτερόλεπτο χρειάζεται 88.200 bytes, ή 86KB.
Στον στερεοφωνικό ήχο αυτή η τιμή είναι για κάθε κανάλι, άρα για τα δύο κανάλια μαζί χρειάζονται 176.400 bytes, ή 172KB κάθε δευτερόλεπτο. Για ένα λεπτό ηχογράφησης χρειάζονται πάνω από 10MB.
Έτσι καταλήγει ένα μουσικό κομμάτι των 4ων λεπτών σε Wav να “ζυγίζει” 40ΜΒ, και μια μικρή μουσική συλλογή με μερικές εκατοντάδες τραγούδια μπορεί γρήγορα να γεμίσει το δίσκο μας.
Πώς το Mp3 μειώνει σημαντικά το μέγεθος του αρχείου
Εφόσον ο υψηλός ρυθμός δειγματοληψίας και το μεγάλο βάθος bit είναι σημαντικά για την ποιότητα του ήχου, και τα δύο πιάνουν χώρο στο δίσκο, τι ακριβώς κάνει το Mp3 και μειώνει τον όγκο χωρίς να μειώνει αντίστοιχα την ποιότητα?
Το κλειδί βρίσκεται στον τρόπο με τον οποίο λειτουργεί η ανθρώπινη ακοή.
Ακουστική συγκάλυψη
Ένα χαρακτηριστικό της ακοής είναι η ακουστική συγκάλυψη (Auditory masking). Πρόκειται για ένα φαινόμενο με βάση το οποίο η αντίληψή μας για ένα συγκεκριμένο ήχο επηρεάζεται από την παρουσία ενός άλλου ήχου.
Η ακουστική συγκάλυψη είναι αυτονόητη σε ήχους με μεγάλη διαφορά στην ένταση. Ένα χειροκρότημα σε ένα ήσυχο δωμάτιο θα ακουστεί δυνατά. Αν όμως ακριβώς πριν το χειροκρότημα είχε ακουστεί ακουστεί ένας πυροβολισμός, ο ήχος του χειροκροτήματος εξαφανίζεται.
Εκτός όμως από την ένταση, δύο ήχοι διαφορετικής συχνότητας μπορούν να καλύψουν ο ένας τον άλλο, συγκεκριμένα ο ήχος χαμηλής συχνότητας να καλύψει τον ήχο υψηλότερης συχνότητας.
Ο Αμερικανός Φυσικός Alfred M. Mayer ήταν ο πρώτος που ανέφερε αυτό το φαινόμενο, το 1894. Το 1959 ο Richard Ehmer περιέγραψε όλες τις ακουστικές καμπύλες στις οποίες συναντάται η ακουστική συγκάλυψη με βάση τη συχνότητα.
Πώς το Mp3 εκμεταλλεύεται την ακουστική συγκάλυψη
Κατά τη μετατροπή ενός WAV σε Mp3, ο κωδικοποιητής Mp3 εφαρμόζει κάποιους μαθηματικούς αλγόριθμους, όπως ο Fast Fourier Transformation (FFT) ή ο discrete Cosine Transformation (DCT) με σκοπό να χωρίσει το ηχητικό αρχείο σε 32 τομείς συχνοτήτων (sub-bands).
Αυτός ο διαχωρισμός χρησιμεύει έτσι ώστε οι περίπλοκοι ήχοι που αποτελούν ένα ηχητικό αρχείο να μπορούν να αναλυθούν ξεχωριστά ο καθένας από τον αλγόριθμο.
Στη συνέχεια, σύμφωνα με το ψυχοακουστικό μοντέλο, το Mp3 προβλέπει ποιες συχνότητες έχουν μεγαλύτερη σημασία, και ποιες έχουν μικρότερη σημασία, βάση της ακουστικής συγκάλυψης.
Τέλος, ο κωδικοποιητής Mp3 κάνει το λεγόμενο “μοίρασμα bit” (bit allocation), όπου αποφασίζει πόσα bit πληροφορίας θα χρησιμοποιήσει για να επανακωδικοποιήσει το σήμα.
Για τις σημαντικές συχνότητες, η κωδικοποίηση γίνεται με περισσότερα bit, ώστε να διατηρηθεί η ποιότητα του ήχου.
Στις συχνότητες που δεν ακούμε τόσο λόγω της ακουστικής συγκάλυψης, η κωδικοποίηση γίνεται με λιγότερα bit. Αυτό μειώνει μεν την ποιότητα του ήχου, αλλά αφού αυτές τις συχνότητες δεν τις ακούμε καλά, δεν μειώνεται σημαντικά η συνολική ποιότητα ήχου του αρχείου.
Όπως αναφέραμε, οι υψηλές συχνότητες επηρεάζονται από τις χαμηλές βάσει της ακουστικής συγκάλυψης. Έτσι, η διαφορά μεταξύ Mp3 και Wav είναι αμέσως ορατή σε έναν αναλυτή συχνοτήτων, καθώς υπάρχει απότομη αποκοπή στις υψηλές συχνότητες.
Τι σημαίνουν τα 128Kbps και 320Kbps στο Mp3
Όταν κωδικοποιούμε ένα WAV σε Mp3, μπορούμε να επιλέξουμε πόσα bit δεδομένων θα χρησιμοποιεί συνολικά η κωδικοποίηση Mp3 ανά δευτερόλεπτο (bitrate).
Οι τιμές, ανάλογα με τον Encoder και τις ρυθμίσεις του, κυμαίνονται από 32Kbps μέχρι 320Kbps, αλλά η πιο δημοφιλής είναι τα 128Kbps. Το ασυμπίεστο Wav αντιστοιχεί σε ρυθμό μεταφοράς δεδομένων 1440Kbps.
Με απλά λόγια, όσο περισσότερα Kbps έχουμε επιτρέψει στον Encoder, τόσο περισσότερα Kbps έχει να μοιράσει στις σημαντικές και τις ασήμαντες συχνότητες, και κατ' επέκταση τόσο καλύτερη είναι η ποιότητα.
Με κωδικοποίηση 320Kbps, διατηρείται μεγαλύτερο μέρος από τις υψηλές συχνότητες, και οι περισσότεροι χρήστες δεν ακούν καμία διαφορά ανάμεσα στο Mp3 και το Wav ή το CD.
Στη χαμηλότερη ποιότητα 128Kbps είναι εμφανές πως κόβεται το μεγαλύτερο μέρος των υψηλών συχνοτήτων, πρακτικά από τα 16kHz και άνω.
Βέβαια, τα Mp3 των 320Kbps έχουν μεγαλύτερο μέγεθος, συνήθως μεταξύ 7MB και 12MB ανά αρχείο.
Σε οικονομικά ηχοσυστήματα, φορητούς Mp3 Player, και στα κινητά, οι περισσότεροι χρήστες δεν καταλαβαίνουν διαφορά στην ποιότητα του ήχου ανάμεσα στα 128Kbps και τα 320Kbps.
Επίσης, το Mp3 μπορεί να κωδικοποιηθεί με Variable Bitrate. Με αυτή τη ρύθμιση, σε κάποια πιο απλά σημεία του ήχου, που δεν περιέχουν πολλή πληροφορία, μπορεί να μοιράσει μόνο 32Kbps, ενώ σε πιο περίπλοκα σημεία να χρησιμοποιήσει 320Kbps για την κωδικοποίηση. Το αποτέλεσμα είναι αυξημένη ποιότητα με μικρότερο μέγεθος αρχείου.
Γίνεται να μετατρέψω ένα Mp3 σε WAV, ή να του αυξήσω το Bitrate?
Mε την κωδικοποίηση των συχνοτήτων με λιγότερα bit, χάνεται οριστικά η αρχική πληροφορία της ηχογράφησης, και αντικαθίσταται με τη μειωμένη ποιότητα, που έχει λιγότερο όγκο πληροφορίας.
Γι' αυτό ο αλγόριθμος Mp3 ονομάζεται “απωλεστικός”, γιατί πετάει ένα μέρος της πληροφορίας. Ενώ αλγόριθμοι συμπίεσης όπως ο Zip είναι μη-απωλεστικοί, διατηρούν όλη την πληροφορία μετά την αποσυμπίεση.
Κατά συνέπεια, αν ένα Mp3 το ξαναμετατρέψουμε σε WAV, η ποιότητα δεν πρόκειται να είναι ποτέ η ίδια με του αρχικού WAV. Πρακτικά θα έχουμε την ίδια ποιότητα με το Mp3, σε ένα αρχείο πολύ μεγαλύτερου μεγέθους.
Για τον ίδιο λόγο δεν έχει νόημα να μετατρέψουμε ένα Mp3 από 128Kbps σε 320Kbps, μία διαδικασία που ονομάζεται upscale. Η πληροφορία έχει ήδη χαθεί, και δεν θα υπάρχει διαφορά στην ποιότητα, μόνο το αρχείο θα αυξηθεί σε όγκο.
Στο αρχείο που χρησιμοποιήσαμε στο παραπάνω παράδειγμα, μετατρέψαμε το 128Kbps σε 320Kbps, αλλά αυτό δεν έφερε πίσω τις συχνότητες άνω των 16kHz.
Μάλιστα, κάποιες σελίδες με Mp3 Download που διαφημίζουν 320Kbps, στην πραγματικότητα έχουν πάρει Mp3 μικρότερου Bitrate και έχουν κάνει upscale.
Ο λόγος είναι πως δεν είχαν ασυμπίεστα Wav για να τα μετατρέψουν απευθείας σε 320Kbps, και προτιμούν να ξεγελάσουν τους χρήστες που θεωρούν σημαντική την επιπλέον ποιότητα.
Σε επόμενο οδηγό θα αναλύσουμε ακριβώς τη διαδικασία και τα προγράμματα για να μετρήσουμε ακριβώς την ποιότητα Mp3 στα αρχεία που κατεβάζουμε.
Πώς δημιουργήθηκε το Mp3
Tο Mp3 να έγινε γνωστό στα τέλη της δεκαετίας του '90, ειδικά μετά την ίδρυση του Napster.
Όμως, η ιστορία της δημιουργίας του ξεκινάει σχεδόν τρεις δεκαετίες νωρίτερα.
Στις αρχές της δεκαετίας του '70, ο Dieter Seitzer, καθηγητής στο πανεπιστήμιο του Erlangen-Nuremberg, έψαχνε μεθόδους για να συμπιέσει αρκετά τη μουσική ώστε να μπορεί να μεταδοθεί μέσω τηλεφωνικής γραμμής, διατηρώντας όμως σχετικά υψηλή ποιότητα.
Για το σκοπό αυτό συγκέντρωσε μια ομάδα μηχανικών και επιστημόνων που ενδιαφέρονταν για την ψηφιακή κωδικοποίηση του ήχου. Το 1979, η ομάδα κατόρθωσε να δημιουργήσει τον πρώτο ψηφιακό επεξεργαστή σήματος με δυνατότητα συμπίεσης ήχου.
Ένας από τους φοιτητές του Seitzer, ο Karlheinz Brandenburg, ανέπτυξε ένα σύστημα συνεχούς κωδικοποίησης ήχου το οποίο εκμεταλλευόταν τις ακουστικές ικανότητες του ανθρώπινου αυτιού όπως περιγράφονται στην ψυχοακουστική.
Με την καθοδήγηση του Seitzer, ο Brandenburg και η ομάδα ανέπτυξαν έναν αριθμό από αλγόριθμους κωδικοποίησης.
Η συνεργασία Fraunhofer IIS και Erlangen-Nuremberg
Το 1987 το Γερμανικό ερευνητικό ινστιτούτο Fraunhofer Institut Integrierte Schaltungen (IIS) ξεκίνησε μια ερευνητική συνεργασία με το πανεπιστήμιο του Erlangen-Nuremberg.
Στόχος ήταν να εργαστούν πάνω στο ερευνητικό πρόγραμμα με την ονομασία EU-147 EURECA Project for Digital Audio Broadcasting (DAB), με χρηματοδότηση της Ευρωπαϊκής Ένωσης.
Σκοπός του προγράμματος ήταν η κωδικοποίηση ήχου με υψηλή ποιότητα και χαμηλό ρυθμό μεταφοράς δεδομένων. Επικεφαλής της κοινής ερευνητικής ομάδας ήταν ο καθηγητής Heinz Gerhäuser, ενώ στην ομάδα συμμετείχαν και οι Seitzer και Brandenburg, μεταξύ άλλων.
Η πρώτη επιτυχία του προγράμματος ήταν το LC-ATC Codec (low complexity adaptive transform coding) που επέτρεψε την κωδικοποίηση στερεοφωνικής μουσικής σε πραγματικό χρόνο.
Το 1989, ο Bradenburg παρέδωσε τη διδακτορική του εργασία, η οποία αφορούσε την ανάπτυξη του αλγόριθμου OCF (Optimum Coding in the Frequency Domain).
Ο αλγόριθμος OCF παρουσίαζε πολλά από τα χαρακτηριστικά που θα είχε το τελικό Mp3, και ήταν ριζοσπαστικός για την εποχή του. Μπορούσε να κωδικοποιήσει μονοφωνική μουσική στα 64Kbps με αρκετά καλή ποιότητα, και μπορούσε να μεταδοθεί μέσω τηλεφώνου.
Η συμμετοχή στο MPEG
Το 1988, δύο μηχανικοί, ο Ιάπωνας Hiroshi Yasuda και ο Ιταλός Leonardo Chiariglione, ίδρυσαν το Moving Pictures Experts Group (Ομάδα Ειδικών στις Κινούμενες Εικόνες, MPEG). Ο στόχος του group ήταν να θέσει τις προδιαγραφές για την ψηφιακή συμπίεση ήχου και εικόνας, και την αναμετάδοσή τους.
Το 1989 συμμετείχαν στο MPEG μηχανικοί από ολόκληρο τον κόσμο, και η ομάδα σχεδίαζε να θέσει ένα standard όσον αφορά τον ήχο. Το MPEG έλαβε συνολικά 14 προτάσεις για κωδικοποίηση ήχου, και υπήρξε ενθάρρυνση στους συμμετέχοντες να συνδυάσουν τις μεθόδους τους.
Η ερευνητική ομάδα του Fraunhofer IIS, με την πρόσθετη έρευνα του Πανεπιστήμιο του Ανόβερο, των εργαστηρίων AT&T-Bell Labs, της Thomson-Brandt, και του Γαλλικού Centre National d'études des Télécommunications (CNET), βελτίωσε τον OCF και δημιούργησε τον αλγόριθμο ASPEC (Adaptive Spectral Perceptual Entropy Coding).
Ο ASPEC ήταν μία από της επιλογές του MPEG. Η άλλη ήταν ο MUSICAM (Masking pattern adapted Universal Subband Integrated Coding And Multiplexing) που αναπτύχθηκε από το Γερμανικό Institut für Rundfunktechnik (IRT), το Γαλλικό CCETT, και τη Philips, επίσης με τη χρηματοδότηση του EURECA EU-147.
Τελικά, το 1991 το MPEG αποφάσισε να συνδυάσει τους MUSICAM και ASPEC για να δημιουργήσει μια οικογένεια τριών τεχνικών κωδικοποίησης:
- Το MPEG Audio Layer I χρησιμοποιεί μια απλοποιημένη μορφή του MUSICAM, με χαμηλότερη αποδοτικότητα συμπίεσης, η οποία όμως μπορούσε να τρέξει σε πιο αδύναμο hardware. Σήμερα είναι γνωστό ως MP1, και ενώ το υποστηρίζουν οι περισσότεροι player, δεν χρησιμοποιείται πρακτικά καθόλου.
- Το MPEG Audio Layer II χρησιμοποιεί τον πλήρη MUSICAM για την κωδικοποίηση. Σήμερα γνωστό ως Mp2, είναι ιδιαίτερα δημοφιλές στη ραδιοφωνική αναμετάδοση, σπανίως όμως θα το βρούμε σαν αρχείο στον υπολογιστή μας.
- Το MPEG Audio Layer III είναι βασισμένο αποκλειστικά στον ASPEC. Ενώ ο αλγόριθμος είναι πιο περίπλοκος, είχε την υψηλότερη αποδοτικότητα στην κωδικοποίηση.
Καθώς ο MUSICAM ήταν λιγότερο περίπλοκος αλγόριθμος από τον ASPEC, αυτός ήταν η επίσημη επιλογή για το Digital Audio Broadcasting (DAB), που ήταν εξ' αρχής ο στόχος του EURECA EU-147.
Το πρώτο κομμάτι Mp3
Το 1990, ο Brandenburg έγινε Επίκουρος καθηγητής στο Erlangen-Nuremberg, συνέχισε όμως και εργαζόταν πάνω στη συμπίεση μουσικής με επιστήμονες από το Fraunhofer, και το 1993 προσελήφθη και ο ίδιος στο ινστιτούτο.
Το πρώτο τραγούδι που χρησιμοποίησε o Brandenburg για την ανάπτυξη του Mp3 ήταν το Tom's Diner της Suzanne Vega. Ο ερευνητής το άκουγε ξανά και ξανά όσο ρύθμιζε τον αλγόριθμο, προκειμένου να βεβαιωθεί πως δεν επηρέαζε αρνητικά τη χροιά της φωνής της Vega.
Το όνομα του Mp3
Ενώ οι προδιαγραφές του Mp3 είχαν ολοκληρωθεί το 1993, μέχρι και τα μέσα του 1995 η επέκταση του αρχείου ήταν .bit.
Μια εσωτερική έρευνα εντός του Fraunhofer IIS στις 14 Ιουλίου 1995 κατέληξε τελικά πως η επέκταση του ISO MPEG Audio Layer 3 θα είναι .mp3. Αυτή είναι η μετάφραση του e-mail στο οποίο ανακοινώθηκε η απόφαση:
Το marketing του Mp3
Μπορεί σήμερα το Mp3 να βρίσκεται παντού, στα πρώτα χρόνια του όμως χρειάστηκε σημαντική προώθηση από το Fraunhofer ISS.
Ήδη από τα μέσα της δεκαετίας του '90, οι δημιουργοί του Mp3 πίστευαν πως είναι το μέλλον, και πως ο καθένας θα μπορούσε να έχει μια φορητή συσκευή μαζί του, γεμάτη μα τραγούδια σε Mp3.
Το πρόβλημα όμως ήταν πως πολλοί “ειδικοί” στην αγορά πίστευαν πως δεν θα υπήρχε ποτέ μια φορητή συσκευή η οποία να μπορέσει να ανταπεξέλθει στην πολυπλοκότητα του Mp3.
Το πρώτο βήμα του Fraunhofer ISS, όσο ακόμα αναπτυσσόταν ο ASPEC, ήταν να δημιουργήσει επαγγελματικό εξοπλισμό βασισμένο στο ASPEC για ραδιοφωνικούς σταθμούς και στούντιο ηχογράφησης.
Μέχρι τότε, για τη μεταφορά ηχητικών κομματιών από τα στούντιο ηχογράφησης στους ραδιοφωνικούς σταθμούς χρειάζονταν πανάκριβες μισθωμένες γραμμές. Με τον εξοπλισμό και τον αλγόριθμο ASPEC, η μεταφορά γινόταν αξιόπιστα μέσα από απλές τηλεφωνικές γραμμές ISDN.
Το 1994, το Fraunhoffer σε συνεργασία με τη Γερμανική εταιρεία Micronas ανέπτυξαν το πρώτο κύκλωμα αποκωδικοποίησης Mp3 και τον πρώτο πρωτότυπο Mp3 Player, που είχε μέγεθος πακέτου τσιγάρων και ένα Megabyte αποθηκευτικού χώρου.
Οι ερευνητές του Fraunhofer παρουσίασαν τη συσκευή σε διεθνείς εκθέσεις, υποδεικνύοντας πως είναι δυνατή η ανάπτυξη Mp3 Player.
To 1996 οι ερευνητές του Fraunhofer κατοχύρωσαν ευρεσιτεχνία στις ΗΠΑ για το Mp3, και κυκλοφόρησαν στο Internet τον πρώτο software mp3 encoder, επί πληρωμή. Όμως ένας μαθητής από την Αυστραλία αγόρασε τον Encoder με μια κλεμμένη πιστωτική, και τον μοίρασε δωρεάν στο Internet. Αυτή η πειρατεία μπορεί να κατέστρεψε πρακτικά το επιχειρηματικό μοντέλο του Fraunhofer, όμως είχε σαν αποτέλεσμα την ταχύτατη διάδοση του Mp3.
Το 1997, ο προγραμματιστής Tomislav Uzelac, που εργαζόταν στην Advanced Multimedia Products, προγραμμάτισε το AMP MP3 Playback Engine, τον πρώτο επιτυχημένο software Mp3 Player.
Δύο φοιτητές, οι Justin Frankel και Dmitry Boldyrev μετέφεραν το AMP στα Windows, και έτσι δημιουργήθηκε ο Winamp, που για πολλούς από εμάς τους “παλιούς” ήταν ο πρώτος μας Mp3 Player. It Really Whips the Llama's Ass.
Οι πρώτοι εμπορικά επιτυχημένοι φορητοί Mp3 Players ήταν το MPMAN από τη Saehan Information Systems στη Νότιο Κορέα, και το Rio από τη Diamond Multimedia στις ΗΠΑ, που κυκλοφόρησαν το 1998.
Την ίδια χρονιά, το Fraunhofer IIS άρχισε να διεκδικεί πληρωμή για τη χρήση του Mp3. Από εκεί και ύστερα, οποιαδήποτε εταιρεία παρήγαγε Mp3 κωδικοποιητές και αποκωδικοποιητές/players, πλήρωνε ένα ποσόν στο Fraunhofer IIS.
Από το Δεκέμβριο του 2012 οι ευρεσιτεχνίες του Mp3 έχουν λήξει στην Ευρώπη και τις περισσότερες χώρες, ενώ οι τελευταίες ευρεσιτεχνίες στις ΗΠΑ λήγουν στις 31 Δεκεμβρίου του 2017
Συνεχίζεται: Πώς διαπιστώνουμε την ποιότητα Mp3 στα αρχεία μας
Τα αρχεία Mp3 θα τα βρούμε σε πολλές διαφορετικές ποιότητες, και δυστυχώς το μέγεθος του αρχείου και οι πληροφορίες που ενσωματώνει δεν ανταποκρίνονται πάντα στην πραγματική του ποιότητα.
Σε επόμενο οδηγό θα δούμε πως με κάποια δωρεάν προγράμματα μπορούμε να διαπιστώσουμε την πραγματική ποιότητα Mp3 της μουσικής μας.
Έχετε απορίες σχετικά με το Mp3 ή την ιστορία του Mp3?
Αν οτιδήποτε σχετικά με το Mp3 δεν σας είναι ξεκάθαρο, ή δεν καλύψαμε κάποιο θέμα σχετικά με αυτό, γράψτε μας στα σχόλια.