+ Reply to Thread
Results 1 to 3 of 3

Thread: Digititis (χυδαϊστί: "ψηφιακίλα")

Hybrid View

  1. Post Digititis (χυδαϊστί: "ψηφιακίλα")

    Πριν 30 περίπου χρόνια παρουσιάστηκε το CD. Το εμπορικό του slogan ήταν απλό και αποτελεσματικό: "Perfect sound forever". Τελικά είχαν δίκιο μόνο στο δεύτερο μισό, στο forever, με την έννοια ότι τα ψηφιακά αρχεία είναι, με τον έναν ή τον άλλο τρόπο, αθάνατα. Perfect δεν είναι. Από τη στιγμή που η νέα πηγή, το CD, κλήθηκε να αντικαταστήσει την παλιά, το δίσκο βινυλίου, ήταν σαφές ότι ένα σωρό προβλήματα εξαφανίστηκαν ως δια μαγείας. Ταυτόχρονα, όπως ήταν αναπόφευκτο, το νέο μέσο παρουσίαζε τα δικά του προβλήματα, τα οποία ήταν εντελώς διαφορετικής φύσεως, διότι το μέσον ήταν εντελώς διαφορετικής φύσεως. Θα χρειαζόταν καιρός έως ότου το ανθρώπινο μυαλό αναλύσει αυτά τα νέα προβλήματα, κατανοήσει τη φύση τους και τις αιτίες τους, και βρει τρόπους να τα αντιμετωπίσει. Εν ολίγοις θα χρειαζόταν ένας νέος Αριστοτελισμός, μία εκ βάθρων νέα κατηγοριοποίηση. Είμαι βέβαιος ότι υπάρχουν πολλοί στο χώρο της ακαδημαϊκής κοινότητας, και πιθανόν αρκετοί στο χώρο της βιομηχανίας audio, που είναι ικανοί να δομήσουν στο μυαλό τους ένα σύστημα νέων Αριστοτελικών κατηγοριών και να δουν την νέα κατάσταση με τρόπο ολοκληρωμένο και επιστημονικώς βάσιμο.

    Το δυσάρεστο είναι ότι στο χώρο του audio "Τύπου", έντυπου και ηλεκτρονικού, διεθνούς και εγχωρίου, δεν έχω διαπιστώσει κάτι αντίστοιχο. Και αν υπάρχει, δεν έχω αντιληφθεί την ύπαρξή του.

    Μια και διαπιστώνω λοιπόν ότι (κατά το ανεκδοτολογικώς λεχθέν από τον Giulio Andreotti) "δεν περιστοιχίζομαι από γίγαντες" παρουσιάζω μία "Μεγάλη Ενοποιημένη Θεωρία" για τα ελαττώματα του ψηφιακού ήχου. Κατανέμω τα προβλήματα σε 4 αδρές κατηγορίες, την πλειοψηφία των οποίων έχω ήδη συζητήσει στο παρελθόν, πρόσφατο ή απώτερο.

    Πρόβλημα 1: ΚΒΑΝΤΙΣΜΟΣ
    Το εποπτικό υλικό παρουσίασα και σχολίασα σε δημοσίευσή του Αυγούστου του 2008 στο Journal Club:
    http://www.avmentor.eu/forum/showthr...B1%CF%84%CE%B1
    Χάρη στην ιδιοφυή χρήση του dither, η παραμόρφωση από τον κβαντισμό αντιμετωπίζεται αποτελεσματικά, ακόμα και στην προδιαγραφή Red Book.

    Το dither είναι θόρυβος που προστίθεται στο αναλογικό σήμα πριν αυτό κβαντισθεί, σε επίπεδο έντασης παρόμοιο με την ένταση που κωδικοποιείται από το "Ελάχιστα Σημαντικό Ψηφίο" (Least Significant Bit, LSB), δηλαδή το τελευταίο από τα 16 δυαδικά ψηφία που περιγράφουν την στιγμιαία τιμή ενός σήματος ανά 1/44100 του δευτερολέπτου (κατά το Red Book). Επιλογή διαφόρων μορφών dither, που έχουν να κάνουν με την φασματική κατανομή του χρησιμοποιούμενου θορύβου, διαφοροποιεί το αποτέλεσμα προς το καλύτερο ή το χειρότερο.

    Το πρόβλημα καθίσταται ακόμα πιο ευεπίλυτο με την σταδιακή καθιέρωση των φορμά Υψηλής Ανάλυσης, που χρησιμοποιούν περισσότερα bit κωδικοποίησης, συνήθως 24 (αντί 16) και υψηλότερες συχνότητες δειγματοληψίας, συνήθως τη διπλάσια (88.2 kHz) ή την τετραπλάσια (176.4 kHz) της συχνότητας του RB (44.1 kHz), ή τα αντίστοιχα πολλαπλάσια (96 ή 192 kHz) της συχνότητας στην οποία λειτουργούσαν παλιά τα DAT (48 kHz). Σημειωτέον ότι το υλικό υψηλής ανάλυσης "αποκτά" αναγκαστικά dither, το οποίο οφείλεται στον θερμικό θόρυβο Johnson των ηλεκτρονίων καθώς αυτά κινούνται τυχαία μέσα στα στοιχεία του κάθε αναλογικού κυκλώματος. Η ισχύς αυτού του θορύβου, όπως έχουμε αναφέρει, εξαρτάται από την θερμοκρασία των στοιχείων του κυκλώματος, το συχνοτικό εύρος λειτουργίας του και την σταθερά Boltzmann (που συσχετίζει την ενέργεια του κάθε σωματιδίου χωριστά με το σύνολο των ενεργειών αυτών, όπως εκφράζονται σε "συλλογικό επίπεδο" από΄τη θερμοκρασία: έχει τιμή γύρω στα 1.38 επί 10 στην -23η δύναμη και μονάδες Joule ανά βαθμό Kelvin). Ο θόρυβος αυτός, για συνηθισμένα κυκλώματα σε θερμοκρασίες δωματίου, χοντρικά βρίσκεται περίπου 120 dB πιο χαμηλά από ένα συνηθισμένο σήμα line level, πράγμα που σημαίνει ότι τα 4 τελευταία bit μιας 24μπιτης λέξης, όπως αυτή παράγεται από έναν μετατροπέα A-to-D, αναλίσκονται σε κωδικοποίηση αναλογικού (=λευκού) θορύβου από τα κυκλώματα που προηγούνται (π.χ. από ένα μικρόφωνο και τα προενισχυτικά του). Αντιστοίχως η αναλογική έξοδος ενός μετατροπέα D-to-A περιέχει αναλογικό (=λευκό) θόρυβο σε παρόμοιο επίπεδο, περίπου 120 dB χαμηλότερο από το επίπεδο κορυφής.


    Πρόβλημα 2: JITTER

    Το εποπτικό υλικό παρέθεσα στο ομότιτλο νήμα στο Journal Club:
    http://www.avmentor.eu/forum/showthread.php?713-Jitter
    Εδώ θα εξετάσω την χρονική συνιστώσα: το jitter μπορεί να μεταθέσει τη χρονική στιγμή κατά την οποία ένα ηλεκτρονικό κύκλωμα ανιχνεύει ένα ψηφιακό bit, ή byte, και συνεπώς να επιφέρει αλλοιώσεις στην χρονική αλληλουχία των μικρογεγονότων που συναπαρτίζουν ένα ηχητικό συμβάν. Εκείνο που δεν μπορεί να κάνει, είναι να αντιμεταθέσει αυτά τα ψηφιακά δεδομένα, να ανατρέψει δηλαδή τη σειρά των 0 και 1 που περιγράφουν το ηχητικό σήμα. Το χρονικό διάστημα ανάμεσα σε δύο διαδοχικές τιμές του σήματος Red Book είναι 1/44100 του δευτερολέπτου, ή 22.7 μsec περίπου. Για σήμα δειγματισμένο στα 192 kHz, το διάστημα πέφτει στα 5.2 μsec. Μετατρεπόμενα σε απόσταση με βάση την ταχύτητα του ήχου στον αέρα (344 m/sec), αυτά μεταφράζονται σε 7.8 και 1.8 mm αντιστοίχως. Συνεπώς, εάν το jitter προκαλεί ασάφεια στερεοεντοπισμού, αυτή ακόμη και στην χειρότερη των περιπτώσεων φράσσεται προς τα πάνω μέχρι που να φτάσει σε σημείο αμελητέο.


    Πρόβλημα 3: ΚΩΔΩΝΙΣΜΟΣ
    Ένας ήχος μπορεί να αρχίσει πάρα πολύ απότομα: σκεφτείτε μια καστανιέτα. Ποτέ όμως δεν μπορεί να τερματισθεί πάρα πολύ απότομα, εκτός και αν είναι εντελώς τεχνητός, δηλαδή ηλεκτρονικά δημιουργημένος. Ακόμα και αν ένας φυσικός ήχος τερματίζεται πολύ απότομα, εκείνο που δεν μπορεί ποτέ να τερματισθεί το ίδιο απότομα είναι η ακουστική συμέριφορά του χώρου, μέσα στον οποίο ο ήχος καλείται να αναπτυχθεί. Η διαδικασία ψηφιοποίησης ενός μεταβατικού, όπως π.χ. του ήχου της καστανιέτας, προτυποποιείται από την μαθηματική επεξεργασία ενός παλμού Dirac:
    http://www.avmentor.eu/forum/showthr...3B%26%23955%3B
    Αποπειρώμενοι να απεικονίσουμε έναν παλμό Dirac στο πεδίο της συχνότητας, δηλαδή αναλύοντάς τον κατά Fourier, με λύπη μας θα διαπιστώσουμε ότι χρειαζόμαστε απείρου πλήθους αρμονικές περιττής τάξεως, πράγμα που δεν επιτρέπεται: σύμφωνα με το θεώρημα του Shannon, το συχνοτικό περιεχόμενο της προς περιγραφήν κυματομορφής δεν μπορεί να υπερβαίνει το ήμισυ της συχνότητας Nyquist. Άρα μας τέλειωσαν οι απείρου πλήθους αρμονικές: πρεπει να φιλτραριστούν επαρκώς στο αναλογικό πεδίο πριν τις πάρει είδηση ο μετατροπέας A-to-D, γιατί αλλιώς θα έχουμε aliasing:
    http://www.soundonsound.com/sos/feb0...sing_piano.mp3
    Το φιλτράρισμα όμως συνεπάγεται και φασικές ολισθήσεις. Μέχρι πρόσφατα η συμβατική σοφία υπαγόρευε τη χρήση φίλτρων τέτοιων, ώστε η φασική τους συμπεριφορά δημιουργούσε κωδωνισμούς:
    http://cnx.org/content/m19834/latest/graphics22.png
    Εύκολα μπορεί κανείς να αντιληφθεί ότι ο προ-κωδωνισμός (pre-ringing), αν είναι ακουστός ή έστω αισθητός, είναι ενοχλητικότερος από τον μετα-κωδωνισμό (post-ringing), γιατί ο πρώτος συμβαίνει πριν ο "κανονικός" ήχος αρχίσει, ενώ ο δεύτερος μπορεί έως έναν βαθμό να αποκρυβεί, ψυχοακουστικώς, από την εξέλιξη του ίδιου του ήχου μέσα στο χρόνο. Το θεωρητικό υπόβαθρο είναι οικείο σε όσους γνωρίζουν ψηφιακή επεξεργασία σημάτων:
    http://upload.wikimedia.org/wikipedi...parsion%29.png
    Η εταιρεία που πρώτη διαφήμισε την εμπλοκή της σε αυτό το ζήτημα ήταν η Meridian, όταν εξέλιξε και χρησιμοποίησε ένα φίλτρο που ονόμασε apodizing (αποδιστικό, δηλαδή που αποκόπτει τον "πόδα"):

    Έτσι εξαλείφεται το pre-ringing, με τίμημα την αύξηση του post-ringing. Έκτοτε και άλλες εταιρείες ακολούθησαν την ίδια οδό, όπως π.χ. η Ayre:

    (Μην εντυπωσιάζεστε από την "καλύτερη" συμπεριφορά αυτού του κωδωνισμού: προσέξτε ότι ο κατακόρυφος άξονας "Data in Volts" είναι αβαθμονόμητος. Άρα ένα είναι το σίγουρο: αν περιέχει "data", αυτά δεν είναι ορατά δια γυμνού οφθαλμού).
    "Θαυμάζω την κομψότητα της μεθόδου σας. Πρέπει να είναι ωραίο να καλπάζεις με το άλογο των αληθινών Μαθηματικών, ενώ εμείς οι υπόλοιποι αγκομαχάμε στον ποδαρόδρομο" - ο Άλμπερτ Άινσταϊν στον Τούλλιο Λέβι-Τσίβιτα

  2. Default

    η TEAC/Esoteric:

    ή η dCS:

    ενώ μεγάλη ποικιλία τέτοιων φίλτρων, με ποικίλες συμπεριφορές και τους αντίστοιχους συμβιβασμούς, υπάρχουν εδώ και καιρό ενσωματωμένες σε software αλγορίθμους, και χρησιμοποιούνται από ηχολήπτες και στούντιο.

    Το σημαντικό σημείο που πρέπει να συγκρατήσουμε είναι το εξής: είπαμε πριν ότι ο παλμός Dirac απαιτεί άπειρες το πλήθος αρμονικές, ενώ τα κριτήρια Nyquist-Shannon απαγορεύουν τον απειρισμό αυτόν. Είναι προφανές ότι όσες περισσότερες αρμονικές επιτρέπουν τα κριτήρια N/S, τόσο πιστότερα αναπαρίσταται ο Dirac. Στην πράξη αυτό σημαίνει ότι με κάθε διπλασιασμό της συχνότητας δειγματοληψίας, οι κωδωνισμοί υποδιπλασιάζονται σε διάρκεια και διπλασιάζεται η συχνότητά τους*, ενώ με κάθε προσθήκη ενός bit στην ψηφιακή λέξη, υποδιπλασιάζονται και η διάρκεια και το σχετικό (ως προς τον κύριο παλμό) πλάτος των κωδωνισμών. Είναι προφανές ότι, εάν συνεχίζουμε να αυξάνουμε τη συχνότητα δειγματοληψίας και τα διαθέσιμα προς κωδικοποίηση bit, οι κωδωνισμοί θα πάψουν κάποτε να γίνονται αντιληπτοί από τα ανθρώπινα αισθητήρια και κάθε περαιτέρω αύξηση θα είναι περιττή. Απομένει να διαπιστωθεί κατά πόσον έχουμε ήδη φτάσει σε αυτό το σημείο με τα φορμά Υψηλής Ανάλυσης, ή εάν θα χρειαστούν ακόμη απαιτητικότερα standards. Το ευχάριστο είναι ότι η ραγδαία αύξηση της υπολογιστικής ισχύος και η αντίστοιχη πτώση του κόστους της κάνουν αυτά τα ενδεχόμενα απολύτως εφικτά.

    *Ο κωδωνισμός έχει συχνότητα 1/2 Nyquist. Είναι ακουστός ένας κωδωνισμός με συχνότητα 22.05 kHz? Πιθανόν όχι. Εκτός και αν συμπίπτει με το breakup κάποιου tweeter ;-) οπότε δημιουργεί μεγάλα προβλήματα ενδοδιαμόρφωσης. Και αυτό εξαλείφεται ως πρόβλημα αν η συχνότητα του κωδωνισμού είναι 44.1 ή 48 kHz, πολλώ μάλλον 88.2 ή 96!


    Πρόβλημα 4: ΜΟΝΟΤΟΝΙΚΟΤΗΤΑ

    Όχι, δεν εννοώ την έννοια μονότονος = βαρετός, ομοιόμορφος, χωρίς ποικιλία. Την εννοώ με την μαθηματική έννοια, όπως λέμε "μονότονες συναρτήσεις".

    Τα αναλογικά μέσα εγγραφής και αναπαραγωγής υπακούουν, grosso modo, σε μία αρχή που λέει "όσο μικρότερο το μέγεθος του σήματος, τόσο γραμμικότερη η λειτουργία". Αυτή είναι η "μονοτονικότητα" - και ισχύει ως έναν βαθμό για όλες τις αναλογικές συσκευές, αλλά ισχύει μείζονι λόγω στις κρισιμότερες από αυτές, δηλαδή τους μετατροπείς ενέργειας από μία μορφή σε άλλη: τα μικρόφωνα, τις μαγνητικές κεφαλές, τα κοπτικά των δίσκων βινυλίου, τις φωνογραφικές κεφαλές, και επίσης για όσες ενισχυτικές βαθμίδες λειτουργούν σε τάξη Α (δηλαδή όλες τις προενισχυτικές και μερικές ενισχυτικές) κλπ. Επίσης ισχύει για τους ηλεκτρο-μηχανικούς μετατροπείς (ηχεία), αλλά αυτό δεν υπεισέρχεται στη συζήτησή μου, γιατί αποτελεί κοινό κρίκο.

    Οι μετατροπές A-to-D και D-to-A ακολουθούν εντελώς αντίθετο νόμο: όσο μειώνεται το πλάτος του σήματος, τόσο αυξάνεται η ανακρίβεια στην αναπαράστασή του, για τον απλό λόγο ότι τα διαθέσιμα προς τούτο bit μειώνονται.

    Για να χρησιμοποιήσω μία αντιστοιχία από τον (πάντα πιο εύκολο) κόσμο της όρασης, η αναλογική οδός είναι σαν τα fractals: όσο πιο μικρή είναι η λεπτομέρεια στην οποία εγκύπτεις, τόσο περισσότερες και ακόμα πιο μικρές λεπτομέρειες ανακαλύπτεις μέσα της. Και τόσο καλύτερα μπορεί η συσκευή να τις αποδώσει, γιατί η λειτουργία της γίνεται όλο και γραμμικότερη. Για πάντα? ΟΧΙ! Σε κάποιο σημείο εμφανίζεται ο θόρυβος, ο οποίος στο τέλος κρύβει την πολύ μικρή λεπτομέρεια. Αλλά και πάλι η απώλεια της λεπτομέρειας γίνεται σταδιακά, όχι απότομα.

    Ας δούμε την ίδια κατάσταση στο ψηφιακό πεδίο. Εδώ τα πράγματα είναι εντελώς αλλιώς. Μεγεθύνεις μία εικόνα και αίφνης η συνέχειά της διασπάται: αρχίζουν να φαίνονται τα στοιχειώδη συστατικά της. Συνεχίζεις τη μεγέθυνση και τελικά πέφτεις πάνω στο ΠΙΞΕΛ. Και τι είναι το πίξελ? Το πίξελ είναι η απόλυτη έλλειψη περαιτέρω λεπτομέρειας. Το πίξελ έχει μόνο μία τιμή. Είναι ένα τετραγωνάκι, π.χ., μπλε. Μία συγκεκριμένη απόχρωση του μπλε. Δεν έχει καμμία άλλη ιδιότητα. Τελεία, παύλα, παράγραφος.

    Το ζήτημα είναι: πόσο γρήγορα πέφτουμε πάνω στο πίξελ?

    Μία ψηφιακή αλυσίδα μπορεί να υπερκεράσει αυτό το πρόβλημα, το πρόβλημα της ανάστροφής μονοτονικότητας, με έναν τρόπο που της είναι οικείος και, εν τέλει, εύκολος: την ωμή δύναμη. Δηλαδή να κάνει τα "πίξελ" τόσο μικρά, που να μην έχεις λόγο να αναζητήσεις παραπάνω λεπτομέρεια. Θεωρώ εντελώς πιθανό να έχουμε αγγίξει το σημείο αυτό με τα φορμά Υψηλής Ανάλυσης. Επιστημονικώς είμαστε σίγουρα εκεί. Οικονομοτεχνικώς ίσως όχι, αλλά και πάλι είναι θέμα βραχέος χρόνου.

    ΣΥΜΠΕΡΑΣΜΑ
    Όλες, ΑΛΛΑ ΟΛΕΣ, οι Αριστοτέλειες κατηγορίες που περιλαμβάνουν τα ηχητικά μειονεκτήματα του ψηφιακού ήχου έχουν ένα κοινό γιατρικό, και αυτό είναι η άύξηση των παραμέτρων της συχνότητας δειγματοληψίας και του βάθους κωδικοποίησης/αποκωδικοποίησης. Το απαιτητικότερο εμπορικώς διαθέσιμο φορμά, το LPCM 24/192, ίσως έχει περιορίσει τα μειονεκτήματα αυτά σε βαθμό μη ακουστό - ή σχεδόν μη ακουστό. Εάν ισχύει το δεύτερο, τότε κάποιο επόμενο φορμά (π.χ. 32/384?) είναι within reach. Σαν το γνωστό ανέκδοτο, που μεταφέρει το "Παράδοξο του Ζηνωνα" στην καθημερινή ζωή: "Δεν έχει νόημα" λέει ο μαθηματικός, αναφερόμενος στην προσπάθεια να αγγίξει μία πολύ ποθητή γυναίκα. "Αφού ξέρεις ότι δεν θα μπορέσεις ποτέ να την αγγίξεις στ' αλήθεια". "Δεν έχει σημασία", απαντάει ο φυσικός. "Μου αρκεί ότι μπορώ να την πλησιάσω όσο θέλω!".


    ΥΣΤΕΡΟΓΡΑΦΟ: κάθε διόρθωση θα με χαροποιήσει. Όποιος φιλοδοξεί να διαψεύσει το περιεχόμενο της 2ης παραγράφου του 1ου μέρους του κειμένου, δεν έχει παρά να το αποπειραθεί :-)
    "Θαυμάζω την κομψότητα της μεθόδου σας. Πρέπει να είναι ωραίο να καλπάζεις με το άλογο των αληθινών Μαθηματικών, ενώ εμείς οι υπόλοιποι αγκομαχάμε στον ποδαρόδρομο" - ο Άλμπερτ Άινσταϊν στον Τούλλιο Λέβι-Τσίβιτα

  3. Default

    Quote Originally Posted by zonepress View Post
    το πρόβλημα της ανάστροφης μονοτονικότητας
    σε εικονίτσα για να τα καταλάβουν όοοοοοολα τα χαζά παιζάκια:
    "Θαυμάζω την κομψότητα της μεθόδου σας. Πρέπει να είναι ωραίο να καλπάζεις με το άλογο των αληθινών Μαθηματικών, ενώ εμείς οι υπόλοιποι αγκομαχάμε στον ποδαρόδρομο" - ο Άλμπερτ Άινσταϊν στον Τούλλιο Λέβι-Τσίβιτα

+ Reply to Thread

Posting Permissions

  • You may not post new threads
  • You may not post replies
  • You may not post attachments
  • You may not edit your posts