Цифра и “цифрит”. Мысли вслух. Часть 1

Для удобства дальнейших рассуждений представим, что на АЦП подается сигнал с виниловой пластинки, на которой присутствует дефект, создающий острый импульс в некоторый момент времени. В цифровом образе этот импульс будет записан ровно в тот момент, когда он появился в звуковой дорожке, без какого-либо предварительного “звона”. **** В равной степени это справедливо для любого одиночного короткого высокочастотного сигнала, в том числе и музыкального, записываемого на студийном оборудовании 🙂

Но, по какой-то причине – после прохождения классического Цифрового Фильтра (ЦФ) с АЧХ и ФЧХ, близкой к идеальной, на осциллограмме восстановленного ЦАП сигнала практически всегда обнаруживается предшествующий “звон” или выброс, которого не было в исходной фонограмме. Значит ли это, что ЦФ вносит искажения?

На мой взгляд, правильный ответ нужно искать не только в особенностях цифро-аналогового преобразования, но и в особенностях аналого-цифрового преобразования. Тот самый импульс на дорожке виниловой пластинки перед АЦП прошел через необходимый в таком случае ФНЧ, но этот ФНЧ реализован в виде реальной электрической схемы, то есть не идеален. За счет этого  какая-то часть спектра импульса, лежащая выше частоты дискретизации АЦП обязательно останется в сигнале. И в момент аналого-цифрового преобразования (записи) АЦП создаст цифровой образ ослабленного импульсного сигнала у которого все гармоники частот, находящихся выше частоты дискретизации, будут включены в звуковой частотный диапазон.

Далее, при воспроизведении сохраненного оцифрованного сигнала (файла) ЦАП восстановит аналоговый сигнал, который соответствует исходному сигналу, плюс конечно и ультразвуковую часть спектра, включенную в область звуковых частот. То есть – восстановится импульсный сигнал, казалось бы успешно “отфильтрованный” на этапе аналого-цифрового преобразования и – более того,  из-за неидеальности цифро-аналогового преобразования этот сигнал будет иметь форму, весьма далекую от исходной – с выбросами и предварительными “звонами”. Строго говоря, в том что они появились нет никакой проблемы или неисправности ЦАП и Цифрового Фильтра. Информация о них есть в самой цифровой фонограмме и она обязательно проявятся, если ее восстанавливать максимально точно математически. Можно сказать, что ЦФ в ЦАП как бы “не знает”, что исходный сигнал прошел аналоговый ФНЧ перед оцифровкой 🙂

То есть – “Математически Точный” Цифровой Фильтр не “фильтрует” некий исходный цифровой сигнал – а по заданным алгоритмам воссоздает заново некую цифровую последовательность, информацию об исходном сигнале.

Существуют Цифровые Фильтры, которые не имеют “звона” при восстановлении импульса, но они не являются математически точными, так как вносят значительные фазовые и (или) амплитудо-частотные искажения. Идеальный ФНЧ имеет полосу пропускания от 0 Гц и по шкале времени (фазы, по сути) работает симметрично от минус до плюс бесконечности, что на практике (в “железе”) реализовать невозможно. Не идеальный ФНЧ можно сконструировать ограничив шкалу времени от нуля до бесконечности (ограничить по фазе) и такими образом убрать предварительный “звон”, но – невозможно добиться одновременно отсутствия “звона” и ограничения частотных и (или) динамических (“амплитудных” 🙂 ) потерь в сигнале и отсутствия восстановления гармоник частот помех.

На практике обычно применяют два наиболее распространенных способа.

Первый способ – наиболее прост – согласиться на потери в исходном сигнале. Поскольку предварительный “звон” имеет сравнительно узкий частотный спектр, близкий к половине частоты дискретизации, то применив Цифровой ФНЧ с пониженной частотой среза можно существенно ослабить его заметность. Например можно выбрать частоту среза ФНЧ =19 kHz вместо 22 kHz и выбрать менее крутой спад АЧХ, что почти гарантированно ослабит различные паразитные ВЧ составляющие исходного сигнала. При этом, конечно неизбежно теряется и часть полезного сигнала, но существенно снижается заметность цифровых артефактов (aka “цифрит”) и исчезает “звон” при воспроизведении импульсов.Такие Цифровые Фильтры  обычно имеют в своем названии слово “Soft”.

Второй способ – отказаться от Цифрового Фильтра, но при этом уйти вверх по частоте дискретизации, тем самым транспонируя спектр помех и их гармоник существенно выше звуковой области. В частности, если при воспроизведении файлов выполнить передискритизацию с частотой ~192K, то применяя только Аналоговый ФНЧ на выходе ЦАП с частотой среза, например ~ 50 kHz, то можно добиться хорошего компромисса по качеству звука при широкой полосе воспроизводимых частот в области ВЧ, минимальных фазовых искажениях и очень низком уровне остаточных ультразвуковых составляющих помех и их гармоник.

То есть, логично получается вполне очевидный вывод, что для воспроизведения CD-rip’ов и  студийных исходников 48…192K без их конвертации в DSD лучше всего подойдет Hi-Res PCM ЦАП без ЦФ и с несложным аналоговым ФНЧ в выходном каскаде. 🙂

Январь 2020 г.Владивосток

P.S. К таким выводам меня привел довольно старый пост неизвестного автора на одном из форумов по оцифровке “винила”. К сожалению, имя автора и название форума я не запомнил.

5 thoughts on “Цифра и “цифрит”. Мысли вслух. Часть 1

  1. Добрый день
    Очень интересное начало.
    А в какой ценовой категории ЦАПа этот вариант может быть более дешевой альтернативой?
    Ждем часть 2

    • Александр, добрый день.

      Вопрос скорее не про альтернативный ЦАП – в принципе можно найти подходящий DIY набор и в комплекте с подходящим софтом (например JRiver) проверить эту идею. (Спойлер – я проверил 🙂 ). Тут скорее вопрос про DSD, воспроизведение которого без цифровой фильтрации практически невозможно. И вопрос в том, не слишком ли много “фантазируют” цифровые фильтры при обработке DSD? У меня есть стойкое ощущение, что помимо так называемой “фильтрации” 🙂 идет DSP обработка на уровне фазовых соотношений компонентов полезного сигнала – для формирования “глубокого” пространства, плюс некоторое поджатие динамического диапазона (причем разной степени для разных частотных областей), поскольку на одном и том же исходном материале, представленном в трех форматах (Винил/PCM/DSD) при воспроизведении DSD тихие звуки “заднего плана” почему-то становятся более заметны и локализуются четче. При этом – изначально материал был записан а аналоге, постпроцессинг для каждого из форматов конечно свой, но исходник во всех вариантах был один и тот же.

      С Уважением,

      Виктор

      • Виктор, добрый день.

        Есть подозрение, что указанные проблемы воспроизведения DSD (в частности – заметное снижение динамики фонограммы, субъективно воспринимаемое как некоторое “смягчение”) прерогатива не столько неизбежной цифровой фильтрации (тот же AFIR, к примеру, по сути – классическое скользящее среднее и простора для “фантазирования” при обработке сигнала не так много), сколько применяемых модуляторов. Насколько мне известно, большинство из них теряет устойчивость при уровне входного сигнала, превышающего 74% от максимального. Как следствие – искусственное занижение динамического диапазона.
        Разумеется, существуют исключения (например, Trellis-модуляторы, применяемые Merging Technologies), но большинство доступного материала в формате DSD не реализует весь потенциал данного формата.

        С Уважением, Герман.

        • Герман, добрый день.

          Да, технологические и конструктивные проблемы с модуляторами, ключами на практике приводят тому, что спектр шумов в итоговом аналоговом сигнале коррелирует с частотой и амплитудой. Похоже, что одним из способов уменьшения заметности шума является введение неких предискажений в исходный цифровой сигнал. То есть на данном этапе полностью решить задачу не представляется возможным, но возможно немного доработать сигнал таким образом, чтобы после цифро-аналогового преобразования артефакты стали менее заметны. Похоже что по факту небольшая часть полезной информации в цифровом исходнике заменяется ее “улучшенным” 🙂 эквивалентом.

          С Уважением,
          Виктор

          • Виктор, добрый день.

            Также существует проблема характерных артефактов SDM (idle tones, limit cycles), приводящая к появлению паразитных пиков в слышимом диапазоне частот. Наиболее интенсивный пик idle tones имеет частоту 3/20 несущей – 423.36Hz для dsd64, 846.72Hz для dsd128, 1693.44Hz для dsd256 и 3386.88Hz для dsd512, соответственно. С увеличением частоты несущей артефакты смещаются в область максимальной чувствительности слуха. То есть, с одной стороны, наращивая частоту, упрощаем требования к аналоговому ФНЧ выходного каскада, с другой – сталкиваемся новыми проблемами… Есть и альтернативный подход – PWM-модуляция на частотах около 100МГц, примененная в Mola-Mola Dac, но наверняка и в этом случае присутствуют “подводные камни”.

            С Уважением, Герман.

Leave a Reply

Your email address will not be published. Required fields are marked *