Форматы цифрового кодирования звукового сигнала
Отличия между PCM, PDM, PWM кодеками. Принцип работы широтно- импульсной и импульсно-кодовой модуляции
Цифровое кодирование звука – это процесс преобразования амплитуды звукового сигнала в последовательность двоичных чисел для
последующей обработки и хранения в цифровых устройствах. Таким образом, оцифровка звука представляет собой аналогово-цифровое преобразование,
включающее в себя два этапа:
— этап дискретизации (осуществление выборки) сигнала по времени;
— этап квантования и кодирования сигнала по амплитуде.
На сегодняшний день существует множество форматов цифрового кодирования звука, каждый из которых предлагает определенные преимущества
по сравнению с другими.
1. PCM метод цифрового кодирования сигнала
PCM – это метод кодирования, обычно используемый для несжатого цифрового звука. Аббревиатура PCM расшифровывается как
Pulse-Code-Modulation, то есть кодирование сигнала с помощью импульсно-кодовых последовательностей в виде n-разрядных целых чисел,
например, 4, 8, 16 или 32 бита. Таким образом, аналоговые уровни сигнала преобразуются (с помощью АЦП) в последовательность целых двоичных чисел,
кодирующих абсолютный уровень амплитуды.
LPCM (линейная импульсно-кодовая модуляция) кодирование – это подвид PCM, при котором аналоговый сигнал сэмплируется через равные
промежутки времени, а уровни квантования амплитуды также линейно равномерны (Рис.1).
LPCM является наиболее используемой формой PCM, поэтому сейчас эти термины практически идентичны.

Рис.1 Квантование сигнала для 4-битного LPCM
Частота импульсов синхронизации (дискретизации) в PCM-кодировании определяет максимальную частоту входного сигнала и, как следует из теоремы Котельникова –
для того чтобы полностью восстановить исходный сигнал, эта частота должна более чем в два раза превышать наибольшую частоту в спектре сигнала.
К примеру, для записи на Аудио CD-дисках используют частоту дискретизации 44.1 кГц и разрядность 16 бит, а в DVD и Blu-Ray дисках обычно
применяют LPCM с частотой 48 кГц (стерео) или 96 кГц (звук 5.1 Surround) и разрядностью 24 бита.
А вот разрядность двоичного кода влияет на такие параметры, как коэффициент нелинейных искажений, уровень шума квантования и динамический
диапазон.
Динамический диапазон в децибелах, можно рассчитать по формуле:
DR = 20lg(2N), где N – разрядность квантования. Получается, что для 16-ти бит теоретический динамический диапазон – около 96 дБ, а для 24 бит –
около 144 дБ.
В цифровом звуке импульсно-кодовая модуляция PCM очень распространена. С её помощью записываются FLAC, MP3, WAV, Audio CD, DVD-Audio
и другие форматы, являющиеся лишь сжатыми или несжатыми способами упаковки, «консервации» потока PCM.
Одним из важных достоинств PCM кодирования является простота обработки его цифрового кода: от заурядной регулировки громкости до любой
многоступенчатой обработки «сложными» эффектами.
Недостатком является то, что для преобразования из аналоговой формы в PCM и обратно требуются специальные аппаратные устройства (АЦП и ЦАП) с
системами взаимной синхронизации.
2. PDM метод цифрового кодирования сигнала
PDM метод кодирования (Pulse-Density-Modulation) – это способ преобразования амплитуды сигнала в последовательность одноразрядных
импульсов с изменяемой длительностью нулей и единиц. Этот однобитный поток со значительно более высокой (по сравнению с PCM-модуляцией) частотой
дискретизации имеет относительную плотностью импульсов, соответствующую амплитуде аналогового сигнала. То есть последовательность выходных
импульсов, состоящая из одних единиц, соответствует максимальному (положительному) значению амплитуды, последовательность из одних нулей –
минимальному (отрицательному) значению амплитуды, а чередование единиц и нулей одинаковой длительности – нулевому значению амплитуды.
Таким образом, для демодуляции выходного цифрового потока достаточно провести простую фильтрацию всех высокочастотных составляющих PDM-потока,
оставив только полезный звуковой сигнал (частоты до 20...22 кГц). Сделать это можно посредством цифрового или аналогового фильтра нижних частот (ФНЧ),
с помощью которого можно выделить средний уровень сигнала из потока битов. Поскольку PDM поток битов можно рассматривать как сигнал с его информацией
в нижнем диапазоне частот и большим количеством шума квантования на значительно более высоких частотах, то такой ФНЧ позволяет улучшить шумовые характеристики
PDM преобразования.
В радиоэлектронике PDM метод кодирования называют одноразрядной дельта-сигма (ΔΣ) модуляцией.
Более подробно познакомиться с принципом работы, свойствами, шумовыми и частотными характеристиками дельта-сигма модуляторов
можно на странице – ссылка на страницу. Здесь же приведём обзорную, то есть несколько сокращённую версию.
Структурная схема дельта-сигма
модулятора первого порядка приведена на Рис.2, а диаграммы, поясняющие его работу, на Рис.3.

Рис.2 Схема сигма-дельта модулятора первого порядка
Рис.3 Диаграммы, поясняющие работу, сигма-дельта модулятора
Модулятор тактируется с частотой, кратной частоте Найквиста (2fmax), и выдаёт на выходе поток с частотой, равной
fbit = OSR × 2fmax, где fmax – это
максимальная частота входного аналогового сигнала, а OSR – коэффициент передискретизации.
На вход сигма-дельта модулятора поступает аналоговый сигнал амплитудой от –VRef до +VRef (на схеме ±1V),
ограниченный максимальной частотой fmax. На выходе создаётся 1-разрядный битовый поток с частотой в OSR раз большей, чем предел Найквиста 2fmax.
В каждом цикле тактовой частоты текущее значение битовой последовательности, преобразованное в аналоговое напряжение ±VRef (на схеме ±1V) посредством 1-bit ЦАП,
вычитается из входного сигнала, а разница интегрируется неинвертирующим аналоговым интегратором и подаётся на компаратор с ячейкой памяти на D-триггере.
Постоянная времени интегратора выбирается исходя из тех соображений, чтобы для максимального уровня сигнала на входе +VRef изменение
выходного напряжения за время одного периода тактовой частоты также равнялось этому уровню (+VRef).
Таким образом, интегратор можно рассматривать как «аналоговый аккумулятор»:
для фиксированного входного напряжения Uвх его выходной уровень увеличивается на те же Uвх за один период тактового сигнала.
В результате на выходе получается быстрый 1-битный поток нулей и единиц с частотой
fbit = OSR × 2fmax, которая, как минимум, в 2×OSR раза
превышает частоту входного сигнала. Если в демодуляторе сформировать уровни «1» и «0» этих битов, равными ±VRef,
то будет получен двоичный поток, среднее значение которого соответствует входному сигналу.
Частота дискретизации сигма-дельта модулятора «первого порядка» определяет как точность аналого-цифрового преобразования, так и его шумовые характеристики,
а вместе с ними и динамический диапазон. Однако повышать тактовую частоту до бесконечности нельзя, поэтому
современные АЦП используют модуляторы более «высоких порядков». В этом случае цепочка из вычитателя и интегратора
заменяется двумя или несколькими аналогичными последовательными звеньями (каждое из которых состоит из вычитателя и интегратора (Рис.4)).

Рис.4 Сигма-дельта модулятор второго порядка
Модуляторы высоких порядков находят широкое применение, потому что расширяют динамический диапазон без увеличения коэффициента передискретизации.
В них возникает эффект модуляции шума, перенос энергии шума на высокие частоты и, как следствие, в рабочей низкочастотной области шумов оказывается меньше.
Это позволяет получить «эффективную» разрядность существенно выше, что у PDM первого порядка.
На графике, изображённом на Рис.5, показана зависимость динамического диапазон сигма-дельта АЦП от коэффициента передискретизации
и порядка модулятора.
Эффективное число бит, также приведённое на графике – это некая абстрактная характеристика, показывающая, сколько
на самом деле бит в выходном коде АЦП несёт в себе полезную (свободную от шума) информацию.

Рис.5 Сигнал/шум (SNR) и эффективное число разрядов (ENOB) – как функции коэффициента передискретизации (OSR) и порядка модулятора (m)
Так какой же должна быть частота дискретизации PDM, она же частота выходного однобитного потока?
Для наглядности обратимся к DSD аудиоформату, разработанному компаниями Sony и Philips, в котором осуществляется PDM кодирование, и который используется для
упаковки и хранения звукозаписей на оптических носителях SACD (Super Audio CD).
На SACD-дисках применяется формат DSD x64 c частотой дискретизации 2822.4 кГц. За основу была взята частота дискретизации
Audio CD 44.1 кГц, увеличенная в 64 раза (отсюда название x64), причём, как декларирует производитель – качество звучания SACD значительно превосходит
обычные CD. Формат SACD способен обеспечивать динамический диапазон 120 дБ в полосе 20...20 000 Гц и расширенную частотную характеристику до 100 кГц.
На данный момент также реально встречаются такие форматы DSD, как: x128 = 5644.8 кГц, x256 = 11289.6 кГц, x512 = 22579.2 кГц.
3. PWM метод цифрового кодирования сигнала
PWM (Pulse-Width Modulation) – это метод цифрового кодирования сигнала, при котором представление амплитуды сигнала производится с помощью
импульсов постоянной частоты с изменяемой длительностью (скважностью), т. е. таких импульсов, у которых в зависимости от
амплитуды входного сигнала изменяется соотношение длительностей логических «0» и «1».
Русскоязычное обозначение PWM – ШИМ (Широтно-Импульсная Модуляция).
PWM метод часто считают частным случаем PDM, потому что кодирование уровней сигнала также осуществляется с помощью цифрового однобитного сигнала,
однако в отличие от PDM у PWM частота переключения выходных импульсов постоянна, а меняется лишь их скважность.
Реализация ШИМ модуляции предельно проста – на один из входов компаратора подаётся сигнал высокой частоты (fШИМ)
от генератора треугольного напряжения,
на второй – аналоговый НЧ сигнал (либо измеряемое постоянное напряжение).
С выхода компаратора снимаются широтно модулированные импульсы с частотой fШИМ, у которых длительность «1»
пропорциональна уровню входного сигнала (Рис.6).

Рис.6 Механизм формирования ШИМ на примере усилителя D-класса
Поскольку частота PWM потока постоянна и значительно выше частоты полезного аналогового сигнала, то в качестве демодулятора удобно использовать
простой аналоговый фильтр нижних частот ФНЧ (на схеме LF, CF), который выделит средний уровень
сигнала из потока битов.
Несмотря на то, что первые импульсные аудиоусилители были построены именно с применением ШИМ модуляции, на сегодняшний день уделом PWM кодеков
в основном являются: импульсные источники питания, системы автоматического управления мощностью оборудования, регуляторы освещения и т. д. и т. п.
Любой из цифровых потоков LPCM, PCM и PDM можно конвертировать друг в друга посредством специальных программных алгоритмов, либо аппаратно с помощью
ИМС цифровой логики.
|