Russian
LinkExchange Banner Network
Russian LinkExchange Member
 

Frequently Asked Questions (Часто Задаваемые Вопросы)

по звуковым компакт-дискам (CD-DA)

Создан: 28.06.98

Последняя модификация: 04.07.98

Автор: Евгений Музыченко (Eugene Muzychenko)

2:5000/14@FidoNet, music@spider.nrcde.ru

Copyright (C) 1996-97, Eugene V. Muzychenko

Все права в отношении данного текста принадлежат автору. При воспроиз-

ведении текста или его части сохранение Copyright обязательно. Коммер-

ческое использование допускается только с письменного разрешения авто-

ра.

При наличии изменений с момента последней публикации они отмечаются

знаком ">-".

----------------------------------------------------------------------

- Как устроен компакт-диск?

Конструкция диска CD-DA (Compact Disk - Digital Audio, компакт-диск -

цифровой звук) и способ записи звука на нем описывается стандартом

предложивших его фирм Sony и Philips, изданным в 1980 году под назва-

нием Red Book (Красная Книга).

Стандартный компакт-диск (CD) состоит из трех слоев: основы, отража-

ющего и защитного. Основа выполнена из прозрачного поликарбоната, на

котором методом прессования сформирован информационный рельеф. Поверх

рельефа напыляется металлический отражающий слой (алюминий, золото,

серебро, другие металлы и сплавы). Отражающий слой покрывается сверху

защитным слоем поликарбоната или нейтрального лака - так, чтобы вся

металлическая поверхность была защищена от контакта со внешней средой.

Общая толщина диска - 1.2 мм.

Информационный рельеф диска представляет собой непрерывную спиральную

дорожку, начинающуюся от центра и состоящую из последовательности уг-

лублений - питов (pits). Промежутки между питами носят название lands.

Чередованием питов и промежутков различной длины на диске записывается

закодированный цифровой сигнал. Расстояние между витками дорожки выби-

рается от 1.4 до 2 мкм, стандарт определяет расстояние в 1.6 мкм.

----------------------------------------------------------------------

- Каким образом на диске представляется звуковой сигнал?

Исходный стереофонический звуковой сигнал подвергается оцифровке в

16-разрядные отсчеты (линейное квантование) с частотой дискретизации

44.1 кГц. Полученный цифровой сигнал носит название PCM (Pulse Code

Modulation - импульсно-кодовая модуляция, ИКМ), так как каждый импульс

исходного сигнала представляется отдельным кодовым словом. Каждые

шесть отсчетов левого и правого каналов оформляются в кадры размером

24 байта (192 бита), которые подвергаются кодированию при помощи дву-

хуровневого кода CIRC (Cross Interleaved Reed-Solomon Code - избыточ-

ный код Рида-Соломона с перекрестным перемежением) по схеме: перемеже-

ние с задержкой на 1 байт, кодирование уровнем C2, перекрестное пере-

межение с переменной задержкой, кодирование уровнем C1, перемежение с

задержкой на 2 байта. Уровень C1 предназначен для обнаружения и кор-

рекции одиночных ошибок, C2 - групповых. В результате получается блок

длиной 256 бит, данные в котором снабжены разрядами обнаружения и кор-

рекции ошибок, и к тому же "размазаны" до блоку, что приводит к записи

смежных звуковых данных в физически несмежных областях диска и снижает

влияние ошибок на отдельные отсчеты.

Код Рида-Соломона имеет избыточность 25% и позволяет обнаруживать до

четырех ошибочных байтов и корректировать до четырех потерянных или

двух ошибочных байтов. Максимальная длина полностью исправляемого па-

кета ошибок - около 4000 бит (~2.5 мм длины дорожки), однако не любой

пакет такой длины может быть полностью исправлен.

После второго перемежения к каждому полученному блоку добавляются раз-

ряды субкодов - P, Q, R, S, T, U, V, W; каждый блок получает восемь

субкодных битов. Затем каждые 98 блоков с субкодами оформляются в один

сверхкадр длительностью 1/75 сек (объем чистых звуковых данных - 2352

байта), называемый также сектором, в котором субкоды первых двух бло-

ков служат признаком синхронизации, а оставшиеся 96 разрядов каждого

субкода образуют P-слово, Q-слово и т.д. На протяжении всей дорожки

последовательность субкодных слов называют также субкодными каналами.

Слова или каналы субкодов используются для управления форматом записи,

индикации фрагментов фонограммы и т.п. - например, канал P служит для

пометки звуковых дорожек и пауз между ними (0 - пауза, 1 - звук), а

канал Q - для пометки формата дорожек и секторов, записи оглавления

TOC (Table Of Contents - таблица содержимого) и временнЫх меток, по

которым отслеживается время воспроизведения. Канал Q может использо-

ваться также для записи информации в ISRC (International Standard

Recording Code - международный стандартный код записи), предназначен-

ном для представления сведений о производителе, времени выпуска и

т.п., а также - для разделения дорожки на отдельные фрагменты (всего

на звуковом диске может быть до 99 звуковых дорожек, каждая из которых

может включать до 99 фрагментов).

В конце концов оформленные таким образом кадры подвергаются канальному

кодированию в терминах "пит - промежуток" с использованием избыточного

кода 8/14 (Eight to Fourteen Modulation - EFM), в котором исходные

байты кодируются 14-битными словами, повышающими разборчивость сигна-

ла. Между словами вставляется по три связующих бита для соблюдения ог-

раничений на количество смежных нулей и единиц, что облегчает демоду-

ляцию и уменьшает постоянную составляющую сигнала. Полученный битовый

поток записываются на диск со скоростью 4.3218 Мбит/с.

В начале диска располагается так называемая вводная (lead-in) зона,

содержащая информацию о формате диска, структуре звуковых программ,

адресах фрагментов, названиях произведений и т.п. В конце записывается

выводная (lead-out) зона (дорожка с номером AA), выполняющая роль гра-

ницы записанной области диска; бит P-кода в этой зоне изменяется с

частотой 2 Гц. Ряд бытовых проигрывателей не может опознать диск без

этой зоны, однако многие могут обходиться без нее. Между вводной и вы-

водной зонами записывается программная область (Program Memory Area -

PMA), содержащая собственно звуковые данные. Программная область отде-

лена от вводной зоны участком из 150 пустых блоков (2 секунды), игра-

ющим роль зазора (pre-gap).

Общая длительность записи на компакт-диске - 74 минуты, однако при

уменьшении стандартного шага дорожки и расстояния между питами можно

достичь увеличения времени записи - за счет снижения надежности считы-

вания в стандартном дисковом приводе.

----------------------------------------------------------------------

- Как записываются и изготавливаются компакт-диски?

Основной способ изготовления дисков - прессование с матрицы. Оригинал

формируется с исходной цифровой мастер-ленты, содержащей уже подготов-

ленный и закодированный цифровой сигнал, специальным высокоточным

станком на стеклянном диске, покрытом слоем фоторезиста - материала,

изменяющего свою растворимость под воздействием лазерного луча. При

обработке записанного оригинала растворителем на стекле возникает тре-

буемый рельеф, который методом гальванопластики переносится на никеле-

вый оригинал (негатив), который может служить матрицей при мелкосерий-

ном производстве, либо основой для снятия позитивных копий, с которых,

в свою очередь, снимаются негативы для массового тиражирования.

Штамповка выполняется методом литья под давлением: с негативной матри-

цы прессуется поликарбонатная подложка с рельефом, сверху напыляется

отражающий слой, который покрывается лаком. Поверх защитного слоя

обычно наносятся информационные надписи и изображения.

Диски с возможностью записи (CD-R, "болванки") изготавливаются таким

же методом, но между основой и отражающим слоем располагается слой ор-

ганического вещества, темнеющего при нагревании. В исходном состоянии

слой прозрачен, при воздействии лазерного луча образуются непрозрачные

участки, эквивалентные питам. Для облегчения слежения за дорожкой при

записи на диске в процессе изготовления формируется предварительный

рельеф (разметка), дорожка которого содержит метки кадров и сигналы

синхронизации, записанные со сниженной амплитудой и впоследствии пе-

рекрываемые записываемым сигналом.

Записываемые диски за счет наличия органического фиксирующего слоя

имеют более низкий коэффициент отражения, чем штампованные, отчего не-

которые проигрыватели (Compact Disk Player - CDP), рассчитанные на

стандартные алюминиевые диски и не имеющие запаса по надежности чте-

ния, могут воспроизводить диски CD-R менее надежно, чем обычные.

----------------------------------------------------------------------

- Как воспроизводятся компакт-диски?

При воспроизведении звуковой компакт-диск вращается с постоянной ли-

нейной скоростью (Constant Linear Velocuty - CLV), при которой ско-

рость дорожки относительно воспроизводящей головки приблизительно рав-

на 1.25 м/с. Система стабилизации скорости вращения поддерживает ее на

таком уровне, чтобы обеспечить скорость считанного цифрового потока

равной 4.3218 Мбит/с, поэтому в зависимости от длины питов и промежут-

ков действительная скорость может изменяться. Угловая скорость диска

при этом изменяется от 500 об/мин при чтении самых внутренних участков

дорожки до 200 об/м на самых внешних.

Для считывания информации с диска используется полупроводниковый лазер

с длиной волны около 780 нм (инфракрасный диапазон). Луч лазера, про-

ходя через фокусирующую линзу, падает на отражающий слой, отраженный

луч попадает в фотоприемник, где происходит определение питов и проме-

жутков, а также проверка качества фокусировки пятна на дорожке и его

ориентации по центру дорожки. При нарушении фокусировки происходит пе-

ремещение линзы, работающей по принципу диффузора громкоговорителя

(voice coil - звуковая катушка), при отклонении от центра дорожки -

перемещение всей головки по радиусу диска. В сущности, системы управ-

ления линзой, головкой и шпиндельным двигателем в приводе являются

системами автоматической регулировки (САР) и находятся в режиме посто-

янного слежения за выбранной дорожкой.

Полученный от фотоприемника сигнал в коде 8/14 демодулируется, в ре-

зультате чего восстанавливается результат кодирования по CIRC с добав-

ленными субкодами. Затем производится отделение субкодных каналов, де-

перемежение и декодирование CIRC на двухступенчатом корректоре (C1 -

для одиночных ошибок и C2 - для групповых), в результате чего обнару-

живается и исправляется большая часть ошибок, внесенных нарушениями

при штамповке, дефектами и неоднородностью материалов диска, царапина-

ми на его поверхности, нечетким определением пита/промежутка в фотоп-

риемнике и т.п. В итоге поток "чистых" звуковых отсчетов направляется

на ЦАП для преобразования в аналоговую форму.

В звуковых проигрывателях после корректора имеется также интерполятор

различной сложности, приближенно восстанавливающий ошибочные отсчеты,

которые не удалось исправить в декодере. Интерполяция может быть ли-

нейной - в простейшем случае, полиномиальной или с использованием

сложных гладких кривых.

Для выполнения деперемежения любое CD-читающее устройство имеет буфер-

ную память (стандартный объем - 2 кб), которая заодно используется для

стабилизации скорости цифрового потока. Для декодирования может ис-

пользоваться несколько различных стратегий, в которых вероятность об-

наружения групповых ошибок обратно пропорциональна надежности их кор-

рекции; выбор стратегии отдается на усмотрение разработчика декодера.

Например, для CD-проигрывателя с мощным интерполятором может выбирать-

ся стратегия с упором на максимальное обнаружение, а для CDP с простым

интерполятором или привода CD-ROM - на максимальную коррекцию.

----------------------------------------------------------------------

- Каковы параметры звукового сигнала на CD?

Стандартные параметры оцифровки - частота дискретизации 44.1 кГц и

разрядность отсчета 16 - определяют следующие теоретически вычисленные

характеристики сигнала:

Диапазон частот - 0..22050 Гц

Динамический диапазон - 98 дБ

Уровень шума - -98 дБ

Коэффициент нелинейных искажений - 0.0015% (на максимальном уровне

сигнала)

В реальных устройствах записи и воспроизведения CD верхние частоты не-

редко обрезаются на уровне 20 кГц для создания запаса по крутизне АЧХ

фильтра. Уровень шума может быть как меньше 98 дБ в случае линейного

ЦАП и шумного выходного усилителя, так и больше - в случае передискре-

тизации на более высокой частоте с использованием ЦАП типа

Delta-Sigma, Bitstream или MASH и малошумящих усилителей. Коэффициент

нелинейных искажений сильно зависит от применяемого ЦАП выходных цепей

и качества источника питания.

Динамический диапазон в 98 дБ определяется для CD, исходя из разницы

между минимальным и максимальным уровнем звукового сигнала, однако на

малом сигнале значительно возрастает уровень нелинейных искажений, от-

чего реальный динамический диапазон, внутри которого сохраняется при-

емлемый уровень искажений, обычно не превышает 50-60 дБ.

Коэффициент детонации в системе "компакт-диск" лишен смысла, поскольку

нестабильность скорости вращения диска напрямую никак не связана с

нестабильностью выходного сигнала, которая практически целиком опреде-

ляется задающими генераторами. Однако "тонкая" зависимость звука от

работы механических и электронных систем CDP может проявляться благо-

даря распространению помех по цепям питания, наводкам между сигнальны-

ми линиями, микрофонному эффекту отдельных деталей и прочим паразитным

воздействиям на звуковой тракт. В частности, помехи по питанию вызыва-

ют дрожание фазы (jitter) опорных генераторов, приводящее к такому же

дрожанию фазы цифрового сигнала, поступающего на ЦАП, что в итоге на-

рушает фазовые характеристики звукового сигнала, ощущаемые на слух как

"размывание" и потеря локализации источников звука в пространстве.

----------------------------------------------------------------------

- Что такое jitter?

Джиттер - быстрое по отношению к длительности периода дрожание фазы

цифрового сигнала, когда нарушается строгая равномерность следования

фронтов импульсов. Такое дрожание возникает из-за нестабильности так-

товых генераторов, а также в местах выделения синхросигнала из ком-

плексного сигнала методом PLL (Phase Locked Loop - петля с захватом

фазы, или фазовая автоподстройка частоты - ФАПЧ). Такое выделение име-

ет место, например, в демодуляторе сигнала, считанного с диска, в ре-

зультате чего образуется опорный синхросигнал, который путем коррекции

скорости вращения диска "подгоняется" к эталонной частоте 4.3218 МГц.

Частота синхросигнала, а следовательно - его фаза и фаза информацион-

ного сигнала - при этом непрерывно колеблются с различной частотой.

Дополнительный вклад может вносить неравномерность расположения питов

на диске, порожденная, например, некачественным прессованием или нес-

табильной записью.

Однако неравномерности сигнала с диска полностью компенсируются вход-

ным буфером декодера, так что любое дрожание и детонация, возникшие до

помещения сигнала в буфер, на этом этапе уничтожаются. Выборка из бу-

фера управляется стабильным генератором с фиксированной частотой, од-

нако таким генераторам тоже присуща определенная, хотя и гораздо мень-

шая, нестабильность. В частности, она может быть вызвана помехами по

цепям питания, которые, в свою очередь, могут возникать в моменты сра-

батывания САР и коррекции скорости диска или положения головки/линзы.

На дисках низкого качества эти коррекции происходят чаще, давая ряду

экспертов повод напрямую связывать стабильность выходного сигнала с

качеством диска, хотя на самом деле причиной является недостаточно хо-

рошая развязка систем CDP.

----------------------------------------------------------------------

- Что означают аббревиатуры AAD, DDD, ADD?

Буквы этой аббревиатуры отражают формы звукового сигнала, использован-

ные при создании диска: первая - при исходной записи, вторая - при об-

работке и сведении, третья - конечный мастер-сигнал, с которого форми-

руется диск. "A" обозначает аналоговую (analog) форму, "D" - цифровую

(digital). Мастер-сигнал для CD всегда существует только в цифровой

форме, поэтому третья буква аббревиатуры всегда "D".

И аналоговая, и цифровая формы сигнала имеют свои достоинства и недос-

татки. При записи и обработке сигнала в аналоговой форме наиболее пол-

но сохраняются его "тонкие элементы", в частности - высшие гармоники,

однако возрастает уровень шума и искажаются амплитудно-частотная и фа-

зо-частотная характеристики (АЧХ/ФЧХ). При обработке в цифровой форме

высшие гармоники принудительно обрезаются на половине частоты дискре-

тизации, а часто и еще ниже, однако все дальнейшие операции выполняют-

ся с предельно возможной для выбранного разрешения точностью. Сигнал,

прошедший аналоговую обработку, ряд экспертов оценивает, как более

"теплый" и "живой", однако многие современные методы обработки сигнала

приемлемо реализуются только в цифровом варианте.

----------------------------------------------------------------------

- Могут ли два одинаковых диска звучать по-разному?

Прежде всего, необходимо убедиться, что диски действительно содержат

идентичный цифровой звуковой сигнал. Полное двоичное совпадение двух

дисков на уровне конфигурации питов и промежутков практически невоз-

можно за счет мелких дефектов материала и искажений при обработке мат-

риц и прессовании, однако благодаря избыточному кодированию подавля-

ющее большинство этих ошибок исправляется при декодировании, обеспечи-

вая один и тот же цифровой поток "высокого уровня".

Сравнить цифровое содержимое дисков можно путем чтения их в приводе

CD-ROM, поддерживающем режим Read Long или Raw Read - считывания

"длинных секторов", которые на самом деле являются сверхкадрами CD-DA

объемом 2352 байта каждый. Подробнее об этом можно прочитать в FAQ по

CD-ROM или в руководстве к программам считывания звука (CD-DA

Grabbers/Rippers). Сравнить диски можно также на студийной аппаратуре,

умеющей читать диски в цифровом виде на DAT-магнитофон.

Причин для возникновения цифровых различий между похожими на слух дис-

ками может быть несколько. Некоторые приводы CD-ROM и другие аппараты

цифрового чтения CD-DA могут в целях недопущения прямого копирования

вносить в сигнал малозаметные на слух искажения, а большинство приво-

дов, поддерживающих команды чтения полных кадров, делают это неакку-

ратно и неточно. При изготовлении копий (перепечаток) звуковых дисков,

особенно пиратским способом, они нередко копируются с передискретиза-

цией на другую частоту (например, 48 кГц в DAT) с последующей передис-

кретизацией на исходную, либо вовсе через аналоговый тракт с двойным

преобразованием цифра/аналог. Ряд версий записывающих программ для

CD-R также намеренно или случайно искажает исходные данные, так что

копия не совпадает с оригиналом.

Если цифровое содержание двух дисков совпадает, они тем не менее тоже

могут давать различное звучание на одном CDP. Возможными причинами

этого может быть нечеткое считывание (даже дорогие CDP далеко не всег-

да имеют хороший запас по надежности чтения), упор на сложную интерпо-

ляцию одиночных ошибок ценой повышения способности к обнаружению и ис-

правлению групповых, недостаточная развязка по питанию и другим путям

распространения паразитных сигналов между первичными системами CDP

(механика, САР, декодер, интерполятор и т.п.) и оконечным звуковым

трактом, и тому подобные тонкости. Свой вклад может вносить и сам

диск, если его параметры отличаются от нормы больше, чем допускает

"диапазон приемлемости" данного CDP.

Сравнение звучания дисков должно быть корректным - наиболее признанным

является двойной слепой тест (double-blind test). Суть метода состоит

в том, что эксперт (слушатель) не должен видеть манипуляций с аппара-

турой и производящего их человека, а сам этот человек, произвольным

образом меняющий диски, не должен знать особенностей их содержимого.

Таким образом максимально исключаются любые влияния, в том числе "тон-

кие" и неизученные, людей на аппаратуру и друг на друга, а мнение эк-

сперта считается предельно непредвзятым.

----------------------------------------------------------------------

- Что такое HDCD?

High Definition Compatible Digital - "сверх-система" кодирования звука

на CD, использующая стандартный формат CD-DA. Звуковой сигнал с более

высокой разрядностью и частотой дискретизации подвергается цифровой

обработке, в результате которой из него выделяется основная часть, ко-

дируемая, как обычно, методом PCM, а дополнительная информация, уточ-

няющая мелкие детали, кодируется в младших битах отсчетов (LSB) и мас-

кируемых спектральных областях. При проигрывании диска HDCD на обычном

CDP используется только основная часть сигнала, а при использовании

специального CDP со встроенным декодером и процессором HDCD из цифро-

вого кода извлекается вся информация о сигнале.

----------------------------------------------------------------------

- Как обращаться с компакт-дисками?

Избегая механического повреждения любой из поверхностей, попадания на

диск органических растворителей и прямого яркого света, ударов и пере-

гибов диска. Надписи на записываемых дисках допускается делать только

карандашами или специальными фломастерами, исключая нажим и использо-

вание шариковых или перьевых ручек.

При извлечении диска из коробки следует остерегаться его перегиба.

Один из удобных и безопасных методов требует участия двух рук - боль-

шой палец левой руки слегка нажимает на фиксатор, ослабляя его, в то

время как другая рука снимает диск с фиксатора. Метод с использованием

одной руки, когда указательный палец ослабляет фиксатор, а большой и

средний снимают диск, требует более точного согласования усилий, без

которого легко перегнуть диск или сломать лепестки фиксатора.

Загрязненный диск можно мыть теплой водой с мылом или неагрессивным

поверхностно-активным веществом (шампунь, стиральный порошок), либо

специально выпускаемыми жидкостями. Неглубокие царапины на прозрачном

слое можно заполировать - полирующими пастами, не содержащими органи-

ческих растворителей и масел, или обычной зубной пастой.

----------------------------------------------------------------------

- Где найти более подробную информацию по компакт-дискам?

П. Шкритек, Справочное руководство по звуковой схемотехнике. - М.,

"Мир", 1991.

Оптические дисковые системы. - М., "Радио и связь", 1991.

Compact Disk Terminology, Jim Fricks, Disc Manufacturing, Inc. Рас-

пространяется в файле CD_Term.Doc.

CD-R FAQ, Andy McFadden, www.fadden.com/cdrfaq/

www.cd-info.com

а также с помощью поисковых систем по ключевым словам CD, CD-DA,

Compact Disk, CDP, CIRC и т.п.

----------------------------------------------------------------------

Большое спасибо всем приславшим ответы, рекомендации, замечания и со-

веты для этого FAQ.

Текст FAQ в альтернативной кодировке доступен для FReq на

2:5000/14@FidoNet по имени CDDAFAQ. Более подробные сведения по цифро-

вому звуку можно найти в SOUNDFAQ, по дискам и приводам CD-ROM - в

CDROMFAQ. Полный пакет FAQ и описаний доступен на

ftp://spider.nrcde.ru/pub/text/tech/emhwfaqs.zip и через страницу FAQ

на http://spider.nrcde.ru. Пакет распространяется также по FIDO

fileecho XHRDDOCS.

======================================================================