Frequently Asked Questions (Часто Задаваемые Вопросы)по электронному созданию и обработке звукаСоздан: 15.06.96 Последняя модификация: 01.08.98 Автор: Евгений Музыченко (Eugene Muzychenko) 2:5000/14@FidoNet, music@spider.nrcde.ru Copyright (C) 1996-97, Eugene V. Muzychenko Все права в отношении данного текста принадлежат автору. При воспроиз- ведении текста или его части сохранение Copyright обязательно. Коммер- ческое использование допускается только с письменного разрешения авто- ра. При наличии изменений с момента последней публикации они отмечаются знаком ">-". ---------------------------------------------------------------------- - Для чего применяется создание и обработка звука? Создание (синтез) звука в основном преследует две цели: имитация раз- личных естественных звуков (шум ветра и дождя, звук шагов, пение птиц и т.п.), а также акустических музыкальных инструментов (имитационный синтез), и получение принципиально новых звуков, не встречающихся в природе (чистый синтез). Обработка звука обычно направлена на получе- ние новых звуков из уже существующих (например, "голос робота"), либо придание им дополнительных качеств или устранение существующих (напри- мер, добавление эффекта хора, удаление шума или щелчков). Каждый из методов синтеза и обработки имеет свою математическую и алгоритмичес- кую модель, что позволяет любой из них реализовать на компьютере; од- нако, многие методы, будучи реализованы точно, требуют слишком большо- го объема вычислений, отчего их обычно реализуют с какой-либо степенью допущения. ---------------------------------------------------------------------- - Каковы основные свойства звука? Чаще всего в звуке рассматривается амплитуда и спектральный состав звукового колебания, а также их изменение во времени. Амплитуда (amplitude) определяет максимальную интенсивность колебаний - громкость (volume) или силу звука. На осциллограмме амплитуда пред- ставляется размахом сигнала - наибольшим и наименьшим относительно среднего значения уровнями. Спектральный состав определяет окраску или тембр звука (timbre). Любое периодическое колебание может быть представлено рядом Фурье - суммой конечного числа синусоидальных колебаний (чистых тонов). Спектр звука представляет собой график интенсивностей (амплитуд) этих частотных составляющих, обозначаемых обычно в виде вертикальных линий соответ- ствующей высоты. Спектр чистого тона имеет только одну линию, соответ- стующую его частоте; спектр любого другого колебания имеет более одной линии. Если на спектре звука имеется достаточно острый пик, то такой звук воспринимается на слух как тон соответствующей высоты, а осталь- ные составляющие определяют его окраску; в противном случае звук вос- принимается как одновременное звучание нескольких тонов или шум. Час- тотные составляющие, кратные основной частоте тона, называются гармо- никами (harmonics) или обертонами; гармоники нумеруются, начиная с са- мого основного тона (первая гармоника), а обертоны - с первой кратной составляющей (первый обертон - вторая гармоника и т.д.). Из-за особенностей слухового восприятия высота звука определяется больше по его спектральному составу, нежели по самому основному тону. Например, субъективная высота большинства спектрально богатых низко- частотных звуков практически не меняется даже при полном удалении из них основного тона, который в слуховом аппарате восстанавливается по разностным частотам первых обертонов. Изменение амплитуды во времени называется амплитудной огибающей (envelope) звука - на амплитудном графике она как бы огибает график колебания, а график получается как бы вписанным в огибающую. Любой природный звук имеет огибающую примерно такого вида: /~~~\ / \__________ / \ / \ -------!--!--!----------!---- 1 2 3 4 5 Цифрами обозначены фазы развития звука, принятые в акустике: 1 - атака (attack) - начальная фаза, подъем 2 - остановка (hold) - короткая стабилизация после подъема 3 - спад (decay) - фаза перехода звука в установившееся состояние 4 - удержание (sustain) - фаза "поддержки" 5 - затухание (release) - послезвучание Фаза поддержки имеет место лишь в том случае, когда вызвавшее появле- ние звука воздействие остается постоянным в течение какого-то времени (например, движение пилы по металлу или поток воздуха в духовом ин- струменте). Аналогично, имеется понятие спектральной огибающей - трехмерный график изменения спектра (и соответственно - тембра) во времени. Кроме периодических колебаний - тонов - рассматриваются также непери- одические колебания - шумы. Для шума характерно более или менее равно- мерное распределение интенсивности по спектру, без явно выраженных пи- ков или спадов. В основном различается два вида шума: белый и розовый. Белый шум имеет равномерную спектральную плотность и в чистом виде в природных звуках не встречается, однако часто встречается в электрон- ных приборах; плотность розового шума спадает с ростом частоты (1/f) - это характеристика шума дождя, прибоя, ветра и прочих неярко выражен- ных природных шумов. Иногда рассматривается также коричневый шум с плотностью 1/f^2, быстро спадающей с ростом частоты - характеристика, близкая к звукам ударного происхождения (гром, обвал). ---------------------------------------------------------------------- - Что такое децибел? Это относительная логарифмическая единица измерения величин, связанных с интенсивностью звука (мощности, амплитуды, напряжения или тока сиг- нала, усиления/ ослабления и т.п.). Чувствительность слуха носит лога- рифмический характер - нарастание интенсивности в виде степенной фун- кции воспринимается на слух как линейное увеличение громкости, поэтому в ряде случаев удобее пользоваться логарифмическими, а не линейными единицами. Десятичный логарифм отношения некоторой величины к ее эта- лонному значению - lg (X/Xэ) - называется белом (Б), а его десятая часть - lg (X/Xэ) / 10 - децибелом (дБ). Измерение в децибелах удобно еще и тем, что человеческое ухо различает относительное изменение ин- тенсивности примерно на 1 дБ. При измерениях абсолютной интенсивности звука (Вт/кв.м.) за эталонное значение принимается уровень порога слышимости для синусоидального сигнала с частотой 1 кГц - 10 в степени -12 (10E-12) Вт/кв.м. При этом порог слышимости определяется интенсивностью 0 дБ, а интенсивность, при которой начинаются болевые ощущения (болевой порог) - около 140 дБ. Интенсивность тихого шепота - около 35 дБ, громкого голоса - около 95 дБ, forte fortissimo (fff) оркестра - около 100 дБ, оркестрового тутти (звучания всех инструментов) - около 120 дБ. При измерениях величин, с которыми интенсивность связана квадратичной зависимостью - напряжения, тока и звукового давления - в выражении для децибела множитель 10 меняется на 20 (двойка выносится из логарифма отношения квадратов). При измерениях относительных величин за эталонный уровень принимается какое-либо значение величины. Например, при оценке усиления за него принимается единичное усиление (пропускание сигнала без изменения), равно 0 дБ. При этом 60 дБ соответствует усилению в 1000 раз (60 = 20 lg 1000), а -20 дБ - ослаблению в 10 раз. Для описания характеристик усилителей и фильтров применяется также единица "децибел на октаву" (дБ/окт), показывающая изменение усиления при изменении частоты в два раза. ---------------------------------------------------------------------- - Какие параметры характеризуют звуковой тракт? Звуковым трактом называют любое устройство, осуществляющее передачу и/или преобразование звука. Звуковой тракт характеризуется следующими параметрами: - номинальный входной и выходной уровень (Input/Output Level) - вели- чина сигнала на входе и выходе тракта, до которого он сохраняет ука- занные параметры. Указывается в вольтах и обычно принимается за 0 дБ. Таким образом, рабочие уровни сигнала имеют отрицательный либо нулевой уровень. - максимальный входной и выходной уровень - величина сигнала, до кото- рой тракт сохраняет работоспособность. Уровни сигналов от номинального до максимального всегда имеют ненулевой положительный уровень. - коэффициент усиления - отношение величины выходного сигнала ко вход- ному. Указывается в разах, процентах или децибелах. - диапазон частот (Frequency Response) - частотный интервал, в котором тракт сохраняет свои основные характеристики. Нуль подразумевает пос- тоянный ток. - форма амплитудно-частотной характеристики (АЧХ) - график зависимости амплитуды сигнала на выходе от его частоты при неизменной амплитуде сигнала на входе. Тракты с горизонтальной внутри частотного диапазона АЧХ называют частотно-независимыми. - неравномерность АЧХ - отклонения графика от заданной формы. Указыва- ется в процентах или децибелах. - уровень шума (Noise Level) - величина шума относительно номинального уровня сигнала. Указывается в децибелах и всегда имеет отрицательное значение. Другое название - соотношение сигнал/шум (Signal to Noise Ratio, SNR), которое имеет такое же положительное значение. Иногда указывется уровень шума, приведенный ко входу - в предположении, что весь шум поступает только на вход, а сам тракт собственного шума не имеет. - коэффициент гармоник (Total Harmonic Distortion, THD) - величина по- бочных гармонических составляющих, вносимых нелинейностью тракта. Ука- зывается в процентах от величины сигнала; в ряде случаев указывается для различных гармоник (на слух наибольшие искажения вносят нечетные гармоники высших порядков). - уровень интермодуляционнх искажений (InterModulation Distortion, IMD) - относительный уровень паразитных частотных компонент, порожден- ных взаимной модуляцией полезных компонент сигнала. Указывается в про- центах от величины сигнала. - переходное затухание (Stereo Crosstalk) - степень ослабления сигнала при его проникновении в соседний стереоканал. Указывается в децибелах. - динамический диапазон (Dynamic Range) - диапазон наибольшего и на- именьшего уровней сигнала, внутри которых сохраняются основные харак- теристики тракта. Снизу обычно ограничен уровнем шума, сверху - номи- нальным уровнем, поэтому часто равен соотношению сигнал/шум, однако нелинейность тракта в ряде случаев не позволяет выдержать параметры в этих областях, а это сужает динамический диапазон. ---------------------------------------------------------------------- - Какие частотные характеристики имеет музыкальный звукоряд? В основе всех звукорядов лежит понятие октавы - звуковысотного диапа- зона, частоты крайних звуков которого различаются вдвое. Музыкальный звукоряд разбивает октаву на ряд ступеней (в европейской системе - двенадцать), которые в любой октаве имеют одинаковое название и смысл. Различаются два основных музыкальных звукоряда - натуральный и хрома- тический. Натуральный строится из обертонов базового звука, сведенных в одну октаву, хроматический основан на равномерном делении октавы на двенадцать ступеней. Соотношения частот натурального звукоряда пред- ставляют собой рациональные дроби, что соседние ступени хроматического отличаются в корень 12 степени из двойки - примерно в 1.059 раза. Опорным звуком принято считать ноту Ля первой октавы - 440 Гц. Использование натурального звукоряда позволяет получить более слитные (консонасные) созвучия, однако неравномерность его ступеней затрудняет транспонирование музыки на интервалы, не кратные октаве. Хроматический звукоряд не дает таких слитных созвучий, однако из-за равномерности ступеней получил преимущественное распространение. ---------------------------------------------------------------------- - Как звук представляется в цифровом виде? Согласно теореме Котельникова, любой непрерывный процесс с ограничен- ным спектром может быть полностью описан дискретной последователь- ностью его мгновенных значений, следующих с частотой, как минимум вдвое превышающей частоту наивысшей гармоники процесса. Из этого сле- дует, что сигнал с частотой F может быть успешно дискретизирован на частоте 2F только в том случае, если он является чистой синусоидой, ибо любое отклонение от синусоидальной формы приводит к выходу спектра за пределы частоты F. Таким образом, для дискретизации реального сиг- нала с плавно спадающим спектром необходим либо выбор частоты дискре- тизации с запасом, либо принудительное ограничение спектра входного сигнала. Одновременно с временнОй дискретизацией выполняется амплитудная - из- мерение мгновенных значений амплитуды и их представление в виде число- вых величин с определенной точностью. Точность измерения (разрядность получаемого дискретного значения) определяет соотношение сигнал/шум и динамический диапазон сигнала (теоретически это взаимно-обратные вели- чины). Уровень шумов, вносимых квантованием - примерно 6N + 10lg (Fдискр/2Fмакс) + 1.7 дБ. Для системы "компакт-диск" и многих других цифровых систем выбрана стандартная частота дискретизации 44.1 кГц, однако частотный диапазон сигнала обычно ограничивается возле 20 кГц для оставления запаса по отношению к теоретическому пределу. Там же используется 16-разрядная оцифровка, что дает предельное соотношение сигнал/шум около 98 дБ. В студийной аппаратуре используются более высокие разрешения - 18, 20 и 24 разряда при частоте дискретизации 48, 56 или 96 кГц. Это делается для того, чтобы сохранить высшие гармоники звукового сигнала, которые непосредственно не воспринимаются слухом, но влияют на формирование общей звуковой картины. Для оцифровки более узкополосных и менее качественных сигналов частота и разрядность дискретизации могут снижаться; например, в телефонных линиях применяется 7- или 8-разрядная оцифровка с частотами 8..12 кГц. Представление аналогового сигнала в цифровом виде называется также им- пульсно-кодовой модуляцией (ИКМ, PCM - Pulse Code Modulation), так как сигнал представляется в виде серии импульсов постоянной частоты (вре- меннАя дискретизация), амплитуда которых передается цифровым кодом (амплитудная дискретизация). ---------------------------------------------------------------------- - Что такое АЦП и ЦАП? Аналогово-цифровой и цифро-аналоговый преобразователи. Первый преобра- зует аналоговый сигнал в цифровое значение амплитуды, второй выполняет обратное преобразование. В англоязычной литературе применяются термины ADC и DAC, а совмещенный преобразователь называют codec (coder-decoder). Принцип работы АЦП состоит в измерении уровня входного сигнала и выда- че результата в цифровой форме. ЦАП получает на входе цифровое значе- ние амплитуды и выдает на выходе напряжение или ток нужной величины. Для правильной работы АЦП входной сигнал не должен изменяться в тече- ние времени преобразования, для чего на его входе обычно помещается схема выборки-хранения, фиксирующая мгновенный уровень сигнала и сох- раняющая его в течение всего времени преобразования. На выходе ЦАП также может устанавливаться подобная схема, подавляющая влияние пере- ходных процессов внутри ЦАП на параметры выходного сигнала. При использовании ЦАП/АЦП в звуковых устройствах они работают в режиме непрерывного преобразования, циклы которого повторяются с частотой дискретизации. Спектр входного сигнала АЦП в этом случае не должен вы- ходить за пределы половины частоты дискретизации, что достигается предварительным аналоговым фильтрованием. Аналогичное фильтрование вы- полняется на выходе ЦАП для подавления порожденных дискретизацией ко- пий (aliases) спектра основного сигнала (anti-alias filtering). На спектральном графике эти копии выглядят многократными отражениями ос- новного спектра сигнала. ---------------------------------------------------------------------- - Что такое передискретизация (oversampling)? Это дискретизация сигнала с частотой, превышающей основную частоту дискретизации. Передискретизации может быть аналоговой, когда с повы- шенной частотой делаются выборки исходного сигнала, или цифровой, ког- да между уже существующими цифровыми отсчетами вставляются дополни- тельные, рассчитанные путем интерполяции. Другой способ получения зна- чений промежуточных отсчетов состоит во вставке нулей, после чего вся последовательность подвергается цифровой фильтрации. В АЦП использует- ся аналоговая передискретизация, в ЦАП - цифровая. Передискретизация используется для упрощения конструкций АЦП и ЦАП. По условиям задачи на входе АЦП и выходе ЦАП должен быть установлен ана- логовый фильтр с АЧХ, линейной в рабочем диапазоне и круто спадающей за его пределами. Реализация такого аналогового фильтра весьма сложна; в то же время при повышении частоты дискретизации вносимые ею частот- ные составляющие пропорционально отодвигаются от основного сигнала, и аналоговый фильтр может иметь гораздо меньшую крутизну среза. Другое преимущество передискретизации состоит в том, что ошибки кван- тования (шум дробления), распределенные по всему спектру квантуемого сигнала, при повышении частоты дискретизации распределяются по более широкому спектру, так что на долю основного звукового сигнала прихо- дится меньшее количество шума. Каждое удвоение частоты снижает уровень шума квантования на 3 дБ; поскольку один двоичный разряд эквивалентен 6 дБ шума, каждое учетверение частоты позволяет уменьшить разрядность преобразователя на единицу. АЦП и ЦАП с передискретизацией за счет значительного уменьшения време- ни преобразования могут обходиться без схемы выборки-хранения. ---------------------------------------------------------------------- - Как устроены и работают АЦП и ЦАП? В основном применяется три конструкции АЦП: - параллельные - входной сигнал одновременно сравнивается с эталонными уровнями набором схем сравнения (компараторов), которые формируют на выходе двоичное значение. В таком АЦП количество компараторов равно (2 в степени N) - 1, где N - разрядность цифрового кода (для восьмираз- рядного - 255), что не позволяет наращивать разрядность свыше 10-12. - последовательного приближения - преобразователь при помощи вспомога- тельного ЦАП генерирует эталонный сигнал, сравниваемый со входным. Эталонный сигнал последовательно изменяется по принципу половинного деления (дихотомии), который используется во многих методах сходящего- ся поиска прикладной математики. Это позволяет завершить преобразова- ние за количество тактов, равное разрядности слова, независимо от ве- личины входного сигнала. - с измерением временнЫх интервалов - широкая группа АЦП, использующая для измерения входного сигнала различные принципы преобразования уров- ней в пропорциональные временнЫе интервалы, длительность которых изме- ряется при помощи тактового генератора высокой частоты. Иногда называ- ются также считающими АЦП. Среди АЦП с измерением временнЫх интервалов преобладают следующие три типа: - последовательного счета, или однократного интегрирования (single-slope) - в каждом такте преобразования запускается генератор линейно возрастающего напряжения, которое сравнивается со входным. Обычно такое напряжение получают на вспомогательном ЦАП, подобно АЦП последовательного приближения. - двойного интегрирования (dual-slope) - в каждом такте преобразования входной сигнал заряжает конденсатор, который затем разряжается на ис- точник опорного напряжения с измерением длительности разряда. - следящие - вариант АЦП последовательного счета, при котором генера- тор эталонного напряжения не перезапускается в каждом такте, а изменя- ет его от предыдущего значения до текущего. Наиболее популярным вариантом следящего АЦП является sigma-delta, ра- ботающий на частоте, значительно превышающей частоту дискретизации вы- ходного цифрового сигнала. Компаратор такого АЦП выдает значения пони- женной разрядности (обычно однобитовые - 0/1), сумма которых на интер- вале дискретизации пропорциональна величине отсчета. Последователь- ность малоразрядных значений подвергается цифровой фильтрации и пони- жению частоты следования (decimation), в результате чего получается серия отсчетов с заданной разрядностью и частотой дискретизации. Для снижения влияния ошибок квантования, которое в случае однобитового преобразователя получается довольно высоким, применяется коррекция сигнала высокочастотным шумом (noise shaping), получаемым через схему обратной связи по ошибке; остатки шума затем удаляются фильтром. ЦАП в основном строятся по трем принципам: - взвешивающие - с суммированием взвешенных токов или напряжений, ког- да каждый разряд входного слова вносит соответствующий своему двоично- му весу вклад в общую величину получаемого аналогового сигнала; такие ЦАП называют также параллельными или многоразрядными (multibit). - sigma-delta, с предварительной цифровой передискретизацией и выдачей малоразрядных (обычно однобитовых) значений на схему формирования эта- лонного заряда, которые со столь же высокой частотой добавляются к вы- ходному сигналу. Такие ЦАП носят также название bitstream. - с широтно-импульсной модуляцией (ШИМ, Pulse Width Modulation, PWM), когда на схему выборки-хранения аналогового сигнала выдаются импульсы постоянной амплитуды и переменной длительности. На этом принципе рабо- тают преобразователи MASH фирмы Matsushita. При использовании передискретизации в десятки раз (обычно - 64x..512x) становится возможным уменьшить разрядность ЦАП без ощутимой потери ка- чества сигнала; ЦАП с меньшим числом разрядов обладают также лучшей линейностью. В пределе количество разрядов может сокращаться до одного (передискретизация в 256 раз и более). Форма выходного сигнала таких ЦАП представляет собой полезный сигнал, обрамленный значительным коли- чеством высокочастотного шума (Noise Shaping), который, тем не менее, эффективно подавляется аналоговым фильтром даже среднего качества. ЦАП являются "прямыми" устройствами, в которых преобразование выполня- ется проще и быстрее, чем в АЦП, которые в большинстве своем - после- довательные и более медленные устройства. ---------------------------------------------------------------------- - Каковы отрицательные стороны цифрового звука? Цифровое представление звука ценно прежде всего возможностью бесконеч- ного хранения и тиражирования без потери качества, однако преобразова- ние из аналоговой формы в цифровую и обратно все же неизбежно приводит к частичной его потере. Наиболее неприятные на слух искажения, вноси- мые на этапе оцифровки - гранулярный шум, возникающий при квантовании сигнала по уровню из-за округления амплитуды до ближайшего дискретного значения. В отличие от простого широкополосного шума, вносимого ошиб- ками квантования, гранулярный шум представляет собой гармонические ис- кажения сигнала, наиболее заметные в верхней части спектра. Мощность гранулярного шума обратно пропорциональна количеству ступеней квантования, однако из-за логарифмической характеристики слуха при ли- нейном квантовании (постоянная величина ступени) на тихие звуки прихо- дится меньше ступеней квантования, чем на громкие, и в результате ос- новная плотность нелинейных искажений приходится на область тихих зву- ков. Это приводит к ограничению динамического диапазона, который в идеале (без учета гармонических искажений) был бы равен соотношению сигнал/шум, однако необходимость ограничения этих искажений снижает динамический диапазон для 16-разрядного кодирования до 50-60 дБ. Искажения, вносимые гранулярным шумом, можно уменьшить путем добавле- ния к сигналу обычного белого шума (случайного или псевдослучайного сигнала), амплитудой в половину младшего значащего разряда; такая опе- рация называется сглаживанием (dithering). Это приводит к незначитель- ному увеличению уровня шума, зато ослабляет корреляцию ошибок кванто- вания с высокочастотными компонентами сигнала и улучшает субъективное восприятие. Сглаживание применяется также перед округлением отсчетов при уменьшении их разрядности. При восстановлении звука из цифровой формы в аналоговую возникает проблема сглаживания ступенчатой формы сигнала и подавления гармоник, вносимых частотой дискретизации. Из-за неидеальности АЧХ фильтров мо- жет происходить либо недостаточное подавление этих помех, либо избы- точное ослабление полезных высокочастотных составляющих. Плохо подав- ленные гармоники частоты дискретизации искажают форму аналогового сиг- нала (особенно в области высоких частот), что создает впечатление "ше- роховатого", "грязного" звука. Отдельную проблему составляет джиттер (jitter) - дрожание (быстрые ко- лебания) фазы моментов срабатывания АЦП или ЦАП, приводящее к наруше- нию первоначальной формы сигнала. Для высокочастотных компонент сигна- ла дрожание фазы приводит к "размыванию" звука - нарушению субъектив- ной пространственной локализации источников, поскольку слуховое вос- приятие локализации базируется в основном на фазовых, а не на ампли- тудных соотношениях стереоканалов. Для борьбы с джиттером используется тактирование АЦП и ЦАП высокостабильными генераторами, а для подавле- ния неравномерности цифрового потока, поступающего на ЦАП - промежу- точными буферами типа FIFO (очередь). ---------------------------------------------------------------------- - Что такое PCM и ADPCM? PCM (Pulse Code Modulation - импульсно-кодовая модуляция) - стандар- тный способ цифрового кодирования сигнала при помощи последовательнос- ти абсолютных значений амплитуды. Различаются знаковое (signed) и без- знаковое (unsigned) представления: в первом случае представлен двупо- лярный сигнал и отсчеты могут меняться от -N до +N, где N - максималь- но возможная амплитуда; во втором случае - однополярный, когда отсчеты меняются от нуля до N. При записи/воспроизведении с помощью звуковой карты эти форматы функционально равнозначны - первый приводится ко второму сдвигом на половину максимальной амплитуды, и наоборот. ADPCM (Adaptive Delta PCM - адаптивная относительная ИКМ) - разновид- ность ИКМ, когда отсчеты представляются не в абсолютной форме, а в ви- де относительных изменений (delta) амплитуды. Это позволяет сократить разрядность отсчета до 2-4 бит, уменьшив при этом общий размер оциф- ровки, однако не позволяет точно представить сигналы с быстро меня- ющейся амплитудой. ---------------------------------------------------------------------- - Какие методы используются для синтеза звука?
1. Аддитивный (additive). Основан на утверждении Фурье о том, что лю- бое периодическое колебание можно представить в виде суммы чистых то- нов (синусоидальных колебаний с различными частотами и амплитудами). Для этого нужен набор из нескольких синусоидальных генераторов с неза- висимым управлением, выходные сигналы которых суммируются для получе- ния результирующего сигнала. На этом методе основан принцип создания звука в духовом органе. Достоинства метода: позволяет получить любой периодический звук, и процесс синтеза хорошо предсказуем (изменение настройки одного из ге- нераторов не влияет на остальную часть спектра звука). Основной недос- таток - для звуков сложной структуры могут потребоваться сотни генера- торов, что достаточно сложно и дорого реализовать.
2. Разностный (subtractive). Идеологически противоположен первому. В основу положена генерация звукового сигнала с богатым спектром (мно- жеством частотных составляющих) с последующей фильтрацией (выделением одних составляющих и ослаблением других) - по этому принципу работает речевой аппарат человека. В качестве исходных сигналов обычно исполь- зуются меандр (прямоугольный, square), с переменной скважностью (отно- шением всего периода к положительному полупериоду), пилообразный (saw) - прямой и обратный, и треугольный (triangle), а также различные виды шумов (случайных непериодических колебаний). Основным органом синтеза в этом методе служат управляемые фильтры: резонансный (полосовой) - с изменяемым положением и шириной полосы пропускания (band) и фильтр нижних частот (ФНЧ) с изменямой частотой среза (cutoff). Для каждого фильтра также регулируется добротность (Q) - крутизна подъема или спа- да на резонансной частоте. Достоинства метода - относительно простая реализация и довольно широ- кий диапазон синтезируемых звуков. На этом методе построено множество студийных и концертных синтезаторов (типичный представитель - Moog). Недостаток - для синтеза звуков со сложным спектром требуется большое количество управляемых фильтров, которые достаточно сложны и дороги.
3. Частотно-модуляционный (frequency modulation - FM). В основу поло- жена взаимная модуляция по частоте между несколькими синусоидальными генераторами. Каждый из таких генераторов, снабженный собственными формирователем амплитудной огибающей, амплитудным и частотным вибрато, именуетчся оператором. Различные способы соединения нескольких опера- торов, когда сигналы с выходов одних управляют работой других, называ- ются алгоритмами синтеза. Алгоритм может включать один или больше опе- раторов, соединенных последовательно, параллельно, последовательно-па- раллельно, с обратными связями и в прочих сочетаниях - все это дает практически бесконечное множество возможных звуков. Благодаря простоте цифровой реализации, метод получил широкое распрос- транение в студийной и концертной практике (типичный представитель класса синтезаторов - Yamaha DX). Однако практическое использование этого метода достаточно сложно из-за того, что бОльшая часть звуков, получаемых с его помощью, представляет собой шумоподобные колебания, и достаточно лишь слегка изменить настройку одного из генераторов, чтобы чистый тембр превратился в шум. Однако метод дает широкие возможности по синтезу разного рода ударных звуков, а также - различных звуковых эффектов, недостижимых в других методах разумной сложности.
4. Самплерный (sample - выборка). В этом методе записывается реальное звучание (сампл), которое затем в нужный момент воспроизводится. Для получения звуков разной высоты воспроизведение ускоряется или замедля- ется; при неизменной скорости выборки применяется расчет промежуточных значений отсчетов (интерполяция). Чтобы тембр звука при сдвиге высоты не менялся слишком сильно, используется несколько записей звучания че- рез определенные интервалы (обычно - через одну-две октавы). В ранних самплерных синтезаторах звуки в буквальном смысле записывались на маг- нитофон, в современных применяется цифровая запись звука. Метод позволяет получить сколь угодно точное подобие звучания реально- го инструмента, однако для этого требуются достаточно большие объемы памяти. С другой стороны, запись звучит естественно только при тех же параметрах, при которых она была сделана - при попытке, например, при- дать ей другую амплитудную огибающую естественность резко падает. Для уменьшения требуемого объема памяти применяется зацикливание сам- пла (looping). В этом случае записывается только короткое время звуча- ния инструмента, затем в нем выделяется средняя фаза с установившимся (sustained) звуком, которая при воспроизведении повторяется до тех пор, пока включена нота (нажата клавиша), а после отпускания воспроиз- водится концевая фаза. На самом деле этот метод нельзя с полным правом называть синтезом - это скорее метод записи-воспроизведения. Однако в современных синтеза- торах на его основе воспроизводимый звук можно подвергать различной обработке - модуляции, фильтрованию, добавлению новых гармоник, звуко- вых эффектов, в результате чего звук может приобретать совершенно но- вый тембр, иногда совсем непохожий на первоначальный. По сути, получа- ется комбинация трех основных методов синтеза, где в качестве основно- го сигнала используется исходное звучание. Типичный представитель этого класса синтезаторов - E-mu Proteus.
5. Таблично-волновой (wave table). Разновидность самплерного метода, когда записывается не все звучание целиком, а его отдельные фазы - атака, начальное затухание, средняя фаза и концевое затухание, что позволяет резко снизить объем памяти, требуемый для хранения самплов. Эти фазы записываются на различных частотах и при различных условиях (мягкий или резкий удар по клавише рояля, различное положение губ и языка при игре на саксофоне и т.п.), в результате чего получается се- мейство звучаний одного инструмента. При воспроизведении эти фазы нуж- ным образом составляются, что дает возможность при относительно не- большом объеме самплов получить достаточно широкий спектр различных звучаний инструмента, а главное - заметно усилить выразительность зву- чания, выбирая, например, в зависимости от силы удара по клавише син- тезатора не только нужную амплитудную огибающую, как делает любой син- тезатор, но и нужную фазу атаки. Основная проблема этого метода - в сложности сопряжения различных фаз друг с другом, чтобы переходы не воспринимались на слух и звучание бы- ло цельным и непрерывным. Поэтому синтезаторы этого класса достаточно редки и дороги. Этот метод также используется в в синтезаторах звуковых карт персо- нальных компьютеров, однако его возможности там сильно урезаны. В час- тности, почти нигде не применяют составление звука из нескольких фаз, сводя метод к простому самплерному, хотя почти везде есть возможность параллельного воспроизведения более одного сампла внутри одной ноты.
6. Метод физического моделирования (physical modelling). Состоит в мо- делировании физических процессов, определяющих звучание реального ин- струмента на основе его заданных параметров (например, для скрипки - порода дерева, состав лака, геометрические размеры, материал струн и смычка и т.п.). В связи с крайней сложностью точного моделирования да- же простых инструментов и огромным объемом вычислений метод пока раз- вивается медленно, на уровне студийных и экспериментальных образцов синтезаторов. Ожидается, что с момента своего достаточного развития он заменит известные методы синтеза звучаний акустических инструментов, оставив им только задачу синтеза не встречающихся в природе тембров.
7. (Alexander Grigoriev) WaveGuide технология, активно pазpабатываемая в Стэнфоpдcком Унивеpcитете и пpименяемая yже в неcкольких пpомышлен- ных моделях электpонных pоялей, напpимеp, фиpмы Baldwin. Пpедcтавляет cобой pазновидноcть физичеcтого моделиpования, пpи котоpой моде- лиpyетcя pаcпpоcтpанение колебаний, пpедcтавленных диcкpетными отcче- тами, по cтpyне (одномеpное моделиpование) и по pезонанcным по- веpхноcтям (двyмеpное моделиpование) или в объемном pезонатоpе (тpех- меpное). Пpи этом появляетcя возможноcть моделиpовать также нелинейные эффекты, напpимеp yдаp молоточка и каcание cтpyны демпфеpом, а также взаимнyю cвязь cтpyн и cвязь гоpизонтальной и веpтикальной мод. ---------------------------------------------------------------------- - Какие методы используются для обработки звука?
1. Монтаж. Состоит в вырезании из записи одних участков, вставке дру- гих, их замене, размножении и т.п. Называется также редактированием. Все современные звуко- и видеозаписи в той или иной мере подвергаются монтажу.
2. Амплитудные преобразования. Выполняются при помощи различных дей- ствий над амплитудой сигнала, которые в конечном счете сводятся к ум- ножению значений самплов на постоянный коэффициент (усиление/ослабле- ние) или изменяющуюся во времени функцию-модулятор (амплитудная моду- ляция). Частным случаем амплитудной модуляции является формирование огибающей для придания стационарному звучанию развития во времени. Амплитудные преобразования выполняются последовательно с отдельными самплами, поэтому они просты в реализации и не требуют большого объема вычислений.
3. Частотные (спектральные) преобразования. Выполняются над частотными составляющими звука. Если использовать спектральное разложение - форму представления звука, в которой по горизонтали отсчитываются частоты, а по вертикали - интенсивности составляющих этих частот, то многие час- тотные преобразования становятся похожими на амплитудные преобразова- ниям над спектром. Например, фильтрация - усиление или ослабление оп- ределенных полос частот - сводится к наложению на спектр соответству- ющей амплитудной огибающей. Однако частотную модуляцию таким образом представить нельзя - она выглядит, как смещение всего спектра или его отдельных участков во времени по определенному закону. Для реализации частотных преобразований обычно применяется спектраль- ное разложение по методу Фурье, которое требует значительных ресурсов. Однако имеется алгоритм быстрого преобразования Фурье (БПФ, FFT), ко- торый делается в целочисленной арифметике и позволяет уже на младших моделях 486 разворачивать в реальном времени спектр сигнала среднего качества. При частотных преобразованиях, кроме этого, требуется обра- ботка и последующая свертка, поэтому фильтрация в реальном времени по- ка не реализуется на процессорах общего назначения. Вместо этого су- ществует большое количество цифровых сигнальных процессоров (Digital Signal Processor - DSP), которые выполняют эти операции в реальном времени и по нескольким каналам.
4. Фазовые преобразования. Сводятся в основном к постоянному сдвигу фазы сигнала или ее модуляции некоторой функцией или другим сигналом. Благодаря тому, что слуховой аппарат человека использует фазу для оп- ределения направления на источник звука, фазовые преобразования стере- озвука позволяют получить эффект вращающегося звука, хора и ему подоб- ные. При помощи сдвига фазы на 90-180 градусов (последнее получается простым инвертированием отсчетов) реализуется эффект "объемности" зву- ка (Surround).
5. ВременнЫе преобразования. Заключаются в добавлении к основному сиг- налу его копий, сдвинутых во времени на различные величины. При сдви- гах на величины, сравнимые с периодом сигнала, эти преобразования превращаются в фазовые; при небольших сдвигах за пределами перида (примерно менее 20 мс) это дает эффект, близкий к хоровому (размноже- ние источника звука), при бОльших - эффекты многократного отражения: реверберации (20..50 мс) и эха (более 50 мс).
6. Формантные преобразования. Являются частным случаем частотных и оперируют с формантами - характерными полосами частот, встречающимися в звуках, произносимых человеком. Каждому звуку соответствует свое со- отношение амплитуд и частот нескольких формант, которое определяет тембр и разборчивость голоса. Изменяя параметры формант, можно подчер- кивать или затушевывать отдельные звуки, менять одну гласную на дру- гую, сдвигать регистр голоса и т.п. ---------------------------------------------------------------------- - Как делаются звуковые эффекты? При помощи различных комбинаций описанных выше преобразований. Вот на- иболее распространенные звуковые эффекты: - вибрато - амплитудная или частотная модуляция сигнала с небольшой частотой (до 10 Гц). Амплитудное вибрато также носит название тремоло; на слух оно воспринимается, как замирание или дрожание звука, а час- тотное - как "завывание" или "плавание" звука (типичная неисправность механизма магнитофона - детонация). Вибрато обычно реализуется модуля- цией синусоидальным сигналом, а тремоло - треугольным или пилообразным сигналом либо многократным автоматическим перезапуском ноты. - динамическая фильтрация (wah-wah - "вау-вау") - реализуется измене- нием частоты среза или полосы пропускания фильтра с небольшой часто- той. На слух воспринимается, как вращение или заслонение/открывание источника звука - увеличение высокочастотных составляющих ассоциирует- ся с источником, обращенным на слушателя, а их уменьшение - с отклоне- нием от этого направления. - фленжер (flange - кайма, гребень). Название происходит от способа реализации этого эффекта в аналоговых устройствах - при помощи так на- зываемых гребенчатых фильтров или линий задержки. Заключается в добав- лении к исходному сигналу его копий, сдвинутых во времени на небольшие величины (примерно 3..30 мс) с возможной частотной модуляцией копий или величин их временных сдвигов и обратной связью (суммарный сигнал снова копируется, сдвигается и т.п.). На слух это ощущается как "дроб- ление", "размазывание" звука, возникновение биений - разностных час- тот, характерных для игры в унисон или хорового пения, отчего фленжеры с определенными параметрами (сдвиги с модуляцией противофазным сигна- лом) применяются для получения хорового эффекта (chorus). Меняя пара- метры фленжера, можно в значительной степени изменять первоначальный тембр звука. - фейзер (phase - фаза) - смешивание исходного сигнала с его копиями, сдвинутыми по фазе (что равноценно сдвигу по времени на доли-единицы миллисекунд); величина сдвига может модулироваться во времени. По су- ти, это частный случай фленжера, но с намного более простой аналоговой реализацией, так как сдвиг по фазе выполняется проще задержки по вре- мени (цифровая реализация одинакова). Изменение фазовых сдвигов сумми- руемых сигналов приводит к подавлению отдельных гармоник или частотных областей, как в многополосном фильтре. На слух такой эффект напоминает качание головки в стереомагнитофоне - физические процессы в обоих слу- чаях примерно одинаковы. - реверберация (reverberation - повторение, отражение). Получается пу- тем добавления к исходному сигналу затухающей серии его сдвинутых во времени копий. Это имитирует затухание звука в помещении, когда за счет многократных отражений от стен, потолка и прочих поверхностей звук приобретает полноту и гулкость, а после прекращения звучания ис- точника затухает не сразу, а постепенно. При этом время между последо- вательными отзвуками (примерно 15..50 мс) ассоциируется с величиной помещения, а их интенсивность - с его гулкостью. По сути, ревербератор представляет собой частный случай фленжера без модуляции и с увеличен- ной задержкой между отзвуками основного сигнала, однако особенности слухового восприятия качественно различают эти два вида обработки. - эхо (echo). Реверберация с еще более увеличенным временем задержки - выше примерно 50 мс. При этом слух перестает субъективно воспринимать отражения, как призвуки основного сигнала, и начинает воспринимать их как повторения. Эхо обычно реализуется так же, как и естественное - с затуханием повторяющихся копий. - дистошн (distortion - искажение) - намеренное искажение формы звука, что придает ему резкий, скрежещущий оттенок. Наибольшее применение по- лучил в качестве гитарного эффекта (классическая гитара heavy metal). Получается переусилением исходного сигнала до появления ограничений в усилителе (среза верхушек импульсов) и даже его самовозбуждения. Бла- годаря этому исходный сигнал становится похож на прямоугольный, отчего в нем появляется большое количество новых нечетных гармоник, резко расширяющих спектр. Этот эффект применяется в различных вариациях (fuzz, overdrive и т.п.), различающихся способом ограничения сигнала (обычное или сглаженное, весь спектр или полоса частот, весь амплитуд- ный диапазон или его часть и т.п.), соотношением исходного и искажен- ного сигналов в выходном, частотными характеристиками усилителей (на- личие/отсутствие фильтров на выходе). - компрессия - сжатие динамического диапазона сигнала, когда слабые звуки усиливаются сильнее, а сильные - слабее. На слух воспринимается как уменьшение разницы между тихим и громким звучанием исходного сиг- нала. Используется для последующей обработки методами, чувствительными к изменению амплитуды сигнала. В звукозаписи используется для снижения относительного уровня шума и предотвращения перегрузок. В качестве ги- тарной приставки позволяет значительно (на десятки секунд) продлить звучание струны без затухания громкости. - вокодер (voice coder - кодировщик голоса) - синтез речи на основе произвольного входного сигнала с богатым спектром. Речевой синтез ре- ализуется при помощи формантных преобразований: выделение из сигнала с достаточным спектром нужного набора формант с нужными соотношениями придает сигналу свойства соответствующего гласного звука. Изначально вокодеры использовались для передачи кодированной речи: путем анализа исходного речевого сигнала из него выделялась информация об изменении положений формант (переход от звука к звуку), которая кодировалась и передавалась по линии связи, а на приемном конце блок управляемых фильтров и усилителей синтезировал речь заново. Подавая на блок рече- вого синтеза звучание, например, электрогитары и произнося слова в микрофон блока анализа, можно получить эффект "разговаривающей гита- ры"; при подаче звучания с синтезатора получается известный "голос ро- бота", а подача сигнала, близкого по спектру к колебаниям голосовых связок, но отличающегося по частоте, меняет регистр голоса - мужской на женский или детский, и наоборот. ---------------------------------------------------------------------- - Что такое Karaoke и как это делается? Это удаление из песни голоса исполнителя - с тем, чтобы получить так называемую "минусовку" (-1), которую можно использовать в качестве сопровождения при собственном пении. Если в песне звучит голос только одного исполнителя - он обычно находится примерно посередине стереопа- норамы, и удалить его можно путем вычитания одного канала из другого. Если голос находится не точно посередине - перед вычитанием нужно уравнять амплитуды голоса в обоих каналах. Если поют несколько голо- сов, они могут быть удалены путем фильтрации соответствующих частот. Естественно, все эти преобразования приводят к заметной потере качес- тва фонограммы. Karaoke также называют специально сделанные фонограммы песен без голо- са исполнителя. ---------------------------------------------------------------------- - Как устроен электронный музыкальный синтезатор? Большинство популярных аналоговых синтезаторов, работающих на разнос- тном принципе, построены по модульной технологии, сложившейся к концу 70-х годов, и содержат блоки Key, Env, VCO, VCA, VCF, LFO, NG, Mix и другие. Key (Keyboard - клавиатура) - блок музыкальной клавиатуры. В ответ на нажатия клавиш формирует сигнал нажатия, запускающий остальные блоки синтезатора, а также сигнал высоты, напряжение которого пропорциональ- но номеру нажатой клавиши. VCO (Voltage Controlled Oscillator - генератор, управляемый напряжени- ем, ГУН) - генератор исходного сигнала синтезатора. Вырабатывает пря- моугольные колебания с различной скважностью (разным спектром сигна- ла), а также синусоидальные, треугольные и пилообразные, логарифм час- тоты которых пропорционален управляющему напряжению. NG (Noise Generator - генератор шума) вырабатывает шум - в основном белый или розовый. Mix (Mixer - микшер) объединяет вырабатываемые генераторами сигналы, суммируя их в различных пропорциях, задаваемых регуляторами. Изменение пропорций смешиваемых сигналов дает изменение спектральной плотности выходного сигнала, который подается в другие блоки для дальшейшей об- работки. VCF (Voltage Controlled Filter - управляемый напряжением фильтр) - блок перестраиваемых фильтров. Обычно под воздействием управляющего напряжения изменяется полоса пропускания фильтра (Band, Contour), час- тота среза (Cutoff) и добротность фильтра - подъем или спад усиления внутри полосы (Resonance - резонанс). Чаще всего используется фильтр нижних частот (ФНЧ), срезающий высшие частоты, с резонансом около час- тоты среза; в более сложных моделях используются также полосовые филь- тры и ФВЧ. Все или часть параметров фильтров выведены на регуляторы, задающие их исходные значения. Env (Envelope - огибающая) вырабатывает напряжение, изменяющееся по фазам ADSR (Attack - Decay - Sustain - Release). При поступлении сиг- нала запуска начинается выработка фазы Attack, которая переходит в Decay и далее - в Sustain, где остается до момента снятия сигнала за- пуска, после чего формируется фаза Release и цикл выработки огибающей завершается. Длительности фаз ADR и уровень S задаются регуляторами. На простых одноголосых синтезаторах имеется только один блок Env, ко- торый позволяет сформировать огибающую для одного звука; в многоголос- ных синтезаторах их несколько. В простых инструментах блок Env форми- рует только амплитудную огибающую звука, в более сложных имеется от- дельный блок для выработки спектральной огибающей для фильтра или до- полнительного управления синтезом. VCA (Voltage Controlled Amplifier - управляемый напряжением усилитель) формирует выходной сигнал синтезатора. Обычно его управляющее напряже- ние берется с блока Env, что дает амплитудную огибающую звука. LFO (Low Frequency Oscillator - генератор низкой частоты) вырабатывает колебания различной формы частотой примерно от 0.1 до 20 Гц, которые могут быть смешаны с любым из других управляющих напряжений. Подача их на VCO дает частотную модуляцию, на VCF - эффект "вау-вау", "вращающе- гося" или "открывающегося" источника звука, на VCA - амплитудное виб- рато (тремоло). Некоторые LFO могут вырабатывать случайно меняющийся ступенчатый сигнал, дающий интересные на слух виды модуляции. Каждый из блоков синтезатора полностью независим от других - все они могут соединяться любым способом для получения различных режимов син- теза. В концертных синтезаторах большинство блоков соединены жестко (Key - на VCO и Env, Env - на VCA, LFO - на VCO и VCA и т.п.), в сту- дийных входы и выходы каждого блока выведены на переднюю панель, и со- единение делается внешними шнурами. В начале 80-х начали внедряться цифровые методы обработки, которые по- началу комбинировались с аналоговыми, выполняя каждый свойственные ему функции. Например, блоки Key, VCO, LFO, NG и Env проще реализуются цифровым способом, а Mix и VCF - аналоговым. При этом цифровые блоки через ЦАП подавали управляющие напряжения на аналоговые. Преимущество цифровых формирователей - более высокая стабильность, точность, а главное - повторяемость сигналов, поскольку аналоговая (непрерывная) форма заменена дискретной (конечной). При достаточно большом числе дискрет ступенчатость перестает ощущаться на слух, но повторяемость остается. Тогда же появились полностью цифровые FM-синтезаторы, которые не со- держали наиболее сложных в цифровой реализации управляемых фильтров. В середине 80-х был освоен выпуск быстродействующих DSP, и появились полностью цифровые разностные и самплерные синтезаторы. По сути, цифровой синтезатор представляет собой обыкновенный компьютер с устройствами ввода (клавиатура, кнопки, рычажки, датчики, MIDI), вы- вода (звук, индикаторы, MIDI), обработки (генераторы, преобразователи, память и т.п.) и центральным процессором, координирующим их работу. Например, клавишный синтезатор Roland JV-30 выпускается как в виде от- дельного модуля (тонгенератора) SC-55, так и в виде звуковой карты для PC - SCC-1. ---------------------------------------------------------------------- - Какие методы синтеза используются в популярных синтезаторах? В большинстве моделей выпуска 70-х годов использовался в основном раз- ностный метод синтеза. В моделях выпуска начала-середины 80-х - час- тотно-модуляционный. В конце 80-х стали преобладать самплерные методы, а в начале 90-х - таблично-волновые, с обработкой на мощных DSP. Попу- лярные модели разностных синтезаторов - PolyMoog, Crumar, ARP; частот- но-модуляционных - Yamaha DX, ритмический Roland TR; самплерных - E-mu Proteus XR, Korg M1; таблично-волновых - Yamaha PSS/PSR, Roland JV и E, Ensoniq TS и ASR (самплер-синтезатор); таблично-волновых с развитой обработкой звука - Yamaha SY, Kurzweil 2000. В первых синтезаторах 40-х..60-х годов использовался в основном адди- тивный метод синтеза и его разновидности. ---------------------------------------------------------------------- - Какими способами можно получить звук на IBM PC?
1. Через встроенный громкоговоритель (PC Speaker): - используя в стандартном режиме подключенный к нему канал 2 системно- го таймера, который может генерировать прямоугольные колебания различ- ной частоты. Таким образом можно получать простые тональные звуки за- данной частоты и длительности, однако управление громкостью и тембром звука в этом способе невозможно. - используя прямое управление громкоговорителем через системный порт 61, подавая на него серию импульсов меняющейся частоты и скважности (соотношения длительности 1/0), Так можно получать различные звуковые эффекты: шум, модуляцию, изменение окраски тона. Далее, можно принять во внимание, что диффузор громкоговорителя обладает инерцией (способ- ностью к интегрированию прямоугольного сигнала): например, при подаче уровня 1 диффузор начинает движение, при подаче уровня 0 - тормозится и через какое-то время начинает движение в обратную сторону; своевре- менно меняя уровни 0/1, можно заставить диффузор двигаться по любой траектории, иначе говоря - излучать звук любой частоты и окраски. Ин- тегрирующим свойством обладает и схема усилителя громкоговорителя, ко- торая обычно содержит фильтрующий конденсатор. Метод такого управления громкоговорителем называется широтноимпульсной модуляцией (ШИМ): час- тота колебаний диффузора определяется частотой следования импульсов, а амплитуда - их скважностью (шириной положительной части импульса). Недостаток этого способа - существенное различие массы и упругости у диффузоров разных громкоговорителей - звук, довольно чистый на одном, может превратиться в подобие шума на другом; кроме этого, за счет бо- лее тонкого управления требуется гораздо большая скорость процессора, а звук получается намного тише, чем при использовании таймера. - используя нестандарные методы программирования канала 2 таймера: на генерацию импульсов различной длительности и скважности или серий им- пульсов сверхзвуковой частоты (метод частотной модуляции - ЧМ). В пер- вом случае снова получается метод ШИМ, но со значительно сниженными затратами на переключение уровней и отслеживание времени, которые те- перь возлагаются на сам таймер. Во втором случае звуковой сигнал полу- чается путем усреднения высокочастотных колебаний в интегрирующей схе- ме громкоговорителя.
2. Через простой ЦАП: - подключаемый к параллельному (LPT) порту (Covox). На восьми выходных линиях данных (D0..D7) параллельного порта собирается взвешивающий сумматор - схема, суммирующая логические уровни 0/1 с весами 1, 2, 4, ..., 128, что дает для каждой из комбинаций восьми цифровых сигналов 0..255 линейно изменяющийся аналоговый сигнал с уровнем 0..X (макси- мальный уровень X зависит от параметров сумматора). Простейший сумма- тор делается на резисторах, более сложный - на микросхемах ЦАП (напри- мер 572ПА). При записи в регистр данных параллельного порта на выходе ЦАП устанавливается уровень, пропорциональный записанному значению, и сохраняется до записи следующего значения. Таким образом получается 8-разрядный преобразователь с частотой дискретизации до нескольких де- сятков килогерц. Добавив два регистра хранения и логику выбора, можно сделать стереоЦАП, коммутируя каналы с помощью служебных сигналов пор- та. - собираемый на вставляемой в разъем расширения плате. В этом случае достаточно просто получается 12- и 16-разрядный ЦАП (моно или стерео). Попутно он может содержать таймер, генерирующий запросы прерывания, и/или логику поддержки прямого доступа к памяти (DMA), которая позво- ляет равномерно и без участия процессора передавать данные из памяти на преобразователь.
3. Через специальную звуковую карту: - используя ЦАП, который есть почти на всех картах. В этом случае кар- та программируется на вывод оцифрованного звука напрямую или через DMA, а подготовка оцифровки в памяти делается так же, как и при выводе на простой ЦАП. - используя синтезатор, который тоже есть почти на всех картах. Боль- шинство карт оснащено простейшими 2- или 4-операторными FM-синтезато- рами; почти на всех современных картах установлены также WT-синтезато- ры. При наличии обоих синтезаторов ими можно управлять одновременно, увеличивая набор тембров и число голосов; параллельно можно задейство- вать и ЦАП карты, через который удобно выводить различные звуковые эф- фекты.
4. При помощи внешнего синтезатора, управляемого от компьютера: - используя MIDI-порт, который имеется практически на всех звуковых картах. Выход MIDI Out (обычно при помощи MIDI-адаптера) соединяется со входом MIDI In синтезатора, и через порт подаются MIDI-команды син- тезатору. Одновременно можно принимать MIDI-сообщения от синтезатора, подключив его MIDI Out к MIDI In звуковой карты. - используя стандартный последовательный порт, если в BIOS Setup есть возможность переключить его в режим MIDI-совместимости (тактовая час- тота, при которой возможно получение скорости 31.25 кбит/с). В этом случае понадобится самодельный адаптер для токовой петли. - используя специальные карты-адаптеры - например, Roland MPU-401. ---------------------------------------------------------------------- - Что такое tracker? Любительская программа для записи и воспроизведения музыки на несколь- ких дорожках (треках); трекеры впервые появились на компьютере Amiga. Поскольку трекеры ориентированы на текстовое представление, в них, в отличие от принятой в музыке горизонтальной нотной записи, применяется вертикальная запись нот при помощи буквенно-цифровых обозначений (нап- ример, D-5 - нота Ре пятой октавы, A#4 - нотя Ля диез четвертой окта- вы, и так далее); при этом каждая дорожка представляется собственной колонкой, а совокупность дорожек образует партитуру. Кроме нот, в до- рожках могут встречаться различные команды управления: фиксация ноты (педаль), вибрато, тремоло, портаменто, переход к другому участку пар- титуры и т.п. Кроме вертикальной записи, в трекерах применяется характерная для них структура музыки: вся партитура делится на кадры (pattern) обычно оди- накового размера, а композиция представляет собой последовательность кадров, что очень удобно для организации повторяемых фрагментов. Каж- дый кадр состоит обычно из 64 строк, что удобно для принятого в треке- рах шестнадцатиричного представления номеров и подходит для распрос- траненных музыкальных размеров. В трекерах применяется два метода синтеза звука: FM - при использова- нии SB- или AdLib-совместимой звуковой карты, и самплерный - при ис- пользовании PC Speaker, Covox, ЦАП или WT-синтезатора звуковой карты (последнее - обычно при работе с картой GUS, поскольку она была первой относительно недорогой и распространенной WT-картой с загружаемыми самплами). FM-трекеры используют параметры инструментов для FM-синте- затора, а самплерные трекеры - записи звучаний инструментов (самплы) в собственном формате. В зависимости от сложности трекера могут исполь- зоваться 8- или 16-разрядные самплы с различными частотами дискретиза- ции, по одному или по несколько самплов на инструмент, неизменные или с возможностью задания огибающих, эффектов и т.п. Современные трекеры (Fast Tracker II, Impulse Tracker) по возможностям не уступают многим концертным синтезаторам, исключая, конечно, качество самого звука и гибкость управления им. Каждый трекер хранит произведения в своем собственном формате, однако многие способны загружать файлы других трекеров. Ранние простые треке- ры использовали формат MOD, пришедший с Amiga, более поздние ввели но- вые форматы (STM, S3M, ULT, XM, IT). В файл записывается вся необходи- мая для его воспроизведения информация - собственно партитура, описа- ния инструментов, сами самплы и т.п., поэтому произведение будет зву- чать точно так же при использовании другой аппаратуры вывода цифрового звука с тем же качеством, или в совместимом трекере. Имеется также большое количество проигрывателей (player) - программ для воспроизведения файлов, подготовленных в трекерах. Наиболее уни- версальный из них - Cubic Player. При наличии звуковой карты GUS или SB AWE32/SB 32 с установленным ОЗУ он использует для проигрывания ин- струментов аппаратный WT-синтезатор карты, загружая самплы в ОЗУ син- тезатора. На AWE32/SB 32 при этом также поддерживается регулировка глубины эффектов Reverb/Chorus. При проигрывании трекерных модулей на другой звуковой карте или через другой трекер/проигрыватель звук может отличаться - за счет различий в реализации вывода звука через карту или неточностей в отработке тре- керных команд. Например, Fast Tracker II при работе с GUS использует его WT-синтезатор, с SB 16 - выводит звук через 16-разрядный цифровой канал, а на остальных картах - через 8-разрядный канал с соответству- ющим понижением качества звука. ---------------------------------------------------------------------- - Что такое MIDI? MIDI - Musical Instrument Digital Interface (цифровой интерфейс музы- кальных инструментов) - стандарт на соединение инструментов и передачи информации между ними. Каждый инструмент имеет три разъема: In (вход), Out (выход) и Thru (повторитель входного сигнала), что позволяет объ- единить в сеть практически любое количество инструментов. Способ передачи - токовая петля (5 мА). Информация передается байтами, в последовательном стартстопном коде (8 битов данных, один стоповый, без четности - формат 8-N-1), со скоростью 31250 бит/с. В этом MIDI-интерфейс очень похож на последовательный интерфейс IBM PC - от- личие только в скорости и способе передачи: в PC используется интер- фейс V24 (RS-232) с передачей сигналов путем изменения напряжения. Частоту 31250 бит/с на стандартном интерфейсе IBM PC получить нельзя. Поток данных, передаваемый по MIDI, состоит из сообщений (событий): нажатие/отпускание клавиш, изменение положений регуляторов (MIDI-кон- троллеров), смена режимов работы, синхронизация и т.п. Можно сказать, что по MIDI передается партитура музыкального произведения, однако есть и специальные виды сообщений - System Exclusive (SysEx) - в кото- рых может содержаться любая информация для инструмента - например, оцифрованный звук для загрузки в ОЗУ, партитура ритм-блока и т.п. Обычно SysEx уникальны для каждого инструмента и не совместимы с дру- гими инструментами. Большинство сообщений содержит в себе номер канала (1..16) - это чаще всего условный номер инструмента в сети, для которого они предназначе- ны. Однако один инструмент может "отзываться" и по нескольким каналам - именно так и работают звуковые карты и многие тонгенераторы (внешние модули синтеза). Прочие сообщения являются общими и воспринимаются всеми инструментами в сети. В сообщениях о нажатиях/отпусканиях клавиш передается номер ноты - число в диапазоне 0..127, определяющее условный номер полутона: ноте До первой октавы соответствует номер 60. Отсюда происходит "компьютер- ная" нумерация октав, начинающаяся с нуля, в которой первой октаве со- ответствует номер 5, а нота До нулевой октавы имеет нулевой MIDI-но- мер. При записи MIDI-потока в файл (MID, RMI) он оформляется в один из трех стандартных форматов: 0 - обычный MIDI-поток 1 - несколько параллельних потоков (дорожек) 2 - несколько независимых последовательных потоков Разбиение на дорожки удобно для выделения партий отдельных инструмен- тов - популярные MIDI-секвенсоры формируют файлы именно формата 1. ---------------------------------------------------------------------- - Какие форматы используются для представления звука и музыки? В настоящее время стандартом де-факто стали два формата: Microsoft RIFF (Resource Interchange File Format - формат файлов передачи ресур- сов) Wave (.WAV) и SMF (Standard MIDI File - стандартный MIDI-файл) (.MID). Первый содержит оцифрованный звук (моно/стерео, 8/16 разрядов, с разной частотой оцифровки), второй - "партитуру" для MIDI-инструмен- тов (ноты, команды смены инструментов, управления и т.п.). Поэтому WAV-файл на всех картах, поддерживающих нужный формат, разрядность и частоту оцифровки звучит совершенно одинаково (с точностью до качества преобразования и усилителя), а MID-файл в общем случае - по-разному. RAW - формат "чистой оцифровки", не содержащий заголовка. Обычно оциф- ровка хранится в 16-разрядном знаковом (signed) формате, хотя могут быть и исключения. VOC и CMF - форматы представления от фирмы Creative. VOC-файлы содер- жат оцифрованный звук, CMF-файлы - нотные партитуры и параметры ин- струментов для синтезаторов OPL3. AIFF (Audio-...) - формат звуковых файлов на Macintosh и SGI. AU - формат звуковых файлов SUN/NeXT. MOD - широко распространенный трекерный формат. Содержит оцифровки ин- струментов и партитуру для них, отчего звучит везде примерно одинаково (опять же - с точностью до способа и качества воспроизведения). В ори- гинале поддерживаются четыре канала, в расширениях - до восьми и бо- лее. STM - формат Scream Tracker, примерно того же уровня, что и MOD. S3M - формат Scream Tracker 3. Развитие STM в сторону увеличения раз- рядности инструментов и количества музыкальных эффектов. Сам ST3 под- держивает до 32 каналов, но не поддерживает предусмотренных в формате 16-разрядных самплов. XM - формат Fast Tracker. Один из наиболее высокоуровневых среди тре- керных форматов. Поддерживаются 16-разрядные самплы, один инструмент может содержать различные самплы на разные диапазоны нот, возможно за- дание амплитудных и панорамных огибающих. IT - формат Impulse Tracker. Подобен XM, так же поддерживает 16-раз- рядные самплы. ---------------------------------------------------------------------- - Как преобразовать цифровой звук из одного формата в другой? Существует большое количество программ преобразования форматов. Наибо- лее известная из них - Convert (автор - Jesus Villena). Она преобразу- ет файлы нескольких десятков различных форматов - обычного цифрового звука (RAW, WAV, VOC), банков инструментов звуковых карт и синтезато- ров (PAT, SBK, KRZ, SYW), партитур и инструментов трекеров (MOD, S3M, XM). Любые хотя бы частично совместимые форматы могут быть преобразо- ваны один в другой в пределах общей совместимости. Недостаток програм- мы Convert - невозможность ручного задания параметров оцифровки, что не позволяет преобразовать форматы без заголовка (RAW, SND и другие). Другая мощная программа преобразования - SOX (SOund eXchange). Сущес- твует под UNIX, OS/2 и DOS. Позволяет задать параметры оцифровки, а также сделать преобразования - усиление/ослабление и добавление эффек- та эхо. Программа AWAVE также поддерживает множество форматов, но работает только под Windows с 32-разрядным интерфейсом (NT, 95 или Win32s). ---------------------------------------------------------------------- - Какие программы используются для синтеза звука? Stomper, Rubber Duck, Orangator, Virtual Waves, Wave Craft, Synthic, Wave Gen, Hammerhead, Rebirth, Sim Synth, Audio Architect, VAZ, Analogic, Sound Producer и другие. Эти программы моделируют работу ад- дитивных, разностных и FM-синтезаторов, рассчитывая режимы работы и формируя звуковую волну. Многие из этих программ имеют встроенные сек- венсоры, по командам которых сгенерированные звуки могут воспроизво- диться в нужной последовательности, образуя ритмическо-басовую основу композиции. ---------------------------------------------------------------------- - Какие программы используются для обработки цифрового звука? Сейчас популярны программы Cool Editor, Sound Forge, Samplitude, Software Audio Workshop (SAW), WaveLab. Они дают возможность просмат- ривать осциллограммы обоих стереоканалов, прослушивать выбранные учас- тки, делать вырезки и вставки, амплитудные и частотные преобразования, звуковые эффекты (эхо, реверберацию, фленжер, дистошн), наложение дру- гих оцифровок, изменение частоты оцифровки, генерировать различные ви- ды шумов, синтезировать звук по аддитивному и FM методам и т.п. Cool Editor содержит спектральный анализатор, отображающий спектр выбранно- го участка оцифровки. WaveLab позволяет накладывать эффекты и управ- лять ими в реальном времени при помощи виртуальных панелей. Cool Edit Pro позволяет сводить подготовленные оцифровки, задавая для них поло- жение, уровень и панораму в виртуальном микшерском пульте. Многие программы обработки звука позволяют загружать и сохранять оциф- ровки в различных форматах, что дает возможность преобразовывать файлы из одного формата в другой и разделять стереоканалы. ---------------------------------------------------------------------- - Какие программы работают с MIDI-форматом? Это так называемые программы-секвенсоры (sequencer), аналогичные аппа- ратным MIDI-секвенсорам. В их функции входит запись и воспроизведение MIDI-партитур, отображение их в различных форматах, различное редакти- рование как нот (транспонирование (transposition), квантование (quantization), сдвиг фрагмента (sliding) и т.п.), так и управляющих событий - смены инструментов, генерации серий значений контроллеров, имитирующих движение регуляторов, вставки SysEx и т.п. Обычно профес- сиональные секвенсоры поддерживают три основных формата отображения: - нотный (staff). Изображается классический нотный стан, принятый в музыкальной практике. Однако в связи с тем, что MIDI-формат описывает события, а не нотную запись, многие принятые в музыке обозначения не допускаются (прежде всего это относится к лигам - некоторые секвенсоры расставляют их автоматически). - временно-высотный (piano roll). Изображается временной график вклю- чения/выключения нот (нажатий/отпусканий), на котором активная нота выглядит горизонтальной линией соответствующей длины и в соответству- ющем временном положении. Слева для удобства определения высоты нот изображается фортепианная клавиатура. - событийный (events). Изображается список всех MIDI-событий с указа- нием времени появления каждого из них. Профессиональные секвенсоры позволяют также присоединять к партитуре WAV-файлы, которые будут воспроизводиться вместе с нею в нужные момен- ты времени. Наиболее известны секвенсоры Voyetra Plus Gold - под DOS и Recording Session, Cakewalk, Cubase и Logic - под Windows. Первый и два послед- них относятся к профессиональным, хотя Cakewalk по некоторым своим возможностям уступает Voyetra и Cubase. Cakewalk и Cubase выпускаются в нескольких версиях: Cakewalk - Apprentice, Pro и Pro Auduo, Cubase - Lite, Score и Studio. ---------------------------------------------------------------------- - Как преобразовать звук (WAV) в партитуру (MID/MOD/XM/IT)? Никак. Эта задача в общем случае принципиально нерешаема, а в частных сводится к распознаванию большого числа сложных звуковых образов и требует очень большого количества ресурсов. Для предельного случая (одноголосное исполнение тембром с выраженной звуковысотностью) воз- можно распознавание высоты отдельных нот и генерация партитуры (прог- раммы Baston и Sound2Midi). ---------------------------------------------------------------------- - Какие еще программы полезны при работе со звуком и музыкой? Audio Compositor - секвенсор, объединенный с эмулятором синтезатора. Позволяет загрузить самплы инструментов в различных форматах и соста- вить из них композицию, записываемую потом в WAV-файл. Cylonix Vocoder - эмулятор вокодера. Effects Master - наложение эффектов в реальном времени на сигнал со входа карты или из WAV-файла. Joy2Mid/Joy4Mid - передача MIDI-сообщений при помощи джойстика. MediPlay - небольшой удобный проигрыватель для WAV/MIDI-файлов с воз- можностью передачи команд "GM Reset/GS Reset" между MIDI-файлами. MIDIMon, MIDI-OX, HUBI's Loopback и HUBI's MIDI Tools - средства для организации виртуальных MIDI-кабелей под Windows, отслеживания прихо- дящих MIDI-сообщений, приема/передачи команд и SysEx. MuitiMid - драйвер для Windows, организующий множественный доступ к MIDI-портам. Spectra Plus - мощный анализатор спектра. ---------------------------------------------------------------------- - Какие секвенсоры поддерживают средства управления GS и XG? Управление при помощи контроллеров поддерживают все MIDI-секвенсоры, однако таблицы символических имен контроллеров (5 - Portamento Time, 71 - Harmonic Contents и т.п.) из известных секвенсоров имеют только Cubase и Cakewalk. Таблицы для инструментов и контроллеров XG были до- бавлены в Cakewalk 5. Управление при помощи NRPN поддерживается последними версиями Cubase и версией Cakewalk 6. Используемые NRPN для GS и XG совпадают. Удобное управление параметрами эффектов через SysEx универсальными секвенсорами не поддерживается. Для Yamaha XG выпущен секвенсор XG Works (Yamaha). Для работы с SysEx в обычных секвенсорах можно исполь- зовать различные программы подготовки пакетов SysEx для конкретных мо- делей синтезаторов - например, GS Edit для Roland GS или XGEdit для Yamaha XG. Полученные пакеты могут затем использоваться в любом сек- венсоре, который поддерживает SysEx. ---------------------------------------------------------------------- - Почему могут неправильно переключаться банки в Cakewalk? Не все синтезаторы используют стандартный метод переключения банков - передачу старшего байта номера банка контроллером 0 и младшего - кон- троллером 32. Для этого в пунктах Settings - Instruments - Configure - Define Instruments (а в CW 6.01 - и в диалоге Track Properties) есть пункт Bank Select Method - попробуйте переключение только контроллером 0 или контроллером 32. ---------------------------------------------------------------------- - Чем различаются разные версии Cakewalk? Professional 3.0 - работа только с MIDI, общий план партитуры только на уровне пустых/заполненных тактов, настройка фильтров внутри опера- ций редактирования. Pro Audio 4.0 - поддержка звуковых дорожек, минимальная обработка зву- ка в них, дорожки могут делиться на участки (клипы), общий план парти- туры и операции drag'n'drop на уровне клипов, независимая настройка фильтров, перетаскивание групп нот в Piano Roll и Staff. Pro Audio 5.0 - версия для Windows 95, дополнительные операции для об- работки звука (reverb, chorus, эквалайзер), оптимизирована работа со звуковыми дорожками. Не работает под Windows NT. Pro Audio 6.0 - поддержка эффектов на звуковых дорожках в реальном времени (CFX), возможность копирования ссылок на клип вместо содержи- мого, настраиваемые панели управления (StudioWare) вместо окна Faders, поддержка RPN/NRPN, упрощенная и более удобная панель настройки пара- метров инструмента, замена окна Controllers на универсальную панель Velocity/Controllers/Wheel/RPN/NRPN в окне Piano Roll, работа с удар- ной нотацией в окне Staff, создание и использование типовых наборов параметров (Presets) в сложных операциях редактирования. Не работает под Windows NT. Pro Audio 6.01 - возможность смешивания звуковых дорожек на отдельную, дополнительные функции в редакторе звуковых дорожек и эффектов, эк- спорт звуковых дорожек в форматах RealAudio, автоматическая загрузка банков SoundFont для серии AWE. Может работать под Windows NT 4.0 и выше. ---------------------------------------------------------------------- - Почему при игре по MIDI "залипают" ноты, контроллеры и т.п.? Чаще всего - из-за превышения пропускной способности самого MIDI-кана- ла или конкретного инструмента. Например, при "рисовании" графика дви- жения движения контроллера в секвенсоре генерируется достаточно боль- шое количество MIDI-сообщений, которое при передаче по каналу может приводить к переполнению входного MIDI-буфера инструмента и потере идущих следом MIDI-сообщений. На некоторых инструментах это видно по миганию индикатора "MIDI Error". Чтобы этого не случалось, серии посы- лок контроллеров необходимо "прореживать", оставляя только ощутимые на слух изменения. В Cakewalk для этого есть специальные CAL-программы thinaft, thinctrl и thinwhl. Подобные ошибки могут также возникать из-за ошибок в реализации MIDI-интерфейса или его драйверов. Например, MIDI-интерфейс звуковых карт SB 32 PnP моделей CT-3600 и CT-3620 спонтанно генерирует на выхо- де последний выведенный через интерфейс байт, нарушая правильность MIDI-сообщений, а драйверы SB 16, SB 32 и AWE32 версий 1996-1997 годов имеют обыкновение терять байты даже на быстрых машинах. Ошибку интер- фейса можно частично замаскировать, включив в секвенсоре вывод синхро- низирующих сообщений (MIDI Clock). ---------------------------------------------------------------------- - Можно ли программно сделать WT MIDI-синтезатор на карте без WT? Это можно сделать на любой звуковой карте, способной воспроизводить цифровой звук. Наиболее известны три программных продукта, реализующих программный WT-синтез с управлением по MIDI: Cubic Player, Yamaha Soft Synthesizer S-YG20, S-YXG50, Roland Virtual Sound Canvas 55/88. Cubic Player - проигрыватель модулей большинства трекерных форматов и MIDI-файлов для DOS. Для проигрывания трекерных модулей используются их собственные инструменты и самплы, для проигрывания MIDI-файлов не- обходим комплект инструментов (patches) от карты GUS, состоящий из ~190 файлов *.PAT, содержащих самплы и параметры инструментов - по од- ному на инструмент, и файла конфигурации default.cfg, задающего соот- ветствие номеров инструментов в MIDI и PAT-файлов. Набор можно скопи- ровать с компьютера, на котором был установлен GUS, либо установить с дискет при помощи пункта Restore Files в инсталляторе для GUS. В файл конфигурации Cubic Player - cp.cfg (если его нет - создать) - нужно внести строчку -mp<полное имя каталога с набором инструментов>. Синтезаторы S-YG20, S-YXG50 и VSC-55/88 представляют собой драйверы для Windows 3.1/95, создающие виртуальные MIDI-устройства. S-YG20 ре- ализует подмножество стандарта XG, S-YXG50 - полный стандарт XG (тре- бует процессора P5-166 или MMX), VSC-55 - подмножество стандарта GS, VSC-88 - полный стандарт GS. Для вывода звука используется стандартное устройство цифрового воспроизведения Windows. Из-за программной обра- ботки самплов звук несколько отстает от MIDI-команд, из-за чего эти драйверы неудобно использовать для работы в реальном времени, однако при проигрывании MIDI-файлов отставание незаметно. ---------------------------------------------------------------------- - Что такое Drum Loop? Дословно - "барабанная петля". Представляет собой файл-оцифровку, в котором записаны отдельные партии ударных или весь ритм целиком, сыг- ранные "живьем" на ударной установке. Готовые оцифровки вставляются в звуковые дорожки секвенсора и нужным образом зацикливаются, чтобы по- лучилась цельная партия ударных. Drum Loop применяются в тех случаях, когда средствами MIDI трудно или невозможно воспроизвести нужные удар- ные тембры или манеру игры. ---------------------------------------------------------------------- - Что такое Audio MPEG? Это метод сжатия звука, а также формат сжатых звуковых файлов, предло- женный MPEG (Moving Pictures Experts Group - экспертной группой по об- работке движущихся изображений). По аналогии с методом сжатия изобра- жений, основанном на преобразованиях цветового спектра, Audio MPEG ис- пользует преобразования спектра звука. Это позволяет достичь коэффици- ента сжатия вплоть до 12 без ощутимых потерь качества звука. Существу- ет три уровня (layers) Audio MPEG для сжатия стереофонических сигна- лов: MPEG-1 - коэффициент сжатия 1:4 при потоке данных 384 кбит/с; MPEG-2 - 1:6..1:8 при 256..192 кбит/с; MPEG-3 - 1:10..1:12 при 128..112 кбит/с. Изначально методы сжатия и восстановления по методам MPEG были разра- ботаны для аппаратной реализации при помощи DSP, однако мощность сов- ременных процессоров достаточна для воспроизведения сжатого звука в реальном времени. Например, для воспроизведения наиболее популярного сейчас формата MPEG-3, файлы которого имеют расширение .MP3, достаточ- но процессора P5-75. Существует несколько программ-проигрывателей: WinPlay, Real Audio Player и другие. Для сжатия звука в реальном вре- мени мощности современных процессоров недостаточно, однако существуют программные преобразователи, сжимающие готовые звуковые файлы - напри- мер, RealAudio Pro3 Encoder. Другим, более удобным, способом работы с Audio MPEG под Windows 95 яв- ляется использование ACM Codec - автоматических преобразователей фор- матов, работающих на уровне системы. При установке в систему такого Codec'а (например, Fraunhofer IIS) файлам Audio MPEG можно присваивать расширение WAV и работать с ними при помощи любой программы, поддержи- вающей ACM (например, стандартный Media Player его поддерживает). ---------------------------------------------------------------------- - От чего зависит естественность звучания акустических тембров? Естественность звучания акустических тембров в синтезаторах зависит в основном от двух факторов: подобия тембров (спектральные характеристи- ки звука) и подобия динамических характеристик (так называемые испол- нительские воздействия - щипок струны гитары или арфы, касание смычком струн виолончели, перегиб грифа и т.п.), причем последние психоакусти- ческие исследования показывают, что даже великолепно оцифрованный ин- струмент без свойственных ему исполнительских воздействий звучит неес- тественно, а плохая оцифровка или даже имитация тембра, имеющая харак- терные признаки игры на данном инструменте воспринимается слухом, как гораздо более похожая. В большинстве случаев наиболее полную информа- цию о характере звучания несет фаза атаки звука, на которой сильнее всего отражается применяемый при игре способ звукоизвлечения. Когда оцифровка инструментов выполняется полностью (от начала атаки) - полученное звучание уже несет в себе примененный при записи метод зву- коизвлечения. При этом отдельные MIDI-ноты звучат достаточно естес- твенно, однако звучание всегда имеет характер однажды записанного ин- струмента и с трудом поддается изменению, отчего приходится иметь мно- жество оцифровок с разным характером звукоизвлечения. Когда оцифровка сделана в так называемой стационарной фазе звучания - после прохождения атаки - звучание отдельной MIDI-ноты уже не будет таким похожим на исходный инструмент, как бы качественно не была вы- полнена сама запись. Этот метод рассчитан на имитацию исполнительского воздействия средствами MIDI - параметрами инструмента и контроллерами управления громкостью, высотой (pitch bend), модуляцией, фильтрами. Такой подход более трудоемок, однако дает возможность создавать на ос- нове имеющегося стационарного тембра множество тембров со свойствами различных инструментов. Например, для имитации игры на щипковых струн- ных инструментах синхронно с началом атаки вставляется небольшое быс- тро спадающее повышение тона, имитирующее более высокое звучание стру- ны в момент щипка; для имитации духовых - постепенно снижающаяся по мере расходования запаса воздуха в легких громкость звучания и т.п. Нужные исполнительские воздействия для имитации естественного звучания акустических инструментов могут вноситься как вручную при помощи MIDI-редакторов, так и автоматически - для этого служит программа Style Enhancer (NTONYX Computer Laboratory). Она позволяет не только накладывать на MIDI-партитуру воздействия, свойственные тому или иному инструменту при заданной манере игры, но и автоматически распознавать отдельные музыкальные фразы и обороты, преобразуя их в соответствии с заданным стилем исполнения. Также могут быть автоматически рассчитаны такие параметры, как амплитуда замаха перед ударом по струнам, объем воздуха в легких, скорость движения смычка в момент касания струн, и т.п. Многие MIDI-партитуры с правильно сделанной имитацией исполни- тельских воздействий звучат даже на синтезаторах среднего класса субъ- ективно более естественно, чем "чистые" партитуры - на сложных профес- сиональных аппаратах. ---------------------------------------------------------------------- - Что такое S/PDIF и AES/EBU? S/PDIF (Sony/Philiрs Digital Interface Format - формат цифрового ин- терфейса фирм Sony и Philiрs) - цифровой интерфейс для передачи звуко- вых сигналов. Представляет собой электрически и форматно упрощенный вариант студийного интерфейса AES/EBU (Audio Engineers Society / European Broadcast Union - общество звукоинженеров / европейское веща- тельное объединение), и используется для передачи звуковых сигналов в цифровой форме между блоками бытовой аппаратуры, DAT (Digital Audio Tape - цифровой звуковой магнитофон), для вывода сигнала с ком- пакт-дисков и т.п. S/PDIF использует электрическое (разъем RCA ("тюльпан") с коаксиальным кабелем) и оптическое (инфракрасный светодиод/фотодиод) соединения, AES/EBU использует электрическое соединение с симметричной экраниро- ванной двухпроводной линией и трехконтактный разъем типа Cannon XLR. ---------------------------------------------------------------------- - Может ли один и тот же цифровой сигнал звучать по-разному? Может. Это возможно благодаря тому, что в любом цифровом сигнале есть два уровня информации: основная, представленная отсчетами звукового сигнала, и побочная, представленная различного рода помехами - неста- бильностью уровней нуля и единицы, тактовой частоты, искажениями формы импульсов и т.п. (влияние носителя). Если передача и преобразование цифровых сигналов выполняются корректно - в результирующем звуковом сигнале остается только исходная информация, искажения же подавляются до уровня, обусловленного наводками, паразитными связями по питанию и т.п. При некачественной передаче или преобразовании помехи попадают в звуковой сигнал и вызывают его искажения, нередко заметные на слух. Например, если ЦАП получает цифровой сигнал по самосинхронизирующемуся последовательному каналу (интерфейс S/PDIF и ему подобные) и использу- ет для извлечения тактовых импульсов систему фазовой автоподстройки частоты (ФАПЧ, или PLL - Phase Locked Loop), то вместе со звуковым сигналом с выхода ЦАП будет также снята информация о нестабильности частоты как источника импульсов, так и внутреннего генератора ФАПЧ. Такая фазовая нестабильность носит название дрожания фазы, или джитте- ра (jitter). Для стабилизации потока данных обычно используется проме- жуточное запоминающее устройство, выборка из которого ведется по так- товым импульсам независимого высокостабильного генератора, иногда даже питаемого от отдельного источника. ---------------------------------------------------------------------- - Где можно найти информацию, звуковые программы и файлы? FIDO: 2:5010/67 (Roma Hmelevsky) - 17.00-05.00 Msk 2:5010/56 - // - - 17.00-05.00 Msk 2:5010/56.2 - // - - 17.00-05.00 Msk 2:5010/58 - // - - 17.00-05.00 Msk Internet: aimnet.com archive.orst.edu audioworks.com bmsu.simbirsk.su cakewalk.com castrop-rauxel.netsurf.de/homepages/michael.banz/ cs.ruu.nl/pub/MIDI junitec.ist.utl.pt/einfo/audio.html layer3.org luth.se lycos.com lysator.liu.se midifarm.com midilink.nl/flist/206.htm mp3.com people.interconnect.com.au/~davidd/download.htm realaudio.com rolandcorp.com www.ru.com/ntonyx/ sfoundry.com spider.nrcde.ru steinberg-us.com steinberg.de teco.quarta.msk.ru teeri.oulu.fi th-zwickau.de/~maz/ unina.it/~aminet/dirs/mus.html uwp.edu winsite.com/pub/pc winsite.com/pub/pc wuarchive.wustl.edu wustl.edu/~aminet/dirs/mus_midi.html www-ccrma.stanford.edu xgmidi.wtal.de yamaha.com, yamaha.co.jp, yamaha.co.uk ---------------------------------------------------------------------- Большое спасибо всем приславшим ответы, рекомендации, замечания и со- веты для этого FAQ. Текст FAQ в альтернативной кодировке доступен для FReq на 2:5000/14@FidoNet по имени SOUNDFAQ, текст описания MIDI-интерфейса на русском языке в этой же кодировке - по имени MIDIDESC. Полный пакет FAQ и описаний доступен на ftp://spider.nrcde.ru/pub/text/tech/emhwfaqs.zip и через страницу FAQ на http://spider.nrcde.ru. Пакет распространяется также по FIDO fileecho XHRDDOCS. ===================================================================== |