Министерство образования и науки

          Российской Федерации

                  Реферат на тему

      “Компьютер и звук”

                      Выполнил: Шушарин А.А. ЭВМ-05-3

                                                             Проверила: Ланина Э.П.

                                            Иркутск 2005г

 

Содержание:

I. Hardware – взгляд.

1. Как всё начиналось (Музыкальное рождение PC)

2. Платы расширения, системные шины и ресурсы

3. Функционирование звуковых плат

II. Звуковые форматы

1. Звуковые файлы формата VQF

2. Звуковые файлы формата ААС

3. Звуковые файлы формата РАС

4. Ogg Vorbis

5. Windows Media Audio

6. Mp3Pro
III. Список источников информации

 

 

 

 

 

I. Hardware – взгляд.

      1. Как всё начиналось

                                  Музыкальное рождение PC

 

Любой цифровой профессиональный синтезатор по сути представляет из себя специализированный компьютер. Как и в персональном компьютере, у него есть микропроцессор, оперативная и постоянная память, средства ввода/вывода информации и т.д. От обычного компьютера его отличает только блок синтеза звука (звуковой модуль) и высококачественные цифро-аналоговые преобразователи.

 

Необходимость в озвучивании компьютера появилась, как это ни смешно, в результате развития игр. Гораздо приятнее было гонять маленького человечка по лабиринту в сопровождении незатейливой мелодии, раздающейся из маленького динамика, чем просто так. Различные производители стали устанавливать в машины простейшие блоки синтеза и воспроизведения звука. А фирма Apple оснастила свои компьютеры MIDI-интерфейсом, что сразу же привлекло профессионалов, и начиная с середины 80-х годов, Apple Macintosh стал таким же привычным студийным устройством как и микшер. MIDI-интерфейс появился и на машинах производства фирмы Atari.

 

IBM-совместимые компьютеры довольно долго оставались в стороне от этих новых течений. Встроенный динамик вполне удовлетворял и разработчиков игр, и пользователей. Но вечно так продолжаться не могло, и в 1988 году никому неизвестная сингапурская фирма Creative Labs выпустила специализированную плату расширения для озвучивания игр, которая получила название Game Blaster. На плате был установлен специально разработанный чип FM-синтезатора C/MS, и пара незатейливых преобразователей для ввода/вывода звука. Цена новинки была довольно высокой - около 400 долларов, и, поэтому Game Blaster широкого распространения не получил.

 

В это же время канадская фирма Ad Lib выпустила свою версию звуковой карты. На ней стоял чип FM-синтезатора YM3812, который фирма Yamaha использовала для производства игрушечных музыкальных инструментов. В остальном карта Ad Lib совершенно ничем не отличалась от Game Blaster’а. Качество звука синтезатора на основе чипа фирмы Yamaha было выше, чем у C/MS, поэтому де-факто именно Ad Lib стал тогда стандартом.

 

Но Creative Labs не замедлили с ответом и создали звуковую карту Sound Blaster, которая была представлена на суд публики в 1989 году на выставке COMDEX в Лас-Вегасе.

Сингапурские “звуковых дел мастера” пошли по пути наименьшего сопротивления и просто купили у Yamaha лицензию на YM3812 и заявили о полной совместимости своего изделия со стандартом Ad Lib. Но на новинке появился MIDI-интерфейс, а качество звука в аудиотракте улучшилось за счет установки модифицированных преобразователей. Все эти новшества сыграли решающую роль в выборе Sound Blaster’а в качестве основы для спецификации MPC (Multimedia PC) компании Microsoft.

 

С этого момента и начинается применение РС в музыке - наличие в спецификации MPC MIDI-интерфейса сделало эту платформу привлекательной для разработчиков программных секвенсеров, которые не могли упустить случая закрепиться на новом рынке. А цена на IBM PC-совместимые компьютеры всегда была в два раза ниже, чем на близкие по мощности Macintosh, что выглядело очень привлекательно в глазах музыкантов - потенциальных покупателей компьютерных систем. Платформа Atari в качестве серьезного конкурента PC и Mac никогда не рассматривалась из-за меньшей производительности и отсутствия универсальности - она изначально создавалась для компьютерных игр и таковой до своего конца и осталась.

 

После принятия спецификации MPC очень многие компании стали выпускать клоны Sound Blaster и Ad Lib, а также создавать свои собственные оригинальные разработки. Обострившаяся конкуренция не могла не сказаться на цене звуковых карт, и в результате, в начале 90-х годов практически любой пользователь PC мог себе позволить играть на компьютере со звуковым сопровождением.

 

Но дешевые чипы FM-синтезаторов производства Yamaha не могли удовлетворить все возрастающие потребности слушателей, поэтому компании, выпускающие звуковые карты начали устанавливать на свои изделия чипы синтезаторов, работающие по принципу воспроизведения семплов (sample playback). В мультимедийной терминологии этот принцип получил не совсем верное название Wave table. К профессиональным синтезаторам эти разработки, за редким исключением, имели очень далекое отношение - в целях их удешевления нещадно урезался объем постоянной памяти и применялись алгоритмы компрессии, которые сильнее “упаковывали” образцы, но в результате ухудшали звук.

 

А некоторые фирмы пошли дальше и предложили свои разработки именно музыкантам. Конечно, качество звука этих карт еще не было по настоящему студийным, но производители создавали их для работы над демонстрационными записями, к которым предъявляются довольно мягкие требования. Среди первых была фирма Turtle Beach, которая в 1992 году выпустила эпохальное устройство Multisound. На нем был установлен чип от профессионального звукового модуля E-mu Proteus 1/XR, а качество оцифровки звука было выше всяческих похвал для техники такого жанра. Цена в 900 долларов не выглядела чрезмерной для этой уникальной звуковой платы.

 

Параллельно с усовершенствованием мультимедийных Wave Table синтезаторов шла работа над доработкой аудиотракта. В результате сегодняшние дешевые звуковые карты записывают и воспроизводят “живые” музыкальные инструменты не хуже бытовых магнитофонов, а некоторые из них уже довольно близко подобрались по качеству звучания к студийной технике.

 

Последнее время на дорогих мультимедийных картах стали появляться цифровые входы и выходы формата SPDIF. Цифровой интерфейс позволяет избежать потерь качества при записи с цифровых источников (CD-плейер, минидиск, DAT-магнитофон). А если для оцифровки “живых” музыкальных инструментов использовать внешние дорогие студийные преобразователи, то можно говорить о том, что на мультимедийной технике достигнуто студийное качество записи звука.

 

С середины 90-х годов лучшие мультимедийные звуковые карты начали стремительно приближаться к профессиональным устройствам по качеству звучания. Но и со стороны производителей профессиональной техники наметился поворот в сторону платформы PC. Все больше синтезаторов и звуковых модулей оборудуется последовательным интерфейсом для подключению к соответствующему порту компьютера. Для PC сейчас уже есть мощные секвенсеры, программы для профессиональной записи на жесткий диск и CD-мастеринга. Появляется все больше серьезных студийных комплексов многоканальной записи, использующих PC в качестве управляющего элемента. Причем, процесс этот, похоже, принял необратимый характер и в настоящий момент именно PC рассматривается большинством ведущих производителей студийной техники в качестве основы для новых разработок.

 

 

 

 

2. Платы расширения, системные шины и ресурсы

 

 

Почему IBM PC совместимые компьютеры выдержали жесточайшую конкурентную борьбу с другими платформами, несмотря на то, что они никогда не были на первых местах по производительности? Все дело в том, что PC обладают открытой архитектурой, то есть компьютер выходит с завода в минимальной конфигурации, а для его модернизации предусмотрены специальные “посадочные места” или слоты расширения для установки специализированных плат. Это позволяет приспосабливать компьютер для любого типа деятельности или легко интегрировать его в уже существующие системы.

 

Для использования в музыкальных целях компьютер приспосабливается именно таким образом - в слоты расширения устанавливается одна или несколько звуковых плат и инсталлируются программы. К звуковым платам подключается все специализированные устройства - микшеры, микрофоны, MIDI-клавиатуры и т.д. Все процессы преобразования и синтеза звука происходят именно в звуковой карте, а компьютер только управляет ей и производит всю дальнейшую обработку полученных данных.

 

Вы наверняка видели различные платы расширения - видеокарты, модемы или SCSI адаптеры. Они устанавливаются на материнскую плату в слоты системных шин ISA или PCI. На любой материнской плате вы можете обнаружить, как правило, 2-4 слота ISA и 3-6 слотов PCI. Звуковые карты также существуют двух типов: традиционные, рассчитанные на шину ISA, и новые, предназначенные для установки в слоты PCI.

 

Шиной в компьютере называется совокупность однотипных каналов передачи данных вместе с устройствами согласования (контроллерами), которые предназначены для организации взаимодействия процессора, памяти и любых периферийных устройств. Упрощено, шину можно представить как пучок проводов, который с одной стороны подключен к платам расширения, а с другой стороны - к процессору через специальные схемы согласования. Процессор передает по этим проводам управляющие сигналы, а платы передают данные для обработки.

 

Естественно, ключевым параметром любой шины будет пропускная способность - количество данных, которые можно передать по ней за единицу времени. От пропускной способности зависит количество одновременно работающих периферийных плат и способность работы со специализированными устройствами, которые требуют передачи большого объема данных.

 

Шина ISA (Industry Standard Architecture - Архитектура индустриального стандарта) создавалась в эпоху 386 процессоров. Тогда в ее слоты устанавливались и видеокарты, и контроллеры жестких дисков, и звуковые карты, и модемы - пропускной способности 16 Мб/с вполне хватало для обслуживания всех этих устройств. Но с появлением мониторов стандарта VGA и оболочки Windows такой пропускной способности стало не хватать - приходилось передавать на видеосистему слишком большое количество данных. Поэтому производители компьютеров разработали сразу несколько стандартов системных шин, которые должны были заменить шину ISA.

 

В результате конкурентной борьбы победу одержала шина PCI (Peripheral Component Interconnect - Взаимосвязь Периферийных Компонентов). Она обеспечивает пропускную способность 132 Мб/с. Большинство современных периферийных устройств рассчитано для работы именно с ней.

 

Шина PCI изначально создавалась под стандарт Plug’n’Play, который позволяет автоматически конфигурировать системные ресурсы. Поэтому все PCI карты гораздо проще в установке, чем аналогичные устройства, для шины ISA. Конечно, все современные звуковые карты поддерживают стандарт P’n’P, но установка любой периферии на шину ISA может вызывать всевозможные проблемы, так как конфигурирование осуществляется на уровне операционной системы, а не на уровне аппаратной части компьютера, как в случае с PCI.

 

Кроме этого, у шины PCI есть еще одно преимущество. Любая быстрая ISA карта, в том числе и звуковая, использует специальные каналы прямого доступа к памяти - DMA (Direct Memory Access). PCI устройство работает с памятью напрямую, обмениваясь данными через локальную шину и ему не требуется каналов DMA. То есть экономятся ресурсы компьютера - вы можете их использовать для другой периферии.

 

В современных компьютерах есть всего семь каналов DMA, причем один из них используется для работы самого контроллера. А многие ISA устройства позволяют работать только с определенными каналами. Отсюда вытекает еще одно ограничение шины ISA - невозможность установки нескольких устройств, использующих одинаковые каналы DMA. Для нашей музыкальной студии это означает, что нельзя будет устанавливать в компьютер несколько однотипных звуковых карт, которые используют DMA (если только такая возможность специально не предусмотрена производителем). Если у вас уже установлена ISA карта, то расширять функциональные возможности студии скорее всего можно будет лишь при помощи PCI карт или специальных ISA карт, которые не используют DMA. Не удивляйтесь, две-три звуковые карты, установленные в одном компьютере - это норма для очень многих современных музыкантов.

 

К счастью, все больше производителей звуковой периферии обращает свой взор на шину PCI, поэтому скоро проблем с установкой однотипных устройств больше не будет.

 

Но даже шина PCI имеет ограничение на количество устанавливаемых на ней устройств. Теоретически, она позволяет держать в компьютере 10 независимых плат расширения, но на практике это число меньше. Во-первых оно ограничено количеством свободных слотов. На современных материнских платах обычно устанавливается 3-5 слотов PCI. Во-вторых оно зависит от наличия свободных линий аппаратных прерываний (IRQ).

 

Прерывания - это специальные сигналы, которые поступают к процессору от различных периферийных устройств, в результате чего он останавливает выполнение текущей последовательности команд и начинает выполнять цепочку, соответствующую прерыванию. В одно и то же время процессор может обслуживать только одно событие, а переключаться между ними ему помогает контроллер прерываний, который обрабатывает поступающие от периферийных устройств сигналы.

 

В компьютере есть всего 15 линий IRQ (есть еще программные прерывания, но они нас пока мало интересуют). Из них обычно свободны всего 4 (если включены 2 COM-порта, 1 LPT, и в компьютере установлен дисковый интерфейс IDE, который использует сразу 2 прерывания). А так как многие периферийные устройства, в том числе и звуковые платы, используют не одно прерывания, а больше, то реально в компьютер можно установить три-четыре платы расширения (это если еще отключить один из COM-портов или отказаться от принтера).

 

Собственно, вся установка звуковых карт в компьютер и вертится вокруг конфигурирования только что описанных системных ресурсов. Есть еще и адреса, по которым процессор находит то или иное устройство, но их в компьютере всего 65536, то есть более чем достаточно для присвоения той или иной плате расширения.

 

3. Функционирование звуковых плат

 

 

Теперь мы с вами знаем при помощи каких устройств происходит “общение” звуковой карты и компьютера. Теперь давайте разберемся с самими звуковыми картами. Представление об их архитектуре поможет нам в дальнейшем, при настройке программного обеспечения.

 

Сейчас есть множество типов звуковых карт: универсальные, карты-синтезаторы, оцифровщики звука, многоканальные аудиоинтерфейсы, MIDI-интерфейсы, семплеры и др. Мы займемся именно универсальными мультимедийными платами, так как они наиболее распространены среди музыкантов-любителей и небогатых профессионалов. “Прародителями” таких плат были уже упоминавшиеся выше Sound Blaster и Ad Lib, поэтому “в народе” их нередко называют “саунд бластерами” (на самом деле, это справедливо ровно настолько, насколько любой копировальный аппарат справедливо называть “ксероксом”).

Схема мультимедийной звуковой карты

 

                             

 

Итак, звуковая карта “начинается” со входов, которые расположены на металлической панели, выходящей на заднюю стенку системного блока. Ко входам подключаются внешние аудиоустройства - микрофоны, магнитофоны, электрогитары и т.д. На нашем рисунке показаны 4 входа. Если у вас уже есть звуковая плата, то вы должны быть знакомы с Line In и Mic In - линейным и микрофонным входами. Они обычно выполнены на разъемах типа “мини-джек” (такие разъемы используются для подключения наушников в портативных плейерах). Отдельный вход Mic In предусмотрен из-за того, что у микрофонов сигнал имеет низкий уровень и его нужно усиливать до нормального уровня (0 дБ), перед тем, как направлять на преобразователь. Поэтому на микрофонных входах звуковой карты всегда установлен предусилитель - небольшая схема, повышающая уровень сигнала но нормального (линейного) уровня.

 

На некоторых типах звуковых плат установлен дополнительный вход Aux In. Если вы посмотрите на рисунок, то увидите, что сигнал с этого входа минует основные устройства звуковой платы и поступает на выходной микшер, а оттуда - сразу на выход. Этот вход позволяет упростить коммутацию внешних устройств и использовать внутренний микшер звуковой платы для смешивания сигналов со внешнего и внутренних источников. Например, если у вас есть автономный синтезатор, то можно его выход подключить в Aux In и все, что вы играете будет слышно в колонках, подключенных к звуковой карте. Aux In тоже обычно делается на разъеме типа “мини джек”.

 

Вход проигрывателя компакт-дисков как правило расположен не на задней панели звуковой платы, а прямо на ней, среди микросхем и других радиодеталей. Если у вас есть привод CD-ROM, то можно связать его выход с этим входом звуковой карты. Такое соединение позволит слушать аудио компакт-диски и оцифровывать звук прямо с привода. Чтобы обнаружить на вашей звуковой карте вход CD-ROM надо всего лишь прочитать руководство пользователя.

 

Кроме всех перечисленных входов, на задней панели звуковой карты обычно есть 15-пиновый разъем MIDI/джойстик порта, который служит для подключения любых внешних MIDI-устройств (синтезаторов, MIDI-клавиатур и т.д.) или джойстика, если карта используется для игр. На специализированных звуковых картах MIDI-порт может иметь не стандартный 15-пиновый разъем, а любой другой. Но в этих случаях всегда прилагается особый переходник. А для подключения внешних MIDI-устройств к стандартному порту практически во всех магазинах, торгующих мультимедийной техникой продается стандартный переходник.

 

Все сигналы с внешних аудиоустройств поступают на входной микшер звуковой платы. Он работает точно так же, как и обычные пульты, с той только разницей, что все управление происходит программно. В комплект служебных программ любой звуковой карты входит программа микшера. Она есть и в стандартных комплектах поставки Windows 95 и 98.

 

Входной микшер нужен для того, чтобы установить оптимальный уровень записи. В первой и второй главах мы достаточно подробно останавливались на проблеме уровня записи. Вы должны помнить, что цифровая техника очень чувствительна к превышению уровня 0 дБ - при этом возникают неприятные искажения. А слишком же низкий уровень записи не позволит передать весь динамический диапазон записываемого музыкального инструмента. То есть любая работа по записи “живого” звука в вашей студии будет начинаться именно с регулировки уровня сигнала при помощи входного микшера звуковой карты.

 

После аналого-цифрового преобразования, данные поступают в сигнальный процессор (DSP - Digital Signal Processor) - сердце звуковой платы. Этот процессор управляет обменом данными со всеми остальными устройствами компьютера через шину ISA или PCI. Если центральный процессор выполняет программу записи звука, то цифровые данные поступают либо прямо на жесткий диск, либо в оперативную память компьютера (это зависит от выполняемой программы). В дальнейшем вы можете этим данным присвоить любое имя - получится звуковой файл.

 

При воспроизведении этого звукового файла данные с жесткого диска через шину поступают в сигнальный процессор звуковой платы, который направляет их на цифро-аналоговый преобразователь. Электрический сигнал, получившийся в результате преобразования, в свою очередь, поступает на выходной микшер. Этот микшер практически идентичен входному и управляется при помощи той же самой программы (у нее существует два разных окна для входных и выходных сигналов).

 

Чтобы работать с современными музыкальными программами звуковая карта должна поддерживать запись в режиме full duplex. При записи в этом режиме сигнальный процессор одновременно может работать с двумя потоками цифровых аудиоданных: идущих с АЦП через шину к другим устройствам компьютера, и поступающих с жесткого диска на ЦАП. То есть режим full duplex - это запись одновременно с воспроизведением. Благодаря этому режиму можно использовать звуковую карту как многоканальный магнитофон.

 

На любой универсальной мультимедийной звуковой карте есть синтезатор. Последнее время практически на всех картах устанавливается не один, а два синтезатора: FM - для сохранения совместимости с Sound Blaster и Ad Lib, и Wave Table - для получения качественного звука. Именно эти синтезаторы показаны на рисунке.

 

Исторически так сложилось, что FM-синтезаторы звуковых плат звучат не очень хорошо. Как правило, на современные мультимедийные карты устанавливаются наборы микросхем (чипсеты) FM-синтезаторов производства Yamaha под названием OPL-2, OPL-3 или совместимые с ними. В музыкальных приложениях такие синтезаторы не применяются - они нужны исключительно для звукового сопровождения игр. Так что не нужно переносить оценку мультимедийных FM синтезаторов на профессиональные модели.

 

Мультимедийные Wave Table синтезаторы позволяют получить уже более приличный звук. В прошлой главе мы достаточно подробно рассказывали, как работают sample playback устройства. Синтезаторы звуковых карт работают практически идентично (они представляют из себя скорее звуковые модули, чем синтезаторы). Но некоторые фирмы-производители мультимедийной техники не только копируют в автономные музыкальные инструменты, но и расширяют их функциональные возможности.

 

На Рисунке вы видите, что у Wave Table синтезатора есть не только постоянная память (ROM), но и оперативная (RAM). Как вы уже знаете, оперативной памятью обладают семплеры, и используется она для загрузки любых звуковых файлов, которые проигрываются с разной высотой при нажатии клавиш на подключенной клавиатуре или поступлении команд от секвенсера. То есть Wave Table синтезатор, имеющий оперативную память помимо постоянной - это ни что иное, как комбинация синтезатора и семплера, которая может выполнять функции обоих устройств. Это означает, что вы можете использовать как образцы звучания, хранящиеся в постоянной памяти, так и загружать в оперативную память дополнительные библиотеки или создавать свои собственные звуки. Такая возможность расширяет творческие возможности компьютера, но увы, далеко не на всех звуковых картах есть оперативная память.

 

Чтобы синтезаторы, установленные на звуковой карте можно было использовать в качестве музыкальных инструментов к MIDI/джойстик порту подключают либо MIDI-клавиатуру, либо автономный синтезатор, который может служить в качестве клавиатуры. Сигналы, поступающие с клавиатуры подаются в процессор, который направляет их либо через системную шину к центральному процессору, либо к синтезаторам звуковой карты. Путь MIDI-сигнала зависит от выполняющихся программ - в любом развитом программном секвенсере можно коммутировать MIDI порты и устройства произвольным образом.

 

Каждый из синтезаторов, установленных на звуковой карте имеет свой собственный ЦАП. После преобразования сигналов в аналоговую форму, они поступают на выходной микшер звуковой карты. То есть вы можете устанавливать необходимый баланс синтезаторов, аудиотракта и аудиоустройства, подключенного к дополнительному (aux) входу. Такая возможность оказывается крайне полезной при окончательном микшировании композиций, записанных при помощи компьютера. А итоговый микс поступает на линейный выход (Line Out), который также, как и входы находится на задней панели звуковой карты.

 

Несколько лет назад на универсальных звуковых картах появились специальные разъемы, предназначенные для установки “дочерних” карт-синтезаторов. Дочерняя карта просто “надевается” сверху на основную и использует ее аудиотракт для вывода сигнала. Первоначально такое решение предназначалось для улучшения звучания карт, не имеющих Wave Table синтезатора “на борту”. По названию первой “дочерней” карты эти разъемы стали называться “разъем Wave Blaster”. Сейчас все больше универсальных карт уже имеют вполне приемлемые синтезаторы и “дочерние” карты используются, в основном, для расширения функциональных возможностей студии.

 

Вот, вкратце, все устройство универсальной мультимедийной звуковой карты. Все специализированные музыкальные платы работают точно таким же образом, только на них нет тех или иных элементов. Например, на картах-синтезаторах установлен только MIDI-интерфейс и качественный Wave Table синтезатор. Карты-оцифровщики имеют хорошие АЦП и ЦАП, сигнальный процессор и ничего больше и т.д.

 

II. Звуковые форматы

 

                                                           

 

           

 

1. Звуковые файлы формата VQF

 

Популярность и широкое распространение технологий МРЗ вызвали бурный рост числа разработок в области сжатия звука. Стали появляться новые стандарты и форматы хранения звука, которые в будущем, возможно, придут на смену существующим. В последующих разделах кратко остановимся на современных достижениях в этой области.

Наряду с широко известным на сегодняшний день форматом МРЗ сравнительно недавно появился формат VQF, имеющий более высокую степень сжатия и качество воспроизведения.

 

Формат VQF основывается на технологии TwinVQ (Transform-domain Weightel Interleave Vector Quantization — векторное квантование с трансформными доменами и взвешенным чередованием), разработанной в Японии в лаборатории NTT Human Interface Laboratories (http://www.hil.ntt.co.jp/top/index_e.html). Патент на использование этого формата принадлежит фирме NTT, однако основное программное обеспечение для работы с этим форматом предлагает фирма Yamaha. Компания Yamaha предлагает, пожалуй лучшее программное обеспечение для создания и воспроизведения файлов формата VQF под маркой SoundVQ (http://www.yamaha.co.jp/english/xg/SoundVQ/). При установке плейера одновременно инсталлируются подключаемые модули для воспроизведения файлов VQF в браузеры Netscape и Explorer.

 

Существует также и программное обеспечение от компании разработчика технологии TwinVQ (http://music.jpn.net/software-e.html).

 

Этот формат по использованию идей сжатия весьма похож на МРЗ. Приведем их сравнительные характеристики.

 

VQF-файлы примерно на 30—35% меньше, чем МРЗ, при одинаковом качестве звука. Потоку 128 Кбит/с у файлов МРЗ соответствует поток 80 Кбит/с у файлов VQF. У этих достоинств есть и обратная сторона. При декодировании загрузка процессора также примерно на 30% выше, чем при декодировании МРЗ. Это определяет повышенные требования к компьютеру, на котором планируется проигрывать такие файлы. Для качественного воспроизведения минимальным требованием является процессор Pentium-90, peкомендуется Pentium-200 MMX. Для кодирования минимальным требованием является компьютер с процессором Pentium-66. Высокая степень сжатия требует значительных временных затрат на кодирование файлов в формате VQF. Так, кодирование 4 минут музыки на Pentium-200 MMX занимает примерно 20 минут процессорного времени. Это значительно больше, чем при кодировании файлов МРЗ.

 

Тесты показывают превосходство VQF по всем параметрам на нижних частотах и гораздо меньшее искажение формы сигнала с большим динамическим диапазоном (реальная музыка). Однако по завалу верхних частот звукового спектра VQF на 2—3 дБ уступает МРЗ на частотах выше 15 кГц. Это легко компенсируется настройкой эквалайзера плейера, что объективно ставит VQF на ступень выше по качеству звука по сравнению с МРЗ, но субъективное восприятие различных композиций формата VQF дало старт затяжной полемике между приверженцами хорошо проверенного старого (МР3) и новинок (формата VQF и формата ААС, о котором пойдет речь далее). Узкопрофессиональные споры не мешают сделать широкой интернетовской общественности выбор в пользу нового формата. Наиболее распространенное мнение сейчас можно сформулировать примерно так:

 

"Если и есть какие-то различия, то нужно быть профессиональным музыкантом, чтобы их заметить".

 

На текущий момент в сети Интернет можно найти довольно много музыкальных произведений в формате VQF, однако их количество и степень популярности значительно уступают МРЗ. Также значительно меньше существует программ-плейеров и кодеров.

 

Для проигрывания файлов можно рекомендовать программу K-Jofol. Появились также подключаемые модули для Winamp, проигрывающие файлы VQF. Этот модуль использует декодер компании Yamaha).

 

Программа K-Jofol версии 0.51 занимает 1,4 Мб (как раз одна дискетка). Позволяет воспроизводить файлы форматов VQF, ААС, МРЗ и др.

 

 

2. Звуковые файлы формата ААС

 

Формат аудиосжатия MPEG-2 AAC (MPEG-2 Advanced Audio Coding - расширенное аудио кодирование) был разработан в стенах института Fraunhofer, при активном участии компаний AT&T, Sony, NEC и Dolby в начале 1998 года.

 

Этот формат изначально позиционировался разработчиками как преемник MP3, так как обладал по сравнению с последним рядом несомненных достоинств. Как и в MP3 в основе алгоритма AAC лежит психоакустическая модель кодирования, то есть при сжатии какая-то часть звукового спектра удаляется. При этом алгоритм AAC содержит большое количество усовершенствований, направленных именно на улучшение качества выходного аудиосигнала. В MPEG-2 AAC используются другие алгоритмы преобразований, улучшенные обработчики шумов и новый банк фильтров. Из специальных возможностей можно назвать, так называемые "водяные знаки" (watermarks) - информацию об авторских правах, которую AAC позволяет хранить в теле аудиокомпозиции, причем удалить эту информацию не разрушив целостность аудиоданных невозможно.

При этом MPEG-2 AAC обладает высочайшим качеством звучания и очень хорошей степенью компрессии аудиокомпозиций. Так, например, аудиокомпозиция в формате AAC с bitrate 96 kbs обеспечивает качество звучания, аналогичное потоку MPEG-1 Layer III bitrate128 kbs. При сравнении же файлов AAC с bitrate 128 kbs, качество звучания ощутимо превосходит MPEG-1 Layer III с такой же степенью сжатия.

 

И вполне возможно этот формат заменил бы устаревающий MP3 если бы не одно но...

 

Сразу же после окончания работ над MPEG-2 AAC некоторые из компаний соучредителей забрали причитающиеся им исходные коды стандарта и на их базе создали собственные форматы, коммерческие и не совместимые друг с другом. Вот таким образом и появилась та мешанина несовместимых форматов, которые называют "семейство форматов аудиосжатия AAC".

 

На данный момент существуют четыре разновидности формата AAC:

 

 

Homeboy AAC

 

AT&T a2bAAC

 

Liquifler Pro AAC

 

Astrid/Quartex AAC

 

По всем объективным параметрам последние две модификации AAC превосходят как МРЗ, так и VQF.

 

Все четыре разновидности несовместимы между собой и используют свои собственные программы кодирования и воспроизведения.

 

Далее мы кратко их охарактеризуем.

HomeboyAAC

 

Это первая версия AAC, кодер для которой стал общедоступен. Ее можно охарактеризовать одним словом — отвратительно. Крайне корявые и медленные кодеры в сочетании с отчетливо слышимыми искажениями сыграли свою роль в отталкивании широких масс от этого формата. Единственными его плюсами является достижение качества МРЗ 128 Кбит/с на более низких битрейтах и наличие приятного и быстрого плейера BitAAC. Сейчас этот формат уже практически не используется и даже ссылки на программное обеспечение для него почти исчезли со страниц Интернета. Следует иметь в виду, что большинство программ, распространяемых через Интернет под видом кодеров AAC, являются кодерами именно этого формата. Во времена появления и развития этой ветви AAC уже существовал формат VQF.

AT&T а2ЬААС

 

Известная компания AT&T не могла остаться в стороне от технологий новых систем сжатия аудиоданных. При фирме было создано специальное подразделение, занимающееся созданием программ и раскруткой нового формата, который получил название а2Ь. Строго говоря, этот формат практически полностью следует тем же самым принципам компрессии, что и предыдущий. Однако фирмой были предприняты значительные усилия по повышению качества звучания (в результате чего снизилась степень сжатия) и внесению новых элементов в формат. Составной частью формата а2Ь стала возможность включения изображения исполнителя и текста песни внутрь аудиофайла. Также была разработана технология получения самовоспроизводящихся песен (исходную композицию можно преобразовать в .ехе-файл, включающий в себя все необходимые для воспроизведения, что увеличивало файл всего примерно на 170 Кб). Для файлов этого формата существует удобный и бесплатный плейер с поддержкой многих дополнительных возможностей. Однако, несмотря на мощнейшую рекламную компанию и на очевидные достоинства формата, он не нашел широкого применения по одной простой причине — отсутствию общедоступного кодера! Мало того, эта уважаемая фирма пыталась запатентовать и запретить к использованию все составные части формата. К счастью, это у нее не вышло, — патент был получен только на собственные нововведения. Сейчас уже рекламный пыл немного угас и со своего сайта компания предлагает приобрести уже готовые файлы или бесплатно скачать несколько композиций.

 

Формат по степени сжатия превосходит МРЗ, но на 15—20% уступает VQF, PAC, Astrid/Quartex AAC и Liquifier Pro AAC.

 

Качество звучания а2Ь 96 Кбит/с сравнимо с качеством МРЗ 128 Кбит/с и VQF 96 Кбит/с, но уступает Liquifier Pro AAC 96, Astrid/Quartex AAC 96 и PAC96.

 

Дополнительную информацию можно получить в Интернете по адресу http://www.a2bmusic.com/.

Liquifier Pro AAC

 

Естественно компания AT&T не могла остаться одинокой на рынке борьбы за первенство в области высококачественной компрессии звука. Через некоторое время фирма Liquid Audio нанесла если не сокрушительный, то очень опасный удар по честолюбивым замыслам остальных. Предложенная ей версия формата AAC наиболее четко следовала всем техническим тонкостям и в результате появилась лучшая на сегодняшний день система сжатия звука. Она по степени сжатия и качеству звучания превосходит все существующие в данный момент момент форматы. И хотя превосходство по сжатию над VQF и Astrid/Quartex AAC незначительное — минимальный битрейт, заслуживающий внимания, все те же 96 Кбит/с, звук превосходит все ожидания!

 

К сожалению, политика компании Liquid Audio на данный момент слабо отличается от политики AT&T — есть отличный плейер, но нет общедоступного кодера (существовала демо-версия, но она работала только в он-лайне и через несколько дней неожиданно самоуничтожалась, а все закодированные ей файлы становились неработоспособными).

 

Подводя итоги, заметим, что этот формат по всем параметрам превосходит все остальные и объективно является лучшим. Среди самых последних новостей отметим появление звуковых файлов в этом формате (они имеют расширение LQT), причем для их воспроизведения можно воспользоваться плейером компании Liquid Audio или же установить plugin для программы Winamp (in_lqt.dll), который на самом деле пользуется все тем же, несколько исправленным плейером, перенаправляя звук в программу Winamp.

 

Дополнительную информацию можно получить в Интернете по адресу  http://www.liquidaudio.com/.

Astrid/Quartex AAC

 

В октябре 1998 г. в "спор гигантов" вступило частное лицо. Никому не известный и скромный программист создал, на основе изданных фирмой NTT в мае исходников МР4, свою собственную систему компрессии! Им был предложено протестировать кодер, для чего он был выложен в Интернете п адресу http://www.geocities.com/ResearchTriangIe/Facility/2141/.

 

Уже через несколько дней после выхода новой версии популярного плейера K-Jofol, для которого автор формата Astrid/Quartex ААС написал декодирующий модуль, появились восторженные отклики. Кодер, обладающий непритязательным интерфейсом командной строки, по сжатию и качеству звучания превосходил кодировщики от AT&T ААС и YAMAHA VQF. При этом качество звука практически не уступало хваленому Liquifier Pro ААС. Почти одновременно появились графические интерфейсы (front-end) для нового кодировщика и масса хвалебных отзывов в разных источниках. При всех видимых недостатках сегодняшней версии 0.2 (поддержка только WAV 44 кГц/16 бит РСМ и степени сжатия только 64, 96 и 128 Кбит/с), она уже широко применяется (есть целые ftp-сайты с музыкой в этом формате) и все с нетерпением ждут новых версий.

 

По степени сжатия и качеству звучания формат превосходит все остальные кроме Liquifier Pro ААС, и является объективно лучшим среди тех, что имеют общедоступные кодеры и доступные для распространения в Интернете звуковые файлы. По сравнению с МРЗ обеспечивается аналогичное качество при потоке на 30% меньше. Качество Astrid ААС 96 Кбит/с много лучше качества VQF/96 Кбит/с. Возможно также потоковое воспроизведение.

 

 

3. Звуковые файлы формата РАС

 

Несколько особняком от остальных систем кодирования стоит формат РАС (Perceptive Audio Coding). Впервые эта аббревиатура появилась в стенах лаборатории Bell Labs/Lucent Technologies (кстати, там же впервые появилось сокращение ААС) в самом конце 1997 года. Через некоторое время стали появляться очень интересные сообщения от других фирм-разработчиков, которые не могли не заинтриговать интересующегося человека.

 

Так было заявлено о следующих возможностях:

1. достижении качества МРЗ 128 Кбит/с в формате РАС с битрейтом 64 Кбит/с;

2. поддержка потокового воспроизведения через Интернет;

3. прямое преобразование из Audio-CD в РАС без промежуточных огромных WAV-файлов на диске;

4.кодирование в реальном времени на Pentium-166 (даже не ММХ);

5. зашита от свободного распространения РАС-файлов по Интернету и на CD-R;

6. широкие возможности упорядочения готовых РАС-файлов (плей-листы, каталоги, описания и т. д.).

 

В середине лета 1998 г. известная фирма Celestial Technologies выпустила первую программу для кодирования и воспроизведения звука в формате РАС — "Audio Library 1.0". Хотя программа бесплатно работает только 15 дней и позволяет в одном каталоге хранить не более 5-ти композиций, уже можно сделать кое-какие выводы. Первое, что бросается в глаза, это отсутствие, как таковых, файлов в формате РАС. Во время своей работы программа создает базу данных, состоящую из 8 файлов с расширением TPS, в отдельном каталоге, причем для воспроизведения необходимы минимум 7 из них (GREGLANG.TPS можно выкинуть). Увеличение количества композиций не меняет количества файлов — при добавленной песни в базу просто увеличивается размер файла SONGDATA.TPS.

 

И во всем остальном программа удивляет. Хотя пока на битрейте 64 Кбит/с звук уступает МРЗ 128 Кбит/с, качество звучания РАС 128 Кбит/с поражает воображение. При этом кодер обеспечивает обещанную скорость кодирования.

 

Новую информацию можно получить по адресу http://www.celestialtech.com/.

 

 

4. Ogg Vorbis

 

Ogg Vorbis, вышел в свет в июне 2000. Этот формат является частью проекта Ogg Squish по созданию полностью открытой системы мультимедиа. Иными словами, и сам проект, и Ogg Vorbis в частности являются открытыми и свободными для распространения, а также разработки на его основе нового программного обеспечения. В FAQ от разработчика (группа Xiphophorus) написано, что Ogg Vorbis является алгоритмом, принципиально схожим с известными MPEG-1 Layer II, MPEG-2 AAC, VQF и проч., однако использует оригинальный математический алгоритм и собственную психоакустическую модель, что освобождает его от необходимости выплачивать какие-то лицензионные сборы и производить иные выплаты сторонним фирмам-изготовителям аудио форматов.

 

Алгоритм Ogg Vorbis рассчитан на сжатие данных на всех возможных битрейтах без ограничений, то есть от 8 Kbps до 512 Kbps, а также на кодирование с переменным битрейтом (VBR). Алгоритм предусматривает хранение внутри файлов подробных комментариев об исполнителе и названии композиции, а также графической информации. В алгоритме предусматривается также возможность кодирования нескольких каналов аудио (более двух, теоретически до 255), возможность редактирования содержимого файлов, а также так называемый "масштабируемый битрейт" - возможность изменения битрейта потока без необходимости декодирования. Поддерживается потоковое воспроизведение (streaming).

 

Для хранения данных используется собственный универсальный формат bitstream Ogg Squish, рассчитанный на хранение любой информации мультимедиа системы Ogg Squish (идея реализация универсального формата bitstream Ogg Squish аналогична идее ASF от Microsoft).

 

5. Windows Media Audio

 

 

Алгоритм (кодек) Windows Media Audio (WMA) от Microsoft. Алгоритм WMA, также как и все рассмотренные ранее, позволяет потоковое воспроизведение (stream playback). Качество WMA (если говорить о WMA 7.0 и 8.0) при скорости потока 64 Кбит/c практически не уступает качеству MPEG-1 Layer III 96-128 Кбит/с, а при 96 Кбит/с может превосходить MPEG-2 AAC 128 Кбит/с ("может"- не значит "всегда", то бишь, речь идет о субъективно воспринимаемом качестве звучания).

 

Для хранения потока в формате WMA используется универсальный потоковый файловый формат .ASF (Advanced Audio Streaming), пришедший на замену .WAV. Вообще говоря, .ASF - это универсальный формат для хранения аудио и видео информации, сжатой с помощью самых разнообразных кодеков. .ASF имеет также и свою несколько сокращенную разновидность .WMA. Файлы .WMA предназначены исключительно для хранения аудио данных. Говоря о WMA как о кодеке, следует сказать, что в последнее время он становится все более популярным, так как Microsoft встроила его в Windows'2000 и Windows'2001, превратив его таким образом в стандарт.

 

На сегодняшний день существует несколько версий WMA: v1, v2, v7 и v8. V7 отличается от младших собратьев поддержкой битрейтов до 192 Kbps (в отличие от 164 Kbps в V1 и V2), несколько худшим качеством кодирования и иной структурой данных. Версия 8 отличается от всех предыдущих явно переработанной психоакустической моделью кодека, за счет чего качество кодирования сильно возросло. Так, при 64 Kbps WMA v8.0 на не сильно требовательных к качеству композициях (поп-музыка, например) почти не отличим от MP3 при 128 Kbps, хотя, опять же, все зависит от конкретной композиции и аппаратуры, на которой осуществляется прослушивание.

 

Изначально, обсуждаемый кодек разрабатывался фирмой Voxware и имел название Voxware Audio Codec. Впоследствии компания забросила его доработку остановившись на v4.0, но кодек не остался гнить и был полностью куплен фирмой Microsoft. Программисты сильно доработали этот кодек, а фирма Microsoft переименовала кодек в Windows Media Audio, не забыв позаботиться о том, чтобы он был бесплатным.

 

 

6. Mp3Pro

 

 

Кодек MP3 Pro анонсирован в июле 2001 года компанией Coding Technologies вместе с Tomson Mulimedia и институтом Fraunhofer. Формат MP3Pro является продолжением, или, точнее, развитием старого MP3. MP3Pro является совместимым с MP3 назад (полностью) и вперед (частично). То есть файлы, закодированные с помощью MP3Pro, можно воспроизводить в обычных проигрывателях, однако качество звучания при этом заметно хуже, чем при воспроизведении в специальном проигрывателе. Это связано с тем, что файлы MP3Pro имеют два потока аудио, в то время как обычные проигрыватели распознают в них только один поток, то есть обычный MPEG-1 Layer 3.

 

В MP3Pro использована новая технология - SBR (Spectral Band Replication).Эта технология предназначена для передачи верхнего частотного диапазона. Идея технологии и предпосылки таковы. Дело в том, что технологии использования психоакустических моделей имеют один общий недостаток: все они работают качественно до битрейта 128 Kbps. На более низких битрейтах начинаются различные проблемы: либо для передачи аудио необходимо обрезать частотный диапазон, либо кодирование приводит к появлению различных артефактов. Этот ключевой момент показывает, что использования психоакустической модели мало при работе с битрейтами ниже 128 Kbps. Новая технология SBR дополняет использование психоакустических моделей. Идея следующая: передается (кодируется) чуть более узкий диапазон частот чем обычно (то есть с обрезанными "верхами"), а верхние частоты воссоздаются (восстанавливаются) уже самим декодером на основе информации о более низких частотных составляющих. Таким образом, технология SBR применяется фактически не столько на стадии сжатия, сколько на стадии декодирования. Загадочный второй "параллельный" поток данных, о котором говорилось выше, как раз и есть та минимальная необходимая информация, которая используется при воспроизведении для восстановления верхних частот. Пока достоверно не известно, какую точно информацию несет этот поток, однако проведенные исследования показывают, что эта информация - есть усредненная мощность сигнала в верхнем (обрезанном) диапазоне частот. Точнее не одна усредненная мощность для всего диапазона вырезанных частот, а информация о средней мощности в нескольких полосах частот верхнего диапазона.

 

Качество звучания MP3Pro можно назвать субъективно очень хорошим даже на битрейте 64 Кбит/с, другими словами, субъективно несложные композиции при таком битрейте воспринимаются не хуже чем MP3 128 Кбит/с. Однако необходимо учитывать тот факт, что такое звучание достигается искусственным путем, и что слышимый сигнал представляет собой уже не столько оригинал, сколько синтезированную копию оригинала, что заставляет задуматься меломанов, обладателей высококачественной аудио аппаратуры, а также просто ценителей качественного оригинального звучания.

 

Список источников:

http://www.chipinfo.ru/literature/radio/199905/p32_33.html

http://www.midi.ru/doc/36.htm

http://www.show-master.ru/articles/pc/24-123.shtml

http://www.show-master.ru/archive/39/70.shtml

Hosted by uCoz