По сути дела, та или иная цифровая форма представления
аналоговых аудио сигналов уже является способом кодирования –
последовательность чисел, описывающая аналоговый аудио сигнал, сама по себе
является цифровым кодом. Однако кодирование, о котором мы будем сейчас
говорить, - это нечто другое. Сейчас рассмотрим методы кодирования цифровых
аудио сигналов.
Оцифрованный аудио сигнал «в чистом виде» (например, в форме
одной из рассмотренных выше вариаций ИКМ) является достаточно точной, но не
самой компактной формой записи исходного аналогового сигнала.
Посудите сами. Ч тобы получить полную информацию об оригинальном
аналоговом сигнале в частотной полосе от 0 до 20 кГц (в слышимом диапазоне
частот), аналоговый сигнал необходимо дискретизовать с частотой не менее 40
кГц. Так, стандарт CD - DA (стандарт записи данных на привычных для всех аудио
компакт-дисках) устанавливает следующие параметры кодирования: двух- или
одноканальная запись в формате ИКМ с частотой дискретизации 44.1 кГц и
разрядностью квантования 16 бит. Один час музыки в таком формате занимает объем
около 600 Мб (60 минут * 60 секунд * 2 канала * 44100 отсчетов в секунду * 2
байта на отсчет = около 605 Мб). Учитывая, что, например, музыкальная коллекция
рядового любителя музыки вполне может насчитывать 5000 треков средней
продолжительностью около 3 минут каждый, объем памяти, требуемый для ее
хранения в исходном цифровом виде, оказывается очень внушительным. Поэтому
хранение относительно больших объемов аудио данных, гарантирующее достаточно
хорошее качество звучания, требует применения разных «ухищрений», позволяющих
уплотнить данные.
В целом, все существующие методы кодирования аудио информации
можно условно разделить всего на два типа.
1.;
Сжатие данных без потерь (англ. « lossless coding») - это
способ кодирования (уплотнения) цифровой аудио информации, позволяющий осуществлять
стопроцентное восстановление исходных данных из сжатого потока (под понятием
«исходные данные» здесь подразумевается исходный вид оцифрованных аудио
данных). К такому способу уплотнения данных прибегают в случаях, когда
требуется абсолютное, стопроцентное сохранение качества оригинального звучания
аудио данных. Существующие сегодня алгоритмы беспотерьного сжатия позволяют
сократить занимаемый данными объем на 20-50% и при этом гарантировать
стопроцентное восстановление исходного цифрового материала из сжатых данных.
Механизмы работы подобных кодеров сходны с механизмами работы архиваторов общих
данных, таких, как, например, ZIP или RAR, но при этом адаптированы специально
для сжатия аудио данных. Беспотерьное кодирование , хотя и идеально с точки
зрения сохранности качества аудио материалов, но оказывается неспособным
обеспечить высокий уровень компрессии.
2. Существует другой, более современный путь
уплотнения данных. Это так называемое сжатие
данных с потерями (англ. « lossy coding»).Цель такого кодирования
заключается в достижении любыми путями максимально высокого коэффициента
компрессии данных при сохранении качества их звучания на приемлемом уровне. В
основе идеи кодирования с потерями лежит два простых основополагающих
соображения:
Кодирование с потерями потому и называется «с потерями», что
приводит к утрате некоторой части аудио информации. Такое кодирование приводит
к тому, что декодированный сигнал при воспроизведении звучит похоже на
оригинальный, но фактически перестает быть ему идентичным. В основе большинства
методов кодирования с потерями лежит использование психоакустических свойств
слуховой системы человека, а также различных хитростей, связанных с
переквантованием и передискретизацией сигнала. В частотности, в процессе
компрессии аудио данные анализируются кодером на предмет выявления различных
деталей звучания, которыми можно пренебречь. Замаскированные частоты,
неслышимые и слабослышимые детали звучания – всем этим можно пожертвовать с
целью достижения более высокого значения коэффициента компрессии. Там, где в
звучании важна лишь разборчивость (например, в телефонии, где наличие частот
выше 4 кГц не является необходимым), аудио информация в процессе кодирования
подвергается серьезному «упрощению», что вкупе с использованием «умных»
квантователей и удачных «жадных» алгоритмов компрессии данных позволяет достичь
высочайших степеней компрессии (1 : 50 и выше). Там, где качеству звучания
предъявляются более высокие требования (например, в портативных и бытовых аудио
устройствах), аудио материалы подвергают более щадящему кодированию. Надо
отметить, что степень агрессивности кодера по отношению к деталям звучания
может регулироваться (эта способность, впрочем, зависит от конкретной
реализации). В среднем, современные кодеры даже при столь высокой степени
компрессии, как 1 : 10 позволяют обеспечить отличное звучание, качество
которого средним слушателем на средней аппаратуре оценивается как равное
качеству звучания исходных аудио данных.