Реферат: Старая пластинка: Что такое цифровой звук и реставрация звука с помощью цифровой обработки

<span Verdana",«sans-serif»">       

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

МИНИСТЕРСТВО ОБРАЗОВАНИЯ

РОССИЙСКОЙ ФЕДЕРАЦИИ

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙИНСТИТУТ

РАДИОТЕХНИКИ ЭЛЕКТРОНИКИ ИАВТОМАТИКИ

(ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)

Курсовая работа по информатике

Тема  :

Старая пластинка: Что такое цифровой звук и реставрация звука с помощьюцифровой обработки.

Студент Чистяков И.А.

Группа  ОТО 4-04

Преподователь  Андрианова Е. Г.

Работадопущена к защите_____________________________

Курсоваяработа защищена с оценкой ___________________

Москва 2005

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

Содержание

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

1.Введение………………………………………………………………..3

        

2. Частьпервая, теоретическая……..………………………………..3

А. Теорияцифрового звука……………………………….……3

Б. Оцифровказвука и его хранение на цифровом носителе.7

В. Каксохранить оцифрованный звук?..................................11

<span Times New Roman",«serif»">Г. Преимущества и недостатки цифровогозвука………….14<span Times New Roman",«serif»">         Д.К вопросу об обработке звука……………..……………….17<span Times New Roman",«serif»">         Е.Аппаратура………………………………………..…………18

         Ж.Программное обеспечение………………………….……..22

         3.Частьвторая: больше практическая……………..…………………25

<span Verdana",«sans-serif»">

1. Подключение проигрывателя ккомпьютеру…..……….25

2. Настройка возможностей звуковойкарты……..………..26

3. Реставрация……………………………………….…………26

4. Подготовка файлов…………………………………………32

5. Разделение файла wave на отдельныекомпозиции........32

          

6. Перспективы и проблематика……………………………33

7. Глоссарий терминов……………………………………….34

<span Verdana",«sans-serif»"><span Verdana",«sans-serif»">1.Введение

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">        В последнее время возможностимультимедийного оборудования  претерпели значительныйрост, и этой  области уделяетсядостаточное количество внимания, но все же рядовой пользователь никак не можетсоставить себе четкого представления о том, какие возможности скрывает егожелезный друг в области воспроизведения звука, писка, шумов, бинаруальных волни т.д. Все ограничивается воспроизведением криков и взрывов в играх и фильмах(благо технический прогресс докатился уже до такого уровня) и прослушиваниядомашней фонотеки (или уже пора придумать другое название, что-нибудь типа«цифротеки»?).

<span Verdana",«sans-serif»">   Попробуем в данном труде разобраться восновных аспектах данной проблемы. Поговорим немного об анатомии, теориицифрового звука и что можно извлечь из старой виниловой пластинки иаудиокассеты.

<span Verdana",«sans-serif»">        Что именно мы знаем о звуковыхвозможностях компьютера, кроме того, что в нашем домашнем компьютереустановлена звуковая плата и две колонки? К сожалению, вероятно из-занедостаточности литературы или по каким-либо другим причинам, но пользователь,чаще всего, не знаком ни с чем, кроме встроенного в Windows микшера аудиовходов/выходов и Recorder’а. Для того чтобы узнать что же умеет компьютер вобласти звука, нужно только поинтересоваться и перед вами откроютсявозможности, о которых вы, может быть, даже не догадывались. И все это не таксложно, как может показаться на первый взгляд.

<span Verdana",«sans-serif»">

2.Часть первая: больше теоретическая.

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Всепроцессы записи, обработки и воспроизведения звука так или иначе работают наодин орган, которым мы воспринимаем звуки — ухо. Две штуки :). Без пониманиятого, что мы слышим, что нам важно, а что нет, в чем причина тех или иныхмузыкальных закономерностей — без этих и других мелочей невозможноспроектировать хорошую аудио аппаратуру, нельзя эффективно сжать или обработатьзвук. То, что здесь описано — лишь самые основы.

<span Verdana",«sans-serif»">Снаружимы видим так называемое внешнее ухо. Ничего особенного нас тут не интересует.Затем идет канал — примерно 0.5 см в диаметре и около 3 см в длину. Далее — барабанная перепонка, к которой присоединены кости — среднее ухо. Эти косточкипередают вибрацию барабанной перепонки далее — на другую перепонку, во внутреннее ухо — трубку с жидкостью,около 0.2 мм диаметром и еще целых 3-4 см длинной, закрученная как улитка.Смысл наличия среднего уха в том, что колебания воздуха слишком слабы, чтобынапрямую колебать жидкость, и среднее ухо вместе с барабанной перепонкой иперепонкой внутреннего уха составляют гидравлический усилитель — площадьбарабанной перепонки во много раз больше перепонки внутреннего уха, поэтомудавление (которое равно F/S) усиливается в десятки раз.

<span Verdana",«sans-serif»">Вовнутреннем ухе по всей его длине натянута некая штука, напоминающая струну — еще одна вытянутая мембрана, жесткая к началу уха и мягкая к концу.Определенный участок этой мембраны колеблется в своём диапазоне, низкие частоты- в мягком участке ближе к концу, самые высокие — в самом начале. Вдоль этоймембраны расположены нервы, которые воспринимают колебания и передают их вмозг, используя два принципа:

<span Verdana",«sans-serif»">Первый- ударный принцип. Поскольку нервы еще способны передавать колебания (бинарныеимпульсы) с частотой до 400-450 Гц, именно этот принцип влоб используется вобласти низкочастотного слуха. Там сложно иначе — колебания мембраны слишкомсильны и затрагивают слишком много нервов. Ударный принцип немного расширяетсядо примерно 4 кГц с помощью трюка — несколько (до десяти) нервов ударяют вразных фазах, складывая свою пропускную способность. Этот способ хорош тем, чтомозг воспринимает информацию более полно — с одной стороны, мы всё таки имеемлегкое частотное разделение, а с другой — можем еще смотреть сами колебания, ихформу и особенности, а не просто частотный спектр. Этот принцип продлен насамую важную для нас часть — спектр человеческого голоса. Да и вообще, до 4 кГцнаходится вся наиболее важная для нас информация.

<span Verdana",«sans-serif»">

<img src="/cache/referats/19479/image002.jpg" align=«right» hspace=«12» v:shapes="_x0000_s1029"><span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Нуи второй принцип — просто местоположение возбуждаемого нерва, применяется длязвуков более 4 кГц. Тут уже кроме факта нас вообще ничего не волнует — ни фаза,ни скважность… Голый спектр.

<span Verdana",«sans-serif»">Такимобразом, в области высоких частот мы имеем чисто спектральный слух не оченьвысокого разрешения, а для частот близких к человеческому голосу — болееполный, основанный не только на разделении спектра, а еще и на дополнительноманализе информации самим мозгом, давая более полную стерео — картину, например.Об этом — ниже.

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Основноевосприятие звука происходит в диапазоне 1 — 4 кГц, в этом же диапазонезаключено человеческий голос (да и звуки, издаваемые большинством важных нампроцессов в природе). Корректная передача этого частотного отрезка — первоеусловие естественности звучания.

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Очувствительности (по мощности и частотной)

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Теперьо децибелах. Вкратце — аддитивная относительная логарифмическая мера громкости(мощности) звука, наиболее хорошо отражающая человеческое восприятие громкости,и в то же время достаточно просто вычисляемая.

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Вакустике принято измерять громкость в дБ SPL (Sound Power Level — не знаю какэто звучит у нас). Ноль этой шкалы находится примерно на минимальном звуке,который слышит человек. Соответственно отсчет ведется в положительную сторону.Человек может осмысленно слышать звуки громкостью примерно до 120 дБ SPL. При140 дБ ощущается сильная боль, при 150 дБ наступает повреждение ушей.Нормальный разговор — примерно 60 — 70 дБ SPL. Далее в этом разделе приупоминании дБ подразумевается дБ от нуля по SPL.

<span Verdana",«sans-serif»">Чувствительностьуха к разным частотам очень сильно различна. Максимальна чувствительность врайоне 1 — 4 кГц, основные тона человеческого голоса. Звук 3 кГц — это и естьтот звук, который слышен при 0 дБ. Чувствительность сильно падает в обе стороны- например для звука в 100 Гц нам нужно уже целых 40 дБ (в 100 раз большаяамплитуда колебаний), для 10 кГц — 20 дБ. Обычно мы можем сказать, что двазвука отличаются по громкости, при разнице примерно в 1 дБ. Несмотря на это, 1дБ — это скорее много, чем мало. Просто у нас очень сильно компрессированное,выровненное восприятие громкости. Зато весь диапазон — 120 дБ — воистинуогромен, по амплитуде это миллионы раз!

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Кстати,увеличение амплитуды в два раза соответствует увеличению громкости на 6 дБ.Внимание! не путайте: 12 дБ — в 4 раза, но разница 18 дБ — уже 8 раз! а не 6,как могло подуматься. дБ — логарифмическая мера)

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Аналогичнапо свойствам и спектральная чувствительность. Мы можем сказать, что два звука(простых тона) отличаются по частоте, если разница между ними составляет около0.3% в районе 3 кГц, а в районе 100 Гц требуется различие уже на 4%! Длясправки — частоты нот (если брать вместе с полутонами, то есть две соседниеклавиши фортепьяно, включая черные) отличаются на примерно 6%.

<span Verdana",«sans-serif»">Вобщем, в районе 1 — 4 кГц чувствительность уха по всем параметрам максимальна,и составляет не так уж и много, если брать не логарифмированные значения, скоторыми приходится работать цифровой технике. Примите на заметку — многое изтого, что происходит в цифровой обработке звука, может выглядеть ужасно вцифрах, и при этом звучать неотличимо от оригинала.

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Вцифровой обработке понятие дБ считается от нуля и вниз, в область отрицательныхзначений. Ноль — максимальный уровень, представимый цифровой схемой.

<span Verdana",«sans-serif»">

А. Собственно говоря, о самой цифре.

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Некоторыефакты и понятия, без которых тяжело обойтись.

<span Verdana",«sans-serif»">В соответствии с теорией математикаФурье, звуковую волну можно представить в виде спектра входящих в нее частот.

<span Verdana",«sans-serif»">

Частотные составляющие спектра — это синусоидальныеколебания (так называемые чистые тона), каждое из которых имеет своюсобственную амплитуду и частоту. Таким образом, любое, даже самое сложное поформе колебание (например, человеческий голос), можно представить суммойпростейших синусоидальных колебаний определенных частот и амплитуд. И наоборот,сгенерировав различные колебания и наложив их друг на друга (смикшировав, смешав),можно получить различные звуки.

Справочка:<span Verdana",«sans-serif»"> человеческий слуховой аппарат/мозгспособен различать частотные составляющие звука в пределах от 20 Гц до ~20 КГц(верхняя граница может колебаться в зависимости от возраста и других факторов).Кроме того, нижняя граница сильно колеблется в зависимости от интенсивностизвучания.

<span Verdana",«sans-serif»;mso-ansi-language:EN-US">

<span Verdana",«sans-serif»">Б.Оцифровка звука и его хранение на цифровом носителе

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">«Обычный» аналоговый звукпредставляется в аналоговой аппаратуре непрерывным электрическим сигналом.Компьютер оперирует с данными в цифровом виде. Это означает, что и звук вкомпьютере представляется в цифровом виде. Как же происходит преобразованиеаналогового сигнала в цифровой?

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Цифровой звук – это способпредставления электрического сигнала посредством дискретных численных значенийего амплитуды. Допустим, мы имеем аналоговую звуковую дорожку хорошего качества(говоря «хорошее качество» будем предполагать нешумную запись, содержащуюспектральные составляющие из всего слышимого диапазона частот – приблизительноот 20 Гц до 20 КГц) и хотим «ввести» ее в компьютер (то есть оцифровать) безпотери качества. Как этого добиться и как происходит оцифровка? Звуковая волна– это некая сложная функция, зависимость амплитуды звуковой волны от времени.Казалось бы, что раз это функция, то можно записать ее в компьютер «как есть»,то есть описать математический вид функции и сохранить в памяти компьютера.Однако практически это невозможно, поскольку звуковые колебания нельзяпредставить аналитической формулой (как y=

<span Verdana",«sans-serif»;mso-ansi-language:EN-US">COS<span Verdana",«sans-serif»">x, например). Остается один путь –описать функцию путем хранения ее дискретных значений в определенных точках.Иными словами, в каждой точке времени можно измерить значение амплитуды сигналаи записать в виде чисел. Однако и в этом методе есть свои недостатки, так какзначения амплитуды сигнала мы не можем записывать с бесконечной точностью, ивынуждены их округлять. Говоря иначе, мы будем приближать эту функцию по двумкоординатным осям – амплитудной и временной (приближать в точках – значит,говоря простым языком, брать значения функции в точках и записывать их сконечной точностью). Таким образом, оцифровка сигнала включает в себя двапроцесса — процесс дискретизации (осуществление выборки) и процесс квантования.Процесс дискретизации — это процесс получения значений величин преобразуемогосигнала в определенные промежутки времени (рис. 1).

<span Verdana",«sans-serif»;mso-ansi-language:EN-US">

<span Verdana",«sans-serif»;mso-ansi-language:EN-US"><img src="/cache/referats/19479/image004.jpg" v:shapes="_x0000_i1025">

<span Verdana",«sans-serif»">рис.1

<span Verdana",«sans-serif»">Квантование — процесс заменыреальных значений сигнала приближенными с определенной точностью (рис. 2).Таким образом, оцифровка – это фиксация амплитуды сигнала через определенные промежуткивремени и регистрация полученных значений амплитуды в виде округленных цифровыхзначений (так как значения амплитуды являются величиной непрерывной, нетвозможности конечным числом записать точное значение амплитуды сигнала, именнопоэтому прибегают к округлению).  Записанные значения амплитуды сигналаназываются отсчетами. Очевидно, что чем чаще мы будем делать замеры амплитуды(чем выше частота дискретизации) и чем меньше мы будем округлять полученныезначения (чем больше уровней квантования), тем более точное представлениесигнала в цифровой форме мы получим.

<img src="/cache/referats/19479/image006.jpg" align=«left» hspace=«12» v:shapes="_x0000_s1026"><span Verdana",«sans-serif»"><span Verdana",«sans-serif»"><span Verdana",«sans-serif»"><span Verdana",«sans-serif»"><span Verdana",«sans-serif»">Рис.2

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Оцифрованный сигнал в виде набора последовательныхзначений амплитуды можно сохранить.

<span Verdana",«sans-serif»">Теперь о практических проблемах.Во-первых, надо иметь в виду, что память компьютера не бесконечна, так чтокаждый раз при оцифровке необходимо находить какой-то компромисс междукачеством (напрямую зависящим от использованных при оцифровке параметров) изанимаемым оцифрованным сигналом объемом.

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Во-вторых, частота дискретизацииустанавливает верхнюю границу частот оцифрованного сигнала, а именно,максимальная частота спектральных составляющих равна половине частотыдискретизации сигнала. Попросту говоря, чтобы получить полную информацию озвуке в частотной полосе до 22050 Гц, необходима дискретизация с частотой неменее 44.1 КГц.

<span Verdana",«sans-serif»">Существуют и другие проблемы инюансы, связанные с оцифровкой звука. Не сильно углубляясь в подробностиотметим, что в «цифровом звуке» из-за дискретности информации об амплитудеоригинального сигнала появляются различные шумы и искажения (под фразой «вцифровом звуке есть такие-то частоты и шумы» подразумевается, что когда этотзвук будет преобразован обратно из цифрового вида в аналоговый, то в егозвучании будут присутствовать упомянутые частоты и шумы). Так, например,джиттер (jitter) – шум, появляющийся в результате того, что осуществлениевыборки сигнала при дискретизации происходит не через абсолютно равныепромежутки времени, а с какими-то отклонениями. То есть, если, скажем,дискретизация проводится с частотой 44.1 КГц, то отсчеты берутся не точнокаждые 1/44100 секунды, а то немного раньше, то немного позднее. А так каквходной сигнал постоянно меняется, то такая ошибка приводит к «захвату» несовсем верного уровня сигнала. В результате во время проигрывания оцифрованногосигнала может ощущаться некоторое дрожание и искажения. Появление джиттераявляется результатом не абсолютной стабильности аналогово-цифровыхпреобразователей. Для борьбы с этим явлением применяют высокостабильныетактовые генераторы. Еще одной неприятностью является шум дробления. Как мыговорили, при квантовании амплитуды сигнала происходит ее округление доближайшего уровня. Такая погрешность вызывает ощущение «грязного» звучания.

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Справочка:

<span Verdana",«sans-serif»">стандартные параметры записи аудио компакт-дисков следующие: частотадискретизации — 44.1 КГц, уровень квантования – 16 бит. Такие параметрысоответствуют 65536 (2<img src="/cache/referats/19479/image008.gif" v:shapes="_x0000_i1026">

<span Verdana",«sans-serif»">На практике, процесс оцифровки(дискретизация и квантование сигнала) остается невидимым для пользователя — всючерновую работу делают разнообразные программы, которые дают соответствующиекоманды драйверу (управляющая подпрограмма операционной системы) звуковойкарты. Любая программа (будь то встроенный в

<span Verdana",«sans-serif»;mso-ansi-language:EN-US">Windows<span Verdana",«sans-serif»"> <span Verdana",«sans-serif»;mso-ansi-language:EN-US">Recorder<span Verdana",«sans-serif»"> или мощный звуковой редактор),способная осуществлять запись аналогового сигнала в компьютер, так или иначеоцифровывает сигнал с определенными параметрами, которые могут оказатьсяважными в последующей работе с записанным звуком, и именно по этой причиневажно понять как происходит процесс оцифровки и какие факторы влияют на еерезультаты.<span Verdana",«sans-serif»; mso-ansi-language:EN-US">

<span Verdana",«sans-serif»">Поехали дальше. Как получитьаналоговый звук опять из цифры?

<span Verdana",«sans-serif»">Мы же его должны услышать, а цифоркинам слышать не дано.

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">2. Преобразование звука из цифровоговида в аналоговый

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Как после оцифровки прослушиватьзвук? То есть, как преобразовывать его обратно из цифрового вида в аналоговый?

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Для преобразования дискретизованногосигнала в аналоговый вид, пригодный для обработки аналоговыми устройствами(усилителями и фильтрами) и последующего воспроизведения через акустическиесистемы, служит цифроаналоговый преобразователь (ЦАП). Процесс преобразованияпредставляет собой обратный процесс дискретизации: имея информацию о величинеотсчетов (амплитуды сигнала) и беря определенное количество отсчетов в единицувремени, путем интерполирования происходит восстановление исходногосигнала  (рис. 3).

<span Verdana",«sans-serif»">

<img src="/cache/referats/19479/image010.jpg" align=«left» hspace=«12» v:shapes="_x0000_s1027"><span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»"><span Verdana",«sans-serif»"><span Verdana",«sans-serif»">Рис.3

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Еще совсем недавно воспроизведениезвука в домашних компьютерах было проблемой, так как компьютеры не оснащалисьспециальными ЦАП. Сначала в качестве простейшего звукового устройства вкомпьютере использовался встроенный динамик (PC speaker). Вообще говоря, этотдинамик до сих пор имеется почти во всех PC, но никто уже не помнит как его«раскачать», чтобы он заиграл. Если вкратце, то этот динамик присоединен кпорту на материнской плате, у которого есть два положения – 1 и 0. Так вот,если этот порт быстро-быстро включать и выключать, то из динамика  можно извлечь более-менее правдоподобныезвуки. Воспроизведение различных частот достигается за счет того, что диффузординамика обладает конечной реакцией и не способен мгновенно перескакивать сместа на место, таким образом он «плавно раскачивается» вследствиескачкообразного изменения напряжения на нем. И если колебать его с разнойскоростью, то можно получить колебания воздуха на разных частотах. Естественнойальтернативой динамику стал так называемый Covox – это простейший ЦАП,выполненный на нескольких подобранных сопротивлениях (или готовой микросхеме),которые обеспечивают перевод цифрового представления сигнала в аналоговый – тоесть в реальные значения амплитуды. Covox прост в изготовлении и поэтому онпользовался успехом у любителей вплоть до того времени, когда звуковая картастала доступной всем.

<span Verdana",«sans-serif»">В современном компьютере звуквоспроизводится и записывается с помощью звуковой карты – подключаемой, либовстроенной в материнскую плату компьютера. Задача звуковой карты в компьютере –ввод и вывод аудио. Практически это означает, что звуковая карта является темпреобразователем, который переводит аналоговый звук в цифровой и обратно. Еслиописывать упрощенно, то работа звуковой карты может быть пояснена следующимобразом. Предположим, что на вход звуковой карты подан аналоговый сигнал икарта включена (программно). Сначала входной аналоговый сигнал попадает ваналоговый микшер, который занимается смешением сигналов и регулировкойгромкости и баланса. Микшер необходим, в частности, для предоставлениявозможности пользователю управлять уровнями. Затем отрегулированный исбалансированный сигнал попадает в аналогово-цифровой преобразователь, гдесигнал дискретизуется и квантуется, в результате чего в компьютер по шинеданных направляется бит-поток, который и представляет собой оцифрованный аудиосигнал. Вывод аудио информации почти аналогичен вводу, только происходит вобратную сторону. Поток данных, направленный в звуковую карту, преодолеваетцифро-аналоговый преобразователь, который образует из чисел, описывающихамплитуду сигнала, электрический сигнал; полученный аналоговый сигнал можетбыть пропущен через любые аналоговые тракты для дальнейших преобразований, втом числе и для воспроизведения. Надо отметить, что если звуковая картаоборудована интерфейсом для обмена цифровыми данными, то при работе с цифровымаудио никакие аналоговые блоки карты не задействуются.

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»"><span Verdana",«sans-serif»">В.Каксохранить оцифрованный звук?

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Для хранения цифрового звукасуществует много различных способов. Как мы говорили, оцифрованный звук являетсобой набор значений амплитуды сигнала, взятых через определенные промежуткивремени. Таким образом, во-первых, блок оцифрованной аудио информации можнозаписать в файл «как есть», то есть последовательностью чисел (значенийамплитуды). В этом случае существуют два способа хранения информации.

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

<img src="/cache/referats/19479/image012.jpg" align=«left» hspace=«12» v:shapes="_x0000_s1028"><span Verdana",«sans-serif»">

Рис.4

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Первый (рис. 4) — PCM (Pulse CodeModulation — импульсно-кодовая модуляция) — способ цифрового кодированиясигнала при помощи записи абсолютных значений амплитуд (бывают знаковое илибеззнаковое представления). Именно в таком виде записаны данные на всех аудиоCD.

<span Verdana",«sans-serif»">Второй способ (рис. 5) — ADPCM(Adaptive Delta PCM — адаптивная относительная импульсно-кодовая модуляция) –запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд(приращениях).

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">

Рис.5 <span Verdana",«sans-serif»"><img src="/cache/referats/19479/image014.jpg" v:shapes="_x0000_i1027">

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Во-вторых, можно сжать или упроститьданные так, чтобы они занимали меньший объем памяти, нежели будучи записанными«как есть». Тут тоже имеются два пути.

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">Кодирование данных без потерь(lossless coding) — это способ кодирования аудио, который позволяетосуществлять стопроцентное восстановление данных из сжатого потока. К такомуспособу уплотнения данных прибегают в тех случаях, когда сохранениеоригинального качества данных критично. Например, после сведения звука в студиизвукозаписи, данные необходимо сохранить в архиве в оригинальном качестве длявозможного последующего использования. Существующие сегодня алгоритмыкодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемыйданными объем на 20-50%, но при этом обеспечить стопроцентное восстановлениеоригинальных данных из полученных после сжатия. Подобные кодеры – это своегорода архиваторы данных (как ZIP, RAR и другие), только предназначенные длясжатия именно аудио.

<span Verdana",«sans-serif»">Имеется и второй путь кодирования,на котором мы остановимся чуть подробнее, – кодирование данных с потерями(lossy coding). Цель такого кодирования — любыми способами добиться схожестизвучания восстановленного сигнала с оригиналом при как можно меньшем объемеупакованных данных. Это достигается путем использования различных алгоритмов«упрощающих» оригинальный сигнал (выкидывая из него «ненужные» слабослышимыедетали), что приводит к тому, что декодированный сигнал фактически перестаетбыть идентичным оригиналу, а лишь похоже звучит. Методов сжатия, а такжепрограмм, реализующих эти методы, существует много. Наиболее известнымиявляются MPEG-1 Layer I,II,III (последним является всем известный MP3), MPEG-2AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ(VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемыйтакими кодерами, находится в пределах 10-14 (раз). Надо особо подчеркнуть, чтов основе всех lossy-кодеров лежит использование так называемойпсихоакустической модели, которая как раз и занимается «упрощением»оригинального сигнала. Говоря точнее, механизм подобных кодеров выполняетанализ кодируемого сигнала, в процессе которого определяются участки сигнала, вопределенных частотных областях которых имеются неслышные человеческому ухунюансы (замаскированные или неслышимые частоты), после чего происходит ихудаление из оригинального сигнала. Таким образом, степень сжатия оригинальногосигнала зависит от степени его «упрощения»; сильное сжатие достигается путем«агрессивного упрощения» (когда кодер «считает» ненужными множественныенюансы), такое сжатие, естественно, приводит к сильной деградации качества,поскольку удалению могут подлежать не только незаметные, но и значимые детализвучания.

<span Verdana",«sans-serif»">Как мы сказали, современныхlossy-кодеров существует достаточно много. Наиболее распространенный формат –MPEG-1 Layer III (всем известный MP3). Формат завоевал свою популярностьсовершенно заслуженно – это был первый распространенный кодек подобного рода,который достиг столь высокого уровня компрессии при отличном качестве звучания.Сегодня этому кодеку имеется множество альтернатив, но выбор остается запользователем.  Преимущества MP3 –широкая распространенность и достаточно высокое качество кодирования, котороеобъективно улучшается благодаря разработкам различных кодеров MP3 энтузиастами(например, кодер Lame). Мощная альтернатива MP3 – кодек Microsoft Windows MediaAudio (Файлы .WMA и .ASF). По различным тестам этот кодек показывает себя от«как MP3» до «заметно хуже MP3» на средних битрейтах, и, чаще, «лучше MP3» нанизких битрейтах. Ogg Vorbis (файлы .OGG) – совершенно свободный отлицензирования кодек, создаваемый независимыми разработчиками. Чаще всего ведетсебя лучше MP3, недостатком является лишь малая распространенность, что можетстать критическим аргументом при выборе кодека для длительного хранения аудио.Вспомним и еще молодой кодек MP3 Pro, анонсированный в июле 2001 года компаниейCoding Technologies совместно с Thomson Multimedia. Кодек являетсяпродолжением, или, точнее, развитием старого MP3 – он совместим с MP3 назад(полностью) и вперед (частично). За счет использования новой технологии SBR(Spectral Band Replication), кодек ведет себя заметно лучше других форматов нанизких битрейтах, однако качество кодирования на средних и высоких битрейтахчаще уступает качеству почти всех описанных кодеков. Таким образом, MP3 Proпригоден больше для ведения аудио трансляций в Internet, а также для созданияпревью песен и музыки.

<span Verdana",«sans-serif»">Говоря о способах хранения звука вцифровом виде нельзя не вспомнить и о носителях данных. Всем привычный аудиокомпакт-диск, появившийся в начале 80-х годов, широкое распространение получилименно в последние годы (что связано с сильным удешевлением носителя иприводов). А  до этого носителямицифровых данных являлись кассеты с магнитной лентой, но не обычные, аспециально предназначенные для так называемых DAT-магнитофонов. Ничегопримечательного – магнитофоны как магнитофоны, однако цена на них всегда былавысокой, и такое удовольствие было не всем «по зубам». Эти магнитофоныиспользовались, в основном, в студиях звукозаписи. Преимущество такихмагнитофонов было в том, что, не смотря на использование привычных носителей,данные на них хранились в цифровом виде и практически никаких потерь причтении/записи на них не было (что очень важно при студийной обработке ихранении звука). Сегодня появилось большое количество различных носителейданных, кроме привычных всем компакт дисков. Носители совершенствуются и скаждым годом становятся более доступными и компактными. Это открывает большиевозможности в области создания мобильных аудио проигрывателей. Уже сегодняпродается огромное количество различных моделей переносных цифровых плееров. И,можно предположить, что это еще далеко не пик развития такого рода техники.

<span Verdana",«sans-serif»"><span Verdana",«sans-serif»">Г.Преимущества и недостатки цифрового звука

<span Verdana",«sans-serif»">

<span Verdana",«sans-serif»">С точки зрения обычного пользователявыгоды много — компактность современных носителей информации позволяет ему,например, перевести все диски и пластинки из своей коллекции в цифровоепредставление и сохранить на долгие годы на небольшом трехдюймовом винчестереили на десятке-другом компакт дисков; можно воспользоваться специальнымпрограммным обеспечением и хорошенько «почистить» старые записи с бобин ипластинок, удалив из их звучания шумы и треск; можно также не простоскорректировать звучание, но и приукрасить его, добавить сочности,объемности,  восстановить частоты. Помимоперечисленных манипуляций со звуком в домашних условиях, Интернет тоже приходитна помощь аудио-любителю. Например, сеть позволяет людям обмениваться музыкой,прослушивать сотни тысяч различных Интернет-радио станций, а такжедемонстрировать свое звуковое творчество публике, и для этого нужен всего лишькомпьютер и Интернет. И, наконец, в последнее время появилась огромная массаразличной портативной цифровой аудио аппаратуры, возможности даже самого среднегопредставителя которой зачастую позволяют с легкостью взять с собой в дорогуколлекцию музыки, равную по длительности звучания десяткам часов.

<span Verdana",«sans-serif»">С точки зрения профессионалацифровой звук открывает поистине необъятные возможности. Если раньше звуковые ирадио студии размещались на нескольких десятках квадратных метров, то теперь ихможет заменить хороший компьютер, который по возможностям превосходит десятьтаких студий вместе взятых, а по стоимости оказывается многократно дешевлеодной. Это снимает многие финансовые барьеры и делает звукозапись  более доступной и профессионалу и простомулюбителю. Современное программное обеспечение позволяет делать со звуком всечто угодно. Раньше различные эффекты звучания достигались с помощью хитроумныхприспособлений, которые не всегда являли собой верх технической мысли или жебыли просто устройствами кустарного изготовления. Сегодня, самые сложные ипросто невообразимые раньше эффекты достигаются путем нажатия пары кнопок.Конечно, вышесказанное несколько утрировано и компьютер не заменяет человека –звукооператора, режиссера или монтажера, однако с уверенностью можно сказать,что компактность, мобильность, колоссальная мощность и обеспечиваемое качествосовременной цифровой техники, предназначенной для обработки звука, уже сегодняпочти полностью вытеснило из студий старую аналоговую аппаратуру.

<span Verdana",«sans-serif»">Впрочем, у цифрового представленияданных есть одно неоспоримое и очень важное преимущество – при сохранномносителе данные на нем не искажаются с течением времени. Если магнитная лентасо временем размагничивается и качество записи теряется, если пластинкацарапается и к звучанию прибавляются щелчки и треск, то компакт-диск /винчестер / электронная память либо читается (в случае сохранности), либо нет,а эффект старения отсутствует. Важно отметить, мы не говорим здесь об Audio CD(CD-DA – стандарт, устанавливающий параметры и формат записи на аудио компактдиски) так как не смотря на то, что это носитель цифровой информации, эффектстарения его, все же, не минует. Это связано с особенностями хранения исчитывания аудио данных с Audio CD. Информация на всех типах компакт-дисковхранится покадрово и каждый кадр имеет заголовок, по которому его возможноидентифицировать. Однако различные типы CD имеют различную структуру и используютразличные методы маркировки кадров. Поскольку компьютерные приводы CD-ROMрассчитаны на чтение в основном Data-CD (надо сказать, что существуют различныеразновидности стандарта Data-CD,  каждыйиз которых  дополняет основной стандартCD-DA), они часто не способны правильно «ориентироваться» на Audio CD, гдеспособ маркировки кадров отличен от Data-CD (на аудио CD кадры не имеютспециального заголовка и для определения смещения каждого кадра необходимоследить за информацией в кадре). Это означает, что если при чтении Data-CDпривод легко «ориентируется» на диске и никогда не перепутает кадры, то причтении с аудио компакт диска привод не может ориентироваться четко, что припоявлении, скажем, царапины или пыли может привести к чтению неправильного кадраи, как следствие, скачку или треску звучания. Эта же проблема (неспособностьбольшинства приводов правильно позиционироваться на CD-DA) является причинойеще одного неприятного эффекта: копирование информации с Audio CD вызываетпроблемы даже при работе с полностью сохранными дисками вследствие того, чтоправильное «ориентирование на диске» полностью зависит от  считывающего привода и не может быть четкопроконтролировано программным путем.

<span Verdana",«sans-serif»">Повсеместное распространение идальнейшее развитие уже упомянутых lossy-кодеров аудио (MP3, AAC и других)открыло широчайшие возможности распространения и хранения аудио. Современныеканалы связи уже давно п