Кодирование звуковой информации

Информатика 430 — Кодирование и обработка звуковой информации

Кодирование звуковой информации

Частота дискретизации. Для записи аналогового звука и г го преобразования в цифровую форму используется микрофон, подключенный к звуковой плате.

Качество полученного цифрового звука зависит от количества измерений уровня громкости звука в единицу времени, т. е. частоты дискретизации.

Чем большее количество измерений производится за I секунду (чем больше частота дискретизации), тем точнее «лесенка» цифрового звукового сигнала повторяет кривую диалогового сигнала.

Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.

Глубина кодирования звука. Каждой «ступеньке» присваивается определенное значение уровня громкости звука. Уровни громкости звука можно рассматривать как набор возможных состояний N, для кодирования которых необходимо определенное количество информации I, которое называется глубиной кодирования звука.

Глубина кодирования звука — это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2I. Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2I = 216 = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему — 1111111111111111.

Качество оцифрованного звука. Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука.

Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации 8000 раз в секунду, глубине дискретизации 8 битов и записи одной звуковой дорожки (режим «моно»).

Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации 48 000 раз в секунду, глубине дискретизации 16 битов и записи двух звуковых дорожек (режим «стерео»).

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла. Можно оценить информационный объем цифрового стереозвукового файла длительностью звучания 1 секунда при среднем качестве звука (16 битов, 24 000 измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в 1 секунду й умножить на 2 (стереозвук):

16 бит × 24 000 × 2 = 768 000 бит = 96 000 байт = 93,75 Кбайт.

Звуковые редакторы. Звуковые редакторы позволяют не только записывать и воспроизводить звук, но и редактировать его.

Оцифрованный звук представляется в звуковых редакторах в наглядной форме, поэтому операции копирования, перемещения и удаления частей звуковой дорожки можно легко осуществлять с помощью мыши.

Кроме того, можно накладывать звуковые дорожки друг на друга (микшировать звуки) и применять различные акустические эффекты (эхо, воспроизведение в обратном направлении и др.).

Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования. Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV или в формате со сжатием МР3.

При сохранении звука в форматах со сжатием отбрасываются «избыточные» для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью. Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном виде).

Контрольные вопросы

1. Как частота дискретизации и глубина кодирования влияют на качество цифрового звука?

Задания для самостоятельного выполнения

1. Задание с выборочным ответом. Звуковая плата производит двоичное кодирование аналогового звукового сигнала. Какое количество информации необходимо для кодирования каждого из 65 536 возможных уровней интенсивности сигнала?

1) 16 битов; 2) 256 битов; 3) 1 бит; 4) 8 битов.

2. Задание с развернутым ответом. Оценить информационный объем цифровых звуковых файлов длительностью 10 секунд при глубине кодирования и частоте дискретизации звукового сигнала, обеспечивающих минимальное и максимальное качество звука:

а) моно, 8 битов, 8000 измерений в секунду;

б) стерео, 16 битов, 48 000 измерений в секунду.

3. Задание с развернутым ответом. Определить длительность звукового файла, который уместится на дискете 3,5″ (учтите, что для хранения данных на такой дискете выделяется 2847 секторов объемом 512 байтов каждый):

а) при низком качестве звука: моно, 8 битов, 8000 измерений в секунду;

б) при высоком качестве звука: стерео, 16 битов, 48 000 измерений в секунду.

Источник: https://www.sites.google.com/site/informatika430/home/kodirovanie-i-obrabotka-zvukovoj-informacii

Кодирование звуковой информации

Кодирование звуковой информации

Из физики известно,что звук – это колебания воздуха. Еслипреобразовать звук в электрическийсигнал (например, с помощью микрофона),то видно плавно изменяющееся с течениемвремени напряжение. Для компьютернойобработки такой – аналоговый – сигналнужно каким-то образом преобразоватьв последовательность двоичных чисел.

Делается это,например, так – измеряется напряжениечерез равные промежутки времени иполученные значения записываются впамять компьютера. Этот процесс называетсядискретизацией (или оцифровкой), аустройство, выполняющее его –аналого-цифровым преобразователем(АЦП).

Чтобы воспроизвестизакодированный таким образом звук,нужно сделать обратное преобразование(для этого служит цифро-аналоговыйпреобразователь – ЦАП), а затем сгладитьполучившийся ступенчатый сигнал.

Чем выше частотадискретизации и чем больше разрядовотводится для каждого отсчета, темточнее будет представлен звук, но приэтом увеличивается и размер звуковогофайла. Поэтому в зависимости от характеразвука, требований, предъявляемых к егокачеству и объему занимаемой памяти,выбирают некоторые компромиссныезначения.

Параметрыдискретизации.

Важными параметрамидискретизации являются частота иразрядность.

Разрядностьуказывает, с какой точностью происходятизменения амплитуды аналогового сигнала.Точность, с которой при оцифровкепередается значение амплитуды сигналав каждый из моментов времени, определяеткачество сигнала после цифро-аналоговогопреобразования. Именно от разрядностизависит достоверность восстановленияформы волны.

Для кодированиязначения амплитуды используют принципдвоичного кодирования. Звуковой сигналдолжен быть представленным в видепоследовательности электрическихимпульсов (двоичных нулей и единиц).Обычно используют 8, 16-битное или 20-битноепредставление значений амплитуды. Придвоичном кодировании непрерывногозвукового сигнала его заменяютпоследовательностью дискретных уровнейсигнала.

Частота- количество измерений амплитудыаналогового сигнала в секунду.

В новом форматекомпакт-дисков Audio DVD за одну секундусигнал измеряется 96 000 раз, т.е. применяютчастотудискретизации96 кГц. Для экономии места на жесткомдиске в мультимедийных приложенияхдовольно часто применяют меньшиечастоты: 11, 22, 32 кГц. Это приводит куменьшению слышимого диапазона частот,а, значит, происходит сильное искажениетого, что слышно.

От частотыдискретизации (количества измеренийуровня сигнала в единицу времени) зависиткачество кодирования. С увеличениемчастоты дискретизации увеличиваетсяточность двоичного представленияинформации.

При частоте 8 кГц (количествоизмерений в секунду 8000) качествооцифрованного звукового сигналасоответствует качеству радиотрансляции,а при частоте 48 кГц (количество измеренийв секунду 48000) — качеству звучания аудио-CD.

В современныхпреобразователях принято использовать20-битное кодирование сигнала, чтопозволяет получать высококачественнуюоцифровку звука.

Вспомним формулуК = 2a. Здесь К — количество всевозможныхзвуков (количество различных уровнейсигнала или состояний), которые можнополучить при помощи кодирования звукаа битами

аКПрименение
8256Недостаточно для достоверного восстановления исходного сигнала, так как будут большие нелинейные искажения. Применяют в основном в мультимедийных приложениях, где не требуется высокое качество звука
1665536Используется при записи компакт-дисков, так как нелинейные искажения сводятся к минимуму.
201048576Где требуется высококачественная оцифровка звука.

Описанный способкодирования звуковой информациидостаточно универсален, он позволяетпредставить любой звук и преобразовыватьего самыми разными способами. Но бываютслучаи, когда выгодней действоватьпо-иному.

Издавна используетсядовольно компактный способ представлениямузыки – нотная запись. В ней специальнымисимволами указывается, какой высотызвук, на каком инструменте и как сыграть.

Фактически, ее можно считать алгоритмомдля музыканта, записанным на особомформальном языке.

В 1983 ведущие производителикомпьютеров и музыкальных синтезаторовразработали стандарт, определившийтакую систему кодов. Он получил названиеMIDI.

Конечно, такаясистема кодирования позволяет записатьдалеко не всякий звук, она годится толькодля инструментальной музыки. Но есть унее и неоспоримые преимущества:чрезвычайно компактная запись,естественность для музыканта (практическилюбой MIDI-редакторпозволяет работать с музыкой в видеобычных нот), легкость замены инструментов,изменения темпа и тональности мелодии.

Есть и другие,чисто компьютерные, форматы записимузыки. Среди них – формат MP3,позволяющий с очень большим качествоми степенью сжатия кодировать музыку,при этом вместо 18–20 музыкальныхкомпозиций на стандартном компакт-диске(CDROM)помещается около 200. Одна песня занимает,примерно, 3,5 Mb,что позволяет пользователям сетиИнтернет легко обмениваться музыкальнымикомпозициями.

Задачи покодированию текста.

1. Два текстасодержат одинаковое количество символов.Первый текст записан на русском языке,а второй на языке племени нагури, алфавиткоторого состоит из 16 символов. Чейтекст несет большее количество информации?

Решение.

I = К * а (информационныйобъем текста равен произведению числасимволов на информационный вес одногосимвола).

Т.к. оба текстаимеют одинаковое число символов (К), торазница зависит от информативностиодного символа алфавита (а).

2а1= 32, т.е. а1 = 5 бит,

2а2= 16, т.е. а2 = 4 бит.

I1 = К * 5 бит, I2 = К *4 бит.

Значит, текст,записанный на русском языке в 5/4 разанесет больше информации.

2. Объем сообщения,содержащего 2048 символов, составил 1/512часть Мбайта. Определить мощностьалфавита.

Решение.

I = 1/512 * 1024 * 1024 * 8 =16384 бит. — перевели в биты информационныйобъем сообщения.

а = I / К = 16384 / 2048 = 8бит — приходится на один символ алфавита.

28= 256 символов — мощность использованногоалфавита.

Именно такойалфавит используется в кодировке ASCII.

Задачи покодированию изображения.

1. Сколько биттребуется, чтобы закодировать информациюо 130 оттенках?

Нетрудно подсчитать,что 8 (то есть 1 байт), поскольку при помощи7 бит можно сохранить номер оттенка о 0до 127, а 8 бит хранят от 0 до 255. Легковидеть, что такой способ кодированиянеоптимален: 130 заметно меньше 255.

2. Известно, чтовидеопамять компьютера имеет объем 512Кбайт. Разрешающая способность экрана640 на 200. Сколько страниц экрана одновременноразместится в видеопамяти при палитре

а) из 8 цветов;

б) 16 цветов;

в) 256 цветов?

3. В режиме True Colorна хранение кода каждого пикселяотводится:

16 бит;

16 байт;

24 бита.

4. Минимальнойединицей измерения графическогоизображения на экране монитора является:

mm;

sm;

pixel;

inch.

5. Растровыйграфический файл содержит черно-белоеизображение (без градаций серого)размером 100х100 точек. Какой объем памятитребуется для хранения этого файла?

1000 бит;

10000 бит;

10000 байт.

6. Растровый файл,содержащий черно-белый (без оттенковсерого) квадратный рисунок, имеет объем200 байт. Рассчитайте размер стороныквадрата (в пикселях).

15;

40;

1000.

7. Объем изображения,размером 40х50 пикселей, составляет 2000байт. Изображение использует:

8 цветов;

256 цветов;

16777216 цветов.

8. Известно, чтовидеопамять компьютера имеет объем 512Кбайт. Разрешающая способность экрана640 на 200 пикселей. Сколько страниц экранаодновременно разместится в видеопамятипри палитре:

из 8 цветов;

16 цветов;

256 цветов?

Задачи покодированию звука.

1. Подсчитать,сколько места будет занимать одна минутацифрового звука на жестком диске илилюбом другом цифровом носителе,записанного с частотой

а) 44.1 кГц;

б) 11 кГц;

в) 22 кГц;

г) 32 кГц

и разрядностью16 бит.

Решение.

а) Если записываютмоносигнал с частотой 44.1 кГц, разрядностью16 бит (2 байта), то каждую минутуаналого-цифровой преобразователь будетвыдавать 44100 * 2 * 60 = 529000 байт (примерно 5Мб) данных об амплитуде аналоговогосигнала, который в компьютере записываютсяна жесткий диск.

Если записываютстереосигнал, то 1058000 байт (около 10 Мб)

б) для частот 11,22, 32 кГц расчеты производятся аналогично.

2. Какой информационныйобъем имеет моноаудиофайл, длительностьзвучания которого 1 секунда, при среднемкачестве звука (16 бит, 24 кГц)?

Решение.

16 бит * 24000 = 384000 бит= 48000 байт = 47 кБайт

3. Рассчитайтеобъем стереоаудиофайладлительностью 20 секунд при 20-битномкодировании и частоте дискретизации44.1 кГц.

Решение.

20 бит * 20 * 44100 * 2 =35280000 бит = 4410000 байт = 4.41 Мб

Источник: https://studfile.net/preview/2893954/page:4/

Представление звуковой информации в компьютере — урок. Информатика, 10 класс

Кодирование звуковой информации

Звук представляет собой непрерывный сигнал — звуковую волну с меняющейся амплитудой и частотой.

Чем больше амплитуда сигнала, тем он громче для человека.

Чем больше частота сигнала, тем выше тон.

Частота звуковой волны выражается числом колебаний в секунду и измеряется в герцах (Гц, Hz).

Человеческое ухо способно воспринимать звуки в диапазоне от \(20\) Гц до \(20\) кГц, который называют звуковым.

Количество бит, отводимое на один звуковой сигнал, называют глубиной кодирования звука.

Современные звуковые карты обеспечивают \(16\)-, \(32\)- или \(64\)-битную глубину кодирования звука.

При кодировании звуковой информации непрерывный сигнал заменяется дискретным, то есть превращается в последовательность электрических импульсов (двоичных нулей и единиц).

Процесс перевода звуковых сигналов от непрерывной формы представления к дискретной, цифровой форме называют оцифровкой.

Важной характеристикой при кодировании звука является частота дискретизации — количество измерений уровней сигнала за \(1 \)секунду:

— \(1\) (одно) измерение в секунду соответствует частоте \(1\) Гц;

— \(1000\) измерений в секунду соответствует частоте \(1\) кГц.

Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Количество измерений может лежать в диапазоне от \(8\) кГц до \(48\) кГц (от частоты радиотрансляции до частоты, соответствующей качеству звучания музыкальных носителей).

Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука.

Самое низкое качество оцифрованного звука, соответствующее качеству телефонной связи, получается при частоте дискретизации \(8000\) раз в секунду, глубине дискретизации \(8\) битов и записи одной звуковой дорожки (режим «моно»).

Самое высокое качество оцифрованного звука, соответствующее качеству аудио-CD, достигается при частоте дискретизации \(48 000 \)раз в секунду, глубине дискретизации \(16\) битов и записи двух звуковых дорожек (режим «стерео»).

Необходимо помнить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Оценить информационный объём моноаудиофайла (\(V\)) можно следующим образом: V = N⋅f⋅k, где \(N\) — общая длительность звучания (секунд), \(f\) — частота дискретизации (Гц), \(k\) — глубина кодирования (бит).

Например, при длительности звучания \(1\) минуту и среднем качестве звука (\(16\) бит, \(24\) кГц):

V = 60⋅24000⋅16 бит = 23040000 бит = 2880000 байт = 2812,5 Кбайт = 2,75 Мбайт.

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Например, оценим информационный объём цифрового стереозвукового файла длительностью звучания \(1 \)секунда при среднем качестве звука (\(16\) битов, \(24 000\) измерений в секунду). Для этого глубину кодирования необходимо умножить на количество измерений в \(1 \)секунду и умножить на \(2\) (стереозвук):

V=16 бит ⋅24000⋅2 = 768000 бит = 96000 байт = 93,75 Кбайт.

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых можно выделить два основных направления: метод FM и метод Wave-Table.

Метод FM (Frequency Modulation) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых представляет собой правильную синусоиду, и, следовательно, может быть описан кодом. Разложение звуковых сигналов в гармонические ряды и представление в виде дискретных цифровых сигналов выполняют специальные устройства — аналогово-цифровые преобразователи (АЦП).

Преобразование звукового сигнала в дискретный сигнал: a — звуковой сигнал на входе АЦП; б — дискретный сигнал на выходе АЦП.

Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука представлен на рис. ниже. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.

Преобразование дискретного сигнала в звуковой сигнал: а — дискретный сигнал на входе ЦАП; б — звуковой сигнал на выходе ЦАП.

Таблично-волновой метод (Wave-Table) основан на том, что в заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и т. д.

Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука.

Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) — один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

Источник: https://www.yaklass.ru/p/informatika/10-klass/informatciia-i-informatcionnye-protcessy-11955/predstavlenie-nechislovoi-informatcii-v-kompiutere-12433/re-b2f76748-2c67-4268-8bc3-c1227079274c

Кодирование и обработка звуковой информации

Кодирование звуковой информации

Цель урока: изучение принципов кодирования звуковой информации.

Задачи урока:

Образовательные:

объяснить различие между аналоговым и цифровым звуком;

познакомить с принципами кодирования звуковой информации;

сформировать представление о зависимости качества цифрового звука от частоты дискретизации и глубины кодирования звука;

сформировать умения нахождения объема звуковой информации;

сформировать навыки записи, редактирования и сохранения звука с нужным качеством.

Развивающая:

развивать мышление, память, внимательность, навыки использования прикладного программного обеспечения.

Воспитательная:

воспитывать дисциплинированность, самостоятельность, информационную культуру.

Оборудование:

Рабочее место учителя: компьютер, проектор, экран, микрофон, колонки.

Рабочее место ученика: компьютер, наушники с микрофоном.

Программное обеспечение: ОС Microsoft Windows XP, приложение Microsoft PowerPoint, компьютерная презентация «Кодирование звуковой информации», стандартное приложение «Звукозапись».

План урока:

Организационный момент (3 мин)

Актуализация знаний (3 мин)

Изучение нового материала (20 мин)

Рефлексия, тестирование (7 мин)

Практическая работа (10 мин)

Домашнее задание (1 мин)

Подведение итогов урока (1 мин)

Примечание: В зависимости от уровня класса и при наличии возможности, желательно разделить этот материал на два урока.

Ход урока

I. Организационный момент (3 мин)

Приветствие, проверка присутствующих, объявление темы (слайд 1).

Сегодня мы продолжим изучать, как различная информация представляется в компьютере. Вы все наверняка любите слушать музыку. А знаете ли вы … (слайд 2).

Что такое звук?

Как раньше хранили звуковую информацию?

Какие носители звуковой информации используются сейчас?

От чего зависит качество звука?

На сегодняшнем уроке мы попробуем ответить на эти вопросы.

Для этого нам надо решить следующие задачи (слайд 3):

понять различие между аналоговым и цифровым звуком;

познакомиться с принципами кодирования звуковой информации;

определить, от каких параметров зависит качество цифрового звука;

научиться находить объем звуковой информации;

сформировать навыки записи, редактирования и сохранения звука с нужным качеством.

II. Актуализация знаний (3 мин)

Принципы кодирования звуковой информации очень схожи с принципами кодирования графической информации, которые мы изучили недавно. Давайте вспомним их (слайд 4).

Фронтальная беседа по вопросам:

В каком виде должна быть представлена информация, чтобы её можно было обрабатывать при помощи компьютера?

 Что такое дискретизация?

 Приведите примеры представления информации в непрерывной (аналоговой) и в дискретной форме.

 Что такое разрешение графического изображения?

 Что такое глубина цвета?

Итак. При аналоговом представлении информации физическая величина изменяется плавно и непрерывно, принимая при этом бесконечное множество значений (слайд 5). При дискретном представлении информации физическая величина изменяется скачкообразно, принимая при этом конечное множество значений (слайд 6). Дискретизация – это преобразование аналоговой формы информации в набор дискретных значений.

III. Изучение нового материала (20 мин)

(Слайд 7). Немного физики. Звук представляет собой распространяющуюся в воздухе, воде или другой среде волну непрерывно меняющейся интенсивностью и частотой.

Человек воспринимает звуковые волны (колебания воздуха) с помощью слуха в форме звука различных громкости и тона. Чем больше интенсивность (амплитуда) звуковой волны, тем громче звук (слайд 8) (игрушечная дудочка – труба). Чем больше частота колебаний, тем выше тон звука (слайд 9) (скрипка – контрабас).

(Слайд 10). Человеческое ухо воспринимает звук с частотой от 20 колебаний в секунду (низкий звук) до 20 000 колебаний в секунду (высокий звук). Частота измеряется в герцах (1 Гц – одно колебание в секунду).

Диапазон амплитуд, в котором человек может воспринимать звук, очень большой. Для измерения громкости звука применяется специальная единица «децибел» (дБ). Изменение громкости звука на 20 дБ соответствует изменению давления, создаваемого звуковой волной, в 10 раз.

Может ли компьютер обрабатывать аналоговый звук?

Что нужно сделать, чтобы звук можно было обработать с помощью компьютера?

(Слайд 11). Чтобы компьютер смог обрабатывать звук, необходимо аналоговый (непрерывный) звуковой сигнал преобразовать в последовательность электрических импульсов (двоичных нулей и единиц).

Для этого в компьютере имеется звуковая карта (аудио-адаптер).

Колебания звуковой волны преобразуются микрофоном в электрические колебания, которые с помощью аналого-цифрового преобразователя (АЦП) преобразуется в дискретный сигнал, сохраняемый в памяти компьютера в виде двоичного кода.

При воспроизведении звука происходит обратный процесс. Цифро-аналоговый преобразователь (ЦАП) преобразует дискретные сигналы в аналоговые электрические колебания, воспроизводимые акустической системой в виде звуковых волн.

(Слайд 12). Процесс преобразования непрерывного звукового сигнала в дискретный называется оцифровкой звука (временнóй дискретизацией).

В звуковой карте непрерывный сигнал измеряется через небольшие равные промежутки времени. Каждое измеренное значение сигнала кодируется двоичным кодом и остается неизменным до следующего измерения. В результате плавный непрерывный сигнал заменяется на ряд дискретных значений, кривая становится ступенчатой, т. е. происходит искажение информации.

От чего будет зависеть качество оцифрованного звука?

(Слайд 13). Искажения сигнала можно уменьшить, если измерять уровень звукового сигнала чаще или увеличить количество возможных дискретных значений сигнала (использовать более длинный двоичный код).

Сколько различных уровней амплитуды звука можно закодировать 4 битами?

(Слайд 14). Частота дискретизации звука – это количество измерений громкости звука за 1 секунду. Измеряется в герцах (Гц). 1 Гц = 1/сек. (одно измерение в секунду).

На практике применяют значения частоты дискретизации от 8000 Гц (8 кГц) до 48000 Гц (48 кГц),  что соответствует изменению качества звука от качества телефонной связи до качества аудио-CD.

(Слайд 15). Глубина кодирования звука (разрядность дискретизации) – это длина двоичного кода, используемого для кодирования каждого измеренного дискретного уровня громкости звука. От глубины кодирования зависит количество дискретных значений сигнала от нуля до максимума.

N = 2i, где N – количество дискретных уровней звука, i – глубина кодирования (бит).

Обычно звуковые карты могут использовать только два значения глубины кодирования:

8 бит (28=256 уровней)

16 бит (216=65536 уровней)

Какие параметры аналогичны частоте дискретизации и глубине кодирования звука при кодировании графики?

(Слайд 16). Демонстрация качества звука при различных значениях частоты дискретизации и глубины кодирования на заранее подготовленных примерах. Обращается внимание учащихся на объемы соответствующих файлов.

(Слайд 17). Из примеров мы увидели, что с увеличением качества звука растет информационный объем файла.

В каких случаях важно уметь рассчитывать объем звукового файла?

Как же его рассчитать?

I – объем звукового файла (бит);

F – частота дискретизации (Гц);

i – глубина кодирования звука (бит);

t – время звучания (сек);

k – количество каналов в записи (k = 1 – моно, k = 2 – стерео).

При записи в режиме «стерео» используются 2 микрофона, хранятся 2 независимых звуковых канала, воспроизводятся 2 акустическими колонками. Это дает возможность слышать «объемный» звук. При этом объем файла будет в 2 раза больше.

Вывод: Чем выше качество звука, тем больше объём файла!

(Слайд 18). Пример задачи:

Определить объём высококачественного звукового файла со следующими параметрами: частота дискретизации 48 кГц, глубина кодирования 16 бит, время звучания 10 секунд, стерео.

Решение – смотрите документ

(Слайд 19). Оцифрованный звук можно сохранять как с полным качеством, так и в форматах со сжатием, при этом информационный объем файлов уменьшается за счет уменьшения качества звука. Наиболее популярные форматы звуковых файлов:

WAV (Waveform audio format) – без сжатия, можно выбрать частоту дискретизации и глубину кодирования для уменьшения размера файла.

MP3 (MPEG-1 Audio Layer 3) – сжатие с потерей информации.

WMA (Windows Media Audio) – потоковый звук, сжатие с потерей информации.

Например, те же 10 секунд стереозвука в формате MP3 (битрейт 96 Кбит/с ) будут занимать всего 117 Кбайт.

(Слайд 20). Решим ещё одну задачу:

Сколько минут высококачественного звука можно записать на CD диск
(частота дискретизации 44,1 кГц, глубина кодирования 16 бит, стерео).

Решение – смотрите документ

Почему на диске MP3 в несколько раз больше?

IV. Рефлексия, тестирование (7 мин)

Давайте еще раз попробуем ответить на вопросы, поставленные в начале урока (слайд 21):

Что такое звук?

Как раньше хранили звуковую информацию?

Какие носители звуковой информации используются сейчас?

От чего зависит качество звука?

Для закрепления изученного материала ученикам предлагается сесть за компьютеры и выполнить небольшой тест в форме веб-страницы (файл код_звука.htm). Тест создан с помощью программного комплекса NetTest v2.8 (К.Поляков, kpolyakov.spb.ru).

V. Практическая работа (10 мин)

Для работы со звуком используется специальное программное обеспечение. Чтобы прослушивать звуковые файлы, нужны звуковые проигрыватели. Например, стандартный проигрыватель Windows Media, популярный проигрыватель WinAmp и другие (слайд 22).

Звуковые редакторы позволяют записывать и редактировать звуковые файлы.

Звуковой сигнал представлен в визуальной форме, поэтому можно легко осуществлять операции копирования, перемещения, удаления звуковых фрагментов, накладывать звуковые дорожки друг на друга (микширование звука), применять различные звуковые эффекты, сохранять в различных звуковых форматах. Например, это можно сделать с помощью коммерческой программы Adobe Audition или свободно распространяемой программы Audacity (слайд 23).

Выполним небольшую практическую работу в стандартном приложении Звукозапись.

1. Откройте приложение Звукозапись (Пуск – Программы – Стандартные – Развлечения – Звукозапись) (слайд 24)

2. Откройте звуковой файл (Файл – Открыть… – Мои документы – Моя музыка – Высоцкий.wav) (слайд 25)

3. Посмотрите свойства этого файла (Файл – Свойства – Формат аудио: PCM 48 кГц; 16 бит; Стерео)  (слайд 26)

4. Сохраните файл в той же папке с новым именем и характеристиками, заданными в таблице (Файл – Сохранить как… – Изменить… – Атрибуты). Посмотрите свойства файла (пункт 3) и запишите их в таблицу (слайд 27)

5. Снова откройте исходный файл (пункт 2) и повторите пункт 4 нужное количество раз (слайд 28)

Имя файлаЧастота дискре-тизации, кГцГлубина кодиро-вания, битДлитель-ность, сРежим (моно — стерео)Объем файла, байтРассчитанный объем файла, байт
Высоцкий481610стерео1920438
Высоцкий 48-8-с48810стерео
Высоцкий 24-8-м24810моно
Высоцкий 8-8-м8810моно

VI. Домашнее задание (1 мин) (слайд 29)

1) Учебник Босовой Л.Л. §5.1.3; учебник Угриновича Н.Д. § 1.5.

2) Рассчитать объёмы файлов, полученные в практической работе. Сравнить с реальным объёмом.

VII. Подведение итогов урока (1 мин) (слайд 30)

Решены ли поставленные задачи?

понять различие между аналоговым и цифровым звуком;

познакомиться с принципами кодирования звуковой информации;

определить, от каких параметров зависит качество цифрового звука;

научиться находить объем звуковой информации;

сформировать навыки записи, редактирования и сохранения звука с нужным качеством.

Источник: https://videouroki.net/razrabotki/kodirovanie-i-obrabotka-zvukovoy-informatsii.html

Кодирование звуковой информации. Подготовка к ЕГЭ

Кодирование звуковой информации

Цель. Осмыслить процесс преобразования звуковой информации, усвоить понятия необходимые для подсчета объема звуковой информации. Научиться решать задачи по теме.

Цель-мотивация. Подготовка к ЕГЭ.

План урока

1. Просмотр презентации по теме с ми учителя. Приложение 1

Материал презентации: Кодирование звуковой информации.

С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.

Процесс преобразования звуковых волн в двоичный код в памяти компьютера:

Процесс воспроизведения звуковой информации, сохраненной в памяти ЭВМ:

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота сигнала, тем выше тон.

Программное обеспечение компьютера в настоящее время позволяет непрерывный звуковой сигнал преобразовывать в последовательность электрических импульсов, которые можно представить в двоичной форме. В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация.

Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек».Каждой «ступеньке» присваивается значение уровня громкости звука, его код(1, 2, 3 и так

далее). Уровни громкости звука можно рассматривать как набор  возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.

адаптер (звуковая плата) — специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем полученный код из регистра переписывается в оперативную память компьютера. Качество компьютерного звука определяется характеристиками аудиоадаптера:

  • Частотой дискретизации
  • Разрядностью(глубина звука).

Частота временной дискретизации

— это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц). Характерные частоты дискретизации аудиоадаптеров:

11 кГц, 22 кГц, 44,1 кГц и др.

Разрядность регистра  (глубина звука) число бит в регистре аудиоадаптера, задает количество возможных уровней звука.

Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно.

Если разрядность равна 8 (16) , то при измерении входного сигнала может быть получено 28= 256 (216=65536) различных значений. Очевидно, 16 разрядный аудиоадаптер точнее кодирует и воспроизводит звук, чем 8-разрядный. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука.

Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:

N = 2I = 216 = 65536, где I — глубина звука.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код.

При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты  дискретизации.

Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации тем точнее процедура двоичного кодирования.

Звуковой файл — файл, хранящий звуковую информацию в числовой двоичной форме.

2. Повторяем единицы измерения информации

1 байт = 8 бит

1 Кбайт = 210 байт=1024 байт

1 Мбайт = 210 Кбайт=1024 Кбайт

1 Гбайт = 210 Мбайт=1024 Мбайт

1 Тбайт = 210 Гбайт=1024 Гбайт

1 Пбайт = 210 Тбайт=1024 Тбайт

3. Закрепить изученный материал, просмотрев презентацию, учебник [1]

4. Решение задач

Учебник [1], показ решения на презентации.

Задача 1. Определить информационный объем стерео аудио файла длительностью звучания 1 секунда при высоком качестве звука(16 битов, 48 кГц).

Запись условияT=1 секI=16 битH= 48 кГцСтерео — ×2V=?РешениеV= T ×I × H × 2V=1 ×16 × 48 000 × 2=1536000 бит/8  =192000 байт/1024 = 187,5 Кбайт

Задача (самостоятельно). Учебник [1], показ решения на презентации.
Определить информационный объем цифрового  аудио файла длительностью звучания которого составляет 10 секунда при частоте дискретизации 22,05 кГц и разрешении 8 битов.

Запись условияT=10 секI=8 битH= 22,05 кГцМоно- ×1V=?РешениеV= T ×I × H × 1V=10 ×8 × 22,05 × 1=10 × 8 × 22 050 бит/8  = 220500 байт/1024 = 215,332/1024 Кбайт = 0,21 Мбайт

5. Закрепление.  Решение задач дома, самостоятельно на следующем уроке

Учебник [1]

№ 90

Определить объем памяти для хранения цифрового аудио­файла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 битов.

Запись условияT=2 минI= 16 битH= 44,1 кГцМоно- ×1V=?РешениеV= T ×I × H × 2V=2×60 ×16 × 44,1 × 1=(120 × 16 × 44 010) бит  = 84672000 бит/8= 10584000байт/1024 = 10335,9375 Кбайт/1024  = 10,09 Мбайт

№ 91

В распоряжении пользователя имеется память объемом 2,6 Мб. Необходимо записать цифровой аудиофайл с длительностью звучания 1 минута. Какой должна быть частота дискретиза­ции и разрядность?

Запись условияV=2,6 Мб T=1 мин Моно- ×1I= ?H= ?РешениеV= T ×I × H × 1; I × H= V /  TI × H= 2,6 Мб/1 мин. = 2,6×1024×1024×8 бит/ 60 сек=21810380,8/60=363506,237363506,237/8=45438,3363506,237/16=22719,15Ответ.Если I=8 ,бит, то H=44,1 кГц.Если I=16 бит, то H=22,05 кГц.

№ 92

Объем свободной памяти на диске — 5,25 Мб, разрядность звуковой платы — 16. Какова длительность звучания цифро­вого аудиофайла, записанного с частотой дискретизации 22,05 кГц?

№ 93

Одна минута записи цифрового аудиофайла занимает на дис­ке 1,3 Мб, разрядность звуковой платы — 8. С какой частотой дискретизации записан звук?

№ 94

Какой объем памяти требуется для хранения цифрового аудиофайла с записью звука высокого качества при условии, что время звучания составляет 3 минуты?

№ 95

Цифровой аудиофайл содержит запись звука низкого качест­ва (звук мрачный и приглушенный). Какова длительность звучания файла, если его объем составляет 650 Кб?

№ 96

Две минуты записи цифрового аудиофайла занимают на дис­ке 5,05 Мб. Частота дискретизации — 22 050 Гц. Какова раз­рядность аудиоадаптера?

№ 97

Объем свободной памяти на диске — 0,1 Гб, разрядность зву­ковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44 100 Гц?

Ответы

№ 92. 124,8 секунды.

№ 93. 22,05 кГц.

№ 94. Высокое качество звучания достигается при частоте дискретизации 44,1 кГц и разрядности аудиоадаптера, равной 16. Требуемый объем памяти — 15,1 Мб.

№ 95. Для мрачного и приглушенного звука характерны следующие параметры: частота дискретизации — 11 кГц, разрядность аудиоадаптера — 8. Длительность звучания равна 60,5 с.

№ 96. 16 битов.

№ 97. 20,3 минуты.

Литература

1. Учебник: Информатика, задачник-практикум 1 том, под редакцией И.Г.Семакина, Е.К. Хеннера )

2. Фестиваль педагогических идей «Открытый урок»Звук. Двоичное кодирование звуковой информации. Супрягина Елена Александровна, учитель информатики.

3. Н. Угринович. Информатика и информационные технологии. 10-11 классы. Москва. Бином. Лаборатория знаний 2003.

1.07.2009

Источник: https://urok.1sept.ru/%D1%81%D1%82%D0%B0%D1%82%D1%8C%D0%B8/533964/

Частота дискретизации звука

Одной из важных характеристик процесса кодирования звука является частота дискретизации, которая представляет собой количество измерений уровня сигнала за $1$ секунду:

Ничего непонятно?

Попробуй обратиться за помощью к преподавателям

  • одно измерение в одну секунду соответствует частоте $1$ гигагерц (ГГц);
  • $1000$ измерений в одну секунду соответствует частоте $1$ килогерц (кГц) .

Определение 2

Частота дискретизации звука — это количество измерений громкости звука за одну секунду.

Количество измерений может находиться в диапазоне от $8$ кГц до $48$ кГц, причем первая величина соответствует частоте радиотрансляции, а вторая — качеству звучания музыкальных носителей.

Замечание 1

Чем выше частота и глубина дискретизации звука, тем более качественно будет звучать оцифрованный звук.

Самое низкое качество оцифрованного звука, которое соответствует качеству телефонной связи, получается, когда частота дискретизации равна 8000 раз в секунду, глубина дискретизации $8$ битов, что соответствует записи одной звуковой дорожки (режим «моно»).

Самое высокое качество оцифрованного звука, которое соответствует качеству аудио-CD, достигается, когда частота дискретизации равна $48000$ раз в секунду, глубина дискретизации $16$ битов, что соответствует записи двух звуковых дорожек (режим «стерео»).

Информационный объем звукового файла

Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла.

Оценим информационный объём моноаудиофайла ($V$), это можно сделать, используя формулу:

$V = N \cdot f \cdot k$,

где $N$ — общая длительность звучания, выражаемая в секундах,

$f$ — частота дискретизации (Гц),

$k$ — глубина кодирования (бит).

Пример 1

Например, если длительность звучания равна $1$ минуте и имеем среднее качество звука, при котором частота дискретизации $24$ кГц, а глубина кодирования $16$ бит, то:

$V=60 \cdot 24000 \cdot 16 \ бит=23040000 \ бит=2880000 \ байт = 2812,5 \ Кбайт=2,75 \ Мбайт.$

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Пример 2

Например, оценим информационный объём цифрового стереозвукового файла, у котрого длительность звучания равна $1$ секунде при среднем качестве звука ($16$ битов, $24000$ измерений в секунду). Для этого глубину кодирования умножим на количество измерений в $1$ секунду и умножить на $2$ (стереозвук):

$V=16 \ бит \cdot 24000 \cdot 2 = 768000 \ бит = 96000 \ байт = 93,75 \ Кбайт.$

Основные методы кодирования звуковой информации

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых выделяют два основных направления: метод FM и метод Wave-Table.

Метод FM (Frequency Modulation) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых будет представлять собой правильную синусоиду, а это значит, что его можно описать кодом. Процесс разложения звуковых сигналов в гармонические ряды и их представление в виде дискретных цифровых сигналов происходит в специальных устройствах, которые называют «аналогово-цифровые преобразователи» (АЦП).

Рисунок 2. Преобразование звукового сигнала в дискретный сигнал

На рисунке 2а изображен звуковой сигнал на входе АЦП, а на рисунке 2б изображен уже преобразованный дискретный сигнал на выходе АЦП.

Для обратного преобразования при воспроизведении звука, который представлен в виде числового кода, используют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука изображен на рис. 3. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.

Рисунок 3. Преобразование дискретного сигнала в звуковой сигнал

На рисунке 3а представлен дискретный сигнал, который мы имеем на входе ЦАП, а на рисунке 3б представлен звуковой сигнал на выходе ЦАП.

Таблично-волновой метод (Wave-Table) основан на том, что в заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и т. д.

Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука.

Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Примеры форматов звуковых файлов

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) — один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

Источник: https://spravochnick.ru/informatika/kodirovanie_informacii/kodirovanie_zvukovoy_informacii/

Booksm
Добавить комментарий