Почему при оцифровке звука редко используют частоты выше 44 кгц?

13 ответов на вопрос “Почему при оцифровке звука редко используют частоты выше 44 кгц?”

  1. edik7791 Ответить

    Частота 44.1 кГц возникла в конце 1970-х, благодаря PCM адаптерам, которые записывали звук на видеокассеты (U-Matic), в частности Sony PCM-1600 (1979) и последующим моделям серии. Позже это стало основой для CD-DA, описанного в стандарте Red Book (1980). В дальнейшем это значение частоты также было включено в другие стандарты 90-х/2000-x годов, вроде DVD, HDMI. Данная частота обычно используется при кодировании в MP3 (и другие потребительские форматы аудио) звука, извлеченного из Audio CD.

    Почему 44.1 кГц?

    Частота дискретизации была выбрана в ходе дебатов между разработчиками, в особенности Sony и Philips, а также благодаря компании Sony, которая в результате активного использования этой частоты практически сделала её стандартом де-факто. Само собой, выбор имел определенное техническое обоснование.

    Человеческий слух и обработка сигналов

    Прежде всего, так как слышимый диапазон для человеческого уха лежит в пределе 20—20000 Гц, а по теореме Котельникова частота семплирования должна быть как минимум в два раза больше максимальной частоты, которую может потребоваться передать, частота семплирования должна быть более 40 кГц. Кроме того, сигнал перед семплированием должен пройти через НЧ фильтр (иначе возникнет алиасинг) и, в то время как идеальный НЧ фильтр абсолютно не пропускал бы частоты выше 20 кГц, но полностью бы пропускал всё что ниже 20 кГц, на практике необходима т.н. переходная полоса, в которой происходит спад АЧХ (частотные составляющие подавляются лишь частично). Чем шире эта полоса, тем проще (и экономнее) создать антиалиазинговый фильтр. Частота 44.1 кГц обеспечивает переходную полосу шириной 2.05 кГц.

    Запись на видео оборудовании

    В ранние годы цифровой звук записывался на пленку видеокассет, т.к. это был единственный доступный носитель с ёмкостью достаточной для более-менее продолжительной записи звука (фактически видеокассеты представляли собой транспорт; этот формат был назван «псевдо-видео»). Чтобы свести к минимуму необходимые модификации оборудования, аудио воспроизводилось на той же скорости, что и видео; также использовалась практически идентичная схемотехника. Частота 44.1 кГц была признана наибольшей доступной, при условии выполнения следующих требований:
    Совместимость как с PAL, так и с NTSC видео. Проще всего, если для каждого поля используется одинаковое количество линий. NTSC имеет частоту смены полей 60 Гц, а PAL — 50 Гц, их наименьшее общее кратное равно 300 Гц. Так как используется 3 семпла на линию, частота дискретизации должна быть кратна 900 Гц. Для NTSC частота дискретизации равна 5m × 60 × 3, где 5m — количество активных линий поля (должно быть кратно пяти). Для PAL частота дискретизации равна 6n × 50 × 3, где 6n — также количество активных линий поля (должно быть кратно шести). Частоты дискретизации, удовлетворяющие вышеописанным требованиям, лежат в пределах от 40 кГц (возможность кодировать сигналы с частотой до 20 кГц) до 46.875 кГц (не более трех семплов на линию для PAL). Таким образом, возможные значения: 40.5, 41.4, 42.3, 43.2, 44.1, 45, 45.9, и 46.8 кГц. Первые значения отбрасываются в соответствии с требованиями к переходной полосе ФНЧ фильтра, последние исключены из-за наличия определенных линий, необходимых для обратного хода луча. Наибольшей возможной частотой оказалась 44.1 кГц, которая и была выбрана.
    Кодирование аудио с использованием не более трех семплов на линию (для одного канала). Аудио семплы записывались путем помещения на линии растра. Стандарты аналогового видео воспроизводят видео с частотой полей 60 Гц (NTSC, Северная Америка – или 60/1.001 Гц ≈ 59.94 Гц для цветного NTSC) или 50 Гц (PAL, Европа), что соответствует частоте 30 и 25 кадров/с — для чересстрочного видео каждое поле представляет лишь половину строк изображения (попеременно отображаются четные и нечетные линии). Каждое поле состоит из 625 линий для PAL и 525 линий для NTSC (хотя некоторые линии используются только для синхронизации, т.е. обратного хода луча), включая в себя половину видимых линий вертикальной развертки. Цифровые аудио семплы кодируются вдоль каждой линии, что позволяет использовать уже имеющиеся схемы синхронизации. С точки зрения видео полученный сигнал выглядит как последовательность белых/черных (или скорее серых) точек вдоль каждой линии развертки. Частота следования линий равнялась 15.625 Гц для PAL (625 × 50/2), 15.750 Гц для 60 Гц (ч/б) NTSC (525 × 60/2), и 15,750/1.001 Гц (примерно 15734.26 Гц) для 59.94 Гц (цветного) NTSC. Таким образом кодирование аудио с частотой дискретизации более 40 кГц требовало использования нескольких семплов на линию, причем 3 семплов на линию было достаточно, это позволяло получить частоту 15.625 × 3 = 46.875 кГц для PAL и 15.750 × 3 = 47.250 кГц для NTSC. К тому же преследовалась цель минимизировать количество семплов в линии, чтобы каждому семплу выделялось большее пространство, и таким образом можно было получить более высокую разрядность (16 бит вместо 14 или 12, например), а также для повышения устойчивости к ошибкам. Кроме того, на практике использовался стерео сигнал, требующий 3 × 2 = 6 семплов/линию. Как уже было сказано, некоторые из линий использовались для вертикальной синхронизации: линии относящиеся к обратному ходу луча не могли быть использованы, и таким образом максимальное количество используемых линий для NTSC составило 490 на фрейм (245 линий на поле), а для PAL — около 588 линий/фрейм (294 линии на поле).

    Математические свойства


    То есть число 44100 является квадратом произведения четырех простых чисел.

    Заключение

    Фактически, выбор частоты был темой многочисленных дебатов, в ходе которых рассматривались альтернативные значения, включая 44.100/1.001 = 44.056 кГц (в соответствии с частотой полей для цветного NTSC — 60/1.001 = 59.94 Гц), предложенное Philips. В конечном счете компания Sony взяла верх — в плане выбора как частоты (44.1 кГц), так и разрядности (16, а не 14 бит на семпл).
    Данная частота рассчитывается следующим образом:
    NTSC:
    245 × 60 × 3 = 44100
    245 активных линий/поле × 60 полей/с × 3 семпла/линию = 44100 семплов/с
    (490 активных линий на один фрейм из 525 линий всего)
    PAL:
    294 × 50 × 3 = 44100
    294 активных линий/поле × 50 полей/с × 3 семпла/линию = 44100 семплов/с
    (588 активных линий на один фрейм из 625 линий всего)
    На практике различные устройства использовали различные стандарты — к примеру, Sony PCM-1610 использовал исключительно 525/60 ч/б видео (NTSC, US).

  2. albiorix_ua Ответить

    дискретизация – для чего нужна большая частота дискретизации выше 44,1 кГц
    у меня колонки esi unik 05 – Частотный диапазон 49 Гц – 22 кГц
    звуковая карта e mu 0404 usb – Частотный диапазон 20 Гц – 20 кГц
    звуковая карта поддерживает Частоту дискретизации 44,1 кГц – 192 кГц
    читал про Частоту дискретизации – там сказано, что 44,1 кГц Частота дискретизации воспроизводит Частотный диапазон до 20 кГц, 48 кГц воспроизводит 22 кГц или 24, и так далее…
    и вот мне не понятно зачем нужна такая Частота дискретизации, если звуковая карта может передать только 20 Гц – 20 кГц…. ну и сами колонки могут якобы воспроизвести 49 Гц – 22 кГц.
    скачивал из сети HD треки с Частотой дискретизации 192 кГц якобы музыка записана с частотным диапазоном до 96 кГц ? по сравнению с обычным CD такой формат быстро утомляет долго не послушать, в сон клонит – все из за того что моя карта не умеет передавать частотный диапазон до 96 кГц и колонки не могут воспроизводить такой диапазон и от этого быстро утомляет ?
    звук такой как будто перед колонками стоит какое то препятсвие оно вроде играет, но звук он какой то не понятный приходится вслушиваться когда слушаю CD я слушаю музыку, а тут я не слушаю а вслушиваюсь и это утомляет…. CD играет помелодичнее как то и заметил бочка играет более правдоподобнее на слух чем в HD треке тут как то совсем не то не пойму что но что то явно не то,
    мб я что то не так делаю ? мб у меня звуковая карта неисправна или чтобы слушать музыку с частотой дискретизации выше 44,1 нужна аппаратура которая поддерживает частотные диапазоны выше 20 кГц ?
    помогите понять и разобраться

  3. PBKoluk Ответить

    Что такое Wave (Mp3, Ogg,MonkeyAudio etc.) частотой 44 КГц в точности сказать сможет не каждый ИТ-специалист, однако большое количество народа; заметит со знанием дела, что 22 КГц – это; маловато, 11 – совсем мало, а 8 КГц – подойдет только для записи речи. Что это за килогерцы и как они связаны с килогерцами на эквалайзере нам предстоит разобраться и понять от чего народ так тяготеет к настоящему аналоговому звуку.
    Вопрос, поставленный в начале, мог показаться наивным, ведь каждый человек, близкий к цифровой технике, знает, что аналоговые сигналы для хранения в цифровом виде необходимо конвертировать с помощью операции дискретизации. Эта операция подразумевает, во-первых, выбор глубины дискретизации, задаваемой в битах (для 16 бит диапазон звуковой амплитуды разбивается на ~65 тысяч частей, в память запишется количество этих самых частей, укладывающихся в амплитуде участка сигнала, обрабатываемого в данный момент времени). Очевидно, что чем чаще мы будем записывать информацию об амплитуде, тем точнее сможем в дальнейшем воспроизвести исходный сигнал. Частота, с которой мы будем забивать память амплитудными значениями, называется “частотой дискретизации”. Разбитие амплитуды на части научно называется “квантованием по уровню” (квант – это единица чего-либо, повторяющаяся в одинаковом виде много раз и составляющая нечто целое). Так вот, вопрос в начале был о цифре 44 килогерца, почему именно такая, а не какая-либо другая частота. Понятно, что для того, чтобы сохранить аналоговый сигнал и воспроизвести его в дальнейшем 1:1, необходимо производить оцифровку с бесконечной частотой дискретизации, что в свою очередь потребует бесконечно большой носитель информации. Получается, что удобства хранения звука в цифровом виде требует жертв в виде частичной потери информации. Переходим к самой “сладкой” части.
    Человек способен воспринимать звук частотой от вибрации до 18- 22 КГц (зависит от индивида). Казалось бы, от чего не сохранить c частотой дискретизации 20 КГц, однако, человек, знакомый с теорией обработки сигналов, услышав такое, начнет яростно вращать пальцем у виска. Мы не будем углубляться в теорию, а просто посмотрим на картинку. Будем считать, что нарисована исходная синусоида частотой 20 ГКц, квантованием по уровню пренебрежем, зеленые точки показывают, в какие моменты производился замер и оцифровка амплитуды сигнала. На нижнем графике показано, что получится при воспроизведении такого результата. Получиться постоянный ток. На втором графике нарисована ситуация с той же частотой исходного сигнала и частотой дискретизации 40 КГц. Как видно, сигнал при воспроизведении сохранил, если не форму, то хотя бы частоту. Третий рисунок представляет собой иллюстрации к интересному явлению, известному под названием «транспонирования частот». Это явление имеет место при попытке оцифровки частотой меньше частоты исходного сигнала. В результате при воспроизведении мы получим новый сигнал разностной частоты.

    Добавить масла в огонь можно следующими фактами: во-первых, в теории передачи аналоговых данных в дискретном виде многократно доказано, что нижний предел частоты дискретизации следует выбирать как максимально возможную частоту полезного сигнала, умноженную на 6 (т.е. для звука – 120 КГц, и это минимум !!!, а вообще, ошибка преобразования снизилась бы до приемлемого значения, начиная с частоты 100*20 КГц ); во-вторых при обратном преобразовании в аналоговую форму имеет место быть так называемый бесконечный спектр. В причины этого явления я бы не стал советовать влезать и сильно заинтересовавшимся, поскольку это потребует изучения теории дискретных систем, достаточно представить себе, что при воспроизведении сигнала кроме частот, близких к исходным (близким – из-за неизбежной ошибки преобразования), появляется тот же самый сигнал, но с частотой, сдвинутой в 2 раза по отношению к исходной, далее в 3 раза и так далее до бесконечности (все эти частоты появляются в каждый момент преобразования из цифровой в аналоговую форму), на практике это выражается высокочастотным свистом. Теперь, что хорошего: точность воспроизведения исходного сигнала крайне важна для управления машинами, человеческое ухо, хоть и является точным инструментом, однако оно не способно отличить звучание настоящих 20КГц от прямоугольного сигнала, прошедшего через сглаживающий фильтр; побочный высокочастотный спектр легко гаситься простейшим фильтром. Неужели получается, что 44 Кгц – это нормально? Лучше, сказать, что оцифровка 44 КГц позволяют в дальнейшем комфортно прослушивать исходный материал.
    Напрашивается следующий вопрос: чего тогда аудиофилы, как ненормальные, бегают за высокочастотными записями, за винилом и за аппаратурой, способной воспроизводить частоты в диапазоне от 4 до 80 КГц, ведь 20 Кгц отлично хватает для «комфортного воспроизведения». Аудиофилы гоняются за «живым» звуком. Не так давно, было выяснено, что хотя человек не способен осознанно воспринимать частоты выше слышимого диапазона, эти; частоты оказывают непосредственное влияние на ощущение «живости» музыки. Верхние и сверхверхние частоты живут вместе в одном пространстве, и сверхверхние частоты оказывают влияние на слышимый спектр. Именно из-за невозможности воспроизвести эти верхние частоты стандартная запись не зазвучит как живая, ведь, во-первых, аппаратура с расширенным диапазоном не является массово распространенной, а, во-вторых, когда делают студийную запись этого момента не учитывают. От куда же берутся «живенькие» звуковые материалы ? На радость аудиофилов подобные записи делаются всё чаще и чаще – это раз, а два – в звукостудиях с целью дальнейшей обработки с минимальной потерей качества исходный материал записывается в как можно более широком диапазоне, и если после мастеринга верхние частоты не порезаны с целью шумоудаления, то такая запись содержит в себе искомый свехвысокочастотный спектр. А вопрос про аналоговые носители уже, наверно, нет смысла обсуждать, они как раз обладают бесконечной частотой дискретизации и бесконечным квантованием по уровню. Плохи они потерей качества при перезаписи и порчей от времени, а самый качественный носитель из всех имеющихся – винил еще и портиться при каждом проигрывании от запилов иглы. Ситуацию могла бы решить лазерная считывающая головка, но это уже другая тема. В любом случае, проблема качественной перезаписи аналоговых носителей остается открытой.
    p.s. ради интереса посчитаем, сколько войдет НЕСЖАТОГО звука на BlueRay (HD-DVD, вероятно, загнется, хотя, кто знает) – 25 ГБайт. Берем 16 бит умножаем на 20000*100 Гц, получаем, что для хранения одной секунды в таком качестве понадобиться 4 мегабайта. На одну блюрейку влезет тогда 1,7 часа. 😉 Неплохо. Ну сожмем без потерь, от силы 5 часов. Сжимать с потерями не можем, иначе весь смысл затеи теряется. Технология объемной записи в кристаллы (~ 1 ТБайт) дает 70 часов, что уже является интересным.
    p.p.s. Итак, друзья, если вы не знаете, аудиофил вы или нет, лучше и не узнавайте, ибо погибнете в спорах с соплеменниками о том есть ли разница в звуке, передаваемом на 10 м по безуглеродистому кабелю сечением три квадрата и два квдарата. Если же вас «угораздило», то вам можно только посочувствовать, ибо действительно доступными технологии «живого» воспроизведения станут, ой, как не скоро.

  4. awarddark Ответить

    Много чего написано про ненужность частоты дискретизации 192000 Гц в звуковых файлах, предназначенных для прослушивания. Но аргументы обычно ссылаются на теоремы, для правильного понимания которых нужно довольно хорошо разбираться в математике. Но есть другой способ проверки некоторых утверждений — провести соответствующие эксперименты много раз.

    Для начала необходимо сформулировать утверждение, которое будет проверяться в дальнейшем. Если частота 192000 Гц избыточна, то должна существовать более низкая частота дискретизации, при которой происходит корректное восстановление звукового сигнала. Предположим, что это частота 44100 Гц. Если при 192000 Гц происходит корректное восстановление, и при 44100 Гц происходит корректное восстановление, то в обоих случаях результат на выходе должен быть одинаковым. Чтобы проверить это на практике, нужно дорогое оборудование, которое есть далеко не у каждого. Поэтому пойдём немного другим путём. Если в файлах 44100 Гц и 192000 Гц содержится одинаковое количество информации о звуке, то это означает, что преобразование из 192000 Гц в 44100 Гц является сжатием без потерь, следовательно, должен существовать способ восстановления из файла 44100 Гц исходного файла 192000 Гц. Вот это уже может проверить каждый на любом современном компьютере.
    В качестве исходника я выбрал музыкальный фрагмент с частотой дискретизации 192000 Гц. Если мне попался какой-то неправильный материал, в котором изначально не было чего-то важного, что должно потеряться при преобразовании из 192000 Гц в 44100 Гц, то любой желающий может проделать описанное в этой статье с любым другим файлом. Все действия будут производиться в свободном редакторе Audacity со стандартными эффектами. Все получаемые в процессе файлы будут сохраняться в формате FLAC с разрядностью 24 бит.
    Исходный файл хранится в файле «A.FLAC» и выглядит вот так:

    А вот так выглядит его спектр:

    Нас интересует только звуковая информация, поэтому ультразвук удалим с помощью эквалайзера.

    И получим такой спектр:

    Экспортируем результат в файл «B.FLAC» — именно с ним мы будем сравнивать файл, который получится в конце всех преобразований.
    Перед преобразованием частоты дискретизации убедимся, что в настройках выставлено максимальное качество:

    Далее выбираем новую частоту дискретизации проекта и его экспортируем в файл «C.FLAC»

    Затем открываем файл «C.FLAC», устанавливаем частоту дискретизации проекта 192000 Гц и экспортируем в файл «D.FLAC».
    И остался самый главный этап: открыть файлы «B.FLAC», «D.FLAC» и сравнить их:

    Посмотрим поближе:

    Разницы нет. Сравним получше — инвертируем одну из дорожек

    И сведём всё в одну дорожку:

    Тишина! Полная тишина!

    А чтобы всё же увидеть разницу, надо увеличить амплитуду на 96 дБ!

    Разница настолько тихая, что её невозможно услышать, а это значит, что при преобразовании из 192000 Гц в 44100 Гц в звуковом диапазоне информация не теряется. Вот так без глубоких познаний в математике с помощью доступного каждому программного обеспечения можно проверить достаточность частоты дискретизации 44100 Гц для хранения музыкальных файлов.

  5. cmdsh Ответить

    Разница огромная. 24 бита дают большую амплитуду звука это заметно на басах.
    192 килогерца дают гораздо более реалистичную стереокартину потому, что лучше передаются высокие частоты звука.
    И вовсе не в том дело что кто-то меломан и что-то там слышит чего не слышат простой человек. Я лично убедился в разнице этих форматов.
    Во первых учтите что найти качественный звук в формате 24 бит на 192 кгц очень трудно. Это формат так называемого блурей аудио и весит он нехило.
    Я как то задался целью и искал такие файлы. И получается так что либо есть 24 бита, но 44.1 частота то наоборот 192 но 16 бит.
    Мне таки удалось найти специальный диск с образцами 24 битной на 192 кгц музыки и там я убедился в том на сколько сильно отличается друм бас в 24 битном формате от 16 битов. Он глубже и сильнее и резче. А потом я качнул какой-то альбом стинга, с названием что-то там про лабиринт. Какая там охрененная стереокартина! Тут сразу стало понятно отличие 192 килогерц от 44.1. Источники звука на стереокартине сидели как влитые и было ощущение кайфа от прослушивания!
    Моя нехитрая аппаратура: компутер коре I5 аудиокарта асус ксонар (какая то там тыщь за 6 р модель не скажу я не дома ) колонки дефендер меркури.
    Совершенно уверенно могу сказать что разница между простым 16,bit 44.1 khz звуком и hd аудио очень существенная и совершенно очевидная. При условии что вы нашли качественный HD аудио файл.
    На простой встроенной звуковухе не тестил. И на совсем дешовых колонках тоже.
    На наушниках косс порта про за 3 тыщи разница менее очевидна хотя наушники по качеству звука резко отличаются от основной массы ширпотреба.
    Что хочу добавить. Часто аппаратура имеет встроенные вещи типа усиления баса ( та самая кнопка “субербас”) что дает эффект сходный с 24 битным басом но во первых это обман потому что 16 битная запись не содержит такой амплитуды а аппаратура только “растягивает” амплитуду и соответственно все таки красота баса немного теряется и он становится почти одинаковым на всех записях.
    Примерно такая же картина с высокими частотами – есть всякие примочки и фильтры и звуковые процессоры которые существенно улучшают на слух высокие частоты в 44.1 записи примешивая туда всякие дополнительные вещи, особенно в аппаратуре высокого уровня, но это все равно обман слуха хоть и очень качественный и изощренный.
    В итоге получается ситуация ка с mpз звуком – вродебы всена месте все слышно но ощущение как будто тебя обокрали а ты не можешь понять в чем именно и соответсвенно удовольствия от прослушивания меньше и башка трещит.
    ps человеческий мозг сложная штука и он крайне тяжело поддается всяким измерениям и тестированиям по этому на всяких слепых тестах даже опытные аудиофилы вполне могут жостко лажать по чистопсихологическим причинам это не должно никого смущать, слушайте сами и выбирайте то что вам нравится.

  6. tranyur Ответить

    смысла нет. судя по вопросу, у тебя обычная встроенная звуковуха, толку втыкать 192 кгц на ней нет.
    44-48 кгц это для неё потолок, при котором ты хоть чуток будешь отличать разницу на своей акустике.
    с хорошей дискретной аудиокартой разница будет заметна сразу. говорю не как теоретик а как человек слушающий исключительно лозлесс форматы на дискретной аудиокарте. про теорему Котельникова разводить теории не буду, любой аудиофил знает что сигнал в широком диапазоне превышающий пределы человеческого слуха звучит более достоверно, это основа основ в HI-FI.так же как дисплей воспроизводящий миллионы цветовых оттенков показывает более качественную картинку чем дисплей ограниченный 65000 цветов хотя глаз эти миллионы цветов тоже не различает.
    в общем по сабжу – 1. разница будет заметна при наличии дискретной звуковой аудиокарты ценой не менее 2500 р (читай) и соответственно хорошей акустики.
    2. при этом звуковой файл должен быть записан именно с такой частотой дискретизации, а это losless форматы -flac, wave, m4a, ape и т. д. с частотой дискретизации 96-192 кгц обычно записывают виниловые рипы.
    3.вывод звука в виндоз должен быть настроен соответствующим образом, вывод звука в аудиоплеере (только фубар 2000 и больше никто) должен быть настроен в обход виндосовского микшера, через васапи, кс, или асио/24 бит. делается это для того что бы звук шёл в чистом виде без примесей. настройка звука
    с учётом всех перечисленных моментов разница не просто будет заметна, она будет огромна. особенно заметно на концертных записях, например классики. чувствуется расстояние до виртуального источника звука и очень заметен объём всей сцены.
    можешь сам проверить виниловые рипы (надо зарегистрироваться что бы качать), даже на встроенной звуковухе разница будет заметна, если конечно вывод звука настроишь как описано мной.
    на дискретной аудиокарте звук будет отличаться от встроенной в разы.
    зы. 1. да звуковой файл в лозлесс с такой частотой дискретизации будет весить немало, для качественного воспроизведения звука хватает частоты дискретизации 48 кгц/ 16-24 бит. например песня в формате FLAC 48 кгц/24 бит будет весить примерно 30-70 мб (зависит от длительности и битрейта) .
    2. при выставлении частоты дискретизации 192 кгц на звуковухе, бывают проблемы при включении некоторых игр, особенно старых.

  7. let4uk69 Ответить

    Цифровой звук не имеет цветов, но у него есть эквиваленты черного и белого — разница между тишиной (все биты равны нулю) и максимальной громкостью (все биты равны единице). Все, что “тише” нуля, не может быть записано. Все, что звучит громче максимума, ужасно искажается. Можно увеличить громкость, но при этом станут звучать громче и тихие звуки. Диапазон уровня записи не меняется и зависит только от разрядности сэмпла. Аудиоинженеры называют это отношением “сигнал/шум” и измеряют его в децибелах (дБ). При записи компакт-дисков используются 16-разрядные “слова”, именно поэтому получается такая чистая запись с очень слабым шумом, вносимым системами записи и воспроизведения. Профессиональное записывающее оборудование часто работает с разрядностью 20 или 24 бита, чтобы гарантировать еще более чистый сигнал. Тем не менее каждый лишний разряд требует дополнительного времени процессора и места на диске.
    В окончательном варианте записи такой диапазон вам может и не понадобиться. Голивудские мюзиклы обычно имели отношение “сигнал/шум” 50 дБ, в цифровых терминах — менее 9 бит. Лучшие студийные магнитофоны десять лет назад достигали диапазона всего лишь 72 дБ — порядка 12 бит (система шумоподавления Dolby, как казалось, добавляла еще пару битов, но на самом деле сводилась лишь к сжатию с потерей качества). Поскольку в компьютерах используются 8-разрядные байты, вам придется выбирать между 8-разрядной записью (48 дБ — приблизительно столько же, сколько в средней радиопередаче на УКВ) и 16-разрядной (96 дБ, что уже переходит разумные границы).
    Если мультимедийное приложение будет проигрываться на выставке или в шумном офисе, тонкостей никто не услышит. Это подобно бликам на экране, мешающим видеть изображение. Даже шум вентилятора вашего компьютера понизит эффективную разрядность на 2 бита. Работники радиостанций понимают это (автомобиль с открытыми окнами — еще худшая среда) и стараются “загнать” свой сигнал в возможно более узкий диапазон. Для деловых и мультимедиа-применений качественная 8-разрядная звуковая дорожка более чем достаточна — если вы тщательно над ней поработали. Это может не получиться на дешевых звуковых платах. Проблема не в цифровой части, а в аналоговых схемах, используемых для дискретизации сигнала и обратного преобразования. Дешевле добавить лишний разряд данных, чем спроектировать хороший преобразователь, поэтому производители пишут на коробке “16-битовый звук”, но не говорят вам, насколько некачественны эти биты.
    Даже если ваш компьютер имеет превосходные звуковые параметры, в процессе обработки и монтажа файлов в них привносится шум. В большинстве случаев полезно записывать и редактировать звук с 16 разрядами, а окончательный вариант преобразовать в 8-разрядный формат. Это не касается частоты оцифровки. После дискретизации звука высокие частоты никуда не денутся, если вы их специально не обрежете. Большинство звуковых плат лучше всего работают на максимальных частотах, поэтому запись лучше всего произвести с дискретизацией 44,1 кГц., а затем сразу же преобразовать файл к низшей частоте.

  8. VideoAnswer Ответить

Добавить ответ

Ваш e-mail не будет опубликован. Обязательные поля помечены *