Разрядность и частота дискретизации звука какая лучше?

10 ответов на вопрос “Разрядность и частота дискретизации звука какая лучше?”

vbn76 25-02-2020 Ответить

в начале, во время аналого-цифрового преобразования
в конце, во время мастеринга
Во время мастеринга частота дискретизации и разрядность конечного трека зачастую снижаются при преобразовании в конечный цифровой формат (CD, mp3 и т. д.).
Когда это происходит, некоторая информация удаляется и заново квантуется, что ещё больше искажает звук.
Для решения этой проблемы придумано следующее…

6. Дизеринг

При конвертации 24-битного файла в 16-битный используется дизеринг, чтобы скрыть большую часть получающихся искажений…
За счёт добавления “псевдослучайного шума” в аудиосигнал.
Поскольку этот концепт тяжело визуализировать, говоря о звуке, его обычно объясняют с помощью изображений.
Вот как это работает:
Когда цветное фото конвертируют в чёрно-белое, математически высчитывается, какой цветной пиксель должен стать чёрным, а какой — белым…
Также, как высчитывается квантование сэмплов цифрового аудио.
Как видите на иллюстрации ниже, картинка “до” выглядит отстойно, не так ли?
Но благодаря дизерингу…
небольшое количество белых пикселей случайно вносятся в чёрные зоны…
небольшое количество чёрных пикселей случайно вносятся в белые зоны…
И благодаря добавлению этого “псевдослучайного шума” в изображение, картинка “после” выглядит гораздо лучше. Концепт аудиодизеринга сходен с этим.
Далее…

7. Время задержки

ОДИН БОЛЬШОЙ НЕДОСТАТОК современных цифровых студий — это задержка по времени, накапливающаяся в потоке сигналов, особенно в ЦЗРС.
Учитывая все происходящие вычисления, для того, чтобы аудиосигнал вышел из системы, требуется от нескольких миллисекунд до нескольких ДЕСЯТКОВ миллисекунд.
Задержка в 0-11 миллисекунд настолько короткая, что обычный человек её и не заметит.
При задержке в 11-22 миллисекунд вы слышите раздражающий слэпбек, короткую задержку, к которой надо какое-то время привыкать.
При задержке более 22 миллисекунд становится почти невозможно играть или петь вместе с треком.
В обычной цифровой цепочке сигналов существуют 4 стадии, влияющие на итоговое время задержки:
аналого-цифровое преобразование
буферизация ЦЗРС
задержка плагина
цифро-аналоговое преобразование
Аналого-цифровое и цифро-аналоговое преобразование — 2 самых маленьких негативных эффекта, добавляющих максимум 5 миллисекунд к задержке.
Однако…
Буфер ЦЗРС и некоторые плагины (включая “смотрящие вперёд” компрессоры и виртуальные инструменты) могут добавить 20, 30, 40 миллисекунд и даже больше.
Чтобы сохранить минимальный уровень задержки:
Отключите все ненужные плагины при записи.
Установите настройки буфера ЦЗРС так, чтобы найти наименьшее время, которое потянет ваш компьютер без лагов.
Вы обратите внимание, что время буферизации измеряется в сэмплах, а НЕ в миллисекундах. Чтобы их сконвертировать:
Поделите число сэмплов на частоту дискретизации (в кГц), чтобы определить время задержки в миллисекундах.
Например: 1024 сэмпла ÷ 44.1 кГц = 23 мс
Если вам влом заниматься математикой, просто запомните значения для 44.1 кГц:
256 сэмплов = 6 мс
512 сэмплов = 12 мс
1024 сэмпла = 24 мс
В БОЛЬШИНСТВЕ случаев эти шаги должны свести задержки к приемлемому уровню…
Но иногда, если ваше оборудование слишком старое или дешёвое, могут и не привести.
В таком случае…

Крайняя мера

Во многих бюджетных интерфейсах есть крутилка “mix” или “blend”, позволяющая соединять музыку с сессии с “живым сигналом”.
Разделяя сигнал с микрофона/гитары и посылая половину на компьютер, а половину — напрямую в наушники, можно избежать задержек, полностью обходя цепочку сигналов.
Недостаток этой техники… вы слышите живой сигнал абсолютно сухим, без эффектов.
Но есть надежда, что по мере роста производительности компьютеров это перестанет быть проблемой в ближайшем будущем.
Далее…

8. Устройства синхронизации

Когда 2 или более устройств обмениваются цифровыми данными в реальном времени…
Их внутренние часы должны быть синхронизированы, чтобы сэмплы оставались выровненными…
И не появлялись раздражающие щелчки и хлопки.
Для их синхронизации одно устройство служит “главным”, а остальные — “ведомыми”.
В простых домашних студиях главными обычно являются часы аудиоинтерфейса.
В профессиональных студиях, которым необходимы идеальная цифровая конвертация и сложный путь прохождения сигнала…
Вместо этого используется специальное отдельное устройство, известное как цифровое устройство синхронизации (также известное как word clock). По словам многих пользователей, при использовании таких устройств звук улучшается гораздо сильнее, чем можно было бы подумать.
kizilheadhunter 25-02-2020 Ответить

Блогер Archimago немало сил потратил, чтобы ответить на вопрос: какое качество звука человек способен определять на слух? В рамках одного из его последних аудиотестов респондентов просят вслепую различить звуки с динамическим диапазоном 24 бит и 16 бит. Каждый из них скачивал несколько пар 24-битных файлов, один из которых претерпел конверсию 24-16-24 бита, то есть на практике был 16-битным файлом. Их просили определить разницу.
В тесте приняли участие 140 добровольцев (138 мужчин и 2 женщины: честная демографическая картина для аудиофилов). Средний возраст респондентов: 44 года.
Согласно анкетам, более 20% респондентов назвались музыкантами и звукоинженерами, поэтому можно сравнить результаты среди «профессионалов» и любителей, с учётом статистической погрешности.
Стоимость аудиоаппаратуры у участников опроса чаще всего лежит в диапазоне от $1000 до $3000.
Результаты опроса по трём парам файлов довольно любопытны. В двух из трёх композиций правильные и неправильные ответы распределились ровно пополам.
А в композиции Bozza 52,85% пользователей ошиблись, приняв 16-битный файл за 24-битный.

20 респондентов правильно ответили на все вопросы, а 21 человек ошибся во всех вариантах, что тоже вписывается в рамки статистического распределения.
Ещё более удивительно, что музыканты показали результат хуже среднего, даже с учётом статистической погрешности! Особенно сильно напутали в композиции Вивальди.

А вот результат среди пользователей, у которых стоимость звукового оборудования превышает $6000.

Наушники тоже вовсе не помогают отличить 16-битную музыку от 24-битной.

Подводя итог. Конечно, есть приложения, в которых нужно работать именно с 24-битным звуком (тот же мастеринг). Но факт в том, что на слух 16- и 24-битный звук совершенно не различимы друг от друга. Если кто-то заявляет, что способен услышать разницу, то этот человек наверняка заблуждается.
andruha300 25-02-2020 Ответить

Прим. перев.: сегодня мы публикуем перевод статьи из блога Итана Хайна – адъюнкт-профессора по направлению «музыкальные технологии» из Нью-Йоркского Университета. Мы уже публиковали перевод одной из его статей (о визуализации музыки) и решили продолжить эту серию материалом об основах цифрового аудио (эта статья затрагивает базовые моменты превращения аналогового звука в цифровой и будет интересна в первую очередь тем, кто не знаком с этим процессом). Данная тематика обсуждалась и в одном из наших подкастов.
Чтобы понять, как работает цифровой звук, вам нужно знать несколько вещей о физике звука. Анимация изображает, как распространяются звуковые волны от кругового источника звука – представьте, что это поверхность барабана или тарелки (музыкального инструмента).

Как видите, звук – это волна, как рябь на поверхности водоема. Представьте, что ваше ухо находится в середине нижней части этой картинки. Давление воздуха на ваше внутреннее ухо ритмично то увеличивается, то уменьшается. Звук является результатом того, что ваш мозг чувствует, насколько далеко происходит колебание и с какой частотой.
Если вы построите график изменения давления воздуха на ваше ухо с течением времени, то он будет выглядеть примерно так:

Мы увидим еще множество таких волн синусоидальной формы: она очень важна для понимания природы звука. Основная задача аудиозаписи – это перевести такую волновую форму в различные медиаформаты, которые можно сохранять, воспроизводить и управлять ими.

От звука к электричеству

Микрофоны работают точно так же, как и ваши уши, только вместо барабанной перепонки в микрофоне содержится маленькая, тонкая металлическая пластинка, прикрепленная к магниту. С изменением давления воздуха на пластинку, магнит покачивается вперед-назад и вырабатывает электрические колебания. Если вы нарисуете график изменения текущего напряжения, то форма волны будет выглядеть в точности как на графике давления воздуха на перепонку.
Существуют несколько различных технологий создания микрофонов. В некоторых микрофонах для вырабатывания тока вместо магнита используется конденсатор, который колеблется в соответствии с колебаниями воздуха. Такие микрофоны используют «фантомное питание» – вместо того, чтобы вырабатывать небольшой электрический ток, они регулируют тот ток, который уже течет через них. Также есть микрофоны, в которых используется небольшой кусочек пьезоэлектрического материала, который, колеблясь, меняет уровень напряжения.

От тока к «цифре»

Итак, теперь вы получили звук, представленный в виде электрического тока. В прошлом люди сохраняли его множеством способов: в качестве волнистых канавок на виниловых пластинках, фотокинопленках или в виде структурированных магнитных частиц на магнитной ленте. Компьютеры же хранят информацию об уровне тока, регулярно считывая уровень напряжения и сохраняя каждое значение как число. Детали этого процесса довольно сложны, но узнать хоть немного о том, как это работает, может быть полезно.
График, расположенный ниже, изображает кодово-импульсную модуляцию – аналого-цифровое преобразование, используемое в аудиоформатах AIFF и WAV. Красная линия – это оригинальный аналоговый сигнал, который постоянно меняет свою амплитуду и поступает по кабелю от микрофона.

Компьютер считывает уровень напряжения через постоянные временные интервалы, которые изображены на графике как вертикальные линии. Синие точки показывают считанный компьютером уровень напряжения в данный момент. Горизонтальные линии отображают другие возможные значения, которые компьютер может сохранить и считать; из всех этих возможных значений он всегда выбирает наиболее близкое к действительному. Аудиофайлы форматов AIFF и WAV представляют собой длинный (очень длинный) список чисел, которые являются значениями уровня напряжения.
Как вы могли догадаться, чем чаще компьютер считывает показания, и чем точнее оказывается каждое из них, тем качественнее будет звучать цифровая запись. Частота, с которой компьютер считывает показания, называется частотой дискретизации, а точность, с которой он это производит – квантованием. Я раскрою эти понятия в тексте ниже.
Частота дискретизации
Аналого-цифровые преобразователи считывают показания напряжения невероятно быстро. Стандарт CD-качества требует частоту дискретизации 44 100 считываний в секунду, или, говоря техническим языком, 44 100 Герц. Аудио в фильмах или на ТВ имеет частоту дискретизации 48 000 Герц. И это очень быстро! Ведущие записывающие студии иногда используют и намного более высокие частоты. Чем выше частота дискретизации, тем точнее вы можете передать ваш аналоговый сигнал и тем больший диапазон частот можно охватить. CD-стандарт в 44 100 Герц покрывает весь диапазон слышимости человека.
Битовая глубина (квантование)
Чтобы понять идею квантования, вам нужно узнать, как компьютеры хранят числа и другие виды информации в памяти. Память компьютера сделана из миллиардов крошечных электрических переключателей, которые могут находиться только в двух положениях: включено или выключено. Количество информации, которое может быть представлено положением одного такого переключателя называется битом. И что же можно сделать с битом? Ну, вы можете сохранить ответ на вопрос, в форме «да/нет» или же логическое утверждение: «правда/ложь». Или можно хранить два числа, к примеру, ноль и единицу.
Но что, если у вас есть два бита, два электрических переключателя? Получаются четыре возможные комбинации этих двух переключателей: 00, 01, 10, 11, и вы можете использовать эти комбинации, чтобы закодировать четыре числа, к примеру: ноль, один, два и три.
Если у вас три бита, то возможно получить восемь комбинаций: 000, 001, 010, 011, 100, 101, 110 и 111. Теперь можно хранить числа: ноль, один, два, три, четыре, пять, шесть, и семь. Используя четыре бита можно получить до шестнадцати комбинаций, с пятью – тридцать две. Каждый бит вдвое увеличивает количество чисел, которые можно закодировать.
Если ваш аналого-цифровой преобразователь имеет только один бит для представления сигнала, то точно представить сигнал в цифровом виде не получится. То же самое произойдет, если используются два бита выборки. График ниже показывает двухбитное аудио. Цифровая версия звуковой волны получается неточной и будет звучать ужасно, так как используются только четыре допустимых значения напряжения.

Аудио с дискретизацией в три бита звучит немного лучше. Теперь компьютер может выбирать из восьми допустимых значений. Синяя цифровая волна все еще сильно отличается от красного аналогового оригинала, но немного приблизилась к нему:

Первый график в этом разделе показывает четырехбитный звук с шестнадцатью возможными значениями каждого считывания. Этот график выглядит куда лучше. Компьютерные игры 80х годов прошлого века использовали восьмибитный звук – это означает, что в каждый момент считывания можно выбрать одно из 256 значений. Звук все еще кажется слишком фальшивым и «компьютерным», но теперь, хотя бы, можно что-то распознать.
Стандарт CD требует 16 бит для представления аудиозаписей. Это означает, что на каждое считывание приходится 65 536 различных значений. При такой битовой глубине ваше приближенное цифровое значение станет очень похоже на оригинальный аналоговый сигнал и будет довольно хорошо звучать. Еще более высокого качества звучания можно достичь, используя при записи 24-битное аудио, которое позволяет выбирать из 16 777 216 различных значений. С частотой в 44 100 считываний в секунду получится очень гладкая и правильная звуковая волна, которую сложно отличить от оригинальной аналоговой волны даже самым чутким слушателям.
Разумеется, чем больше битовая глубина, тем больше места требуется на диске для хранения всех этих чисел. Качественное 24-битное аудио требует в 256 раз больше места, чем 16-битное аудио. Так что всегда приходится выбирать между качеством и местом на диске. Теперь вы понимаете, почему аудиофайлы такие большие. При прослушивании 16-битного аудио с диска, воспроизводится примерно десять мегабайт информации за минуту, при прослушивании 24 битного – два с половиной гигабайта за минуту.

Как работает звукозаписывающая аппаратура

Самое сложное в звукозаписи – это подобрать правильный уровень сигнала. Если вы установите слишком низкую громкость микрофона, то получите слабовыраженные колебания напряжения. Затем, когда вы будете прослушивать запись, вы будете вынуждены сильно увеличивать громкость, чтобы расслышать её (запись), но вместе с этим увеличится и громкость записанного фонового шума от окружения или оборудования. Получившаяся дорожка будет звучать не лучшим образом. С другой стороны, если вы установите слишком высокую громкость микрофона, то скачки напряжения могут превысить те значения, которые сможет прочитать ваш аналого-цифровой преобразователь. Такое явление называется клиппинг – обрезание сигнала, и звучит оно просто чудовищно.
На графике ниже изображен сигнал, слишком громкий для данного записывающего устройства, а также два различных варианта его искривления.

Аналоговые системы реагируют на перегрузку мягким ограничением уровня (soft clipping). Из-за этого звуковые волны сжимаются и добавляют некоторые гармоники к звуку. На самом деле мягкое ограничение может звучать довольно классно. Гитаристы намеренно перегружают свои усилители, чтобы воссоздать такой вид искажения, который отлично звучит и при воспроизведении с аудиоленты. В свою очередь, цифровые системы при перегрузке резко ограничивают уровень сигнала (hard clipping). Как следует из названия, такое ограничение полностью обрезает пики сигнала. Из-за этого в сигнале появляются ужасно звучащие высокие гармоники, и впоследствии от них невозможно избавиться. Таким образом, урезания цифрового сигнала лучше избегать.
Довольно сложно выставить ручку регулировки усилителя у звукозаписывающего устройства в нужное положение, в котором вы получите хороший сигнал и избежите клиппирования. Картинка ниже изображает индикаторы аудиоинтерфейса, который я использую в момент звукозаписи. Верхний индикатор показывает очень хороший уровень громкости с достаточным запасом мощности. Значение нижнего располагается прямо на границе клиппирования, поэтому, скорее всего, я его немного убавлю.

Где же вы должны производить звукозапись? Это сильно зависит от того, какие помещения есть в вашем распоряжении. Лучшие место – это звукозаписывающие студии, но если у вас нет возможности попасть в одну из таких, есть и другие способы записать хороший звук. В видео ниже подробно рассказывается о звукозаписи в неидеальных условиях.

Форматы файлов

Полученную звукозапись можно сохранить в нескольких форматах. Можно начать с вышеупомянутых форматов AIFF и WAV. Они идентичны друг другу и просто хранят в себе список чисел в различном порядке. Основная проблема AIFF и WAV состоит в том, что они занимают очень много места. Есть несколько способов сжать аудиозаписи, чтобы уменьшить объем занимаемой памяти. Существуют две разновидности сжатия: сжатие без потерь и сжатие с потерями.
Сжатие без потерь
Возможно уменьшить размер файлов на компьютере, не потеряв важной информации. Хорошая аналогия – это условные обозначения стенографиста. Эта система используется репортерами, когда они заменяют различные слова короткими кодами. Условные обозначения занимают меньше места, чем английские слова, и по ним можно дословно воспроизвести все сказанное. Точно так же, как условные обозначения стенографистов являются сжатием без потерь для английского языка, форматы FLAC и Apple Lossless представляют собой способы подобного сжатия для аудио. FLAC и Apple Lossless занимают примерно в два раза меньше места, чем несжатые AIFF и WAV.
Сжатие с потерями
Можно сжать файлы до еще меньших размеров, если вы готовы пожертвовать качеством звука. Сжатие с потерями сродни краткому содержанию книги – вы поймете главную идею, но не воссоздадите целый текст во всех подробностях. MP3 – это наиболее известный аудиоформат сжатия с потерями. MP3-файл звучит не так хорошо, как несжатый оригинал, но может занимать в 10 раз меньше места или даже меньше. Чем больше вы жертвуете качеством, тем сильнее можно сжать файл. Недостатком является то, что когда качество потеряно, восстановить файл уже не получится.

Воспроизведение звука

Точно так же, как аналого-цифровые преобразователи переводят электрические сигналы в числа, цифро-аналоговые преобразователи переводят числа в электрические сигналы. Преобразователь считывает все показания напряжения в аудиофайле и посылает сигналы соответствующей силы по проводу к динамикам. Колебания тока идут по проводам и воздействуют на магнит в динамике, который прикреплен к тонкому бумажному или пластиковому конусу, вибрирующему вместе с ним. Вибрации конуса сотрясают воздух, который воздействует на ваше внутреннее ухо, и вы слышите воспроизведенный звук.
VideoAnswer 25-02-2020 Ответить
VideoAnswer 25-02-2020 Ответить
VideoAnswer 25-02-2020 Ответить
VideoAnswer 25-02-2020 Ответить

Разрядность и частота дискретизации звука какая лучше?

10 ответов на вопрос “Разрядность и частота дискретизации звука какая лучше?”

Добавить ответ Отменить ответ