Оглавление:
Реализм в прослушивании звука (часть 2)
4 метода используемые для создания звуковой реальности на расстоянии
Аудиоинженеры столкнулись с проблемой воссоздания звуковых полей (звук.сцен). Классическая теория Bell Labs предполагает, что зана
вес перед сценой с бесконечным количеством обычных микрофонов, управляющих таким же занавесом из удаленных громкоговорителей, может создавать как точную, так и реалистичную копию инсценированного музыкального события, а слушатели могут сидеть где угодно позади этот занавес, двигают головой и все равно слышат реалистичное звуковое поле.
К сожалению, этот метод, даже если бы он был экономически оправдан, терпит неудачу по первым двум пунктам с любым конечным числом АС.

Такая завеса может действовать как линза и изменять направление или фокус звуковых волн, попадающих на неё. Подобно световым волнам, звуковые волны имеют направленный компонент, который легко теряется при таком расположении либо на микрофоне, АС или оба места.
Таким образом, каждый излучающий громкоговоритель на практике представляет собой новый дискретный источник звука неконтролируемой направленности, сообщающийся непосредственно с обоими ушами и, следовательно, генерирующий интерференционные картины гребенчатого фильтра и направленные искажения ушной раковины, которых нет на активной стороне занавеса.
Наконец, этот занавес громкоговорителей не излучается в комнату для прослушивания размером с концертный зал, и поэтому можно было бы, скажем, оперную сцену пристроить к комнате для прослушивания, которая даже не настолько велика.
Это отсутствие атмосферы оперного театра само по себе не сделало бы эту систему воспроизведения нереальной, даже если бы остальная часть поля была каким-то образом сделана точной, но она определенно не звучала бы идеально. Но использование массивов акустики (стены из сотен колонок), окружающих относительно большую зону прослушивания, позволяет синтезировать любое звуковое поле в комнате с замечательной точностью. Но этот метод может быть полезен в системах звукоусиления в залах, театрах или лабораториях.

В общем, методы многоканальной записи или матричные системы объемного звучания (Hafler, SQ, QS, UHJ, Dolby, 5.1 и т. д.) кажутся захватывающими улучшениями, когда их впервые слышат давно лишенные возможности слушатели стереомузыки, но, в конце концов, они звучат не так как надо нет настоящего реализма звука.
Бинауральный подход
Второй, более практичный и часто захватывающий подход — бинауральный. Идея состоит в том, что, поскольку у нас есть только два уха, если мы запишем в точности то, что слушатель услышал бы на входе в каждый слуховой проход в месте записи, и доставим эти два сигнала в неизменном виде в слуховые проходы удаленного слушателя, тогда и точность, и реализм должен быть идеально передан. Эта концепция почти работает и, вероятно, может быть усовершенствована в самом ближайшем будущем с помощью передовых компьютерных программ, особенно для приложений виртуальной реальности, включающих гарнитуры или акустику ближнего поля.

Проблема в том, что для записи используется фиктивная голова с смоделированными ушными раковинами и встроенными в слуховой проход микрофонами.
Настоящая загадка, однако, заключается в том, что фиктивная голова недостаточно точно соответствует какой-либо конкретной форме головы человека-слушателя или внешнему уху, чтобы избежать интернализации звуковой сцены, в результате чего кажется, что у вас есть полный симфонический оркестр из от уха до уха и от носа к затылку.
Интернализация — это неизбежный и единственный логический вывод, к которому может прийти мозг, столкнувшись со звуковым полем, совершенно не обработанным головой или ушными раковинами. Ибо как иначе звук мог бы избежать этих структур, если бы он не возник внутри черепа? Если использовать муляж головы без ушных раковин, то, чтобы избежать интернализации, нужны наушники, отстоящие от головы, скажем, вперед.
Но теперь направление окружающего звука неверное, а боковая локализация не совсем точная. IMAX является примером этого метода без ушей, дополненныйгромкоговорителями.

Существует также конструкция круглых наушников, в которой крошечный динамик размещается прямо над выемкой в нижней передней части уха, так что многие резонансы ушной раковины по-прежнему обычно возбуждаются фронтальными звуками. Аналогичный ушной динамик над верхней задней частью уха может обеспечить аналогичный благоприятный для ушной раковины вход для звуков, исходящих сзади.
К сожалению, различия в форме головы между манекеном и головой слушателя остаются, и манекен головы не должен иметь смоделированные ушные раковины, если предполагается использовать эти наушники. Аналогичный ушной динамик над верхней задней частью уха может обеспечить аналогичный благоприятный для ушной раковины вход для звуков, исходящих сзади.
НО бинауральный звук через наушники сталкивается со многими трудностями, является убедительным свидетельством того, что индивидуальные формы головы и извилины наружного уха имеют решающее значение для нашей способности ощущать звуковую реальность.
Синтез волнового поля
Третий теоретический метод создания как точного, так и реалистичного звукового поля заключается в фактическом измерении интенсивности и направления движения разрежений и сжатий всех падающих звуковых волн в одном лучшем положении для прослушивания во время концерта, а затем воссоздании этой точной звуковой волны.

В Ambisonics (игнорируя компоненты высоты) совпадающий узел микрофона, который эквивалентен трем микрофонам, занимающим одну и ту же точку в пространстве, фиксирует полное представление давления и направленности всех звуковых лучей в одной точке на месте записи.
При воспроизведении акустики, окружающие слушателя, производят звуковые волны, которые вместе сходятся в одной точке (в центре головы слушателя), образуя те же разрежения и сжатия, включая их направленные компоненты, которые были записаны.
Теоретически, если реконструированная звуковая волна верна во всех отношениях в центре головы (при отсутствии головы слушателя в данный момент), то она также будет правильной на вправо или влево от этой точки на входе.

Основное преимущество этого метода заключается в том, что он может в равной степени охватывать звуки передней сцены, атмосферу зала и звуки тыла, и, поскольку он воссоздает исходное звуковое поле (по крайней мере, в этой точке), он не полагается на механизм фантомного изображения.
С другой стороны, амбисоническая теория молчит о том, как звуки, исходящие из различных громкоговорителей, модифицируются ушной раковиной и формой головы и как декодер может компенсировать эти эффекты.

Таким образом, амбисонический метод нелегко поддерживать точным на частотах намного выше 2000 Гц, и он должен полагаться и действительно опирается на очевидную способность мозга игнорировать это отсутствие реалистичных высокочастотных входных сигналов локализации ушной раковины, головы и сигналов и локализовать на основе легче восстановить только низкочастотные сигналы. Это было бы хорошо, если бы локализация сама по себе приравнивалась к реализму или если бы нас интересовали только приложения с объемным звуком в фильмах.
Другие проблемы с базовой Ambisonic включают тот факт, что для этого требуется как минимум 3 записанных канала (если вас беспокоит качество), и поэтому она мало что может сделать для обширной библиотеки существующих записей. Возвращаясь к технической стороне проблемы, необходимо иметь достаточное количество акустики вокруг слушателя, чтобы обеспечить достаточное разнообразие векторов направления звука для точного воспроизведения формы волны, и все эти положения АС относительно слушателя должны быть точно известны декодеру Ambisonic.

Аналогичным образом, для достижения наилучших результатов должны быть известны или тщательно контролироваться частота, задержка и направленность всех громкоговорителей, и, как и во всех других акустических системах, необходимо учитывать или, что еще лучше, устранять эффекты отражений в помещении для прослушивания.
Как вы можете себе представить, довольно сложно, особенно при повышении частоты, обеспечить, чтобы размер реконструированного поля в месте прослушивания был достаточно большим, чтобы вместить голову, все нормальные движения головы, повседневные ошибки в положение слушателя и более одного слушателя.
Однако, по моему мнению, основным препятствием на пути к реальности с помощью любого метода реконструкции сигнала с одной точкой, такого как Ambisonics, является его нынешняя неспособность, как в бинауральном случае, приспособиться к влиянию внешнего уха и самой головы на форму сигнала, действительно достигающего слухового прохода.
Например, если предполагается, что широкополосная звуковая волна от левого переднего динамика объединяется со звуковой волной от заднего правого АС, заднего центрального АСи т. д., то для этих частот выше, скажем, 2500 Гц ушная раковина левого уха будет изменять звук от каждого такого АС,. ведь совершенно иначе, чем ожидается по уравнениям декодера, в результате чего форма сигнала будет изменена совершенно индивидуально и по существу не поддается контролю любым практическим декодером. Результатом является хорошая низкочастотная локализация, но плохая или отсутствующая локализация ушной раковины.
К сожалению, простая локализация, отсутствие согласованности, как, к сожалению, в случае со стереозвуком, объемным звуком или амбисоник, не является гарантией реализма. Действительно, если уж приходится жертвовать механизмом локализации, то пусть это будет самый низкочастотный.
Наконец, можно доказать, что можно добиться великолепного реализма даже без какой-либо подробной локализации авансцены, если локализация окружающего пространства правильна по направлению (в чем может убедиться любой, кто сидел в последнем ряду в мариинском театре).
Амбиофоника или амбиофония
Четвертый известный мне подход я назвал амбиофоникой. Ведь амбиофоника, которая немного заимствует у бинауральной и еще меньше у амбисоники, предполагает, что механизмов локализации больше, чем мечталось в предыдущих философиях, и стремится удовлетворить все механизмы, насколько это возможно. Этот метод также придерживается психоакустической позиции, согласно которой абсолютная бинауральная позиционная точность, в отличие от абсолютного реализма, не так важна, и, кроме того, эта технология воспроизведения должна быть связана только с воспроизведением постановочных акустических музыкальных событий, а не фильмов или виртуальной реальности.
Преимущество сосредоточения внимания только на одном аспекте звуковой реальности состоит в том, что эта реальность достижима сегодня, разумна по цене и применима к существующим пластинкам и компакт-дискам.
Одним из основных элементов амбиофонической теории является то, что лучше всего не записывать фоновую и боковую атмосферу концертного зала или пытаться извлечь её позже из разностного сигнала или воссоздать ее с помощью реконструкции формы волны, а синтезировать фоновую часть поля, используя реально сохраненные данные концертного зала для генерации сигналов окружения с использованием цифровых сигнальных процессоров нового поколения.
Разнообразие и точность таких синтезированных окружающих полей ограничены только навыками программистов и сборщиков данных, а также скоростью и размером используемых компьютеров. Таким образом, со временем можно было достичь любой желаемой степени совершенства конструкции концертного зала. Библиотека великих залов мира может быть использована для создания окружающего поля, как это уже было сделано с поразительным успехом в JVC XP-A1010.
Амбиофония обычно менее ограничена количеством слушателей, которые могут одновременно делиться опытом, по сравнению с большинством реализаций других методов, использующих такое же количество динамиков. К счастью, в нескольких практических воплощениях в Ambiophonic могут разместиться от двух до пяти человек.

Другой основной принцип амбиофонии состоит в том, чтобы воссоздать в месте прослушивания точную копию исходной звуковой волны давления. Однако Ambiophonic делает это, перенося источник звука, сцену и зал в комнату для прослушивания, а не точечный волновой фронт к ушам.
Амбиофоническое воспроизведение или амбиофоническое прослушивание
Другими словами, амбиофония реализует бинауральный эффект, используя, как и в бинауральном случае, всего два записанных канала, но с двумя передними колонками, воспроизводящими сцену, и восемью или около того АС окружения вместо наушников. Ambiophonics генерирует изображение сцены шириной до 120° с точностью и реалистичностью, которые намного превосходят любую другую схему воспроизведения с 2 каналами. Хотя вряд ли это кажется необходимым, использование четырех каналов и четырех основных фронтальных громкоговорителей может создать полное сценическое изображение на 180°.

По причинам, изложенным ниже, амбиофоническое воспроизведение требует, чтобы два основных фронтальных громкоговорителя располагались под углом всего около 10° в каждую сторону от места прослушивания, чтобы не создавать искажения угла ушной раковины для центральных звуков, которые фантомное изображение-стерео, Расположение динамиков или АС Ambisonic или объемного звучания почти всегда приводит к возникновению обьёмности звука.
Амбиофония также требует, чтобы небольшая легкая звукопоглощающая панель располагалась на краю по центру перед местом слушателя, чтобы предотвратить попадание сигнала левого переднего динамика или АС в правое ухо и наоборот. Хотя для достижения этой цели существуют электронные средства (Carver, Lexicon, Cooper-Bauck-Harmon Intl.) и дополнительные громкоговорители, ни одно из них не работает так хорошо, как небольшая недорогая панель.

Амбиофонический слушатель может свободно вращать головой, раскачиваться взад-вперед, и волнообразно из стороны в сторону, без смещения изображения, как в концертном зале. Большинство аудиофилов считают, что использование панели будет нежелательно по эстетическим соображениям.
Я, конечно, хотел бы придумать менее проблематичный способ достижения той же цели, но, по крайней мере, на практике к панели очень быстро привыкаешь и вскоре удивляешься, почему кто-то слушает без неё. Новые легкие материалы упрощают хранение панели между сессиями или предоставляют дополнительные возможности для нескольких слушателей.