最後更新日期 2024-02-24 ,由 support 進行編輯。

最後更新日期 2024-02-24 ,由 support 進行編輯。

Immersive Sound 沉浸聲

ADM 音訊定義模型

想理解認識 Ambisonics/Spatial Audio/SBA (Scene-Based Audio),首先要從認識 ADM 開始,而想認識 ADM,則要對 ADM 整合的三大元素 Channel、Object、Scene 有所掌握。

Channel:聲道

即泛指 mono、stereo、2D/3D surround 這類 Channel-Based Audio (CBA),CBA 是大家比較熟悉的技術,在大多數情況下提及的「多聲道」就是指 CBA,比較經典會被提到的譬如Auro 3D 或其他如 ITU 建議的環繞格式,而除了喇叭端,自然也包括到前端麥克風的各式各樣的「多聲道錄音」,CBA 可以是點收音、各式 2-Channel 收音,也可以是各種環繞或陣列式收音;「Channel-聲道」的本意是「麥克風」和「喇叭」的直通關係,不過 CBA 也隨著時間推進而衍生出許多錄音和混音技術的變化,這些變化體現在後來錄音師跟混音師所認知的「去蕪存菁」的概念上,也就是所謂怎麼記錄到「好的聲音:器樂局部面向上聽起來比較好聽的聲音,有點像照相取景」、「所需要的聲音部位」、「拿掉其他不需要的」,來得到一個「相對乾淨」的「源頭」或後期製作上透過處理來得到相對乾淨清晰的「混音」,以及利用「透鏡原理」來收錄「更突出」或「更寬」的聲音的諸多做法。在 ADM 裡面,這些被做為固定方向的 Static Channel 的中繼資料/詮釋資料包括 Timecode 均被儲存為 BWF Wave file 裡面的 Chunk 資料塊或一個獨立的資料軌(譬如 MPEG-H 是存在第 16 軌),其音訊則以獨立的一個音軌來包括其所有聲道(譬如你 Atmos Bed 這層的 channel 做 5.1,則會以 5.1的多聲道形式做成單獨一個音軌,也因此需要特別注意 channel order,也就是聲道的mapping 必須和廠家要求的排位一致)。

Object:物件

Object-Based Audio(簡稱 OBA),是利用多聲道喇叭來擴展後端系統於聲像操作上的空間自由度,由於 CBA 通常做好之後就會是固定而不會輕易去改動的母帶,而當代沉浸聲技術上是鼓勵廠商開發產品時使用更大規模喇叭數(尤指電影院的喇叭數)來達成更好的聲像定位,所以就會需要擴展 CBA 成為後端系統可操作的 OBA,以便利用後端多聲道喇叭來執行作品預設的3 D Positioning,OBA 的音軌製作自然是跟 CBA 一樣,OBA 其實就是 CBA 裡面的 mono (也可以用多個 mono 音軌做成 static Object 來額外做成一個或多個 Bed,這是變通之道),在 ADM BWF 檔裡面的 OBA 音訊是以單獨聲道的母帶形式存在,而其相關空間定位和增益控制的描述資料則與 Channel 一樣全部都記錄在 Metadata (中繼資料/詮釋資料)中,這些資料送到終端透過相應的 ADM 渲染工具或處理器來讀取和操作後面的多聲道喇叭。

Scene:場景

Scene-Based Audio(簡稱SBA),即 Spatial Audio,即 Ambisonics,SBA 能讓 ADM 的整合應用具靈活度,以及提高後端系統聲響效果的沉浸感 (有機感、自然鮮活感,也就是音響圈常說的於音響設備上所希冀得到的「真實度」、「高傳真/高保真」為基礎的更上一層樓的呈現物理性的完整三維空間聲場),在 Ambisonics Domain 裡面,廠家們可以達到這個目的。但 CBA 跟 OBA 做不到沉浸嗎?嚴格上來講你有 OBA 的時候就沒辦法直接用 CBA 來達到沉浸,這當中涉及到後端多聲道系統的喇叭數量尤其要理解電影院的規模需要,另一方面由於 Atmos 音樂製作的最後端聲道數在 Apple Music 裡面規範的沉浸式音訊格式最多就有7.1.2,所以無論你怎麼做,它就是用 7.1.2 丟給Apple Spatial Audio,所以終端用戶得到的體驗就是叫做 7.1.2 聲道的家用規格的體驗,而 Object 是無法直接跟已固定做好的 CBA 黏合起來的,也因此需要 SBA 來黏合它們,使最終輸出到多聲道喇叭上能得到一個整體感,各廠家也都正往這個目標不斷努力,Object 因為在電影院的聲學環境裡多半無法呈現出自然、鮮活的有機感、空間的真實度,國外有些工程師在製作上會用做「影子」的方式來補足 Object這個缺陷,這個是逼不得已的事,然而,我們同時這幾年裡也陸續看到了其他廠家在他們的產品上利用 SBA 來提供給終端用戶一個沉浸感的擴展能力,譬如 AMBEO Soundbar、Sony 相關支援 Sony 360 RA 的喇叭機種上,都有一個擴展按鈕開關,譬如 AMBEO Soundbar 上面可以打開 AMBEO mode。SBA 不只用在後端設備或平台服務,事實上 SBA 可以應用於整個產業流程裡的每個環節,因為 Ambisonics 確確實實可以解決很多 CBA 做不到的事,開玩笑的說呢,Ambisonics Domain 就像是前段時間新聞媒體上很熱鬧的「元宇宙」,為何?對於開發來說,廠家工程師可以在 Ambisonics Domain 裡面來做觀察和發展,因為就 SBA 可以是被做為一個模擬器,能夠很扎實的發揮作用,這是 CBA、OBA 所做不到的。所以在專業音訊行業裡的我們要認識到,ADM 包括 SBA 的理由並不只是為了支持一階、二階或更高階的Ambisonics B 格式來做 Ambiance,事實上它所是許多沉浸聲相關軟硬體廠家用來開發產品的核心技術(因為它專利許多年前就過期了,所以利用它來進入到沉浸聲領域從事產品開發的廠家如雨後春筍般的湧現,包括 VR/AR/MR/XR 這些跟頭盔有關的科技業,用Ambisonics 做遊戲的聲音引擎SDK是很早的事情了)。
依據各品牌廠家各自制定的 ADM Profile,內容創作者可以有機會編排設計預留給後端用戶的操作彈性,以實現可互動操作的終端體驗。

目前廠家的 ADM 規範只有 MPEG-H 3D Audio 具有這個終端可互動操作的特徵,譬如MPEG-H 3D Audio 聲音內容設計者可以讓終端用戶擁有切換語系、關閉旁對話或旁白或播報員聲音等操作上的彈性,至於其他 Dolby Atmos、Sony 360 Reality Audio 則暫時都還沒有看到。但這三家公司於去年已經宣佈共同建立了一個專利池,表示後續這三家在其產業各方面領域的合作必是一股強大的力量。

另 EBU 也持續更新了他們的 EARPS ADM 工具套裝(應該是延續了上述 BBC 的軟體開發目標) https://ear-production-suite.ebu.io

延伸閱讀:

Audio Definition Model Software – BBC R&D

Leave A Comment