數(shù)字音頻編碼系統(tǒng)管理論文

時(shí)間:2022-07-29 04:29:00

導(dǎo)語:數(shù)字音頻編碼系統(tǒng)管理論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)字音頻編碼系統(tǒng)管理論文

[摘要]隨著存儲(chǔ)媒體容量和傳輸帶寬的不斷提高,高質(zhì)量多聲道數(shù)字音頻系統(tǒng)也逐漸取代傳統(tǒng)的單聲道、立

體聲系統(tǒng),而成為新的傳播媒體方式。本文著重介紹當(dāng)前幾種典型的多聲道數(shù)字音頻系統(tǒng)的編、解碼技術(shù)。

以MPEG-2、AC-3、DTS、MPEGAAC多聲道數(shù)字音頻系統(tǒng)來討論它們各自聲道的配置、數(shù)據(jù)容量、數(shù)據(jù)率等所

帶來的優(yōu)缺點(diǎn),最后介紹在數(shù)字音視頻廣播中,多聲道數(shù)字音頻系統(tǒng)的應(yīng)用。

1、前言

對(duì)于CD格式來說,大家都知道它具有良好的信噪比、超過80dB以上的動(dòng)態(tài)范圍以及超過15kHz的頻率范圍,這

使得它具有良好的音頻質(zhì)量和滿意的收聽效果,但是它僅僅提供了兩個(gè)聲道。多聲道數(shù)字音頻系統(tǒng)通過聲道

的擴(kuò)展,不僅在質(zhì)量上與CD音頻不相上下,同時(shí)還帶給聽眾身臨其境的感受,而這是傳統(tǒng)單聲道和立體聲無

法實(shí)現(xiàn)的,因此多聲道數(shù)字音頻系統(tǒng)已被更多的聽眾接受,同時(shí)也逐漸成為音樂制作的主流。

在眾多的國際標(biāo)準(zhǔn)中,如SMPTE、EBU、ITU-R、ISO/IEC、MPEG等,都涵蓋著一種稱之為5.1聲道的多聲道數(shù)

字音頻格式。在即將制定的DVD-Audio標(biāo)準(zhǔn)中,也規(guī)定將采用24bit采樣精度、88.2,96,192KHz采樣率的多

聲道數(shù)字音頻格式。

一種廣泛接受的多聲道數(shù)字音頻系統(tǒng)配置方案就是我們常稱的5.1聲道系統(tǒng),也就是3/2/.1的配置方案。這

種方法是按照ITR-U的建議BS.775來確定用于重放的揚(yáng)聲器擺放位置的,如圖1所示。

根據(jù)建議可知,5個(gè)全頻帶的重放揚(yáng)聲器分為前置揚(yáng)聲器(包括L、R、C)和后置揚(yáng)聲器(也稱環(huán)繞揚(yáng)聲器,

包括Ls、Rs),按照?qǐng)D示所規(guī)定的角度和方位進(jìn)行擺放,并且它們都位于一個(gè)圓的邊界上,其中L、R揚(yáng)聲器

與C揚(yáng)聲器分別呈30度夾角,Ls、Rs揚(yáng)聲器與C揚(yáng)聲器分別呈110度夾角。除此5個(gè)全頻帶的聲道外,還有一個(gè)

低頻增強(qiáng)聲道,稱之為LFE,它的頻率范圍在200Hz以下,大約是全頻帶倍頻程的10%左右,因此也稱點(diǎn)一聲

道。它的放置沒有特殊的要求,一般放置在前面。

5個(gè)重放揚(yáng)聲器的擺放并不是說能夠完全重現(xiàn)真實(shí)的空間聲像,其實(shí)5個(gè)揚(yáng)聲器的使用僅僅是一種重現(xiàn)空間聲

像而采用的粗略的實(shí)現(xiàn)方式。當(dāng)然,一方面重放的效果取決于音頻素材的制作,另一方面則需要嚴(yán)格的重放

揚(yáng)聲器的空間位置擺放和收聽者的位置關(guān)系。在電影院里我們往往能夠感受到聲像定位準(zhǔn)確的音頻效果,現(xiàn)

在也有一些提法,認(rèn)為8個(gè)、10個(gè)、12個(gè)甚至更多的重放揚(yáng)聲器會(huì)有更加完美的音頻效果。這些觀點(diǎn)有它存在

的理由,聲像的表現(xiàn)當(dāng)然是越準(zhǔn)確越好,但是一味的通過增加重放揚(yáng)聲器的數(shù)量以及增加音頻聲道數(shù)的話,

它也會(huì)帶來另外的負(fù)面影響,如聲像的定位更加困難等等,因此我們?cè)诖藘H僅通過5.1聲道的實(shí)現(xiàn)方式來進(jìn)

行闡述。另外,我們還應(yīng)明確一點(diǎn),對(duì)于家庭消費(fèi)者來說,5.1聲道已經(jīng)足夠表現(xiàn)較完美的音頻效果了。

不管是那種擺放方式,它的實(shí)現(xiàn)都離不開基本的編碼方式和主要規(guī)則。另外5.1聲道方式還會(huì)帶來較大的壓

縮比和較低的比特率(相對(duì)于更多聲道的情況),下面就詳細(xì)的來介紹一下多聲道數(shù)字音頻系統(tǒng)的編碼方式。

圖1ITR-U的建議BS.775確定的用于重放的揚(yáng)聲器擺放位置

1、多聲道數(shù)字音頻的編碼

從立體聲向多聲道的過渡,增加了對(duì)存儲(chǔ)和傳輸媒體的需要。下面以CD格式為例,假設(shè)它的采樣頻率為

Fs=44.1kHz,采樣精度R為16bit,那么CD格式的音頻數(shù)據(jù)率B為:

BCD=2×R×Fs=1.411Mb/s

由此可知,一個(gè)小時(shí)的CD格式的音樂需要635MB的存貯空間,其實(shí)CD最長的重放時(shí)間為74分鐘。那么如果使

用的是多聲道時(shí),此時(shí)的數(shù)據(jù)率為:

Bcdmultichannel=5.1×R×Fs=3.598Mb/s

同樣一個(gè)小時(shí)的多聲道格式的音樂需要1.62GB的存儲(chǔ)空間,遠(yuǎn)遠(yuǎn)大于CD的容量。同時(shí)當(dāng)前已應(yīng)用的多

聲道系統(tǒng)面臨著帶寬的問題。如美國的數(shù)字電視中僅僅給多聲道的音頻384kb/s的帶寬,在Internet音頻廣

播中,也只有56kb/s的數(shù)據(jù)通道,因此由上可知,多聲道數(shù)字音頻系統(tǒng)面臨者存儲(chǔ)容量和傳輸帶寬的限制。

如何將多聲道數(shù)字音頻數(shù)據(jù)率降低的同時(shí)又能夠保證音頻質(zhì)量,是多聲道數(shù)字音頻系統(tǒng)面臨的重大問題。眾

所周知,對(duì)于線性PCM來說,它的實(shí)現(xiàn)簡單,在高容量/高帶寬的前提下可以提供CD質(zhì)量的音頻信號(hào)。從另一

個(gè)角度來看,采樣精度的提高以及采樣頻率的提高,會(huì)帶來更高的音頻質(zhì)量,如將采樣精度由R=16提高到

R=24;將采樣頻率由Fs=44.1kHz或Fs=48kHz提高到Fs=96kHz或Fs=192kHz。這種發(fā)展趨勢(shì)已經(jīng)逐漸地由一些

錄音工程師和音樂制作商所接受,同樣多聲道數(shù)字音頻系統(tǒng)則也要順應(yīng)這種趨勢(shì)。但如果仍然采用線性PC

M,這無疑是增加了更大的數(shù)據(jù)量,提高了現(xiàn)有的數(shù)據(jù)率。

我們知道線性PCM并沒有充分利用音頻信號(hào)的特性進(jìn)行編碼,在PCM數(shù)據(jù)流中存在著大量的冗余信息。同時(shí)

要強(qiáng)調(diào)的是不管音頻信號(hào)如何編解碼、傳輸,最終還是要靠我們的人耳來實(shí)現(xiàn)的,如圖2所示,因此我們

可以充分地考慮人耳的聽覺特性,并加以利用,如人耳的掩蔽效應(yīng)、哈斯效應(yīng)等等。這樣就可以將音頻信

號(hào)中與人耳有關(guān)的那部分冗余信息去除掉,在編碼時(shí)則僅僅對(duì)有用的那部分音頻信號(hào)進(jìn)行編碼,從而降低

了參與編碼的數(shù)據(jù)量。同時(shí)再將編碼的信號(hào)進(jìn)行比特精度的分配,對(duì)于幅度比較大的信號(hào)或變化比較快的信號(hào)分配更多的比特?cái)?shù),而對(duì)于幅度小、變化慢的信號(hào)則減少比特?cái)?shù)的分配,從而達(dá)到減少數(shù)據(jù)率的可能性,實(shí)現(xiàn)編碼的高效率。當(dāng)然這種結(jié)果是以編碼過程復(fù)雜化為代價(jià)的。下面具體分析幾種聲學(xué)模型。

圖2編碼、傳輸、人耳聽音的實(shí)現(xiàn)

2.1根據(jù)聽覺域度對(duì)可聞信號(hào)進(jìn)行編碼

人耳對(duì)聲振動(dòng)的感受,在頻率及聲壓級(jí)方面都有一定的范圍,頻率范圍正常人約為20Hz~20kHz,而聲壓級(jí)范圍則是如圖聽閾曲線來描述的。意即在這條曲線之下的對(duì)應(yīng)頻率的信號(hào)是聽不到的。

圖16MPEG-2音頻混合后環(huán)繞聲兼容性如圖3所示,對(duì)于信號(hào)A來說,由于其聲壓級(jí)超過聽閾曲線的聲壓級(jí)域值,所以可以對(duì)人耳造成聲振動(dòng)的感

受,意即聽到A信號(hào)。而對(duì)B信號(hào)來說,其聲壓級(jí)位于聽閾曲線之下,雖然它是客觀存在的,但人耳是不可聞

的。因此,可以將類似的信號(hào)去除掉,以減少音頻數(shù)據(jù)率。

2.2根據(jù)掩蔽效應(yīng),只對(duì)幅度強(qiáng)的掩蔽信號(hào)進(jìn)行編碼

人耳能在寂靜的環(huán)境中分辨出輕微的聲音,但在嘈雜的環(huán)境中,同樣的這些聲音則被嘈雜聲淹沒而聽不

到了。這種由于一個(gè)聲音的存在而使另一個(gè)聲音要提高聲壓級(jí)才能被聽到的現(xiàn)象稱為聽覺掩蔽效應(yīng)。

如圖4所示,雖然B、C兩信號(hào)的聲壓級(jí)已超過聽閾曲線的范圍,人耳已可以聽到B、C兩信號(hào)的存在,但是由

于A信號(hào)的存在,通過前向掩蔽將C信號(hào)淹沒掉,通過后向掩蔽將B信號(hào)淹沒掉,從而最終到達(dá)人耳引起感覺

的只有A信號(hào)。因此,可以將類似的B、C信號(hào)去除掉以減少音頻數(shù)據(jù)率。

2.3量化噪聲使得不必全部編碼原始信號(hào)

類似于人耳的聽閾曲線,由于數(shù)字信號(hào)存在著量化噪聲,如圖5所示,對(duì)于信號(hào)A和B來說,并不一定要將A、

B信號(hào)進(jìn)行全部幅度的編碼,而只需將A、B信號(hào)與量化噪聲的差值進(jìn)行編碼就可以達(dá)到相同的聽覺效果,因

此,在編碼過程中實(shí)際量化幅度就可以大大的減少,而減少數(shù)據(jù)率。

2.4通過子帶分割來進(jìn)行優(yōu)化、編碼

在傳統(tǒng)的編碼過程中,都是將整個(gè)頻帶作為操作對(duì)象,采用相同的比特分配對(duì)每個(gè)信號(hào)進(jìn)行量化。而實(shí)際

上,由于聽覺曲線的存在及其它因素,對(duì)于幅度較小的信號(hào)可以分配較少的比特?cái)?shù)就可以達(dá)到要求,因此

將整個(gè)頻帶分成多個(gè)子頻帶,然后對(duì)每個(gè)子頻帶的信號(hào)獨(dú)立編碼,從而使得在每個(gè)子頻帶中比特分配可以

根據(jù)信號(hào)自身來適應(yīng)。

如圖ABCD四個(gè)信號(hào),如果對(duì)整個(gè)頻帶編碼,對(duì)于D信號(hào)來說分配16比特來量化則顯得多余浪費(fèi),所以如果

將ABCD分別置于不同的子帶內(nèi),則可在分別所處的子帶內(nèi)使用最適合的比特?cái)?shù)分配給信號(hào)來編碼,從而減

少數(shù)據(jù)率,同時(shí)如果用于分割的子帶分辨率越高,意即子帶的頻帶相對(duì)越窄,那么在子帶中分配的比特?cái)?shù)

就越精確,而減少了比特率。

2.5不同的實(shí)現(xiàn)方式

當(dāng)前在數(shù)字音頻編碼領(lǐng)域存在著各種不同的編碼方案和實(shí)現(xiàn)方式,為了能夠讓大家對(duì)此有一個(gè)較完整的認(rèn)

識(shí),在本文中僅對(duì)當(dāng)前流行的幾種典型的編碼方法做一個(gè)介紹。不管是通過那一種方式實(shí)現(xiàn),其基本的編

碼思路方框圖都大同小異,如圖7所示。對(duì)于每一個(gè)音頻聲道中的PCM音頻信號(hào)來說,首先都要將它們映射

到頻域中,這種時(shí)域到頻域的映射可以通過子帶濾波器(如MPEGLayersI,II,DTS)或通過變換濾波器

組(如AC-3,MPEGAAC)實(shí)現(xiàn)。這兩種方式的最大不同之處在于濾波器組中的頻率分辨率的不同。

每個(gè)聲道中的音頻采樣塊首先要根據(jù)心理聲學(xué)模型來計(jì)算掩蔽門限值,然后由計(jì)算出的掩蔽門限值來決定

如何將公用比特區(qū)中的比特分配給不同的頻率范圍內(nèi)的信號(hào),如MPEGLayersI,II,DTS所采用;或由計(jì)

算出的掩蔽門限值來決定哪些頻率范圍內(nèi)的量化噪聲可以引入而不需要去除,如AC-3,MPEGAAC所采用。

然后根據(jù)音頻信號(hào)的時(shí)域表達(dá)式進(jìn)行量化,隨后采用靜噪編碼(如MPEGLayersI,II,DTS,MPEGAAC)。

最后,將控制參數(shù)及輔助數(shù)據(jù)進(jìn)行交織產(chǎn)生編碼后的數(shù)據(jù)流。解碼過程則首先將編碼后的數(shù)據(jù)流進(jìn)行解復(fù)

用,然后通過比特流中傳輸?shù)目刂茀?shù)對(duì)音頻數(shù)據(jù)反量化,或通過心理聲學(xué)模型參數(shù)反向運(yùn)算得到音頻信

號(hào)(如AC-3),最后將得到的音頻信號(hào)由頻域反變換到時(shí)域,完成解碼過程。

另外多聲道數(shù)字音頻編碼技術(shù)還充分利用了聲道之間的相關(guān)性及雙耳聽覺效應(yīng),來進(jìn)一步去除聲道之間的

冗余度和不相關(guān)度。去除通道之間的相關(guān)度,一種最常用的方法是M/S方式,在這種方式中是將兩個(gè)獨(dú)立

聲道的頻譜相加和相減,根據(jù)兩個(gè)聲道的相關(guān)度大小,來決定是傳輸和/差信號(hào)還是傳輸原始信號(hào)。

由于人耳對(duì)于頻率超過2-3kHz的聲音定位主要是通過內(nèi)耳密度差分(IID)實(shí)現(xiàn)的,因此為了進(jìn)一步減少

數(shù)據(jù)率,將各個(gè)聲道中頻率超過約定門限值的信號(hào)組合后再進(jìn)行傳輸。這種技術(shù)應(yīng)用在MPEGLayersI,

II,III中,實(shí)現(xiàn)強(qiáng)度立體聲編碼;用在AC-3中對(duì)兩個(gè)聲道或耦合聲道實(shí)現(xiàn)多聲道編碼。在MPEGAAC中,

則既可實(shí)現(xiàn)強(qiáng)度立體聲編碼,又可實(shí)現(xiàn)多聲道編碼。

1、杜比數(shù)字AC-3編解碼壓縮過程

AC-3最早是在1991年的電影“BatmanReturns”中應(yīng)用的。它的應(yīng)用不僅在電影界占有一席之地,而且

它已被北美地區(qū)的數(shù)字電視及DVD視頻定為其數(shù)字音頻實(shí)施規(guī)范。我們熟知的AC-2,AC-3都是由兩聲道發(fā)

展而來的,即杜比數(shù)字(DolbyDigital)。對(duì)于數(shù)字音頻信號(hào)來說,通過應(yīng)用數(shù)字壓縮算法,來減少正

確再現(xiàn)原始脈沖編碼調(diào)制(PCM)樣本所需要的數(shù)字信息量,得出原始信號(hào)經(jīng)數(shù)字壓縮后的表達(dá)式。

3.1AC-3編碼過程

AC-3編碼器接受PCM音頻并產(chǎn)生相應(yīng)的AC-3數(shù)碼流。在編碼時(shí),AC-3算法通過對(duì)音頻信號(hào)的頻域表達(dá)式進(jìn)

行粗量化,達(dá)到高的編碼增益(輸入碼率對(duì)輸出碼率之比)。如圖8所示。

編碼過程的第一步是把音頻表達(dá)式從一個(gè)PCM時(shí)間樣本的序列變換為一個(gè)頻率系數(shù)樣本塊的序列。這在分

析濾波器中完成。512個(gè)時(shí)間樣本的相互重疊樣本塊被乘以時(shí)間窗而變換到頻域。由于相互重疊的樣本

塊,每個(gè)PCM輸入樣本將表達(dá)在兩個(gè)相繼的變換樣本塊中。頻域表達(dá)式則可以二取一,使每個(gè)樣本塊包含

256個(gè)頻率系數(shù)。這些單獨(dú)的頻率系數(shù)用二進(jìn)制指數(shù)記數(shù)法表達(dá)為一個(gè)二進(jìn)制指數(shù)和一個(gè)尾數(shù)。這個(gè)指數(shù)

的集合被編碼為信號(hào)頻譜的粗略表達(dá)式,稱作頻譜包絡(luò)。核心的比特指派例行程序用這個(gè)頻譜包絡(luò),確

定每個(gè)單獨(dú)尾數(shù)需要用多少比特進(jìn)行編碼。將頻譜包絡(luò)和6個(gè)音頻樣本塊粗略量化的尾數(shù),格式化成一個(gè)

AC-3數(shù)據(jù)幀(FRAME)。AC-3數(shù)碼流是一個(gè)AC-3數(shù)據(jù)幀的序列。

在實(shí)際的AC-3編碼器中,還包括下述功能:

l附有一個(gè)數(shù)據(jù)幀的信頭(header),其中包含與編碼的數(shù)碼流同步及把它解碼的信息(比特

率、取樣率、編碼的信道數(shù)目等)。

l插入誤碼檢測碼字,以便解碼器能檢驗(yàn)接收的數(shù)據(jù)幀是否有誤碼。

l可以動(dòng)態(tài)的改變分析濾波器組的頻譜分辨率,以便同每個(gè)音頻樣本塊的時(shí)域/頻域特性匹配的

更好。

l頻譜包絡(luò)可以用可變的時(shí)間/頻率分辨率進(jìn)行編碼。

l可以實(shí)行更復(fù)雜的比特指派,并修改核心比特分派例行程序的一些參數(shù),以便產(chǎn)生更加優(yōu)化

的比特指派。

l一些聲道在高頻可以耦合在一起,以便工作在較低比特率時(shí),可得到更高的編碼增益。

l在兩聲道模式中,可以有選擇的實(shí)行重新設(shè)置矩陣的過程,以便提供附加的編碼增益,以及

當(dāng)兩信道的信號(hào)解碼時(shí)使用一個(gè)矩陣環(huán)繞聲解碼器,還能獲得改進(jìn)的結(jié)果。

3.2AC-3解碼過程

解碼過程基本上是編碼的逆過程。解碼器必須同編碼數(shù)碼流同步,檢查誤碼,以及將不同類型的數(shù)據(jù)

(例如編碼的頻譜包絡(luò)和量化的尾數(shù))進(jìn)行解格式化。運(yùn)行比特指派例行程序,將其結(jié)果用于解數(shù)據(jù)

大包(unpack)和尾數(shù)的解量化。將頻譜包絡(luò)進(jìn)行解碼而產(chǎn)生各個(gè)指數(shù)。各個(gè)指數(shù)和尾數(shù)被變換回到

時(shí)域成為解碼的PCM時(shí)間樣本。如圖9所示:

圖9AC-3解碼過程框圖

在實(shí)際的AC-3解碼器中,還包括下述功能:

l假若檢測出一個(gè)數(shù)據(jù)誤碼,可以使用誤碼掩蓋或靜噪。

l高頻內(nèi)容耦合在一起的那些聲道必須去除耦合。

l無論何時(shí)已被重新設(shè)置矩陣的聲道,必須進(jìn)行去除矩陣化的過程(在2-聲道模式中)。

l必須動(dòng)態(tài)的改變綜合濾波器組的分辨率,與編碼器分析濾波器組在編碼過程中所用的方法

相同。

3.3杜比數(shù)字AC-3編碼數(shù)據(jù)格式

經(jīng)過杜比數(shù)字AC-3編碼器的編碼處理,可以將原始的數(shù)據(jù)PCM信號(hào)編碼為杜比數(shù)字AC-3音頻數(shù)據(jù)流。

一個(gè)AC-3串行編碼的音頻數(shù)據(jù)流是由一個(gè)同步幀的序列所組成。如圖10所示。

由圖可見,每個(gè)同步幀包含六個(gè)編碼的音頻樣本塊(AB)其中每個(gè)代表256個(gè)新的音頻樣本。在

每個(gè)同步幀開始的同步信息(SI)的信頭中,包含為了獲得同步和維持同步所需要的信息。接著SI后

面的是數(shù)碼流信息(BSI)的信頭;它包含描述編碼數(shù)據(jù)流業(yè)務(wù)的各種參數(shù)。編碼的音頻樣本塊之后接

著是一個(gè)輔助數(shù)據(jù)(AUX)字段。在每個(gè)同步幀結(jié)尾處是誤碼檢驗(yàn)字段,其中包含一個(gè)用于誤碼檢測的

CRC字。一個(gè)附加的CRC字位于SI信頭中,以供選用。

AB0~AB5的每一塊代表一個(gè)編碼通道,可以被分別獨(dú)立解碼,塊的大小可以調(diào)整,但總數(shù)據(jù)量不變。在

圖中還有兩個(gè)未標(biāo)出的CRC,其中第一個(gè)位于幀的5/8處,另一個(gè)位于幀未。之所以如此安排,目的就

是可以減少解碼器的RAM需求量,使得解碼器不必完全接收一幀后才解碼音頻數(shù)據(jù),而是分成了兩部

分進(jìn)行解碼。

3.4杜比數(shù)字AC-3的兼容性

由于AC-3比特流中同步結(jié)構(gòu)中的AB0~AB5是獨(dú)立解碼的,因此可以將這些編碼信號(hào)重新構(gòu)造為所需的輸

出信號(hào),即輸出的下行兼容性。如圖11所示。

圖11AC-3輸出的下行兼容性

在許多重放系統(tǒng)中,揚(yáng)聲器的數(shù)目不能同編碼的音頻聲道的數(shù)目匹配。為了重現(xiàn)完整的音頻節(jié)目

需要向下混合。在幀同步中,AB0~AB5中記錄著六個(gè)獨(dú)立聲道的音頻數(shù)據(jù),按照AC-3重放時(shí)的安排,

我們稱之為L、R、C、Ls、Rs、LFE。一般用于向下混合的過程中,低音增強(qiáng)LFE通道記錄的音頻信號(hào)

主要用于渲染烘托氣氛,所以向下混合時(shí),只用其中的L、R、C、Ls、Rs。從圖中可以看到編碼后的

AC-3數(shù)據(jù)流可以直接傳輸后經(jīng)解碼器解碼為5.1通道音頻信息進(jìn)行重放,也可以向下混合為兩個(gè)聲道

信號(hào),然后經(jīng)不同的解碼器得到不同的重放模式。就單一環(huán)繞聲道(n/1模式)而言,把S稱為單個(gè)

環(huán)繞聲道。從圖中可看出,向下混合提供兩種類型:向下混合為Lt、Rt矩陣環(huán)繞編碼的立體聲對(duì);

向下混合為通常的立體聲信號(hào)Lo、Ro。向下混合的立體聲信號(hào)(Lo、Ro或Lt、Rt)可進(jìn)一步向下混

合為單聲道M,通過兩個(gè)聲道簡單的相加即可。如果將Lt、Rt向下混合為單聲道,環(huán)繞信息將會(huì)丟

失。當(dāng)希望需要一個(gè)單聲道信號(hào)時(shí)則Lo、Ro向下混合更可取。

用于Lo、Ro立體聲信號(hào)的一般3/2向下混合方程式為:

Lo=1.0′L+clev′C+slev′Ls;

Ro=1.0′R+clev′C+slev′Rs;

如果接著Lo、Ro被組合成單聲道信號(hào)重放,有效的向下混合方程式為:

M=1.0′L+2.0′clev′C+1.0′R+slev′Ls+slev′Rs;

如果只出現(xiàn)單個(gè)環(huán)繞聲道S(3/1模式),則向下混合方程式為:

Lo=1.0′L+clev′C+0.7′slev′S;

Ro=1.0′R+clev′C+0.7′slev′S;

M=1.0′L+2.0′clev′C+1.0′R+1.4′slev′S;

其中clev、slev分別代表中央聲道混合聲級(jí)系數(shù)和環(huán)繞聲道混合聲級(jí)系數(shù),在BSI數(shù)據(jù)中由

Cmixlev、Surmixlev比特字段來指出相對(duì)應(yīng)的值。

用于Lt、Rt立體聲信號(hào)的一般3/2向下混合方程式為:

Lt=1.0′L+0.707′C-0.707′Ls-0.707′Rs;

Rt=1.0′R+0.707′C+0.707′Ls+0.707′Rs;

如果只出現(xiàn)單個(gè)環(huán)繞聲道S(3/1模式),則向下混合方程式為:

Lt=1.0′L+0.707′C-0.707′S;

Rt=1.0′R+0.707′C+0.707′S;

經(jīng)過對(duì)獨(dú)立聲道的音頻信號(hào)進(jìn)行不同的分配及矩陣重組,則實(shí)現(xiàn)了AC-3數(shù)據(jù)流的向下兼容性,

意即通過不同的解碼器、解碼矩陣方式,可以得到杜比數(shù)字5.1聲道環(huán)繞聲、立體聲、杜比

Prologic、單聲道以及杜比的虛擬環(huán)繞聲方式。其中Lo、Ro與Lt、Rt的最大區(qū)別就是Lt、Rt是

錄的全部的L、R、環(huán)繞聲的信息,經(jīng)過矩陣重解可得到環(huán)繞聲信息,而Lo、Ro則是將環(huán)繞聲信

息增加支立體聲信號(hào)中,無法再重現(xiàn)環(huán)繞聲信號(hào)信息。

4、MPEG-2多聲道編解碼過程

MPEG-2感知編碼系統(tǒng)充分利用了心理聲學(xué)中的掩蔽效應(yīng)和哈斯效應(yīng),利用壓縮編碼技術(shù),將原始

音頻信號(hào)中不相關(guān)分量和冗余分量有效的去除掉,在不影響人耳聽覺閾度和聽音效果質(zhì)量上,將

音頻信號(hào)壓縮。

4.1MPEG音頻子帶編碼器的基本結(jié)構(gòu)

感知型子帶音頻編碼器不斷地對(duì)音頻輸入信號(hào)進(jìn)行分析。由一個(gè)心理聲學(xué)模型動(dòng)態(tài)地確定掩蔽門限,

即在該掩蔽門限之下的多余的噪聲是無法為人的聽覺系統(tǒng)聽到的。由該心理聲學(xué)模型產(chǎn)生的信息被

饋至一個(gè)比特分配模塊,該模塊的任務(wù)是將各聲道可用的比特以一種優(yōu)化的方式在頻譜范圍內(nèi)進(jìn)行

分配。輸入信號(hào)還與上述過程并行地被分割到一系列稱為子帶的頻帶中。每個(gè)子帶信號(hào)都在經(jīng)過定

標(biāo)處理后被重新進(jìn)行量化,該量化編碼過程引入的量化噪聲不能超過已確定的對(duì)應(yīng)子帶的掩蔽門限。

因此量化噪聲頻譜就與信號(hào)頻譜進(jìn)行了動(dòng)態(tài)自適應(yīng)?!氨壤蜃印焙透髯訋褂玫牧炕鞯南嚓P(guān)

信息與編碼后的子帶樣值一同進(jìn)行傳輸。

解碼器可以在不了解編碼器如何確定編碼所需信息的情況下對(duì)碼流進(jìn)行解碼。這可以降低解碼器的

復(fù)雜度,并為編碼器的選擇和解碼器開發(fā)提供了很大的靈活性。如在心理聲學(xué)研究上取得了新的結(jié)

果,則更高效率和更高性能的編碼器可在與所有現(xiàn)有解碼器完全兼容的條件下得以應(yīng)用。這一靈活

性目前已有了成功的例子,現(xiàn)在最高技術(shù)水平的編碼器的性能已超過了標(biāo)準(zhǔn)化過程中使用的早期編

碼器。如圖12所示。

圖12(a)MPEG音頻編碼器框圖

4.2層

MPEG音頻標(biāo)準(zhǔn)包括了三種不同的算法,稱為層。層數(shù)越高,相應(yīng)可達(dá)到的壓縮比就越高,而復(fù)雜度、

延時(shí)及對(duì)傳輸誤碼的敏感度也越高。層II專門對(duì)廣播應(yīng)用進(jìn)行了優(yōu)化。它使用了具有32個(gè)等寬子帶劃

分的子帶濾波,自適應(yīng)比特分配和塊壓擴(kuò)。單聲道的碼率范圍為32-192kbps,立體聲為64-384kbps。

它在256kbps及192kbps相關(guān)立體聲條件下的表現(xiàn)十分出色。128kbps(立體聲)條件下的性能在許

多應(yīng)用中仍可接受。

4.3MPEG-2在多聲道音頻方面的擴(kuò)展

ITU-R工作組TG10-1在關(guān)于多聲道聲音系統(tǒng)的建議方面進(jìn)行了工作。該項(xiàng)工作的主要成果就是建議

BS.775,其中說明一個(gè)適當(dāng)?shù)亩嗦暤缆曇襞渲脩?yīng)包含五個(gè)聲道,分別代表左、中央、右、左環(huán)繞、右

環(huán)繞聲道。如果使用了一個(gè)作為選項(xiàng)的低頻增強(qiáng)聲道(LFE),則該配置被稱為“5.1”。五聲道配置

也可表示為‘3/2’,即三個(gè)前置聲道及兩個(gè)環(huán)繞(后置)聲道。

MPEG已認(rèn)識(shí)到應(yīng)根據(jù)ITU-R建議775來增加音頻標(biāo)準(zhǔn)的多聲道能力的必要性。

這是在第二階段完成的,由此產(chǎn)生了MPEG-2音頻標(biāo)準(zhǔn)。在多聲道聲音方面的擴(kuò)展支持在一路碼流中傳

輸五個(gè)輸入聲道、低頻增強(qiáng)聲道以及7個(gè)旁白聲道。該擴(kuò)展與MPEG-1保持前向及后向兼容。前向兼容性

意味著多聲道解碼器可正確地對(duì)立體聲碼流進(jìn)行解碼。后向兼容性則意味著一個(gè)標(biāo)準(zhǔn)的立體聲解碼器

在對(duì)多聲道碼流進(jìn)行解碼時(shí)可輸出兼容的立體聲信號(hào)。

這是通過一種真正的可分級(jí)方式實(shí)現(xiàn)的。在編碼器端,五個(gè)輸入聲道被向下混合為一路兼容立體聲信

號(hào)。該兼容立體聲信號(hào)按照MPEG-1標(biāo)準(zhǔn)進(jìn)行編碼。所有用于在解碼器端恢復(fù)原來的五個(gè)聲道的信息都

被置于MPEG-1的附加數(shù)據(jù)區(qū)內(nèi),該數(shù)據(jù)區(qū)被MPEG-1解碼器忽略。這些附加的信息在信息聲道T2、T3及

T4以及LFE聲道中傳輸,這幾個(gè)信息聲道通常包含中央、左環(huán)繞和右環(huán)繞聲道。MPEG-2多聲道解碼器不

但對(duì)碼流中的MPEG-1部分進(jìn)行解碼,還對(duì)附加信息聲道T2、T3、T4及LFE解碼。根據(jù)這些信息,它可

以恢復(fù)原來的5.1聲道聲音。如圖13所示。

13MPEG-2編碼器/解碼器框圖

當(dāng)相同碼流饋送至MPEG-1解碼器時(shí),解碼器將只對(duì)碼流的MPEG-1部分進(jìn)行解碼,而忽略所有附加的多

聲道信息。由此它將輸出在MPEG-2編碼器中經(jīng)向下混合產(chǎn)生的兩個(gè)聲道。這種方式實(shí)現(xiàn)了與現(xiàn)有的雙

聲道解碼器的兼容性。也許更為重要的是,這種可分級(jí)的方式使得即使在多聲道業(yè)務(wù)中仍可使用低成

本的雙聲道解碼器。考慮到所使用的其它所有編碼策略,多聲道業(yè)務(wù)中的雙聲道解碼器本質(zhì)上就是一

個(gè)對(duì)所有聲道進(jìn)行解碼并在解碼器中產(chǎn)生雙聲道向下混合信號(hào)的多聲道解碼器。如圖14所示。

就其包含了不同的可由編碼器使用以進(jìn)一步提高音頻質(zhì)量的技術(shù)而言,該標(biāo)準(zhǔn)是具有很大靈活性的。

4.4定向邏輯兼容性

如果源素材已經(jīng)經(jīng)過環(huán)繞聲編碼(如Dolby環(huán)繞聲),廣播業(yè)者可能希望將它直接播送給聽眾。一種

選擇是將該素材直接以2/0(僅為立體聲)模式播送。環(huán)繞聲編碼器主要是將中央聲道信號(hào)分別與左

右聲道信號(hào)同相相加,而將環(huán)繞聲道信號(hào)分別與左右聲道信號(hào)反相相加。為能對(duì)這些信息正確解碼,

編解碼器必須保持左右聲道彼此之間的幅度和相位關(guān)系。這在MPEG編碼中是通過限制強(qiáng)度立體聲編碼

只能在高于8kHz的頻率范圍內(nèi)使用而得以保障的,因?yàn)榄h(huán)繞聲編碼僅在低于7kHz的范圍內(nèi)使用環(huán)繞聲

道信息。如圖15所示。

圖15使用MPEG-1音頻播送環(huán)繞聲素材

當(dāng)傳輸多聲道信息時(shí),與現(xiàn)有(專利的)環(huán)繞聲解碼器的兼容性可通過幾種手段得以實(shí)現(xiàn)。多聲

道編碼器在工作時(shí)使用一個(gè)環(huán)繞聲兼容的矩陣。這可以使立體聲解碼器能夠接收環(huán)繞聲編碼的信號(hào),

并可選擇將其傳送給環(huán)繞聲解碼器。一個(gè)完整的多聲道解碼器將對(duì)所有信號(hào)進(jìn)行再變換,以獲得原來

的多聲道表現(xiàn)。MPEG-2多聲道語法支持這種模式,進(jìn)而也為DVB規(guī)范所支持。如圖16所示。

4.5MPEG-2在低采樣率方面的擴(kuò)展

除了在多聲道方面的擴(kuò)展外,MPEG-2音頻還包含了MPEG-1音頻在低采樣率方面的擴(kuò)展。該擴(kuò)展的目的

是以一種簡單的方式獲得改進(jìn)的頻譜分辨率。通過將采樣率減半,頻率分辨率就提高了兩倍,但時(shí)間

分辨率則劣化了兩倍。這可使許多穩(wěn)態(tài)信號(hào)獲得更好的質(zhì)量,而對(duì)一些在時(shí)間特性上要求嚴(yán)格的信號(hào)

而言質(zhì)量則下降了。半采樣率的使用是在碼流中通過將每幀幀頭中的某一比特,即ID位置設(shè)為“0”

來表示的。而且,可用碼率表也進(jìn)行了修改,以便在低碼率條件下提供更多的選擇,每個(gè)子帶可用的

量化器也為適應(yīng)更高的頻率分辨率作了修改。

5、先進(jìn)音頻編碼(AdvancedAudioCoding-AAC)

MPEGAAC(先進(jìn)音頻編碼)是于1997年成為ISO/IEC標(biāo)準(zhǔn)的(參見ISO/IEC13818)。AAC是以新建立

的MPEG-4標(biāo)準(zhǔn)中的時(shí)域到頻域映射的編碼算法組成的。AAC從提高效率的角度出發(fā),放棄了與原

MPEG-1解碼器的后向兼容性,這也是該算法在開始時(shí)被稱為NBC的原因。

5.1AAC的主要特點(diǎn)

AAC可以支持1到48路之間任意數(shù)目的音頻聲道組合、包括15路低頻效果聲道、配音/多語聲聲道,以

及15路數(shù)據(jù)。它可同時(shí)傳送16套節(jié)目,每套節(jié)目的音頻及數(shù)據(jù)結(jié)構(gòu)可任意規(guī)定。在碼率為64kbps/聲

道的條件下,AAC可以提供很高的聲音質(zhì)量。

根據(jù)不同的應(yīng)用場合,AAC提供了三種類型(Profile)以供選擇,即主要類型(MainProfile)、

低復(fù)雜度類型(LowComplexityProfile)、可放縮采樣率類型(ScaleableSamplingRate,SSR

Profile)。因而其可應(yīng)用范圍很廣。

5.2AAC算法結(jié)構(gòu)

為提高音頻編碼效率,AAC采用了許多先進(jìn)技術(shù),如霍夫曼編碼、相關(guān)立體聲、聲道耦合、反向自適

應(yīng)預(yù)測、時(shí)域噪聲整形、修正離散余弦變換(MDCT)、及混合濾波器組等。其算法基本結(jié)構(gòu)框圖如圖17所示。

其中,濾波器組與MPEG層III所采用的濾波器組相比,由于層III算法在對(duì)濾波器進(jìn)行選擇時(shí)考慮了兼

容性問題,因而具有固有的結(jié)構(gòu)上的不足;而AAC則直接采用了MDCT變換濾波。同時(shí),AAC增加了窗口

長度,由1152點(diǎn)增至2048,使MDCT的性能優(yōu)于原來的濾波器組。

時(shí)域噪聲整形(TNS)技術(shù)是時(shí)域/頻域編碼中一項(xiàng)新穎的技術(shù)。它利用頻域的自適應(yīng)預(yù)測的結(jié)果來對(duì)

時(shí)域中量化噪聲的分布進(jìn)行整形處理。通過采用TNS技術(shù),可以使特殊環(huán)境下的話音信號(hào)質(zhì)量得到顯著

的提高。

后向自適應(yīng)預(yù)測是一項(xiàng)在語音信號(hào)編碼系統(tǒng)領(lǐng)域建立起來的技術(shù)。它主要利用了某一特定形式的音頻

信號(hào)易于預(yù)測的特點(diǎn)。

在量化過程中,通過對(duì)量化精度更為精細(xì)的控制,可以使給定的碼率得到更加有效的利用。

在碼流復(fù)接時(shí),通過對(duì)必須傳輸?shù)男畔⑦M(jìn)行熵編碼使冗余度降至最低。

通過以上各種編碼技術(shù)的運(yùn)用以及采用一種可變的碼流結(jié)構(gòu),使AAC編碼算法在得到大大優(yōu)化的同時(shí),

也為將來進(jìn)一步提高編碼效率提供了可能性。

事實(shí)上,在AAC編碼的三種類型中,各種編碼技術(shù)的使用也是不同的,也就是說,三種類型的算法復(fù)雜

度是不同的。這一不同考慮了編、解碼兩端的算法復(fù)雜度。例如,后向自適應(yīng)預(yù)測約占解碼運(yùn)算量的

45%左右,在LC和SSR類型中都沒有采用這一技術(shù)。另外,在LC類型中,TNS濾波器的長度被限制為12個(gè)

系數(shù),但仍保持了18KHz帶寬;在SSR類型中,TNS也只使用12個(gè)系數(shù),并且?guī)捪拗茷?KHz,同時(shí)該

類型也沒有采用聲道耦合技術(shù),在混合濾波器組的結(jié)構(gòu)及增益控制方面也與另兩種類型不同。

AAC可以在低數(shù)據(jù)率的情況下提供較高質(zhì)量的音頻信息,如每個(gè)聲道僅64kb/s時(shí)就會(huì)有比較好的性能。

AAC當(dāng)前的應(yīng)用主要用于日本的數(shù)字音頻廣播及美國的IBOC(帶內(nèi)同頻技術(shù))。

6、用于DTS的相干聲學(xué)編碼

DTS系統(tǒng)中采用的數(shù)字音頻壓縮算法——相干聲學(xué)編碼,主要目的就是用于提高民用音頻重放設(shè)備重放

的音頻質(zhì)量的,其音頻重放質(zhì)量可以超越原有的如CD唱片的質(zhì)量。同時(shí)通過更多揚(yáng)聲器的使用,使得

聽眾可以感受到普通立體聲無法達(dá)到的聲音效果。因此總體目標(biāo)就是將聽眾真正的帶入專業(yè)的音響領(lǐng)

域及多聲道環(huán)繞聲的天地。

相干聲學(xué)編碼器是一種感知、優(yōu)化、差分子帶音頻編碼器,它使用了多種技術(shù)對(duì)音頻數(shù)據(jù)進(jìn)行壓縮。下

面將分別對(duì)其進(jìn)行詳細(xì)的描述。從整體來看,編碼器與解碼器的實(shí)現(xiàn)是不對(duì)稱的。理論上編碼器可以

設(shè)計(jì)的非常復(fù)雜,但實(shí)際上,編碼器發(fā)展成為包括兩種音頻分析的模式。解碼器與編碼器相比則簡單的

多,因?yàn)榻獯a算法是根據(jù)編碼數(shù)據(jù)流中的參數(shù)來控制的,解碼器不需要做任何的計(jì)算來決定重放的音頻

質(zhì)量。6.1編碼過程

編碼過程中的第一步是通過一個(gè)多相濾波器組將每個(gè)聲道的全頻帶24比特線性PCM源信號(hào)進(jìn)行分割到一定

數(shù)目的子帶中去。這種濾波方式提供了一種框架,既可以消除頻譜滾降較快的音頻信號(hào)分量,同時(shí)又去除

了感知上的冗余度。多相濾波器只要通過低復(fù)雜度的計(jì)算就可以實(shí)現(xiàn)更好的線性、更高的理論編碼增益和

更理想的阻帶衰減。每一個(gè)子帶信號(hào)都包含了相應(yīng)的、嚴(yán)格限制帶寬的線性PCM音頻數(shù)據(jù)。子帶的個(gè)數(shù)及

相應(yīng)的帶寬是由源信號(hào)的帶寬來決定的,一般情況下分為32個(gè)獨(dú)立的子帶。

圖18相干聲學(xué)編碼器流程圖

在每個(gè)子帶中進(jìn)行差分編碼(子帶ADPCM),這一步可以去除信號(hào)中的客觀冗余量,如周期很短的信號(hào)。

通過對(duì)信號(hào)的對(duì)比分析、心理聲學(xué)及信號(hào)瞬態(tài)的分析可以判斷信號(hào)中的感知冗余信息。通過子帶范圍比特

率的選擇和上述分析的結(jié)果,來調(diào)整對(duì)每個(gè)信號(hào)的差分編碼程序的執(zhí)行。差分編碼與心理聲學(xué)模型(如噪

聲掩蔽門限)的結(jié)合可以得到較高的編碼效率,甚至可以在不影響主觀聽覺的基礎(chǔ)上進(jìn)一步降低比特率。

如果使用較高的比特率,那么對(duì)于心理聲學(xué)模型的依賴性則相對(duì)較弱,但可以肯定隨著比特率的增加,

編碼信號(hào)的保真度也會(huì)提高。

比特指派程序管理著所有音頻聲道中子帶信息的編碼指派和分配。在時(shí)間和頻率上的自適應(yīng)可以優(yōu)化音頻

質(zhì)量。作為音頻編碼系統(tǒng)設(shè)計(jì)的基礎(chǔ),比特指派程序通過對(duì)音頻信號(hào)比特的分配和使用的比特率來決定音

頻質(zhì)量。通過在編碼策略中獨(dú)立的執(zhí)行這些程序使得運(yùn)算的復(fù)雜程度大大提高,但是這樣做卻可以使得解

碼器相對(duì)的簡單。相反,隨著比特率的增加,比特指派程序的靈活性也將大大降低,但是可以確保音頻質(zhì)

量的透明性。

編碼過程中最后一步就是將來自每個(gè)子帶ADPCM處理后的音頻數(shù)據(jù)進(jìn)行數(shù)據(jù)復(fù)用(或稱打包)。數(shù)據(jù)復(fù)用

器將所有聲道中子帶數(shù)據(jù)加上附加的輔助信息進(jìn)行打包,形成特殊數(shù)據(jù)語法格式的編碼數(shù)據(jù)流。在數(shù)據(jù)流

中加入的同步信息將用于解碼器對(duì)編碼數(shù)據(jù)流的同步。

6.2

對(duì)編碼數(shù)據(jù)流同步以后,首先就是對(duì)編碼數(shù)據(jù)流進(jìn)行解包,如果必要的話還將對(duì)編碼數(shù)據(jù)流進(jìn)行檢錯(cuò)及誤

碼校正,然后將解包的音頻數(shù)據(jù)送到相應(yīng)聲道的子帶中去。

圖19相干聲學(xué)解碼器流程圖

第二步是通過在每個(gè)子帶中傳輸?shù)妮o助信息指令,對(duì)子帶中的差分信號(hào)進(jìn)行反量化得到子帶PCM信號(hào)。這

些通過反量化得到的子帶PCM信號(hào)再進(jìn)行反濾波處理,得到每個(gè)聲道的全頻帶的時(shí)域PCM信號(hào)。在解碼器中,

沒有程序用于音頻質(zhì)量的調(diào)整。

在解碼器中包括一個(gè)可選的DSP功能模塊,這個(gè)模塊主要用于用戶的編程使用。它允許對(duì)單個(gè)聲道或全部

聲道中子帶或是全頻帶PCM信號(hào)進(jìn)行處理。這些功能諸如上矩陣變換、下矩陣變換、動(dòng)態(tài)范圍控制以及聲

道之間的延時(shí)調(diào)整等。

6.3

DTS系統(tǒng)最早是用于電影應(yīng)用中的。在1993年的電影“JurassicPark”(侏羅紀(jì)公園)中,沒有使用

AC-3,而是使用了DTS多聲道數(shù)字音頻系統(tǒng)。DTS系統(tǒng)中的音頻數(shù)據(jù)是存儲(chǔ)在一張CD-ROM上的,取代了將聲

音記錄在膠片上的方式,而是在膠片上記錄用于同步CD-ROM音頻信息的時(shí)間碼,通過電影膠片上的時(shí)間碼

來同步播放CD-ROM。由于CD-ROM與電影膠片磁跡相比,具有更大的容量和更穩(wěn)定的可靠程度,因此它可以

在4:1壓縮比的情況下提供質(zhì)量更高的多聲道音頻信息。對(duì)于AC-3來說,典型的壓縮比為12:1。隨著應(yīng)

用的普及,DTS系統(tǒng)又提出一種低數(shù)據(jù)率版本,其參數(shù)規(guī)范如下:

音頻聲道的個(gè)數(shù)DTS=1——10.1

FsDTS=8——192kHz

RDTS=16——24bit

BDTS=32——6144kb/s

數(shù)據(jù)幀大小DTS=512樣本

在低數(shù)據(jù)率版本中,由0到24kHz的32個(gè)子帶的頻率,通過一個(gè)512抽頭的多相正交鏡象濾波器(PQMF)來

實(shí)現(xiàn)從時(shí)域到頻域的映射。另外8個(gè)附加的子帶覆蓋了24kHz到48kHz之間頻率范圍,2個(gè)附加的子帶覆蓋了

48kHz到96kHz之間的頻率范圍。為了進(jìn)一步減小冗余度,采用了前向自適應(yīng)線性預(yù)測,同時(shí)心理聲學(xué)模

型用來對(duì)信號(hào)進(jìn)行預(yù)測,在量化過程中使用了標(biāo)度量化和矢量量化。

DTS的大多數(shù)應(yīng)用都是采用相對(duì)較小的壓縮比、工作在幾乎無損情況的模式下的。一般來說,數(shù)據(jù)率在

1Mb/s的情況下,DTS可以提供較好質(zhì)量的音頻。DTS的應(yīng)用也主要是在電影、CD及DVD視頻中。另外,DTS

所具有的可變比特率編碼方式使得它同樣可以應(yīng)用于DAB及DVD的廣播中。

7、

數(shù)字音頻廣播系統(tǒng)的發(fā)展是從85年以后開始的,其中包括了我們熟知的Eureka147DAB(尤里卡147數(shù)字

音頻廣播)和DVB。不斷發(fā)展的數(shù)字調(diào)制方式及編碼算法都為數(shù)字音頻廣播提供了更加有效的傳輸和存儲(chǔ)

方式,使得在有限的帶寬中以較低比特率來傳輸聲道數(shù)更多、質(zhì)量更優(yōu)的音頻信號(hào)成為可能。同樣在數(shù)字

音頻廣播系統(tǒng)的發(fā)展中也充分利用了這些以此為核心的新技術(shù)。以前,立體聲廣播起著主導(dǎo)的作用,現(xiàn)在

隨著越來越多的多聲道數(shù)字音頻系統(tǒng)的應(yīng)用,在數(shù)字音頻廣播領(lǐng)域也已經(jīng)開始接納并制定相關(guān)的音頻標(biāo)準(zhǔn)

了。在Eureka147DAB和DVB中,已經(jīng)包括了多聲道數(shù)字音頻的擴(kuò)展。

7.1

Eureka147DAB國際協(xié)議是于1986年由16個(gè)歐洲成員組織為制定數(shù)字音頻廣播標(biāo)準(zhǔn)而制定的標(biāo)準(zhǔn)規(guī)范。隨

后又有一些新的組織機(jī)構(gòu)加入到這項(xiàng)協(xié)議工作中去,并于1995年形成了第一個(gè)DAB的標(biāo)準(zhǔn)。在同一年中,

世界范圍的DAB論壇也相繼成立,它們的目標(biāo)就是促進(jìn)世界各地更多的組織機(jī)構(gòu)采用以Eureka147DAB為

藍(lán)本的數(shù)字音頻廣播的實(shí)現(xiàn)。

Eureka147DAB系統(tǒng)的設(shè)計(jì)是用來取代現(xiàn)行的FM廣播業(yè)務(wù)的,它采用COFDM(編碼正交頻分復(fù)用)以便于

更好地進(jìn)行移動(dòng)接收和克服多徑效應(yīng),載波采用DQPSK(差值正交相移鍵控)進(jìn)行調(diào)制,通道編碼采用卷

積編碼,以滿足可調(diào)整碼率的需要。

Eureka147DAB系統(tǒng)使用1.536MHz的頻譜帶寬來傳輸最大不超過1.5Mb/s的數(shù)據(jù),因此對(duì)于多聲道來說,

如為6個(gè)聲道,則每個(gè)聲道的數(shù)據(jù)率最大不超過256kb/s。對(duì)于聲道如何分配及使用,則是根據(jù)節(jié)目數(shù)量/

數(shù)據(jù)業(yè)務(wù)與音頻質(zhì)量來折衷考慮的。由于早期的Eureka147DAB源編碼的發(fā)展沒有反映出當(dāng)前最新發(fā)展的

技術(shù),同時(shí)由于歷史原因及DAB標(biāo)準(zhǔn)由歐洲制定,而歐洲長期以來都采用的是MPEG技術(shù),考慮到兼容等問

題,因此DAB系統(tǒng)中音頻編碼系統(tǒng)采用的是MPEGLayerII編碼方案。不能說MPEGLayerII編碼方案有什么

不好,但是如果我們綜觀當(dāng)前多聲道數(shù)字音頻系統(tǒng)的最新發(fā)展,不難看出,有更多更好的方案可以被采用,

如在提高聲音質(zhì)量上可采用DTS系統(tǒng),在增加聲道數(shù)目上可采用MPEGAAC系統(tǒng)。

7.2

DVB項(xiàng)目是在1993年由220多個(gè)世界組織來制定建立的。這些世界組織包括廣播業(yè)者、制造商、網(wǎng)絡(luò)管理者

和致力于發(fā)展數(shù)字電視標(biāo)準(zhǔn)的各種組織機(jī)構(gòu)。最早的DVB業(yè)務(wù)是在歐洲開始的,現(xiàn)在DVB標(biāo)準(zhǔn)不僅是歐洲的

數(shù)字電視標(biāo)準(zhǔn),而且它也擴(kuò)展到亞洲、非洲、美洲及澳大利亞等地區(qū),成為這些地區(qū)數(shù)字電視的選擇標(biāo)準(zhǔn)

之一。與此不同的美國采用的是ATSC系統(tǒng)。

在DVB的標(biāo)準(zhǔn)中規(guī)定了三個(gè)子系統(tǒng):DVB-S(衛(wèi)星)、DVB-C(有線)和DVB-T(地面)系統(tǒng)。DVB-S系統(tǒng)是

一種單載波系統(tǒng),是最早實(shí)現(xiàn)的DVB標(biāo)準(zhǔn),它是建立在正交相移鍵控(QPSK)調(diào)制和通道編碼(卷積編碼

和里得-所羅門塊編碼)的基礎(chǔ)之上的,典型的碼率為40Mb/s左右。DVB-C系統(tǒng)是以DVB-S系統(tǒng)為基礎(chǔ)建立

的,不同的是它采用QAM(正交調(diào)幅)調(diào)制方式,取代了用于DVB-S中的QPSK調(diào)制方式。在DVB-C中如果使

用64點(diǎn)QAM調(diào)制,則可以實(shí)現(xiàn)在8MHz的帶寬中傳輸38.5Mb/s的數(shù)據(jù)。DVB-T系統(tǒng)與以上兩者都不同的是采用

了COFDM的調(diào)制方式,而通道編碼則與前兩者基本相同。在DVB-T系統(tǒng)中,可以實(shí)現(xiàn)在7MHz的帶寬中傳輸

19.35Mb/s的數(shù)據(jù)。

DVB系統(tǒng)的源編碼是建立在MPEG-2視頻和MPEG-2系統(tǒng)標(biāo)準(zhǔn)上的。同時(shí)在DVB中也提供了與立體聲相兼容的多

聲道數(shù)字音頻系統(tǒng)。同樣由于歷史及其他一些原因,在DVB音頻部分中仍然采用的是MPEGLayerII多聲道

數(shù)字音頻系統(tǒng),在DVB的標(biāo)準(zhǔn)中也同時(shí)規(guī)定可以采用靈活性更大、質(zhì)量更高,超過MPEGLayerIIMC系統(tǒng)

的多聲道數(shù)字音頻系統(tǒng)作為DVB的音頻部分。

總之,隨著數(shù)字廣播的不斷發(fā)展,相信這些已經(jīng)成熟的各種技術(shù)都將有它們各自的用武之地。

8、結(jié)語

在本文中,我們主要討論了當(dāng)前較流行、較成熟的幾種多聲道數(shù)字音頻系統(tǒng),同時(shí)也對(duì)它們所采用的編碼

方法的主要技術(shù)做了詳盡的分析比較。隨著存儲(chǔ)媒體及傳輸帶寬技術(shù)的不斷發(fā)展,相信多聲道數(shù)字音頻系

統(tǒng)會(huì)逐漸取代傳統(tǒng)的如CD格式的音頻系統(tǒng);同樣應(yīng)用于多聲道數(shù)字音頻系統(tǒng)中的音頻編碼及傳輸方案也會(huì)

不斷的進(jìn)行更新、發(fā)展。更多聲道的實(shí)現(xiàn)及更高質(zhì)量的音頻系統(tǒng)實(shí)現(xiàn)都會(huì)成為可能,如新建立的

DVD-Audio音頻技術(shù)中的編碼方案已遠(yuǎn)遠(yuǎn)超越了PCM音頻方式。

總而言之,我們相信在今后的數(shù)字廣播的發(fā)展中,不管是DVB、DAB、數(shù)字視頻、音頻廣播,還是ATSC數(shù)字

電視系統(tǒng)等,都將會(huì)采用不受帶寬限制(相對(duì)而言)、可提供更高質(zhì)量、更多聲道的多聲道數(shù)字音頻系統(tǒng)。

參考文獻(xiàn)

[1]ITU-RRecommendationBS.775-1,“Multi-channelStereophonicSoundSystemwithand

withoutAccompanyingPicture”,InternationalTelecommunicationUnion,Geneva,Switzerland,

1992-1994

[2]ITU-RRecommendationBS.1116,“MethodsfortheSubjectiveAssessmentofSmall

ImpairmentsinAudioSystemsIncludingMulti-channelSoundSystem”,International

TelecommunicationUnion,Geneva,Switzerland,1992-1994

[3]J.D.JohnsonandFerreira,“Sum-DifferenceStereoTransformCoding,”IEEEICASSP

1992,pp.569-571。

[4]ISO/IEC13818-3

[5]ISO/IEC11172-3

[6]M.Davis,“TheAC-3Multi-channelCoder”,presentedatthe95thAESConvention,New

York,October1993,preprint3774.

[7]ISO/IEC13818-7,AdancedAudioCoding(AAC)

[8]“DTSCoherentAcousticsDeliveringHigh-QualityMulti-channelSoundtothe

Consumer,”presentedatthe100thAESConvention,Copenhagen,May1996,present4296