解碼技術(shù)論文范文
時間:2023-03-15 14:07:36
導(dǎo)語:如何才能寫好一篇解碼技術(shù)論文,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
0 引言
中文MARC是中國機讀目錄(China Machine-Readable Catalogue)的簡稱,中文MARC的主要作用是將各類書目信息編目成統(tǒng)一的標(biāo)準(zhǔn)計算機可讀形式,便于讀者檢索以及各圖書情報部門之間交流書目。學(xué)位論文是高校大學(xué)生為獲取相應(yīng)級別學(xué)位而撰寫的關(guān)于在校期間所學(xué)知識的應(yīng)用或所完成的科研成果。
目前,我國各高校的學(xué)位論文大部分都是用中文撰寫的,也有一小部分是用外文撰寫的。高校圖書館將學(xué)位論文收藏至自建特色數(shù)據(jù)庫,就需要對學(xué)位論文進行編目,對學(xué)位論文編目時要保證編目產(chǎn)生的關(guān)于學(xué)位論文的數(shù)據(jù)的質(zhì)量,以方便讀者檢索并利用學(xué)位論文。
1 中文MARC編目學(xué)位論文存在的問題
高校圖書館對文獻資源進行有效的分類標(biāo)引和主題標(biāo)引,并用相應(yīng)的著錄、編目格式使文獻資源的主要檢索項及特點形成書目的形式就是高校圖書館的編目工作[1]。學(xué)位論文編目的工作流程一般為:回溯編目―審校―典藏―貼書標(biāo)―入庫上架。學(xué)位論文作為一種特殊的文獻資源,其編目具有自己的特點:1)編目難度高。高校大學(xué)生研究的學(xué)術(shù)領(lǐng)域及學(xué)術(shù)方向繁多,其具體研究方向小而專,對非專業(yè)編目人員來說,分類編目比較困難;2)編目工作量巨大。教育事業(yè)飛速發(fā)展,各高校每年都在擴大招生,進而各高校每年產(chǎn)出的學(xué)位論文數(shù)量激增,而高校圖書館編目人員有限,而且圖書館每年還要有其他書目入館需要編目,因此編目人員總的工作量非常大。3)學(xué)位論文撰寫語種不統(tǒng)一。部分高校設(shè)有外國語學(xué)院,這些學(xué)院的部分學(xué)生所撰寫的學(xué)位論文所使用的語種一般為外文。
中文MARC是以UNIMARC為基本依據(jù),根據(jù)我國出版物的具體情況制定的[2]。中文MARC機讀記錄字段區(qū)有如下10個功能塊:0―標(biāo)識塊;1―編碼信息塊;2―著錄信息塊;3―附注塊;4―款目連接塊;5―相關(guān)題名塊;6―主題分析塊;7―責(zé)任者塊;8―國際使用塊;9―國內(nèi)使用塊[3]。中文MARC通過對每個功能塊增設(shè)功能不同的多種字段及子字段、對每個字段又增設(shè)不同要求的標(biāo)識符的方式更為詳細的記錄文獻信息。
高校圖書館編目學(xué)位論文最終要達到的目標(biāo)是:1)精準(zhǔn)、全面、直觀的反映出學(xué)位論文所表達的科研成果,包括科研成果的領(lǐng)域,關(guān)鍵詞等信息。2)準(zhǔn)確標(biāo)引學(xué)位論文,形成規(guī)范數(shù)據(jù),方便讀者進行檢索。編目學(xué)位論文是讀者可以使用學(xué)位論文的前提和基礎(chǔ),學(xué)位論文編目工作的質(zhì)量直接關(guān)系到讀者對學(xué)位論文的使用情
況[1]。因此,學(xué)位論文編目工作是高校圖書館工作中的一個重要分支,各高校對學(xué)位論文編目工作都很重視。但是由于學(xué)位論文本身具有的特殊性和中文MARC編目具有的高技術(shù)性,導(dǎo)致中文MARC在對學(xué)位論文進行編目的時候會出現(xiàn)一些問題,而這些問題的出現(xiàn)直接影響了學(xué)位論文編目的質(zhì)量,進而影響到學(xué)位論文在高校圖書館乃至整個學(xué)術(shù)界的正常流通。中文MARC在高校圖書館學(xué)位論文編目中存在如下問題。
1)標(biāo)準(zhǔn)不統(tǒng)一。當(dāng)前我國使用比較普遍的中文MARC編目標(biāo)準(zhǔn)有兩種:一種是國家圖書館編寫制定的全國圖書館聯(lián)合編目中心系統(tǒng)標(biāo)準(zhǔn);一種是北京大學(xué)圖書館編寫制定的中國高等教育文獻資源保障系統(tǒng),即CALIS系統(tǒng)標(biāo)準(zhǔn)[3]。雖然采用這兩種中文MARC編目標(biāo)準(zhǔn)編目的數(shù)據(jù)覆蓋面都很廣,共享性也比較強,但還是應(yīng)該將這兩種標(biāo)準(zhǔn)結(jié)合,制定一套唯一的編目標(biāo)準(zhǔn)。有了唯一的標(biāo)準(zhǔn),各高校圖書館在選擇編目系統(tǒng)時也不需要進行比較,既方便了高校圖書館編目工作,也能使圖書信息流通更順暢。
2)標(biāo)引不規(guī)范。《中國圖書分類法》是高校圖書館編目分類的主要依據(jù)。由于部分高校圖書館還有自己編寫的《圖書館編目分類細則》,并結(jié)合這兩個規(guī)范來進行編目,因此在很多編目細則上出現(xiàn)了不一致現(xiàn)象。
3)著錄字段不完整。中文MARC編目雖然具有詳細的編目規(guī)則,但是不同的編目員對規(guī)則的理解會有所不同。在中文MARC著錄中,字段和指示符都有詳細的規(guī)定,如果出現(xiàn)指示符的漏著、錯著都會直接影響到學(xué)位論文的檢索。
4)外文語種撰寫的學(xué)位論文編目格式不統(tǒng)一。當(dāng)前我國圖書館使用USMARC對外文圖書進行著錄,而有些圖書館認為只有原版外文書籍才應(yīng)該用USMARC進行編目,其余外文圖書應(yīng)該按中文MARC格式來著錄。因此,使用外文撰寫的學(xué)位論文編目格式就出現(xiàn)了兩種,即USMARC格式和中文MARC格式。這種不一致的編目格式會嚴重影響到學(xué)位論文的網(wǎng)上共享,對數(shù)字圖書館的建設(shè)也有不利影響。
高校圖書館每年進書量都很大,新進圖書只有經(jīng)過編目才能入庫上架,讀者才能在館藏書目檢索系統(tǒng)中檢索到圖書,而高校圖書館專業(yè)的編目人員非常有限,因此就會出現(xiàn)非專業(yè)人員對圖書進行編目,比如燕山大學(xué)圖書館學(xué)位論文的編目工作就是由勤工助學(xué)的學(xué)生來完成的。編目工作對人員專業(yè)要求比較高,編目細則又非常繁雜,雖然專業(yè)的編目人員已經(jīng)設(shè)定號學(xué)位論文編目格式,但是非專業(yè)人員在對學(xué)位論文進行編目的時候很容易就會出現(xiàn)漏著、錯著的現(xiàn)象,而在對學(xué)位論文編目中出現(xiàn)的錯誤只有非常專業(yè)的編目人員才能及時發(fā)現(xiàn),這樣就會導(dǎo)致很多編目過程中出現(xiàn)的錯誤到最后都沒有被發(fā)現(xiàn),從而影響到讀者對學(xué)位論文的檢索。
2 改進與展望
篇2
(一)功能及主要技術(shù)指標(biāo)要求
直讀式電子壓力計實現(xiàn)井下壓力和溫度參數(shù)的測量,并將測量結(jié)果通過單芯鎧裝電纜實時傳送至地面解碼控制儀,主要技術(shù)指標(biāo)要求如下所示。
a)壓力測量范圍:(0~30、45、60、80)MPa;壓力測量誤差:0.04%F.S;
b)溫度測量范圍:(-20~+150)℃,測量誤差:±1℃;
c)傳輸距離不小于6000m;通訊誤碼率1.0×10-7。
(二)基本方案及工作原理
直讀式電子壓力計由井下電子壓力計和地面解碼控制儀兩部分組成,其中井下電子壓力計由壓力傳感器、溫度傳感器、信號放大電路、模數(shù)轉(zhuǎn)換電路、單片機系統(tǒng)、編碼電路、數(shù)字通訊接口電路和裝載于單片機系統(tǒng)中的相關(guān)工作軟件組成,解碼控制儀由解碼電路、通訊接口電路、通用計算機(油田配置)和相關(guān)工作軟件組成。
工作過程中,井下電子壓力計由地面解碼控制儀通過單芯鎧裝電纜提供能源,溫度和壓力傳感器分別將環(huán)境壓力和溫度轉(zhuǎn)換為電信號輸出,該電信號經(jīng)放大和模數(shù)轉(zhuǎn)換后由單片機系統(tǒng)進行數(shù)據(jù)實時采集和處理,然后按一定周期經(jīng)數(shù)字通訊口輸出。井下電子壓力計和井上解碼控制儀之間通過單芯鎧裝電纜連接,解碼控制儀中通訊接口電路接收井下電子壓力計輸出的壓力和溫度數(shù)據(jù),并經(jīng)解碼后輸入計算機中進行實時分析和處理。
2、數(shù)據(jù)傳輸方案選擇
設(shè)備之間數(shù)據(jù)通訊通常有并行通訊和串行通訊兩種方案,并行通訊的缺點是傳輸距離短,通訊信道所占點號多,而串行通訊與之相反。根據(jù)井下電子壓力計與井上解碼控制儀的數(shù)據(jù)傳輸特點,需選擇串行數(shù)據(jù)傳輸方式。
在曼徹斯特編碼中,用電壓跳變的相位不同來區(qū)分邏輯1和邏輯0,即用正的電壓跳變表示邏輯0,用負的電壓跳變表示邏輯1。
在油田測井中,井下電子壓力計在井下采集大量信息,并傳送給地面解碼控制儀;但井下電子壓力計到地面解碼控制儀這段信道的傳輸距離較長且環(huán)境惡劣,常用的NRZ碼不適合在這樣的信道里傳輸,而且NRZ碼含有豐富的直流分量,容易引起滾筒的磁化。曼徹斯特編碼方式使得信號以串行脈沖碼的調(diào)制方式在數(shù)據(jù)線上傳輸,和最常用的NRZ碼相比,消除了NRZ碼的直流成分,具有時鐘恢復(fù)和更好的抗干擾性能,這使它更適合于從井下到井上的信道傳輸,因而在井下電子壓力計和地面解碼控制儀之間選用曼徹斯特編碼使數(shù)據(jù)傳輸可靠性更高、傳輸距離更遠。
3、曼徹斯特碼編碼軟硬件設(shè)計
每一周期井下電子壓力計需將采集到的壓力和溫度兩個參數(shù)分別進行曼徹斯特編碼方式輸出,井下電子壓力計與地面解碼控制儀之間按如下通訊協(xié)議進行。
a)壓力與溫度均以字為單位進行傳送,先發(fā)送壓力字,后發(fā)送溫度字,一個壓力字和一個溫度字的組合稱為一個消息;
b)每一個字由20位組成,第1~3位為3個起始位,第4~19位為16個數(shù)據(jù)位,第20位為奇偶校驗位;
c)壓力字3個起始位電平為先高后低,溫度字起始位為先低后高,高低電平均各占一位半,壓力字與溫度字校驗位均采用奇校驗;
d)傳輸?shù)牟ㄌ芈剩?.7292kbps(175μs/位),傳輸一個消息共耗時3.5ms。為保證數(shù)據(jù)傳輸可靠性,井下電子壓力計同一消息在一個采樣周期內(nèi)重復(fù)發(fā)送兩次,地面解碼控制儀根據(jù)校驗位判斷每個字的正確性。
由單片機編程輸出兩路I/O控制信號,經(jīng)過濾波電路、運放電路、整型電路后,產(chǎn)生曼徹斯特編碼雙相電平信號,并經(jīng)單芯鎧裝電纜送至地面解碼控制儀。為滿足曼徹斯特編碼格式及井下電子壓力計與地面解碼控制儀之間的通訊協(xié)議,井下電子壓力計軟件采用如下的編程方式輸出波形。
a)壓力字同步頭為262.5μs高電平后跟隨262.5μs低電平,溫度字同步頭為262.5μs低電平后跟隨262.5μs高電平;
b)若數(shù)據(jù)位為邏輯0,則在87.5μs低電平后跟隨87.5μs高電平;
c)若數(shù)據(jù)位為邏輯1,則在87.5μs高電平后跟隨87.5μs低電平;
d)校驗位的波形產(chǎn)生方式與數(shù)據(jù)位相同。
4、曼徹斯特碼解碼軟硬件設(shè)計
地面解碼控制儀需將井下電子壓力計輸出的曼徹斯特碼進行解碼,并按通訊協(xié)議用軟件將接收到的曼徹斯特碼數(shù)據(jù)轉(zhuǎn)換為井下電子壓力計測得的壓力和溫度數(shù)據(jù),即地面解碼控制儀中的解碼過程為井下電子壓力計編碼過程的逆過程。曼徹斯特碼解碼過程可分為如下三部分:
a)同步字頭檢測,并辨別其為溫度數(shù)據(jù)還是壓力數(shù)據(jù)。
b)對曼碼形式的數(shù)據(jù)進行解碼,從曼徹斯特碼波形中分離出同步時鐘,并將時鐘和數(shù)據(jù)進行處理使曼碼數(shù)據(jù)轉(zhuǎn)化為非歸零二進制數(shù)據(jù)。
c)將串行數(shù)據(jù)轉(zhuǎn)化為并行數(shù)據(jù),并進行奇偶校驗,以檢驗數(shù)據(jù)傳輸?shù)恼_性。
經(jīng)過幾千米鎧裝電纜傳輸上來的數(shù)據(jù),幅度衰減到毫伏級,因此井上需要精密的解碼電路,才能保證數(shù)據(jù)傳輸無誤碼率。井下傳輸上來的數(shù)據(jù)經(jīng)過濾波電路、精密運算放大器、雙D觸發(fā)器輸出曼碼波形給單片機,經(jīng)過單片機的程序轉(zhuǎn)化為井下的壓力與溫度數(shù)字量。
5、試驗結(jié)果
直讀式電子壓力計首臺產(chǎn)品完成廠內(nèi)試驗后,到油田用8000m的鎧裝電纜連接井下電子壓力計和地面解碼控制儀,將電子壓力計下放到井下6500m的深度,在溫度高達150℃、壓力為30~60MPa的油井中測試壓力和溫度。在三次連續(xù)5個小時的測試過程中,數(shù)據(jù)傳輸準(zhǔn)確可靠,沒有出現(xiàn)丟點現(xiàn)象,誤碼率為零。
6、結(jié)束語
試驗數(shù)據(jù)統(tǒng)計分析結(jié)果表明,本文研究結(jié)果解決了直讀式電子壓力計通訊方案、通訊協(xié)議、單芯遠距離傳輸、曼徹斯特碼編解碼軟硬件設(shè)計等關(guān)鍵技術(shù),增強了電子壓力計在油田測井領(lǐng)域的市場競爭力。
參考文獻:
[1]1553B總線及其在測控網(wǎng)絡(luò)中的應(yīng)用.計量與測試技術(shù).侯青劍.2005.3
篇3
Abstract: JPEG2000 is a new image coding standard which can provide better rate-distortion performanc than the JPEG standard. But a lot of computation redundancy exists in the traditional implementation of JPEG2000 encoder, in particular at the lower bit rate. That makes the encoder need more encoding time and working memory size. In order to reduce the computational complexity, the paper proposed a new JPEG 2000 image size conversion algorithm, the algorithm can greatly reduce the image conversion required computation amount and time.
關(guān)鍵詞: JPEG2000;轉(zhuǎn)換;頻率域
Key words: JPEG 2000;transformation;frequency domain
中圖分類號:TN919.81 文獻標(biāo)識碼:A 文章編號:1006-4311(2013)26-0184-02
0 引言
JPEG2000是新一代的靜態(tài)圖像編碼國際標(biāo)準(zhǔn),與已有的JPEG標(biāo)準(zhǔn)相比,它可以提供更好的圖像質(zhì)量和更高的壓縮率,但其計算的復(fù)雜度也遠高于JPEG算法。一般在處理JPEG 2000圖像時,若欲將其圖像尺寸縮小,首先需由JPEG 2000解碼器處理,將JPEG 2000圖像解碼到空間域圖像后,在空間域里將圖像縮小至所需尺寸后,再經(jīng)JPEG 2000編碼器將圖像作編碼,最后得到尺寸縮小后的壓縮圖像。但是由于在空間域里使用圖像大小轉(zhuǎn)換方法來縮小JPEG 2000圖像,需要大量的計算量、繁雜的處理過程、以及占用大量的存儲空間。為了加快圖像尺寸轉(zhuǎn)換處理速度、降低計算復(fù)雜度、以及有效降低存儲空間占用,本論文提出一個快速的JPEG 2000圖像尺寸縮小轉(zhuǎn)換算法。流程如圖1。
在我們的快速JPEG 2000圖像尺寸縮小轉(zhuǎn)換方法中,首先將原始JPEG 2000圖像經(jīng)EBCOT解碼以及反量化步驟解出圖像的頻率域編碼信息后,再透過頻率域圖像尺寸縮小轉(zhuǎn)換方法,直接在頻率域里縮小圖像尺寸,最后再通過量化與EBCOT編碼等步驟,將圖像尺寸縮小后的圖像頻率域編碼信息編成JPEG 2000圖像。
本文所提的JPEG 2000圖像尺寸縮小轉(zhuǎn)換方法與空間域圖像大小轉(zhuǎn)換方法相比,所提的方法省掉反向小波轉(zhuǎn)換、反向色彩轉(zhuǎn)換、后置處理、前置處理、正向色彩轉(zhuǎn)換、以及正向小波轉(zhuǎn)換等六個步驟。由于所提的方法不需將頻率域編碼信息轉(zhuǎn)成空間域圖像,因此本論文所提的方法除了可更快速的轉(zhuǎn)換圖像大小外,也可省下存放空間域圖像內(nèi)容所需的存儲空間以及減少所需的計算量。
1 簡化JPEG 2000壓縮與解壓縮流程
在快速JPEG 2000圖像尺寸縮小轉(zhuǎn)換方法中,保留了EBCOT解碼、反量化、量化與EBCOT編碼等四個部分,主要原因說明如下:
1.1 EBCOT編/解碼 JPEG 2000編碼后的圖像會儲存成封包的格式,但封包并非以子頻帶為單位儲存,所以要取得各子頻帶的內(nèi)容,必須先經(jīng)過EBCOT解碼才行。再者本文的方法有可能需要對子頻帶再進行小波轉(zhuǎn)換,因此EBCOT編/解碼過程不可省略。
1.2 量化與反量化 保留量化與反量化步驟的主要原因在于圖像經(jīng)由正向小波轉(zhuǎn)換后,會產(chǎn)生不同大小的子頻帶頻率信息,不同子頻帶頻率信息使用不同的量化步長值進行量化。
子頻帶與量化步長值這兩者有相對應(yīng)關(guān)系,換句話說以具有7個子頻帶的JPEG 2000圖像而言,必須要有7個相對應(yīng)的量化步長值。而子頻帶與量化步長值所產(chǎn)生的數(shù)目與小波轉(zhuǎn)換的層數(shù)有關(guān),對于一個經(jīng)過m層小波轉(zhuǎn)換的影像,所具有的子頻帶數(shù)目Nsubbands計算公式為:Nsubbands=3×m+1,圖2所示為圖像經(jīng)由二次小波轉(zhuǎn)換后所產(chǎn)生的七個不同的子頻帶。
每個子頻帶的量化步長值都是由一組獨立的控制參數(shù)(ε,μ)決定,該組控制參數(shù)必須記錄于JPEG 2000碼流頭部,供譯碼端還原量化步長值使用。圖3所示為一張圖像經(jīng)過三次小波轉(zhuǎn)換后所產(chǎn)生的頻率域情況。
本文所提的頻率域圖像尺寸縮小方法會改變原本圖像的小波轉(zhuǎn)換層數(shù),進而影響到量化步長值與子頻帶的對應(yīng)關(guān)系。當(dāng)使用不同小波轉(zhuǎn)換層數(shù)時,每個子頻帶的量化步長值會不同。所以,當(dāng)圖像在進行尺寸縮小前,先使用原本JPEG 2000圖像的量化步長值對圖像進行反量化,還原頻率域信息,當(dāng)圖像尺寸已調(diào)整縮小后,再用新的量化步長值來量化頻率域信息,即可解決量化步長值與子頻帶不一致的問題。
在我們所提的方法中,分別會遇到小波層數(shù)足夠與小波層數(shù)不足的情況。假設(shè)一張JPEG 2000圖像小波層數(shù)為m層,欲要將圖像尺寸縮小為原來的(1/2n×1/2n)大小時,假如n
若n>=m發(fā)生,也就是小波層數(shù)不足。首先經(jīng)EBCOT解碼后,產(chǎn)生不同的子頻帶信息。針對不同的子頻帶信息使用反量化,接著進行圖像縮小的工作,將不需要的外頻信息去除,保留的頻率信息因小波層數(shù)不足(小波層數(shù)需為1層以上),要對保留的頻率信息再進行小波轉(zhuǎn)換。產(chǎn)生出來的小波頻率域尺寸大小超過欲轉(zhuǎn)換尺寸,可將外頻的小波頻率信息去除,保留LL子頻帶。此時圖像大小雖已符合轉(zhuǎn)換所需大小,但JPEG 2000規(guī)定圖像至少要有一層小波轉(zhuǎn)換,所以必須再做一次小波轉(zhuǎn)換,得到一張小波轉(zhuǎn)換層數(shù)為1的JPEG 2000圖像,最后再經(jīng)量化與EBCOT編碼,得到尺寸縮小后的JPEG 2000圖像。
2 頻率域圖像尺寸縮小轉(zhuǎn)換方法
圖1中間的頻率域圖像尺寸縮小轉(zhuǎn)換方法主要工作包括縮小頻率域圖像尺寸與修改JPEG 2000圖像碼流主標(biāo)頭相關(guān)參數(shù)等步驟,詳細步驟如下:
2.1 括縮小頻率域圖像尺寸
①小波轉(zhuǎn)換層數(shù)足夠的作法。假設(shè)當(dāng)圖像的小波層數(shù)為m層,欲將圖像尺寸縮小為(1/2n×1/2n)大小時,若n
首先使用EBCOT解出頻率域信息,再對需保留的頻率域信息作反量化動作,接著將整張圖像的尺寸縮小,并且丟棄不需要的外頻頻率信息,最后將所保留的頻率域信息再重新經(jīng)過量化與EBCOT編碼,即可得到圖像尺寸縮小后的JPEG 2000圖像。
②小波轉(zhuǎn)換層數(shù)不足的作法。假設(shè)當(dāng)圖像的小波層數(shù)為m層時,欲將圖像尺寸縮小為(1/2n×1/2n)大小時,若n>=m,就是小波層數(shù)不足,則除了丟棄m個外層的中高頻信息外,還需要將原來最內(nèi)層的低頻信息,進行(n-m)+1次小波轉(zhuǎn)換,再將所產(chǎn)生的(n-m)層的中高頻信息丟棄。由于以上的(n-m)次小波轉(zhuǎn)換后的中高頻信息最終將被丟棄,因此在進行以上小波轉(zhuǎn)換時可直接省略許多計算工作,不必進行完整的小波轉(zhuǎn)換。此法為本文提出的快速小波轉(zhuǎn)換方法。
2.2 修改JPEG 2000圖像碼流主標(biāo)頭相關(guān)參數(shù) JPEG 2000圖像碼流主標(biāo)頭記錄原始圖像大小、塊狀(tile)大小、小波層數(shù)、各子頻帶的量化步階值參數(shù)(ε和μ)等數(shù)據(jù)信息。在我們所提方法中,并沒有將圖像解回空間域,而是在頻率域信息縮小圖像尺寸后,直接進行量化和EBCOT編碼,產(chǎn)生新的JPEG 2000圖像。新的JPEG 2000圖像碼流主標(biāo)頭數(shù)據(jù)無法像空間域轉(zhuǎn)換方法由JPEG 2000壓縮方式設(shè)定,而必須自行修改JPEG 2000圖像碼流主標(biāo)頭內(nèi)的相關(guān)參數(shù)。
3 小結(jié)
JPEG 2000具有的多種特性使其有著廣泛的應(yīng)用前景。目前許多圖形圖像公司如Pegasus,Aware等在開發(fā)的圖像軟件中集成了JPEG 2000圖像壓縮技術(shù);有的公司如ImagePower等已開發(fā)出JPEG 2000的DSP芯片。JPEG 2000將取代JPEG在圖像壓縮領(lǐng)域發(fā)揮重要作用。本論文提出一個新的快速圖像壓縮方法,可大幅降低使用空間域轉(zhuǎn)換時的處理時間,以及所需存儲空間,但是本文所提方法只針對靜態(tài)圖像實現(xiàn)固定大小的縮小轉(zhuǎn)換,無法對圖像作任意大小轉(zhuǎn)換,對圖像作任意大小轉(zhuǎn)換是一個很好的發(fā)展方向,需作進一步研究。
參考文獻:
[1]杜偉娜,孫軍,倪強.基于JPEG2000的高效率控制算法[J].上海交通大學(xué)學(xué)報,2006,40(1):16-19.
篇4
由於在現(xiàn)今資訊流通普遍的社會中,影像的需求量越來越大,影像的數(shù)位化是必然的趨勢。然而在數(shù)位化過的影像所占的資料量又相當(dāng)龐大,在傳輸與處理上皆有所不便。將資料壓縮是最好的方法。如今有一新的模式,在壓縮率及還原度皆有不錯的表現(xiàn),為其尚未有一標(biāo)準(zhǔn)的格式,故在應(yīng)用上尚未普及。但在不久的未來,其潛力不可限量。而影像之於印刷有密不可分的關(guān)系。故以此篇文章介紹小波(WAVELET)轉(zhuǎn)換的歷史淵源。小波轉(zhuǎn)換的基礎(chǔ)原理。現(xiàn)今的發(fā)展對印刷業(yè)界的沖擊。影像壓縮的未來的發(fā)展。
壹、前言
由於科技日新月異,印刷已由傳統(tǒng)印刷走向數(shù)位印刷。在數(shù)位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當(dāng)?shù)馁M時,現(xiàn)今個人擁有True Color的視訊卡、24-bit的全彩印表機與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實自然,更要搭配多媒體或動畫。但是相對的高畫質(zhì)視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經(jīng)地義的事,但是用網(wǎng)路傳個640X480 True Color圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業(yè)在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數(shù)學(xué)家與資訊理論學(xué)者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實:壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現(xiàn)鋸齒狀的現(xiàn)象。皆會造成印刷輸出的問題。影像壓縮技術(shù)是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉(zhuǎn)路轉(zhuǎn),科學(xué)家便將注意力移轉(zhuǎn)到WAVELET轉(zhuǎn)換法,結(jié)果不但發(fā)現(xiàn)了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論。小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點,又能克服其不足之處。可達到完全不失真,壓縮的比率也令人可以接受。由於其數(shù)學(xué)理論早在1960年代中葉就有人提出了,而到現(xiàn)在才有人將其應(yīng)用於實際上,其理論仍有相當(dāng)大的發(fā)展空間,而其實際運用也屬剛起步,其後續(xù)發(fā)展可說是不可限量。故研究的動機便由此而生。
貳、 WAVELET的歷史起源
WAVELET源起於Joseph Fourier的熱力學(xué)公式。傅利葉方程式在十九世紀(jì)初期由Joseph Fourier (1768-1830)所提出,為現(xiàn)代信號分析奠定了基礎(chǔ)。在十九到二十世紀(jì)的基礎(chǔ)數(shù)學(xué)研究領(lǐng)域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續(xù)圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論為傅利葉方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波規(guī)范正交基。其後1984年,法國地球物理學(xué)J. Morlet在分析地震波的局部性質(zhì)時,發(fā)現(xiàn)傳統(tǒng)的傅利葉轉(zhuǎn)換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學(xué)家A.Grossman對Morlet的這種信號根據(jù)一個確定函數(shù)的伸縮,平移系 { a -1/2 Ψ[(x-b)/a] ;a,b?R ,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。
1986年,Y. Meyer建構(gòu)出具有一定衰減性的光滑函數(shù)Ψj,k(x),其二進制伸縮與平移系 {Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構(gòu)成L2(R)的規(guī)范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構(gòu)了小波函數(shù)的構(gòu)造及信號按小波轉(zhuǎn)換的分解及重構(gòu)。1988年Daubechies建構(gòu)了具有正交性(Orthonormal)及緊支集(Compactly Supported);及只有在一有限區(qū)域中是非零的小波,如此,小波分析的系統(tǒng)理論得到了初步建立。
三、 WAVELET影像壓縮簡介及基礎(chǔ)理論介紹
一、 WAVELET的壓縮概念
WAVELET架在三個主要的基礎(chǔ)理論之上,分別是階層式邊碼(pyramid coding)、濾波器組理論(filter bank theory)、以及次旁帶編碼(subband coding),可以說wavelet transform統(tǒng)合了此三項技術(shù)。小波轉(zhuǎn)換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應(yīng)用於編碼、解碼、檢測邊緣、壓縮數(shù)據(jù),及將非線性問題線性化。良好的分析局部的時間區(qū)域與頻率區(qū)域的信號,彌補傅利葉轉(zhuǎn)換中的缺失,也因此小波轉(zhuǎn)換被譽為數(shù)學(xué)顯微鏡。
WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經(jīng)由數(shù)學(xué)公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關(guān))。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經(jīng)由取舍資料而達到壓縮目地的作法,是近代數(shù)位影像編碼技術(shù)的一項突破。即是WAVELET的概念引入編碼技術(shù)中。
WAVELET轉(zhuǎn)換在數(shù)位影像轉(zhuǎn)換技術(shù)上算是新秀,然而在太空科技早已行之有年,像探測衛(wèi)星和哈柏望遠鏡傳輸影像回地球,和醫(yī)學(xué)上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現(xiàn)的效果。
以往lossless的編碼法只著重壓縮演算法的表現(xiàn),將數(shù)位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。 將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài),控制解碼後影像的品質(zhì),選擇適當(dāng)?shù)木幋a法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。
二、 影像壓縮過程
原始圖形資料 色彩模式轉(zhuǎn)換 DCT轉(zhuǎn)換 量化器 編碼器 編碼結(jié)束
三、 編碼的基本要素有三點
(一) 一種壓縮/還原的轉(zhuǎn)換可表現(xiàn)在影像上的。
(二) 其轉(zhuǎn)換的系數(shù)是可以量化的。
(三) 其量化的系數(shù)是可以用函數(shù)編碼的。
四、 現(xiàn)有WAVELET影像壓縮工具主要的部份
(一) Wavelet Transform(WAVELET轉(zhuǎn)換):將圖形均衡的分割成任何大小,最少壓縮二分之一。
(二) Filters(濾鏡):這部份包含Wavelet Transform,和一些著名的壓縮方法。
(三) Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內(nèi)插量化,對編碼的架構(gòu)有一定的影響。
(四) Entropy Coding(熵編碼器):有兩種格式,一種是使其減少,一種為內(nèi)插。
(五) Arithmetic Coder(數(shù)學(xué)公式):這是建立在Alistair Moffat s linear time coding histogram的基礎(chǔ)上。
(六) Bit Allocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。
肆、 WAVELET影像壓縮未來的發(fā)展趨勢
一、 在其結(jié)構(gòu)上加強完備性。
二、 修改程式,使其可以處理不同模式比率的影像。
三、 支援更多的色彩。可以處理RGB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。
四、 加強運算的能力,使其可支援更多的影像格式。
五、 使用WAVELET轉(zhuǎn)換藉由消除高頻率資料增加速率。
六、 增加多種的WAVELET。如:離散、零元樹等。
七、 修改其數(shù)學(xué)編碼器,使資料能在數(shù)學(xué)公式和電腦的位元之間轉(zhuǎn)換。
八、 增加8X8格的DCT模式,使其能做JPEG的壓縮。
九、 增加8X8格的DCT模式,使其能重疊。
十、 增加trellis coding。
十一、 增加零元樹。
現(xiàn)今已有由中研院委托國內(nèi)學(xué)術(shù)單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應(yīng)用於實務(wù)上的日子指日可待。
伍、 影像壓縮研究的方向
1. 輸入裝置如何捕捉真實的影像而將其數(shù)位化。
2. 如何將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài)。
3. 如何控制解碼影像的品質(zhì)。
4. 如何選擇適當(dāng)?shù)木幋a法。
5. 人的視覺系統(tǒng)對影像的反應(yīng)機制。
小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點,又能克服其不足之處。
陸、 在印刷輸出的應(yīng)用
WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續(xù)發(fā)展?jié)摿o窮,尤其在網(wǎng)路出版方面,其利用價值更高,WAVELET的出現(xiàn)就猶如當(dāng)時的JPEG出現(xiàn),在影像的領(lǐng)域中掀起一股旋風(fēng),但是WAVELET卻有JPEG沒有的優(yōu)點,JPEG乃是失真壓縮,且解碼後復(fù)原程度有限,能在網(wǎng)路應(yīng)用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。
有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數(shù)位印刷上。等到WAVELET的應(yīng)用成熟,再發(fā)展其適用的RIP,又是一段時間以後的事了。
在網(wǎng)路出版上已經(jīng)有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網(wǎng)路上大量使用,應(yīng)該是未來的趨勢。對於網(wǎng)路出版應(yīng)該是一陣不小的沖擊。
圖像壓縮的好處是在於資料傳輸快速,減少網(wǎng)路的使用費用,增加企業(yè)的利潤,由於傳版的時間減少,也使印刷品在當(dāng)?shù)赜∷⒌目赡苄栽龈撸瑴p少運費,減少開支,提高時效性,創(chuàng)造新的商機。
柒、 結(jié)論
WAVELET的理論并不是相當(dāng)完備,但是據(jù)現(xiàn)有的研究報告顯現(xiàn),到普及應(yīng)用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學(xué)領(lǐng)域上,均有其應(yīng)用價值。國內(nèi)已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現(xiàn)。這也顯示國內(nèi)的研究速度,遠落在外國的後面,國外已成立不少相關(guān)的網(wǎng)站,國內(nèi)僅有少數(shù)的相關(guān)論文。如此一來國內(nèi)要使這種壓縮模式普及還有的等。正式使用於印刷業(yè)更是要相當(dāng)時間。不過對於網(wǎng)路出版仍是有相當(dāng)大的契機,國內(nèi)仍是可以朝這一方面發(fā)展的。站在一個使用其成果的角度,印刷業(yè)界也許并不需要去了解其高深的數(shù)理理論。但是在運用上,為了要使用方便,和預(yù)估其發(fā)展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據(jù),也許在不久的將來此一模式會成為主流,到時才不會手足無措。
參考文獻
1.Geoff Davis,1997,Wavelet Image Compression Construction Kit,。
2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上), 峰資訊股份有限公司。
3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下), 峰資訊股份有限公司。
4.施威銘研究室,1994,PC影像處理技術(shù)(二)圖檔壓縮續(xù)篇,旗標(biāo)出版有限公司。
5.盧永成,民八十七年,使用小波轉(zhuǎn)換及其在影像與視訊編碼之應(yīng)用,私立中原大學(xué)電機工程學(xué)系碩士學(xué)位論文。
6.江俊明,民八十六年,小波分析簡介,私立淡江大學(xué)物理學(xué)系碩士論文。
7.曾泓瑜、陳曜州,民八十三年,最新數(shù)位訊號處理技術(shù)(語音、影像處理實務(wù)),全欣資訊圖書。
附錄:
嵌入式零元樹小波轉(zhuǎn)換、 階層式嵌入式零元樹小 波轉(zhuǎn)換、階層式影像傳送 及漸進式影像傳送
目前網(wǎng)路最常用的靜態(tài)影像壓縮模式為JPEG格式或是GIF格式等。但是利用這些格式編碼完成的影像,其資料量是不變的,其接受端必須完整地接受所有的資料量後才可以顯示出編碼端所傳送的完整影像。這個現(xiàn)象最常發(fā)生在利用網(wǎng)路連結(jié)WWW網(wǎng)站時,我們常常都是先接收到文字後,其網(wǎng)頁上的圖形才,慢慢的一小部份一小部份顯示出來,有時網(wǎng)路嚴重塞車,圖形只顯示一點點後就要再等非常久的時間才再有一點點顯示出來,甚至可能斷線了,使得使用者完全不知道在接收什麼圖案的圖形,無形中造成網(wǎng)路資源的浪費。此缺點之改善,可以使用嵌入式零元樹小波轉(zhuǎn)換(EZW)來完成。
階層式影像傳送系統(tǒng)的主要功能為允許不同規(guī)格之顯示裝置或解碼器可以從同一編碼器中獲得符合其要求之訊號,如此不需要對於不同的解碼器設(shè)計不同的編碼器配合利用之,進而增加了其應(yīng)用的 范圍,及減低了所架設(shè)系統(tǒng)的復(fù)雜度,也可以節(jié)省更多的設(shè)備費用。利用Shapiro所提出的嵌入式零元樹小波轉(zhuǎn)換(EZW)技術(shù)來設(shè)計階層式影像傳送系統(tǒng)時,其編碼的效果不是很好。主要的原因是,利用(EZW)技術(shù)所設(shè)計的編碼器是根據(jù)影像的全解析度來加以編碼的,這使得擁有不同解析度與碼率要求的解碼器,無法同時分享由編碼器所送出來的位元流。雖然可以利用同時播放(Simulcast)技術(shù)來加以克服之,但是該技術(shù)對於同一影像以不同解析度獨立編碼時,將使得共同的低通次頻帶(Lowpass Subband)被重復(fù)的編碼與傳送,而產(chǎn)生了相當(dāng)高的累贅(Redundancy)。
基於上述情況,有人將嵌入式零元樹小波轉(zhuǎn)換(EZW)技術(shù)加以修改之,完成了一個新式的階層式影像傳送系統(tǒng)。該技術(shù)為階層式嵌入的零元樹小波轉(zhuǎn)換(Layered Embedded Zerotree Wavelet,簡稱 LEZW技術(shù)。這個技術(shù)使我們所設(shè)計出來的階層式影像傳送系統(tǒng),可以在編碼傳送前預(yù)先指定圖層數(shù)目、每層影像的解析度與碼率。
LEZW技術(shù)是將EZW技術(shù)中的連續(xù)近似量化(SAQ)加以延伸應(yīng)用之,而EZW傳統(tǒng)的做法是將SAQ應(yīng)用於全部的小波轉(zhuǎn)換系數(shù)上。然而在LEZW技術(shù)中,從基層(Base Layer)開始SAQ一次僅用於一個 圖層(Layer)的編碼,直到最高階析度的圖層為止。當(dāng)編碼的那一圖層碼率利用完時,即表示該圖層編碼完畢可以再往下一圖層編碼之。為了改善LEZW的效率,在較低圖層的SAQ結(jié)果應(yīng)用於較高圖層的SAQ過程中,基於這種編碼的程序,LEZW演算法則可以在每一圖層平均碼率的限制下,重建出不同解析度的影像。因此,LEZW非常適合用於設(shè)計階層式影像傳送系統(tǒng)。
LEZW技術(shù)也可以應(yīng)用於漸進式傳送,對於一個漸進式影像傳送系統(tǒng)而言,控制其解析度將可以改善重建影像的視覺品質(zhì)。而常用的漸進式傳送方法有使用向量量化器或零元樹資料結(jié)構(gòu)編碼演算法則。但是向量量化器需要較大的記憶體及對與傳送中的錯誤敏威,而利用EZW技術(shù)所設(shè)計的漸進式影像傳送系統(tǒng),可以改善這些缺點,所以享有較好的效能。但是它也有缺點就是,應(yīng)用於漸進式傳送時是根據(jù)全解析度來做編碼及傳送,因此在低碼率的限制之下時,若用全解析度來顯示影像將使得影像模糊不清。所以在低碼率傳送時的影像以較低的解析度來顯示時,則可以使影像的清晰度有所改善。
篇5
由於在現(xiàn)今資訊流通普遍的社會中,影像的需求量越來越大,影像的數(shù)位化是必然的趨勢。然而在數(shù)位化過的影像所占的資料量又相當(dāng)龐大,在傳輸與處理上皆有所不便。將資料壓縮是最好的方法。如今有一新的模式,在壓縮率及還原度皆有不錯的表現(xiàn),為其尚未有一標(biāo)準(zhǔn)的格式,故在應(yīng)用上尚未普及。但在不久的未來,其潛力不可限量。而影像之於印刷有密不可分的關(guān)系。故以此篇文章介紹小波(WAVELET)轉(zhuǎn)換的歷史淵源。小波轉(zhuǎn)換的基礎(chǔ)原理?,F(xiàn)今的發(fā)展對印刷業(yè)界的沖擊。影像壓縮的未來的發(fā)展。
壹、前言
由於科技日新月異,印刷已由傳統(tǒng)印刷走向數(shù)位印刷。在數(shù)位化的過程中,影像的資料一直有檔案過大的問題,占用記憶體過多,使資料在傳輸上、處理上都相當(dāng)?shù)馁M時,現(xiàn)今個人擁有TrueColor的視訊卡、24-bit的全彩印表機與掃描器已不再是天方夜譚了,而使用者對影像圖形的要求,不僅要色彩繁多、真實自然,更要搭配多媒體或動畫。但是相對的高畫質(zhì)視覺享受,所要付出的代價是大量的儲存空間,使用者往往只能眼睜睜地看著體積龐大的圖檔占掉硬碟、磁帶和光碟片的空間;美麗的圖檔在親朋好友之間互通有無,是天經(jīng)地義的事,但是用網(wǎng)路傳個640X480TrueColor圖形得花3分多鐘,常使人哈欠連連,大家不禁心生疑慮,難道圖檔不能壓縮得更小些嗎?如此報業(yè)在傳版時也可更快速。所以一種好的壓縮格式是不可或缺的,可以使影像所占的記憶體更小、更容易處理。但是目前市場上所用的壓縮模式,在壓縮的比率上并不理想,失去壓縮的意義。不然就是壓縮比例過大而造成影像失真,即使數(shù)學(xué)家與資訊理論學(xué)者日以繼夜,卯盡全力地為lossless編碼法找出更快速、更精彩的演算法,都無可避免一個尷尬的事實:壓縮率還是不夠好。再說用來印刷的話就造成影像模糊不清,或是影像出現(xiàn)鋸齒狀的現(xiàn)象。皆會造成印刷輸出的問題。影像壓縮技術(shù)是否真的窮途末路?請相信人類解決難題的潛力是無限的。既然舊有編碼法不夠管用,山不轉(zhuǎn)路轉(zhuǎn),科學(xué)家便將注意力移轉(zhuǎn)到WAVELET轉(zhuǎn)換法,結(jié)果不但發(fā)現(xiàn)了滿意的解答,還開拓出一條光明的坦途。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論。小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點,又能克服其不足之處??蛇_到完全不失真,壓縮的比率也令人可以接受。由於其數(shù)學(xué)理論早在1960年代中葉就有人提出了,而到現(xiàn)在才有人將其應(yīng)用於實際上,其理論仍有相當(dāng)大的發(fā)展空間,而其實際運用也屬剛起步,其後續(xù)發(fā)展可說是不可限量。故研究的動機便由此而生。
貳、WAVELET的歷史起源
WAVELET源起於JosephFourier的熱力學(xué)公式。傅利葉方程式在十九世紀(jì)初期由JosephFourier(1768-1830)所提出,為現(xiàn)代信號分析奠定了基礎(chǔ)。在十九到二十世紀(jì)的基礎(chǔ)數(shù)學(xué)研究領(lǐng)域也占了極重要的地位。Fourier提出了任一方程式,甚至是畫出不連續(xù)圖形的方程式,都可以有一單純的分析式來表示。小波分析是近幾年來才發(fā)展出來的數(shù)學(xué)理論為傅利葉方程式的延伸。
小波分析方法的提出可追溯到1910年Haar提出的小波規(guī)范正交基。其後1984年,法國地球物理學(xué)J.Morlet在分析地震波的局部性質(zhì)時,發(fā)現(xiàn)傳統(tǒng)的傅利葉轉(zhuǎn)換,難以達到其要求,因此引進小波概念於信號分析中,對信號進行分解。隨後理論物理學(xué)家A.Grossman對Morlet的這種信號根據(jù)一個確定函數(shù)的伸縮,平移系{a-1/2Ψ[(x-b)/a];a,b?R,a≠0}展開的可行性進行了研究,為小波分析的形成開了先河。
1986年,Y.Meyer建構(gòu)出具有一定衰減性的光滑函數(shù)Ψj,k(x),其二進制伸縮與平移系{Ψj,k(x)=√2jΨ(2jx-k);j,k?Z}構(gòu)成L2(R)的規(guī)范正交基。1987年,Mallat巧妙的將多分辨分析的思想引入到小波分析中,建構(gòu)了小波函數(shù)的構(gòu)造及信號按小波轉(zhuǎn)換的分解及重構(gòu)。1988年Daubechies建構(gòu)了具有正交性(Orthonormal)及緊支集(CompactlySupported);及只有在一有限區(qū)域中是非零的小波,如此,小波分析的系統(tǒng)理論得到了初步建立。
三、WAVELET影像壓縮簡介及基礎(chǔ)理論介紹
一、WAVELET的壓縮概念
WAVELET架在三個主要的基礎(chǔ)理論之上,分別是階層式邊碼(pyramidcoding)、濾波器組理論(filterbanktheory)、以及次旁帶編碼(subbandcoding),可以說wavelettransform統(tǒng)合了此三項技術(shù)。小波轉(zhuǎn)換能將各種交織在一起的不同頻率組成的信號,分解成不相同頻率的信號,因此能有效的應(yīng)用於編碼、解碼、檢測邊緣、壓縮數(shù)據(jù),及將非線性問題線性化。良好的分析局部的時間區(qū)域與頻率區(qū)域的信號,彌補傅利葉轉(zhuǎn)換中的缺失,也因此小波轉(zhuǎn)換被譽為數(shù)學(xué)顯微鏡。
WAVELET并不會保留所有的原始資料,而是選擇性的保留了必要的部份,以便經(jīng)由數(shù)學(xué)公式推算出其原始資料,可能不是非常完整,但是可以非常接近原始資料。至於影像中什度要保留,什麼要舍棄,端看能量的大小儲存(跟波長與頻率有關(guān))。以較少的資料代替原來的資料,達到壓縮資料的目的,這種經(jīng)由取舍資料而達到壓縮目地的作法,是近代數(shù)位影像編碼技術(shù)的一項突破。即是WAVELET的概念引入編碼技術(shù)中。
WAVELET轉(zhuǎn)換在數(shù)位影像轉(zhuǎn)換技術(shù)上算是新秀,然而在太空科技早已行之有年,像探測衛(wèi)星和哈柏望遠鏡傳輸影像回地球,和醫(yī)學(xué)上的光纖影像,早就開始用WAVELET的原理壓縮/還原影像資料,而且有壓縮率極佳與原影重現(xiàn)的效果。
以往lossless的編碼法只著重壓縮演算法的表現(xiàn),將數(shù)位化的影像資料一絲不漏的送去壓縮,所以還原回來的資料和原始資料分毫無差,但是此種壓縮法的壓縮率不佳。將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài),控制解碼後影像的品質(zhì),選擇適當(dāng)?shù)木幋a法,而且還在擷取圖形資料時,先幫資料「減肥。如此才是WAVELET編碼法主要的觀念。
二、影像壓縮過程
原始圖形資料色彩模式轉(zhuǎn)換DCT轉(zhuǎn)換量化器編碼器編碼結(jié)束
三、編碼的基本要素有三點
(一)一種壓縮/還原的轉(zhuǎn)換可表現(xiàn)在影像上的。
(二)其轉(zhuǎn)換的系數(shù)是可以量化的。
(三)其量化的系數(shù)是可以用函數(shù)編碼的。
四、現(xiàn)有WAVELET影像壓縮工具主要的部份
(一)WaveletTransform(WAVELET轉(zhuǎn)換):將圖形均衡的分割成任何大小,最少壓縮二分之一。
(二)Filters(濾鏡):這部份包含WaveletTransform,和一些著名的壓縮方法。
(三)Quantizers(量化器):包含兩種格式的量化,一種是平均量化,一種是內(nèi)插量化,對編碼的架構(gòu)有一定的影響。
(四)EntropyCoding(熵編碼器):有兩種格式,一種是使其減少,一種為內(nèi)插。
(五)ArithmeticCoder(數(shù)學(xué)公式):這是建立在AlistairMoffat''''slineartimecodinghistogram的基礎(chǔ)上。
(六)BitAllocation(資料分布):這個過程是用整除法有效率的分配任何一種量化。
肆、WAVELET影像壓縮未來的發(fā)展趨勢
一、在其結(jié)構(gòu)上加強完備性。
二、修改程式,使其可以處理不同模式比率的影像。
三、支援更多的色彩??梢蕴幚鞷GB的色彩,像是YIQ、HUV的色彩定義都可以分別的處理。
四、加強運算的能力,使其可支援更多的影像格式。
五、使用WAVELET轉(zhuǎn)換藉由消除高頻率資料增加速率。
六、增加多種的WAVELET。如:離散、零元樹等。
七、修改其數(shù)學(xué)編碼器,使資料能在數(shù)學(xué)公式和電腦的位元之間轉(zhuǎn)換。
八、增加8X8格的DCT模式,使其能做JPEG的壓縮。
九、增加8X8格的DCT模式,使其能重疊。
十、增加trelliscoding。
十一、增加零元樹。
現(xiàn)今已有由中研院委托國內(nèi)學(xué)術(shù)單位研究,也有不少的研究所的碩士。國外更是如火如荼的展開研究。相信實際應(yīng)用於實務(wù)上的日子指日可待。
伍、影像壓縮研究的方向
1.輸入裝置如何捕捉真實的影像而將其數(shù)位化。
2.如何將數(shù)位化的影像資料轉(zhuǎn)換成利於編碼的資料型態(tài)。
3.如何控制解碼影像的品質(zhì)。
4.如何選擇適當(dāng)?shù)木幋a法。
5.人的視覺系統(tǒng)對影像的反應(yīng)機制。
小波分析,無論是作為數(shù)學(xué)理論的連續(xù)小波變換,還是作為分析工具和方法的離散小波變換,仍有許多可被研究的地方,它是近幾年來在工具及方法上的重大突破。小波分析是傅利葉(Fourier)分析的重要發(fā)展,他保留了傅氏理論的優(yōu)點,又能克服其不足之處。
陸、在印刷輸出的應(yīng)用
WAVELET影像壓縮格式尚未成熟的情況下,作為印刷輸出還嫌太早。但是後續(xù)發(fā)展?jié)摿o窮,尤其在網(wǎng)路出版方面,其利用價值更高,WAVELET的出現(xiàn)就猶如當(dāng)時的JPEG出現(xiàn),在影像的領(lǐng)域中掀起一股旋風(fēng),但是WAVELET卻有JPEG沒有的優(yōu)點,JPEG乃是失真壓縮,且解碼後復(fù)原程度有限,能在網(wǎng)路應(yīng)用,乃是由於電腦的解析度并不需要太高,就可辨識其圖形。而印刷所需的解析度卻需一定的程度。WAVELET雖然也是失真壓縮,但是解碼後卻可以還原資料到幾乎完整還原,如此的壓縮才有存在的價值。
有一點必須要提出的就是,并不是只要資料還原就可以用在印刷上,還需要有解讀其檔案的RIP,才能用於數(shù)位印刷上。等到WAVELET的應(yīng)用成熟,再發(fā)展其適用的RIP,又是一段時間以後的事了。
在網(wǎng)路出版上已經(jīng)有瀏覽器可以外掛讀取WAVELET檔案的軟體了,不過還是測試版,可是以後會在網(wǎng)路上大量使用,應(yīng)該是未來的趨勢。對於網(wǎng)路出版應(yīng)該是一陣不小的沖擊。
圖像壓縮的好處是在於資料傳輸快速,減少網(wǎng)路的使用費用,增加企業(yè)的利潤,由於傳版的時間減少,也使印刷品在當(dāng)?shù)赜∷⒌目赡苄栽龈?,減少運費,減少開支,提高時效性,創(chuàng)造新的商機。
柒、結(jié)論
WAVELET的理論并不是相當(dāng)完備,但是據(jù)現(xiàn)有的研究報告顯現(xiàn),到普及應(yīng)用的階段,還有一段距離。但小波分析在信號處理、影像處理、量子物理及非線性科學(xué)領(lǐng)域上,均有其應(yīng)用價值。國內(nèi)已有正式論文研究此一壓縮模式。但有許多名詞尚未有正式的翻譯,各自有各自的翻譯,故研究起來倍感辛苦。但相信不久即會有正式的定名出現(xiàn)。這也顯示國內(nèi)的研究速度,遠落在外國的後面,國外已成立不少相關(guān)的網(wǎng)站,國內(nèi)僅有少數(shù)的相關(guān)論文。如此一來國內(nèi)要使這種壓縮模式普及還有的等。正式使用於印刷業(yè)更是要相當(dāng)時間。不過對於網(wǎng)路出版仍是有相當(dāng)大的契機,國內(nèi)仍是可以朝這一方面發(fā)展的。站在一個使用其成果的角度,印刷業(yè)界也許并不需要去了解其高深的數(shù)理理論。但是在運用上,為了要使用方便,和預(yù)估其發(fā)展趨勢,影像壓縮的基本概念卻不能沒有。本篇文章單純的介紹其中的一種影像壓縮模式,目的在為了使後進者有一參考的依據(jù),也許在不久的將來此一模式會成為主流,到時才不會手足無措。
參考文獻:
1.GeoffDavis,1997,WaveletImageCompressionConstructionKit,。
2.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(上),峰資訊股份有限公司。
3.張維谷.小宇宙工作室,初版1994,影像檔寶典.WINDOWS實作(下),峰資訊股份有限公司。
4.施威銘研究室,1994,PC影像處理技術(shù)(二)圖檔壓縮續(xù)篇,旗標(biāo)出版有限公司。
5.盧永成,民八十七年,使用小波轉(zhuǎn)換及其在影像與視訊編碼之應(yīng)用,私立中原大學(xué)電機工程學(xué)系碩士學(xué)位論文。
篇6
關(guān)鍵詞:轉(zhuǎn)碼;實時;MPEG-2;H.264
中圖分類號:TP37 文獻標(biāo)識碼:A 文章編號:1009-3044(2017)06-0219-04
1 概述
多種視頻壓縮標(biāo)準(zhǔn)的同時存在,導(dǎo)致視頻設(shè)備間急需解決兼容問題,而視頻轉(zhuǎn)碼是有效解決這種兼容問題的一種技術(shù)。H.264作為新一代的視頻壓縮標(biāo)準(zhǔn),具有比其它視頻壓縮標(biāo)準(zhǔn)擁有更高的壓縮率。然而,當(dāng)前保留的大多數(shù)視頻節(jié)目都是由 MPEG-2壓縮得到的,為了適應(yīng)實際的需要,由 MPEG-2到 H.264的標(biāo)清分辨率實時轉(zhuǎn)碼是很 有必要的。本文的研究工作就是圍繞標(biāo)清實時轉(zhuǎn)碼技術(shù)展開的。
2 轉(zhuǎn)碼方案選取
在轉(zhuǎn)碼器中,編碼部分的耗時遠遠大于解碼部分。本論文研究的目的,是在盡可能少增加碼流和盡量少降低圖像質(zhì)量的前提下,實現(xiàn)MPEG-2到H.264在D1分辨率(720x576)的實時轉(zhuǎn)碼。為此,需要從輸入的MPEG-2碼流中提取可復(fù)用參數(shù)并用于H.264 編碼端,以減輕編碼端的編碼時間。
MPEG-2 轉(zhuǎn) H.264 轉(zhuǎn)碼器屬于不同標(biāo)準(zhǔn)間的轉(zhuǎn)碼。在其轉(zhuǎn)碼過程中,如果直接使用解碼端產(chǎn)生的運動矢量,將導(dǎo)致轉(zhuǎn)碼的運動估計不準(zhǔn)、視頻質(zhì)量下降等許多問題, 所以需要對運動矢量進行調(diào)整。文獻[2]使用mobile-calendar序列對CPDT轉(zhuǎn)碼結(jié)構(gòu)和兩種DCT域轉(zhuǎn)碼結(jié)構(gòu)做了測試。測試的結(jié)果是, 象素域級聯(lián)轉(zhuǎn)碼器轉(zhuǎn)碼后的圖像質(zhì)量(以PSNR為標(biāo)準(zhǔn))明顯高于DCT域轉(zhuǎn)碼。象素域級聯(lián)轉(zhuǎn)碼結(jié)構(gòu)有著低復(fù)雜度和高靈活性等特點,并且有最好的PSNR效果,對錯誤偏移也有很好的抗誤碼性,非常適合作為MPEG-2轉(zhuǎn)H.264轉(zhuǎn)碼器的結(jié)構(gòu)。因此,本文研究的轉(zhuǎn)碼器采用了運動矢量重估計的象素域級聯(lián)轉(zhuǎn)碼結(jié)構(gòu)。
3 轉(zhuǎn)碼器的實現(xiàn)
轉(zhuǎn)碼器的輸入端是正確的 MPEG-2 碼流,輸出端是可包含 I、P、B 三種幀類型的 H.264 碼流,其中 B 幀以及 IDR 幀的頻率可由轉(zhuǎn)碼器參數(shù)設(shè)定。這里詳細討論三種幀類型轉(zhuǎn)碼的算法。
3.1 I幀轉(zhuǎn)碼的實現(xiàn)
本文研究的轉(zhuǎn)碼器針對D1分辨率視頻流,每幀分辨率為720x576,即每幀有1620個宏塊需要編碼。如果I幀中宏塊的幀內(nèi)預(yù)測包含所有預(yù)測模式,將會有非常大的計算量,而且由于標(biāo)準(zhǔn)間較大的差異,轉(zhuǎn)碼器在幀內(nèi)預(yù)測方面可復(fù)用信息非常少。為了達到比較高的轉(zhuǎn)碼速度,并且不影響圖像質(zhì)量,本轉(zhuǎn)碼器采用了簡化幀內(nèi)預(yù)測模式的方法:轉(zhuǎn)碼器在幀內(nèi)預(yù)測部分只采用16x16幀內(nèi)預(yù)測的4種模式,同時降低量化參數(shù)。這樣,每個幀內(nèi)預(yù)測宏塊最多只需進行16次預(yù)測即可,遠遠小于選用全部幀內(nèi)預(yù)測模式的592次。這種方法雖然使轉(zhuǎn)碼器中I幀的壓縮率少量下降,但是大大提高了I幀轉(zhuǎn)碼速度。I幀宏塊的轉(zhuǎn)碼流程如圖1所示。
3.2 P幀的轉(zhuǎn)碼
本文研究的D碼器其運動估計算法主要有以下幾個重點:
宏塊的模式選擇:由于MPEG-2和H.264中運動矢量的相關(guān)性,MPEG-2中得到的基于宏塊16x16的MV對于H.264中的7種幀間預(yù)測模式來說是比較準(zhǔn)確的。如果只采用H.264的16x16,16x8,8x16,8x8四種分割方式進行預(yù)測,雖然會使預(yù)測更加準(zhǔn)確從而減少10%的碼流,但是使運動估計部分的計算復(fù)雜度增加了4倍以上。本轉(zhuǎn)碼器對運算速度的要求很嚴格,所以為了提高轉(zhuǎn)碼速度,本轉(zhuǎn)碼器盡可能采用16x16模式對宏塊進行預(yù)測編碼。當(dāng)16x16模式預(yù)測的塊其SAD超過閾值時,再進行8x8塊分割編碼。
亞像素搜索精度:一般來說編碼器在編碼每幀之前都要對當(dāng)前幀做插值。H.264對亮度最高可達1/4像素,其半像素點需要通過復(fù)雜的6頭濾波,而1/4像素點由一對對角半像素點線性內(nèi)插得出。其計算量很龐大。本轉(zhuǎn)碼器最高搜索精度使用半像素,從而在略微增加碼流大小的情況下大大減少了運動估計的時間。
半像素插值范圍:普通視頻編碼器在編碼P幀前需要對整幅圖像進行插值。本論文研究的轉(zhuǎn)碼器為了提高轉(zhuǎn)碼效率,避免了對所有塊都進行半像素插值。方法是:當(dāng)整像素匹配塊的SAD小于某個閾值時,直接以該匹配塊為最佳匹配塊進行殘差編碼,而不在半像素域內(nèi)進行搜索。這樣可以在對碼流影響不大的情況下,減少半像素6頭濾波的計算次數(shù)以及半像素域的運動搜索。
搜索窗口:轉(zhuǎn)碼器中輸入流包含的運動矢量和在全局范圍內(nèi)重新搜索得到的最佳運動矢量比較接近,為了減少6頭插值濾波的次數(shù)和搜索范圍,同時考慮到MPEG-2解碼產(chǎn)生的指向半像素的運動矢量與H.264編碼的最佳運動矢量有差距,本文轉(zhuǎn)碼方案中運動矢量在復(fù)用前首先進行取整操作。在對坐標(biāo)為(x,y)的宏塊做運動估計時,如果需要進行半像素域搜索,則僅搜索其上下左右四個半像素點,從中找出SAD最小的塊作為最佳匹配塊。
宏塊模式復(fù)用:在MPEG-2碼流中我們還可以得到宏塊模式。對于非幀間預(yù)測塊可以直接利用此信息,將此塊作為H.264中的幀內(nèi)模式來處理。這樣就避免了此塊的模式選擇部分,節(jié)約了時間。
轉(zhuǎn)碼器的編碼端在進行P幀宏塊轉(zhuǎn)碼時,必須首先判斷出16x16宏塊的最佳參考塊位置。
每個P幀宏塊的轉(zhuǎn)碼流程為:
(1)判斷該塊是否為幀間預(yù)測塊,如果不是,則進行16x16幀內(nèi)預(yù)測編碼;
(2)如果該塊屬于幀間預(yù)測,則讀取該塊在解碼中對應(yīng)的運動矢量;
(3)如果該塊有兩個運動矢量,則分別對其進行(4)(5)步,并選取SAD小的運動矢量作為參考;
(4)根據(jù)解碼中對應(yīng)的取整運動矢量從參考幀中找到參考塊,并計算參考塊亮度與當(dāng)前塊亮度之間的SAD;
(5)判斷SAD值是否超過閾值,如果兩個運動矢量所指向的參考塊其SAD均超過閾值,則到(6),否則選取使得SAD小的運動矢量作為運動重估計的參考,并到(10);
(6)根據(jù)該塊周圍塊的運動矢量,計算該塊的PMV,并計算該PMV所指向參考塊與當(dāng)前塊之間的SAD;
(7)選取使SAD最小的運動矢量作為運動重估計的參考;
(8)如果SAD大于閾值,計算參考塊色差U和V相對于當(dāng)前塊的SAD是否都小于閾值。如果是則選取參考塊為最佳匹配塊并運行(10),否則運行(9);
(9)對參考塊周圍進行6頭濾波插值,并在參考塊頂點像素上、下、左、右、頂點5個點的范圍內(nèi)搜素最佳匹配塊;
(10)根據(jù)最佳匹配塊和運動矢量判斷該塊是否屬于SKIP宏塊。如果是則按SKIP宏塊編碼,否則對該塊進行殘差編碼。
從P幀宏塊轉(zhuǎn)碼流程可以看到,本轉(zhuǎn)碼器采用的運動重估計無需對整幅圖像進行插值,并且計算過程中可大大減少半像素6頭濾波插值,從而提高轉(zhuǎn)碼器P幀轉(zhuǎn)碼的速度。
3.3 B幀的轉(zhuǎn)碼
P幀與B幀最大的區(qū)別在于,B幀編碼可以有三種預(yù)測方向:前向,后向和雙向。B幀預(yù)測方式如圖2所示。
3.3.1 MPEG-2中B幀的編碼
在MPEG-2標(biāo)準(zhǔn)中B幀不可以作為參考幀參與運動估計和運動補償,所以編碼器不存儲B幀的編碼重構(gòu)圖像。根據(jù)運動矢量的不同,MPEG-2的B幀宏塊編碼可分為三類:
如果只有一個前向預(yù)測運動矢量,那么該B幀宏塊僅參考前一個I幀或者P幀。這種僅采用前向預(yù)測的B幀宏塊的壓縮方法與P幀中幀間預(yù)測宏塊的壓縮方法類似;
如果只有一個后向預(yù)測的運動矢量,那么該B幀宏塊參考的是后向的一個I幀或P幀,其預(yù)測方法與P幀的幀間預(yù)測原理相同,只不過預(yù)測方向相反;
當(dāng)前向和后向運動矢量都存在時,說明該B幀宏塊需要做雙向預(yù)測。它需要從前后兩個I幀或P幀中做預(yù)測,其殘差塊為當(dāng)前原始宏塊像素與前向、后向兩個預(yù)測塊的像素平均值的差。
MPEG-2中B幀的模式選擇樹形結(jié)構(gòu)如圖3所示。
3.3.2 H.264中的B幀編碼
H.264中B幀的編碼原理和MPEG-2類似,不過其編碼方案有3個重要改進:
允許對B幀宏塊進行劃分,允許對其子塊進行運動估計和運動補償;
允許B幀在過去和將來有限的多幅參考幀中使用多個參考幀進行運動估計,參考幀的數(shù)量隨不同檔次而變;
允許B幀作為其它幀的參考幀。
圖4顯示了H.264中3種B幀編碼方式:一個前向和一個后向預(yù)測;兩個前向預(yù)測;兩個后向預(yù)測。
和MPEG-2相比H.264在B幀的模式中增加了一種DIRECT模式。這種模式與SKIP模式有些類似,其運動矢量不編碼,而是根據(jù)周圍宏塊的運動矢量進行預(yù)測得到的。不過它與SKIP模式最大的不同在于,SKIP模式的宏塊沒有像素殘差,而DIRECT模式有像素差。這樣在編碼過程中可以節(jié)省運動矢量的編碼位數(shù),從而增大壓縮比。
在B幀中可以對宏塊進行4種分割,分別是16x16、16x8、8x16、8x8。不同的分割方式可以采用的預(yù)測模式也不盡相同。表1所示為B幀的宏塊預(yù)測選擇。
3.3.3 B幀轉(zhuǎn)碼的實現(xiàn)
B幀的轉(zhuǎn)碼和P幀轉(zhuǎn)碼相似,也需要對運動矢量進行調(diào)整。B幀預(yù)測在H.264中是非常消耗時間的,如果使用多參考幀,其計算量遠遠高于P幀編碼。為了使轉(zhuǎn)碼器在高速轉(zhuǎn)碼B幀的同時,盡量少影響碼流大小,設(shè)計合理的模式選擇算法非常重要。
本文研究的轉(zhuǎn)碼器其B幀宏塊模式選擇方法有以下幾個關(guān)鍵:
一般來說,輸入MPEG-2碼流中B幀的預(yù)測模式選擇是比較準(zhǔn)確的,所以轉(zhuǎn)碼器對MPEG-2碼流中B幀宏塊的預(yù)測方向進行復(fù)用。如果編碼宏塊對應(yīng)MPEG-2碼流中采用的是單向預(yù)測,則直接復(fù)用該預(yù)測模式。如果該宏塊采用的是雙向預(yù)測,則在H.264編碼時根據(jù)計算決定預(yù)測方式。這樣可以在碼流壓縮率基本不變的情況下,使預(yù)測模式的選擇時間減少到原來的三分之一;
H.264標(biāo)準(zhǔn)中的DIRECT模式支持16x16宏塊分割方式,并且使碼流壓縮率有明顯提高,所以本轉(zhuǎn)碼器在處理雙向預(yù)測塊的運動估計時,采用雙向預(yù)測和DIRECT預(yù)測模式,并從中選出最合適的模式進行宏塊殘差編碼。雖然和僅采用雙向預(yù)測相比增加了一種預(yù)測模式,從而增加了運動估計的運算,但是使得壓縮后B幀碼流比特率大大減少。
如果B幀宏塊在解碼端采用前向或后向預(yù)測,則H.264編碼端該宏塊采用和解碼時相同的預(yù)測模式進行編碼。當(dāng)B幀宏塊解碼端采用雙向預(yù)測時,其模式選擇過程為:
取前向預(yù)測運動矢量,按前向預(yù)測方式找到最佳匹配塊,并計算SAD。如果SAD小于閾值,則按前向預(yù)測進行編碼,否則繼續(xù)進行預(yù)測模式的選擇;
取后向預(yù)測運動矢量,按后向預(yù)測方式找到最佳匹配塊,并計算SAD。如果SAD小于閾值,則按后向預(yù)測進行編碼,否則繼續(xù)進行預(yù)測模式的選擇;
進行DIRECT預(yù)測,找到最佳匹配塊,并計算SAD。如果小于閾值,則按DIRECT模式進行編碼,否則繼續(xù)進行預(yù)測模式的選擇;
進行雙向預(yù)測,并與DIRECT預(yù)測模式進行比較,選擇COST小的模式進行編碼。
B幀雙向預(yù)測塊轉(zhuǎn)碼流程如圖5所示。
4 測試結(jié)果
4.1不使用去方塊濾波器的轉(zhuǎn)碼效果
測試環(huán)境為PCIntel(R)Core(TM)2CPU2.0GHz,內(nèi)存1G。在試驗中D1(720x576)測試碼流選用廣電提供的大話西游片段序列和Tank序列,幀數(shù)均為25fps,GOP均為15,碼流格式為IBBP。轉(zhuǎn)碼輸出端輸出格式同輸入碼流格式,幀數(shù)均為25fps。測試轉(zhuǎn)碼時測試200幀,量化參數(shù)選用QP=32,不使用去方塊濾波。
大話西游測試碼流屬于運動不是很劇烈的碼流。使用本轉(zhuǎn)碼器測試后,PSNR平均值35.3712,最低值33.8383,最高值39.0904。前4幀PSNR為:
PSNR (YCbCr Y Cb Cr): 37.6093 36.2018 43.9715 43.8465
PSNR (YCbCr Y Cb Cr): 35.3219 33.7641 44.1130 43.7948
PSNR (YCbCr Y Cb Cr): 35.1656 33.6160 43.7726 43.4904
PSNR (YCbCr Y Cb Cr): 35.3718 33.8730 43.0355 42.8159
轉(zhuǎn)碼后200幀的碼流大小共1.296kb,轉(zhuǎn)碼速度為平均每幀24.184ms。在實時要求的每幀40ms情況下,可以實現(xiàn)實時轉(zhuǎn)碼器。
Tank序列和上一個序列相比運動比較劇烈。測試得到PSNR平均值為33.3818,最低值31.2469,最高值37.0915。前4幀PSNR為:
PSNR (YCbCr Y Cb Cr): 34.4716 32.8147 45.2238 46.8538
PSNR (YCbCr Y Cb Cr): 31.8217 30.1360 43.4940 46.3854
PSNR (YCbCr Y Cb Cr): 32.0798 30.3967 43.7334 46.2518
PSNR (YCbCr Y Cb Cr): 33.2598 31.6105 43.2837 46.0296
轉(zhuǎn)碼后200幀的碼流大小共2.540kb,轉(zhuǎn)碼速度為平均每幀27.3ms。可以實現(xiàn)實時轉(zhuǎn)碼。雖然在劇烈的運動視頻進行轉(zhuǎn)碼時PSNR會有所下降,但是從視覺上感覺差異不大。
由實驗結(jié)果可見,在對運動不是很劇烈的碼流進行轉(zhuǎn)碼時,碼流壓縮率比較高,圖像質(zhì)量比較好,轉(zhuǎn)碼速度很快,在對運動比較劇烈的碼流轉(zhuǎn)碼時,碼流壓縮率和圖像質(zhì)量都有所下降,但是都在可以接受的范圍內(nèi)。雖然轉(zhuǎn)碼速度也略有下降,但是還是能保證實時轉(zhuǎn)碼。
4.2使用去方塊濾波器的轉(zhuǎn)碼效果
測試時使用大話西游片段序列和Tank序列,同樣測試200幀,選用量化參數(shù)QP=32,轉(zhuǎn)碼時使用去方塊濾波器。
大話西游碼流平均轉(zhuǎn)碼速度為每幀29.61ms,其中V波耗時平均每幀5.43ms。PSNR平均值35.6615,最低值34.1878,最高值39.4467,前4幀的PSNR為:
PSNR (YCbCr Y Cb Cr): 37.5639 36.1336 44.2403 44.0461
PSNR (YCbCr Y Cb Cr): 35.4928 33.9397 44.2055 43.8518
PSNR (YCbCr Y Cb Cr): 35.3602 33.8116 43.9539 43.6541
PSNR (YCbCr Y Cb Cr): 35.5582 34.0564 43.3320 42.9935
該測試條件下的PSNR和不使用濾波器時測得的PSNR平均值35.3712,最低值33.8383,最高值39.0904相比,有明顯的提升,且塊效應(yīng)有明顯的消除。碼流大小1,292kb,與不使用濾波時壓縮的1,296kb相比有少量下降。
Tank碼流平均轉(zhuǎn)碼速度為每幀35.199ms,其中濾波耗時平均每幀7.90ms。PSNR平均值33.5520,最低值31.4689,最高值37.2467,前4幀的PSNR為:
PSNR (YCbCr Y Cb Cr): 34.2591 32.5901 45.6571 47.0037
PSNR (YCbCr Y Cb Cr): 31.8855 30.1968 43.7478 46.5964
PSNR (YCbCr Y Cb Cr): 32.1336 30.4466 44.0063 46.5356
PSNR (YCbCr Y Cb Cr): 33.2226 31.5645 43.6591 46.2399
該測試條件下的PSNR和不使用去方塊濾波時PSNR平均值為33.3818,最低值31.2469,最高值37.0915相比,圖像質(zhì)量有明顯提高。轉(zhuǎn)碼后碼流大小為2,512kb,比不使用濾波時的2,540kb有所下降。
由實驗結(jié)果可見,兩個碼流在轉(zhuǎn)碼器添加去方塊濾波功能的情況下,圖像質(zhì)量有所提升,碼流大小略有下降,轉(zhuǎn)碼速度仍然達到了D1分辨率實時轉(zhuǎn)碼的目的。
5 結(jié)束語
本論文的研究目標(biāo)是基于 PC 環(huán)境,在保證圖像質(zhì)量少量損失的前提下實現(xiàn) MPEG-2 到 H.264 的 D1 分辨率實時轉(zhuǎn)碼。當(dāng)前,分辨率為 D1 電視格式的視頻編碼大多是通過 MPEG-2 壓縮的,而 H.264 由于其性能的卓越,注定會在當(dāng)今與將來有更廣泛的應(yīng)用,所以研究 MPEG-2 到 H.264 的轉(zhuǎn)碼是很必要的,有很強的現(xiàn)實意義與價值。
參考文獻:
[1] 畢厚杰.新一代視頻壓縮編碼標(biāo)準(zhǔn)H.264/AVC[M].北京:人民郵電出版社,2005:22-24.
[2] Werner N.Requantization for transcoding of MPEG-2 intraframes[J]. IEEE Trans image Process,1999,8(2):.
[3] Assuncao P, Ghanbari M. Buffer analysis and control in CBR video transcoding[J].IEEE Trans. Circuits Syst. Video Technol,2002(12): 1009-1020.
篇7
關(guān)鍵詞:嵌入式系統(tǒng),802.11協(xié)議,無線視頻傳輸,樓宇智能化
1.引言
目前樓宇門禁裝置大多為一個簡單的可控電子開關(guān),一般采取語音對話的有線控制方式,不具備可視化能力和無線控制能力,其存在交互效果差、有線網(wǎng)絡(luò)布線繁瑣、智能化程度不夠高的缺點。。隨著視頻編、解碼技術(shù)和無線傳輸技術(shù)的快速發(fā)展,智能化樓宇系統(tǒng)也得到了快速的發(fā)展。嵌入式無線網(wǎng)絡(luò)產(chǎn)品以其體積小、成本低、使用靈活方便等優(yōu)點,得到了越來越廣泛的應(yīng)用。隨著市場上智能化樓宇的不斷升溫, 門鈴系統(tǒng)已作為智能化辦公室和智能化小區(qū)的一個重要組成部分。
本研究介紹的智能小區(qū)無線可視化門鈴系統(tǒng)正是在這樣的應(yīng)用前景下,基于802.11無線網(wǎng)絡(luò)協(xié)議進行設(shè)計的。
2.系統(tǒng)整體結(jié)構(gòu)設(shè)計與工作原理
如圖1所示,該系統(tǒng)采用低功耗、高性能的嵌入式IDTRC32434 作為主控芯片,使用VW2010芯片進行硬實時編解碼以提高編解碼效率,采用PHILIPS公司的BGW200無線芯片進行音視頻碼流的轉(zhuǎn)發(fā)控制。整個系統(tǒng)由服務(wù)器端和客戶端兩部分組成,主要實現(xiàn)音頻視頻數(shù)據(jù)采集和高質(zhì)量編解碼以及無線網(wǎng)絡(luò)傳輸功能。
服務(wù)器端工作原理
由CCD Sensor和音頻端口進來的輸入信號,經(jīng)過視頻A/D和音頻A/D轉(zhuǎn)換后,進行MPEG4視頻編碼和MPEG MP3音頻編碼。編碼后的視音頻碼流送到網(wǎng)絡(luò)復(fù)用模塊打包后,將壓縮編碼后的數(shù)據(jù)流經(jīng)過802.11x無線網(wǎng)絡(luò)送到客戶端。如下圖1所示:
系統(tǒng)客戶端工作原理
由無線網(wǎng)絡(luò)接收的音視頻碼流數(shù)據(jù),經(jīng)過網(wǎng)絡(luò)解復(fù)用模塊解復(fù)用后,獲得的視頻碼流和音頻碼流分別送至視頻解碼模塊和音頻解碼模塊進行MPEG4
視頻解碼和MP3音頻解碼。解碼后的數(shù)據(jù)經(jīng)過視頻模擬編碼、D/A和音頻D/A轉(zhuǎn)換后送到可視終端顯示。如下圖2所示:
3.硬件設(shè)計
系統(tǒng)的硬件設(shè)計主要分四個部分:主控制系統(tǒng)、音視頻采集系統(tǒng)、多媒體編解碼系統(tǒng)、無線網(wǎng)絡(luò)系統(tǒng)。。
3.1 主控芯片采用IDT RC32434
它是一款64位MIPS,內(nèi)部集成了NAND Flash控制器(FlashC)、32位PCI總線控制器(PCIC)、4通道DMA控制器、4通道SDRAM控制器(SDRAMC)、外部總線控制器 (EBUSC)、外部總線接口(E―BUSI)以及2個通用串口等,并通過內(nèi)部總線對它們分別進行控制。該芯片提供高達400MHz的頻率,集成了標(biāo)準(zhǔn)外圍元件互連(PCI)接口,可與802.11a/b/g和串行Ⅵ、等先進外圍設(shè)備連接。處理速度快,功能強,性價比高,能很好滿足嵌入式ucLinux系統(tǒng)的需求。
3.2 CCD 攝像頭和A/D 轉(zhuǎn)換芯片
SAA 7110 是Philip s 公司生產(chǎn)的可編程前端視頻解碼器,它可將輸入的視頻模擬信號轉(zhuǎn)換為YUV 數(shù)字信號。其內(nèi)部包含三路模擬處理通道, 能實現(xiàn)視頻源的選擇, 數(shù)據(jù)輸出格式有YUV4: 1: 1 (8bit) 和YUV 4: 2: 2 (8bit) 兩種。它還包括抗混疊濾波,A/D 轉(zhuǎn)換, 自動嵌位, 自動增益控制, 時鐘產(chǎn)生, 多制式解碼及亮度、對比度和飽和度的控制等功能。
3.3多媒體編解碼芯片
該系統(tǒng)采用VW2010作為多媒體編解碼芯片,它是一種實時MPEG-4音視頻壓縮/解壓芯片。其片內(nèi)集成有3個信號處理/控制單元,包括一個視頻編碼(壓縮)器、一個視頻解碼(解壓)器和一個片內(nèi)CPU(內(nèi)部擴展一個音頻編碼DSP、一個音頻解碼DSP、一個多路復(fù)合單元和一個多路解復(fù)合單元)。具有可編程、高性能和低功耗特點,因為每個信號處理/控制單元都由一個RISC處理器和專用的硬件加速器構(gòu)成。
3.4802. 11b 芯片
無線模塊采用的芯片是PHILIPS公司的BGW200,該芯片通過高速串口SPI2與處理器的SPI1口連接。SPI(SerialPeripheral Interface,串行外設(shè)接口)是一種同步外設(shè)接口,允許MCU與各種外圍設(shè)備以串行方式進行通信、數(shù)據(jù)交換。當(dāng)IDT RC32434與BGW200之間互相通信時只能通過BGW200的SPI2口進行,此時IDT RC32434是主(HOST),BGW200是從機(SLAVE),傳輸?shù)臅r鐘由HOST控制。
4.軟件設(shè)計
本系統(tǒng)軟件設(shè)計按層次劃分主要分為三層:系統(tǒng)初始化引導(dǎo)和嵌入式系統(tǒng)內(nèi)核移植、外設(shè)驅(qū)動程序編寫(包括USB攝像頭驅(qū)動、無線網(wǎng)絡(luò)模塊驅(qū)動等)、數(shù)據(jù)采集與無線傳輸。
4.1 系統(tǒng)引導(dǎo)、內(nèi)核移植和文件系統(tǒng)的建立
雖然Linux 內(nèi)核小、效率高,但嵌入式系統(tǒng)的硬件資源畢竟有限,因此不能直接把Linux作為操作系統(tǒng),要針對具體的應(yīng)用通過配置內(nèi)核、裁減shell和嵌入式C庫對系統(tǒng)進行定制,使整個系統(tǒng)能夠存放到容量較小的Flash中。嵌入式Linux系統(tǒng)主要由4 個部分組成:引導(dǎo)內(nèi)核啟動的文件(bootloader)、Linux內(nèi)核文件(kernel)、虛擬磁盤文件(ramdisk)、用戶空間文件(user)。把它們分別放在DataFlash內(nèi)的4個分區(qū)模塊中。對于不需要動態(tài)改變,使用較節(jié)省空間的ROMFS只讀文件系統(tǒng);user模塊內(nèi)需要進行較多的讀寫操作,所以使用支持動態(tài)擦寫保存的JFFS2文件系統(tǒng)。在構(gòu)建完軟件平臺后,下面就主要涉及到USB攝像頭驅(qū)動和無線驅(qū)動模塊設(shè)計、視頻采集模塊和基于802.11無線網(wǎng)絡(luò)傳輸模塊的程序設(shè)計。
4.2 USB攝像頭驅(qū)動
搭建好嵌入式Linux的開發(fā)環(huán)境后,下一步就首要完成USB攝像頭驅(qū)動工作。。Video4Linux(V4L)是Linux中關(guān)于視頻設(shè)備的內(nèi)核驅(qū)動,它為針對視頻設(shè)備的應(yīng)用程序編程提供一系列接口函數(shù)。對于USB口攝像頭,其驅(qū)動程序中提供了基本的I/O操作接口函數(shù)open,read,write,close的實現(xiàn)。當(dāng)應(yīng)用程序?qū)υO(shè)備文件進行系統(tǒng)調(diào)用操作時,Linux內(nèi)核將通過file-operations結(jié)構(gòu)訪問驅(qū)動程序提供的函數(shù)。在編譯時選取動態(tài)加載模式,確定USB攝像頭被正常驅(qū)動后,下一步就是使用Video4Linux提供的API函數(shù)集來編寫視頻采集程序。
4.3 音視頻數(shù)據(jù)采集
在完成USB攝像頭驅(qū)動后,就可以針對設(shè)備文件/dev/video進行視頻捕捉方面的程序設(shè)計。其中用到的主要函數(shù)有:Camera open():用來開啟視頻設(shè)備文件;Camera get capability():取得設(shè)備文件的相關(guān)信息;Cameraget picture():獲取圖像的相關(guān)信息
Cameraclose():用來關(guān)閉設(shè)備文件;Camera grab image():用來抓取圖像,采用mmap方式,直接將設(shè)備文件/dev/ video0映射到內(nèi)存,加速文件I/O操作,還可以使多個線程共享數(shù)據(jù)。如圖3.
圖3
4.4音視頻壓縮編解碼
獲取圖像數(shù)據(jù)后,可以直接輸出到FrameBuffer進行顯示,由于本系統(tǒng)要將采集到的音視頻通過無線網(wǎng)絡(luò)傳輸出去,所以在傳輸之前要對原始的圖像數(shù)據(jù)進行壓縮編碼,在此選用VW2010芯片來實現(xiàn)MPEG- 4視頻編解碼方案。和其他標(biāo)準(zhǔn)相比,MPEG-4壓縮比更高,節(jié)省存儲空間,圖像質(zhì)量更好,特別適合在低帶寬條件下傳輸視頻,并能保持圖像的質(zhì)量。對視頻流進行壓縮編碼以后,接下來就要實現(xiàn)網(wǎng)絡(luò)傳輸部分的功能。
4.5無線網(wǎng)絡(luò)模塊驅(qū)動
無線驅(qū)動模塊的軟件架構(gòu)分為三部分:客戶驅(qū)動(client driver)、主機硬件抽象層(HHAL)、主機操作系統(tǒng)抽象層(HOSAL)。設(shè)備驅(qū)動程序本質(zhì)上來說就是一組相關(guān)函數(shù)的集合。它利用結(jié)構(gòu)體file_operations與文件系統(tǒng)聯(lián)系起來,內(nèi)核使用該結(jié)構(gòu)體訪問驅(qū)動程序的函數(shù),該數(shù)據(jù)結(jié)構(gòu)定義再<linux/fs.h>頭文件中。在這個數(shù)據(jù)類型中,每一個成員變量指向驅(qū)動程序定操作的函數(shù),對于沒有的操作函數(shù),相應(yīng)的成員函數(shù)可以設(shè)置位NULL。
設(shè)備驅(qū)動程序通常包含下面3個最主要的部分:(1)驅(qū)動程序的注冊和注銷;(2)設(shè)備的打開和釋放;(3)設(shè)備的讀寫操作。
對于需要動態(tài)加載的模塊,通過執(zhí)行Makefile文件,在當(dāng)前目錄會生成目標(biāo)文件wireless.o。將目標(biāo)文件wireless.o下載到已經(jīng)燒寫好的文件系統(tǒng)中。當(dāng)目標(biāo)板重新啟動后,運行命令:insmod wireless.o 即可將無線驅(qū)動模塊鏈接到內(nèi)核中。一旦驅(qū)動程序被注冊到內(nèi)核表中,對驅(qū)動程序的操作就和它的主設(shè)備號對應(yīng)起來了。當(dāng)應(yīng)用程序?qū)υO(shè)備文件進行某種操作時,內(nèi)核會從file_operations結(jié)構(gòu)中找到并去調(diào)用正確的函數(shù)。卸載模塊可輸入下面的命令:rmmodwireless.o。
4.6無線網(wǎng)絡(luò)傳輸控制過程
(1) 初始化
系統(tǒng)初始化包括對SAA 7110、VW2010、RC32434、BGW20 等芯片的初始化。初始化過程主要包括對一些數(shù)據(jù)寄存器、地址寄存器、中斷服務(wù)寄存器等進行相應(yīng)的操作以形成系統(tǒng)運行環(huán)境的初始狀態(tài)。
(2) 傳輸控制策略
上電開始初始化程序后,服務(wù)器端USB攝像頭的模擬視頻信號在程序控制下通過SAA7110 視頻解碼芯片完成模數(shù)轉(zhuǎn)換,接著mpeg4 編碼芯片VW2010將接收的數(shù)字圖像信號進行DCT變換、量化編碼、熵編碼后,把數(shù)據(jù)流輸出到相應(yīng)的SDRAM內(nèi)部的FIFO中。RC32434MCU在FIFO中查找?guī)綐?biāo)志,如果找到,判斷緩沖區(qū)內(nèi)是否有一幀的數(shù)據(jù),如果有則微處理器讀出壓縮數(shù)據(jù)流并發(fā)送到BGW20進行擴頻、調(diào)制發(fā)射出去。客戶端初始化過程與服務(wù)器端類似,在系統(tǒng)初始化完畢后通過與服務(wù)器端交互,建立網(wǎng)絡(luò)連接,并將SDRAM 用作硬解碼時的數(shù)據(jù)緩沖區(qū),采用LCD 接口連液晶屏用來顯示圖像。整個系統(tǒng)中,由RC32434完成對各器件的初始化、協(xié)調(diào)整個系統(tǒng)的工作。
5.結(jié)論
系統(tǒng)采用64位MIPS芯片IDT RC32434作為主控制器,以VW2010作為MPEG-4編、解碼芯片實現(xiàn)網(wǎng)絡(luò)端口輸入和輸出的MPEG-4碼流、采用BGW200無線模塊進行音視頻數(shù)據(jù)傳輸,在uclinux平臺上結(jié)合先進的多媒體無線傳輸技術(shù)實現(xiàn)的,結(jié)果表明其具有較高的傳輸效率、和普遍的門禁設(shè)備相比,本系統(tǒng)具有更好的靈活性與擴展性、交互能力、控制能力更強。而且該無線音視頻傳輸技術(shù)也可廣泛用于IP電視、衛(wèi)星電視、安防系統(tǒng)、智能樓宇系統(tǒng)和基于MPEG-4標(biāo)準(zhǔn)的數(shù)字電視廣播系統(tǒng)中,應(yīng)用前景十分廣闊。
參考文獻
[1] 杜春雷編著,《ARM 體系結(jié)構(gòu)與編程》, 清華大學(xué)出版社,2003.
[2]Philips Semi conductor,《SAA 7110 Enhanced Video Input Processor (EVIP) Data Sheet》, May 1998.
[3] 魏永明、駱剛等譯,《Linux 設(shè)備驅(qū)動程序》第二版, 中國電力出版社, 2002.
[4] 廣州周立功單片機發(fā)展有限公司. P89LPC932A1 FLASH單片機使用指南.
[5]Thomson, J. An integrated 802.11a baseband and MAC processor. Solid-State Circuits Conference,ISSCC,2002(1):12~21
篇8
【關(guān)鍵詞】數(shù)模結(jié)合;收費公路;監(jiān)控聯(lián)網(wǎng);方案
0 概述
甘肅省省公路管理局作為甘肅省公路系統(tǒng)的主管部門,管轄13個公路總段和1個公路分局。各公路總段和公路分局分管各自轄區(qū)內(nèi)的二級公路收費所,每個收費所又分管有1至3個收費站。目前,各個收費站監(jiān)控系統(tǒng)只停留在其上級單位――收費所中。監(jiān)控視頻和音頻未能進一步傳輸至公路總段,更未能上傳至省省公路管理局。因此,省公路管理局和各公路總段對所轄收費所的管理及各收費站車流量情況的監(jiān)控都無法達到可視化的效果,不能及時給公路總段和省公路管理局的相關(guān)領(lǐng)導(dǎo)提供交通一線的決策信息。隨著信息技術(shù)的發(fā)展,省公路管理局根據(jù)自身現(xiàn)象,提出將監(jiān)控信號、IP視頻傳輸、中心(分控中心)顯示、點播、存儲、大屏幕顯示系統(tǒng)有效的結(jié)合為一個整體,構(gòu)建一個優(yōu)質(zhì)的基于網(wǎng)絡(luò)平臺的數(shù)字視頻管理系統(tǒng),從而實現(xiàn)全省二級公路聯(lián)網(wǎng)監(jiān)控。
1 方案目標(biāo)
省公路管理局此次建設(shè)智能視頻監(jiān)控系統(tǒng),實現(xiàn)對整個二級公路收費站的實時視頻監(jiān)控、圖像存儲、歷史圖像查詢、云臺操作控制;實現(xiàn)監(jiān)控網(wǎng)絡(luò)和監(jiān)控內(nèi)容的廣度覆蓋,監(jiān)控網(wǎng)絡(luò)應(yīng)全面覆蓋重點地區(qū),監(jiān)控內(nèi)容應(yīng)適應(yīng)二級公路收費系統(tǒng)視頻監(jiān)控業(yè)務(wù)的需求;實現(xiàn)監(jiān)控信息反饋的快速反應(yīng),確保信息的快速、高效和安全流動。具體建設(shè)目標(biāo):建成省級二級路收費站監(jiān)控網(wǎng)絡(luò),建成省級主控室和中心機房,建設(shè)智能視頻監(jiān)控管理平臺。
2 系統(tǒng)功能
根據(jù)各收費所監(jiān)控系統(tǒng)的實際情況,經(jīng)過綜合分析,要實行聯(lián)網(wǎng)監(jiān)控,最好的方案是監(jiān)控數(shù)據(jù)逐級匯總,最終傳輸至省公路管理局,省公路管理局可隨時根據(jù)需要點播對應(yīng)收費站的相關(guān)視頻,并進行監(jiān)聽。我們可以將系統(tǒng)歸納為監(jiān)控資源、傳輸網(wǎng)絡(luò)、監(jiān)控中心、視頻管理平臺四個部分。
(1)監(jiān)控資源是監(jiān)控信息的起始點,包括圖像信息、音頻信息、報警信息甚至還包括區(qū)域監(jiān)控系統(tǒng)。在本案中監(jiān)控資源指收費站視頻監(jiān)控攝像機。
(2)傳輸網(wǎng)絡(luò)是監(jiān)控信息的傳輸通道。傳輸網(wǎng)絡(luò)可分為模擬和數(shù)字兩種。本方案的傳輸網(wǎng)絡(luò)為IP傳輸網(wǎng),采用光纖線路(租用或敷設(shè))和租用運營商MSTP(10M)線路兩種方式來實現(xiàn)聯(lián)網(wǎng)。
(3)監(jiān)控中心是各種監(jiān)控資源的處理和響應(yīng)中心。同時包含查看監(jiān)控資源、大屏幕電視墻圖像顯示、音視頻錄相及各種終端設(shè)備的控制及管理。本方案中包括三級監(jiān)控中心,第一級為省公路管理局監(jiān)控中心、第二級為公路總段監(jiān)控中心、第三級為收費所監(jiān)控中心。收費所監(jiān)控中心為監(jiān)控資源的匯聚中心,也是目前全省各收費的已建成的比較完整的監(jiān)控中心,都具備相對獨立、完整的CATV監(jiān)控系統(tǒng)。
(4)視頻管理平臺是整個系統(tǒng)的調(diào)度、管理核心,負責(zé)系統(tǒng)內(nèi)各種監(jiān)控資源信息的調(diào)配和記錄、用戶的管理、設(shè)備的管理工作。同時負責(zé)與第三方系統(tǒng)接口工作等。
3 數(shù)模結(jié)合技術(shù)下的整體設(shè)計框架
視頻編碼器和解碼器應(yīng)用到模擬監(jiān)控系統(tǒng)中,將傳統(tǒng)的模擬視頻信號轉(zhuǎn)換為數(shù)字信號,通過計算機網(wǎng)絡(luò)來傳輸,這就實現(xiàn)了視頻/音頻的數(shù)字化、系統(tǒng)的網(wǎng)絡(luò)化、應(yīng)用的多媒體化和管理的智能化。ivsIP智能監(jiān)控解決方案,通過視頻管理平臺實現(xiàn)圖像信息的調(diào)配、存儲、回放以及用戶、設(shè)備的管理,實現(xiàn)了整個系統(tǒng)的智能化??傮w設(shè)計如圖1所示:
圖1 系統(tǒng)總體設(shè)計圖
IVSIP智能解決方案:最底層的監(jiān)控資源在經(jīng)過監(jiān)控接入層的編碼器編碼后,通過媒體交換層的IP承載網(wǎng),將監(jiān)控音、視頻信息傳送至控制管理層和視頻應(yīng)用層。不同于傳統(tǒng)的監(jiān)控模式,監(jiān)控視頻流和音頻流以IP數(shù)據(jù)包的形式在網(wǎng)絡(luò)中傳輸。因此,可以很方便地通過媒體交換服務(wù)器MS、視頻管理服務(wù)器VM和DC解碼器對監(jiān)控音、視頻資源進行統(tǒng)一管理。還可以很方便地應(yīng)用IP SAN技術(shù),對音、視頻數(shù)據(jù)進行集中存儲和備份。另外,通過開發(fā)相應(yīng)視頻應(yīng)用程序,可以更深層次的應(yīng)用音、視頻監(jiān)控信息。如圖2所示。
圖2 iVS IP智能監(jiān)控解決方案示意圖
3.1 視頻編、解碼器
編解碼器支持H.264、MPEG2、MPEG4、MJPEG等多種標(biāo)準(zhǔn)編碼格式,提供從單路到16路各種密度的規(guī)格,支持實時流和存儲流雙流設(shè)計,支持高至8Mbps的高清碼流或低至128Kbps的標(biāo)清碼流并且可以根據(jù)用戶需求任意調(diào)整,采用電信級制造工藝,可以基于各種網(wǎng)絡(luò)環(huán)境高質(zhì)量、可靠的滿足各類網(wǎng)絡(luò)監(jiān)控前端編碼、存儲和解碼的需求。
3.2 網(wǎng)絡(luò)視頻存儲系統(tǒng)
專業(yè)的IP存儲技術(shù)和強大的數(shù)據(jù)管理服務(wù)器構(gòu)建完善的網(wǎng)絡(luò)存儲系統(tǒng),存儲資源可以根據(jù)需求分布式部屬并加以統(tǒng)一資源管理和調(diào)度,支持動態(tài)存儲資源管理、在線部屬,可以基于統(tǒng)一平臺滿足不同存儲質(zhì)量、容量和服務(wù)質(zhì)量的客戶需求,可以提供完善的備份和存儲生命周期管理功能,同時支持NAS備份功能。
3.3 系統(tǒng)管理平臺
包括專用的視頻管理服務(wù)器、數(shù)據(jù)管理服務(wù)器、客戶端和流媒體服務(wù)器,視頻管理服務(wù)器是用于集中認證、注冊、配置、控制、報警轉(zhuǎn)發(fā)控制的專用信令服務(wù)器,可以實現(xiàn)完善的視頻編解碼設(shè)備網(wǎng)絡(luò)管理功能,支持多臺信令管理服務(wù)器相互協(xié)同工作組建多級多域的管理平臺。數(shù)據(jù)管理服務(wù)器主要功能為管理存儲設(shè)備、存儲資源和視頻數(shù)據(jù),支持對系統(tǒng)所有存儲資源進行全方位的監(jiān)控和管理,支持不間斷的視頻檢索、回放等業(yè)務(wù)??蛻舳丝梢蕴峁┯押梅奖愕娜藱C界面功能,包括監(jiān)控對象的實時監(jiān)視監(jiān)聽、查詢、云臺控制、接警處理,并集成了基本的GIS功能方便用戶操作。
3.4 承載網(wǎng)絡(luò)系統(tǒng)
采用充分組播優(yōu)化的系列交換機對前端視頻編碼器傳輸?shù)臄?shù)據(jù)進行接入、匯聚、交換。通過設(shè)備自身安全特性和防火墻等實現(xiàn)對邊界安全接入的控制。同時可通過網(wǎng)絡(luò)本身的設(shè)備、協(xié)議冗余實現(xiàn)整個監(jiān)控網(wǎng)絡(luò)的穩(wěn)定性。
篇9
關(guān)鍵詞:SC2262;SC2272;智能手機;無線尋呼
靜脈輸液是目前疾病治療的主要手段。然而因我國人口眾多,醫(yī)療資源不充足,經(jīng)常出現(xiàn)醫(yī)院病床緊張的情況,因此,醫(yī)院設(shè)立了輸液大廳,類似于門診治輸液方式,其存在患者眾多,人員流動性大,醫(yī)護人員分配少的特點。輸液人數(shù)眾多護士工作強度大,無法定期查看患者輸液進行狀況?;颊咭坏斠航Y(jié)束,沒有及時換藥或撥針將出現(xiàn)血液回流等不良狀況,必然會增加醫(yī)療事故發(fā)生的概率。針對上述現(xiàn)狀,為了緩解護士的工作壓力,為患者提供可靠優(yōu)質(zhì)的治療服務(wù),國內(nèi)外部分廠家相繼研制了有線尋呼系統(tǒng),因其存在布線施工復(fù)雜、成本高、維護難的不足,已不能很好的用于輸液大廳這種場合[1]。基于上述背景,本文順應(yīng)物聯(lián)網(wǎng)理念的發(fā)展潮流,本著低成本,高可靠性、穩(wěn)定性的原則,將WIFI技術(shù)、無線射頻技術(shù)、智能手機技術(shù)相結(jié)合,設(shè)計了一款低成本、移動性好、多種模式無線主機接收,可靈活組網(wǎng)進行無線擴展的輸液無線尋呼系統(tǒng)。
1 系統(tǒng)總體結(jié)構(gòu)設(shè)計
系統(tǒng)總體框圖如圖1所示,由呼叫終端、接收主機、護士站PC機及智能手機終端構(gòu)成。在實際使用中,呼叫終端由病人手持或安放在輸液椅子邊上,(注意:椅子的編號與呼收終端地址相對應(yīng))。當(dāng)輸液結(jié)束時,病人按下呼叫終端上的按鍵,通過無線射頻發(fā)射呼叫信息幀到接收主機,接收主機收到有效信息后通過WIFI模塊以WIFI網(wǎng)絡(luò)通信技術(shù),轉(zhuǎn)發(fā)到護士站的PC機進行語音報號,同時還可轉(zhuǎn)發(fā)到護士的智能手機上。接收主機也可以通過無線路由擴大網(wǎng)絡(luò)覆蓋范圍。
2 硬件設(shè)計
2.1 呼叫終端模塊
呼叫終端分別由射頻發(fā)射模塊、電源電路、編碼電路組成。射頻發(fā)射模塊選用XY-FST射頻發(fā)射模塊。編碼電路選取SC2262,通過查閱其用戶手冊中的引腳定義[2],設(shè)計的終端模塊電路如圖2所示,R6用于調(diào)節(jié)編碼振蕩器的頻率;SC2262的第17為串行輸出發(fā)送引腳,與射頻模塊的數(shù)據(jù)引腳相接。10、11、12、13為數(shù)據(jù)編碼,可設(shè)為0或1;1---8為三態(tài)地址引腳,設(shè)置時必須與主機的解碼接收模塊SC2272相同。其中J11、J12在設(shè)計PCB時做編碼狀態(tài)設(shè)置跳線,以便于對不同模塊對應(yīng)的輸液座位進行對應(yīng)編號設(shè)置。其工作流程是:當(dāng)按鍵S4沒有按下時,模塊不通電,所以不耗電,為電池供電提供了較好的可能性。當(dāng)按鍵按下時模塊得電立即傳送已設(shè)好的編碼數(shù)據(jù)。
2.2 接收主機模塊
2.2.1 超外差接收射頻模塊
超外差接收射頻模塊由解碼模塊與XY-FST射頻接收模塊構(gòu)成。接收終端的呼叫號碼,通過SC2272解碼后,將結(jié)果輸出單片機的P10~P13口線。通過查閱SC2272的用戶手冊可知[3],接在15、16腳間的電阻值選取很關(guān)鍵,要與SC2262的對應(yīng)。同時其地址也要與2262設(shè)置相同。正確解碼后17腳會輸出由0到1的脈沖信號,將其連接到單片機的P14口線用于通知單片機讀取數(shù)據(jù)。
2.2.2 處理器模塊及WIFI模塊
處理器模塊的主要任務(wù)是通過I/O口讀取SC2272接收到的終端呼叫號,然后通過串口控制WIFI模塊,將數(shù)據(jù)上傳到WIFI網(wǎng)絡(luò),WIFI終端接收。因處理器不需要做復(fù)雜運算處理,因此選用成本較低,通用性好的AT89S51單片機來實現(xiàn)。
為了降低開發(fā)的難度,縮短開發(fā)的周期,近而降低開發(fā)成本,綜合考慮成本高低、技術(shù)支持是否良好等多方面的因素,最終選用了濟南有人物聯(lián)網(wǎng)技術(shù)有限公司的串口轉(zhuǎn)WIFI模塊USR-WIFI232。USR-WIFI232系列產(chǎn)品具有超小體積、支持無線工作在STA/AP/AP+STA/WDS(WDS即無線漫由功能)模式等特點,能夠使本文設(shè)計的尋呼系統(tǒng)便于實現(xiàn)靈活的組網(wǎng)模式,組成一個覆蓋范圍較廣的WIFI網(wǎng)絡(luò),進而提高了系統(tǒng)的通用性。模塊的接口定義及管腳說明詳見參考文獻[4]。
3 軟件設(shè)計
3.1 接收主機軟件設(shè)計
單片機上電后,首先完成串口初始化,接著進入主循環(huán),通過P14口線不斷檢測解碼模塊SC2272的第17腳是否有0到1的信號跳變,以確定是否有終端呼叫。如果有就讀取呼叫值,然后按特定的數(shù)據(jù)幀格式通過串口發(fā)送到WIFI模塊,WIFI模塊不對數(shù)據(jù)做任何處理直接傳輸?shù)秸麄€WIFI網(wǎng)絡(luò),供護士站PC主機接收和安卓智能手機接收。
3.2 護士站PC軟件設(shè)計
基于VB6.0平臺開發(fā)的顯示界面如圖3所示,包括當(dāng)前呼叫號碼顯示區(qū)域,網(wǎng)絡(luò)連接設(shè)置與狀態(tài)顯示區(qū)及語音調(diào)節(jié)區(qū)域。對于網(wǎng)絡(luò)的連接編程選用WinSock控件能通過TCP協(xié)議(數(shù)據(jù)傳輸協(xié)議)連接到接收主機的WIFI網(wǎng)絡(luò)。同步號碼語音播報是通過在VB環(huán)境中添加Win32 speech API中的對象庫來完成??筛鶕?jù)PC操作系統(tǒng)中已安裝的語音庫設(shè)為中英文男女音四種模式。
4 結(jié)論與討論
本系統(tǒng)整體調(diào)試通過,調(diào)試顯示如圖3所示。經(jīng)過多次測試,本系統(tǒng)能夠很好的實現(xiàn)對終端呼叫信號的接收、顯示、播報及轉(zhuǎn)發(fā)。接收范圍也能滿足應(yīng)用要求。本方法設(shè)計的系統(tǒng)克服了有線系統(tǒng)的缺陷,具有成本低、移動性好、多種模式無線主機接收,可靈活組網(wǎng)進行無線擴展的優(yōu)勢。
[參考文獻]
[1]于沛.基于無線傳感器網(wǎng)絡(luò)輸液監(jiān)測系統(tǒng)設(shè)計[D].碩士論文,黑龍江大學(xué),2012,1-5.
[2]拓迪電子有限公司.SC2262數(shù)據(jù)手冊.佛山市拓迪電子有限公司,2010,1-30.
[3]拓迪電子有限公司.SC2272數(shù)據(jù)手冊.佛山市拓迪電子有限公司,2010,1-28.
[4]有人科技有限公司.USR-WIFI232芯片技術(shù)手冊.濟南有人科技有限公司,2012,1-26.
篇10
【關(guān)鍵詞】智能家居 GSM模塊 單片機
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,網(wǎng)絡(luò)化智能家居系統(tǒng)可提供遙控、家電控制、照明控制、窗簾自控、防盜報警、可編程定時控制及計算機控制等多種功能和手段,使生活更加舒適、安全和便利。本文設(shè)計的基于GSM網(wǎng)絡(luò)的智能家居監(jiān)控系統(tǒng)由智能監(jiān)控模塊、數(shù)據(jù)采集系統(tǒng)和用戶手機構(gòu)成,通過GSM短信息的收發(fā)實現(xiàn)對家庭設(shè)備的遠程監(jiān)控。
1 總體設(shè)計方案
系統(tǒng)由中心控制模塊和各分散控制模塊組成。中心控制模塊實現(xiàn)控制用戶手機和各分散控制功能模塊。選用AT89S52單片機作為該監(jiān)控系統(tǒng)的核心控制元件。主控單片機模塊接收用戶手機發(fā)送的短信息,根據(jù)短消息的內(nèi)容控制各子功能模塊;同時主控單片機模塊將家居系統(tǒng)的控制信息以短信形式發(fā)送到用戶手機,由單片機構(gòu)成各控制模塊子系統(tǒng)。
1.1 系統(tǒng)硬件部分
根據(jù)任務(wù)需要,合理選擇單片機、傳感器、GSM模塊和設(shè)備來構(gòu)成系統(tǒng)。為使硬件設(shè)計盡可能合理,系統(tǒng)的電路設(shè)計遵循了以下幾個方面:
(1)選擇標(biāo)準(zhǔn)化、模塊化的典型電路,提高設(shè)計的成功率和結(jié)構(gòu)的靈活性。
(2)選用功能強、集成度高的電路或芯片。
(3)選擇通用性強、市場貨源充足的元器件。
(4)在對硬件系統(tǒng)總體結(jié)構(gòu)考慮時,考慮通用性的問題,采用模塊化的設(shè)計方式。
(5)系統(tǒng)的擴展及各功能模塊的設(shè)計應(yīng)適當(dāng)留有余地,以備將來修改、擴展之需。
(6)在電路設(shè)計時,充分考慮應(yīng)用系統(tǒng)各部分的驅(qū)動能力
最終確定采用AT89S52單片機作為處理芯片。西門子的TC35系列的TC35iGSM模塊,TC35i與GSM2/2+兼容、雙頻(GSM900/GSMl800)、RS232數(shù)據(jù)口、符合ETSI標(biāo)準(zhǔn)GSM0707和GSM0705,且易于升級為GPRS模塊。該模塊集射頻電路和基帶于一體,向用戶提供標(biāo)準(zhǔn)的AT命令接口,為數(shù)據(jù)、語音、短消息和傳真提供快速、可靠安全的傳輸,方便用戶的應(yīng)用開發(fā)與設(shè)計。
1.2 系統(tǒng)軟件部分
軟件部分由以下幾部分構(gòu)成:數(shù)據(jù)采集單元、手機短信信令識別與分析單元、GSM模塊TC35 modem接口程序部分、分析控制部分。其中數(shù)據(jù)采集部分和手機短信信令識別需要作實時處理;GSM模塊TC35 modem接口程序部分和分析控制部分則是根據(jù)采集和手機短信信令進行分時操作有利于提高系統(tǒng)效率。
2 系統(tǒng)軟件設(shè)計
軟件設(shè)計部分主要有數(shù)據(jù)采集部分、手機短信信令識別、TC35Modem接口程序部分、分析控制部分。其中數(shù)據(jù)采集部分和手機短信信令識別需要作實時處理;GSM模塊TC35Modem接口程序部分和分析控制部分則是根據(jù)采集和手機短信信令進行分時操作有利于提高系統(tǒng)效率。本智能家居監(jiān)控系統(tǒng)軟件設(shè)計的內(nèi)容主要有主控模塊程序、TC35Modem模塊通信程序、串口通信初始化程序和短消息的編碼解碼程序。軟件設(shè)計模塊如圖1所示。
2.1 單片機系統(tǒng)軟件設(shè)計
為了實現(xiàn)單片機與TC35I模塊的通信順暢,必須使二者的串口波特率一致,如果單片機F=11.0590MHZ,設(shè)置串行口波特率為9600,工作方式為方式3,Tl定時器采用工作方式2。其中串行口和定時器的工作方式和初值可以根據(jù)具體情況加以更改。
本系統(tǒng)的軟件設(shè)計是將整個短信處理模塊放入單片機的中斷服務(wù)子程序中。發(fā)送和接收串行口數(shù)據(jù)采用中斷方式進行,這樣可以大大節(jié)省CPU資源。當(dāng)接收一幀數(shù)據(jù)進入一位寄存器,送入接收SBUF中,同時將Rl置1;當(dāng)發(fā)送數(shù)據(jù)載入發(fā)送SBUF中開始向外發(fā)送,發(fā)送完畢后即將TI置1。無論Rl置1還是TI置1,均會激發(fā)串口中斷,執(zhí)行中斷服務(wù)程序。響應(yīng)中斷時,首先判斷中斷是接收程序還是發(fā)送程序,若為接收中斷則將SBUF中的數(shù)據(jù)存入接收隊列緩沖區(qū);若為發(fā)送中斷便將待發(fā)送的數(shù)據(jù)幀發(fā)送到SBUF中。
2.2 短消息PDU模式編碼解碼程序
在GSM標(biāo)準(zhǔn)中,中文編碼采用UTF-8的編碼,不是目前國內(nèi)常用的GB-2312編碼,因此需要對中文編碼進行轉(zhuǎn)換才能與采用GB-2312漢字庫相配合,方可正確顯示出短消息中漢字字型。由于UTF-8和GB-2312編碼之間不存在一一對應(yīng)的線性關(guān)系,因此需要采用查表的方式進行轉(zhuǎn)換。
2.3 短消息收發(fā)程序設(shè)計
發(fā)送短信息的主要工作是將發(fā)送的內(nèi)容進行相應(yīng)的編碼,其次就是將發(fā)送所用的SMS服務(wù)中心號碼、目標(biāo)號、有效時間和短信內(nèi)容按照PDU編碼的格式發(fā)送出去。如果是接收短信息,其工作就是將接受到的短信息內(nèi)容進行解碼,發(fā)送和接收的PDU串的結(jié)構(gòu)是不同的。接收程序流程圖如圖2所示。
3 運行結(jié)果
運行結(jié)果如圖3所示。
4 結(jié)論
本文設(shè)計了一個基于GSM網(wǎng)絡(luò)的無線傳感智能家居監(jiān)控系統(tǒng)。系統(tǒng)在運行中還有改進之處,還需進一步對程序結(jié)構(gòu)進行優(yōu)化。本設(shè)計只是智能家居控制中的一部分,目前國內(nèi)很多公司都在致力于智能家居產(chǎn)品的開發(fā),隨著相關(guān)技術(shù)的進一步發(fā)展,我國將全面普及智能家庭網(wǎng)絡(luò)系統(tǒng)和產(chǎn)品。
參考文獻
[1]黃欣榮.基于GSM短信模塊的家庭防盜報警系統(tǒng)的設(shè)計[J].中國新通信,2010(06),19-22.
[2]曾志永,凌振寶,王君.基于GSM技術(shù)的智能家居系統(tǒng)的設(shè)計[J].電子技術(shù)應(yīng)用,2005(10),33-35.
[3]齊趙毅,陳杰浩,羅穎等.基于GSM的智能家居遠程監(jiān)控系統(tǒng)[J].科技信息,2013(04),19.
[4]申利民,劉冬香.基于GSM智能家居控制系統(tǒng)的設(shè)計[J].傳感器世界,2011,17(1):32-36.
[5]王騏,何嘉斌.單片機控制GSM模塊實現(xiàn)短信收發(fā)的軟件設(shè)計[J].單片機與嵌入式系統(tǒng)的應(yīng)用,2005.
[6]馬忠梅.單片機的C語言應(yīng)用程序設(shè)計[M].北京:北京航天航空大學(xué)出版社,2007.
[7]邱文靜.基于GSM短信息的家居設(shè)施遙控監(jiān)測系統(tǒng)設(shè)計[D].南京:南京理工大學(xué)碩士學(xué)位論文,2009.
[8]蘇江福.基于GSM網(wǎng)絡(luò)的智能家居監(jiān)控系統(tǒng)設(shè)計與實現(xiàn)[D].哈爾濱工程大學(xué)碩士學(xué)位論文,2008.