計(jì)算機(jī)視覺(jué)前沿技術(shù)范文
時(shí)間:2023-12-28 17:38:16
導(dǎo)語(yǔ):如何才能寫(xiě)好一篇計(jì)算機(jī)視覺(jué)前沿技術(shù),這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
最近幾年,自動(dòng)駕駛成為當(dāng)下最為熱門(mén)的科技領(lǐng)域之一,許多企業(yè)紛紛將目光轉(zhuǎn)向該領(lǐng)域,諸如谷歌、百度、英特爾、Uber、豐田、本田、福特等科技和車(chē)企巨頭都在該領(lǐng)域有相關(guān)研究。在國(guó)內(nèi),除了高舉無(wú)人車(chē)大旗的百度,許多創(chuàng)業(yè)公司也在研究自動(dòng)駕駛技術(shù),圖森互聯(lián)即其中之一。
9月19日,國(guó)內(nèi)計(jì)算機(jī)視覺(jué)與人工智能創(chuàng)業(yè)企業(yè)圖森互聯(lián)宣布,他們研發(fā)的計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)算法在全球最權(quán)威、最具影響力的自動(dòng)駕駛算法公開(kāi)排行榜KITTI和Cityscapes評(píng)測(cè)數(shù)據(jù)集上均獲得世界第一。僅KITTI數(shù)據(jù)集中,圖森互聯(lián)獲得目標(biāo)檢測(cè)三個(gè)單項(xiàng)、目標(biāo)追蹤兩個(gè)單項(xiàng)、道路分割四個(gè)單項(xiàng),共計(jì)九個(gè)單項(xiàng)的全部世界第一。
那么,在當(dāng)前,自動(dòng)駕駛技術(shù)究竟有哪些等級(jí)?市面上的自動(dòng)駕駛技術(shù)都有哪些陣營(yíng)?產(chǎn)品落地情況又如何?基于這些問(wèn)題,《汽車(chē)觀察》記者對(duì)有著十年并行和分布式運(yùn)算研究經(jīng)歷、曾是淡馬錫國(guó)家實(shí)驗(yàn)室研究員、現(xiàn)為圖森互聯(lián)聯(lián)合創(chuàng)始人的南洋理工大學(xué)博士郝佳男進(jìn)行了獨(dú)家采訪。以下為部分采訪實(shí)錄:
《汽車(chē)觀察》:圖森做自動(dòng)駕駛技術(shù)項(xiàng)目的初衷是什么,單純就是看到了這塊的市場(chǎng)需求與前景嗎?
郝佳男:首先,圖森是做圖像識(shí)別SaaS起家,在技術(shù)上有一定的積累,自動(dòng)駕駛所用到的計(jì)算機(jī)視覺(jué)感知技術(shù)和圖像識(shí)別SaaS在很多方面是同源的;另外,對(duì)于自動(dòng)駕駛,特別是主要基于視覺(jué)傳感器的自動(dòng)駕駛,有很高的技術(shù)壁壘,圖森能夠很好地發(fā)揮自己的長(zhǎng)處;第三,運(yùn)營(yíng)車(chē)輛對(duì)自動(dòng)駕駛和無(wú)人駕駛存在較大的需求,因?yàn)樽詣?dòng)駕駛和無(wú)人駕駛可以極大地減少這些運(yùn)營(yíng)車(chē)輛企業(yè)的人力成本和潛在的安全風(fēng)險(xiǎn),而且無(wú)人車(chē)可以持續(xù)運(yùn)營(yíng),這對(duì)企業(yè)來(lái)說(shuō)是生產(chǎn)效率的飛躍。
《汽車(chē)觀察》:目前,在國(guó)際上自動(dòng)駕駛技術(shù)分為幾個(gè)等級(jí)?圖森的自動(dòng)駕駛技術(shù)又是幾級(jí)的技術(shù)?在國(guó)內(nèi)外算是一個(gè)什么水平?
郝佳男:目前自動(dòng)駕駛有L1-L5五個(gè)等級(jí),L5是人們最期待的完全無(wú)人駕駛水平,眾人熟知的谷歌無(wú)人駕駛在目前只能算是L4級(jí)水平。圖森的主要目標(biāo)是通過(guò)低成本傳感器實(shí)現(xiàn)可靠的L3級(jí)別無(wú)人駕駛。
目前行業(yè)內(nèi)的標(biāo)桿是以色列的Mobileye。但目前Mobileye量產(chǎn)的芯片依然使用傳統(tǒng)非深度學(xué)習(xí)算法,因此在一些特定場(chǎng)景中(如車(chē)側(cè)面、非常見(jiàn)車(chē)型等)會(huì)出現(xiàn)錯(cuò)誤。最近Tesla發(fā)生的車(chē)毀人亡事故就一個(gè)例子。圖森的技術(shù)方案基于深度學(xué)習(xí)構(gòu)建,能夠?qū)崿F(xiàn)更可靠的性能。
《汽車(chē)觀察》:目前的自動(dòng)駕駛技術(shù)有哪幾類(lèi)?它們的本質(zhì)區(qū)別在哪里?分別有哪些優(yōu)勢(shì)?
郝佳男:目前,市面上共有兩種解決方案:一種是計(jì)算機(jī)視覺(jué)為主、毫米波雷達(dá)為輔的低價(jià)解決方案;另一種是激光雷達(dá)為主、以攝像頭為輔的高價(jià)解決方案。
以谷歌和百度為代表的是以激光雷達(dá)為主、攝像頭為輔的高價(jià)解決方案,成本在50萬(wàn)以上。比如Google的無(wú)人駕駛車(chē)輛,在這個(gè)技術(shù)路線中,車(chē)輛完全由人工智能來(lái)駕駛,可以將車(chē)輛的方向盤(pán)、油門(mén)和剎車(chē)去掉,同時(shí),為了增加技術(shù)的可靠性,Google無(wú)人駕駛汽車(chē)以激光雷達(dá)為核心,一個(gè)64線的激光雷達(dá)成本在7萬(wàn)美元左右,整體解決方案較貴。另外,激光雷達(dá)的硬件可靠性一般,也很難達(dá)到車(chē)規(guī)需求。但是這兩家上市企業(yè)出于市值管理的考慮,在這方面不計(jì)成本。對(duì)他們來(lái)說(shuō),新技術(shù)所能達(dá)到的程度帶來(lái)的新聞和公關(guān)效力,會(huì)大幅地抬高股價(jià)。但這種成本過(guò)高的技術(shù),在商業(yè)化應(yīng)用時(shí)會(huì)比較困難。
而選擇低價(jià)解決方案更容易被車(chē)廠、受眾所接受。以特斯拉、奔馳、沃爾沃等車(chē)廠為代表的漸進(jìn)型自動(dòng)駕駛,即先從輔助駕駛開(kāi)始做起,在特定場(chǎng)景、或是特定的封閉結(jié)構(gòu)化路段適用,做出緊急剎車(chē)、自適應(yīng)巡航、車(chē)道保持、自動(dòng)泊車(chē)等動(dòng)作,后續(xù)涉入高度自動(dòng)駕駛,即除了結(jié)構(gòu)化路段外,還能在非結(jié)構(gòu)化道路上自動(dòng)駕駛。
圖森就屬于低價(jià)解決方案,即選擇低成本的硬件(毫米波雷達(dá)、視覺(jué)傳感器、高性能SoC),配合計(jì)算機(jī)視覺(jué)算法來(lái)降低總成本。傳感器承擔(dān)的精度要求降下來(lái),那么對(duì)算法的要求就比較高了。
《汽車(chē)觀察》:目前的自動(dòng)駕駛技術(shù)是如何實(shí)現(xiàn)自動(dòng)駕駛的?能實(shí)現(xiàn)到怎樣程度的自動(dòng)駕駛?
郝佳男:自動(dòng)駕駛系統(tǒng)使用了多種傳感器來(lái)感知,其中可視為廣義“視覺(jué)”的有超聲波雷達(dá)、毫米波雷達(dá)、激光雷達(dá)(LiDAR)和攝像頭等。毫米波雷達(dá)和激光雷達(dá)承擔(dān)了主要的中長(zhǎng)距測(cè)距和環(huán)境感知,而攝像頭主要用于交通信號(hào)燈、車(chē)輛、行人等物體的識(shí)別。
攝像頭拍到的視頻其實(shí)也是由一幀幀圖像形成。拍下來(lái)是一回事,通過(guò)計(jì)算得出圖像里的行人、車(chē)輛、信號(hào)燈等結(jié)構(gòu)化數(shù)據(jù)則是另一回事。在過(guò)去,這被視為不可想象的任務(wù)。但深度學(xué)習(xí)的發(fā)展讓基于視覺(jué)的感知技術(shù)獲得了大幅度提升,基于視覺(jué)的環(huán)境感知變得可行了。
《汽車(chē)觀察》:目前,市面上的自動(dòng)駕駛技術(shù)在產(chǎn)品化的情況如何?有沒(méi)有落地的產(chǎn)品正在運(yùn)營(yíng)?
郝佳男:對(duì)于整個(gè)自動(dòng)駕駛行業(yè)來(lái)說(shuō),產(chǎn)品化需要漫長(zhǎng)的時(shí)間,可能需要2-3年的時(shí)間。圖森主要還是為主機(jī)廠和Tier1(一級(jí)零部件供應(yīng)商)提供以攝像頭為主、配合毫米波雷達(dá)和視覺(jué)芯片的、低成本的自動(dòng)駕駛解決方案。
《汽車(chē)觀察》:自長(zhǎng)安的無(wú)人駕駛路試后,國(guó)家開(kāi)始出臺(tái)相關(guān)禁止自動(dòng)駕駛路試的政策,這樣一來(lái),整個(gè)研發(fā)自動(dòng)駕駛技術(shù)的企業(yè)又該如何測(cè)試自己的技術(shù)?如何看待國(guó)家有關(guān)自動(dòng)駕駛這方面的政策?
篇2
(1.清華大學(xué)電子工程系,北京100084;2.英特爾(中國(guó))有限公司,北京100()13)
摘要:媒體與認(rèn)知實(shí)驗(yàn)課程是清華大學(xué)電子工程系在課程改革中提出的一門(mén)全新的核心必修課程。文章首先闡述該課程的特點(diǎn),然后介紹基于英特爾RealSense設(shè)備及微軟Kinect設(shè)備開(kāi)發(fā)的一套探索前沿型實(shí)驗(yàn)教學(xué)平臺(tái),分別說(shuō)明基于手勢(shì)識(shí)別的博弈游戲?qū)嶒?yàn)項(xiàng)目和基于姿勢(shì)識(shí)別的組合拍照實(shí)驗(yàn)項(xiàng)目,指出通過(guò)這些前沿的基于交叉學(xué)科的智能感知技術(shù)和內(nèi)容,學(xué)生可以掌握成為本領(lǐng)域高層次專(zhuān)業(yè)人才必需的各項(xiàng)基本技能和專(zhuān)業(yè)知識(shí)。
關(guān)鍵詞 :RealSense;媒體認(rèn)知;智能感知;機(jī)器學(xué)習(xí);人機(jī)交互
文章編號(hào):1672-5913(2015)15-0108-03 中圖分類(lèi)號(hào):G642
基金項(xiàng)目:英特爾一清華媒體與認(rèn)知實(shí)驗(yàn)教學(xué)項(xiàng)目( 202023011)。
第一作者簡(jiǎn)介:楊毅,女,高級(jí)工程師,研究方向?yàn)閿?shù)字信號(hào)處理,yangyy@mail.tsinghua.edu.cn。
1 背景
媒體與認(rèn)知實(shí)驗(yàn)課程借鑒包括美國(guó)MIT大學(xué)、CMU大學(xué)、Stanford大學(xué)、英國(guó)倫敦大學(xué)學(xué)院等在內(nèi)的國(guó)外著名大學(xué)跨媒體信息處理、入機(jī)交互與感知技術(shù)、虛擬現(xiàn)實(shí)及信號(hào)處理領(lǐng)域?qū)嶒?yàn)教學(xué)課程的特點(diǎn),并結(jié)合清華大學(xué)電子工程系在該領(lǐng)域研究的基礎(chǔ)、優(yōu)勢(shì)和創(chuàng)新性成果,有針對(duì)性地將已有科研成果轉(zhuǎn)化為教學(xué)實(shí)驗(yàn)課中的教學(xué)內(nèi)容,通過(guò)建設(shè)一套完整、全面的涵蓋人機(jī)感知交互、媒體信息處理、虛擬現(xiàn)實(shí)及信號(hào)處理領(lǐng)域的探索前沿型實(shí)驗(yàn)教學(xué)平臺(tái),培養(yǎng)學(xué)生的智能感知技術(shù)開(kāi)發(fā)能力;同時(shí),采用集體創(chuàng)新培養(yǎng)和個(gè)人研究探索相結(jié)合的方式,最終達(dá)到理工與人文、技術(shù)與藝術(shù)、感知與思考的高度融合,成為具有國(guó)際一流水平的、兼具科研創(chuàng)新能力和探索精神的領(lǐng)軍型人才。
實(shí)驗(yàn)教學(xué)課程內(nèi)容及平臺(tái)涉及的主要研究?jī)?nèi)容包括媒體數(shù)據(jù)獲取與人機(jī)交互、生物特征識(shí)別、語(yǔ)音識(shí)別及情感理解、虛擬交互行為分析等。該實(shí)驗(yàn)課程力圖建設(shè)成為達(dá)到國(guó)際水平的智能感知技術(shù)實(shí)驗(yàn)教學(xué)課程及項(xiàng)目平臺(tái)。通過(guò)該實(shí)驗(yàn)課程的建立,學(xué)生能夠了解國(guó)際科學(xué)界及工業(yè)界最前沿的媒體認(rèn)知及智能感知技術(shù)熱點(diǎn)和難點(diǎn)問(wèn)題,利用平臺(tái)的基礎(chǔ)設(shè)施和設(shè)備構(gòu)建并實(shí)施多種解決方案??缧袠I(yè)、跨領(lǐng)域、跨學(xué)科的媒體認(rèn)知及智能感知類(lèi)前沿綜合實(shí)驗(yàn)課程,通過(guò)借助智能感知及人機(jī)交互知識(shí)作為工具和手段解決媒體信息處理、虛擬現(xiàn)實(shí)及人機(jī)交互的問(wèn)題,充分挖掘和激發(fā)理工科背景知識(shí)較佳的電子工程系學(xué)生在交叉學(xué)科和前沿技術(shù)方面的實(shí)力和潛力。
2 媒體與認(rèn)知實(shí)驗(yàn)課程特點(diǎn)
媒體與認(rèn)知實(shí)驗(yàn)設(shè)計(jì)開(kāi)發(fā)了一套以實(shí)時(shí)智能感知技術(shù)為基礎(chǔ)的探索前沿型實(shí)驗(yàn)教學(xué)平臺(tái),該平臺(tái)在設(shè)備和設(shè)計(jì)內(nèi)容方面均與國(guó)際水平接軌,具有教學(xué)互促、知識(shí)延伸、技能拓展的特點(diǎn)。項(xiàng)目平臺(tái)涵蓋跨媒體信息處理、人機(jī)交互與感知技術(shù)、虛擬現(xiàn)實(shí)等領(lǐng)域的設(shè)備和技術(shù),力圖成為與國(guó)際接軌的探索前沿型實(shí)時(shí)智能感知實(shí)驗(yàn)教學(xué)平臺(tái)。
該課程涉及的技術(shù)和研究方向均為國(guó)內(nèi)外智能感知技術(shù)領(lǐng)域各大高校和科研院所的研究熱點(diǎn)及難點(diǎn),將這些研究?jī)?nèi)容引入實(shí)驗(yàn)教學(xué),可以引導(dǎo)本科學(xué)生開(kāi)闊科研視野、堅(jiān)定科研信念和明確科研方向。通過(guò)構(gòu)建與國(guó)際最新研發(fā)技術(shù)水平相當(dāng)?shù)膶?shí)驗(yàn)平臺(tái),學(xué)生能夠了解國(guó)際領(lǐng)先的媒體認(rèn)知及信號(hào)處理知識(shí)和技能,利用該平臺(tái)的基礎(chǔ)設(shè)備構(gòu)建并實(shí)施多種解決方案;教學(xué)最終達(dá)到培養(yǎng)掌握國(guó)際領(lǐng)先技術(shù)、具有突出創(chuàng)新實(shí)踐能力和持續(xù)探索精神的高素質(zhì)人才的目的。
該平臺(tái)內(nèi)容主要面向各年級(jí)本科生及碩士研究生,與基礎(chǔ)核心課、專(zhuān)業(yè)限選課等課程配套,逐步形成層次清晰、逐級(jí)擴(kuò)展的具有創(chuàng)新探索前沿性質(zhì)的智能感知技術(shù)教學(xué)實(shí)驗(yàn)課程體系。
3 基于手勢(shì)識(shí)別的媒體認(rèn)知實(shí)驗(yàn)項(xiàng)目
人機(jī)交互的雙向信息流動(dòng)是以媒體感知和處理為核心的。人將用戶(hù)感覺(jué)和效應(yīng)通道傳遞的交互意圖在計(jì)算機(jī)內(nèi)表示為文本、語(yǔ)音、圖形、圖像等多媒體信息。人到機(jī)( human to computer)信息流動(dòng)是多媒體信息的獲取及識(shí)別過(guò)程,計(jì)算機(jī)處理的信息需要以文本、語(yǔ)音、圖形、圖像等用戶(hù)理解概念所需的多媒體信息形式展現(xiàn)出來(lái);機(jī)到人( computer to human)的信息流動(dòng)是多媒體信息的合成和呈現(xiàn)過(guò)程,機(jī)器利用感知及推理對(duì)來(lái)自用戶(hù)感覺(jué)和效應(yīng)通道的跨媒體信息進(jìn)行識(shí)別、集成和協(xié)調(diào),獲取用戶(hù)動(dòng)作和行為習(xí)慣、偏好及其他相關(guān)信息,以人類(lèi)易理解的多媒體信息方式為用戶(hù)提供輸出信息,從而提供不受時(shí)空限制而效能最大化的個(gè)性化計(jì)算服務(wù)。
美國(guó)Stanford大學(xué)電子工程系提出一種基于Kinect的手勢(shì)識(shí)別方法,通過(guò)Kinect獲取RGB圖像信息和深度數(shù)據(jù),采用SURF變換算法實(shí)現(xiàn)高準(zhǔn)確度的手勢(shì)識(shí)別。西班牙馬德里卡洛斯大學(xué)機(jī)器人實(shí)驗(yàn)室( Robotics Lab,Univ. Carlos IIIof Madrid Leganes,Spain)針對(duì)傳統(tǒng)的手勢(shì)識(shí)別系統(tǒng)受光照條件影響導(dǎo)致計(jì)算量大、訓(xùn)練過(guò)程長(zhǎng)等問(wèn)題,根據(jù)RGB-D攝像頭獲取的深度數(shù)據(jù)建立人手的骨骼模型,從三維骨骼模型中提取手勢(shì)的時(shí)域信號(hào),采用有限狀態(tài)機(jī)對(duì)手勢(shì)不同狀態(tài)下的方向進(jìn)行編碼,采用基于模板的分類(lèi)器識(shí)別出手勢(shì)。瑞士蘇黎世聯(lián)邦理工大學(xué)計(jì)算機(jī)視覺(jué)實(shí)驗(yàn)室( Computer Vision Lab,ETH Zurich,Zurich,Switzerland)提出一種基于Haarlet的手勢(shì)識(shí)別系統(tǒng),根據(jù)微軟Kinect設(shè)備獲取的深度信息檢測(cè)手勢(shì)的三維指向,將手勢(shì)轉(zhuǎn)換為交互命令,提高了人與機(jī)器人交互的自然性。
石頭、剪子、布、蜥蜴、史波克( Rock-Paper-scissors-Lizard-Spock)是一種由石頭、剪子、布延伸出來(lái)的博弈論猜拳游戲,在石頭、剪子、布基礎(chǔ)上增加了兩種手勢(shì),減少了原來(lái)石頭、剪子、布游戲和局的幾率。該游戲的手勢(shì)及輸贏說(shuō)明如圖1所示(圖來(lái)自百度圖片搜索)。
英特爾的RealSense設(shè)備是一種能通過(guò)采集視覺(jué)、深度,音頻等多種媒體信息獲得手勢(shì)、語(yǔ)音等表征意圖的智能感知設(shè)備,可以廣泛應(yīng)用于自然互動(dòng)、沉浸式協(xié)作與創(chuàng)作等創(chuàng)新應(yīng)用,能夠幫助開(kāi)發(fā)人員在游戲、娛樂(lè)和內(nèi)容創(chuàng)建交互方面實(shí)現(xiàn)新的突破。該實(shí)驗(yàn)項(xiàng)目通過(guò)利用全新的英特爾三維智能感知設(shè)備RealSense,可以實(shí)現(xiàn)上述手勢(shì)識(shí)別的智能感知功能。該實(shí)驗(yàn)設(shè)置多種難度,將簡(jiǎn)單難度設(shè)置為電腦隨機(jī)出拳;針對(duì)高等難度則需要學(xué)習(xí)用戶(hù)的出拳模式并構(gòu)建一個(gè)馬爾科夫模型,電腦針對(duì)用戶(hù)的出拳模式進(jìn)行相應(yīng)出拳?;赗ealSense識(shí)別的5種手勢(shì)如圖2所示,可以看出ReaISense設(shè)備對(duì)不同手勢(shì)的區(qū)分度較高。
4 基于姿勢(shì)識(shí)別的媒體認(rèn)知實(shí)驗(yàn)項(xiàng)目
人體的三維模型包含足夠的信息以描述人體的運(yùn)動(dòng)特征,對(duì)于體感交互設(shè)計(jì)而言,姿態(tài)識(shí)別、動(dòng)作識(shí)別、手勢(shì)識(shí)別非常重要。微軟推出的Kinect設(shè)備與計(jì)算機(jī)軟件開(kāi)發(fā)包一起使用,為企業(yè)和開(kāi)發(fā)者提供創(chuàng)建交互式應(yīng)用程序的基礎(chǔ),允許開(kāi)發(fā)者借助微軟或語(yǔ)言開(kāi)發(fā)相關(guān)應(yīng)用,提供骨豁跟蹤、人臉跟蹤、語(yǔ)音識(shí)別技術(shù)等底層功能?;贙inect設(shè)備開(kāi)發(fā)的平臺(tái)和應(yīng)用獲得了不錯(cuò)的效果。藝術(shù)家通過(guò)人體組合姿勢(shì)構(gòu)成英文里的各種字母形象,如圖3所示。
該實(shí)驗(yàn)項(xiàng)目通過(guò)利用Kinect實(shí)現(xiàn)人體字母造型識(shí)別,在造型匹配某個(gè)特定字母或組合時(shí)觸發(fā)拍照,解決在實(shí)際拍照過(guò)程中為了擺出某一特定造型需要多次重復(fù)大量拍攝的問(wèn)題。基本思路是利用Kinect的人體識(shí)別功能,在攝像頭獲得的圖像中提取出人置信息,然后將人置信息在本地程序中與預(yù)設(shè)的目標(biāo)造型進(jìn)行匹配,只有當(dāng)匹配程度到達(dá)一定值的時(shí)候,程序才觸發(fā)拍攝事件并將圖像保存。系統(tǒng)由5個(gè)模塊組成:初始化、人體識(shí)別、計(jì)算匹配度、圖形顯示和拍照觸發(fā)。其中,初始化模塊屬于主窗口類(lèi),內(nèi)部由時(shí)間進(jìn)行關(guān)聯(lián),其他模塊各為一類(lèi),分別通過(guò)調(diào)用函數(shù)和嵌入窗體的方式使用,其算法框架如圖4所示。系統(tǒng)運(yùn)行過(guò)程中,計(jì)算出的匹配數(shù)值會(huì)直接顯示在屏幕上,同時(shí)彈出提示字幕,向用戶(hù)反饋其姿勢(shì)準(zhǔn)確程度。
篇3
所謂智能制造,是將物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等新一代信息技術(shù)與先進(jìn)自動(dòng)化技術(shù)、傳感技術(shù)、控制技術(shù)、數(shù)字制造技術(shù)結(jié)合,實(shí)現(xiàn)工廠和企業(yè)內(nèi)部、企業(yè)之間和產(chǎn)品全生命周期的實(shí)時(shí)管理和優(yōu)化的新型制造系統(tǒng)。
智能產(chǎn)品具有監(jiān)測(cè)、控制、優(yōu)化和自主等四個(gè)方面的功能。而智能生產(chǎn)是指以智能制造系統(tǒng)為核心,以智能工廠為載體,通過(guò)在工廠和企業(yè)內(nèi)部、企業(yè)之間以及產(chǎn)品全生命周期形成以數(shù)據(jù)互聯(lián)互通為特征的制造網(wǎng)絡(luò),實(shí)現(xiàn)生產(chǎn)過(guò)程的實(shí)時(shí)管理和優(yōu)化。
此次世界智能制造大會(huì)抓住智能制造這一世界經(jīng)濟(jì)熱點(diǎn),洞察當(dāng)下全球前沿技術(shù)的競(jìng)爭(zhēng)點(diǎn),融政產(chǎn)學(xué)研為一爐予以共同關(guān)注。世界制造業(yè)正在經(jīng)歷一場(chǎng)變革、一場(chǎng)進(jìn)化,生產(chǎn)將變得更加聰明,效率也就更高。此次大賓朋滿(mǎn)座,說(shuō)明企業(yè)對(duì)智能制造充滿(mǎn)渴望,產(chǎn)業(yè)發(fā)展充滿(mǎn)動(dòng)力。這場(chǎng)大會(huì)是科技思維的饕餮盛宴,必將碰撞出大機(jī)遇。
智能制造是中國(guó)制造業(yè)由大轉(zhuǎn)強(qiáng)的核心戰(zhàn)略選擇,更是中國(guó)經(jīng)濟(jì)增長(zhǎng)變速換擋走向新里程的標(biāo)志。歷經(jīng)30多年的高速發(fā)展,中國(guó)在2015年已成為世界制造業(yè)第一大國(guó),建成了世界上門(mén)類(lèi)最為齊全的現(xiàn)代制造業(yè)體系,中國(guó)制造業(yè)一直是國(guó)家經(jīng)濟(jì)發(fā)展的重心,一度使中國(guó)成為世界工廠的代名詞,創(chuàng)造過(guò)無(wú)數(shù)讓國(guó)人引為榮耀的輝煌。然而,中國(guó)制造在發(fā)展質(zhì)量、創(chuàng)新能力、品牌塑造方面,與發(fā)達(dá)國(guó)家相比仍有較大差距,大而不強(qiáng)的問(wèn)題一直是急需破解的瓶頸,依托資源消耗和人力成本低廉的路徑選擇越來(lái)越艱難,低端的傳統(tǒng)優(yōu)勢(shì)日趨衰弱,向著東南亞的新一輪國(guó)際產(chǎn)業(yè)轉(zhuǎn)移凸顯中國(guó)制造大而不強(qiáng)的尷尬。中國(guó)制造亟待在科技創(chuàng)新、智能制造的引領(lǐng)中強(qiáng)筋壯骨,在著力提升生產(chǎn)率的轉(zhuǎn)型中浴火重生,以獲得經(jīng)濟(jì)中高速增長(zhǎng)。
如果說(shuō)過(guò)去3年中國(guó)制造在轉(zhuǎn)型中“熱身”,試圖打開(kāi)一扇窗戶(hù)向外瞧,那么這場(chǎng)大會(huì)就是一個(gè)全新的里程碑――以最先進(jìn)的智能制造思想武裝自己,開(kāi)辟新的航程。
智能制造給世界帶來(lái)新活力,給中國(guó)帶來(lái)新發(fā)展。瓦特的蒸汽機(jī),在轟鳴聲中不但改變了他自己貧病交加的命運(yùn),也把整個(gè)人類(lèi)帶進(jìn)了工業(yè)社會(huì),解放了生產(chǎn)力,促進(jìn)了社會(huì)進(jìn)步。喬布斯的“蘋(píng)果”,一機(jī)在手,包攬世界,億萬(wàn)網(wǎng)民在刷屏中進(jìn)入移動(dòng)互聯(lián)時(shí)代,也助燃了信息化火焰燃遍全球。中國(guó)也在歡呼聲中見(jiàn)證“神九上天,蛟龍入?!钡纳衿?,驚嘆中國(guó)制造尖端技術(shù)的鬼斧神功,制造業(yè)的數(shù)字化、網(wǎng)絡(luò)化、智能化為中國(guó)經(jīng)濟(jì)發(fā)展安裝了強(qiáng)勁的翅膀。
智能制造為世界經(jīng)濟(jì)提供新動(dòng)能,提高生產(chǎn)率。世界經(jīng)濟(jì)不景氣,增長(zhǎng)下向風(fēng)險(xiǎn)的警報(bào)一直未能解除,亟需轉(zhuǎn)變發(fā)展方式,期待新動(dòng)能除舊布新、改天換地。唯有人工智能等科技生產(chǎn)擔(dān)當(dāng)此重任,大幅提高生產(chǎn)率,促進(jìn)經(jīng)濟(jì)的發(fā)展。依托自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)等這些人工智能核心領(lǐng)域技術(shù)的發(fā)展,以生態(tài)科技、智能機(jī)器人、無(wú)人車(chē)、無(wú)人機(jī)等為代表的人工智能技術(shù)已漸趨成熟。由此撬動(dòng)的相關(guān)產(chǎn)業(yè)鏈也將迎來(lái)巨大市場(chǎng)機(jī)會(huì),可估商業(yè)利益至少在萬(wàn)億量級(jí)。
智能制造將掀起新一輪企業(yè)淘汰浪潮。在歐美和日本有成百上千家百年企業(yè),但中國(guó)很多企業(yè)卻做著做著就夭折了,這與企業(yè)家的胸懷和眼光有密切關(guān)系。企業(yè)家要站得高,看得遠(yuǎn),轉(zhuǎn)型中高端才能有長(zhǎng)久的生命力。這一輪智能制造大潮,讓傳統(tǒng)企業(yè)倍感壓力,跟上了,企業(yè)就往上走;跟不上,就要趴下去。
篇4
關(guān)鍵詞:數(shù)字媒體技術(shù);課程體系;實(shí)踐教學(xué)
0.引言
2003年,浙江大學(xué)在國(guó)內(nèi)首次開(kāi)設(shè)數(shù)字媒體技術(shù)專(zhuān)業(yè)后,國(guó)內(nèi)各大高校根據(jù)自身的情況紛紛開(kāi)設(shè)了該專(zhuān)業(yè),其中有些是從計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè)或軟件工程專(zhuān)業(yè)設(shè)置數(shù)字媒體技術(shù)專(zhuān)業(yè)(如浙江大學(xué)、江南大學(xué)),有些是從藝術(shù)專(zhuān)業(yè)中分離出該專(zhuān)業(yè)(如中國(guó)傳媒大學(xué)),而有些則依托自身在通信領(lǐng)域的優(yōu)勢(shì)開(kāi)辦該專(zhuān)業(yè)(如北京郵電大學(xué))。這些高校在專(zhuān)業(yè)人才培養(yǎng)目標(biāo)中均強(qiáng)調(diào)“技術(shù)與藝術(shù)的結(jié)合”“培養(yǎng)復(fù)合型人才”,但他們的側(cè)重點(diǎn)不完全一致,工科院校強(qiáng)調(diào)“以技術(shù)為主藝術(shù)為輔”,而藝術(shù)類(lèi)院校則強(qiáng)調(diào)“以藝術(shù)為主技術(shù)為輔”,這就造成了目前該專(zhuān)業(yè)在人才培養(yǎng)目標(biāo)上的不明確。2012年,教育部頒布了《普通高等學(xué)校本科專(zhuān)業(yè)目錄和專(zhuān)業(yè)介紹》,原數(shù)字媒體技術(shù)專(zhuān)業(yè)和影視藝術(shù)技術(shù)專(zhuān)業(yè)從電氣信息類(lèi)下分離出來(lái)成為新目錄中計(jì)算機(jī)類(lèi)下的數(shù)字媒體技術(shù)專(zhuān)業(yè),并規(guī)定該專(zhuān)業(yè)的培養(yǎng)目標(biāo)是“培養(yǎng)德、智、體等全面發(fā)展,掌握數(shù)學(xué)與自然科學(xué)基礎(chǔ)知識(shí)以及與數(shù)字媒體相關(guān)的計(jì)算機(jī)科學(xué)與技術(shù)、信息與通信工程等學(xué)科的基本理論、基本知識(shí)、基本技能和基本方法,具備良好的技術(shù)素質(zhì)和一定的藝術(shù)修養(yǎng),能在互動(dòng)媒體、媒體網(wǎng)絡(luò)、新媒體工程等領(lǐng)域從事系統(tǒng)設(shè)計(jì)、開(kāi)發(fā)與應(yīng)用工作的高級(jí)復(fù)合型人才?!毙履夸涍M(jìn)一步規(guī)范了數(shù)字媒體技術(shù)專(zhuān)業(yè)的性質(zhì)、人才培養(yǎng)的基本要求以及培養(yǎng)的學(xué)生應(yīng)該掌握哪些知識(shí),應(yīng)該具備什么樣能力,并要求在加強(qiáng)學(xué)生基本理論與方法的同時(shí)強(qiáng)調(diào)注重基本技能的培養(yǎng)。為此,在專(zhuān)業(yè)建設(shè)與教學(xué)過(guò)程中,必須增加實(shí)踐性強(qiáng)的課程,提高教學(xué)過(guò)程的實(shí)踐性,合理地開(kāi)展實(shí)踐、實(shí)訓(xùn)活動(dòng),給學(xué)生提供較多的參與實(shí)踐和鍛煉的機(jī)會(huì)。
1.數(shù)字媒體技術(shù)專(zhuān)業(yè)課程與實(shí)踐教學(xué)模式
數(shù)字媒體專(zhuān)業(yè)是實(shí)踐性很強(qiáng)的專(zhuān)業(yè),在教學(xué)過(guò)程中既要制訂一套科學(xué)的課程體系,也要合理地安排實(shí)踐與實(shí)訓(xùn)活動(dòng),這些對(duì)學(xué)校的軟硬件條件提出了較高的要求。那么如何利用有限的資源條件,讓學(xué)生在掌握較扎實(shí)的專(zhuān)業(yè)理論知識(shí)的同時(shí)為學(xué)生創(chuàng)造更多的實(shí)踐、實(shí)訓(xùn)機(jī)會(huì),是我們需要深入思考和研究的問(wèn)題。結(jié)合江南大學(xué)數(shù)字媒體技術(shù)專(zhuān)業(yè)近幾年的辦學(xué)歷程,筆者以為,要全面提高專(zhuān)業(yè)課程教學(xué)和實(shí)踐教學(xué)水平,可從以下幾方面入手。
1.1創(chuàng)新科學(xué)的人才培養(yǎng)方案和課程體系
科學(xué)的人才培養(yǎng)方案是培養(yǎng)合格高校畢業(yè)生的根本保障。人才培養(yǎng)方案的制訂要結(jié)合高等學(xué)校的教育特點(diǎn)和自身?xiàng)l件,從市場(chǎng)和企業(yè)需求出發(fā),面向社會(huì)以適應(yīng)市場(chǎng)的發(fā)展規(guī)律。課程的設(shè)置要做到按需設(shè)置,在保證相對(duì)固定的情況下能適度調(diào)整,這樣才能培養(yǎng)出大批既掌握基本技能又能滿(mǎn)足社會(huì)需要的創(chuàng)新型應(yīng)用人才。
實(shí)現(xiàn)專(zhuān)業(yè)的培養(yǎng)目標(biāo),不是僅靠一門(mén)或幾門(mén)課程所能奏效的,而要靠全部專(zhuān)業(yè)課程來(lái)協(xié)調(diào)和補(bǔ)充。課程體系是否合理,直接關(guān)系到創(chuàng)新人才培養(yǎng)的成敗。根據(jù)江南大學(xué)目前的專(zhuān)業(yè)優(yōu)勢(shì),在課程體系的設(shè)置中借鑒國(guó)內(nèi)外的成功經(jīng)驗(yàn),在加強(qiáng)學(xué)科交叉與滲透的同時(shí)強(qiáng)調(diào)以計(jì)算機(jī)技術(shù)為主、藝術(shù)為輔的教學(xué)模式,以體現(xiàn)“藝工結(jié)合”的辦學(xué)特色。
為達(dá)到專(zhuān)業(yè)人才培養(yǎng)的目標(biāo),在課程設(shè)置中我們將課程分為通識(shí)教育課程、學(xué)科平臺(tái)課程、專(zhuān)業(yè)核心課程、專(zhuān)業(yè)選修課程、集中實(shí)踐性環(huán)節(jié)以及素質(zhì)教育等6大類(lèi)。其中,通識(shí)教育課程主要包括思想政治理論類(lèi)課程、外語(yǔ)與自然科學(xué)基礎(chǔ)課程;學(xué)科平臺(tái)和專(zhuān)業(yè)核心課程主要是一些能體現(xiàn)專(zhuān)業(yè)特色的基礎(chǔ)必修課程和專(zhuān)業(yè)課程,包括一些藝術(shù)類(lèi)課程,實(shí)現(xiàn)學(xué)科交叉與滲透;專(zhuān)業(yè)選修課程主要是一些專(zhuān)業(yè)拓展性課程,以激發(fā)學(xué)生學(xué)習(xí)的積極性、主動(dòng)性和創(chuàng)造性,為學(xué)生個(gè)性化發(fā)展打下基礎(chǔ);集中實(shí)踐性環(huán)節(jié)安排在短學(xué)期(每學(xué)年的第二學(xué)期)進(jìn)行,主要是針對(duì)已學(xué)過(guò)的課程而開(kāi)設(shè)的綜合應(yīng)用與設(shè)計(jì)類(lèi)課程,目的是加強(qiáng)學(xué)生的實(shí)踐動(dòng)手能力,培養(yǎng)學(xué)生具有一定的自主創(chuàng)新應(yīng)用能力,以充分展示學(xué)生的個(gè)性化。
在課程的建設(shè)與執(zhí)行方面,除通識(shí)教育課程外,對(duì)其他課程根據(jù)設(shè)置、知識(shí)點(diǎn)、課程內(nèi)容之間的關(guān)聯(lián)性等采用課程鏈和課程群的方式進(jìn)行,主要分為以下5大課程群:
(1)藝術(shù)類(lèi)課程:素描、色彩與綜合構(gòu)成、藝術(shù)設(shè)計(jì)概論、平面設(shè)計(jì)、場(chǎng)景設(shè)計(jì)與表現(xiàn)、數(shù)字?jǐn)z影與攝像及視頻特技與非線性編輯。
(2)程序與算法類(lèi):離散數(shù)學(xué)、程序設(shè)計(jì)I(c)、程序設(shè)計(jì)II、數(shù)據(jù)結(jié)構(gòu)與算法分析、面向?qū)ο蠹夹g(shù)與語(yǔ)言C++、Java與對(duì)象分布技術(shù)、腳本編程技術(shù)、計(jì)算理論及云計(jì)算技術(shù)等。
(3)系統(tǒng)與硬件類(lèi):數(shù)字媒體技術(shù)概論、數(shù)字電路、計(jì)算機(jī)組成原理、操作系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)原理、匯編與接口、數(shù)據(jù)采集技術(shù)、數(shù)字視音頻技術(shù)、數(shù)字信號(hào)處理、計(jì)算機(jī)視覺(jué)、面向?qū)ο蟮能浖こ碳叭斯ぶ悄堋?/p>
(4)圖形圖像及應(yīng)用類(lèi):計(jì)算機(jī)圖形學(xué)、數(shù)字圖像處理技術(shù)、高級(jí)圖形技術(shù)及應(yīng)用、人機(jī)交互技術(shù)、流媒體開(kāi)發(fā)技術(shù)、信息可視化、虛擬現(xiàn)實(shí)與數(shù)字娛樂(lè)、在線互動(dòng)媒體技術(shù)、XML技術(shù)、數(shù)字安全技術(shù)及計(jì)算機(jī)前沿技術(shù)講座。
(5)網(wǎng)絡(luò)與動(dòng)畫(huà)游戲類(lèi):計(jì)算機(jī)網(wǎng)絡(luò)、網(wǎng)站建設(shè)與網(wǎng)絡(luò)傳播、動(dòng)畫(huà)原理與設(shè)計(jì)、動(dòng)畫(huà)動(dòng)力學(xué)與運(yùn)動(dòng)學(xué)、計(jì)算機(jī)動(dòng)畫(huà)編程技術(shù)、移動(dòng)媒體游戲設(shè)計(jì)及計(jì)算機(jī)游戲程序設(shè)計(jì)。
在以上課程體系中,要求各課程群內(nèi)的課程相關(guān)性較強(qiáng)并相互依托,而群間的課程相對(duì)獨(dú)立。通過(guò)對(duì)各課程群課程的設(shè)置、各課程的知識(shí)點(diǎn)與學(xué)分分配以及課程之間的內(nèi)容銜接等問(wèn)題進(jìn)行探討,可以加強(qiáng)不同課程間的銜接與協(xié)調(diào),使課程設(shè)置更加合理,教學(xué)效果也會(huì)得到進(jìn)一步提升。另外,按課程群進(jìn)行課程體系建設(shè),既可以充分發(fā)揮任課教師的專(zhuān)業(yè)特長(zhǎng),又能促進(jìn)學(xué)生的個(gè)性化發(fā)展。
1.2強(qiáng)化動(dòng)手能力的培養(yǎng),推進(jìn)實(shí)踐教學(xué)改革
實(shí)踐教學(xué)是高校教學(xué)的重要組成部分,是培養(yǎng)創(chuàng)新型人才的重大環(huán)節(jié),是對(duì)理論教學(xué)的驗(yàn)證、補(bǔ)充和拓展,它始終貫穿于高等教育的全過(guò)程。實(shí)踐教學(xué)環(huán)節(jié)是創(chuàng)新課程體系的一個(gè)重要環(huán)節(jié),能提高學(xué)生對(duì)理論教學(xué)的加深、提高和綜合運(yùn)用,培養(yǎng)學(xué)生的創(chuàng)新精神和綜合素質(zhì)。建立完善的專(zhuān)業(yè)實(shí)踐教學(xué)體系,促進(jìn)學(xué)生實(shí)踐能力和創(chuàng)新精神的培養(yǎng),我們從以下方面開(kāi)展工作:
(1)完善實(shí)踐教學(xué)體系,積極開(kāi)展課內(nèi)外實(shí)踐教學(xué)活動(dòng)。制訂完善的實(shí)踐教學(xué)管理制度,加強(qiáng)對(duì)實(shí)踐課程的監(jiān)督與管理;編寫(xiě)并適時(shí)修改實(shí)驗(yàn)課程的教學(xué)大綱,推進(jìn)實(shí)驗(yàn)教學(xué)內(nèi)容、方法、手段及模式的改革與創(chuàng)新,培養(yǎng)學(xué)生發(fā)現(xiàn)、分析和解決問(wèn)題的興趣及能力,在學(xué)生中開(kāi)展研究性學(xué)習(xí)和創(chuàng)新型實(shí)驗(yàn)的試驗(yàn)。
(2)加強(qiáng)學(xué)生的實(shí)踐與實(shí)訓(xùn),做好校內(nèi)外實(shí)習(xí)基地的建設(shè)。實(shí)習(xí)基地是實(shí)施實(shí)踐教學(xué)環(huán)節(jié)的重要場(chǎng)所,是對(duì)學(xué)生進(jìn)行專(zhuān)業(yè)技術(shù)技能訓(xùn)練和解決實(shí)際問(wèn)題能力的訓(xùn)練。在校內(nèi),結(jié)合數(shù)字媒體學(xué)院的辦學(xué)宗旨和人才培養(yǎng)目標(biāo),除平時(shí)課程的實(shí)驗(yàn)教學(xué)外,利用短學(xué)期(每學(xué)年的第二學(xué)期)進(jìn)行專(zhuān)業(yè)課程設(shè)計(jì),主要涉及面向?qū)ο笳n程設(shè)計(jì)、人機(jī)交互課程設(shè)計(jì)、三維建模、計(jì)算機(jī)組成課程設(shè)計(jì)、圖像處理課程設(shè)計(jì)、互動(dòng)媒體課程設(shè)計(jì)、網(wǎng)絡(luò)游戲課程設(shè)計(jì)等。由專(zhuān)業(yè)指導(dǎo)教師布置課程的設(shè)計(jì)內(nèi)容,要求學(xué)生在一周時(shí)間內(nèi)完成,最終以大作業(yè)或作品的形式提供成果,并評(píng)定成績(jī)。通過(guò)課程設(shè)計(jì),能培養(yǎng)學(xué)生運(yùn)用所學(xué)理論知識(shí)解決某些實(shí)際問(wèn)題的能力和獨(dú)立工作能力。在校外,我們聯(lián)合企業(yè)建立多個(gè)實(shí)訓(xùn)基地,為學(xué)生提供包括基本技能和綜合能力兩方面的真實(shí)的實(shí)踐環(huán)境。實(shí)訓(xùn)期間,學(xué)生頂崗培訓(xùn),并要求企業(yè)指定實(shí)訓(xùn)指導(dǎo)教師,負(fù)責(zé)對(duì)學(xué)生實(shí)訓(xùn)期間的技能培養(yǎng)、團(tuán)隊(duì)協(xié)作與溝通以及組織管理等方面的指導(dǎo)。通過(guò)實(shí)訓(xùn),不僅培養(yǎng)學(xué)生解決實(shí)際應(yīng)用問(wèn)題的能力,還能培養(yǎng)學(xué)生愛(ài)崗敬業(yè)、遵規(guī)守紀(jì)、團(tuán)隊(duì)協(xié)作、市場(chǎng)競(jìng)爭(zhēng)意識(shí)以及創(chuàng)新意識(shí)等綜合素質(zhì)。
(3)以項(xiàng)目為驅(qū)動(dòng),促進(jìn)學(xué)生介入科研活動(dòng)。以討論式教學(xué)、研究式學(xué)習(xí)、項(xiàng)目團(tuán)隊(duì)等多種形式,引導(dǎo)學(xué)生開(kāi)展多種學(xué)術(shù)觀點(diǎn)和思想的交鋒,追蹤本專(zhuān)業(yè)的最新發(fā)展前沿,提高自主學(xué)習(xí)和獨(dú)立研究能力。結(jié)合國(guó)家、省及校級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃,以項(xiàng)目的形式讓學(xué)有余力的學(xué)生通過(guò)自主選題或參與教師科研項(xiàng)目進(jìn)行初步的探索性研究工作。在組建學(xué)生項(xiàng)目團(tuán)隊(duì)時(shí),要求團(tuán)隊(duì)成員中既要有數(shù)字媒體技術(shù)專(zhuān)業(yè)的學(xué)生,也要有藝術(shù)專(zhuān)業(yè)的學(xué)生,以真正體現(xiàn)“藝工”結(jié)合的培養(yǎng)宗旨。這幾年的經(jīng)驗(yàn)表明,讓學(xué)生參與科研項(xiàng)目,不僅培養(yǎng)了學(xué)生運(yùn)用所學(xué)知識(shí)解決實(shí)際問(wèn)題的能力,還能提高學(xué)生對(duì)專(zhuān)業(yè)的愛(ài)好及其學(xué)習(xí)激情和創(chuàng)新精神,讓學(xué)生在了解專(zhuān)業(yè)發(fā)展前沿的同時(shí)掌握從事科學(xué)研究的方法,為以后從事數(shù)字媒體工作打下了較好的基礎(chǔ)。
(4)切實(shí)加強(qiáng)畢業(yè)設(shè)計(jì)(論文)的組織與監(jiān)督工作。畢業(yè)設(shè)計(jì)(論文)環(huán)節(jié)是高校實(shí)現(xiàn)人才培養(yǎng)目標(biāo)、強(qiáng)化學(xué)生專(zhuān)業(yè)知識(shí)和專(zhuān)業(yè)技能、提高學(xué)生綜合素質(zhì)和創(chuàng)新能力的重要環(huán)節(jié),是高等學(xué)校本科生教學(xué)計(jì)劃的重要組成部分,是理論與實(shí)踐相結(jié)合、教學(xué)與科研和生產(chǎn)相結(jié)合的過(guò)程,因此它有著任何課堂教學(xué)或教學(xué)實(shí)習(xí)所不可替代的功能,在培養(yǎng)高級(jí)專(zhuān)門(mén)人才過(guò)程中有著特殊的地位。為提高畢業(yè)設(shè)計(jì)(論文)的質(zhì)量,必須制訂完善的規(guī)范與標(biāo)準(zhǔn),并對(duì)整個(gè)過(guò)程實(shí)行全程監(jiān)控。在畢業(yè)設(shè)計(jì)(論文)期間,我們將整個(gè)過(guò)程分為畢業(yè)生動(dòng)員、學(xué)生選題、教師指導(dǎo)、質(zhì)量監(jiān)控以及評(píng)閱答辯等,時(shí)間從每年12月開(kāi)始到次年的6月。指導(dǎo)教師由高級(jí)職稱(chēng)或具有博士學(xué)位的教師擔(dān)任,根據(jù)專(zhuān)業(yè)要求及從事的科研工作每位指導(dǎo)教師確定題目,實(shí)現(xiàn)學(xué)生與教師的雙向選擇;學(xué)生選題后由指導(dǎo)教師下達(dá)具體的任務(wù),系部組織學(xué)生開(kāi)題;實(shí)行中期檢查制度,對(duì)學(xué)生的工作進(jìn)程進(jìn)行監(jiān)控;嚴(yán)把畢業(yè)答辯關(guān)。通過(guò)畢業(yè)設(shè)計(jì)(論文)環(huán)節(jié),促進(jìn)學(xué)生分析、解決實(shí)際問(wèn)題和科學(xué)研究能力的提高,為他們走上工作崗位奠定良好基礎(chǔ)。
(5)開(kāi)展多種形式的學(xué)術(shù)交流活動(dòng)。為激發(fā)學(xué)生對(duì)專(zhuān)業(yè)學(xué)習(xí)的興趣,了解專(zhuān)業(yè)發(fā)展的最新動(dòng)態(tài)和社會(huì)對(duì)專(zhuān)業(yè)的需求,聘請(qǐng)國(guó)內(nèi)知名學(xué)者和行業(yè)專(zhuān)家為學(xué)生開(kāi)展多種形式的學(xué)術(shù)和主題講座。學(xué)術(shù)專(zhuān)家可以就專(zhuān)業(yè)現(xiàn)狀、發(fā)展方向和最新的研究成果為本科生進(jìn)行介紹,激發(fā)學(xué)生對(duì)專(zhuān)業(yè)的熱愛(ài)和科學(xué)研究的興趣;行業(yè)專(zhuān)家則介紹一些新興產(chǎn)業(yè)的相關(guān)信息和發(fā)展現(xiàn)狀,結(jié)合行業(yè)進(jìn)行一些技術(shù)培訓(xùn),讓廣大師生深入了解企業(yè)和社會(huì)的需求。組織學(xué)生參加“挑戰(zhàn)杯”大學(xué)生課外學(xué)術(shù)科技作品競(jìng)賽、信息技術(shù)競(jìng)賽等科技競(jìng)賽活動(dòng),鼓勵(lì)學(xué)生努力追求夢(mèng)想、迎接挑戰(zhàn),同時(shí)營(yíng)造學(xué)院濃厚的學(xué)術(shù)氛圍,促進(jìn)更加良好學(xué)風(fēng)的形成。
實(shí)踐教學(xué)始終貫穿于高等教育的全過(guò)程,要不斷改進(jìn)實(shí)踐教學(xué)的方法和形式,把理論教學(xué)與實(shí)踐教學(xué)擺在同等重要的地位;要通過(guò)引導(dǎo)吸引高水平教師從事實(shí)踐教學(xué)工作,加強(qiáng)實(shí)驗(yàn)、實(shí)習(xí)與實(shí)訓(xùn)、畢業(yè)設(shè)計(jì)(論文)等實(shí)踐教學(xué)環(huán)節(jié);要加強(qiáng)產(chǎn)學(xué)研合作,充分利用國(guó)內(nèi)外資源,不斷拓展校際、校企、校所之間的合作,做好校內(nèi)外實(shí)習(xí)基地的建設(shè);推進(jìn)討論式教學(xué)、研究式學(xué)習(xí)、項(xiàng)目團(tuán)隊(duì)等新型教學(xué)組織形式,提高學(xué)生自主學(xué)習(xí)和獨(dú)立研究能力。
篇5
關(guān)鍵詞:基于內(nèi)容圖像檢索;相關(guān)反饋;主動(dòng)學(xué)習(xí);樣本選擇
中圖法分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)號(hào):A 文章編號(hào):2095-2163(2013)04-
Research on Reference Feedback based on Active Learning
WU Weining, LIU Yang, GUO Maozu*, WANG Chunyu, LIU Xiaoyan
(School of Computer Science and Technology, Harbin Institute of Technology, Harbin, 150001)
Abstract: Reference feedback is a common technique in the field of information retrieval. Recently, it has been widely applied in the task of content-based image retrieval (CBIR) in order to overcome the gap between low features and high semantic concepts by utilizing the user-computer interaction. This paper combines the active learning into reference feedback technique. The goal is to choose the most informative images in the unlabeled pool as returned images by using the active learning, and then reduces the feedback times. On the COREL database and VOC database, the paper evaluates the proposed method. The experimental results indentify that the reference feedback based on active learning can effectively enhance the performance of CBIR system.
Keywords: Content-based Image Retrieval; Reference Feedback; Active Learning; Sampling Strategy
0 引言
相對(duì)文本而言,圖像包含的內(nèi)容則要豐富得多。由于互聯(lián)網(wǎng)的發(fā)展,web上的圖片數(shù)量正日趨龐大,圖像包含的語(yǔ)義信息亦千差萬(wàn)別,另外具有相同語(yǔ)義信息的圖像數(shù)量頁(yè)在與日俱增。因此,作為信息檢索中一個(gè)重要分支,基于內(nèi)容的圖像檢索(CBIR)已成為關(guān)注熱點(diǎn)。
CBIR方法是以一幅圖像作為單位,通過(guò)使用圖像領(lǐng)域的前沿技術(shù),提取圖像的視覺(jué)特征,例如:顏色,紋理等。當(dāng)用戶(hù)查找圖像時(shí),搜索引擎根據(jù)用戶(hù)所提供的圖像視覺(jué)特征,尋找與之相似的圖像。這一做法避免了TBIR策略存在的問(wèn)題,可直接對(duì)圖像進(jìn)行操作。但是,由于圖像處理技術(shù)的局限性,單純提取圖像底層特征很難完整描述圖像包含語(yǔ)義信息,并且,圖像所屬的不同領(lǐng)域,所包含的視覺(jué)對(duì)象之間具有的空間信息等,也會(huì)對(duì)圖像的語(yǔ)義信息產(chǎn)生很大的影響。為了使搜索引擎能夠根據(jù)用戶(hù)提供的高層語(yǔ)義概念返回與用戶(hù)選擇圖像語(yǔ)義最為接近的圖像,相關(guān)反饋技術(shù)則提供了一種良好的實(shí)現(xiàn)途徑。該技術(shù)是使得檢索系統(tǒng)可根據(jù)算法選擇少部分圖像返回給用戶(hù),用戶(hù)對(duì)這些圖像給出標(biāo)記信息,學(xué)習(xí)系統(tǒng)再?gòu)倪@些標(biāo)記圖像中進(jìn)行知識(shí)學(xué)習(xí),并利用這些新知識(shí)提供新的檢索結(jié)果。
根據(jù)相關(guān)反饋過(guò)程的特點(diǎn),主動(dòng)學(xué)習(xí)技術(shù)可以有效地用于該過(guò)程。具體做法是通過(guò)采樣算法選擇對(duì)檢索系統(tǒng)最有利的部分樣例作為反饋圖像,并將這些圖像提交給用戶(hù)進(jìn)行標(biāo)記。使用主動(dòng)學(xué)習(xí)技術(shù)選擇反饋圖像的目的是減少提升檢索系統(tǒng)性能所需要的反饋圖像數(shù)量,同時(shí)也一并減少用戶(hù)的工作量和提交反饋圖像標(biāo)記的次數(shù)。根據(jù)這一目的,本文提出一種基于主動(dòng)學(xué)習(xí)算法的相關(guān)反饋技術(shù),利用主動(dòng)學(xué)習(xí)技術(shù)從大量無(wú)標(biāo)注待檢索圖像中選擇信息含量最大的圖像,將這些圖像作為反饋圖像,提交用戶(hù)進(jìn)行標(biāo)注,由此而減少用戶(hù)標(biāo)記反饋圖像的次數(shù)和數(shù)量,并提高CBIR系統(tǒng)的性能。本文主要工作和貢獻(xiàn)概述如下:根據(jù)CBIR圖像系統(tǒng)中給出的目標(biāo)圖像,學(xué)習(xí)一個(gè)直推向量機(jī)模型[1](Transductive Support Vector, TSVM);使用該模型對(duì)圖像庫(kù)中的所有待檢索圖像與目標(biāo)圖像的相似程度進(jìn)行預(yù)測(cè);根據(jù)預(yù)測(cè)結(jié)果計(jì)算圖像對(duì)應(yīng)的信息熵值,選擇信息熵的絕對(duì)值最小的一組圖像作為反饋圖像,提交用戶(hù)獲取標(biāo)記信息;將標(biāo)注后的圖像用于進(jìn)一步學(xué)習(xí)直推向量機(jī)模型,上述訓(xùn)練過(guò)程迭代進(jìn)行,直至達(dá)到用戶(hù)滿(mǎn)意的檢索效果為止。結(jié)合提出的算法過(guò)程,本文在Visual Studio 2005平臺(tái)開(kāi)發(fā)和實(shí)現(xiàn)了這一圖像檢索系統(tǒng),并在COREL圖像庫(kù)上對(duì)系統(tǒng)性能進(jìn)行了實(shí)驗(yàn)驗(yàn)證,實(shí)驗(yàn)結(jié)果證明了系統(tǒng)的有效性。
1 相關(guān)工作
基于內(nèi)容的圖像檢索(CBIR)方法可以被視作機(jī)器學(xué)習(xí)領(lǐng)域中的分類(lèi)問(wèn)題,即根據(jù)所給出的待檢索圖像,學(xué)習(xí)一個(gè)分類(lèi)模型,利用該模型將圖像庫(kù)中的圖像劃分為目標(biāo)圖像和非目標(biāo)圖像。在檢索過(guò)程中,一個(gè)首要的問(wèn)題是如何克服圖像的底層特征與高層語(yǔ)義概念之間的語(yǔ)義鴻溝。為了解決這一問(wèn)題,相關(guān)反饋技術(shù)通過(guò)向用戶(hù)提交查詢(xún)的方式,讓用戶(hù)提供一部分圖像的語(yǔ)義信息,根據(jù)反饋圖像中的語(yǔ)義信息,提升系統(tǒng)檢索的準(zhǔn)確度。另外,隨著用戶(hù)提交反饋次數(shù)的增加,學(xué)習(xí)系統(tǒng)逐步將反饋的圖像添加到學(xué)習(xí)系統(tǒng)的訓(xùn)練集中,并使用增量學(xué)習(xí)的方式,學(xué)習(xí)用戶(hù)提供的語(yǔ)義知識(shí)。值得注意的是,使用相關(guān)反饋技術(shù)的CBIR系統(tǒng)的學(xué)習(xí)方式與主動(dòng)學(xué)習(xí)算法具有很大的相似性,因此,利用主動(dòng)學(xué)習(xí)算法設(shè)計(jì)相關(guān)反饋,提升CBIR系統(tǒng)的精度,這一做法越發(fā)受到研究人員的廣泛重視,成為研究熱點(diǎn)。
目前,已有一些研究人員致力于將主動(dòng)學(xué)習(xí)算法應(yīng)用于相關(guān)反饋技術(shù)中,并取得了良好的實(shí)際效果。這些做法可以分為兩大類(lèi)。第一類(lèi)是委員會(huì)投票方法[2,3],此類(lèi)做法的特點(diǎn)是在同一個(gè)圖像集上同時(shí)學(xué)習(xí)多個(gè)分類(lèi)模型,并使用這些模型對(duì)同一個(gè)無(wú)標(biāo)注圖像的類(lèi)別進(jìn)行投票,選擇分類(lèi)模型差異程度最大的圖像作為反饋圖像;第二類(lèi)是基于不確定度的反饋方法[1],這類(lèi)做法的特點(diǎn)是使用當(dāng)前分類(lèi)模型對(duì)無(wú)標(biāo)注圖像的類(lèi)別進(jìn)行預(yù)測(cè),并根據(jù)分類(lèi)模型的預(yù)測(cè)結(jié)果計(jì)算分類(lèi)模型對(duì)圖像的置信度,再選擇當(dāng)前分類(lèi)模型最不確定的圖像交由用戶(hù)進(jìn)行反饋。
首先,訓(xùn)練集已知的情況下,Platt提出一種貪心算法[4],根據(jù)無(wú)標(biāo)記樣例對(duì)應(yīng)的未來(lái)期望誤差,從無(wú)標(biāo)記樣例集合中選擇訓(xùn)練樣例,目的是通過(guò)選擇未來(lái)期望誤差最小的樣例,逐步搜索主動(dòng)學(xué)習(xí)算法的全局最優(yōu)解。但是,這一做法的缺點(diǎn)是,為了計(jì)算每個(gè)無(wú)標(biāo)記樣例的未來(lái)期望誤差,需要分別計(jì)算該樣例被添加正類(lèi)標(biāo)記和負(fù)類(lèi)標(biāo)記后對(duì)分類(lèi)模型的影響,即多次重新訓(xùn)練分類(lèi)模型。如果無(wú)標(biāo)記樣例數(shù)量巨大,這一做法的計(jì)算消耗很大,因此,很難滿(mǎn)足檢索系統(tǒng)的要求。近年來(lái),支持向量機(jī)模型以其在小樣本學(xué)習(xí)問(wèn)題上的卓越性能受到了廣泛關(guān)注。針對(duì)該支持向量機(jī)模型的啟發(fā)式主動(dòng)學(xué)習(xí)算法也隨之得到了更多的研究與使用,例如:Schohn提出了一種啟發(fā)式的SVM主動(dòng)學(xué)習(xí)算法,通過(guò)核空間將圖像的底層特征維度無(wú)限放大,獲得了一個(gè)特征維度數(shù)目遠(yuǎn)遠(yuǎn)高于樣本數(shù)量的稀疏空間,而主動(dòng)學(xué)習(xí)的做法是選擇包含盡可能多的維度信息的樣例作為包含信息含量最高的樣例。事實(shí)證明,這種方法不但可以獲得近似于貪心算法的結(jié)果,而且運(yùn)行效率更高[5]。在該類(lèi)做法中,包含維度信息最多的樣例主要集中在距離支持向量機(jī)的分類(lèi)超平面較近的位置,因此,這一主動(dòng)學(xué)習(xí)算法主要選擇距離分類(lèi)界面最近的樣例作為反饋樣例。與Schohn的做法不同的是,Zhou提出了SSAIR算法[6]。該算法通過(guò)利用半監(jiān)督學(xué)習(xí)中的co-training算法,結(jié)合主動(dòng)學(xué)習(xí)中的co-testing模式,使用co-training中訓(xùn)練得到的兩個(gè)分類(lèi)模型對(duì)測(cè)試樣本進(jìn)行投票分類(lèi),最終,采用兩個(gè)分類(lèi)模型產(chǎn)生分歧的樣本作為供用戶(hù)反饋的備選樣本。與其它用于該領(lǐng)域的主動(dòng)學(xué)習(xí)算法不同的是,這一做法改變了傳統(tǒng)反饋圖像集由用戶(hù)在前次檢索中系統(tǒng)認(rèn)定的與待查詢(xún)圖像最相關(guān)的那些圖像來(lái)構(gòu)成的定則,而是通過(guò)分類(lèi)模型的投票來(lái)選擇反饋圖像集,盡最大可能改進(jìn)檢索系統(tǒng)的性能。
以上兩類(lèi)做法中,第一類(lèi)方法需要同時(shí)學(xué)習(xí)多個(gè)模型,計(jì)算量和時(shí)間消耗較大,為了滿(mǎn)足圖像檢索系統(tǒng)的實(shí)時(shí)性要求,本文選擇第二類(lèi)方法選擇反饋圖像。事實(shí)上,Schohn和Zhou提出的主動(dòng)學(xué)習(xí)算法的共同特點(diǎn)是,認(rèn)為分類(lèi)模型最不確定或者置信度最低的樣例是無(wú)標(biāo)記圖像中信息含量最大的樣例,在具體做法中則表現(xiàn)為多個(gè)分類(lèi)模型彼此間分歧最大或者距離分類(lèi)超平面最近的樣例,選擇這些樣例進(jìn)行標(biāo)記,可最大限度提高分類(lèi)模型的性能。與這些方法不同的是,本文提出一種最大信息熵的主動(dòng)學(xué)習(xí)算法,在所有無(wú)標(biāo)注樣例中,選擇樣例對(duì)應(yīng)的信息熵值最大的樣例點(diǎn)作為信息含量最大的樣例,并以此作為反饋樣例。算法的目的是在有限的檢索時(shí)間條件下,更加有效衡量樣例的信息含量,由此提高檢索系統(tǒng)的性能。
2 基于主動(dòng)學(xué)習(xí)的相關(guān)反饋算法
2.1信息熵最大化采樣策略
本節(jié)詳細(xì)介紹了信息熵最大化這一采樣策略,為了方便理解,首先給出問(wèn)題的基本概念。因?yàn)榛谙嚓P(guān)反饋技術(shù)的圖像檢索系統(tǒng)是一個(gè)迭代的學(xué)習(xí)過(guò)程,這里假定在第輪迭代中,訓(xùn)練集表示為,其中,分別表示訓(xùn)練樣例及其對(duì)應(yīng)的標(biāo)記信息。因?yàn)閳D像檢索可看作是將待檢索圖像劃分為正類(lèi)和負(fù)類(lèi)的過(guò)程,故有。本文使用TSVM作為分類(lèi)模型,則在當(dāng)前迭代步中,TSVM算法學(xué)習(xí)的分類(lèi)超平面為:
這里,和分別表示訓(xùn)練樣本和無(wú)標(biāo)記樣本在核空間的距離,是偏差項(xiàng)。對(duì)于任意一個(gè)無(wú)標(biāo)記樣本,不考慮相同的歸一化系數(shù),該樣本與分類(lèi)超平面之間的距離是:
鑒于TSVM模型僅能提供無(wú)標(biāo)記樣本與分類(lèi)界面之間的距離,而無(wú)法提供樣本與對(duì)應(yīng)的類(lèi)別標(biāo)記之間的精確概率輸出,為此,本文在這里使用了sigmoid函數(shù),通過(guò)擬合的方法獲得樣本對(duì)應(yīng)類(lèi)別標(biāo)記的后驗(yàn)概率值,即:
其中,參數(shù)和使用Platt[7]中的優(yōu)化算法,迭代求解得到。根據(jù)無(wú)標(biāo)記樣本對(duì)應(yīng)的后驗(yàn)概率值,無(wú)標(biāo)記樣本對(duì)應(yīng)的信息熵值可以通過(guò)下式計(jì)算:
根據(jù)計(jì)算得到的信息熵值,選擇信息熵值最大的樣本,作為本輪迭代中最適合加入到訓(xùn)練集中的無(wú)標(biāo)記樣本,,即:
2.2 基于主動(dòng)學(xué)習(xí)的相關(guān)反饋過(guò)程
信息熵是信息論中反映樣本信息含量的指標(biāo)之一,鑒于此,信息熵也經(jīng)常在機(jī)器學(xué)習(xí)算法中作為樣本信息含量的度量標(biāo)準(zhǔn)。值得注意的是,在公式(5)中,分類(lèi)模型對(duì)無(wú)標(biāo)注樣本的預(yù)測(cè)概率越接近于0.5,無(wú)標(biāo)注樣本對(duì)應(yīng)的信息熵值越大,該樣本的不確定程度也就越大。在這一點(diǎn)上,信息熵最大化采樣策略與基于不確定程度的采樣策略的目標(biāo)是一致的。在圖像檢索的相關(guān)反饋過(guò)程中,本文使用信息熵最大化采樣策略,由待檢索圖像中選擇反饋圖像,提交用戶(hù)做出標(biāo)記,將標(biāo)記后的樣本用于分類(lèi)模型的訓(xùn)練過(guò)程,這個(gè)過(guò)程迭代進(jìn)行,直至用戶(hù)滿(mǎn)意為止。下面,給出了基于主動(dòng)學(xué)習(xí)的相關(guān)反饋的算法過(guò)程。
算法:基于主動(dòng)學(xué)習(xí)的相關(guān)反饋算法
輸入:標(biāo)記圖像集,無(wú)標(biāo)記圖像集,反饋圖像數(shù)量
輸出:檢索結(jié)果
BeginFor
(1)在標(biāo)記圖像集上學(xué)習(xí)TSVM分類(lèi)模型,獲得公式(1)中的分類(lèi)超平面;
(2)根據(jù)分類(lèi)超平面,使用公式(2)計(jì)算每一個(gè)無(wú)標(biāo)記樣本與該分類(lèi)界面之間的距離;
(3)通過(guò)公式(3)中的sigmoid函數(shù)擬合,獲得無(wú)標(biāo)記樣本對(duì)應(yīng)的后驗(yàn)概率值;
(4)使用公式(4)逐個(gè)計(jì)算無(wú)標(biāo)記樣本的信息熵值;
(5)選擇信息熵值最大的個(gè)無(wú)標(biāo)記樣本作為反饋圖像,提交給用戶(hù)進(jìn)行標(biāo)記;
(6),;
(7)如果用戶(hù)對(duì)當(dāng)前檢索結(jié)果滿(mǎn)意,則結(jié)束,否則返回步驟1,。
EndFor
在上面的反饋過(guò)程中,每輪迭代中,檢索系統(tǒng)返回信息熵最大的一組樣本提交給用戶(hù)標(biāo)注,該做法可以減少迭代次數(shù),在用戶(hù)可接受的范圍內(nèi),盡可能多地提供標(biāo)注樣本用于訓(xùn)練。
3 實(shí)驗(yàn)結(jié)果與分析
3.1數(shù)據(jù)庫(kù)及實(shí)驗(yàn)設(shè)計(jì)
本實(shí)驗(yàn)使用COREL圖像庫(kù)中的3類(lèi)圖像作為待檢索圖像,每類(lèi)圖像包含100幅圖像,這3個(gè)圖像類(lèi)別分別是鷹,魚(yú)和馬。本文分別提取每一幅圖像的特征組成樣本集合,使用TSVM作為分類(lèi)模型,用于從CBIR系統(tǒng)中獲得檢索結(jié)果。在每一組實(shí)驗(yàn)中,首先,從待檢索圖像中隨機(jī)抽取一幅圖像作為目標(biāo)圖像,訓(xùn)練TSVM模型;根據(jù)該模型的預(yù)測(cè)結(jié)果,計(jì)算每一幅圖像的信息熵值,并選擇信息熵最大的五幅圖像作為反饋圖像();提交用戶(hù)標(biāo)記后,將反饋圖像和標(biāo)記用于訓(xùn)練TSVM模型,同時(shí)給出檢索結(jié)果;該過(guò)程循環(huán)進(jìn)行,直至達(dá)到結(jié)束標(biāo)準(zhǔn)為止。本文使用查全率(precision)作為圖像檢索結(jié)果的評(píng)價(jià)標(biāo)準(zhǔn),其中,檢索系統(tǒng)劃分的相關(guān)圖像數(shù)量是100幅,召回圖像數(shù)量是20幅。
3.2實(shí)驗(yàn)結(jié)果
在表1和表2中,本文給出了反饋次數(shù)為5次,并使用不同的圖像底層特征條件下,在不同語(yǔ)義類(lèi)別上,CBIR系統(tǒng)的檢索結(jié)果。從實(shí)驗(yàn)結(jié)果可以看出,使用最大墑作為樣本信息含量的度量標(biāo)準(zhǔn),基于主動(dòng)學(xué)習(xí)的相關(guān)反饋技術(shù)在圖像檢索系統(tǒng)中取得了良好的檢索結(jié)果。隨著反饋次數(shù)的增加,CBIR系統(tǒng)的檢索結(jié)果得到逐步提高。同時(shí),表1和表2的對(duì)比還可以發(fā)現(xiàn),顏色稀疏和相關(guān)圖組成的混合特征獲得了比SIFT特征更好的檢索結(jié)果,這是因?yàn)榍罢叩木S度高于后者,提供了更多的圖像底層語(yǔ)義信息,由此而提高了檢索效果。
表1 顏色稀疏和相關(guān)圖的混合特征條件下,不同反饋次數(shù)時(shí),CBIR系統(tǒng)檢索精度
Tab. 1. Using sparse color and related features, different feedback times, the precision of CBIR system
初始值
反饋1次
反饋2次
反饋3次
反饋4次
反饋5次
鷹
0.71
0.724
0.73
0.628
0.732
0.75
馬
0.502
0.522
0.428
0.526
0.522
0.604
魚(yú)
0.494
0.538
0.504
0.536
0.572
0.468
表2 SIFT特征條件下,不同反饋次數(shù)時(shí),CBIR系統(tǒng)檢索精度
Tab.2 Using SIFT features, different feedback times, the precision of CBIR system
初始值
反饋1次
反饋2次
反饋3次
反饋4次
反饋5次
鷹
0.5
0.756
0.39
0.71
0.774
0.622
馬
0.44
0.376
0.406
0.406
0.472
0.424
魚(yú)
0.25
0.314
0.22
0.358
0.23
0.334
在圖1和圖2中,本文給出了使用基于主動(dòng)學(xué)習(xí)的相關(guān)反饋技術(shù)在CBIR系統(tǒng)中的檢索結(jié)果。除了使用COREL圖像庫(kù)作為檢索圖像庫(kù)之外,本文還增加了VOC圖像庫(kù)(包含20類(lèi),共計(jì)5 011幅圖像)作為檢索圖像庫(kù),對(duì)所提出方法進(jìn)行實(shí)驗(yàn)驗(yàn)證。從圖1和圖2中可以看出,基于主動(dòng)學(xué)習(xí)的相關(guān)反饋技術(shù)可以有效提升CBIR系統(tǒng)的檢索性能。
(a) Car類(lèi)別
初始檢索結(jié)果
使用相關(guān)反饋技術(shù)后的檢索結(jié)果
(b) Aeroplane類(lèi)別
初始檢索結(jié)果
使用相關(guān)反饋技術(shù)后的檢索結(jié)果
圖1 VOC圖像庫(kù)上,使用基于主動(dòng)學(xué)習(xí)相關(guān)反饋技術(shù)的圖像檢索結(jié)果
Fig.1 The retrieval results on VOC database by using feedback techniques based on active learning algorithm
(a) Eagle類(lèi)別
初始檢索結(jié)果
使用相關(guān)反饋技術(shù)后檢索結(jié)果
初始檢索結(jié)果
使用相關(guān)反饋技術(shù)后檢索結(jié)果
圖2 COREL圖像庫(kù)上,使用基于主動(dòng)學(xué)習(xí)相關(guān)反饋技術(shù)的檢索結(jié)果。
Fig.2 The retrieval results on COREL database by using feedback techniques based on active learning algorithm
4 結(jié)束語(yǔ)
本文利用了主動(dòng)學(xué)習(xí)算法在選擇訓(xùn)練樣本方面,相對(duì)于隨機(jī)選擇方法的優(yōu)勢(shì),提出了一種基于主動(dòng)學(xué)習(xí)的相關(guān)反饋技術(shù)。在所提出的技術(shù)中,算法利用了分類(lèi)模型最不確定的樣本可以提供更多反饋信息的特點(diǎn),使用信息熵作為樣本信息含量的度量標(biāo)準(zhǔn),選擇每輪迭代過(guò)程中,信息熵值最大的樣本作為反饋樣本,達(dá)到了增量學(xué)習(xí),提升檢索系統(tǒng)性能的目的。本文使用COREL圖像庫(kù)和VOC圖像庫(kù),對(duì)所提出方法的性能進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果證明所提出方法的有效性。
參考文獻(xiàn)
[1] CHEN J X. Active learning for transductive support vector machines with applications to text classification[J]. 計(jì)算機(jī)科學(xué). 2004, 31: 242-244.
[2] ABE N, MAMITSUKA H. Query learning strategies using boosting and bagging[C]//Proceedings of 15th International Conference on Machine Learning. Madison. WI, 1998: 1-9.
[3] SEUNG H, OPPER M, SOMPOLINSKY M. Query by committee[C]//Proceedings of 5th ACM Workshop on Computational Learning Theory. Pittsburgh, PA, 1992: 287-294.
[4] PLATT J. Fast training of support vector machins using sequential minimal optimization. advances in kernel methods: support vector learning[M]. Cambridge: MIT Press, 1998: 42-65.
[5] SCHOHN G, GOHN D. Less is more: active learning with support vector machine[C]// Proceedings of 17th International Conference of Machine Learning. Stanford, CA, 2000: 204-211.
[6] ZHOU Z H, CHEN K J, JIANG Y. Exploiting unlabeled data in content-based image retrieval[C]//Proceedings of the 15th European Conference on Machine Learning. Pisa, Italy: LNAI 3021, 2004: 525-536.
[7] PLATT J C. Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods. Advances in Large Margin Classifiers[M]. Cambridge: MIT Press, 1999: 61-74.
基金項(xiàng)目:國(guó)家自然科學(xué)基金(61171185,61271346,60932008);高等學(xué)校博士學(xué)科點(diǎn)專(zhuān)項(xiàng)科研基金(20112302110040)
作者簡(jiǎn)介:吳偉寧(1983-).女,黑龍江寧安人,博士研究生.研究方向:機(jī)器學(xué)習(xí),圖像檢索;
劉揚(yáng)(1976-).男,吉林懷德人,博士,副教授.研究方向:機(jī)器學(xué)習(xí),計(jì)算機(jī)視覺(jué);
郭茂祖(1966-).男,山東夏津人,博士后,教授,博導(dǎo).研究方向:計(jì)算生物學(xué)與生物信息學(xué),機(jī)器學(xué)習(xí)與圖像理解;
王春宇(1979-).男,遼寧寬甸人,博士研究生,講師.研究方向:生物信息學(xué),并行計(jì)算;
熱門(mén)標(biāo)簽
計(jì)算機(jī)畢業(yè)論文 計(jì)算機(jī)論文 計(jì)算機(jī)技術(shù)論文 計(jì)算機(jī)教育論文 計(jì)算機(jī)專(zhuān)業(yè)論文 計(jì)算機(jī)專(zhuān)業(yè)畢業(yè)論文 計(jì)算機(jī)教學(xué)論文 計(jì)算機(jī)基礎(chǔ)論文 計(jì)算機(jī)應(yīng)用論文 計(jì)算化學(xué)論文 心理培訓(xùn) 人文科學(xué)概論
相關(guān)文章
1計(jì)算機(jī)類(lèi)專(zhuān)業(yè)開(kāi)展工程的思考
2高職院校計(jì)算機(jī)專(zhuān)業(yè)人才培養(yǎng)探析
4中職計(jì)算機(jī)教學(xué)應(yīng)用策略