語音識(shí)別技術(shù)范文10篇
時(shí)間:2024-04-28 08:14:01
導(dǎo)語:這里是公務(wù)員之家根據(jù)多年的文秘經(jīng)驗(yàn),為你推薦的十篇語音識(shí)別技術(shù)范文,還可以咨詢客服老師獲取更多原創(chuàng)文章,歡迎參考。
語音識(shí)別技術(shù)在電網(wǎng)的應(yīng)用
摘要:語音識(shí)別技術(shù)在車載等領(lǐng)域得到了廣泛的應(yīng)用,隨著智能電網(wǎng)建設(shè)推進(jìn),基于智能化的語音識(shí)別技術(shù)也將得到重點(diǎn)研究。闡述了語音識(shí)別的基本原理,分析了語音識(shí)別技術(shù)在電力調(diào)度、設(shè)備巡檢等領(lǐng)域的應(yīng)用情況。
關(guān)鍵詞:語音識(shí)別;電網(wǎng)應(yīng)用;深度學(xué)習(xí);電力生產(chǎn)
語言是人類社會(huì)中交流的重要手段,也是最為有效的途徑之一,而語音是語言的聲學(xué)表征,從20世紀(jì)50年代開始,語音識(shí)別技術(shù)概念被提出并得到重視,隨著計(jì)算機(jī)技術(shù)的快速發(fā)展與深入應(yīng)用,同機(jī)器開展語音交流成為現(xiàn)實(shí)。到20世紀(jì)90年代后期,人工神經(jīng)網(wǎng)絡(luò)的應(yīng)用使得語音識(shí)別系統(tǒng)真正開始實(shí)用化,通過對(duì)人類語音的容錯(cuò)性與自適應(yīng)識(shí)別,使得計(jì)算機(jī)認(rèn)知人的真實(shí)意圖,從而完成一系列的相關(guān)執(zhí)行動(dòng)作[1]。近些年車載語音識(shí)別技術(shù)得到了較為廣泛的開發(fā)與應(yīng)用,也使得語音識(shí)別向其他行業(yè)逐漸擴(kuò)展開來。對(duì)于電力系統(tǒng)而言,盡管語音告警、語音合成等帶有語音的相關(guān)技術(shù)應(yīng)用時(shí)間較長,但是針對(duì)語音識(shí)別技術(shù)的應(yīng)用與開發(fā)同其他成熟行業(yè)相比來說,還較為淺顯。隨著智能電網(wǎng)建設(shè)的快速推進(jìn),語音識(shí)別技術(shù)這一具有明顯智能特征的前端技術(shù),必將在電網(wǎng)應(yīng)用中得到較為廣泛的應(yīng)用與研究。
一、語音識(shí)別原理
從淺顯角度上來看,語音識(shí)別就是人的聲音信號(hào)轉(zhuǎn)換為文字或者指令的相關(guān)過程[2],是語音信號(hào)處理的重要研究方向之一,它不僅是人工智能單個(gè)方向,是綜合了微機(jī)技術(shù)、信號(hào)分析處理、模式識(shí)別、聲學(xué)等多個(gè)學(xué)科的綜合研究方向。針對(duì)不同限制條件下的相關(guān)領(lǐng)域,語音識(shí)別系統(tǒng)可劃分為孤立詞、連接詞以及連續(xù)語音識(shí)別方式,而根據(jù)對(duì)語音產(chǎn)生對(duì)象的依賴程度,可劃分為特定人以及非特定人兩個(gè)層次,根據(jù)對(duì)語音詞匯量的程度,可劃分為小級(jí)別、中等級(jí)別、大級(jí)別以及無限制等多種程度的語音識(shí)別系統(tǒng)。從本質(zhì)原理上,語音識(shí)別系統(tǒng)的基礎(chǔ)主要為統(tǒng)計(jì)模式識(shí)別,綜合了語音學(xué)以及語言學(xué)的大量信息,將語音輸入對(duì)象特征向量序列進(jìn)行一系列的轉(zhuǎn)化,形成待處理的聲學(xué)模型。在建立模型之后,開展相關(guān)的特征提取、模型搜索求解等相關(guān)操作。簡單來說,就是將獲取的語音信息進(jìn)行模塊處理,對(duì)相關(guān)的語音特征參數(shù)結(jié)合數(shù)據(jù)塊進(jìn)行模塊匹配并識(shí)別,最終輸出相應(yīng)的識(shí)別結(jié)果,開展下一步的應(yīng)用分析。根據(jù)語音識(shí)別的基本步驟分析,一般分為語音信號(hào)的獲取、預(yù)處理、特征提取、相似性度量與模塊匹配、數(shù)據(jù)后處理、識(shí)別結(jié)果輸出等多個(gè)基本步驟。由于語音信號(hào)本質(zhì)上屬于非平穩(wěn)信號(hào),目前對(duì)語音信號(hào)的分析是建立在短時(shí)平穩(wěn)性假設(shè)之上的,同時(shí)聲學(xué)模型又是系統(tǒng)中最為重要的部分之一,主要存在建模單元選擇、狀態(tài)聚類、參數(shù)估計(jì)等多個(gè)方面。隨著語音識(shí)別系統(tǒng)研究逐步深入,現(xiàn)階段對(duì)于,基于深度學(xué)習(xí)的聲學(xué)模型結(jié)構(gòu),基于深度學(xué)習(xí)的聲學(xué)模型訓(xùn)練效率優(yōu)化,基于深度學(xué)習(xí)的聲學(xué)模型說話人自適應(yīng)和基于深度學(xué)習(xí)的端到端語音識(shí)別均得到了重點(diǎn)關(guān)注[3]。
二、語音識(shí)別在電網(wǎng)中應(yīng)用分析
語音識(shí)別研究論文
摘要:語音識(shí)別技術(shù)是一門涉及面很廣的交叉學(xué)科。隨著新理論的提出和應(yīng)用,語音識(shí)別技術(shù)取得了很大的進(jìn)步,許多產(chǎn)品已經(jīng)得以實(shí)際的應(yīng)用,但在其進(jìn)一步的發(fā)展進(jìn)程中,還有許多棘手的問題有待解決。
關(guān)鍵詞:語音識(shí)別;動(dòng)態(tài)時(shí)間規(guī)整算法;人工神經(jīng)元網(wǎng)絡(luò)
1背景介紹
語言是人類特有的功能,是人們思維最重要的寄托體,是人類交流最主要的途徑。語音是語言的聲學(xué)表現(xiàn),是人類交流信息最自然、最有效、最方便的手段。語言和語音與人類社會(huì)科學(xué)文化發(fā)展緊密相連。
語音識(shí)別技術(shù)是讓機(jī)器接收,識(shí)別和理解語音信號(hào),并將其轉(zhuǎn)換成相應(yīng)的數(shù)字信號(hào)的技術(shù)。它是一門交叉學(xué)科,涉及到語音語言學(xué)、數(shù)理統(tǒng)計(jì)、計(jì)算機(jī)、信號(hào)處理等一系列學(xué)科。
2發(fā)展歷史
廣播電視音頻監(jiān)測(cè)技術(shù)研究
廣播電視的不問斷和安全播出始終是廣播電視機(jī)構(gòu)要完成的首要任務(wù)。隨著基于電子管、晶體管等設(shè)備的退役和計(jì)算機(jī)軟硬件技術(shù)、微電子技術(shù)和數(shù)字化技術(shù)的應(yīng)用普及,廣播電視設(shè)備的故障率已經(jīng)降到了非常低的水平,在節(jié)目播出過程中由于設(shè)備故障造成的停播、錯(cuò)播現(xiàn)象已很少發(fā)生。近年來,信號(hào)的安全播出問題,尤其是信號(hào)的被干擾、被破壞和被插播的現(xiàn)象屢見不鮮。廣播電視的安全監(jiān)測(cè)技術(shù)逐漸成為廣播電視制播技術(shù)的研究焦點(diǎn)。本文將針對(duì)以上問題加以探討,并對(duì)解決問題所用到的關(guān)鍵技術(shù)和算法進(jìn)行簡要的分析和論述。
1監(jiān)測(cè)業(yè)務(wù)和技術(shù)的現(xiàn)狀及分類
目前國內(nèi)大多數(shù)廣播電視臺(tái)站的自動(dòng)監(jiān)測(cè)系統(tǒng)都只針對(duì)音頻信號(hào)的質(zhì)量好壞和信號(hào)的有無進(jìn)行監(jiān)測(cè),而對(duì)于音頻信號(hào)的來源及內(nèi)容等安全方面的監(jiān)測(cè)任務(wù)則更多地采用循環(huán)播放、人工監(jiān)聽的方式…。人工方式不僅效率低,而且不及時(shí)。應(yīng)州于廣播電視安全監(jiān)測(cè)系統(tǒng)的音頻信號(hào)監(jiān)測(cè)技術(shù)從業(yè)務(wù)層面上可分為音頻的內(nèi)容監(jiān)測(cè)和音頻的質(zhì)量監(jiān)測(cè)。音頻的內(nèi)容監(jiān)測(cè)主要是對(duì)采集的信息的收集、整理、解析和應(yīng)用等過程中所出現(xiàn)的錯(cuò)誤、疏漏、不當(dāng)及不和諧、敏感信息的檢查和把關(guān),它關(guān)注的是音頻所表述的具體內(nèi)容。音頻的質(zhì)量監(jiān)測(cè)主要是對(duì)已經(jīng)制作完成的廣播電視節(jié)目在音頻信號(hào)的生成、處理、傳輸和收發(fā)過程中出現(xiàn)的干擾、噪聲、電平過低、中斷和信源突變等狀況所進(jìn)行的實(shí)時(shí)監(jiān)控和更正,它注重的是音頻信號(hào)的質(zhì)量及來源的正確性。二者雖然針對(duì)的業(yè)務(wù)層面不同,卻彼此依賴相互聯(lián)系。音頻內(nèi)容的好壞會(huì)直接影響到音頻質(zhì)量的高低,音頻質(zhì)量的高低也會(huì)直接影響終端聽眾對(duì)信息內(nèi)容的獲取量和正確率。總之,對(duì)音頻內(nèi)容和質(zhì)量的監(jiān)測(cè)都是為了保證聽眾能收到正確、優(yōu)質(zhì)和不間斷的音頻信號(hào)。目前,可應(yīng)用于音頻信號(hào)監(jiān)測(cè)任務(wù)的技術(shù)可分為音頻比對(duì)技術(shù)、音頻識(shí)別技術(shù)、數(shù)字水印技術(shù)這三大類。
2音頻比對(duì)技術(shù)
音頻比對(duì)技術(shù)是利用數(shù)字音頻的時(shí)域或頻域特征或?qū)傩詠矸治鰞啥我纛l序列的相似度,再相似度的大小來判斷這兩段音頻序列播放的是否是相同或相似的內(nèi)容。其大概流程如圖1所示。首先,將要處理的2路音頻序列通過多路音頻采集卡采集到設(shè)備中,并進(jìn)行濾波、增益補(bǔ)償?shù)忍幚?;其次,將得到?路音頻信號(hào)進(jìn)行模數(shù)轉(zhuǎn)換,再對(duì)得到的數(shù)字信號(hào)進(jìn)行壓縮處理;然后,提取2路信號(hào)的特征參數(shù)或者屬性;最后,比較提取出來的參數(shù)或者屬性,得出2路音頻信號(hào)的相似度,再由相似度來判斷2路信號(hào)是否相同或者相似。濾波和增益補(bǔ)償?shù)阮A(yù)處理是為了濾除音頻中的噪盧、干擾脈沖及平衡音頻的電平差等。
壓縮處理是為了減少音頻中相關(guān)性較低和不相關(guān)的參數(shù),減少后續(xù)工作量,提高處理的實(shí)時(shí)性(目前比較流行的壓縮算法是利用小波函數(shù)壓縮)。參數(shù)和屬性的提取是從音頻流中以幀為單位提取出2路音頻的質(zhì)心、均方根、Mel倒譜系數(shù)以及音高、振幅、帶寬、能量等。音頻比對(duì)是利用上一步提取的參數(shù)或?qū)傩赃M(jìn)行計(jì)算和比較,將比較結(jié)果同預(yù)先設(shè)定的閾值進(jìn)行對(duì)比,得出最終結(jié)果。音頻比對(duì)技術(shù)在實(shí)現(xiàn)時(shí)不考慮音頻的具體內(nèi)容,它只注重音頻序列的關(guān)鍵參數(shù)和屬性的相似度。目前對(duì)音頻技術(shù)的應(yīng)用需求更多的還是涉及到音頻的語意和具體內(nèi)容方面,這項(xiàng)技術(shù)的適用領(lǐng)域相對(duì)來說比較小,但是它基本上能滿足廣播電視的質(zhì)量監(jiān)測(cè)的任務(wù)需求。
智能語音識(shí)別在廣播電視監(jiān)測(cè)的應(yīng)用
摘要:隨著媒體深度融合不斷推進(jìn),各類新興媒體持續(xù)涌現(xiàn)、遍地開花,廣播電視內(nèi)容監(jiān)測(cè)從傳統(tǒng)的廣播、電視頻道監(jiān)測(cè)擴(kuò)展到了互聯(lián)網(wǎng)新興媒體視聽內(nèi)容。海量、多元的互聯(lián)網(wǎng)視聽內(nèi)容給監(jiān)測(cè)監(jiān)管工作帶來了巨大的挑戰(zhàn),如何適應(yīng)這一新形勢(shì)是各級(jí)監(jiān)管機(jī)構(gòu)面臨的共性問題。本文旨在探討將自動(dòng)語音識(shí)別和智能語義分析技術(shù)結(jié)合起來應(yīng)用到監(jiān)測(cè)監(jiān)管工作中的可行性及優(yōu)勢(shì)。
關(guān)鍵詞:智能語義分析;自動(dòng)語音識(shí)別;內(nèi)容監(jiān)測(cè)
1引言
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展普及,手機(jī)、電腦逐漸成為了人們獲取信息、學(xué)習(xí)娛樂的主要渠道,與之對(duì)應(yīng)的各類互聯(lián)網(wǎng)新媒體傳播平臺(tái)(短視頻、直播、視頻網(wǎng)站等)不斷涌現(xiàn),海量的網(wǎng)絡(luò)視頻、網(wǎng)絡(luò)廣播等互聯(lián)網(wǎng)視聽內(nèi)容都成為了廣播電視監(jiān)測(cè)監(jiān)管對(duì)象,使得監(jiān)測(cè)監(jiān)管工作變得更加艱巨和復(fù)雜,對(duì)監(jiān)測(cè)監(jiān)管從業(yè)人員的專業(yè)素質(zhì)和監(jiān)測(cè)技術(shù)手段提出了更高的要求。傳統(tǒng)廣播電視內(nèi)容監(jiān)測(cè)是將音視頻節(jié)目錄像先存貯,再通過圖像識(shí)別、關(guān)鍵幀對(duì)比、語音特征識(shí)別等技術(shù)手段進(jìn)行監(jiān)測(cè)監(jiān)管,存在監(jiān)測(cè)時(shí)效性差、計(jì)算存貯資源需求高、違規(guī)識(shí)別準(zhǔn)確率低等問題。隨著互聯(lián)網(wǎng)視聽監(jiān)測(cè)業(yè)務(wù)的不斷拓展,這些劣勢(shì)越發(fā)凸顯,實(shí)現(xiàn)快速、實(shí)時(shí)、準(zhǔn)確的對(duì)巨量、多元的互聯(lián)網(wǎng)視聽內(nèi)容進(jìn)行監(jiān)測(cè)監(jiān)管的需求變得越來越迫切。
2自動(dòng)語音識(shí)別和智能語義分析技術(shù)
2.1自動(dòng)語音識(shí)別。語音識(shí)別(ASR)是語音交互中最基礎(chǔ)的一個(gè)AI技術(shù)環(huán)節(jié),就是將一段語音信號(hào)轉(zhuǎn)換成相對(duì)應(yīng)的文本信息,系統(tǒng)主要包含特征提取、聲學(xué)模型、語言模型以及字典與解碼四大部分。此外,為了更有效地提取特征,往往還需要對(duì)所采集到的聲音信號(hào)進(jìn)行濾波、分幀等音頻數(shù)據(jù)預(yù)處理工作,將需要分析的音頻信號(hào)從原始信號(hào)中合適地提取出來。特征提取工作將聲音信號(hào)從時(shí)域轉(zhuǎn)換到頻域,為聲學(xué)模型提供合適的特征向量;聲學(xué)模型再根據(jù)聲學(xué)特性計(jì)算每一個(gè)特征向量在聲學(xué)特征上的得分;而語言模型則根據(jù)語言學(xué)相關(guān)的理論,計(jì)算該聲音信號(hào)對(duì)應(yīng)可能詞組序列的概率;最后根據(jù)已有的字典,對(duì)詞組序列進(jìn)行解碼,得到最后可能的文本表示,連續(xù)語音識(shí)別原理框圖如圖1所示。當(dāng)前,該技術(shù)發(fā)展已非常成熟,車載語音助手、智能語音輸入等都已經(jīng)普及在我們的各種生活場(chǎng)景中。2.2智能語義分析。智能語義分析是自然語言理解(NLP)的關(guān)鍵,自然語言理解是人工智能領(lǐng)域中的核心課題之一。當(dāng)前,智能語義分析可以對(duì)文本進(jìn)行自動(dòng)化處理,主要應(yīng)用于要素抽取、智能審核、輿情分析、知識(shí)搜索、自動(dòng)寫作等,在分析歧義、詞語省略、代詞所指、意圖識(shí)別等的理解方面依然存在不足。但是,隨著近年來人工智能技術(shù)的迅猛發(fā)展,經(jīng)過不斷的演化迭代,其智能化、類人化的理解能力已經(jīng)越來越高,按照這個(gè)趨勢(shì),未來計(jì)算機(jī)一定能夠逐步接近甚至達(dá)到類人自然語言處理能力。通過以上介紹不難發(fā)現(xiàn),將語音自動(dòng)識(shí)別和智能語義分析結(jié)合起來,運(yùn)用到廣播電視內(nèi)容監(jiān)測(cè)中,從技術(shù)實(shí)現(xiàn)上來說已經(jīng)沒有障礙,首先通過自動(dòng)語音識(shí)別將音視頻內(nèi)容文本化,然后再利用智能語義分析對(duì)文本化的音視頻內(nèi)容進(jìn)行分析監(jiān)測(cè),輸出監(jiān)測(cè)預(yù)警信息。當(dāng)前,語音識(shí)別速度和準(zhǔn)確率早已達(dá)到應(yīng)用層面的標(biāo)準(zhǔn),為音視頻內(nèi)容文本化的準(zhǔn)確率提供了保障,通過樣本庫關(guān)鍵詞句進(jìn)行文本檢索,就可以快速準(zhǔn)確識(shí)別一般違規(guī)信息,這只是快速發(fā)現(xiàn)的第一步。對(duì)于較為復(fù)雜的違規(guī)信息,智能語義分析系統(tǒng)在不斷的使用優(yōu)化過程中,通過長期連續(xù)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練和人工糾偏,逐步提高對(duì)長文本、復(fù)雜結(jié)構(gòu)句式、特殊發(fā)聲等各種定制監(jiān)測(cè)需求違規(guī)信息的理解識(shí)別準(zhǔn)確率,由文本內(nèi)容檢索逐步進(jìn)化到擬人化的感知思考,應(yīng)用前景明朗。
單片機(jī)控制智能語音刷卡系統(tǒng)設(shè)計(jì)探討
摘要:闡述STM32單片機(jī)控制的智能語音刷卡系統(tǒng)中的內(nèi)部結(jié)構(gòu)、語音識(shí)別功能,智能語音刷卡系統(tǒng)的功能模塊,包括中央控制系統(tǒng)、語音識(shí)別模塊、電平串口模塊、藍(lán)牙模塊、顯示模塊、刷卡模塊、供電模塊,探討智能語音刷卡系統(tǒng)的程序設(shè)計(jì)。
關(guān)鍵詞:STM32單片機(jī),智能語音控制,程序設(shè)計(jì),語音識(shí)別
STM32單片機(jī)控制的智能語音刷卡系統(tǒng)當(dāng)前被越來越多的應(yīng)用于各個(gè)領(lǐng)域,該系統(tǒng)能夠在消費(fèi)者進(jìn)行刷卡消費(fèi)時(shí)使用語音功能輸入消費(fèi)價(jià)格,在使用過程中更加方便快捷。該系統(tǒng)主要具有強(qiáng)大的語音識(shí)別功能和刷卡功能,在執(zhí)行語音功能時(shí)可以將其懸掛在腰間,或者其他位置。語音系統(tǒng)內(nèi)部結(jié)構(gòu)包括一個(gè)麥克風(fēng)以及連接線,系統(tǒng)主要是通過掛在腰間的語音識(shí)別裝置進(jìn)行語音識(shí)別和轉(zhuǎn)換,然后將信息上傳至系統(tǒng)內(nèi)部,從而智能控制刷卡機(jī)達(dá)到語音識(shí)別目的。本系統(tǒng)可以在刷卡成功后通過電子屏顯示消費(fèi)者銀行卡的余額等信息,通過對(duì)這一系統(tǒng)的推廣和應(yīng)用極大地提高了商場(chǎng)等收銀工作的工作效率以及準(zhǔn)確率,減少誤差。本文通過對(duì)STM32單片機(jī)控制的智能語音刷卡系統(tǒng)的運(yùn)行原理、結(jié)構(gòu)分析和討論,希望能夠更好地將該系統(tǒng)推廣到各個(gè)領(lǐng)域當(dāng)中,提高其使用價(jià)值。
1研究背景
以STM32單片機(jī)控制裝置為主要部分的智能語音刷卡系統(tǒng),能夠更好地施展其語音識(shí)別功能,該系統(tǒng)是通過內(nèi)部特殊裝置來對(duì)語音進(jìn)行分析和定位,最終完成識(shí)別工作,然后將識(shí)別后的信息傳送至中央系統(tǒng),通過中央系統(tǒng)對(duì)刷卡裝置發(fā)送指令最終完成語音刷卡任務(wù)。這一系列的操作過程都要利用電腦程序編排,只有經(jīng)過軟件對(duì)該系統(tǒng)進(jìn)行科學(xué)合理的編程,對(duì)STM32單片機(jī)裝置進(jìn)行嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)分析和處理,才能夠是中樞控制系統(tǒng)接收到準(zhǔn)確無誤的信息數(shù)據(jù),從而保證系統(tǒng)能夠更好地完成刷卡任務(wù)。我國STM32單片機(jī)智能語音刷卡系統(tǒng)應(yīng)用已經(jīng)十分普遍,各大商場(chǎng)甚至中小私營門面都引進(jìn)該系統(tǒng),用于店鋪收銀工作,該系統(tǒng)具有生產(chǎn)成本低,操作簡單,小巧方便便于攜帶等諸多優(yōu)點(diǎn)。因此,為了更好地將該系統(tǒng)應(yīng)用在各個(gè)領(lǐng)域當(dāng)中,我們應(yīng)該更加清晰明了的掌握該系統(tǒng)的內(nèi)部結(jié)構(gòu)以及運(yùn)行理論,充分的改進(jìn)和完善該系統(tǒng),使其能夠更好地為我們提供服務(wù)。
2STM32單片機(jī)控制的智能刷卡系統(tǒng)
計(jì)算機(jī)人工智能識(shí)別關(guān)鍵技術(shù)探討
受社會(huì)經(jīng)濟(jì)水平提升的影響,計(jì)算機(jī)技術(shù)的開發(fā)越來越深入,尤其是人工智能識(shí)別技術(shù)的開發(fā)與應(yīng)用,應(yīng)用范圍越來越廣,真正提高了生活與工作的便捷性。當(dāng)前人工智能技術(shù)已經(jīng)在機(jī)器人、智能語音識(shí)別、人工神經(jīng)等多個(gè)領(lǐng)域得到運(yùn)用,充分發(fā)揮計(jì)算機(jī)技術(shù)的優(yōu)勢(shì)提高計(jì)算機(jī)人工智能識(shí)別水平。下面重點(diǎn)圍繞計(jì)算機(jī)人工智能識(shí)別關(guān)鍵技術(shù)的應(yīng)用展開分析。
1計(jì)算機(jī)人工智能識(shí)別技術(shù)
所謂智能識(shí)別技術(shù),即立足于計(jì)算機(jī)系統(tǒng)、掃描設(shè)備、照相機(jī)技術(shù)等先進(jìn)技術(shù)的基礎(chǔ)上,對(duì)目標(biāo)指令、數(shù)據(jù)信息展開智能識(shí)別,提高識(shí)別準(zhǔn)確性與效率,從而滿足目前社會(huì)發(fā)展過程中對(duì)智能識(shí)別提出的嚴(yán)格要求。人工智能識(shí)別技術(shù)是在語音識(shí)別技術(shù)的基礎(chǔ)上延伸而來,語音識(shí)別技術(shù)主要是在手機(jī)控制中得到運(yùn)用,為人民群眾的生活提供高質(zhì)量服務(wù)。隨后技術(shù)人員開發(fā)了人工智能識(shí)別技術(shù),在運(yùn)行過程中更多利用語音識(shí)別,語音內(nèi)容、手機(jī)發(fā)出的指令比對(duì)之后展開分析,從而保證選擇的有效性。在實(shí)際應(yīng)用中滲透人工智能識(shí)別技術(shù),能夠真正減少工作量,提高工作效率,這對(duì)于社會(huì)的飛速發(fā)展有重要作用。
2計(jì)算機(jī)人工智能識(shí)別關(guān)鍵技術(shù)現(xiàn)狀
目前我國人工智能識(shí)別技術(shù)的研發(fā)、應(yīng)用依然處于發(fā)展階段,與國外對(duì)比還沒有非常完善且成熟的技術(shù)體系。同時(shí),各個(gè)國家就人工智能識(shí)別技術(shù)展開交流與合作,這為我國研發(fā)人工智能識(shí)別技術(shù)新的機(jī)遇。通過不斷實(shí)踐與研發(fā),人工智能識(shí)別技術(shù)水平顯著提升,同時(shí)也為人們的工作與生活帶來諸多便利。改善了生活條件。同時(shí),我國相關(guān)部門對(duì)人工智能識(shí)別技術(shù)給予足夠的重視,投入大量資金,市場(chǎng)規(guī)模不斷擴(kuò)大。2016年市場(chǎng)規(guī)模為16億元,2017年增加到21億元,2018年為26億元,預(yù)計(jì)2019年和2020年有望突破40億元。但是,人工智能識(shí)別技術(shù)在實(shí)踐應(yīng)用的過程中依然面臨問題,和國外整體發(fā)展水平有一些差距,以上便是目前需要解決的解決重點(diǎn)問題。
3計(jì)算機(jī)人工智能識(shí)別關(guān)鍵技術(shù)運(yùn)用
AI在安全播出領(lǐng)域的應(yīng)用
摘要:隨著互聯(lián)網(wǎng)和大數(shù)據(jù)的發(fā)展,人工智能技術(shù)(AI)得到了高速和深入的發(fā)展。在有線電視安全播出領(lǐng)域運(yùn)用AI技術(shù),將會(huì)顯著提升安全播出工作效果。本文對(duì)安全播出中的內(nèi)容安全審播現(xiàn)狀進(jìn)行了總結(jié),對(duì)AI技術(shù)發(fā)展進(jìn)行了介紹,并對(duì)如何將AI應(yīng)用于安全播出領(lǐng)域進(jìn)行了詳細(xì)分析,提出具體技術(shù)部署方案和相關(guān)建議,對(duì)AI技術(shù)運(yùn)用于數(shù)字電視安全播出具有啟示價(jià)值。
關(guān)鍵詞:AI;安全播出;大數(shù)據(jù)
1引言
隨著我國經(jīng)濟(jì)發(fā)展和社會(huì)進(jìn)步,人民群眾對(duì)精神文化生活的需求日益增長。廣播電視播出機(jī)構(gòu)通過不斷增加播出頻道數(shù)量和節(jié)目內(nèi)容來滿足用戶這方面需求,這對(duì)作為廣播電視產(chǎn)業(yè)發(fā)展的基礎(chǔ)和廣播電視工作生命線的安全播出工作提出了更高要求。在我國,廣播電視承擔(dān)了黨、政府和人民宣傳喉舌的特殊功能,是輿論引導(dǎo)的主要工具。安全播出是廣播電視運(yùn)營商的首要任務(wù),而內(nèi)容安全是安全播出的重點(diǎn)之一,特別是涉及政治、外交、軍事、國計(jì)民生大政方針等內(nèi)容時(shí),更加不能有絲毫差錯(cuò)。
2內(nèi)容安全審核與播出現(xiàn)狀
對(duì)于有線電視運(yùn)營商來說,安全播出包括電視節(jié)目的播出、傳輸與覆蓋等網(wǎng)絡(luò)傳輸環(huán)節(jié),也包括點(diǎn)播形式的媒資和頁面海報(bào)等內(nèi)容呈現(xiàn)環(huán)節(jié)。其中,媒資內(nèi)容安全涉及意識(shí)形態(tài)和輿論導(dǎo)向,是安全播出重中之重的環(huán)節(jié)。針對(duì)媒資內(nèi)容的安全播出措施主要包括播出前審核和播出過程中監(jiān)聽監(jiān)看。目前,對(duì)媒資內(nèi)容的審核由審核專家采取人工方式進(jìn)行,人工審核的特點(diǎn)是審核效率有限。播出過程中對(duì)媒資內(nèi)容進(jìn)行監(jiān)聽監(jiān)看以人工方式為主,但這種方式存在明顯不足:第一,對(duì)內(nèi)容安全的認(rèn)知取決于人員業(yè)務(wù)素質(zhì)、主客觀判斷等因素,不同人員對(duì)同樣內(nèi)容的認(rèn)知結(jié)果存在差異;第二,欄目數(shù)量和點(diǎn)播媒資內(nèi)容日益增多,需要增加具備安全播出業(yè)務(wù)素質(zhì)的人員數(shù)量,相應(yīng)的人力成本也會(huì)大幅增加;第三,監(jiān)聽監(jiān)看人員值守期間安播壓力大,精神高度緊張,工作體驗(yàn)不佳,專業(yè)人員流失嚴(yán)重。針對(duì)內(nèi)容審核以人工方式為主存在的問題,通過引入AI技術(shù),基于智能算法,輔助內(nèi)容安全審核,可以大幅度減輕目前內(nèi)容安全審核壓力,提升安全播出的工作效果。
計(jì)算機(jī)人工智能識(shí)別技術(shù)應(yīng)用思考
摘要:隨著計(jì)算機(jī)、人工智能技術(shù)的快速發(fā)展和普及,計(jì)算機(jī)人工智能識(shí)別技術(shù)也不斷地推陳出新,并在許多領(lǐng)域得到了推廣和應(yīng)用,為人們的生活和工作帶來了極大的便利。對(duì)計(jì)算機(jī)人工智能識(shí)別技術(shù)進(jìn)行了闡述,并就當(dāng)前的技術(shù)應(yīng)用實(shí)踐展開分析,對(duì)其應(yīng)用瓶頸和解決對(duì)策給予分析和探討。
關(guān)鍵詞:計(jì)算機(jī);人工智能識(shí)別技術(shù);應(yīng)用實(shí)踐;瓶頸
目前,計(jì)算機(jī)人工智能識(shí)別技術(shù)的應(yīng)用范圍較廣,比如無生命特征的技術(shù)實(shí)踐領(lǐng)域有二維碼識(shí)別、機(jī)器翻譯和基于神經(jīng)網(wǎng)絡(luò)的類型識(shí)別等;有生命特征的技術(shù)實(shí)踐領(lǐng)域誕生了語音識(shí)別、面部識(shí)別和指紋識(shí)別等。這些技術(shù)的應(yīng)用滿足了現(xiàn)代社會(huì)發(fā)展的相關(guān)需求。但計(jì)算機(jī)人工智能識(shí)別技術(shù)誕生較近,技術(shù)還不夠成熟,所以在應(yīng)用中存在一些亟需突破的瓶頸問題。突破這些瓶頸以促使該技術(shù)得到更好的發(fā)展和應(yīng)用,將是該領(lǐng)域未來發(fā)展的重中之重。
1計(jì)算機(jī)人工智能識(shí)別技術(shù)
計(jì)算機(jī)人工智能識(shí)別技術(shù)的核心是用計(jì)算機(jī)對(duì)人類智能進(jìn)行模擬,進(jìn)而促使計(jì)算機(jī)通過模仿人類的判別思維來達(dá)成識(shí)別的目的。例如人類看到了一個(gè)熟悉的面孔,會(huì)通過大腦的思維判別,自主識(shí)別出對(duì)方的身份,而利用人工智能技術(shù)進(jìn)行面部識(shí)別與之類似,也是通過掃描被識(shí)別者的面部信息,然后將其與已納入面部模型庫中的“熟悉面孔”進(jìn)行對(duì)比,進(jìn)而實(shí)現(xiàn)身份的識(shí)別確認(rèn)。將計(jì)算機(jī)人工智能識(shí)別技術(shù)廣泛應(yīng)用于生活和工作,可以實(shí)現(xiàn)對(duì)人力資源的解放,很多識(shí)別確認(rèn)類的工作交由系統(tǒng)自動(dòng)完成,極大地提升了工作質(zhì)量和效率。與歐美等發(fā)達(dá)國家相比,我國對(duì)計(jì)算機(jī)人工智能識(shí)別技術(shù)的研究起步較晚,但因?yàn)閲液拖嚓P(guān)企業(yè)高度重視,目前我國在該技術(shù)的研究方面,尤其是在實(shí)踐應(yīng)用領(lǐng)域取得了很多積極成果,推動(dòng)了該技術(shù)在我國的應(yīng)用水平的提升。但目前該技術(shù)在應(yīng)用過程中還存在一些瓶頸和難點(diǎn),比如成本較高、可靠性不足等等,對(duì)技術(shù)的應(yīng)用深化形成了一定的阻礙,也是現(xiàn)階段亟待解決和攻克的問題。
2計(jì)算機(jī)人工智能識(shí)別技術(shù)的應(yīng)用實(shí)踐
多媒體技術(shù)的應(yīng)用與發(fā)展前景
1多媒體技術(shù)涉及的內(nèi)容
多媒體是一種較為泛泛的稱呼,其主要是通過計(jì)算機(jī)的交互式綜合技術(shù)以及數(shù)字通信網(wǎng)絡(luò)處理技術(shù)等多種科技手段,將多種形式的信息集中在一起,從而形成一種交互式的系統(tǒng)。通過多媒體技術(shù),人們能夠?qū)ι钪械亩喾N工作進(jìn)行更加方便的執(zhí)行。目前,多媒體技術(shù)主要涉及以下一些方面,且在這些方面中具有非常廣闊的應(yīng)用前景:首先是對(duì)圖像信息的處理,通過多媒體的壓縮功能,能夠?qū)D像信息進(jìn)行各種形式之間的轉(zhuǎn)換,從而保證圖像信息的傳遞性。然后是對(duì)音頻信息的處理,多媒體技術(shù)能夠通過音頻的合成產(chǎn)生人們需要的一些特定語音信息,此外,當(dāng)前非常流行的語音轉(zhuǎn)換功能能夠?qū)崿F(xiàn)語音信息和文本信息之間的良好轉(zhuǎn)換,從而大大方便了人們的生活和工作。還有多媒體的數(shù)據(jù)庫和著作工具等,通過這些多媒體技術(shù),能夠使人們的生活和學(xué)生更加簡單便捷,提高人們的生活質(zhì)量。
2多媒體技術(shù)的應(yīng)用現(xiàn)狀
2.1多媒體數(shù)據(jù)處理技術(shù)的應(yīng)用
對(duì)于計(jì)算機(jī)多媒體技術(shù)來說,其包含的內(nèi)容非常豐富,像文字、圖像和聲音等的處理等,通過多媒體技術(shù)能夠?qū)Ω鞣N數(shù)據(jù)進(jìn)行快速的轉(zhuǎn)換,滿足人們工作學(xué)習(xí)的需要,且多媒體在進(jìn)行信息轉(zhuǎn)換時(shí)能夠大批量的進(jìn)行,從而更好的解決了當(dāng)前存在的存儲(chǔ)器存儲(chǔ)容量問題等。對(duì)于多媒體數(shù)據(jù)處理技術(shù)來說,其涉及的技術(shù)和內(nèi)容非常多,主要包含以下幾種:第一,視頻技術(shù)。視頻技術(shù)主要由兩個(gè)方面組成,分別是視頻的數(shù)字化和視頻的編碼兩種,所謂的視頻數(shù)字化指的是多媒體能夠?qū)⒌玫降哪M視頻信號(hào)經(jīng)過內(nèi)部的轉(zhuǎn)換系統(tǒng),使其變?yōu)槟軌虮挥?jì)算機(jī)讀取和存儲(chǔ)的數(shù)字信號(hào),然后通過計(jì)算機(jī)對(duì)該數(shù)字信號(hào)進(jìn)行其他的一些處理,使其便于存儲(chǔ)和使用。而視頻的編碼技術(shù)則是針對(duì)數(shù)字化的視頻信號(hào)的一種處理手段,其將轉(zhuǎn)換完成的數(shù)字信號(hào)進(jìn)行編碼處理,使其變?yōu)槟軌虮挥?jì)算機(jī)進(jìn)行再處理的視頻信號(hào),像錄制和播放等,根據(jù)其應(yīng)用環(huán)境的不同,可以將其分為不同的編碼技術(shù),比較常見的有電視廣播中的廣播編碼,其能夠?qū)⒁曨l信號(hào)變?yōu)槟軌虮凰杏脩艚邮盏囊曨l信號(hào)。第二,音頻技術(shù)。音頻信號(hào)是人們?nèi)粘I钪凶畛R姷男畔?,其包含的?nèi)容非常豐富,比較常見的音頻技術(shù)主要有以下幾種:音頻的數(shù)字化、語音信息的處理、語音識(shí)別功能以及最后的語音合成功能。音頻技術(shù)的發(fā)展遠(yuǎn)遠(yuǎn)早于視頻技術(shù),因此,目前已經(jīng)具有非常多的音頻產(chǎn)品,并進(jìn)入了量產(chǎn)化。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,音頻技術(shù)在存儲(chǔ)和傳輸方面迎來了一個(gè)新的發(fā)展高潮,為人們?nèi)粘I钪械囊纛l信息傳遞提供了更加簡便的方式。當(dāng)前,人們正在逐漸嘗試實(shí)現(xiàn)語音的識(shí)別,將簡單的語音信息輸入給電腦,使其能夠按照人們的思想進(jìn)行運(yùn)行,這是人類長久以來的美好夢(mèng)想。伴隨著計(jì)算機(jī)技術(shù)的成熟和普及,越來越多的人將計(jì)算機(jī)當(dāng)做日常生活中的一種重要交流工具,因此,如何使不熟悉計(jì)算機(jī)的人能夠正常使用計(jì)算機(jī),正在逐漸成為人們感興趣的話題之一,而語音識(shí)別技術(shù)的出現(xiàn),為人們的夢(mèng)想實(shí)現(xiàn)提供了一種有效的手段。目前,語音識(shí)別技術(shù)正在迅速發(fā)展,但由于這一技術(shù)出現(xiàn)的時(shí)間較短,大部分的研究還在試驗(yàn)階段,出現(xiàn)了非常多的新思想和新算法,為這一技術(shù)的發(fā)展提供了廣闊的空間。另外,語音識(shí)別技術(shù)的研究正處在一個(gè)重要的瓶頸期,世界各國的研究人員正在嘗試將計(jì)算機(jī)的語音識(shí)別功能推廣到所有人都能使用,且對(duì)于一些大量的詞匯或者連續(xù)的語音都能進(jìn)行很好地識(shí)別,實(shí)現(xiàn)人們期望的語音識(shí)別技術(shù)的真正應(yīng)用,提高人們的生活水平和質(zhì)量。目前,對(duì)于一些世界應(yīng)用較多的語言,語音識(shí)別技術(shù)已經(jīng)進(jìn)行了簡單的應(yīng)用,該技術(shù)的使用在許多領(lǐng)域取得了較好的成果。第三,數(shù)據(jù)壓縮技術(shù)。數(shù)據(jù)壓縮技術(shù)主要是通過對(duì)圖像和視頻等信號(hào)的處理,將其進(jìn)行壓縮和存儲(chǔ),這是實(shí)現(xiàn)計(jì)算機(jī)圖像處理的最基礎(chǔ)內(nèi)容,且是當(dāng)前進(jìn)行圖像處理的熱點(diǎn)技術(shù)之一。目前,比較常見的圖像壓縮技術(shù)有兩種,分別是JPEG和MPEG,這是ISO制定的兩個(gè)重要標(biāo)準(zhǔn),大部分的圖像處理都是通過這兩種方式。另外,壓縮技術(shù)還在音頻的處理和視頻的處理上具有重要的應(yīng)用,通過這種處理方式,能夠?qū)⒕哂休^高質(zhì)量的音頻和視頻信息進(jìn)行播放,滿足人們的日常生活需要。
2.2計(jì)算機(jī)多媒體通信技術(shù)的應(yīng)用
人工智能在外語教學(xué)的應(yīng)用
一、引言
人工智能(ArtificialIntelligence,簡稱AI)近年來成為了人們關(guān)注的焦點(diǎn),最初這個(gè)概念是在1956年達(dá)特茅斯會(huì)議上提出,并被正式確立為一門學(xué)科,歷經(jīng)三次高潮三次低谷的發(fā)展。1997年,IBM開發(fā)的人工智能“深藍(lán)”打敗人類的國際象棋冠軍。2016年3月,谷歌開發(fā)的AlphaGo以4:1的明顯優(yōu)勢(shì)戰(zhàn)勝多次榮獲世界冠軍的李世石。自此人工智能在學(xué)術(shù)研究、行業(yè)發(fā)展和資本市場(chǎng)表現(xiàn)活躍。伴隨神經(jīng)網(wǎng)絡(luò)、腦科學(xué)研究的迅速進(jìn)步,人工智能在云計(jì)算和大數(shù)據(jù)等相關(guān)技術(shù)的支持下,迅速被運(yùn)用到各個(gè)領(lǐng)域。以人工智能為核心的新技術(shù)與教學(xué)融合將成為下一個(gè)核心驅(qū)動(dòng)力。在2018年的《人工智能發(fā)展白皮書》[1]中,提到教育智能化將會(huì)成為教育領(lǐng)域的發(fā)展方向,人工智能將會(huì)引發(fā)教育理念和教育生態(tài)的深刻變革。全球主要發(fā)達(dá)國家當(dāng)前都在加速教育教學(xué)創(chuàng)新,積極開發(fā)教育新產(chǎn)品,推進(jìn)教育教學(xué)創(chuàng)新。2018年4月,《高等學(xué)校人工智能創(chuàng)新行動(dòng)計(jì)劃》[2]提出了未來的人才培養(yǎng)新模式,要增設(shè)“人工智能+X”的復(fù)合專業(yè)培養(yǎng),眾高校也相繼成立了人工智能學(xué)院和相關(guān)專業(yè),如南京大學(xué)、中國科學(xué)院大學(xué)、西安電子科技大學(xué)、上海交通大學(xué)等,結(jié)合近幾年教育部“新工科”教育改革的背景,為外語教學(xué)與研究帶來了新的契機(jī)。傳統(tǒng)的外語教學(xué)中一直存在教學(xué)質(zhì)量和效果不理想的困境,我們要充分利用日趨成熟的人工智能技術(shù)開展一場(chǎng)深層次的變革,重塑外語教育的時(shí)代性、個(gè)性化的新形態(tài)。人工智能在神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)和蒙特卡洛數(shù)搜索法等技術(shù)使用后,逐步形成神經(jīng)網(wǎng)絡(luò)“大腦”來進(jìn)行復(fù)雜精準(zhǔn)的數(shù)據(jù)處理,初步有了人類高級(jí)智能的“學(xué)習(xí)能力”。人工智能在教育中所需用到的技術(shù)主要包括[3]:①自然語言理解技術(shù),這讓計(jì)算機(jī)與人之間能用自然語言來有效溝通,包括機(jī)器理解、機(jī)器翻譯等。②人機(jī)交互技術(shù),包括語音識(shí)別、語音合成、情感交互等。③知識(shí)圖譜技術(shù),指建立語義網(wǎng)絡(luò),使用網(wǎng)絡(luò)中的關(guān)系來分析解決問題。④生物特征識(shí)別技術(shù),包括指紋識(shí)別、語音識(shí)別、人臉識(shí)別等。
二、人工智能支持下的外語教學(xué)改革
我國外語教學(xué)的整體效率近年來一直不高,大學(xué)生的英語學(xué)習(xí)效果主要是通過全國大學(xué)生四六級(jí)考試的成績來體現(xiàn),雖然近年來加入了口語考試,但是學(xué)生的英語溝通交流水平總體還是令人擔(dān)憂,應(yīng)用能力遠(yuǎn)沒有達(dá)到熟練實(shí)用水平。大學(xué)英語的發(fā)展方向是要提高質(zhì)量,增強(qiáng)實(shí)效。大學(xué)英語的改革目標(biāo)是要將人文性、實(shí)效性、數(shù)字化與工具性相結(jié)合。隨著00后即將成為大學(xué)校園的主力軍,他們?cè)趯W(xué)習(xí)和認(rèn)知模式、信息技術(shù)運(yùn)用習(xí)慣方面有著鮮明的特色,技術(shù)、閱圖、創(chuàng)新、急切成為了他們的標(biāo)識(shí),被認(rèn)為是“數(shù)字原住民”[4],他們更傾向于用智能化方式去獲取數(shù)字化資源學(xué)習(xí)。但是面對(duì)海量且品種繁多的外語學(xué)習(xí)資源,如何滿足個(gè)性化學(xué)習(xí)需求,提高學(xué)習(xí)效率,重構(gòu)有效適切的外語教學(xué)新模式成為了外語教師們探索科研的新目標(biāo)。目前市場(chǎng)上比較普遍的在線教育大多是一對(duì)一視頻,或者把一些教師的課做成視頻放在線上播放,這其實(shí)只是教學(xué)場(chǎng)所的改變,教育方式并沒有發(fā)生本質(zhì)變化,如果學(xué)生不自覺,效果有時(shí)候還沒有線下的實(shí)體課程好。人工智能則可以使用語音識(shí)別和自然語言處理技術(shù)來解決口語語音和文本的詞法、語法分析和語義理解,增加多元交互的學(xué)習(xí)環(huán)境,極大提升學(xué)習(xí)效果[5]。隨著人工智能研究的日益成熟,“智慧學(xué)習(xí)”和“深度學(xué)習(xí)”被賦予了新的內(nèi)涵,智慧學(xué)習(xí)以建構(gòu)主義、混合學(xué)習(xí)和現(xiàn)代教學(xué)學(xué)習(xí)理論為理論基礎(chǔ),整合增強(qiáng)現(xiàn)實(shí)、云計(jì)算、移動(dòng)通信、大數(shù)據(jù)等先進(jìn)信息技術(shù)的增強(qiáng)型數(shù)字學(xué)習(xí)[6]。深度學(xué)習(xí)可以通過神經(jīng)網(wǎng)絡(luò)來模擬人腦的學(xué)習(xí)過程來抽象表達(dá)現(xiàn)實(shí)世界的大量數(shù)據(jù)。目前典型的深度學(xué)習(xí)模型有遞歸神經(jīng)網(wǎng)絡(luò)(RNN,RecurrentNeuralNetworks)、卷積神經(jīng)網(wǎng)絡(luò)(CNN,ConvolutionalNeuralNetworks)以及深度信念網(wǎng)絡(luò)(DBN,DeepBeliefNet-works)等,其中由于RNN多用于處理時(shí)間序列,所以其較多應(yīng)用在口語訓(xùn)練、口語測(cè)試等方面[7]。近幾年,從市場(chǎng)中已知的人工智能運(yùn)用于外語教育的產(chǎn)品來看,主要分為幾類:英語語音測(cè)評(píng)、智能批改+習(xí)題推薦、教育機(jī)器人、智能陪練,其中前三類較多,而分級(jí)閱讀和智能陪練的較少。比如語音測(cè)評(píng)類的有科大訊飛、流利說、馳聲、朗播網(wǎng)等,智能批改類的有極智批改、批改網(wǎng)、作業(yè)盒子、貍米教育等,教育機(jī)器人類的有寒武紀(jì)智能、UBTECH、LEZHI、好兒優(yōu)等。1.英語語音評(píng)測(cè)———AI口語老師和智能口語考試系統(tǒng)。英語口語學(xué)習(xí)與測(cè)評(píng)是我國英語教育中的重要組成部分。為了測(cè)評(píng)學(xué)習(xí)者的口語語音語調(diào)、標(biāo)準(zhǔn)度、流利度以及口頭表達(dá)能力,通過NLP(自然語言處理)以及語音識(shí)別等技術(shù)開發(fā),外語教學(xué)市場(chǎng)上出現(xiàn)兩類“英語語音評(píng)測(cè)”的產(chǎn)品:AI口語老師和智能口語考試系統(tǒng)。這兩類產(chǎn)品可以替代教師對(duì)學(xué)生的口語陪練、口語考試測(cè)評(píng)及評(píng)分統(tǒng)計(jì)等相關(guān)工作,通過機(jī)器輔助學(xué)習(xí),極大提高了教師的工作效率,同時(shí)實(shí)現(xiàn)了口語自適應(yīng)學(xué)習(xí)。人工測(cè)評(píng)往往伴隨著一些主觀因素,智能評(píng)測(cè)可以有效地避免這類問題,更具客觀性、穩(wěn)定性,高效完成自動(dòng)評(píng)分和成績統(tǒng)計(jì)以及學(xué)情分析任務(wù)。從目前英語語音測(cè)評(píng)產(chǎn)品的現(xiàn)狀來看,優(yōu)點(diǎn)是分析結(jié)果相對(duì)準(zhǔn)確,覆蓋多種口語類型,從發(fā)音到對(duì)話、朗讀涵蓋多種口語學(xué)習(xí)和考試類型,包括音標(biāo)發(fā)音、短文朗讀、看圖說話、口頭作文等。短時(shí)間可以做出反饋,快速給出評(píng)分,同時(shí)給出精細(xì)的分析。當(dāng)然,這類產(chǎn)品也會(huì)有一定不足,受口語發(fā)音本身的不確定性和語音采集的設(shè)備條件等因素的影響,英語語音測(cè)評(píng)結(jié)果會(huì)出現(xiàn)一定的偏差,但總體結(jié)果相對(duì)準(zhǔn)確?,F(xiàn)階段此類產(chǎn)品的測(cè)試結(jié)果是反饋學(xué)生發(fā)音中的單詞讀錯(cuò)、遺漏或者語法有誤等問題,但是無法檢測(cè)出學(xué)習(xí)者的語調(diào)和連讀等錯(cuò)誤。這類產(chǎn)品雖然會(huì)根據(jù)學(xué)生口語情況進(jìn)行個(gè)性化教學(xué)和測(cè)評(píng),但互動(dòng)性仍不足,模式化明顯,長時(shí)間練習(xí)只是幾種方案方式在循環(huán),多樣性和互動(dòng)性還有待提高。以目前市場(chǎng)上較為知名的英語流利說為例,流利說開發(fā)了世界領(lǐng)先的多粒度和多維度的實(shí)時(shí)語音識(shí)別和評(píng)估引擎和游戲化教學(xué),讓各水平語言愛好者輕松練口語。每日更新地道美語對(duì)話提供好玩上癮的對(duì)話闖關(guān)游戲,通過硅谷的實(shí)時(shí)語音分析技術(shù),讓用戶輕松愉快練口語。目前有超過3000萬人使用流利說,積累了中國人2.75億分鐘口語數(shù)據(jù)。2.智能批改+習(xí)題推薦。智能批改如圖1所示,可以部分減輕教師批改作業(yè)的繁重任務(wù)。完整的流程是教師先從線上布置作業(yè),系圖1智能批改圖統(tǒng)地利用豐富的語料庫資源,使用自然語言處理、圖像識(shí)別以及數(shù)據(jù)挖掘等人工智能技術(shù)把學(xué)習(xí)者的作業(yè)與語料庫進(jìn)行檢測(cè)對(duì)比,進(jìn)行自動(dòng)批改,給出個(gè)性化的學(xué)情分析報(bào)告,對(duì)拼寫、語法、句型和搭配方面能夠迅速地標(biāo)注錯(cuò)誤部分和錯(cuò)誤原因,在作業(yè)量巨大的情況下,會(huì)比教師的批改結(jié)果更為細(xì)致,教師和家長能在學(xué)習(xí)者的作業(yè)提交后馬上得到反饋并了解最新的學(xué)習(xí)進(jìn)展,并據(jù)此來實(shí)時(shí)調(diào)整學(xué)習(xí)進(jìn)度和難度并推薦合適的習(xí)題。當(dāng)然,也會(huì)有一些美中不足,如學(xué)生作業(yè)的主題相關(guān)性、篇章結(jié)構(gòu)和內(nèi)在邏輯性、思想的創(chuàng)新性等方面提示還略有欠缺。iWrite2.0英語寫作與評(píng)閱系統(tǒng),通過在大型語料庫中來挖掘聯(lián)想詞庫,運(yùn)用大數(shù)據(jù)技術(shù),同時(shí)探索基于人工神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)來提高作文評(píng)閱的智能程度[8]。科大訊飛開發(fā)的產(chǎn)品在2015年某國家級(jí)英語考試中在翻譯題和作文題的評(píng)分準(zhǔn)確度比大多數(shù)專家教師的評(píng)分準(zhǔn)確度還要高,同時(shí)評(píng)卷系統(tǒng)還指出具體語法格式錯(cuò)誤和措辭不當(dāng)?shù)葐栴}。3.分級(jí)閱讀。英語分級(jí)閱讀,可以根據(jù)學(xué)生的不同認(rèn)知水平來選擇階梯式的讀物,匹配適合學(xué)生個(gè)人的書目,解決了學(xué)生閱讀太難的書會(huì)失去閱讀興趣、閱讀難度低的書無法提升閱讀能力的問題,使其感受閱讀的樂趣。全世界時(shí)下有幾種熱門的閱讀分類體系:藍(lán)思分級(jí)(Lexile)、AR分級(jí)法(AcceleratedReader)、A-Z分級(jí)法(GRL/GuidedReadingLevel)。國內(nèi)目前在分級(jí)閱讀方面的產(chǎn)品主要有:ReadingPro、新東方旗下的多納學(xué)英語、嘰里呱啦、英語總動(dòng)員、巴布閱讀等,各有其產(chǎn)品的優(yōu)勢(shì)和不足。在國外,以美國為例,已有70%的美國公辦學(xué)校使用Newsela,有40萬教師和超過400萬學(xué)生用戶,閱讀文章數(shù)超過5700萬。Newsela通過自適應(yīng)的真實(shí)內(nèi)容分級(jí)閱讀將新聞聚合并分級(jí),為不同閱讀水平的學(xué)生提供閱讀內(nèi)容。人工智能的分級(jí)閱讀相較于傳統(tǒng)分級(jí)閱讀,可更為高效地測(cè)定分析,依據(jù)不同學(xué)生的興趣愛好和閱讀能力的學(xué)習(xí)數(shù)據(jù)挖掘行個(gè)性化精準(zhǔn)閱讀,使學(xué)生閱讀興趣明顯提高,學(xué)生閱讀習(xí)慣大為改進(jìn),大大提高了教師的工作效率,把教師從收集和推薦書目,閱讀監(jiān)督學(xué)生等大量機(jī)械式重復(fù)性工作解放出來,同時(shí)實(shí)現(xiàn)了學(xué)生自適應(yīng)閱讀,達(dá)到了分級(jí)閱讀的核心目的。教師和家長也可快捷精準(zhǔn)地全方位監(jiān)測(cè)分析學(xué)生的學(xué)習(xí)情況。4.智能學(xué)情分析和智能情緒識(shí)別。智能學(xué)情分析是指在積累了學(xué)生學(xué)習(xí)成績、學(xué)習(xí)進(jìn)度、學(xué)習(xí)習(xí)慣等數(shù)據(jù)后,對(duì)其進(jìn)行智能分析,并給出分析報(bào)告,協(xié)助教師對(duì)學(xué)生學(xué)習(xí)情況進(jìn)行管理,設(shè)計(jì)個(gè)性化教學(xué)方案,為學(xué)生量身定制不同于他人的學(xué)習(xí)策略和學(xué)習(xí)方法,讓孩子更為有效地學(xué)習(xí)。做智能學(xué)情分析的如極客大數(shù)據(jù)的“極課EI(EducationIntelligence)”是采用“IPH適應(yīng)性教學(xué)模型”和“集中式動(dòng)態(tài)學(xué)業(yè)檔案管理”兩大專利技術(shù),采集作業(yè)和考試中動(dòng)態(tài)化的海量數(shù)據(jù)并進(jìn)行大數(shù)據(jù)智能算法分析,基于行為和關(guān)系數(shù)據(jù)的知識(shí)圖譜來制定學(xué)生的具體自適應(yīng)學(xué)習(xí)方案[9]。根據(jù)官方數(shù)據(jù),“極客大數(shù)據(jù)”的活躍使用學(xué)校已超過1800所,收集3200萬份學(xué)生作業(yè)考試數(shù)據(jù),180萬教師、學(xué)生及家長的使用習(xí)慣。每個(gè)孩子都是與眾不同的,有自己獨(dú)特的天賦特性、偏好和天生優(yōu)勢(shì),也有不同于別人的弱點(diǎn)。解決孩子的學(xué)習(xí)問題,應(yīng)當(dāng)用個(gè)性化的方法適應(yīng)其在學(xué)習(xí)上的要求。因而這種學(xué)習(xí)活動(dòng)對(duì)于每個(gè)學(xué)生而言都是有意義的,因?yàn)槭怯蓪W(xué)生自發(fā)的興趣來驅(qū)動(dòng)的。智能情緒識(shí)別目前主要由教育培訓(xùn)機(jī)構(gòu)和技術(shù)公司合作開發(fā),如好未來、VIPKID,通過人工智能圖像識(shí)別技術(shù),智能情緒識(shí)別可以識(shí)別學(xué)生課堂表情來判斷學(xué)生學(xué)習(xí)的興趣、困難點(diǎn)和集中度。2018年10月,新東方正式的首款A(yù)I類教育產(chǎn)品BlingABC“AI班主任”[10],可以通過人臉屬性分析和檢測(cè)、語音識(shí)別、NLP(NaturalLanguageProcessing)等人工智能技術(shù)來發(fā)現(xiàn)學(xué)生在語言學(xué)習(xí)中的問題,根據(jù)學(xué)生上課時(shí)的參與度、回答時(shí)長、情緒表現(xiàn)和學(xué)習(xí)結(jié)果來進(jìn)行量化分析。5.教育機(jī)器人。教育機(jī)器人除了在科學(xué)、技術(shù)、工程和數(shù)學(xué)(STEM)教育方面起著重要作用,在外語教學(xué)中的應(yīng)用也越來越普遍。機(jī)器人可以根據(jù)學(xué)生的認(rèn)知能力來為其定制學(xué)習(xí)內(nèi)容,引導(dǎo)互動(dòng)學(xué)習(xí)來營造母語式的外語學(xué)習(xí)環(huán)境,在潛移默化中提高外語語言能力。從早期2016年簡單的聊天學(xué)習(xí)機(jī)器人如著名語言學(xué)習(xí)AppDuolingo(多鄰國)的永久免費(fèi)的外語學(xué)習(xí)chatbox[11],開始只允許用戶打字對(duì)話,到擁有智能復(fù)雜功能的機(jī)器人,如科大訊飛的“阿爾法大蛋”,好未來旗下勵(lì)步英語聯(lián)合機(jī)器人領(lǐng)域領(lǐng)先的ROOBO公司推出的小布機(jī)器人[12],與此配套的Let’sChat系統(tǒng),可以進(jìn)行進(jìn)行語音識(shí)別、口語評(píng)測(cè)、繪本伴讀等功能,能夠智能適配學(xué)生的學(xué)習(xí)水平來進(jìn)行因人施教。通過教育機(jī)器人的輔導(dǎo)和在線教育的講解,可以精準(zhǔn)定位學(xué)生的薄弱知識(shí)點(diǎn)到納米級(jí)別來實(shí)現(xiàn)因材施教的“智適應(yīng)”的理想學(xué)習(xí)方式[13]。借助自然語言處理和情感機(jī)器人,通過陪伴學(xué)生的成長來增加其對(duì)人的關(guān)懷[14]。
三、人工智能在外語教育中的研究熱點(diǎn)方向
查閱各種資料發(fā)現(xiàn),人工智能近幾年在外語教育中的研究熱點(diǎn)方向主要有:①知識(shí)表示與教育知識(shí)圖譜,其研究熱點(diǎn)是以知識(shí)點(diǎn)及課程為中心的圖譜和以教學(xué)及資源為中心的圖譜。②認(rèn)知診斷,其研究熱點(diǎn)是使用大數(shù)據(jù)分析技術(shù)彌補(bǔ)傳統(tǒng)IRT模型的不足。③學(xué)習(xí)者建模,其研究熱點(diǎn)是針對(duì)學(xué)習(xí)主體對(duì)象的學(xué)習(xí)者進(jìn)行建模,對(duì)學(xué)習(xí)者知識(shí)狀態(tài)的識(shí)別和診斷。④教育試題資源表征,其研究熱點(diǎn)是使用深度學(xué)習(xí)模型對(duì)多源異構(gòu)教育資源進(jìn)行深度表征。⑤機(jī)器閱讀理解與批閱,其研究熱點(diǎn)是基于深度學(xué)習(xí)的機(jī)器閱讀理解。⑥智能教育系統(tǒng),其研究熱點(diǎn)是教育機(jī)器人、游戲化教學(xué)、對(duì)話形式的學(xué)習(xí),建立動(dòng)態(tài)模型。⑦腦科學(xué)與教育的結(jié)合,其研究熱點(diǎn)是交叉學(xué)科研究,教師對(duì)“神經(jīng)神話”的認(rèn)知,對(duì)腦科學(xué)的信念,以及教師自身的腦科學(xué)素養(yǎng)。人工智能在外語教育中的運(yùn)用將推動(dòng)外語學(xué)習(xí)的精準(zhǔn)測(cè)評(píng)、個(gè)性教學(xué)和因材施教。配合直播、游戲、VR等技術(shù)的教育人工智能可以極大提高學(xué)生的興趣,提高外語的學(xué)習(xí)效率,有著巨大的應(yīng)用發(fā)展空間。如何融合教育測(cè)量、教育理論與人工智能,分析學(xué)生的學(xué)習(xí)效率、能力和水平及目前的知識(shí)狀態(tài)將成為教師學(xué)習(xí)研究的方向。
熱門標(biāo)簽
相關(guān)文章
1單片機(jī)控制智能語音刷卡系統(tǒng)設(shè)計(jì)探討
4學(xué)生語音校對(duì)項(xiàng)目校企合作分析