計(jì)算機(jī)語(yǔ)言學(xué)關(guān)鍵問(wèn)題研究

時(shí)間:2022-01-28 08:21:42

導(dǎo)語(yǔ):計(jì)算機(jī)語(yǔ)言學(xué)關(guān)鍵問(wèn)題研究一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

計(jì)算機(jī)語(yǔ)言學(xué)關(guān)鍵問(wèn)題研究

摘要:近幾年,隨著產(chǎn)業(yè)界人工智能領(lǐng)域應(yīng)用服務(wù)不斷落地,學(xué)術(shù)界對(duì)于AI分支科學(xué)的研究也愈加深入。NLP,即自然語(yǔ)言處理,在信息時(shí)代向智能時(shí)代的過(guò)渡中發(fā)揮著極其重要的作用。由此衍生出的一門(mén)高度交叉的新興學(xué)科,計(jì)算機(jī)語(yǔ)言學(xué),也正在進(jìn)行著突飛猛進(jìn)的發(fā)展。自然語(yǔ)言處理是計(jì)算機(jī)翻譯的過(guò)程,涉及數(shù)據(jù)挖掘、知識(shí)圖譜、機(jī)器學(xué)習(xí)及與語(yǔ)言計(jì)算相關(guān)的語(yǔ)言學(xué)等研究。中文自然語(yǔ)言處理是以轉(zhuǎn)換自然語(yǔ)言為基本原則,遵循基于規(guī)則、基于統(tǒng)計(jì)等研究思路,并且適當(dāng)添加一些可靠的實(shí)例來(lái)完成翻譯過(guò)程。本文我們將圍繞計(jì)算機(jī)在處理中文自然語(yǔ)言方面的問(wèn)題來(lái)展開(kāi)分析,通過(guò)詳細(xì)的分析了解一下中文自然語(yǔ)言處理的基本概念,再來(lái)研究一下中文自然語(yǔ)言處理的關(guān)鍵問(wèn)題與步驟。

關(guān)鍵詞:自然語(yǔ)言處理;自動(dòng)分詞;機(jī)器學(xué)習(xí);語(yǔ)言學(xué)

一、針對(duì)于中文自然語(yǔ)言處理含義的分析

語(yǔ)言是人傳遞信息的關(guān)鍵因素,其本身的復(fù)雜性與語(yǔ)言描述外部世界的復(fù)雜性,表明機(jī)器理解語(yǔ)言是一個(gè)艱難的過(guò)程。所以說(shuō)要采取有效手段促使消除語(yǔ)言和交流障礙的信息化,從而通過(guò)算法和數(shù)據(jù)模型處理來(lái)達(dá)到自然語(yǔ)言處理的目的。所謂自然語(yǔ)言處理,包括詞法分析、語(yǔ)法分析、語(yǔ)義分析、篇章理解,通過(guò)自然語(yǔ)言處理能夠更好的研究和實(shí)現(xiàn)人和計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效通信的手段。自然語(yǔ)言處理和語(yǔ)言學(xué)的分析研究有著深遠(yuǎn)的聯(lián)系,但是也同樣有著一定的區(qū)別。對(duì)自然語(yǔ)言處理的研究不是單一的研究自然語(yǔ)言,而是在研究自然語(yǔ)言的基礎(chǔ)上來(lái)研究和實(shí)現(xiàn)自然語(yǔ)言通信的計(jì)算機(jī)系統(tǒng)。通過(guò)大規(guī)模的數(shù)據(jù)訓(xùn)練機(jī)器,使機(jī)器掌握自然語(yǔ)言間的規(guī)則,進(jìn)行準(zhǔn)確的處理與翻譯。自然語(yǔ)言處理問(wèn)題主要包括了對(duì)計(jì)算機(jī)和人類思維的學(xué)習(xí),但是翻譯工作是一項(xiàng)比較復(fù)雜的過(guò)程,同時(shí)也是一種從簡(jiǎn)單智能到相對(duì)信息化問(wèn)題的過(guò)程,在處理中存在對(duì)各種特殊的常識(shí)處理存在匱乏的因素,也就導(dǎo)致出現(xiàn)一些語(yǔ)境分析不透徹的情況發(fā)生,進(jìn)一步也將會(huì)影響相應(yīng)的處理結(jié)構(gòu)[1]。

二、針對(duì)于中文自然語(yǔ)言處理與計(jì)算機(jī)結(jié)合的分析

中文自然語(yǔ)言處理就是對(duì)漢語(yǔ)中的漢字等自然語(yǔ)言處理翻譯的過(guò)程,當(dāng)前我國(guó)相關(guān)研究人員對(duì)自然語(yǔ)言處理信息化的研究力度還不夠深入。這是由于中文自然語(yǔ)言處理,相比于英語(yǔ)等有天然分隔符的語(yǔ)言,難度更大。例如,界定單詞邊界的詞法分析任務(wù),也被稱為“中文自動(dòng)分詞”的任務(wù),是中文語(yǔ)言處理的首要步驟。其中,新詞發(fā)現(xiàn)、歧義切分等關(guān)鍵問(wèn)題又是基于對(duì)語(yǔ)言的理解之上的。下面我們?cè)賮?lái)詳細(xì)了解一下中文自然語(yǔ)言處理技術(shù)發(fā)展的基本現(xiàn)狀,首先我們根據(jù)以GATE為基礎(chǔ)的自然語(yǔ)言處理技術(shù)來(lái)展開(kāi)分析。由于以GATE為基礎(chǔ)的自然語(yǔ)言處理技術(shù)是語(yǔ)言工程學(xué)軟件體系結(jié)構(gòu)的基礎(chǔ),從而一些關(guān)于工程學(xué)的語(yǔ)言行為就都是能夠?qū)I(yè)化進(jìn)行衡量的。在經(jīng)過(guò)自然語(yǔ)言處理以及人工交互的處理以后,能夠更加全面的構(gòu)成相應(yīng)的軟件和應(yīng)用,最終再通過(guò)計(jì)算機(jī)語(yǔ)言學(xué)中的各種工具和計(jì)算機(jī)科學(xué)專業(yè)的可預(yù)測(cè)性來(lái)完成進(jìn)一步的設(shè)施組織[2]。

三、針對(duì)于中文自然語(yǔ)言處理關(guān)鍵問(wèn)題的分析

中文自然語(yǔ)言處理主要體現(xiàn)在中文自然語(yǔ)言信息主題知識(shí)獲取瓶頸處理上,因?yàn)橹形淖匀徽Z(yǔ)言處理的領(lǐng)域以及時(shí)間的處理、對(duì)機(jī)器翻譯的知識(shí)性等都應(yīng)當(dāng)進(jìn)一步結(jié)合這種模式的深度和難度,最后完成中文自然語(yǔ)言處理的傳統(tǒng)信息知識(shí)處理。需要注意的是應(yīng)當(dāng)根據(jù)語(yǔ)義網(wǎng)來(lái)更加直觀的分析系統(tǒng)規(guī)劃的各個(gè)流程,然后依據(jù)適應(yīng)性來(lái)適當(dāng)增加對(duì)中文自然語(yǔ)言有關(guān)知識(shí)的系統(tǒng)支持和關(guān)注。相關(guān)人員對(duì)中文自然語(yǔ)言信息統(tǒng)計(jì)機(jī)器翻譯模型順利的開(kāi)展和完成統(tǒng)計(jì)工作,能夠有效的對(duì)中文自然語(yǔ)言處理的相關(guān)手段提供更多的關(guān)注,根據(jù)當(dāng)前的翻譯系統(tǒng)來(lái)選擇一種比較相近的編碼過(guò)程,進(jìn)而專業(yè)的推出解碼的主要法則。中文自然語(yǔ)言信息統(tǒng)計(jì)要合理的從處理技術(shù)的應(yīng)用中體現(xiàn)出來(lái),在信息理論模型當(dāng)中完成噪聲處理復(fù)雜問(wèn)題。除此之外,在面對(duì)中文自然語(yǔ)言信息處理其他一些問(wèn)題時(shí),一般情況下都是通過(guò)采用中文自然語(yǔ)言信息聚類處理來(lái)完成的,在當(dāng)前現(xiàn)有層次的算法的基礎(chǔ)上合理的來(lái)對(duì)平面分割算法等手段進(jìn)行利用,最后通過(guò)有效的結(jié)合算法性能共同完成分析過(guò)程[3]。

四、總結(jié)

通過(guò)上述問(wèn)題的分析,我們已經(jīng)意識(shí)到中文自然語(yǔ)言處理和計(jì)算機(jī)結(jié)合的重要性和必要性。隨著人工智能相關(guān)技術(shù)的不斷發(fā)展,中文自然語(yǔ)言處理和計(jì)算機(jī)的結(jié)合問(wèn)題也將會(huì)面臨大量的知識(shí)成本,這就要求從中文自然語(yǔ)言的處理、發(fā)展歷程以及傳統(tǒng)處理手段等來(lái)進(jìn)一步對(duì)建模的核心問(wèn)題完成相應(yīng)的處理。針對(duì)于不同類型的限制條件和因素最大限度的達(dá)到最優(yōu)的處理效果,并且管理人員和工作人員還可以通過(guò)相應(yīng)的實(shí)驗(yàn)來(lái)進(jìn)行中文自然語(yǔ)言信息的處理,最終實(shí)現(xiàn)更精準(zhǔn)的效果和目的,更好的推動(dòng)中文自然語(yǔ)言處理與計(jì)算機(jī)的結(jié)合。

參考文獻(xiàn)

[1]自然語(yǔ)言處理與中文計(jì)算會(huì)議征文通知[J].計(jì)算機(jī)應(yīng)用研究,2013(2):12-13.

[2]第五屆國(guó)際自然語(yǔ)言處理與中文計(jì)算會(huì)議暨第24屆國(guó)際東方語(yǔ)言計(jì)算機(jī)處理會(huì)議(NLPCC-ICCPOL2016)[J].計(jì)算機(jī)工程與設(shè)計(jì),2016(11):111-113.

[3]劉源等著.信息處理用現(xiàn)代漢語(yǔ)分詞規(guī)范及自動(dòng)分詞方法[M].桂林:廣西科學(xué)技術(shù)出版社,1994.

作者:龐宇 單位:北方工業(yè)大學(xué)計(jì)算機(jī)學(xué)院