數(shù)據(jù)挖掘技術(shù)在計算機(jī)軟件工程的應(yīng)用

時間:2022-03-01 08:43:54

導(dǎo)語:數(shù)據(jù)挖掘技術(shù)在計算機(jī)軟件工程的應(yīng)用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘技術(shù)在計算機(jī)軟件工程的應(yīng)用

摘要:在大數(shù)據(jù)時代背景下,數(shù)據(jù)網(wǎng)絡(luò)時代的到來給人們的日常生活、工作提供了極大的便利,尤其是數(shù)據(jù)挖掘技術(shù),被廣泛地應(yīng)用于計算機(jī)軟件工程領(lǐng)域中,并取得了良好的應(yīng)用效果。為此,現(xiàn)根據(jù)數(shù)據(jù)挖掘技術(shù)概念以及應(yīng)用意義,分析了該技術(shù)在計算機(jī)軟件工程中的應(yīng)用策略。然后,從關(guān)聯(lián)方法、分類方法、聚類方法三個方面入手,研究了比較常用的數(shù)據(jù)挖掘技術(shù)應(yīng)用方法。希望通過這次研究,為相關(guān)人員提供有效的借鑒和參考。

關(guān)鍵詞:計算機(jī)軟件工程;數(shù)據(jù)挖掘技術(shù);應(yīng)用

數(shù)據(jù)挖掘作為一種新概念,主要是指從具有密度較低的海量數(shù)據(jù)中,選出比較價值的信息數(shù)據(jù),使得數(shù)據(jù)利用率得以大幅度提升。因此,通過將數(shù)據(jù)挖掘技術(shù)科學(xué)應(yīng)用于計算機(jī)軟件工程中,可以保證海量數(shù)據(jù)的處理質(zhì)量和效率,從而實現(xiàn)對重要數(shù)據(jù)信息的最大化利用。因此,如何將數(shù)據(jù)挖掘技術(shù)科學(xué)應(yīng)用在計算機(jī)軟件工程中是技術(shù)人員必須思考和解決的問題。

1數(shù)據(jù)挖掘技術(shù)概述

數(shù)據(jù)挖掘技術(shù)作為一種先進(jìn)、新型的信息處理技術(shù),具有強(qiáng)大的功能性優(yōu)勢,被大量行業(yè)廣泛應(yīng)用?,F(xiàn)階段,在計算機(jī)軟件工程領(lǐng)域中,數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用研究內(nèi)容少之又少,大量軟件工程在實際實施中,仍然運(yùn)用傳統(tǒng)的數(shù)據(jù)挖掘技術(shù),導(dǎo)致數(shù)據(jù)處理效率難以得到保證。而數(shù)據(jù)挖掘技術(shù)涉及到大量的功能,不同功能之間往往具有一定的聯(lián)系,可以保證最終評估結(jié)果的真實性和有效性??傊瑢τ跀?shù)據(jù)挖掘技術(shù)而言,該技術(shù)比較明顯的應(yīng)用優(yōu)勢是最大化提高數(shù)據(jù)處理效率,并從根本上解決數(shù)據(jù)丟失問題,為促進(jìn)企業(yè)的健康、可持續(xù)發(fā)展提供重要的技術(shù)支持。

2數(shù)據(jù)挖掘技術(shù)應(yīng)用意義

2.1有利于數(shù)據(jù)信息的正確理解

不同的人,由于知識儲備、社會閱歷存在一定的差異性,導(dǎo)致對不同數(shù)據(jù)信息的理解也存很大的不同。此時,采集和理解數(shù)據(jù)信息需要借助人工模式,那么將增加數(shù)據(jù)信息的采集時間成本和理解時間成本,使得數(shù)據(jù)信息整體處理成本呈現(xiàn)出不斷上升的趨勢。每個人都有自己的主觀意識,因此,在某種程度上會降低數(shù)據(jù)信息處理的權(quán)威性。通過將數(shù)據(jù)挖掘技術(shù)科學(xué)應(yīng)用于計算機(jī)軟件工程中,不僅可以根據(jù)所設(shè)置好的數(shù)據(jù)分析目標(biāo),對數(shù)據(jù)信息進(jìn)行科學(xué)化、規(guī)范化分析和整理,還能全面化整合處理所采集好的數(shù)據(jù)信息,從而形成一種系統(tǒng)、完善的查詢體系,使得數(shù)據(jù)信息的準(zhǔn)確性和權(quán)威性得以大幅度提升,為后期軟件開發(fā)和管理提供極大的便利,確保操作人員能夠準(zhǔn)確、深入地認(rèn)識和理解數(shù)據(jù)信息。

2.2有利于提高數(shù)據(jù)信息的處理質(zhì)量

通過將數(shù)據(jù)挖掘技術(shù)科學(xué)地應(yīng)用于計算機(jī)軟件工程中,可以實現(xiàn)對海量數(shù)據(jù)的大規(guī)模計算,從而保證數(shù)據(jù)信息的最終處理質(zhì)量。數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展和普及下,其數(shù)據(jù)功能變得越來越強(qiáng)大,這樣一來,不僅提高了數(shù)據(jù)計算的效率,還能保證數(shù)據(jù)計算結(jié)果的精確度,便于操作人員在最短時間內(nèi),實現(xiàn)對混亂數(shù)據(jù)的科學(xué)化篩選和處理,使得數(shù)據(jù)信息處理質(zhì)量得以大幅度提升。

2.3有利于提高數(shù)據(jù)信息的利用率

通過利用數(shù)據(jù)挖掘技術(shù),可以實現(xiàn)對無用數(shù)據(jù)或者混亂數(shù)據(jù)的科學(xué)分類以及深入挖掘,從而獲得相應(yīng)的數(shù)據(jù)信息處理結(jié)果。此時,操作人員可以將所獲得的數(shù)據(jù)信息直接應(yīng)用到實際工作中,并針對事件處理需求,選擇出比較合適的數(shù)據(jù)信息,只有這樣,才能實現(xiàn)對數(shù)據(jù)信息利用率的大幅度提升。此外,還要利用數(shù)據(jù)挖掘技術(shù),將抽象、難懂的數(shù)據(jù)信息直接轉(zhuǎn)化為易于理解的信息資料,便于人們更好地理解和利用這些數(shù)據(jù)信息。

3數(shù)據(jù)挖掘技術(shù)在計算機(jī)軟件工程中的應(yīng)用策略

3.1在信息挖掘中的應(yīng)用

在計算機(jī)軟件工程領(lǐng)域中,通過利用數(shù)據(jù)挖掘技術(shù),可以全方位、多角度地管控信息數(shù)據(jù),同時,該工程所涉及到的應(yīng)用范圍比較廣闊,因此,所涉及到的信息類型具有一定的多樣性和復(fù)雜性。而計算機(jī)軟件工程的應(yīng)用可以統(tǒng)一化、集中化管理相關(guān)信息數(shù)據(jù),使得相關(guān)軟件在實際開發(fā)期間,能夠同步更新和處理數(shù)據(jù)資源,從而最大限度地提高軟件開發(fā)質(zhì)量,確保軟件開發(fā)目標(biāo)得以圓滿實現(xiàn)。此外,數(shù)據(jù)挖掘主要包含大量的需要更替數(shù)據(jù),確保技術(shù)人員能夠?qū)浖?nèi)部結(jié)構(gòu)進(jìn)行科學(xué)地分析和準(zhǔn)確區(qū)別,從而充分發(fā)揮和利用數(shù)據(jù)挖掘技術(shù)應(yīng)用優(yōu)勢,便于后期操作人員在最短時間內(nèi)快速分析和處理軟件內(nèi)部問題,確保軟件開發(fā)任務(wù)得以圓滿完成。為了實現(xiàn)對人員組織關(guān)系的深入分析和挖掘,需要根據(jù)軟件開發(fā)需求,重點做好對人力資源的科學(xué)協(xié)調(diào)工作和合理分配工作,同時,嚴(yán)格遵循軟件模塊設(shè)計原則,完成對大型軟件系統(tǒng)的構(gòu)建,通常情況下,參與軟件系統(tǒng)構(gòu)建工作的人員幾乎成千上萬,而參與人員在開展討論會期間,其討論內(nèi)容通常會涉及到文檔傳遞、電子郵件發(fā)送等相關(guān)內(nèi)容,此時,需要做好對組織人員之間關(guān)系的深入分析和挖掘,便于后期小組的科學(xué)劃分以及任務(wù)指派工作的有效落實。另外,軟件組織內(nèi)部所有員工和軟件用戶之間要構(gòu)建一種穩(wěn)定、可靠的關(guān)系網(wǎng)絡(luò),隨著網(wǎng)絡(luò)復(fù)雜度的不斷提高,通過對網(wǎng)絡(luò)內(nèi)部關(guān)系進(jìn)行有效地分析和挖掘,可以確保軟件項目管理工作能夠正常、有序、順利地開展。例如:在對人員組織關(guān)系相關(guān)信息進(jìn)行挖掘期間,需要利用版本控制系統(tǒng),對相關(guān)程序進(jìn)行統(tǒng)一化、有序化修改,并深入地分析和挖掘軟件變更后的歷史信息,同時,根據(jù)不同程序模塊之間的關(guān)系,確定出相應(yīng)的邏輯依賴關(guān)系,該軟件系統(tǒng)內(nèi)部結(jié)構(gòu)可以直觀、有效地反映出開發(fā)組織結(jié)構(gòu),從而得出如圖1所示的開發(fā)組織結(jié)構(gòu)與軟件結(jié)構(gòu)的潛在關(guān)系映射示意圖。圖1開發(fā)組織結(jié)構(gòu)與軟件結(jié)構(gòu)的潛在關(guān)系映射

3.2在軟件執(zhí)行記錄上的應(yīng)用

在數(shù)據(jù)挖掘技術(shù)的應(yīng)用背景下,為了保證軟件執(zhí)行記錄相關(guān)數(shù)據(jù)的深入分析和挖掘效果,需要在全方位分析和處理軟件程序的基礎(chǔ)上,盡可能地優(yōu)化軟件運(yùn)行性能,確保其完全達(dá)到預(yù)期判斷標(biāo)準(zhǔn)。所以,在深入分析和挖掘執(zhí)行記錄期間,需要全面查詢所設(shè)置好的安裝路徑,并采用逆向建模的方式,將數(shù)據(jù)結(jié)構(gòu)分析工作落實到位,便于后期軟件維護(hù)環(huán)節(jié)的有效實施。另外,技術(shù)人員要及時地發(fā)現(xiàn)和處理軟件在實際運(yùn)行期間經(jīng)常出現(xiàn)的軟件漏洞問題,確保軟件運(yùn)行性能得以大幅度提升。此外,還要做好對程序規(guī)約的深入分析和挖掘。程序規(guī)約挖掘主要是指通過對執(zhí)行跟蹤相關(guān)程序進(jìn)行全面地分析,及時發(fā)現(xiàn)和處理程序代碼所對應(yīng)的協(xié)議。此外,還要在保證跟蹤信息執(zhí)行結(jié)果精確度的基礎(chǔ)上,采用逆向建模的方式,對相關(guān)程序進(jìn)行全方位地分析、驗證和維護(hù)。該類挖掘流程如下:采用初步桶裝的方式,對相關(guān)系統(tǒng)進(jìn)行全面地分析,然后,全面地收集和整理軟件所對應(yīng)的API接口,同時,全面地過濾和處理跟蹤信息,從而形成相應(yīng)的規(guī)約模型,該模型可以實現(xiàn)對相關(guān)系統(tǒng)功能的有效表征處理。程序規(guī)約挖掘的基本過程如圖2所示。

3.3在軟件漏洞檢測中的應(yīng)用

在計算機(jī)軟件工程領(lǐng)域中,軟件漏洞檢測作為一項重要工作,除了可以有效地提高軟件開發(fā)效率外,還能確保整個系統(tǒng)能夠可靠、穩(wěn)定、安全地運(yùn)行,為后期及時、有效地發(fā)現(xiàn)和處理安全隱患問題打下堅實的基礎(chǔ)。通過對軟件漏洞進(jìn)行全面化修復(fù),可以為用戶提供更加優(yōu)質(zhì)的保障。在數(shù)據(jù)挖掘技術(shù)的應(yīng)用背景下,軟件漏洞檢測工作在實際開展中,首先,要根據(jù)軟件內(nèi)部的測試內(nèi)容,對其進(jìn)行有針對性地分析和測試;此外,還要全方位測試軟件漏洞相關(guān)的項目內(nèi)容,從而更好地滿足軟件開發(fā)相關(guān)標(biāo)準(zhǔn)和要求。數(shù)據(jù)挖掘技術(shù)在實際應(yīng)用期間,要根據(jù)所記錄的內(nèi)容,對相關(guān)數(shù)據(jù)進(jìn)行全面地分析,并對最終的分析結(jié)果進(jìn)行全面地分析和改進(jìn),接著,選出合適的測試模式,將測試工作落實到位,從而實現(xiàn)對測試模式的科學(xué)選擇,以滿足軟件工程實際的開展需求。此外,在對漏洞數(shù)據(jù)進(jìn)行處理期間,要借助數(shù)據(jù)挖掘技術(shù),對冗余數(shù)據(jù)分析和提取,從而篩選出有價值的數(shù)據(jù),并不斷地完善和補(bǔ)充稀缺數(shù)據(jù)內(nèi)容,并采用數(shù)據(jù)的方式,將所補(bǔ)充數(shù)據(jù)內(nèi)容形象、直觀地呈現(xiàn)在用戶面前。此外,為了確保數(shù)據(jù)挖掘技術(shù)科學(xué)、合理地應(yīng)用于計算機(jī)軟件工程中,還要選用合適的數(shù)據(jù)模型,將驗證工作落實到位,并采用合適的數(shù)據(jù)挖掘模式,完成對測試集的科學(xué)測量和處理。軟件漏洞問題在實際檢測期間,要做好對軟件漏洞的科學(xué)化、規(guī)范化分類,并對數(shù)據(jù)庫中相關(guān)漏洞數(shù)據(jù)進(jìn)行科學(xué)地更新和優(yōu)化。軟件漏洞檢測流程如圖3所示。

4數(shù)據(jù)挖掘技術(shù)應(yīng)用方法

4.1關(guān)聯(lián)方法

關(guān)聯(lián)法,顧名思義,就是指對兩個不同事物內(nèi)部的聯(lián)系程度進(jìn)行有效研究的一種常用方法。在數(shù)據(jù)挖掘技術(shù)的應(yīng)用背景下,通過利用關(guān)聯(lián)方法,可以實現(xiàn)對相關(guān)數(shù)據(jù)信息的高效化處理和采集。同時,在使用關(guān)聯(lián)法期間,技術(shù)人員要嚴(yán)格遵循有趣關(guān)聯(lián)原則,將數(shù)據(jù)挖掘技術(shù)與計算機(jī)軟件工程進(jìn)行充分結(jié)合,兩者之間的關(guān)系屬性主要包含以下兩種,一種是支持度,另一種是置信度。在實際操作期間,還要結(jié)合支持度這一屬性,精確地表示出事務(wù)集。

4.2分類方法

分類方法在具體的運(yùn)用中,要借助分類標(biāo)號,對相關(guān)執(zhí)行動作進(jìn)行科學(xué)地分析和預(yù)測。同時,還要在構(gòu)建相關(guān)分析模型的基礎(chǔ)上,根據(jù)分類法的特點,構(gòu)建出與之相匹配的分析模型。此外,分析模型在實際構(gòu)建期間,要盡可能凸顯出自身的應(yīng)用價值,為此,技術(shù)人員要重視對相關(guān)數(shù)據(jù)類集的引用?,F(xiàn)階段,在處理軟件工程分類法期間,要選用合適的判斷樹法,判斷樹法主要包含神經(jīng)網(wǎng)絡(luò)分類法和最臨近分類法。最后,在使用分類法期間,技術(shù)人員要在全面了解和分析分類法類型的基礎(chǔ)上,選用合適的計算方法,確定出與之相匹配的適用范圍,然后,盡可能使用最低成本,保證最終處理效果。

4.3聚類方法

聚類方法在實際使用期間,要嚴(yán)格按照所設(shè)置好的劃分標(biāo)準(zhǔn),對研究工作相關(guān)數(shù)據(jù)對象進(jìn)行分類操作,使其被劃分為不同的類型。同時,還要盡可能保證同類數(shù)據(jù)對象與同簇數(shù)據(jù)對象之間的相識度。反之,不同類之間的數(shù)據(jù)在實際處理期間,并不會出現(xiàn)比較明顯的差異。另外,還要采用聚類法,對數(shù)據(jù)對象進(jìn)行科學(xué)劃分,確保聚類法能夠科學(xué)、有效地應(yīng)用于數(shù)據(jù)信息的處理領(lǐng)域中,從而提高聚類法的運(yùn)用效果。

5結(jié)束語

綜上所述,在數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展和普及下,為了促進(jìn)計算機(jī)軟件工程的健康、可持續(xù)發(fā)展,技術(shù)人員要樹立與時俱進(jìn)的觀念,根據(jù)未來軟件工程的發(fā)展需求,將數(shù)據(jù)挖掘技術(shù)與軟件管理進(jìn)行充分結(jié)合,確保該技術(shù)能夠更好地應(yīng)用于計算機(jī)軟件工程中,確保軟件產(chǎn)品能夠及時、有效地升級和優(yōu)化,從而為用戶、企業(yè)提供更加優(yōu)質(zhì)的服務(wù),進(jìn)而最大限度地體現(xiàn)科技發(fā)展水平。

參考文獻(xiàn):

[1]劉知云.關(guān)于數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析[J].電腦知識與技術(shù),2021(24):27-28.

[2]張良,杜崗.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].數(shù)碼設(shè)計(下),2020(2):19-20.

[3]李楨.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].通訊世界,2017(12):47-48.

[4]張欲豐,儲小勤.探析數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].信息記錄材料,2020(03):189-190.

[5]王鵬,胥司祿,陳夢杰,等.關(guān)于數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析[J].電腦知識與技術(shù),2020(25):207-208.

[6]張立鑒.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2019(06):47-48.

[7]栗元龍.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用探討[J].數(shù)字通信世界,2019(09):181.

作者:孫輝 單位:濰坊科技學(xué)院