高校數(shù)據(jù)科學與大數(shù)據(jù)技術研究
時間:2022-09-06 11:30:51
導語:高校數(shù)據(jù)科學與大數(shù)據(jù)技術研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)是因互聯(lián)網(wǎng)技術的快速發(fā)展而產(chǎn)生的新專業(yè),該專業(yè)以數(shù)學、統(tǒng)計學和計算機科學為三大主要支撐學科。該文首先討論了數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的人才培養(yǎng)目標,從5個方面討論了人才培養(yǎng)目標,然后以大數(shù)據(jù)工程師、數(shù)據(jù)分析師、數(shù)據(jù)挖掘工程師和大數(shù)據(jù)開發(fā)工程師為例,研究了該專業(yè)的崗位任職要求。根據(jù)該專業(yè)的人才培養(yǎng)目標,結合該專業(yè)的崗位任職要求,該文以湖北工程學院為例,從專業(yè)基礎課、專業(yè)主干課、專業(yè)選修課和專業(yè)實踐課這四個方面探討了該專業(yè)的課程設置,以期為相關院校該專業(yè)人才培養(yǎng)方案的制訂和課程設置提供一定的參考。
關鍵詞:數(shù)據(jù)科學與大數(shù)據(jù)技術;課程設置;地方高校
隨著互聯(lián)網(wǎng)技術的不斷發(fā)展,社會媒體以及各種經(jīng)濟和社會活動產(chǎn)生了海量的數(shù)據(jù),數(shù)據(jù)的類型呈現(xiàn)多樣化的形態(tài),既包括結構化數(shù)據(jù),也包括非結構化數(shù)據(jù),如音頻、圖像和視頻等。對這些數(shù)據(jù)進行充分利用,不僅需要數(shù)據(jù)科學理論上的發(fā)展,還需要大量掌握數(shù)據(jù)科學技術的專業(yè)人才。自2016年2月教育部批準北京大學、對外經(jīng)濟貿易大學和中南大學等高校開設數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)起,許多高校紛紛設立數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)。截至目前,我國共有500多所高校獲批設立該專業(yè)。從眾多高校開設的情況來看,數(shù)據(jù)科學和大數(shù)據(jù)技術專業(yè)的設立主要分布在計算機學院、數(shù)學與統(tǒng)計學院、商學院和信息學院,也有的學校開設在理學院。數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)以傳統(tǒng)的數(shù)學、統(tǒng)計學和計算機科學為三大支撐學科,并且涉及多學科的特定知識,也出現(xiàn)了許多處理大數(shù)據(jù)的技術和平臺。由于數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)開設時間較短,很多高校還處在摸索階段,沒有太多可借鑒的經(jīng)驗。如果只是修改數(shù)學專業(yè)、統(tǒng)計學專業(yè)和計算機專業(yè)的培養(yǎng)方案,不從具體實施方面著手操作,很難培養(yǎng)出符合國家和地方經(jīng)濟發(fā)展、符合市場需求的專業(yè)人才。一些作者對此進行了有益的探索,2018年朝樂門等[1]研究了數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的特色課程,2019年孫書韜等[2]分析了北美知名大學數(shù)據(jù)科學專業(yè)課程體系,文獻[3][4][5]探討了計算機學院和信息學院數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的課程體系,文獻[6]分析了大數(shù)據(jù)專業(yè)課程體系設計中存在的主要問題,提出了“軟”“硬”兩套課程體系路線。湖北工程學院是第三批成功申請數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的學校之一,該專業(yè)由湖北工程學院數(shù)學與統(tǒng)計學院負責申報,開設在數(shù)學與統(tǒng)計學院。經(jīng)過這兩三年的探索和實踐,對該專業(yè)已積累了一定的經(jīng)驗。下面就以湖北工程學院為例,從該專業(yè)人才培養(yǎng)目標、專業(yè)的崗位情況、專業(yè)基礎課、專業(yè)主干課、專業(yè)選修課和專業(yè)實踐課這幾方面進行闡述與分享。
1數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的人才培養(yǎng)目標
本專業(yè)培養(yǎng)德智體美勞全面發(fā)展,適應環(huán)境變化和社會發(fā)展的需要,具有良好的政治素質與道德修養(yǎng),掌握專業(yè)相關的學科基礎知識與基本技能,具備從事大數(shù)據(jù)系統(tǒng)的分析、設計、實現(xiàn)、運行和維護能力的高素質應用型高級工程技術人才,能夠在智慧城市建設和大數(shù)據(jù)相關領域內進行數(shù)據(jù)挖掘、大數(shù)據(jù)分析、大數(shù)據(jù)開發(fā)和數(shù)據(jù)可視化等工作。本專業(yè)學生畢業(yè)3~5年后應達到如下預期目標:培養(yǎng)目標1:掌握數(shù)學知識、自然科學知識、工程基礎知識和數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)相關知識。培養(yǎng)目標2:具備較強的大數(shù)據(jù)工程項目的設計、開發(fā)、應用及大數(shù)據(jù)運維部署等實踐應用能力。培養(yǎng)目標3:具有良好的團隊合作、溝通交流和項目管理能力,能夠作為團隊成員或領導團隊完成項目的實施,具備創(chuàng)新精神和創(chuàng)業(yè)能力。培養(yǎng)目標4:能跟蹤學習數(shù)據(jù)科學領域新技術,具有較強的終身學習能力和可持續(xù)發(fā)展能力。培養(yǎng)目標5:能適應環(huán)境變化和社會發(fā)展的需要,具有國際視野,把握時代特征與社會需求,具備良好的個人素質、職業(yè)道德、人文素養(yǎng)、專業(yè)素養(yǎng)和社會責任感。
2數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的崗位情況
我們從互聯(lián)網(wǎng)招聘網(wǎng)站上發(fā)布的信息研究該專業(yè)的崗位情況和崗位要求得知,該專業(yè)主要有以下就業(yè)崗位:大數(shù)據(jù)工程師、數(shù)據(jù)分析師、數(shù)據(jù)挖掘工程師、大數(shù)據(jù)開發(fā)工程師、算法工程師、數(shù)據(jù)運營、數(shù)據(jù)科學家和大數(shù)據(jù)運維工程師。下面以大數(shù)據(jù)工程師、數(shù)據(jù)分析師、數(shù)據(jù)挖掘工程師和大數(shù)據(jù)開發(fā)工程師為例,闡述這些崗位的任職要求。
2.1大數(shù)據(jù)工程師
任職要求:具有1年以上大數(shù)據(jù)相關工作經(jīng)驗;精通至少一種編程語言,如Java、Scala、Python;熟悉Hadoop、Hive、Hbase、Zookeeper、Hue等中的多個,或者有相關工作經(jīng)驗者優(yōu)先;熟悉Sparkstream?ing、Storm、Flink、Redis、Es中的多個,或者有相關工作經(jīng)驗者優(yōu)先;熟悉Sparkmllib/GraphX、圖計算、Mahout中的多個,或者有相關工作經(jīng)驗者優(yōu)先;具備數(shù)據(jù)挖掘、數(shù)據(jù)分析、機器學習知識背景,擁有反欺詐系統(tǒng)、推薦系統(tǒng)、精準營銷、信息檢索等方面的工作經(jīng)驗者優(yōu)先。
2.2數(shù)據(jù)分析師
任職要求:對數(shù)據(jù)敏感,有較強的數(shù)據(jù)分析邏輯,熟練掌握SQL、SPSS等數(shù)據(jù)分析工具,熟練使用PPT、office、Excel等辦公軟件;有2年相關數(shù)據(jù)分析工作經(jīng)驗,具備處理和分析較大量級數(shù)據(jù)的能力;能夠對平臺各類數(shù)據(jù)、網(wǎng)站流量數(shù)據(jù)、用戶數(shù)據(jù)等各類數(shù)據(jù)進行統(tǒng)計分析;熟悉數(shù)據(jù)分析和數(shù)據(jù)挖掘理論知識、網(wǎng)絡知識和互聯(lián)網(wǎng)應用技術知識,了解金融平臺數(shù)據(jù)分析統(tǒng)計,了解互聯(lián)網(wǎng)營銷;具備較強的數(shù)據(jù)報表、數(shù)據(jù)報告制作能力;有用戶相關分析經(jīng)驗及建模經(jīng)驗者優(yōu)先。
2.3數(shù)據(jù)挖掘工程師
任職要求:具有計算機、統(tǒng)計學、數(shù)學相關專業(yè)背景,具備數(shù)據(jù)挖掘理論、數(shù)據(jù)庫和機器學習基礎;掌握如關聯(lián)規(guī)則、分類算法和聚類算法等常用的機器學習算法;掌握Python、C、C++、Java等編程語言中至少一門編程語言;理解掌握數(shù)據(jù)庫原理,熟練使用Sql,能夠熟練使用Hadoop系列工具;有較強的數(shù)據(jù)思維、邏輯思維和結構化思維,具有獨立的分析問題和解決問題的能力;具有推薦系統(tǒng)和用戶畫像建模工作經(jīng)驗者優(yōu)先考慮。
2.4大數(shù)據(jù)開發(fā)工程師
任職要求:兩年以上大數(shù)據(jù)研發(fā)、挖掘、分析相關工作經(jīng)驗;精通Java、Python、SQL等數(shù)據(jù)處理語言;對數(shù)據(jù)敏感,對數(shù)據(jù)相關工作有濃厚興趣;有Hadoop、Hive、Hbase、Presto等實際使用經(jīng)驗者優(yōu)先考慮;工作認真、仔細,積極主動,有較好的邏輯思維能力;有數(shù)據(jù)倉庫設計開發(fā)經(jīng)驗者優(yōu)先考慮;了解數(shù)理統(tǒng)計、數(shù)據(jù)分析及挖掘,熟知常用算法,有運用機器學習算法建模的理論基礎或實際經(jīng)驗者優(yōu)先考慮。從以上該專業(yè)的就業(yè)崗位的任職要求可以看出,對于數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的學生來說,要想真正成為一個高素質、復合型的大數(shù)據(jù)人才,需要具備以下能力:(1)編程能力。掌握至少一門編程語言,如Py?thon、C和Java等。(2)熟練掌握Hadoop和Spark大數(shù)據(jù)生態(tài)圈及相關組件,熟悉Linux系統(tǒng)。教改教法88(3)具備數(shù)據(jù)存儲能力,熟練掌握數(shù)據(jù)庫Sql及其他類型數(shù)據(jù)庫。(4)熟練使用PPT、Office、Excel等辦公軟件,熟練使用SPSS和R等統(tǒng)計軟件。(5)一般該專業(yè)的工作崗位需要1年以上的工作經(jīng)驗。此外,不同的崗位有不同的需求,如大數(shù)據(jù)工程師、算法工程師和數(shù)據(jù)科學家需要掌握數(shù)據(jù)挖掘理論知識以及常見的機器學習算法。而大數(shù)據(jù)運維工程師需要精通Hadoop大數(shù)據(jù)生態(tài)圈,并有實際部署維護經(jīng)驗。數(shù)據(jù)運營和數(shù)據(jù)分析師需要了解特定領域的知識,才能知道數(shù)據(jù)背后的含義,從而更好地分析和解決該領域的實際問題。從該專業(yè)以上就業(yè)崗位的任職要求可以看出,數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)課程開設涉及數(shù)學類、統(tǒng)計類、計算機類、數(shù)據(jù)科學類、大數(shù)據(jù)技術類相關課程和領域方向類課程。由于湖北工程學院數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)開設在數(shù)學與統(tǒng)計學院,數(shù)學與統(tǒng)計學師資較強,結合人才畢業(yè)要求,開設專業(yè)基礎課、專業(yè)主干課、專業(yè)選修課偏向于數(shù)學類、統(tǒng)計類和數(shù)據(jù)科學類相關課程。
3數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的專業(yè)基礎課的設置
數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的專業(yè)基礎課有高等數(shù)學、線性代數(shù)、概率論、數(shù)理統(tǒng)計、離散數(shù)學、C語言程序設計、Linux操作系統(tǒng)基礎、統(tǒng)計學、大數(shù)據(jù)導論。高等數(shù)學、線性代數(shù)、概率論、數(shù)理統(tǒng)計和統(tǒng)計學課時較為充足,突出基礎性學科的重要性。在這些課程中,數(shù)學類課程有高等數(shù)學、線性代數(shù)和離散數(shù)學;統(tǒng)計類相關課程有概率論、數(shù)理統(tǒng)計和統(tǒng)計學;計算機類相關課程有C語言程序設計、Linux操作系統(tǒng)基礎。大數(shù)據(jù)導論開設為通識課,主要是讓學生知道數(shù)據(jù)科學和大數(shù)據(jù)技術專業(yè)所涉及的各種專業(yè)技術以及該專業(yè)的應用領域。
4數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的專業(yè)主干課的設置
數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的專業(yè)主干課有數(shù)據(jù)結構與算法(C語言)、數(shù)據(jù)庫原理及其應用技術、機器學習、應用回歸分析、Python語言程序設計、數(shù)據(jù)采集與網(wǎng)絡爬蟲、數(shù)據(jù)可視化。在這些課程中,統(tǒng)計類相關課程有應用回歸分析;計算機類相關課程有數(shù)據(jù)結構與算法(C語言)、數(shù)據(jù)庫原理及其應用技術和Python語言程序設計;數(shù)據(jù)科學類相關課程有機器學習、數(shù)據(jù)采集與網(wǎng)絡爬蟲和數(shù)據(jù)可視化。
5數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的專業(yè)選修課的設置
數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的專業(yè)選修課有數(shù)學實驗與數(shù)學模型、數(shù)據(jù)挖掘與分析、應用多元統(tǒng)計分析、應用時間序列分析、推薦系統(tǒng)、數(shù)值分析、計算機網(wǎng)絡、深度學習、文本挖掘、大規(guī)模分布式系統(tǒng)、大數(shù)據(jù)處理技術及其應用、數(shù)據(jù)清洗、算法分析與設計、Java語言程序設計、數(shù)字圖像處理、行業(yè)大數(shù)據(jù)案例分析、應用隨機過程、最優(yōu)化理論。在這些課程中,數(shù)學類課程有數(shù)學實驗與數(shù)學模型、數(shù)值分析、最優(yōu)化理論;統(tǒng)計類相關課程有應用多元統(tǒng)計分析、應用時間序列分析、應用隨機過程;計算機類相關課程有計算機網(wǎng)絡、算法分析與設計、Java語言程序設計;數(shù)據(jù)科學類相關課程有數(shù)據(jù)挖掘與分析、推薦系統(tǒng)、數(shù)字圖像處理、深度學習、文本挖掘、數(shù)據(jù)清洗;大數(shù)據(jù)技術類相關課程有大規(guī)模分布式系統(tǒng)、大數(shù)據(jù)處理技術及其應用,這兩門課涉及Hadoop大數(shù)據(jù)生態(tài)圈和Spark大數(shù)據(jù)分析技術。領域方向類課程有行業(yè)大數(shù)據(jù)案例分析,這門課程涉及某一領域的知識及相應的大數(shù)據(jù)分析案例實現(xiàn)。湖北工程學院數(shù)學與統(tǒng)計學院的師資力量主要集中在數(shù)學、統(tǒng)計學和數(shù)據(jù)科學方向。在學生選修課程時,我們會推薦選修與大數(shù)據(jù)工程師、數(shù)據(jù)分析師、數(shù)據(jù)挖掘工程師、數(shù)據(jù)運營等崗位相關的課程,對于有進一步深造意愿的學生,可以選擇與算法工程師和數(shù)據(jù)科學家崗位相關的選修課程。而對于以后想從事大數(shù)據(jù)工程師、大數(shù)據(jù)開發(fā)工程師和大數(shù)據(jù)運維工程師崗位的學生,要重點學習大數(shù)據(jù)技術類相關課程和編程語言課程。
6數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的專業(yè)實踐課的設置
從數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)崗位情況的任職要求可以看出,一些企業(yè)和公司對求職者的實踐能力有一定的要求。因此,結合該專業(yè)的人才培養(yǎng)目標,在制訂人才培養(yǎng)方案時,要重視專業(yè)實踐課程的設置。數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的專業(yè)實踐課的設置分為專業(yè)課程實驗課和專業(yè)集中實踐課。在設置專業(yè)課程實驗課時,我們將它與對應的專業(yè)課程理論課放在一起,在人才培養(yǎng)方案中將其作為一門課程設置,在專業(yè)基礎課、專業(yè)主干課和專業(yè)選修課中都會涉及。專業(yè)集中實踐課分為專業(yè)實習、專業(yè)綜合實踐、畢業(yè)論文設計、數(shù)據(jù)庫課程設計、機器學習課程設計以及數(shù)據(jù)結構與算法課程設計等,其中專業(yè)實習和專業(yè)綜合實踐可以去校外的實訓基地進行,采用校企合作的方式,在校外的實訓基地進行的實踐活動可以對校內實踐教學的各個環(huán)節(jié)起到充實和完善作用。如果受到疫情影響,則可以采用在線實踐實習的方式,由企業(yè)的項目工程師在線指導培訓,學生通過操作實訓項目,可以提高實踐動手能力和人才培養(yǎng)質量。專業(yè)課程實驗課、數(shù)據(jù)庫課程設計、數(shù)據(jù)結構與算法課程設計和機器學習課程設計等都可以在湖北工程學院數(shù)學與統(tǒng)計學院的大數(shù)據(jù)實驗室進行。
7結語
湖北工程學院數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)的專業(yè)課程在設置方面,是根據(jù)該專業(yè)的人才培養(yǎng)目標,并且結合該專業(yè)的崗位情況而開設的,也借鑒了其他學校的課程設置和企業(yè)工程師的建議。學生畢業(yè)之后從事什么樣的崗位和選擇哪個考研方向,需要學生根據(jù)自己對相關課程的學習情況以及所選修的專業(yè)課程來確定。對于專業(yè)課程的設立和課時設定以及具體開設學期的確定,我們遵循“厚基礎、寬口徑、重實踐、促創(chuàng)新”的原則。同時,我們也會考慮并結合地方高校學生的實際情況,在實際操作中進一步優(yōu)化。
參考文獻
[1]朝樂門,邢春曉,王雨晴.數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)特色課程研究[J].計算機科學,2018,45(3):1-8.
[2]孫書韜,朱立谷,李春芳.北美知名大學數(shù)據(jù)科學專業(yè)課程體系分析[J].中國教育信息化,2019(24):48-50.
[3]劉建華,胡文瑜,唐鄭熠,等.數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)課程體系探索[J].科教文匯,2021(2):115-116.
[4]高艷.應用型高校數(shù)據(jù)科學與大數(shù)據(jù)技術專業(yè)課程體系探索:以山西農業(yè)大學信息學院為例[J].信息系統(tǒng)工程,2019(5):169,171.
[5]李莎莎,周競文,唐晉韜,等.數(shù)據(jù)科學與大數(shù)據(jù)人才專業(yè)課程體系分析[J].計算機工程與科學,2018,40(S1):109-113.
[6]付長賀,鄧甦.新工科背景下大數(shù)據(jù)專業(yè)課程體系設計[J].沈陽師范大學學報(自然科學版),2020,38(5):468-471.
作者:潘保國 吳舒展 單位:湖北工程學院數(shù)學與統(tǒng)計學院