計算機(jī)專業(yè)數(shù)據(jù)倉庫見習(xí)報告

時間:2022-07-23 02:24:00

導(dǎo)語:計算機(jī)專業(yè)數(shù)據(jù)倉庫見習(xí)報告一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

計算機(jī)專業(yè)數(shù)據(jù)倉庫見習(xí)報告

一、導(dǎo)讀部分:

可見二者差別之大,這只是數(shù)據(jù)庫與數(shù)據(jù)倉庫的一個概念性的大致區(qū)別。另外它編程人員最關(guān)心的建立與操作各方面也差別很大,因此如果你沒有這方面的知識想只憑借數(shù)據(jù)庫發(fā)面的知識來開發(fā)數(shù)據(jù)倉庫的產(chǎn)品是很不可能的這就要求你要從數(shù)據(jù)倉庫最基礎(chǔ)的知識學(xué)起。

可能很多同學(xué)首先就會想到數(shù)據(jù)庫,說起數(shù)據(jù)倉庫。終究就錯了一個字,但是就是這一個字使這二者差異很大:

即數(shù)據(jù)庫為中心,保守的數(shù)據(jù)庫技術(shù)是以單一的數(shù)據(jù)資源。進(jìn)行事務(wù)處理、批處置等各種數(shù)據(jù)處置工作,主要是操作型處理,操作型處置也叫事務(wù)處理,指對數(shù)據(jù)庫聯(lián)機(jī)的日常操作,通常是對一個或一組紀(jì)錄的查詢和修改,主要為企業(yè)的特定應(yīng)用服務(wù)的注重響應(yīng)時間,數(shù)據(jù)的平安性和完整性。

用以支持經(jīng)營管理中的決策制定過程,而數(shù)據(jù)倉庫則是面向主題的集成的不可更新的穩(wěn)定性)隨時間不斷變化(不同時間)數(shù)據(jù)集合。主要用于分析型處理(也叫信息型處置)分析型處置則用于管理人員的決策分析,經(jīng)常要訪問大量的歷史數(shù)據(jù)。

二、數(shù)據(jù)倉庫的基礎(chǔ)知識:

1.數(shù)據(jù)倉庫概念始于上世紀(jì)80年代中期,首次出現(xiàn)是在被譽(yù)為“數(shù)據(jù)倉庫之父”WilliamH.Inmon的《建立數(shù)據(jù)倉庫》一書中。隨著人們對大型數(shù)據(jù)系統(tǒng)研究、管理、維護(hù)等方面的深刻識認(rèn)和不斷完善,在總結(jié)、豐富、集中多行企業(yè)信息的經(jīng)驗之后,為數(shù)據(jù)倉庫給出了更為精確的定義,即“數(shù)據(jù)倉庫是在企業(yè)管理和決策中面向主題的、集成的、與時間相關(guān)的、不可修改的數(shù)據(jù)集合”。數(shù)據(jù)倉庫并沒有嚴(yán)格的數(shù)據(jù)理論基礎(chǔ),也沒有成熟的基本模式,且更偏向于工程,具有強(qiáng)烈的工程性。通常按其關(guān)鍵技術(shù)部份分為數(shù)據(jù)的抽取、存儲與管理以及數(shù)據(jù)的表現(xiàn)等三個基本方面。

數(shù)據(jù)倉庫的重點(diǎn)與要求是能夠準(zhǔn)確、安全、可靠地從數(shù)據(jù)庫中取出數(shù)據(jù),經(jīng)過加工轉(zhuǎn)換成有規(guī)律信息之后,再供管理人員進(jìn)行分析使用。數(shù)據(jù)倉庫主要是應(yīng)用于決策支持系統(tǒng),其主要目的是“提取”信息并加以擴(kuò)展,用來進(jìn)行處理基于數(shù)據(jù)倉庫的決策支持系統(tǒng)(DSS)的應(yīng)用。

2基于數(shù)據(jù)倉庫的決策支持系統(tǒng)基于數(shù)據(jù)倉庫的決策支持系統(tǒng)(DSS)由三個部件組成:數(shù)據(jù)倉庫技術(shù)(Datawarehousing),聯(lián)機(jī)分析處理技術(shù)(OLAP,On—LineAnalyticalPro—cessing),數(shù)據(jù)挖掘技術(shù)(DataMining)。

聯(lián)機(jī)分析處理(OLAP,On—AnalyticalPro—cessing)是使分析人員、管理人員或執(zhí)行人員能夠從多種角度對從原始數(shù)據(jù)中轉(zhuǎn)化出來的、能夠真正為用戶所理解的、并真實反映企業(yè)給特性的信息進(jìn)行快速、一致、交互地存取,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術(shù)。OLAP的目標(biāo)是滿足決策支持或多維環(huán)境特定的查詢和報表需求。數(shù)據(jù)倉庫側(cè)重于存儲和管理面向決策主題的數(shù)據(jù);而OLAP側(cè)重于數(shù)據(jù)倉庫的數(shù)據(jù)分析,并將其轉(zhuǎn)換成輔助決策信息。OLAP的一個主要特點(diǎn)是多維數(shù)據(jù)分析,這與數(shù)據(jù)倉庫的多維數(shù)據(jù)組織正好形成相互結(jié)合、相互補(bǔ)充的關(guān)系。問此,利用OLAP技術(shù)與數(shù)據(jù)倉庫的結(jié)合可以較好地解決傳統(tǒng)決策支持系統(tǒng)既需要處理大量數(shù)據(jù)又需要進(jìn)行大量數(shù)值計算的問題。

OLAP的多維數(shù)據(jù)分析主要通過對多維數(shù)據(jù)的維進(jìn)行剖切、鉆取和旋轉(zhuǎn)來實現(xiàn)對數(shù)據(jù)庫所提供的數(shù)據(jù)進(jìn)行深入分析,為決策者提供決策支持。多維結(jié)構(gòu)是決策支持的支柱,也是OLAP的核心。

數(shù)據(jù)挖掘(DataMining)是從大量的、不完全的、有噪聲的。模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。

數(shù)據(jù)挖掘可以看成是一種數(shù)據(jù)搜尋過程,它不必預(yù)先假設(shè)或提出問題,但是仍能找到那些非預(yù)期的卻令人關(guān)注的信息,這些信息表示了數(shù)據(jù)元素的關(guān)系和模式。它能挖掘出數(shù)據(jù)鍵潛在的模式(pattern),找出最有價值的信息和知識(knowledge)。指導(dǎo)商業(yè)行為或輔助科學(xué)研究。研究對象是大規(guī)模和超大規(guī)模的數(shù)據(jù)集合。

三:在建立數(shù)據(jù)倉庫時應(yīng)該注意的重點(diǎn)問題:

1.找清楚主題,主題是你的數(shù)據(jù)倉庫研究的一個大方向,如果你把這個都沒有弄清楚的話后面的工作都是白費(fèi)了。一般數(shù)據(jù)倉庫的主題就是客戶最關(guān)心的部分,是客戶的項目做好以后在運(yùn)行期間時常進(jìn)行操作和觀察的核心內(nèi)容。只要你在建立的前真正弄清楚了客戶的需求,一般主題的建立就不會出問題。

2.維度的建設(shè),說白了維度就是客戶的使用分析處理是的一個觀察角度,數(shù)據(jù)倉庫是多維的,也就是用戶在觀察的時候是從多個角度來觀察的。這就要求你在具體的多維數(shù)據(jù)建立前要把用戶的業(yè)務(wù)模型建立完備,一般這是一個迭代的過程,在建立好或修改好一個模型后最好和用戶溝通一下,然后根據(jù)用戶的要求再做相應(yīng)的修改,另外基礎(chǔ)數(shù)據(jù)庫里面的維度表也要同步,把實際用到的維度都能在數(shù)據(jù)庫里有所反應(yīng)。

3.維度層次的建立:維度層次其實就是用戶在觀察時能夠細(xì)化的單位,也可以說是一個范圍,它是用戶在進(jìn)行切片,上鉆,下鉆時的重要單位,在建立層次的時候首先是要搞清楚要有那些層次,這個通常是用戶要求的,然后在基礎(chǔ)數(shù)據(jù)庫建立的時候一定要把這些層次的順序弄清楚,現(xiàn)在的數(shù)據(jù)倉庫工具大多都是自動對你提供的數(shù)據(jù)表進(jìn)行搜索而發(fā)現(xiàn)維度層次的,要是的建立基礎(chǔ)數(shù)據(jù)表的時候不注意可能你以后得出的結(jié)果就會錯很遠(yuǎn)。

四:總結(jié):

1.找實習(xí)工作的認(rèn)識:

我覺得實習(xí)其實就是一個從大學(xué)生活到工作的一個過度階段,學(xué)校和社會差別很大。有很多學(xué)生在學(xué)校里對自己以后工作的事想的少,準(zhǔn)備的少,一旦步入社會自己心里上一片空白,在實習(xí)時對于自己到底干什么工作,自己有什么專業(yè)技能也不是很清楚,最后總是過了很久快返校時才找到實習(xí)單位。我認(rèn)為實習(xí)很重要,因為實習(xí)和正常上班沒有什么兩樣,如果實習(xí)時就沒有方向的話,以后工作了想找到方向會走彎路。還有對于大多數(shù)同學(xué)來說,先就業(yè),在擇業(yè)是最好的,畢竟自己在學(xué)校里接觸社會少,專業(yè)實際操作和運(yùn)用能力與實際工作要求還是有一定的差距,不要老想著自己一定要找到一份好工作,自己專業(yè)內(nèi)的工作,自己喜歡的工作,這樣是不切合實際的。

2.工作總結(jié):在日常的工作中也有很多小問題值得我們注意,我總結(jié)了一下幾條:

①最好每天都能做工作日記,早上上班前寫好自己在這一天的工作目標(biāo),工作中應(yīng)該注意的重點(diǎn)問題,有哪些事情是要問清楚主管的等。然后在每天的下班前在看一下自己當(dāng)天做了那些工作,哪些工作目標(biāo)沒有完成,為什么沒有完成,自己在以后的工作中應(yīng)該注意哪些問題……,這些將是很重要的,經(jīng)常看看會有很大進(jìn)步。

②在開發(fā)項目的時候最好每天都有一個備份機(jī)制,因為電腦出故障是時常發(fā)生的,如果沒有備份的話可能會發(fā)生前功盡棄的可能。

③在開發(fā)時遇到需求說明不是很清楚的地方一定要向上級主管問清楚,因為軟件是做給客戶用的,我們不能憑空想像,那樣開發(fā)出來的東西很有可能會返工。

④在工作中可能會碰到和你的頂頭上司發(fā)生矛盾的事,如果已經(jīng)發(fā)生了,你要想清楚為什么會發(fā)生這種事,這些事情能不能避免,如果能避免自己在日后的工作中就要多注意一些。

⑤在討論問題時要有自己的見解,不能人云亦云沒有見解。

⑥工作要踏實,認(rèn)認(rèn)真真做。

⑦要多總結(jié),多交流。

以上就是我在數(shù)據(jù)倉庫實習(xí)期間自己的一些認(rèn)識和看法,可能還有很多東西自己平時沒有注意到,我也希望,祝愿每一位實習(xí)生包括我自己能夠在日后的工作中取得更大進(jìn)步。