即席查詢分析論文
時間:2022-01-19 07:00:00
導(dǎo)語:即席查詢分析論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
1商業(yè)智能的概念
商務(wù)智能是20世紀(jì)90年代末首先在國外企業(yè)界出現(xiàn)的一個術(shù)語,其代表為提高企業(yè)運營性能而采用的一系列方法、技術(shù)和軟件。它把先進的信息技術(shù)應(yīng)用到整個企業(yè),不僅為企業(yè)提供信息獲取能力,而且通過對信息的開發(fā),將其轉(zhuǎn)變?yōu)槠髽I(yè)的競爭優(yōu)勢?;ヂ?lián)網(wǎng)數(shù)據(jù)中心IDC(InternetDataCenter)將商業(yè)智能BI(BusinessIntelligence)定義為多種軟件工具的集合。其中包括終端用戶查詢和報告工具。該專門用來支持初級用戶的原始數(shù)據(jù)訪問,不包括適用于專業(yè)人士的成品報告生成工具。OLAP工具。提供多維數(shù)據(jù)管理環(huán)境,其典型的應(yīng)用是對商業(yè)問題的建模與商業(yè)數(shù)據(jù)分析。OLAP也被稱為多維分析。數(shù)據(jù)挖掘(DataMining)軟件。使用諸如神經(jīng)網(wǎng)絡(luò)、規(guī)則歸納等技術(shù),用來發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系,做出基于數(shù)據(jù)的推斷。主管信息系統(tǒng)(EIS,ExecutiveInformationSystem)。以及數(shù)據(jù)集市(DataMart)和數(shù)據(jù)倉庫(DataWarehouse)產(chǎn)品。包括數(shù)據(jù)轉(zhuǎn)換、管理和存取等方面的預(yù)配置軟件,通常還包括一些業(yè)務(wù)模型,如財務(wù)分析模型。
2數(shù)據(jù)倉庫的實現(xiàn)
數(shù)據(jù)倉庫不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫,他是一種面向分析型數(shù)據(jù)處理的技術(shù)。它是對多個異構(gòu)的數(shù)據(jù)源的高度有效的集成,集成后然后再按照主題進行重組,并包含歷史數(shù)據(jù),一般情況下存放在數(shù)據(jù)倉庫里的數(shù)據(jù)不再需要經(jīng)過修改。我們的傳統(tǒng)數(shù)據(jù)庫技術(shù)是以單一的數(shù)據(jù)資源,即數(shù)據(jù)庫為中心,進行從事務(wù)處理、批處理到?jīng)Q策分析等各種類型的數(shù)據(jù)處理工作。不同類型的數(shù)據(jù)有著不同的處理特點,以單一的數(shù)據(jù)組織方式進行組織的數(shù)據(jù)庫并不能反映這種差異,特別是滿足不了現(xiàn)代商業(yè)企業(yè)數(shù)據(jù)處理多樣化的要求。隨著數(shù)據(jù)庫應(yīng)用的廣泛普及,人們對數(shù)據(jù)處理的這種多層次特點有了更清晰的認(rèn)識。總結(jié)起來,當(dāng)前的商業(yè)企業(yè)數(shù)據(jù)處理可以大致地劃分為兩大類:操作型處理和分析型處理。操作型處理,通常是對一個或一組記錄的查詢和修改,主要是為企業(yè)的特定應(yīng)用服務(wù)的,人們關(guān)心的是響應(yīng)時間、數(shù)據(jù)的安全性和完整性。分析型處理則用于商業(yè)企業(yè)管理人員的決策分析。兩者之間的巨大差異使得操作型處理和分析型處理的分離成為必然。這種分離,劃清了數(shù)據(jù)處理的分析型環(huán)境與操作型環(huán)境之間的界限,從而由原來的以單一數(shù)據(jù)庫為中心的數(shù)據(jù)環(huán)境發(fā)展成為一種新環(huán)境:體系化環(huán)境。
3數(shù)據(jù)倉庫的體系架構(gòu)
數(shù)據(jù)倉庫系統(tǒng)包括四大部分:數(shù)據(jù)裝載、數(shù)據(jù)管理、信息訪問和系統(tǒng)管理與維護。它描述了數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)源(即業(yè)務(wù)系統(tǒng)或者其它OLTP系統(tǒng))、相應(yīng)的數(shù)據(jù)轉(zhuǎn)換ETL((Extraction、Transformation、Loading)過程(指把數(shù)據(jù)從數(shù)據(jù)源轉(zhuǎn)換并加載到中央數(shù)據(jù)倉庫的過程)、中央數(shù)據(jù)倉庫、對數(shù)據(jù)倉庫信息的訪問(通過一般的OLAP工具進行訪問或者進行數(shù)據(jù)挖掘等)、以及對整個數(shù)據(jù)倉庫系統(tǒng)的管理與維護(元數(shù)據(jù)服務(wù)、數(shù)據(jù)庫建模與管理、系統(tǒng)管理、操作管理、專業(yè)技術(shù)服務(wù)等)。從這個框架結(jié)構(gòu)圖可以清楚地看出,數(shù)據(jù)倉庫系統(tǒng)是一個由許多產(chǎn)品、模塊、及服務(wù)構(gòu)成的復(fù)雜解決方案,而決非某一個單純的產(chǎn)品。
在數(shù)據(jù)倉庫領(lǐng)域里,有一個概念叫Adhocqueries,英文定義為(Anon-standardinquiry.Anadhocqueryiscreatedtoobtaininformationastheneedarises.)中文一般翻譯為“即席查詢”。即席查詢是指那些用戶在使用系統(tǒng)時,根據(jù)自己當(dāng)時的需求定義的查詢。
那么即席查詢和我們通常的查詢有什么樣的區(qū)別呢?單從sql語句上來說,他們之間的不同之處在于,通常查詢在我們的系統(tǒng)設(shè)計與實施的時候,他的內(nèi)容我們是已知的,我們可以在系統(tǒng)實施的時候通過多種技術(shù)來優(yōu)化這些查詢,例如建立索引,分區(qū)等,我們可以使得這些查詢的效率非常的高,然而即席查詢是用戶在使用的時候臨時產(chǎn)生的,系統(tǒng)根本無法預(yù)先優(yōu)化這些查詢,所以,對于此類的查詢是評估我們數(shù)據(jù)倉庫的一個非常重要的指標(biāo)。
即席查詢生成的方式很多,最常見的就是使用即席查詢工具。一般的數(shù)據(jù)展現(xiàn)工具都會提供即席查詢的功能。通常的方式是,將數(shù)據(jù)倉庫中的維度表和事實表映射到語義層,用戶可以通過語義層選擇表,建立表間的關(guān)聯(lián),最終生成SQL語句。
OracleDiscoverer是一種直觀的即席查詢、報表、分析和Web工具,它使企業(yè)的各級業(yè)務(wù)用戶均能從數(shù)據(jù)集市、數(shù)據(jù)倉庫、在線事務(wù)處理系統(tǒng)中獲得對信息的即時訪問。OracleDiscoverer為用戶提供商務(wù)智能的功能和洞察力。它使用戶能集中精力解決業(yè)務(wù)問題,并提升對數(shù)據(jù)的洞察力和數(shù)據(jù)的使用價值。我們可以使用OracleDiscoverer直觀易用的WorkbookWizard來創(chuàng)建、修改和優(yōu)化即席查詢。借助OracleDiscoverer這一直觀的即席查詢、報告以及分析工具,百度(http://)獲得了出色的數(shù)據(jù)查詢及報表展示的解決方案,OracleDiscoverer不僅為百度提供了滿足境外資本市場的報表,其適用于關(guān)系與多維(OLAP)數(shù)據(jù)的分析更是為百度管理層及時準(zhǔn)確地了解公司經(jīng)營狀況提供了強有力的工具.使決策者在做出商業(yè)判斷時有了正確和科學(xué)的依據(jù)。
在一個數(shù)據(jù)倉庫系統(tǒng)中,即席查詢使用的越多,對數(shù)據(jù)倉庫的要求就越高,對數(shù)據(jù)模型的對稱性的要求也越高。對稱性的數(shù)據(jù)模型對所有的查詢都是相同的,這也是維度建模的一個優(yōu)點。
5應(yīng)用領(lǐng)域
5.1銀行金融領(lǐng)域
在銀行業(yè),BI信息嵌入前臺業(yè)務(wù)系統(tǒng)中,數(shù)據(jù)倉庫與客服呼叫中心的數(shù)據(jù)交互整合?;跀?shù)據(jù)倉庫的客戶信息和大量的交易歷史,加工、提煉出客戶的衍生信息和行為趨勢,如細(xì)分族群、渠道偏好、貢獻度、違約概率,以及還款提醒、產(chǎn)品購買傾向、存款到期和理財投資建議等信息,將加工好的信息嵌入到呼叫中心系統(tǒng)中,一旦客戶打電話到客服中心,客服坐席人員可以在解決客戶的問題之后,立即根據(jù)BI提供的信息為客戶提供個性化的服務(wù)和有針對性的交叉銷售,實現(xiàn)前端客服系統(tǒng)的智能化。
即席查詢(Ad-hocquery)是BI在業(yè)務(wù)一線應(yīng)用的另一種重要模式。國外先進銀行在數(shù)據(jù)倉庫建立起來后,紛紛建立其業(yè)務(wù)智能單元(BusinessIntelligentUnit),簡稱BIU。BIU由精通業(yè)務(wù)、熟悉信息分析技術(shù)的分析人員組成,他們憑借豐富的行業(yè)知識和經(jīng)驗,利用各種分析工具直接訪問數(shù)據(jù)倉庫進行各種即席查詢分析,及時深入地掌握業(yè)務(wù)發(fā)展動向。他們可以通過對以往的產(chǎn)品銷售狀況和客戶的行為偏好的分析,設(shè)計新產(chǎn)品;針對新產(chǎn)品進行目標(biāo)客戶群的分析,估算目標(biāo)客戶數(shù)量和活動成本、營銷渠道容量,設(shè)計市場營銷活動;對異常的管理指標(biāo)進行深入的分析,挖掘問題所在,提出解決問題的方法等。
即席查詢分析應(yīng)用在發(fā)達國家已得到廣泛的應(yīng)用,國外先進銀行尤其注重BIU團隊的建設(shè)和分析人員的培養(yǎng)。美國一家頗具規(guī)模的銀行,數(shù)據(jù)倉庫的數(shù)據(jù)量達130TB,其專職的數(shù)據(jù)分析人員超過2000人,每天提交的查詢超過400萬次。英國一家具有悠久歷史的全球性銀行,其數(shù)據(jù)倉庫擁有1500名專職的業(yè)務(wù)分析用戶,每天提交即席查詢多達150萬個,相當(dāng)于15個/秒。臺灣一家擁有400萬客戶的銀行,就有500名業(yè)務(wù)分析人員通過分析師資格考試。
5.2電信領(lǐng)域
在電信領(lǐng)域當(dāng)中,即席查詢是信息利用的主要方式之一。由于市場的變化、業(yè)務(wù)需求的變化、領(lǐng)導(dǎo)決策需求的變化等等,隨時可能需要知道相關(guān)的業(yè)務(wù)指標(biāo),這些類型的應(yīng)用需求往往需要通過即席查詢來實現(xiàn)。即席查詢的用戶可以分為三類:
(1)決策用戶,可使用的信息面應(yīng)該是全企業(yè)的所有信息;
(2)各部門業(yè)務(wù)用戶,可使用的信息面應(yīng)當(dāng)是部門相關(guān)的基本信息;
(3)數(shù)據(jù)管理部門,實際是決策用戶信息應(yīng)用的實現(xiàn)者,即決策用戶對于信息的應(yīng)用需求往往通過該部門實現(xiàn)。同時,他們還負(fù)責(zé)信息的主動發(fā)掘、總結(jié)和。
即席查詢可分為戰(zhàn)術(shù)性和戰(zhàn)略性兩種。
戰(zhàn)術(shù)性即席查詢包括:查詢客戶的單一視圖,如一個大客戶使用了多少產(chǎn)品(固話、數(shù)據(jù)業(yè)務(wù)、寬帶、小靈通等),每個產(chǎn)品在最近6個月帶來了多少營收,在一個客戶經(jīng)理所管轄的片區(qū)內(nèi),按賬務(wù)月、客戶、產(chǎn)品等統(tǒng)計營收或進行排序等。由于戰(zhàn)術(shù)性即席查詢涉及的數(shù)據(jù)量很少,數(shù)據(jù)庫不需要進行全表掃描操作,因此響應(yīng)速度很快,通常都在秒級響應(yīng)。
戰(zhàn)略性即席查詢包括:按時間、產(chǎn)品和客戶群分析新增客戶數(shù)、使用量和營收,找出最近半年營收一直在下降(下降幅度超過50%)的所有客戶名單。這些查詢可能需要進行全表掃描操作,因此響應(yīng)速度為分鐘級。
一般而言,戰(zhàn)術(shù)性即席查詢多為各部門業(yè)務(wù)用戶使用,戰(zhàn)略性即席查詢多為數(shù)據(jù)管理部門或決策用戶使用。
摘要:即席查詢,數(shù)據(jù)庫應(yīng)用最普遍的一種查詢,利用數(shù)據(jù)倉庫技術(shù),可以讓用戶隨時可以面對數(shù)據(jù)庫,獲取所希望的數(shù)據(jù).使用此功能的用戶都必須對關(guān)系型數(shù)據(jù)庫操作有一定的了解,同時對目前的底層數(shù)據(jù)庫有比較深刻的認(rèn)識。它是一種條件不固定,格式靈活的查詢報表。
關(guān)鍵詞:商業(yè)智能;數(shù)據(jù)倉庫;即席查詢