電力營銷系統(tǒng)數(shù)據(jù)分析論文

時間:2022-03-27 03:50:58

導(dǎo)語:電力營銷系統(tǒng)數(shù)據(jù)分析論文一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

電力營銷系統(tǒng)數(shù)據(jù)分析論文

1HANA數(shù)據(jù)分析平臺采用的核心技術(shù)

HANA數(shù)據(jù)分析平臺在軟件方面,通過內(nèi)存技術(shù),應(yīng)用程序能直接處理電力企業(yè)數(shù)據(jù)庫中的各種數(shù)據(jù),并直接在主內(nèi)存中處理。主要技術(shù)包括行+列的存儲、壓縮、數(shù)據(jù)分區(qū)、增量數(shù)據(jù)更新等。平臺采用的軟件包括數(shù)據(jù)抽取工具、內(nèi)存數(shù)據(jù)庫(含數(shù)據(jù)庫服務(wù)器、建模工具Studio、客戶端工具)、報表展現(xiàn)層BusinessObjectsBI組件。在硬件方面,通過預(yù)配置的軟硬件結(jié)合體,提供高性能的數(shù)據(jù)讀寫操作,并在內(nèi)存數(shù)據(jù)庫里采用列式存儲從而將更多的數(shù)據(jù)存入(列式存儲方式更適合數(shù)據(jù)壓縮)。

2HANA數(shù)據(jù)分析平臺實施過程

數(shù)據(jù)分析平臺建設(shè)應(yīng)遵循最大限度的考慮應(yīng)用實用性、縮短實現(xiàn)周期、降低技術(shù)風(fēng)險等因素。

2.1需求分析

需求分析是要對用戶的訴求或需求進行深入了解,并在需求的基礎(chǔ)上對整個平臺進行一致約定。因此以重要性、分析的復(fù)雜性、數(shù)據(jù)量大小、以及快速見效為原則,需求分析需要明確下面的內(nèi)容。

1)選擇需要分析的主題,結(jié)合當(dāng)前電力營銷業(yè)務(wù)在計量、業(yè)擴、抄表、電費核算、電費繳納、賬務(wù)等工作職能的劃分,也要考慮分析的主題具有針對性的業(yè)務(wù)場景,這些場景往往跨越多個職能。

2)分析并描述各個主題的業(yè)務(wù)背景,包括使用的用戶角色,使用的業(yè)務(wù)場景。以電費出賬異常為例:電費出賬異常主要是由于用戶檔案錯誤、抄表錯誤所引發(fā)的,涉及到業(yè)擴、抄表、電費核算等多個職能部門。以電費出賬異常作為分析的主題,其業(yè)務(wù)場景主要用于電費發(fā)行后,對引發(fā)電費異常的用戶檔案數(shù)據(jù)、計量信息、抄表信息進行檢查并按職能需求進行分別展示。

3)分析各個主題間的關(guān)系,在這個平臺上用戶的所有活動信息,如用戶請求的數(shù)量,用戶對這些數(shù)據(jù)的訪問頻率、時間、數(shù)據(jù)細節(jié)層次、請求多大的數(shù)據(jù)量等之間的關(guān)聯(lián)。

4)分析主題所涉及的表的目錄、表的內(nèi)容、表的容量、每個表的平均行大小、表的記錄數(shù)、表的增長情況等。

2.2平臺規(guī)劃

HANA數(shù)據(jù)分析平臺應(yīng)用架構(gòu)一般采用四層:數(shù)據(jù)源層、數(shù)據(jù)抽取及復(fù)制層、HANA數(shù)據(jù)集市層以及報表展示層。

1)數(shù)據(jù)源層:作為平臺的分析對象,提供報表分析所需的數(shù)據(jù),數(shù)據(jù)源層可同時支持各種類型的數(shù)據(jù)庫,數(shù)據(jù)源層為營銷系統(tǒng)(管理庫),生產(chǎn)庫到管理庫之間采用SharePlex復(fù)制工具實現(xiàn)數(shù)據(jù)同步,以避免數(shù)據(jù)抽取對生產(chǎn)系統(tǒng)的影響。

2)數(shù)據(jù)抽取和復(fù)制層:數(shù)據(jù)抽取和復(fù)制層負責(zé)將數(shù)據(jù)源層中源系統(tǒng)的數(shù)據(jù)抽取和復(fù)制到HANA分析數(shù)據(jù)庫中,主要構(gòu)成是數(shù)據(jù)抽取和復(fù)制工具,可以分別采用實時同步服務(wù)(SLT)以及非實時同步的數(shù)據(jù)服務(wù)(DataService)兩種不同的復(fù)制工具來滿足不同特征的源數(shù)據(jù)要求。在確定采用哪種工具前,需要對每個數(shù)據(jù)源的大小、變更時間、變更頻繁度、增量大小等信息做詳細了解,對不同數(shù)據(jù)源表選擇合適的復(fù)制工具。

3)數(shù)據(jù)集市層:數(shù)據(jù)集市層是整體系統(tǒng)架構(gòu)的核心,負責(zé)分析數(shù)據(jù)的儲存、報表模型的建立以及數(shù)據(jù)計算。該層包含分析數(shù)據(jù)庫以及虛擬模型架構(gòu)兩個主要組成,所有需分析展示的數(shù)據(jù)在數(shù)據(jù)集市層通過集市層進行儲存、壓縮、建立邏輯模型并計算,通過該平臺特有的內(nèi)存計算技術(shù)可以使這個過程的效率大幅提升。

4)報表展示層:報表展示層負責(zé)將HANA數(shù)據(jù)庫中的數(shù)據(jù)運算結(jié)果按照報表需求進行展示,采用SAPBusinessObjectBI4.0以及EXCEL作為展示工具。

2.3平臺實現(xiàn)

2.3.1模型設(shè)計

依據(jù)報表的需求分析、功能需求、性能需求、模型擴展性、模型的靈活性、實現(xiàn)成本進行平衡,在達到性能要求的前提下,設(shè)計出可以重用的模型,HANA平臺不同于傳統(tǒng)的數(shù)據(jù)倉庫需要物理化模型設(shè)計,HANA采用了邏輯視圖模型設(shè)計的概念,邏輯視圖從表面看體現(xiàn)的是傳統(tǒng)的星型、雪花型模型設(shè)計,但這些模型中的數(shù)據(jù)并不是物理存放的。HANA提供了屬性視圖、分析視圖、計算視圖三種模型設(shè)計,屬性視圖實現(xiàn)對維度的設(shè)計,分析視圖則實現(xiàn)傳統(tǒng)的星型模型設(shè)計,計算視圖實現(xiàn)更復(fù)雜的雪花型模型設(shè)計。模型設(shè)計時是先將需求階段所確定的分析主題作為分析對象,梳理每個主題展示所需的事實表數(shù)據(jù)內(nèi)容和數(shù)據(jù)粒度、分析維度、分析的數(shù)據(jù)指標(biāo)。例如:一個以分析電費構(gòu)成為主題的業(yè)務(wù)場景,該主題分析當(dāng)期電費的構(gòu)成情況,并同期比較各個電費構(gòu)成的變動情況,那它的指標(biāo)可以為目錄電度電費、峰谷品跌、豐枯品跌、基本電費、力調(diào)費、代征費、電度電費、結(jié)算電費等指標(biāo)。分析的維度可包含:時間維度、用戶維度、組織維度、用電服務(wù)維度、抄表維度、計收維度等。并在此時完成對事實表和維度表的邏輯數(shù)據(jù)模型設(shè)計。

2.3.2表樣及功能設(shè)計

報表的樣式和功能應(yīng)當(dāng)考慮用戶對數(shù)據(jù)進行分析的使用習(xí)慣,借鑒數(shù)據(jù)倉庫中的多維數(shù)據(jù)可視化方法,通過對報表的上鉆、下鉆、切片等展示功能技術(shù)的利用,實現(xiàn)對匯總性數(shù)據(jù)、明細類數(shù)據(jù)、核心數(shù)據(jù)的快速查看和分析。以上述的分析電費構(gòu)成主題為例,其展示需求決定表樣的設(shè)計采用圖型混合表格的方式,功能上采用按照組織維度進行上鉆、下鉆功能可查看不同供電區(qū)域的電費構(gòu)成情況和各個指標(biāo)的排名情況,前端展示采用了BOWebintelligence嵌入DashBoard圖表設(shè)計實現(xiàn)。

2.3.3數(shù)據(jù)抽取及復(fù)制設(shè)計

為確保數(shù)據(jù)質(zhì)量,應(yīng)當(dāng)進行數(shù)據(jù)抽取和復(fù)制的規(guī)劃設(shè)計。首先,根據(jù)模型設(shè)計中指標(biāo)、維度信息分別列舉出其相應(yīng)的數(shù)據(jù)來源,即營銷系統(tǒng)的物理表和字段,指標(biāo)來源于營銷系統(tǒng)的交易數(shù)據(jù),而維度來源于營銷系統(tǒng)的主數(shù)據(jù)。其次,根據(jù)邏輯數(shù)據(jù)模型和數(shù)據(jù)來源確定營銷數(shù)據(jù)庫到HANA數(shù)據(jù)庫的ETL規(guī)劃,根據(jù)數(shù)據(jù)的質(zhì)量規(guī)則(包括:數(shù)據(jù)清除、空值處理、數(shù)據(jù)替換、規(guī)范化數(shù)據(jù)格式等),確認營銷系統(tǒng)源數(shù)據(jù)到HANA目標(biāo)數(shù)據(jù)庫數(shù)據(jù)的轉(zhuǎn)換規(guī)則,同時依據(jù)數(shù)據(jù)大小、數(shù)據(jù)變更時間、數(shù)據(jù)變更頻繁度、數(shù)據(jù)增量大小要求確定采用的實時工具SLT還是定時抽數(shù)工具BODataService,例如:收費賬務(wù)相關(guān)的交易數(shù)據(jù)存在記錄基數(shù)大、變更頻率很高等特征,采用實時復(fù)制增量數(shù)據(jù)更合適,而賬務(wù)的月結(jié)數(shù)據(jù)僅在每月初產(chǎn)生且數(shù)據(jù)量非常巨大,因此采用定時批量復(fù)制更合適。

2.3.4模型及報表開發(fā)

模型及報表開發(fā)共分為數(shù)據(jù)裝載、HANA建模、定義語義層(IDT)、報表開發(fā)、數(shù)據(jù)校驗五個步驟,這五個步驟相互交疊與重復(fù),直至到達最優(yōu)化設(shè)計。其中數(shù)據(jù)裝載的方式利用了SLT的實時同步技術(shù),SLT同步技術(shù)其核心是基于數(shù)據(jù)庫的觸發(fā)器模式實現(xiàn)對源數(shù)據(jù)的增量復(fù)制,最大限度的避免了對源系統(tǒng)表結(jié)構(gòu)的改變,同時采用的多任務(wù)復(fù)制機制使得實時復(fù)制的效率可保持在5~10秒內(nèi)的數(shù)據(jù)延遲,裝載后的HANA數(shù)據(jù)的大小比較源數(shù)據(jù)庫數(shù)據(jù)大小可壓縮30%~70%的容量。

3發(fā)展前景

不斷的完善HANA數(shù)據(jù)分析平臺的分析主題,不僅是基于電力營銷系統(tǒng),還可以基于用電采集系統(tǒng)等構(gòu)建起電力企業(yè)的大數(shù)據(jù)分析平臺。利用HANA內(nèi)置的PAL(預(yù)測分析庫)對海量電量數(shù)據(jù)、客戶服務(wù)數(shù)據(jù)實現(xiàn)數(shù)據(jù)高級分析,建立其有效的事前預(yù)測、事中控制、事后改善的企業(yè)快速輔助決策模式。營銷業(yè)務(wù)可以在客戶服務(wù)中對受理業(yè)務(wù)的情況信息、執(zhí)行過程、執(zhí)行結(jié)果進行深入分析、對客戶需求進行快速響應(yīng),改進服務(wù)質(zhì)量、提升電網(wǎng)服務(wù)建設(shè)。更可以利用海量電能量數(shù)據(jù)對偷竊電稽核、客戶用電行為、能效管理等進行過分析和應(yīng)用,助力營銷輔助決策與分析能力的快速提升。

4結(jié)論

基于電力營銷系統(tǒng)中業(yè)務(wù)數(shù)據(jù)所建立的HANA數(shù)據(jù)分析平臺,從分析效率來看均有實質(zhì)性的提高。經(jīng)實踐證明,與營銷系統(tǒng)報表在同等條件下對比,其分析效率可提高百倍以上。在大宗數(shù)據(jù)的分析上,HANA平臺更是體現(xiàn)了其快速見效、性能優(yōu)異、分析功能操作簡潔和靈活、快速適應(yīng)業(yè)務(wù)變化的能力。

作者:劉宏剛吳丹單位:重慶市電力公司信息通信分公司重慶智網(wǎng)科技有限公司