大數(shù)據(jù)技術(shù)有線電視節(jié)目研究

時間:2022-11-15 08:46:13

導(dǎo)語:大數(shù)據(jù)技術(shù)有線電視節(jié)目研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

大數(shù)據(jù)技術(shù)有線電視節(jié)目研究

摘要:在當(dāng)前互聯(lián)網(wǎng)技術(shù)以及智能AI技術(shù)的發(fā)展背景下,合肥有線利用大數(shù)據(jù)技術(shù)對電視用戶群和節(jié)目資源進行細(xì)分,整合規(guī)范合肥有線的直播和點播節(jié)目資源元數(shù)據(jù),利用基于內(nèi)容的推薦算法和協(xié)同過濾算法對推薦模型的數(shù)據(jù)進行大數(shù)據(jù)分析,實現(xiàn)有線電視用戶的個性化推薦服務(wù)。

關(guān)鍵詞:推薦系統(tǒng);大數(shù)據(jù);互動電視;HFC

雙向網(wǎng)絡(luò)在當(dāng)前互聯(lián)網(wǎng)技術(shù)以及智能AI技術(shù)的發(fā)展背景下,為了應(yīng)對新媒體技術(shù)的挑戰(zhàn),合肥有線對傳統(tǒng)機頂盒進行著技術(shù)升級,利用大數(shù)據(jù)技術(shù)對自己的用戶群進行細(xì)分,并以此信息對用戶進行合肥有線的直播和點播節(jié)目資源進行系統(tǒng)推薦,以期做到千人千面的個性服務(wù),用以提高合肥有線的品牌競爭力。本系統(tǒng)從合肥有線雙向網(wǎng)絡(luò)中收集用戶終端的各類信息(用戶信息、用戶行為信息以及業(yè)務(wù)信息等),通過對各類數(shù)據(jù)信息的建模分析利用大數(shù)據(jù)平臺來實現(xiàn)有線用戶的個性化推薦服務(wù)。

1對有線節(jié)目資源進行大數(shù)據(jù)分析的意義

自全網(wǎng)雙向改造后,合肥有線不僅保證直播節(jié)目穩(wěn)定無延時地傳輸也引進了海量視頻資源以供有線用戶點播收看。雖然節(jié)目資源的初步聚合歸類改變了用戶的被動接收的收視習(xí)慣,但與互聯(lián)網(wǎng)視頻網(wǎng)站對節(jié)目詳盡的分類相比,合肥有線的視頻資源入口相對簡單、點播路徑過長以及影片搜索不便捷等問題無不影響著用戶收視。因此,運用大數(shù)據(jù)分析系統(tǒng),對節(jié)目資源進行深度分析,不僅可以提升有線優(yōu)質(zhì)資源的曝光率而且可以增加用戶的黏度;對用戶進行群體細(xì)分以及用戶喜好的分析,改變了有線電視節(jié)目的運營模式,從傳統(tǒng)的粗放式推送轉(zhuǎn)化為精細(xì)化的用戶運營,提升了用戶的品牌忠誠度。

2推薦系統(tǒng)介紹

推薦技術(shù)的發(fā)展是隨著信息技術(shù)和互聯(lián)網(wǎng)的發(fā)展而興起的,是信息過載時代信息消費者和信息生產(chǎn)者之間的紐帶,是一種幫助用戶快速發(fā)現(xiàn)有用信息的工具。推薦系統(tǒng)并不需要用戶提供明確的需求,是分析并挖掘用戶的歷史行為,利用特定算法找出用戶的個性化特點并主動給用戶推薦滿足他們需求的信息的系統(tǒng)。推薦系統(tǒng)面向的對象稱為用戶,推薦的產(chǎn)品稱為物品,推薦系統(tǒng)所關(guān)心的就是用戶與物品之間的關(guān)系,現(xiàn)有的一些基本類型的推薦系統(tǒng)包括:協(xié)同系統(tǒng)、基于內(nèi)容的系統(tǒng)和基于知識的系統(tǒng)。[1]這些系統(tǒng)都具有一個重要的特點擁有強大的用于跟蹤和識別用戶長期興趣的用戶識別機制。

3有線節(jié)目資源推薦系統(tǒng)架構(gòu)圖

有線節(jié)目資源推薦系統(tǒng)的用戶是收看有線電視節(jié)目的終端用戶,推薦系統(tǒng)的物品是有線節(jié)目資源,包括了直播電視節(jié)目、在線點播影片以及電視劇。有線節(jié)目資源推薦系統(tǒng)的架構(gòu)如圖1所示。3.1數(shù)據(jù)信息。推薦系統(tǒng)能否提供用戶滿意的結(jié)果依賴于數(shù)據(jù)信息源。數(shù)據(jù)源需要具有大數(shù)據(jù)的特性:大量化、多樣化以及速度化等特點。涉及的數(shù)據(jù)信息可以分為以下幾類:(1)終端用戶自身數(shù)據(jù)信息:收看電視節(jié)目的終端設(shè)備以及智能卡號,用戶姓名、用戶地址;(2)終端用戶行為數(shù)據(jù)信息:用戶點播的數(shù)據(jù)信息(片名、開始點播時間、結(jié)束收看時間、暫停播放的時長以及對節(jié)目的評分)、用戶瀏覽的數(shù)據(jù)信息(片名、開始瀏覽時間、結(jié)束瀏覽時間)(3)節(jié)目資源的數(shù)據(jù)信息:節(jié)目資源的元信息(片名、類別、供應(yīng)商、導(dǎo)演、主演、內(nèi)容介紹、時長、集數(shù))以及節(jié)目資源的綜合評分(網(wǎng)絡(luò)評分以及用戶評分)(4)其他數(shù)據(jù):為了彌補節(jié)目資源元數(shù)據(jù)的不足,也需要利用網(wǎng)絡(luò)爬蟲技術(shù),從互聯(lián)網(wǎng)上獲取節(jié)目資源相關(guān)的元數(shù)據(jù)作為數(shù)據(jù)信息的補充。3.2數(shù)據(jù)處理。跟一般的挖掘分析相同,推薦系統(tǒng)需要對已有的數(shù)據(jù)信息進行數(shù)據(jù)清洗以及整理,將重復(fù)的、不合理的以及錯誤的數(shù)據(jù)去除掉,并對符合要求的數(shù)據(jù)進行格式化處理。3.3數(shù)據(jù)分析。經(jīng)過處理后的數(shù)據(jù)依然不能講用戶和物品關(guān)聯(lián)起來,要想給用戶推薦個性化的物品,就需要通過建模來對用戶和物品進行聚類分析,并依據(jù)特定算法用戶的個性化需求。推薦算法一般包括:協(xié)同過濾、基于內(nèi)容的推薦、基于知識的推薦以及基于上下文的推薦系統(tǒng)等。本文中使用了基于內(nèi)容的推薦和協(xié)同過濾兩種算法作為系統(tǒng)的推薦算法。3.4數(shù)據(jù)展示數(shù)據(jù)展示部分就是將推薦算法得出的接口通過特定的方式提供給用戶,比如:機頂盒首頁個性推薦、其他系統(tǒng)頁面以及各類數(shù)據(jù)接口等。

4系統(tǒng)實現(xiàn)

依據(jù)有線節(jié)目資源推薦系統(tǒng)的需求分析,我們結(jié)合爬蟲數(shù)據(jù)整理了有線節(jié)目資源的元數(shù)據(jù),實時記錄了有線用戶的點播數(shù)據(jù)(瀏覽信息以及點播信息),并依據(jù)推薦模型采用基于內(nèi)容的推薦算法和協(xié)同過濾算法的混合算法作為整個系統(tǒng)的推薦算法,對有線節(jié)目進行分類排行以及個性推薦。4.1分類排行。包含熱門節(jié)目排行、熱門影星參演排行、經(jīng)典老片以及綜合評分排行等,為有線用戶提供最常用的節(jié)目資源推薦(如圖2所示)。4.2個性化推薦。個性推薦與單個用戶對節(jié)目的喜好有關(guān),依據(jù)用戶的歷史行為通過推薦算法來推斷用戶的喜好,從而為用戶提供可能感興趣的節(jié)目資源,相對于分類排行而言,個性推薦更加地智能化(如圖3所示)。

5結(jié)語

本系統(tǒng)是針對合肥有線節(jié)目資源進行的數(shù)據(jù)分析,為有線互動點播業(yè)務(wù)提供長尾分析以及資源推薦,其實現(xiàn)主要包括兩部分,其一,合肥有線節(jié)目資源與爬蟲信息的基礎(chǔ)信息整合;其二,基于內(nèi)容的推薦算法和協(xié)同過濾算法對推薦模型的數(shù)據(jù)進行大數(shù)據(jù)分析。實踐證明,該系統(tǒng)對有線節(jié)目資源進行的大數(shù)據(jù)分析為合肥有線互動點播業(yè)務(wù)提供了強有力的技術(shù)支持。

參考文獻(xiàn):

[1][美]CharuC.,Aggarwal.推薦系統(tǒng):原理與實踐[M].王宏志,譯.機械工業(yè)出版社,2018.

[2]美弗朗西斯科•里奇著推薦系統(tǒng):技術(shù)、評估及高效算法[M].李艷民,譯.機械工業(yè)出版社,2018.

[3][美]BruceEckel.Java編程思想[M].陳昊鵬,譯.2007-06-01.

[4][美]CraigWalls.Spring實戰(zhàn)[M].張衛(wèi)濱,譯.2016.

[5][美]湯姆,懷特.Hadoop權(quán)威指南:大數(shù)據(jù)的存儲與分析[M].王海,華東,劉喻,呂粵海,譯清華大學(xué)出版社,2017.

作者:張軍 單位:合肥有線電視寬帶網(wǎng)絡(luò)有限公司