ML自動(dòng)化信息方案
時(shí)間:2022-03-11 11:04:00
導(dǎo)語:ML自動(dòng)化信息方案一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
[摘要]信息是任何電子商務(wù)和電子政務(wù)網(wǎng)站必須解決的技術(shù)問題,本文介紹了一種基于Xml的信息自動(dòng)化方案,方案中無需引入數(shù)據(jù)庫管理系統(tǒng),降低了網(wǎng)站建設(shè)成本,提高了信息的效率。
[關(guān)鍵詞]信息XML電子商務(wù)電子政務(wù)
一、引言
隨著Internet的飛速發(fā)展和普及,電子商務(wù)和電子政務(wù)網(wǎng)站已經(jīng)成為企事業(yè)單位重要的信息平臺(tái),也是人們快速獲取各種信息的重要途徑。目前國內(nèi)很多公司都建立了自己的門戶網(wǎng)站和部門網(wǎng)站,來各類新聞和通知等信息。
當(dāng)前信息大致有兩種方式:第一種是通過固定的模板來信息,即根據(jù)已有的HTML格式的信息模板,通過簡單的內(nèi)容替換來生成靜態(tài)的頁面,然后通過FTP上傳到服務(wù)器,再修改主頁上的連接進(jìn)行;第二種是將信息數(shù)據(jù)保存到數(shù)據(jù)庫或者文件中,當(dāng)用戶閱讀具體信息的時(shí)候,從數(shù)據(jù)庫或文件中調(diào)出數(shù)據(jù),動(dòng)態(tài)生成顯示頁面。
第一種方式,信息格式靈活,顯示速度較快,但整個(gè)過程很繁瑣,維護(hù)起來非常麻煩;第二種方式,信息的和管理比較方便;本文主要介紹一種基于XML的自動(dòng)化信息方案,無需引入數(shù)據(jù)庫系統(tǒng),將靜態(tài)HTML頁面顯示速度快的特點(diǎn)和文件存儲(chǔ)節(jié)省成本和便于維護(hù)的特點(diǎn)相結(jié)合,提供一種便捷的信息和維護(hù)方式,尤其適用于中小型網(wǎng)站信息。
二、XML技術(shù)的特點(diǎn)
XML(extensibleMarkupLanguage)是W3C在1998年9月設(shè)計(jì)的一個(gè)SGML(StandardGeneralizedMarkupLanguage標(biāo)準(zhǔn)通用標(biāo)記語言)的簡化版本。XML是一種簡單而有效的通用語言規(guī)范,屬于元標(biāo)記語言。XML文檔是用純文本編寫的,可以用多種方法創(chuàng)建和編輯。XML文檔允許用戶根據(jù)自己的需要,靈活定義數(shù)據(jù)組織方式。采用XML技術(shù)進(jìn)行數(shù)據(jù)存儲(chǔ)具有以下特點(diǎn):
通用性:XML是開放的國際化標(biāo)準(zhǔn),W3C正式批準(zhǔn)的,具有標(biāo)準(zhǔn)的名域說明方法,支持文檔對象模型標(biāo)準(zhǔn)、可擴(kuò)展類型語言標(biāo)準(zhǔn)、可擴(kuò)展鏈接語言標(biāo)準(zhǔn)和XML指針語言標(biāo)準(zhǔn)。使用XML可以在不同的計(jì)算機(jī)系統(tǒng)間交換信息。
易用性:XML對SGML進(jìn)行了精簡,它拋棄了SGML中不常用的部分,方便用戶編寫Web頁面同時(shí)也給設(shè)計(jì)人員實(shí)現(xiàn)XML瀏覽器降低了困難。
跨平臺(tái)性:由于XML本身具有良好的跨平臺(tái)性,只要數(shù)據(jù)存儲(chǔ)為XML格式,那么這些數(shù)據(jù)就可以被任何其他語言或系統(tǒng)識(shí)別。
高性價(jià)比的存儲(chǔ)方案:相比于普通的文件,XML文檔在數(shù)據(jù)定位和修改等操作方面具有明顯的優(yōu)勢,具有較好的速度和效率;XML文檔可以代替數(shù)據(jù)庫實(shí)現(xiàn)常用的數(shù)據(jù)操作,無需單獨(dú)安裝數(shù)據(jù)庫系統(tǒng)軟件,使得系統(tǒng)的整體成本得以降低。
目前,處理XML文檔的方式主要有SAX與DOM兩種。SAX(SimpleAPIforXML)是一種基于流的,以事件處理方式工作的接口。DOM(DocumentObjectModel)則是在對XML文檔進(jìn)行分析后,在內(nèi)存中建立起一個(gè)完整的樹結(jié)構(gòu),然后在此基礎(chǔ)上進(jìn)行各種操作。簡單地比較來看,SAX對系統(tǒng)資源要求低,速度快,但對文檔的操作是只讀的;DOM的處理能力強(qiáng)大!但要求大量的系統(tǒng)資源,尤其是對于大的文檔。而后還出現(xiàn)了Xpath和XPointer用以完成XML的搜索和轉(zhuǎn)換;XSML和XSLT和SOAP用以完成XML的遠(yuǎn)程對象訪問,XMLQueryLanguages的出現(xiàn)使XML查詢語言可用于任何XML文檔。
三、基于XML的信息方案
公司網(wǎng)站的信息不僅包括新聞,還包括通知,公告,招聘信息和各種動(dòng)態(tài)信息,其整體流程為:系統(tǒng)管理員為信息者設(shè)置權(quán)限,信息者根據(jù)自己的用戶名和口令登錄到信息界面,進(jìn)行信息的和管理,部分信息在前還需要系統(tǒng)管理員進(jìn)行審批。本方案以新聞信息為例進(jìn)行說明:
1.總體設(shè)計(jì)方案
根據(jù)Web軟件B/S結(jié)構(gòu)的特點(diǎn),方案中新聞數(shù)據(jù)的存儲(chǔ)采用XML文件格式,開發(fā)工具選擇ASP[根據(jù)實(shí)際需要,可以自由選擇其他語言工具(如JSP,PHP等)與XML文件自由組合]。
為了充分利用傳統(tǒng)信息中靜態(tài)HTML頁面前臺(tái)顯示速度快的優(yōu)點(diǎn),在新聞數(shù)據(jù)寫入XML文檔的同時(shí),由程序根據(jù)約定模板自動(dòng)生成當(dāng)前新聞的靜態(tài)HTML頁面,采用當(dāng)前時(shí)間作為文件的名稱(如20080201091011.html,此命名方式在新浪網(wǎng)等門戶網(wǎng)站大量使用),同時(shí)為了避免XML文件過大造成解析過慢,新聞分為近期新聞和早起新聞,對于近期新聞采用XML文件和靜態(tài)HTML頁面雙重存儲(chǔ)格式,XML文件用于支持對新聞數(shù)據(jù)的修改,修改后重新生成靜態(tài)HTML頁面用于前臺(tái)顯示;早期新聞只保留靜態(tài)HTML頁面供瀏覽,XML文件中不進(jìn)行數(shù)據(jù)保存,不提供修改操作。管理員可以通過管理界面將當(dāng)前的近期新聞轉(zhuǎn)為過期新聞,轉(zhuǎn)換的同時(shí)將XML文件中對應(yīng)的數(shù)據(jù)刪除。同時(shí)考慮到新聞中經(jīng)常出現(xiàn)的多媒體信息(如圖片,音頻和視頻數(shù)據(jù)),根據(jù)其數(shù)據(jù)量大,獨(dú)立引用的特點(diǎn),只保存多媒體文件的名字,當(dāng)新聞瀏覽時(shí)通過多線程的方式直接到指定目錄進(jìn)行加載。新聞流程如下圖:
信息系統(tǒng)包括前臺(tái)新聞顯示部分和后臺(tái)新聞和維護(hù)部分。核心功能簡介如下:
(1)新聞管理。提供新聞,刪除,編輯,近期新聞轉(zhuǎn)為過期新聞等管理操作。
(2)權(quán)限管理。引入角色組的概念,它是權(quán)限控制的單位,每個(gè)角色組具有對網(wǎng)站部分資源的控制權(quán)限。
(3)用戶管理。提供用戶添加,刪除和修改等操作入口。每個(gè)用戶必須歸屬于某個(gè)角色組。
(4)模板管理。對新聞的靜態(tài)HTML模板進(jìn)行添加,修改和刪除等操作。
(5)文件上傳。將新聞中可能需要鏈接的各種文件上傳到服務(wù)器指定目錄。
2.XML文檔設(shè)計(jì)
XML文檔主要用于保存新聞中的非多媒體信息,多媒體信息則保存目錄信息。每個(gè)新聞節(jié)點(diǎn)中包含了構(gòu)成新聞的各個(gè)要素,內(nèi)容正文部分按段落錄入,為了區(qū)分普通的文本內(nèi)容和多媒體內(nèi)容,每段還包括了段落的標(biāo)識(shí)和段落的內(nèi)容。下面是一個(gè)保存新聞內(nèi)容的XML文檔部分內(nèi)容示例:
<?xmlversion="1.0"encoding="gb2312"?>
<?xml:stylesheettype="text/xsl"?>
<document>
<news>
<title>新聞的標(biāo)題</title>
<date>新聞錄入的時(shí)間</date>
<link>新聞對應(yīng)HTML靜態(tài)頁面鏈接</link>
<class>新聞的類別</class>
<keyWords>新聞的關(guān)鍵字</keyWords>
<author>新聞的作者</author>
<segment>
<segmentTag>段落內(nèi)容的標(biāo)識(shí)</segmentTag>
<segmentContent>段落內(nèi)容數(shù)據(jù)</segmentContent>
</segment>
</news>
</document>
3.關(guān)鍵技術(shù)的研究與實(shí)現(xiàn)
(1)新聞模板設(shè)計(jì)。典型的新聞內(nèi)容中包含新聞的關(guān)鍵字,新聞標(biāo)題,日期,單位,者,正文等要素,信息的關(guān)鍵在于正文數(shù)據(jù)已何種形式寫入到XML文件中。本方案中將新聞的具體內(nèi)容分段進(jìn)行處理,一則新聞的正文部分由若干段組成,每一段的內(nèi)容可以是單一的文本,圖片或者其他允許的多媒體,也可以是多種文件按照一定順序和空間排列的組合形式。信息的初始狀態(tài)每段只有一欄,者可以根據(jù)實(shí)際需要對某一段落進(jìn)行分欄,每一欄內(nèi)放置單一的文件內(nèi)容。從而使得新聞內(nèi)容的組合方式更靈活,簡單,實(shí)用。(2)面向?qū)ο蟮木幋a實(shí)現(xiàn)。方案中服務(wù)器端采用VBScript進(jìn)行編碼,該腳本支持面向?qū)ο蟮木幋a,為了充分發(fā)揮其面向?qū)ο蟮目芍赜眯裕`活高效的特點(diǎn),在對系統(tǒng)整體進(jìn)行編碼進(jìn)行研究和分析之后,引入了面向?qū)ο蟮闹R(shí),設(shè)計(jì)了用于操作XML文件的類。操作主要包括以節(jié)點(diǎn)為單位的獲取,修改,刪除,增加等操作。該類的主要描述如下:
ClassCls_News
‘屬性變量的定義
…………
PublicPropertyGetnewsId
''''獲取XML文件中節(jié)點(diǎn)具體屬性的值
EndProperty
…………
PublicFunctionGetInfoFromXml(objXmlDoc)
''''從Xml中讀取指定節(jié)點(diǎn)的數(shù)據(jù),并填充各個(gè)屬性
EndFunction
PublicFunctionAddToXml(objXmlDoc,xmlFile)
''''添加信息到XML文件中
EndFunction
PublicFunctionEditToXml(objXmlDoc,xmlFile)
''''編輯當(dāng)前XML文件中信息
EndFunction
PublicFunctionDeleteFromXml(objXmlDoc,xmlFile)
''''從XML文件中刪除數(shù)據(jù)
EndFunction
…………
EndClass
四、總結(jié)
本文介紹的技術(shù)已經(jīng)在中小型的電子商務(wù)網(wǎng)站中有了初步的應(yīng)用,高性價(jià)比的存儲(chǔ)方案獲得了單位的充分肯定。當(dāng)然使用過程中我們也發(fā)現(xiàn)一些問題需要改進(jìn),這其中包括加快大數(shù)據(jù)量XML文檔的解析速度,探索XML文檔的檢索方式和增強(qiáng)信息模板的靈活性等幾個(gè)方面的內(nèi)容,這些將是我們后續(xù)研究的主要工作??傊捎肵ML技術(shù)進(jìn)行信息的自動(dòng)化具有很高的實(shí)用意義,尤其是對于中小型電子商務(wù)和電子政務(wù)網(wǎng)站的信息,能夠提供高性價(jià)比的內(nèi)容存儲(chǔ)和方案。
參考文獻(xiàn):
[1]吳志剛等:基于Web的信息資源模型.計(jì)算機(jī)應(yīng)用研究,2000,17(3)
[2]張海永等:精通ASP+XML+CSS網(wǎng)絡(luò)開發(fā)混合編程.電子工業(yè)出版社,2006
[3]魏英:Internet環(huán)境下自動(dòng)新聞系統(tǒng).計(jì)算機(jī)應(yīng)用,2004年第24卷
[4]楊友河等:XML技術(shù)在電子商務(wù)的數(shù)據(jù)中的應(yīng)用研究.機(jī)械,2004年z1期
[5]萬靜等:鐵路貨運(yùn)電子商務(wù)信息規(guī)范-tfbXML注冊中心模式研究.商場現(xiàn)代化,2007年18期
- 上一篇:男性正式禮服穿戴禮儀
- 下一篇:社會(huì)生活禮儀