一、導(dǎo)言
政府信息資源是一切產(chǎn)生于政府內(nèi)部或雖然產(chǎn)生于政府外部但對政府活動有影響的信息資源的統(tǒng)稱。由于政府總以某種方式與人們的工作和生活的每一方面直接或間接相聯(lián)系,因此,政府信息資源的總量常常多得驚人,甚至達到無法計數(shù)的地步。據(jù)統(tǒng)計,目前各級政府部門大約集聚了全社會信息資源總量的80%。這些信息資源常常比一般的信息資源更有價值,其質(zhì)量和可信度也較高,并且直接關(guān)系到國民經(jīng)濟與社會發(fā)展的狀況和水平。如何加強管理、綜合開發(fā)和有效利用這些資源已經(jīng)成為各級政府工作的當務(wù)之急,也是一個值得研究和探討的新領(lǐng)域。
二、研究現(xiàn)狀
⒈國外政府信息資源定位服務(wù)由于元數(shù)據(jù)能夠處理各種形式的信息,包括數(shù)字化及非數(shù)字化的信息,特別是能較好地解決網(wǎng)絡(luò)信息的發(fā)現(xiàn)、控制和管理問題,因此,目前在國際上已廣泛應(yīng)用在包括政府信息、博物館藏品、檔案等各種類型的信息中。目前政府信息的元數(shù)據(jù)格式主要有兩種:政府信息指引服務(wù)(Government I Locater Service,GILS)及都柏林核心元 數(shù)據(jù)集(Dublin Core,DC)。其中依照GIL 發(fā)展指引服務(wù)的國家較多,包括美國、 加拿大、日本、俄羅斯等;以Dublin 為構(gòu)建系統(tǒng)標準的有澳大利亞。在系統(tǒng) 規(guī)格方面,主要遵循Z39.50(信息檢索 應(yīng)用服務(wù)定義和協(xié)議規(guī)范,1996年被 ISO正式確定為信息檢索的國際標準) 的信息檢索標準,可跨資料庫、跨機構(gòu) 組織,甚至跨國界,以單一檢索界面檢 索所需的政府信息資源,使政府信息資 源的共享朝著全球一體化的方向發(fā)展。 美國等發(fā)達國家從20世紀70-80年 代就開始研究和出臺了一系列管理政策,對政府信息資源進行管理。為了整合政府的公共信息資源,為公眾提供單一窗口的政府信息導(dǎo)航、檢索與定位服務(wù),1994年12月,美國商務(wù)部將政府信息定位服務(wù)GILS計劃作為聯(lián)邦政府信息處理標準(FIPS 192)頒發(fā),公布正式建立GILS政府信息定位服務(wù)。此公告要求所有政府機構(gòu)必須實行GILS檢索系統(tǒng)的使用。美國將GILS作為政府信息基礎(chǔ)設(shè)施的核心組成部分進行建設(shè)。
?、参覈?wù)信息資源目錄體系建設(shè)
為充分發(fā)揮信息資源開發(fā)利用在信息化建設(shè)中的重要作用,《中共中央辦公廳國務(wù)院辦公廳關(guān)于加強信息資源開發(fā)利用工作的若干意見》(中辦發(fā)[2004Core34號)、《國家信息化領(lǐng)導(dǎo)小組關(guān)于我國電子政務(wù)建設(shè)指導(dǎo)意見》(中辦發(fā)[200217號)兩個文件中都明確提出了建設(shè)政務(wù)信息資源目錄體系的任務(wù)。為貫徹文件精神,加快政務(wù)信息資源開發(fā)利用建設(shè),解決政府部門間信息資源的查詢和共享,促進跨行業(yè)、跨部門、跨地區(qū)的互連互通,國務(wù)院信息化工作辦公室組織相關(guān)部門編寫了政務(wù)信息資源目錄體系標準。國家電子政務(wù)標準化總體組于2004年11月組建了政務(wù)信息資源目錄體系與交換體系標準編寫組,積極開展該標準編寫工作,并廣泛、認真地征求專家、部委、地方各方面的意見和建議,對該標準予以反復(fù)修改,最終形成了政務(wù)信息資源目錄體系與交換體系》標準征求意見稿。國家標準委2005年8月正式批準成立了政務(wù)信息資源目錄體系與交換體系標準工作組,并于9月底召開了該工作組會議,通過了該標準的征求意見稿。
《政務(wù)信息資源目錄體系與交換體系》中將政務(wù)信息資源目錄體系定為:采集、存儲、使用和管理政務(wù)信資源目錄內(nèi)容,通過元數(shù)據(jù)信息的定位和發(fā)現(xiàn),實現(xiàn)政務(wù)信息資源共享的統(tǒng)。從實踐意義上看,建設(shè)政務(wù)信息源目錄體系,就是要對部門間政務(wù)信資源進行梳理和整合,進行分級、分點、分布式的組織和管理。它體現(xiàn)了種政務(wù)資源的內(nèi)在關(guān)聯(lián),是信息資源享和服務(wù)的一套工具;是方便信息資檢索、定位和共享的應(yīng)用服務(wù)體系。
三、關(guān)鍵技術(shù)研究
⒈元數(shù)據(jù)抽取技術(shù)
政務(wù)信息資源目錄體系中元數(shù)據(jù)式,將遵循國家《政務(wù)信息資源目錄系》標準中的核心元數(shù)據(jù)標準。元數(shù)抽取技術(shù)是指從Web頁面等格式化態(tài)的政務(wù)信息資源中,依照某一元數(shù)標準,自動生產(chǎn)元數(shù)據(jù)的技術(shù)。元數(shù)抽取基于采集系統(tǒng)和存儲系統(tǒng)實現(xiàn),其原理如圖1所示。

?、挪杉到y(tǒng)
采集系統(tǒng)針對一個專題,分以下步進行數(shù)據(jù)采集:
——利用搜索引擎,對設(shè)定的專進行泛搜索,確定探索的范圍;
——利用網(wǎng)絡(luò)蜘蛛,在確定的探索范圍內(nèi)進行泛探索,探尋可能有價值站點
——對有價值的信息源進行監(jiān)視,定時捕獲更新的內(nèi)容;
——數(shù)據(jù)清洗,對捕獲的內(nèi)容進行清洗,只保留關(guān)注的有價值的信息。
?、拼鎯ο到y(tǒng)
存儲系統(tǒng)把捕獲的Web頁面分解為元數(shù)據(jù),并對其分類保存。在這里,存儲的概念不僅是把數(shù)據(jù)放到數(shù)據(jù)庫或者保存到硬盤上,更重要的是根據(jù)一定的目錄體系標準,把數(shù)據(jù)分解為元數(shù)據(jù),然后進行存儲。
?、苍獢?shù)據(jù)管理技術(shù)
政務(wù)信息資源目錄體系中元數(shù)據(jù)的管理包括元數(shù)據(jù)的命名、發(fā)布和訪問,并為用戶提供統(tǒng)一的訪問接口。目錄體系中的所有元數(shù)據(jù)構(gòu)成元數(shù)據(jù)目錄。在元數(shù)據(jù)目錄中,采用統(tǒng)一的結(jié)構(gòu)來描述元數(shù)據(jù),并提供訪問API(Applicat Programming Interface,應(yīng)用程序接口),通過API可以插入、更新、刪除、查詢目錄中的數(shù)據(jù)。它為元數(shù)據(jù)目錄提供統(tǒng)一的邏輯視圖,實際的元數(shù)據(jù)目錄可以是多個異構(gòu)的、分布式的副本的目錄。
《政務(wù)信息資源目錄體系》標準中對于元數(shù)據(jù)的命名規(guī)則、編碼方式以及目錄接口API等技術(shù)要求都有明確描述,在實現(xiàn)中只要嚴格遵循這些描述即可。
?、衬夸浄?wù)技術(shù)
在現(xiàn)實應(yīng)用中,目錄服務(wù)被賦予兩種范圍的含義。其一是較為含混的:任何一個提供分布的用戶命名管理的系統(tǒng) 服務(wù)都被冠以目錄服務(wù)的名稱。例如Email系統(tǒng)中的用戶帳號管理系統(tǒng),NTDomain管理系統(tǒng)等。另一個較為嚴格:目錄服務(wù)被定義成基于X.500系列建議的基于分布網(wǎng)絡(luò)信息處理的、有層次結(jié)構(gòu)的目標管理體系。例如,Novell公司的Novell目錄服務(wù)(NDS),基于LDAP(Lightweight Directory ACC輕量級目錄訪問協(xié)議)的Internet目錄訪問服務(wù),等等。目前,人們基本采用后者的定義來判斷一種服務(wù)是否為目錄服務(wù)。
目錄服務(wù)提供元數(shù)據(jù)目錄的統(tǒng)一邏輯視圖,實現(xiàn)單一系統(tǒng)映像。在實際應(yīng)用中,元數(shù)據(jù)目錄可以采用分布式存儲,每個管理域可以設(shè)置一個元數(shù)據(jù)目錄。政務(wù)信息資源目錄體系的所有服務(wù)都使用元數(shù)據(jù)目錄中存儲的信息,并通過目錄服務(wù)協(xié)議訪問元數(shù)據(jù)。應(yīng)用程序的其它服務(wù)在使用元數(shù)據(jù)信息時,通過元目錄服務(wù)協(xié)議訪問元數(shù)據(jù)。各服務(wù)之間需要通過軟件進行相互協(xié)同。異構(gòu)形式的網(wǎng)絡(luò)應(yīng)用,如Email、數(shù)據(jù)庫服務(wù)、Internet/Intranet訪問等,采用同構(gòu)的目錄服務(wù)。多種應(yīng)用共享一套資源信息,避免了管理上的重復(fù)操作和多系統(tǒng)間的不協(xié)調(diào),提高了應(yīng)用系統(tǒng)的身份驗證安全等級,降低了管理的復(fù)雜度,也方便了用戶的使用(參見圖2)。
基于LDAP實現(xiàn)的政務(wù)信息資源目錄體系,可順利地訪問所有授權(quán)的網(wǎng)絡(luò)資源。具有能在單臺服務(wù)器或全球多服務(wù)器網(wǎng)絡(luò)上管理所有網(wǎng)絡(luò)資源的強大功能,是一種跨平臺、跨地域的目錄服務(wù),且在不同的服務(wù)器上只需登錄一次,就可享受到政務(wù)信息資源目錄體系的服務(wù)。
四、系統(tǒng)設(shè)計實現(xiàn)
⒈體系框架
政務(wù)信息資源目錄體系框架由信息庫系統(tǒng)、標準規(guī)范、技術(shù)支撐平臺、管理機制和服務(wù)模式構(gòu)成。目錄體系建設(shè)和使用過程中存在三類角色:信息提供者、信息使用者和目錄信息管理者,信息提供者確保編目信息的正確性和實時性,信息管理者負責目錄信息的管理、安全、服務(wù)(參見圖3)。

?、蚕到y(tǒng)架構(gòu)
目錄體系分為國家目錄中心、省級目錄中心、地市目錄中心和縣級目錄中心四級。目錄中心是獨立或托管的平臺系統(tǒng)(參見圖4)。在國家目錄中心建立一個統(tǒng)一的全國各目錄中心網(wǎng)絡(luò)地址表,各級目錄中心能夠獲得全國各地的目錄中心網(wǎng)絡(luò)地址,實現(xiàn)各級目錄中心跨地區(qū)的目錄中心訪問。各目錄中心為同級各部門建立固定的目錄區(qū)域。各部門需要進行一次確定身份的登錄注冊。每個部門負責維護目錄中心的各自的部門資源服務(wù)目錄及資源目錄。
⒊技術(shù)架構(gòu)
政務(wù)信息資源目錄體系從技術(shù)架構(gòu)角度劃分為四個系統(tǒng):編目系統(tǒng)、目錄報送系統(tǒng)、目錄管理系統(tǒng)和目錄服務(wù)系統(tǒng),如圖5所示。
?、啪幠肯到y(tǒng)
基于核心元數(shù)據(jù)標準開發(fā)的元數(shù)據(jù)生成工具,從不同形態(tài)的政務(wù)信息資源中,抽取出元數(shù)據(jù),生成目錄。其主要功能如下:
——元數(shù)據(jù)生成:針對已有目錄,采用轉(zhuǎn)換方式生成元數(shù)據(jù);針對網(wǎng)頁、數(shù)據(jù)庫、電子文件,采用自動抽取的方式生成元數(shù)據(jù);針對其他資源,也可利用手工方式進行元數(shù)據(jù)錄入。
——資源編碼:使用資源編碼的前段碼并賦予后段碼,生成資源ID。
——資源分類:對政務(wù)資源進行分類,以自動為主,以手工為輔。
?、颇夸泩笏拖到y(tǒng)
政務(wù)信息資源目錄體系利用電子政務(wù)專網(wǎng)實現(xiàn)元數(shù)據(jù)報送。數(shù)據(jù)報送系統(tǒng)的功能主要將各部門前置機的元數(shù)據(jù)報送到所對應(yīng)的目錄服務(wù)中心。
?、悄夸浌芾硐到y(tǒng)
目錄管理系統(tǒng)包括數(shù)據(jù)互訪平臺、元數(shù)據(jù)管理平臺和系統(tǒng)管理平臺。通過各平臺實現(xiàn)對目錄數(shù)據(jù)服務(wù)的集中管理。它們各自的主要功能如下:
——數(shù)據(jù)互訪平臺:構(gòu)筑一個抽象層的數(shù)據(jù)服務(wù)平臺,構(gòu)筑邏輯上集中,物理上分散的虛擬數(shù)據(jù)庫,并按照標準來對外提供目錄數(shù)據(jù)發(fā)布和目錄數(shù)據(jù)注冊服務(wù)。
——元數(shù)據(jù)管理平臺:用于管理元數(shù)據(jù)的注冊、更新、刪除,并擔負元數(shù)據(jù)有效性檢查的工作。
——系統(tǒng)管理平臺:提供了數(shù)據(jù)庫系統(tǒng)和接口組件服務(wù)器的配置,數(shù)據(jù)的備份、遷移、認證,用戶管理等功能,是提高系統(tǒng)運行可靠性和提高系統(tǒng)可維護性的關(guān)鍵。
?、饶夸浄?wù)系統(tǒng)
發(fā)布系統(tǒng)通過發(fā)布與查詢服務(wù)器將元數(shù)據(jù)按照多種分類方式發(fā)布到政務(wù)目錄中心網(wǎng)站,供使用者進行瀏覽、查詢。發(fā)布方式依據(jù)資源分類標準,在Web頁面展現(xiàn)數(shù)據(jù),并以多種查詢方式向用戶提供目錄服務(wù)。
五、結(jié)束語
政務(wù)信息資源目錄體系建設(shè)是一項長期、細致、復(fù)雜的工作,同時是信息時代一項嶄新的課題,其涉及的范圍廣、部門多。因此在其具體建設(shè)實施時必須遵循國家制定的相關(guān)標準和規(guī)范,將不同種類信息資源進行統(tǒng)一描述,并根據(jù)應(yīng)用需求建立各種目錄分類方法,為存放分散、種類繁多的政務(wù)信息資源提供檢索和導(dǎo)航服務(wù)。政務(wù)信息資源目錄體系的逐漸完善,必將促進對政務(wù)信息資源的進一步開發(fā)和利用。