時間:2019年05月11日 分類:教育論文 次數:
摘要:[目的/意義]在雙一流建設和信息化建設的背景下,實現學科電子檔案資源有效聚合有助于提高學科建設工作效率,引導學科發展。[方法/過程]通過簡述學科電子檔案和資源聚合相關概念,梳理資源聚合的范圍內容和資源間的語義關系,并確定合適的資源聚合方式和工具,構建了基于關聯數據的學科電子檔案資源聚合框架。[結果/結論]框架包括資源層、語義關聯描述層、關聯數據創建層、關聯數據聚合層以及應用服務層五個層次,可用于引導學科電子檔案關聯數據的創建與發布、指導基于關聯數據的學科電子檔案資源聚合的進行以及促進基于關聯數據的學科電子檔案資源聚合平臺的設計與實現等,有助于布局將來的學科發展方向。
關鍵詞:學科電子檔案,聚合框架,關聯數據,學科建設
1引言
隨著2015年國務院對《統籌推進世界一流大學和一流學科建設總體方案》的印發并啟動了中國高校“雙一流”建設,教育部門和高校高度重視學科建設活動。其中,學科評估是學科建設工作中較為重要的一項內容,需要調取、查閱有關學科存檔資料,以此作為數據參考[1]。通過文獻調研發現,目前我國對學科檔案管理的實踐與研究均十分薄弱。
一方面,大多高校的學科檔案建設管理制度不規范,檔案資料散存在多個部門和個人手中[2];同時,隨著網絡和多媒體技術的發展,更多的學科電子檔案由此生成,但大多為簡單存儲,尚未進行整合、形成一個有機整體。另一方面,學科檔案相關研究較少,研究主要集中于對學科檔案管理規范、建設策略以及體系建設等方面的理論研究,學科電子檔案的資源組織和聚合方面還處于研究空白。由此可看出,目前我國對學科檔案管理重視不夠,學科檔案的建設與管理現狀,一定程度上影響了學科建設工作程序化、制度化和規范化發展。
《全國檔案事業發展“十三五”規劃綱要》中明確提出,到2020年,要初步實現以信息化為核心的現代化檔案管理[3]。我國檔案管理工作正處于紙質檔案與電子檔案并重的階段,有學者預見,未來高校檔案必然會發展到以電子檔案管理為主的階段[4]。但電子檔案不是簡單存儲,由于數據量巨大,需要進行語義關聯,將信息盡可能整合在一起,才能幫助有效檢索[5]。由此,本文通過闡述學科電子檔案、資源聚合等相關概念及分析基于關聯數據的學科電子檔案資源聚合的基礎理論,嘗試構建基于關聯數據的學科電子檔案資源聚合框架,用于指導學科電子檔案資源聚合的實現。
2學科電子檔案與資源聚合
2.1學科電子檔案的資源范圍
關于學科檔案的概念,有學者提出是學校在從事學科建設活動中直接形成的對學生、學校和社會有保存價值的各種文字、圖表、聲像等不同形式載體的歷史記錄[6]。學科檔案涉及材料眾多,還未有相關檔案部門對學科檔案歸檔范圍進行說明,但很多研究已涉及該領域。蓋丙蘭通過分析學科檔案管理工作流程,提出學科檔案是學校業務層面上生成的檔案,包括學科建設、教學、科研等相關資料[7]。
李娟認為學科檔案包括學科綜合類檔案、科研類檔案、師資類檔案、社會服務類檔案以及學術交流類檔案[8]。劉恩賢認為學科檔案分為宏觀和微觀兩個層面,宏觀上包括學校上級文件,以及學校組織學科申報、檢查、評估、驗收等活動的資料和文件。微觀上包括師資隊伍、科學研究、人才培養、社會服務、條件建設、學術交流和制度建設等方面的檔案[9]。另外,相關文件內容也有所涉及。
2017年教育部學位中心下發的第四輪學科評估指標體系中明確指出,要以師資隊伍與資源、人才培養質量、科學研究水平和社會服務與學科聲譽為一級評價指標,以師資質量、專任教師數、支撐平臺、培養過程質量、在校生和畢業生質量、學術論文質量、出版專著或教材、社會服務貢獻和學科聲譽為二級指標對學科發展進行評估[10],為了更好的服務學科,學科檔案應該包含以上所有資源材料。
此外,2008年教育部和國家檔案局制定的《高等學校檔案管理辦法》中強調,高等學校應當對紙質檔案材料和電子檔案材料同步歸檔,文件歸檔范圍包括黨群類、行政類、學生類、教學類、科研類、基本建設類、儀器設備類、產品生產類、出版物類、外事類和財會類[11]。本文的研究對象為以計算機磁盤等設備進行存儲的那部分學科檔案,稱為學科電子檔案[12]。
綜合相關研究和文件內容,結合學科電子檔案建設意義——為高校學科建設提供參考,優化學科評估工作,作為考察學校過去一段時間教學與管理水平的憑證,本文認為學科電子檔案包括學科團隊、科學研究、人才培養、條件設施、學術交流、學科社會服務工作以及規劃制度建設等方面的材料。在信息化、現代化為核心的檔案管理背景下,學科電子檔案具有重要價值,是高校科研、教學和學科發展的重要組成部分,需要對其進行充分挖掘和利用。
2.2資源聚合及其方式
資源聚合是指通過智能技術實現資源的融聚并產生新的知識元,旨在發現資源之間的語義關聯,構成一個多層次、系統化的資源有機整體[5]。資源聚合研究著重解決了異構資源的語義關聯和跨庫檢索問題。目前,國內外已運用資源聚合理念,實現了社交網絡平臺、智能web應用、個性化推薦等技術層面的應用[13-16]。基于語義的電子資源聚合方式主要分為基于元數據的資源聚合方式、基于本體的資源聚合方式和基于關聯數據的資源聚合方式三類。
(1)基于元數據的資源聚合方式。元數據作為一種基本的信息資源描述與組織方法,主要用來解決資源管理和共享問題,其資源描述功能在資源存儲與檢索方面發揮了巨大作用。美國博物館采用該聚合方式實現了對IMLS(InstituteofMuseumandLibraryServices,美國博物館與圖書館服務研究所)資助中心內容資源的一站式檢索[17];另外,國內學者張宇等制定了一種伸縮性良好的元數據規范,對分散系統中的異構數據進行了集成,并在醫藥衛生數據共享工程應用中取得良好經濟效益[18]。
(2)基于本體的資源聚合方式。由于元數據在異構資源的描述應用上功能較弱,學者們又提出了基于本體的資源聚合方式。在此基礎上,Kuo提出了基于本體的知識聚合框架[19];Scherl等對大量異構的軍事決策資源進行了智能融合[20];冷伏海采用重構領域本體分類、構建基本類間關系本體和語言分層轉換等方法,促進了特定領域本體的整合[21];曾建勛提出了一種基于科研本體的聚合模型,通過科研實體之間的關聯關系,達到資源聚合的目的[22]。
(3)基于關聯數據的資源聚合方式。基于元數據和本體的資源聚合方式雖然能夠較為全面地描述資源,但無法在多領域的異構資源之間建立語義聯系,如學科電子檔案中的人員類、科研成果類和科研團隊類等。而關聯數據的提出為解決資源的開放聚合提供了新契機。國外已充分利用關聯數據技術,實現了科研人員、所屬機構、研究成果和科研項目之間的整合和集成[23]。在國內,蘇春萍提出了基于關聯數據的醫學圖書館信息整合模型,有助于醫學資源的充分利用[24]。
基于關聯數據的電子資源聚合將成為下一階段資源集成與服務的研究重點。由于學科電子檔案資源種類多,保存格式多樣,如圖片格式、文字格式、網頁格式等,且資源分布在多領域,采用基于元數據和基于本體兩種方法實現學科電子檔案資源聚合顯得比較薄弱。因此,研究采用基于關聯數據的資源聚合方式對學科電子檔案資源進行聚合研究。基于關聯數據的學科電子檔案資源聚合研究目標是,實現學科電子檔案不同類型、不同來源資源的聚集和語義層面上的融合,深化學科檔案信息服務功能,開發利用其潛在價值,從而更好的服務于高校的教學、科研和學科建設,服務于國家的科技發展與經濟建設。
3基于關聯數據的學科電子檔案資源聚合的理論基礎
學科電子檔案資源種類繁多,如學科團隊、科學研究、社會服務等,但各類資源之間存在著較強的語義關系。關聯數據及其技術可將存在關聯關系的各類資源進行語義鏈接,實現資源的聚合和檢索。
3.1學科電子檔案資源間的語義關系
學科電子檔案涉及學科團隊、科學研究、人才培養、條件設施、學術交流、學科社會服務工作以及規章制度建設等方面的資源。各類資源之間具有多種語義關聯關系。學科電子檔案各類資源之間關聯密切,如學科團隊與學科團隊之間的合作與交流關系;學科團隊和學生之間的培養與合作關系;學科團隊與科學研究之間的科研產出關系;科學研究與社會服務之間的相互促進關系等。各類資源及其關聯可借助RDF進行語義描述和鏈接,學科電子檔案各類資源之間關聯關系的存在,使得學科電子檔案資源的語義關聯和聚合成為可能。
3.2關聯數據技術的作用與優勢
關聯數據是將未進行關聯的資源鏈接起來,即在語義網中采用URI和RDF發布、分享和鏈接各類數據、信息和知識[25],可促進資源整合為一個富含語義、互通互聯的有機聚合系統,實現用戶在整個知識領域內資源的準確、可靠查詢與閱覽[26]。
目前,已有學者基于關聯數據實現了對非物質文化遺產、館藏資源、網絡社區學術資源等進行聚合[27-29]。在關聯數據研究領域,存在較為通用的語義描述規范,從不同角度分為關聯數據集的語義化描述、知識組織體系的語義化描述和數字資源描述模型等。這些語義關聯描述模型所涉及的詞表和本體可面向所有資源,無論有形的還是無形的,包括BIBO、PRISM、DC、SWRC、FOAF等。
其中,BIBO作為書目文檔分類本體,主要用于描述語義網中以RDF形式存在的書目資源[30];PRISM可用于在出版渠道和平臺管理等出版內容[31];DC是都柏林核心集,主要用于解決網絡信息資源的描述、控制和管理問題[32];SWRC是為描述與特定研究社區密切相關的各類核心實體,以及他們之間的關聯關系而建立的本體模型[33]。
在構建學科電子檔案資源的關聯數據時,可針對學科電子檔案各類資源的特點和屬性,對現有語義關聯描述模型中的詞表和本體進行復用或適當修改、完善。因此,利用關聯數據可高效地對學科電子檔案資源進行描述,進而實現資源的語義鏈接和資源聚合。
3.3學科電子檔案資源聚合與服務的支撐技術
在確定學科電子檔案能夠建立關聯關系后,可借助各種支撐工具,如將關聯數據的RDF三元組存儲于Virtuoso中,建立索引機制,形成基于語義的關聯數據網以實現資源聚合與發布;或采用D2R開源軟件,實現關系型數據庫的RDF轉換,并通過URI標識資源,以SPARQL查詢功能,提供資源的查詢、檢索服務。還可采用Drupal內容管理系統,結合其內嵌的各管理模塊,動態分配URI,生成關聯數據并發布。
學科電子檔案資源聚合的價值,主要是以面向用戶實現基于關聯數據的信息瀏覽與知識查詢來實現的,包括集成檢索、資源瀏覽以及導航服務。在便捷查詢信息的基礎上,借助關聯數據技術,深入鏈接到其他學科電子檔案相關信息的詳細數據,更多的挖掘出數據網中的知識單元。
4學科電子檔案資源聚合框架及其應用
4.1“框架”的構建
“框架”是建筑學中的概念,表現為一組抽象構件及構件實例間交互的方法,是一種可復用的設計,用于解決或處理復雜問題[34]。在對學科電子檔案資源的語義關系和聚合與服務的支撐技術分析的基礎上,本文構建了基于關聯數據的學科電子檔案資源聚合的框架,包含資源層、語義關聯描述層、關聯數據創建層、關聯數據聚合層以及應用服務層五個部分,各部分由下而上,構成實現基于關聯數據的學科電子檔案資源聚合的完整流程。
(1)資源層。資源層是實現資源聚合的第一步,學科電子檔案資源類型包括學科團隊類資源、科學研究類資源、人才培養類資源等核心資源,涉及的數據類型有圖片、視頻、音頻和word/excel等。在該階段,應全面分析學科電子檔案的資源類、子類、屬性及其關系。
(2)語義關聯描述層。語義關聯描述是學科電子檔案資源關聯數據構建和資源聚合實現的關鍵,該階段主要通過深入分析各類資源的結構、內容和關聯關系,形成語義關聯模型,從而為資源關聯數據的創建奠定基礎。在學科電子檔案領域,可借用BIBO、PRISM、DC、SWRC、FOAF等現有本體或詞表來構建語義關聯模型。
(3)關聯數據創建層。構建了資源的語義關聯模型,下一步驟是借助關聯數據關聯與創建的方法和工具創建關聯數據。主要包括RDFizer、開源工具D2RServer以及關聯關系自動構建工具Silk、LIMES等,這些工具可為不同形式、不同載體、不同內容的學科電子檔案資源關聯數據的創建提供技術支撐。
(4)關聯數據聚合層。該層是連接服務層和語義關聯模型層的中間層,也是實現學科電子檔案資源聚合的又一關鍵程序。目前,有多種工具可用于實現學科電子檔案資源聚合,如艾金勇通過采用D2R服務器、D2RQ引擎與D2RQ映射文件,實現藏書書目數據的深度鏈接和聚合[35];瑞雪娟等借助Drupal工具,實現了多類型學術資源的信息聚合[36]。施旖采用主題圖知識組織技術,對非遺檔案資源進行了聚合,實現了知識定位等多種功能[37]。由此,可根據具體實際情況,選用D2R平臺、Drupal內容管理框架和主題圖知識組織等技術方法實現學科電子檔案資源聚合。
(5)應用服務層。提供更好的資源服務是實現學科電子檔案資源聚合的最終目的,由此,應用服務層處于框架的頂層,是聚合效果的呈現方式。目前,主要可通過專門為用戶提供html瀏覽、RDF瀏覽、語義檢索及知識服務等資源服務形式,實現基于關聯數據的學科電子檔案聚合資源的應用服務。
4.2“框架”的應用
構建基于關聯數據的學科電子檔案資源聚合框架,具有多方面的實際應用功能,具體為:可以引導學科電子檔案關聯數據的創建與發布、指導基于關聯數據的學科電子檔案資源聚合的進行以及促進基于關聯數據的學科電子檔案資源聚合平臺的設計與實現等。
(1)引導學科電子檔案關聯數據的創建與發布。
關聯數據的創建與發布流程較為統一,主要是通過建立資源間的語義關聯,借助相關成熟工具將其轉化為關聯數據并發布。框架的前三個層次就是按照該流程設定的,能夠引導學科電子檔案關聯數據的創建與發布。步驟為通過資源層,明確學科電子檔案具體資源類型,以及資源類的子類、屬性及其關系;而后,進入語義關聯描述層,借助支持學科電子檔案語義描述的本體或詞表,實現資源的語義關聯;最后,依據關聯數據創建層中建議的學科電子檔案資源關聯數據的創建與發布方法,引導實現不同形式、不同載體、不同內容的學科電子檔案資源關聯數據的創建與發布。
(2)指導基于關聯數據的學科電子檔案資源聚合的實現。
基于關聯數據的學科電子檔案資源聚合框架的構建,主要目的就是為了指導基于關聯數據的學科電子檔案資源聚合的進行。在關聯數據聚合層中,已依據現有的資源聚合研究實例,列舉出有效的資源聚合技術方法。資源聚合建立在關聯數據創建的基礎上,在基于前三層次實現學科電子檔案關聯數據創建的前提上,依據一種資源聚合技術,能夠實現學科電子檔案資源聚合。一般促進資源從多種角度進行聚合,以增強資源的關聯強度。
(3)促進基于關聯數據的學科電子檔案資源聚合平臺的設計與實現。
學科電子檔案在實現資源的獲取、描述、關聯以及多種模式的聚合后,可通過設計開發基于數據庫及面向Web的分布式應用系統,即基于關聯數據的學科電子檔案資源聚合服務平臺,從而以更好的形式為特定用戶服務。已有的研究案例表明了實現資源聚合平臺的意義,如劉煒等利用關聯數據技術重組圖書館資源,構建了圖書館歷史文獻服務平臺[38];曾琦研究構建了基于關聯數據的圖書館云服務平臺[39];黃冬春通過構建基于關聯數據的農業科技信息資源服務平臺框架,促進了農業科技方面的用戶知識交流等[40]。
基于關聯數據的學科電子檔案資源聚合平臺的設計與實現,屬于框架的頂層應用服務的設計,此時,該聚合框架可作為服務平臺設計與實現的基礎支撐環節。
5結語
本研究在分析學科電子檔案資源語義關系、關聯數據的作用與優勢以及學科電子檔案資源聚合與服務支撐技術的基礎上,借助關聯數據技術,從語義關聯的角度構建學科電子檔案資源聚合框架,用于指導聚合實現,拓寬學科檔案研究領域,填補研究空白;也可為之后的學科建設活動提供便利,幫助規劃未來的學科發展發向,促進學科檔案工作程序化、制度化和規范化發展。
在“框架”實施時,還要注意以下幾點問題:首先,進行關聯數據聚合時,注意根據數據量大小建立數據管理中心,以便更好地對數據進行維護和管理;由于目前在關聯數據的訪問權限控制上還沒有可使用的標準,由此需要對其安全訪問進行規范化和標準化研究;另外,在實際聚合的過程中,會遇到關聯數據更新問題,直接涉及到數據鏈的修改或刪除的問題,由此,必須要保證關聯的同步更新,避免出現訪問無效死鏈的情況從而影響用戶滿意度。本文提出了“基于關聯數據的學科電子檔案資源聚合”的理論框架,尚未進行實踐驗證。在后續研究中,將以該框架為基礎,實現基于關聯數據的學科電子檔案資源聚合服務。
參考文獻:
[1]方光華.重點突破帶動整體提升,大力推進特色學科發展[J].中國高等教育,2011(Z2):42-43.
[2]劉蓓蕾.大學學科檔案管理體系建設研究[J].佳木斯職業學院學報,2014(2):198-198.
[3]全國檔案事業發展“十三五”規劃綱要[EB/OL].[2017-11-28].http://www.saac.gov.cn/news/2016-04/07/content_136280.htm.
[4]張銀芝.我國高校檔案管理歷史與未來發展趨勢探討[J].辦公室業務,2017(19):116.
[5]畢強.數字資源:從整合到聚合的轉變[J].數字圖書館論壇,2014(6):1.
[6]陸建芳,高正榮,裴春.高校重點學科檔案資源管理與利用[J].蘭臺世界,2015(9):113-114.
[7]蓋丙蘭.高校學科電子檔案系統價值研究[J].辦公自動化:學術版,2014(22):44-46.
相關刊物推薦:《中國高等教育評估》(季刊)創辦于1988年,是中國高等教育評估領域最早的專業刊物。原名為《高教評估信息》,1994年更為現名。本刊由上海市教育委員會主管,上海教科院高教所與中國高教評估研究會主辦。