第一页欧美-第一页综合-丁香花成人另类小说-丁香久久-顶级欧美色妇xxxxbbbb

學術(shù)咨詢

讓期刊論文更省時、省事、省心

檔案機構(gòu)參與科學數(shù)據(jù)歸檔管理的模式、問題與對策

時間:2022年07月01日 分類:經(jīng)濟論文 次數(shù):

摘 要:[目的/意義]檔案機構(gòu)參與科學數(shù)據(jù)歸檔管理,對優(yōu)化科學數(shù)據(jù)管理流程及實現(xiàn)科研檔案與科學數(shù)據(jù)協(xié)同管理具有重要意義。[方法/過程]文章以 DCC 數(shù)據(jù)管護模型作為分析框架,采用案例研究法對國內(nèi)外科研院所、科研型企業(yè)、高等院校的科學數(shù)據(jù)管理實踐實例

  摘 要:[目的/意義]檔案機構(gòu)參與科學數(shù)據(jù)歸檔管理,對優(yōu)化科學數(shù)據(jù)管理流程及實現(xiàn)科研檔案與科學數(shù)據(jù)協(xié)同管理具有重要意義。[方法/過程]文章以 DCC 數(shù)據(jù)管護模型作為分析框架,采用案例研究法對國內(nèi)外科研院所、科研型企業(yè)、高等院校的科學數(shù)據(jù)管理實踐實例進行研究,識別出職能合并式、資源共享式及獨立運行式 3 種檔案機構(gòu)參與科學數(shù)據(jù)管理的主要模式。[結(jié)果/結(jié)論]研究結(jié)果顯示,檔案機構(gòu)當前未能廣泛參與到科學數(shù)據(jù)管理戰(zhàn)略規(guī)劃的制定之中,科學數(shù)據(jù)管理存在數(shù)據(jù)質(zhì)量源頭管控缺乏、數(shù)據(jù)價值鑒定工作缺失、數(shù)據(jù)長期保存技術(shù)單一、數(shù)據(jù)共享利用監(jiān)管有待加強、數(shù)據(jù)集成服務有待完善等問題。未來檔案機構(gòu)應從提升數(shù)據(jù)管理意識、加強與科學數(shù)據(jù)管理機構(gòu)的溝通協(xié)作、推進可行模式的探索等方面積極參與科學數(shù)據(jù)管理。

  關(guān)鍵詞:科學數(shù)據(jù);科研檔案;檔案機構(gòu);數(shù)據(jù)管理

檔案管理

  1 引言

  隨著大數(shù)據(jù)時代的到來和數(shù)字經(jīng)濟的繁榮發(fā)展,數(shù)據(jù)作為生產(chǎn)要素的價值與日俱增。其中,科學數(shù)據(jù)在促進科技創(chuàng)新、國家安全等方面更具有不可替代的戰(zhàn)略價值。在科學研究領域,“數(shù)據(jù)密集型”科研范式的出現(xiàn),標志著未來的科研流程將更大程度地建立在數(shù)據(jù)基礎之上[1]。隨著全球科技創(chuàng)新能力的不斷提升,科學數(shù)據(jù)數(shù)量呈現(xiàn)“井噴式”增長態(tài)勢。以航空航天領域為例,美國航空航天局每天要處理約24 TB 的數(shù)據(jù);我國空間環(huán)境地基監(jiān)測系統(tǒng)“子午工程”一期和二期項目的年生產(chǎn)數(shù)據(jù)總量超過 6.8 PB,數(shù)據(jù)類型超過 200 種[2]。但與此同時,受限于不恰當?shù)墓芾矸绞剑罅繑?shù)據(jù)正面臨著丟失、內(nèi)容不可讀取、共享和復用困難等風險,尤其是不可重復觀測的數(shù)據(jù)更是如此[3]。為此,需要對科學數(shù)據(jù)進行存檔管理,并提供支持信息以促進數(shù)據(jù)復用,實現(xiàn)驗證發(fā)表結(jié)果、開展元分析、提出新問題、增加引用率、支持教學等目標[4]。為了更好地實現(xiàn)科學數(shù)據(jù)全生命周期管理,維護科研成果的完整性,確保研究結(jié)論的長期可應用性,各國政府相繼出臺政策,科研院所、高校紛紛制定規(guī)章制度,以應對日益緊迫的科學數(shù)據(jù)管理問題。

  一些科研資助機構(gòu)、國際監(jiān)管機構(gòu)和科技期刊也要求將原始數(shù)據(jù)保存在永久的開放存取檔案庫中[5]。國務院于 2018 年出臺《科學數(shù)據(jù)管理辦法》(以下稱《辦法》),將科學數(shù)據(jù)管理上升到國家高度,提出了科學數(shù)據(jù)管理原則并明確各責任主體職責[6]。在《辦法》的指導和要求下,我國依托行業(yè)主管部門及科研院所建立了“國家高能物理科學數(shù)據(jù)中心”“國家基因組科學數(shù)據(jù)中心”等 20 個國家科學數(shù)據(jù)中心,對多學科領域的科學數(shù)據(jù)進行管理和共享[7],并形成“數(shù)據(jù)中心”和“數(shù)據(jù)中心+數(shù)據(jù)論文”2 種主要管理模式[8]。但是,在數(shù)字信息資源保存方面具有堅實理論基礎和豐富實踐經(jīng)驗的檔案機構(gòu)在科學數(shù)據(jù)管理中呈現(xiàn)缺位狀態(tài)。2020 年 10 月,《科學技術(shù)研究檔案管理規(guī)定》修訂出臺,明確科學數(shù)據(jù)屬于科研檔案的歸檔范圍[9]。在此背景下,檔案機構(gòu)應如何合理參與科學數(shù)據(jù)管理并發(fā)揮相應的作用成為值得深入探討的議題。

  當前,國內(nèi)外學術(shù)界對于檔案機構(gòu)參與科學數(shù)據(jù)管理的相關(guān)研究較少,多將檔案機構(gòu)作為科學數(shù)據(jù)管理的利益相關(guān)者,探討檔案機構(gòu)參與科學數(shù)據(jù)管理的動因、權(quán)責及有關(guān)路徑。Geoffery 等[10]認為檔案館應保證科學數(shù)據(jù)是長期可用的。Schumann 等[11]提出檔案館可以通過制定可信賴數(shù)字檔案館標準、啟用數(shù)據(jù)批準印章(Data Seal of Approval,DSA)等措施保障社會科學數(shù)據(jù)的真實性。盛小平等[12]認為檔案館是科學數(shù)據(jù)開放共享的利益相關(guān)者之一,具有制定相關(guān)政策標準、收集存儲與組織科學數(shù)據(jù)、提供數(shù)據(jù)培訓與監(jiān)管服務等職責。閆鵬[13]基于利益相關(guān)者理論,提出檔案部門可為科學數(shù)據(jù)管理提供理論指導與實踐服務。何思源等[14-15]從概念、管理、風險收益 3個層面分析了檔案機構(gòu)參與科學數(shù)據(jù)管理的合理性,并提出檔案部門和科學數(shù)據(jù)管理部門的新型協(xié)作模式。王寧等[16]對國際組織相關(guān)成果開展分析,提出檔案學視角下科學數(shù)據(jù)管理的優(yōu)化路徑。霍倩等[17]從政策工具角度分析科學數(shù)據(jù)管理政策,得出檔案部門科學數(shù)據(jù)管理的啟示。

  在國際實踐領域,檔案管理的理念已逐步滲入到科學數(shù)據(jù)管理之中。一方面,部分科學數(shù)據(jù)存儲庫的責任主體并未直接包含檔案機構(gòu),但仍以“數(shù)據(jù)檔案館”命名,如英國數(shù)據(jù)檔案館(UK Data Archive)、愛爾蘭社會科學數(shù)據(jù)檔案館(Irish Social Science Data Archive,ISSDA)等;另一方面,一些檔案機構(gòu)已經(jīng)直接參與到科學數(shù)據(jù)管理之 中 ,如 美 國 國 家 大 氣 科 學 研 究 中 心(NationalCenter for Atmospheric Research,NCAR)下設專門的檔案管理機構(gòu),對其項目產(chǎn)生的科學數(shù)據(jù)進行管理以支持科學研究[18]。丹麥數(shù)據(jù)檔案館(The DanishData Archive)則是由國家檔案館為科研人員和學生提供研究數(shù)據(jù)集[19]。綜上所述,本文從現(xiàn)實出發(fā),選取國外科學數(shù)據(jù)管理實踐典型案例開展比較分析,梳理國內(nèi)外科學數(shù)據(jù)管理工作的現(xiàn)狀與特點,在此基礎上歸納檔案機構(gòu)參與科學數(shù)據(jù)管理的不同模式,并結(jié)合我國當前實際提出針對性的優(yōu)化對策,以期為實現(xiàn)科學數(shù)據(jù)多方協(xié)同共治提供參考借鑒。

  2 研究方法與案例選取

  2.1 研究方法

  本文主要采用案例研究方法,以 DCC 數(shù)據(jù)管護模型為基礎,構(gòu)建理論分析框架,在此基礎上開展對國內(nèi)外科學數(shù)據(jù)管理實踐案例的收集與案例數(shù)據(jù)的分析。在對國內(nèi)案例開展調(diào)研時,輔以焦點小組訪談法,以檔案機構(gòu)工作人員、科學數(shù)據(jù)管理機構(gòu)工作人員為訪談對象,聚焦研究問題進行半結(jié)構(gòu)化訪談,盡可能詳細地考察當前檔案機構(gòu)參與科學數(shù)據(jù)管理的現(xiàn)狀。

  2.2 案例選取與數(shù)據(jù)收集

  本文在案例選取上主要有以下 3 方面的考慮:一是,不同類型機構(gòu)需有較為豐富的科學數(shù)據(jù)管理實踐經(jīng)驗;二是,綜合平衡國內(nèi)外案例,選取不同學科領域具有代表性的檔案機構(gòu)作為調(diào)研對象;三是,調(diào)研對象的科學數(shù)據(jù)管理涵蓋自然科學領域及社會科學領域,應涉及科研院所、科研型企業(yè)、高等院校的科學數(shù)據(jù)管理機構(gòu)(如科學數(shù)據(jù)中心、圖書館)及檔案機構(gòu)。經(jīng)過前期的網(wǎng)絡調(diào)研與文獻回顧,并考慮案例資料的可獲取性,選擇國家空間科學數(shù)據(jù)中心(National Space Science Data Center,NSSDC)、國家基因組科學數(shù)據(jù)中心(National Genomics Data Center,NGDC)、天津中交第一航務勘察設計院有限公司、澳大利亞數(shù)據(jù)檔案館(The Australian Data Archive,ADA)、美國國家大氣研究中心(The National Centerfor Atmospheric Research,NCAR)作為研究案例。

  NSSDC 和 NGDC 分別依托于中科院國家空間科學中心與中科院北京基因組研究所,擁有大量的科學觀測與研究數(shù)據(jù),由于觀測數(shù)據(jù)的收集耗時長、成本高、長期復用價值大,因此,對科學數(shù)據(jù)管理的要求也比較高。NSSDC 是世界數(shù)據(jù)系統(tǒng)(World DataSystem,WDS)的正式成員,是被美國地球物理學會(American Geophysical Union,AGU)認可的學術(shù)論文關(guān)聯(lián)數(shù)據(jù)倉儲庫。2020 年 10 月,NSSDC 通過 CoreTrust Seal 國際數(shù)據(jù)中心資質(zhì)認證,成為亞太地區(qū)空間領域首家通過認證的數(shù)據(jù)中心。NGDC 面向我國人口健康和社會可持續(xù)發(fā)展的重大戰(zhàn)略需求,建立生命組學大數(shù)據(jù)匯交、存儲、安全管理、開放共享與整合挖掘研究體系。

  作為 2019 年我國新批準建設的 2家國家級科學數(shù)據(jù)中心,其科學數(shù)據(jù)管理相較于其他研究機構(gòu)更為成熟,但尚未將檔案機構(gòu)納入管理體系。研究國外同類機構(gòu)的發(fā)展軌跡,探索將具備成熟電子文件管理經(jīng)驗的檔案機構(gòu)納入科學數(shù)據(jù)管理體系,形成更加穩(wěn)定的科學數(shù)據(jù)治理體系,可為我國未來檔案機構(gòu)參與科學數(shù)據(jù)管理提供借鑒。由于部分細節(jié)問題無法通過網(wǎng)絡資源獲取,因此,還對兩所科學數(shù)據(jù)中心的領導、管理人員及技術(shù)人員等進行了半結(jié)構(gòu)化訪談以充實資料。天津中交第一航務勘察設計院有限公司將科研檔案、科學數(shù)據(jù)與企業(yè)知識管理系統(tǒng)相融合,在企業(yè)科學數(shù)據(jù)管理實踐上處于領先地位,因而是一個具有典型意義的研究案例。美國 NCAR 始建于 1960 年,其宗旨是領導和促進大氣、地球和太陽系科學研究和創(chuàng)新[20]。

  NCAR 研究范圍包括氣候變化、大氣成分變化、日地相互作用、天氣信息預報及對人類社會產(chǎn)生的影響,在長期保存與管理科學觀測數(shù)據(jù)方面積累了豐富經(jīng)驗。ADA 隸屬于澳大利亞國立大學社會研究與方法中心(Centre for Social Research and Methods,CSRM),成立于 1981 年,是通過 Core Trust Seal 認證的科學數(shù)據(jù)存儲庫,主要收集保存與社會、政治和經(jīng)濟事務有關(guān)的數(shù)據(jù),為大學、政府和其他部門的眾多社會科學研究者提供在線獲取、記錄、保存和傳播社會科學數(shù)據(jù)的服務[21],在社會科學數(shù)據(jù)管理方面具有代表性。數(shù)據(jù)收集的具體過程如下:

  首先,瀏覽和觀察 5個案例的官方網(wǎng)站,重點關(guān)注與科學數(shù)據(jù)生命周期各個環(huán)節(jié)相關(guān)的政策性文件、平臺資源建設情況,對各案例當前科學數(shù)據(jù)管理的現(xiàn)狀進行初步了解;其次,基于案例分析框架設計半結(jié)構(gòu)化訪談提綱,對國內(nèi) 3 個案例中的 NSSDC、NGDC 和天津中交第一航務勘察設計院有限公司的相關(guān)人員進行深度訪談,涉及目前科學數(shù)據(jù)管理的現(xiàn)狀、面臨的問題與挑戰(zhàn)、對檔案機構(gòu)參與科學數(shù)據(jù)管理的看法和建議等。在征得訪談對象同意后,對訪談過程進行全程錄音,訪談結(jié)束后,盡快轉(zhuǎn)錄錄音文件,形成案例分析的核心資料;最后,為保證數(shù)據(jù)資料的信度和效度,還對不同來源的資料進行三角互證,對存在異議或表述不清楚的內(nèi)容及時通過電話視頻等形式予以補充和校正,以此保證資料收集的真實可靠性。受疫情影響,關(guān)于ADA與NCAR的案例數(shù)據(jù)主要通過互聯(lián)網(wǎng)收集。

  3 研究過程

  3.1 理論框架

  構(gòu)建為了更有效地推進數(shù)據(jù)管理實踐,相關(guān)機構(gòu)紛紛提出概念化模型指導實踐工作,其中以英國數(shù)據(jù)管護中心(Digital Curation Centre,DCC)的數(shù)據(jù)管護模型最具代表性。該模型的適用對象包含任何二進制數(shù)字形式的信息,包括簡單的數(shù)字對象(文本、圖像、聲音文件)、稍復雜的數(shù)字對象(網(wǎng)頁)以及結(jié)構(gòu)化的數(shù)據(jù)存儲庫等[22]。

  數(shù)據(jù)管護生命周期活動包括描述和表示信息、制定保存計劃、社區(qū)觀察與參與、管護和保存,由此引起的順序性行動包括概念化、產(chǎn)生或接收、鑒定與篩選、采集、保存、存儲、獲取、利用、復用、轉(zhuǎn)化與遷移,偶然性行動包括處理、再鑒定和遷移。針對數(shù)據(jù)生命周期順序中的每一個行動,DCC都進行了相應的清單制定以確定該步驟的內(nèi)容要點。DCC 數(shù)據(jù)管護模型揭示了貫穿于數(shù)據(jù)全生命周期的管護行動,本文據(jù)此構(gòu)建案例分析框架,如圖 1所示,用以指導科學數(shù)據(jù)管理實踐案例的分析,探究檔案機構(gòu)參與科學數(shù)據(jù)管理的程度、方式及面臨的問題與挑戰(zhàn)。

  3.2 案例分析

  本文所收集的案例資料主要是政策文件資料和訪談數(shù)據(jù)。根據(jù)案例分析框架,設定政策與訪談定性數(shù)據(jù)內(nèi)容分析編碼表,包括科學數(shù)據(jù)管理的戰(zhàn)略規(guī)劃、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)保存、數(shù)據(jù)利用與服務5 個生命周期階段。同時,運用開放性編碼方法對科學數(shù)據(jù)歸檔保存進行重點分析。其中,政策文件資料采用手動編碼,機構(gòu)工作人員訪談材料錄入 Nvivo 進行系統(tǒng)編碼,并將兩者內(nèi)容進行提煉整合。在此基礎上,對檔案機構(gòu)參與科學數(shù)據(jù)管理的模式與現(xiàn)存問題進行識別與歸納,并針對問題提出對策建議。

  3.2.1 科學數(shù)據(jù)管理生命周期編碼分析由于篇幅限制,此處僅以表格形式歸納 NSSDC、NGDC、天津中交第一航務勘察設計院有限公司、澳大利亞 ADA、美國 NCAR 在戰(zhàn)略規(guī)劃、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)保存、數(shù)據(jù)利用與服務 5 個階段的科學數(shù)據(jù)管理工作要點。

  3.2.2 科學數(shù)據(jù)歸檔保存分析

  歸檔保存是檔案文件全生命周期管理的核心工作,相關(guān)的方法和規(guī)則經(jīng)過多年實踐已經(jīng)十分成熟,但是對于科學數(shù)據(jù)管理而言仍屬于比較新的挑戰(zhàn),一些科學數(shù)據(jù)管理機構(gòu)甚至還未開始考慮數(shù)據(jù)歸檔與長期保存的問題。NSSDC 等 5 家機構(gòu)的科學數(shù)據(jù)歸檔保存方式各有特點。

  4 研究發(fā)現(xiàn)與結(jié)論

  4.1 檔案機構(gòu)參與科學數(shù)據(jù)管理的模式科學數(shù)據(jù)的歸檔保存可以借鑒檔案文件的歸檔管理模式,為檔案機構(gòu)參與科學數(shù)據(jù)管理提供了契機。根據(jù)表 1 和表 2 的案例資料編碼分析結(jié)果,識別出檔案機構(gòu)參與科學數(shù)據(jù)管理的 3 種主要模式:資源共享式、職能合并式及獨立運行式。

  4.1.1 資源共享式NCAR 下設科學數(shù)據(jù)中心、圖書館、檔案機構(gòu)等信息管理機構(gòu),同時配備可以互操作的一站式檢索平臺實現(xiàn)包括科研檔案及科研數(shù)據(jù)在內(nèi)的各類科研信息資源的檢索。本文將此模式界定為科學數(shù)據(jù)與科研檔案的資源共享模式。該模式為實現(xiàn)科學數(shù)據(jù)與科研檔案的協(xié)同管理提供了新思路。在資源共享管理模式下,一站式檢索平臺不僅能更大程度地提高用戶訪問各類科研信息資源的效率,優(yōu)化用戶體驗,同時也能降低日常歸檔、保管和利用服務等有關(guān)工作環(huán)節(jié)所帶來的成本能耗。需要注意的是,該模式需要設置一個專門機構(gòu)進行規(guī)劃指導,通過制定頂層政策、強化溝通聯(lián)系、開展協(xié)同合作等措施,實現(xiàn)跨部門資源的統(tǒng)籌集成與互操作應用。

  4.1.2 職能合并式

  ADA 與我國中交第一航務勘察設計院有限公司將檔案管理和科學數(shù)據(jù)管理的職能進行合并,由同一機構(gòu)統(tǒng)一開展科研信息資源管理工作,本文將此模式界定為科學數(shù)據(jù)與科研檔案管理的職能合并模式。該模式將傳統(tǒng)檔案機構(gòu)成功升級轉(zhuǎn)型,實現(xiàn)科研檔案與科學數(shù)據(jù)的協(xié)同管理,甚至承擔知識管理的職能。職能合并式管理模式對檔案機構(gòu)參與科學數(shù)據(jù)全生命周期管理而言是一種可行的參考模式,該模式下的管理人員應具有“雙重身份”,一方面要深諳現(xiàn)代檔案管理的理念與方法,另一方面又要掌握數(shù)據(jù)挖掘開發(fā)與服務應用的先進技術(shù)。對于大型技術(shù)型企業(yè)和具備條件的科研機構(gòu),可嘗試采用該模式,將科學數(shù)據(jù)與科研檔案的歸檔管理相關(guān)聯(lián),實現(xiàn)科研鏈條全過程管理,為科研活動提供強有力的信息保障支撐。

  4.1.3 獨立運行式

  NSSDC 與 NGDC 在開展科學數(shù)據(jù)管理工作時,尚未與檔案機構(gòu)業(yè)務進行協(xié)同,本文將此模式界定為科學數(shù)據(jù)管理中心的獨立運行管理模式。該模式下科學數(shù)據(jù)管理機構(gòu)與檔案機構(gòu)互不干涉,各有側(cè)重。科學數(shù)據(jù)管理機構(gòu)側(cè)重于科學數(shù)據(jù)本身的統(tǒng)一開發(fā)與利用。檔案機構(gòu)側(cè)重于科研檔案的管理,重記憶留存,對科學數(shù)據(jù)本身歸檔的指導與干預較少。由于檔案機構(gòu)在數(shù)據(jù)管理技術(shù)和分析利用方面的水平尚不及科學數(shù)據(jù)中心,因此,獨立運行模式是當前我國科學數(shù)據(jù)管理最普遍的模式。總體而言,在科研范式轉(zhuǎn)變的新時代學術(shù)背景下,檔案機構(gòu)亟需重新審視自身定位。隨著《科學數(shù)據(jù)管理辦法》《科學技術(shù)研究檔案管理規(guī)定》等相關(guān)法規(guī)的實施,檔案機構(gòu)以科研檔案管理為切入點深度參與科學數(shù)據(jù)管理勢在必行,檔案機構(gòu)協(xié)同科學數(shù)據(jù)中心、圖書館等信息機構(gòu)實現(xiàn)科研過程全鏈條的信息保障工作將是未來科學數(shù)據(jù)管理的重點。

  4.2 科學數(shù)據(jù)中心獨立運行模式存在的問題

  通過前述案例訪談及實際調(diào)研可知,天津中交第一航務勘察設計院有限公司、ADA、NCAR 的檔案機構(gòu)已通過職能合并或資源共享模式參與科學數(shù)據(jù)管理。本文主要結(jié)合檔案管理理論與方法,探討獨立運行模式下 NSSDC 與 NGDC 的科學數(shù)據(jù)管理實踐現(xiàn)狀及存在問題,從中發(fā)現(xiàn)檔案機構(gòu)參與科學數(shù)據(jù)管理的契機并提出對策建議。

  4.2.1 檔案機構(gòu)戰(zhàn)略規(guī)劃失位的問題檔案機構(gòu)職能缺位,參與科學數(shù)據(jù)管理的合規(guī)性不足。根據(jù)《科學數(shù)據(jù)管理辦法》及調(diào)研發(fā)現(xiàn),在管理范疇上,當前我國科學數(shù)據(jù)管理的戰(zhàn)略規(guī)劃對象主要還是聚焦于科學數(shù)據(jù)本身,與科學數(shù)據(jù)相關(guān)聯(lián)的文檔與背景信息等并未被納入其中。在管理機構(gòu)方面,較為強調(diào)科學數(shù)據(jù)中心對科學數(shù)據(jù)進行全生命周期管理,而檔案機構(gòu)未被認定為科學數(shù)據(jù)管理的法定責任主體。在獨立運行模式下,科學數(shù)據(jù)由科學數(shù)據(jù)中心保存管理,科研檔案則由中科院檔案館保管,兩者之間的天然聯(lián)系被割裂,在管理上基本不存在業(yè)務協(xié)同,未實現(xiàn)各類科研信息資源的集成與互操作,難以滿足研究者在同一時間點既獲取科學數(shù)據(jù)又了解其科研項目背景信息的需求。

  4.2.2 科學數(shù)據(jù)源頭失控的問題科學數(shù)據(jù)缺乏源頭管控,數(shù)量完整性難以得到保障。當前,科學數(shù)據(jù)管理機構(gòu)未在科研項目立項時對科學數(shù)據(jù)實施源頭管控,科學數(shù)據(jù)的質(zhì)量也因此受到一定影響。研究發(fā)現(xiàn),科研人員主動向科學數(shù)據(jù)中心匯交的科學數(shù)據(jù)主要包括 2 類:項目研究數(shù)據(jù)、論文發(fā)表所形成和使用的數(shù)據(jù)。一方面,項目研究所產(chǎn)生的數(shù)據(jù)是否完全匯交,在很大程度上取決于科研人員的個人意愿,部分項目存在科研人員流動風險,使得數(shù)據(jù)極易留存在科研人員手中,出現(xiàn)數(shù)據(jù)孤島問題;另一方面,因發(fā)表論文需要,一些調(diào)查、實驗所形成的數(shù)據(jù)流入國際數(shù)據(jù)庫,導致數(shù)據(jù)主權(quán)喪失檔案管理部門在價值鑒定、安全審查方面已經(jīng)形成成熟規(guī)范,但由于沒有從一開始就介入科研數(shù)據(jù)管理的戰(zhàn)略規(guī)劃與制度建設,致使科學數(shù)據(jù)面臨散失與流失風險,完整性難以得到保障。

  4.2.3 科學數(shù)據(jù)價值鑒定缺失的問題

  數(shù)據(jù)價值鑒定工作缺失,管理成本與效益難以平衡。當前,科學數(shù)據(jù)數(shù)量呈指數(shù)級增長,開展數(shù)據(jù)價值鑒定工作已迫在眉睫。數(shù)據(jù)價值鑒定工作主要包括 2 個方面:一是確定數(shù)據(jù)的保存期限;二是對保存期滿的數(shù)據(jù)進行續(xù)存、銷毀等處理。研究發(fā)現(xiàn),科學數(shù)據(jù)管理機構(gòu)缺乏完備的科學數(shù)據(jù)價值鑒定方案,難以準確判斷數(shù)據(jù)保存價值、合理劃分數(shù)據(jù)保存期限及對失去保存價值數(shù)據(jù)的處置方式,在對數(shù)據(jù)的價值鑒定主體、鑒定方法、保存期限、銷毀方式等關(guān)鍵問題上均未形成科學認知。如 NSSDC 和 NGDC目前采取“一刀切”方式,即永久保存所有科學數(shù)據(jù),尚未考慮數(shù)據(jù)刪除或銷毀問題,只有當科學數(shù)據(jù)出現(xiàn)重大質(zhì)量問題如存在造假、篡改時,才會啟動銷毀程序。隨著科學數(shù)據(jù)的不斷增加,尤其在當前“碳達峰”與“碳中和”的能源約束條件下,一刀切模式將會帶來管理成本投入增加與利用效益不平衡的風險。

  4.2.4 科學數(shù)據(jù)存儲技術(shù)單一的問題

  數(shù)據(jù)保存技術(shù)單一,難以維護數(shù)據(jù)的長期可讀性。科學數(shù)據(jù)在長期保存過程中會面臨格式過時、算法陳舊、版本升級、儲存庫變遷等諸多問題,科學數(shù)據(jù)管理機構(gòu)需制定長遠的保存規(guī)劃,在技術(shù)可行、成本可控、風險可預的前提下,采取綜合性的保障手段進行應對[23]。調(diào)研發(fā)現(xiàn),科學數(shù)據(jù)中心長期保存科學數(shù)據(jù)的技術(shù)較為單一,如 NSSDC 僅采用容災備份這一常規(guī)手段對不可再生的科學數(shù)據(jù)(如衛(wèi)星的原始觀測數(shù)據(jù)等)進行長期保存,雖然也會根據(jù)科學數(shù)據(jù)的存儲量及活躍度進行遷移處理,但事實上,這些技術(shù)難以保證科學數(shù)據(jù)在長期保存過程中運維環(huán)境的一致性及數(shù)據(jù)內(nèi)容的完整性,數(shù)據(jù)的可讀性仍然受到挑戰(zhàn)。

  4.2.5 科學數(shù)據(jù)共享中存在數(shù)據(jù)濫用的問題

  在科學數(shù)據(jù)共享與服務中,數(shù)據(jù)濫用行為缺乏監(jiān)管,數(shù)據(jù)集成服務有待完善。合理安全利用科學數(shù)據(jù)對維護國家安全、社會公共利益、商業(yè)機密、個人隱私具有重要意義[6]。科學數(shù)據(jù)中心目前已采取多種方式保障科學數(shù)據(jù)的安全利用。以 NSSDC 為例,一是,實行科學數(shù)據(jù)分級分類管理,如按照數(shù)據(jù)來源項目、所屬領域、使用熱度等確定管理級別;二是,簽訂共享協(xié)議,依據(jù)科研人員要求,部分科學數(shù)據(jù)需申請使用;三是,設置數(shù)據(jù)保護期,如天文領域的科學數(shù)據(jù)在保護期內(nèi)(可為 1 年、2 年、3 年等)暫不公開共享。以上措施主要約束了科學數(shù)據(jù)的利用權(quán)限、利用范圍與利用時效,而較少涉及科學數(shù)據(jù)的利用途徑與利用行為,隱私泄露、違規(guī)利用等濫用問題無法得到有效解決。此外,科學數(shù)據(jù)中心通過線上線下提供多元的數(shù)據(jù)服務,包括數(shù)據(jù)應用工具開發(fā)、數(shù)據(jù)產(chǎn)品定制、數(shù)據(jù)系統(tǒng)設計與建設、數(shù)據(jù)出版、異構(gòu)數(shù)據(jù)庫一站式檢索等多項服務,但還未能實現(xiàn)科學數(shù)據(jù)與相關(guān)科技文件材料、科研檔案之間的整合與互操作,而這也是未來檔案機構(gòu)參與科學數(shù)據(jù)管理的建設重點。

  5 結(jié)語

  本文主要采用案例研究方法,通過對 NSSDC、NGDC、天津中交第一航務勘察設計院有限公司、ADA、NCAR 等國內(nèi)外案例進行分析研究,識別出職能合并式、資源共享式、獨立運行式 3 種檔案機構(gòu)參與科學數(shù)據(jù)管理的模式。調(diào)研發(fā)現(xiàn),當前檔案機構(gòu)未能參與到科學數(shù)據(jù)管理戰(zhàn)略規(guī)劃的制定之中,科學數(shù)據(jù)管理存在數(shù)據(jù)質(zhì)量源頭管控缺乏、數(shù)據(jù)價值鑒定方案缺失、數(shù)據(jù)長期保存技術(shù)單一、數(shù)據(jù)共享利用監(jiān)管有待加強、數(shù)據(jù)與檔案文件的關(guān)聯(lián)服務有待完善等問題。未來檔案機構(gòu)應從提升數(shù)據(jù)管理意識、加強與科學數(shù)據(jù)管理機構(gòu)的溝通協(xié)作、推進可行模式的試點探索等方面參與科學數(shù)據(jù)管理。

  受限于案例資料的可獲取性,本文未能將國內(nèi)高校的科學數(shù)據(jù)管理實踐納入案例對象。事實上,隨著科學研究范式的轉(zhuǎn)型發(fā)展和科研檔案及科學數(shù)據(jù)管理的不斷深化,如何發(fā)揮檔案機構(gòu)在科學數(shù)據(jù)管理中的作用,如何實現(xiàn)科學數(shù)據(jù)與科研檔案的協(xié)同管理,這些問題值得深入探討。未來可對不同國家、不同地區(qū)、不同類型的科學數(shù)據(jù)管理機構(gòu)及檔案機構(gòu)展開更為廣泛的調(diào)研考察與對比分析,結(jié)合科研人員對科研檔案及科學數(shù)據(jù)的利用需求,提出更具合理性、適用性與實踐性的研究結(jié)論。

  參考文獻:

  [1] HEY T,TANSLEY S,TOLLE K.The Fourth Paradigm:Data-Intensive Scientific Discovery[M].Published byMicrosoft Research,2009.

  [2] 國家空間科學數(shù)據(jù)中心.數(shù)據(jù)來源[EB/OL].(2020-09-20)[2022-03-19].

  [3] 王芳,慎金花.國外數(shù)據(jù)管護(Data Curation)研究與實踐進展[J].中國圖書館學報,2014,40(04):116-128.

  [4] WHITLOCK M C. Data archiving in ecology and evolution:best practices[J]. Trends in Ecology andEvolution,2011,26(02):61-65.

  [5] MILLS J A,TEPLITSKY C,ARROYO B,et al.Archiving Primary Data:Solutions for Long-Term Studies[J].Trends in Ecology & Evolution,2015,30(10):581-589.

  [6] 國務院辦公廳.國務院辦公廳關(guān)于印發(fā)科學數(shù)據(jù)管理辦法的通知[EB/OL].(2018-03-17)[2022-03-19].

  選自期刊《科技情報研究》第4卷第3期

  作者信息:❋王 芳1 韓家鈺2 卜昊昊31.南開大學商學院信息資源管理系,天津 3000712.中國航空工業(yè)集團公司西安航空計算技術(shù)研究所,西安 7100683.中國人民大學信息資源管理學院,北京 100872

主站蜘蛛池模板: 亚洲一区二区三区高清 | 中文一区二区在线观看 | 99999久久久久久亚洲 | 午夜影视水蜜桃网站 | 精品中文字幕制服中文 | 国产成人精选免费视频 | 日韩欧美在线综合网 | 日本在线黄色网址 | 久久综合免费视频 | 国产污片在线观看 | 欧美人一级淫片a免费播放 欧美人七十二式性视频教程一 | 在线观看中文字幕第一页 | 美女一级牲交毛片视频 | 狠狠色丁香久久婷婷综合_中 | 亚洲欧美在线播放 | 日韩欧美成人乱码一在线 | 激情五月色综合亚洲小说 | 老人与老人免费a级毛片 | 在线免费黄 | 久热精品男人的天堂在线视频 | 韩国毛片在线观看 | 中日韩国语视频在线观看 | 日韩专区亚洲国产精品 | 777奇米影视笫四色88me久久综合 | 久久性妇女精品免费 | 未成人禁止视频高清在线观看 | 色拍拍在线精品视频 | 国产午夜精品理论片久久影视 | 国产精品午夜性视频网站 | 亚洲国产美女精品久久 | 久久这里只有精品免费看青草 | 道日本一本草久 | 国产色婷婷精品综合在线观看 | 亚洲激情综合网 | 国产精品第4页 | 看黄视频在线观看 | 国产精品欧美亚洲韩国日本久久 | 黄色一级片免费看 | 真正毛片| 在线观看国产一区二区三区99 | 日韩精品亚洲专区在线观看 |