第一页欧美-第一页综合-丁香花成人另类小说-丁香久久-顶级欧美色妇xxxxbbbb

學(xué)術(shù)咨詢

讓期刊論文更省時(shí)、省事、省心

圖數(shù)據(jù)庫在復(fù)雜網(wǎng)絡(luò)分析中的研究與應(yīng)用進(jìn)展

時(shí)間:2022年01月04日 分類:電子論文 次數(shù):

摘要:目的圖數(shù)據(jù)庫作為存儲(chǔ)網(wǎng)絡(luò)數(shù)據(jù)的主流工具,在復(fù)雜網(wǎng)絡(luò)分析中的研究與應(yīng)用不斷豐富,本文系統(tǒng)梳理了圖數(shù)據(jù)庫在復(fù)雜網(wǎng)絡(luò)領(lǐng)域的應(yīng)用進(jìn)展和研究趨勢(shì)。文獻(xiàn)范圍以WebofScience核心數(shù)據(jù)庫、Scopus、CNKI數(shù)據(jù)庫為檢索中英文文獻(xiàn)的來源,對(duì)15個(gè)圖數(shù)據(jù)庫相關(guān)網(wǎng)頁、21個(gè)實(shí)

  摘要:目的圖數(shù)據(jù)庫作為存儲(chǔ)網(wǎng)絡(luò)數(shù)據(jù)的主流工具,在復(fù)雜網(wǎng)絡(luò)分析中的研究與應(yīng)用不斷豐富,本文系統(tǒng)梳理了圖數(shù)據(jù)庫在復(fù)雜網(wǎng)絡(luò)領(lǐng)域的應(yīng)用進(jìn)展和研究趨勢(shì)。文獻(xiàn)范圍以WebofScience核心數(shù)據(jù)庫、Scopus、CNKI數(shù)據(jù)庫為檢索中英文文獻(xiàn)的來源,對(duì)15個(gè)圖數(shù)據(jù)庫相關(guān)網(wǎng)頁、21個(gè)實(shí)踐案例、14篇研究論文進(jìn)行詳細(xì)調(diào)研和綜述。方法本文對(duì)比分析了國內(nèi)外主流圖數(shù)據(jù)庫,嘗試探討最新的圖數(shù)據(jù)庫解決方案在復(fù)雜網(wǎng)絡(luò)分析中應(yīng)用,包括中心性、路徑查找、鏈路預(yù)測(cè)、社區(qū)檢測(cè)等在內(nèi)的算法、圖可視化、性能及應(yīng)用實(shí)例。[結(jié)果]圖數(shù)據(jù)庫已經(jīng)成為復(fù)雜網(wǎng)絡(luò)分析與大數(shù)據(jù)挖掘重要的分析工具與研究手段,不僅是復(fù)雜網(wǎng)絡(luò)分析一站式解決方案,還與圖計(jì)算引擎等工具結(jié)合使用。[局限]圖數(shù)據(jù)庫應(yīng)用場(chǎng)景非常多,本文未能完整覆蓋,僅選取2-3個(gè)有代表性的案例進(jìn)行闡述。[結(jié)論]圖數(shù)據(jù)庫對(duì)于查詢、表示和挖掘網(wǎng)絡(luò)數(shù)據(jù)效果顯著,能較為直觀分析和發(fā)現(xiàn)圖結(jié)構(gòu)中有意義的模式或結(jié)構(gòu),其對(duì)數(shù)據(jù)密集型的多維特征的呈現(xiàn)更接近現(xiàn)實(shí),是未來挖掘隱含關(guān)系的重要工具。

  關(guān)鍵詞:知識(shí)圖譜;圖數(shù)據(jù)庫;復(fù)雜網(wǎng)絡(luò)

復(fù)雜網(wǎng)絡(luò)信息

  1引言

  隨著人工智能時(shí)代的到來,知識(shí)表示和推理已成為高質(zhì)量決策過程中的一個(gè)重要環(huán)節(jié),旨在為智能系統(tǒng)表示知識(shí)以解決更為復(fù)雜的任務(wù)[1]。知識(shí)圖譜(KnowledgeGraph)作為一個(gè)知識(shí)數(shù)據(jù)庫,代表了實(shí)體之間結(jié)構(gòu)關(guān)系,其中蘊(yùn)含的信息以能夠產(chǎn)生知識(shí)的方式進(jìn)行結(jié)構(gòu)化[2],它已經(jīng)成為大數(shù)據(jù)分析、語義網(wǎng)、自然語言處理(NLP)、自動(dòng)問答、知識(shí)管理、鏈路預(yù)測(cè)等領(lǐng)域的交叉研究熱點(diǎn)。

  從通用知識(shí)圖譜到領(lǐng)域知識(shí)圖譜,知識(shí)圖譜的有效性和普及性大大提升,對(duì)客觀世界的描述也越來越深入、細(xì)化。作為非關(guān)系型數(shù)據(jù)庫的典型代表,圖數(shù)據(jù)庫(Graphdatabase)既能夠存儲(chǔ)知識(shí)圖譜中由概念、實(shí)體、關(guān)系和屬性所構(gòu)成的網(wǎng)絡(luò)數(shù)據(jù),還能夠基于節(jié)點(diǎn)、關(guān)系、屬性的數(shù)據(jù)結(jié)構(gòu)進(jìn)行基于圖的數(shù)據(jù)存儲(chǔ)、查詢和挖掘,且已經(jīng)產(chǎn)生了以圖為中心的新型大數(shù)據(jù)技術(shù)棧[3]。因此,圖數(shù)據(jù)庫作為存儲(chǔ)網(wǎng)絡(luò)數(shù)據(jù)的主流工具之一,它在復(fù)雜網(wǎng)絡(luò)分析中發(fā)揮著越來越重要的作用。

  根據(jù)權(quán)威數(shù)據(jù)庫研究網(wǎng)站DB-engines[4],圖數(shù)據(jù)庫自2013年以來一直是最受歡迎的數(shù)據(jù)庫,在社交媒體、零售業(yè)、金融、汽車制造商、電信及酒店等許多領(lǐng)域得到應(yīng)用,主要包括社交關(guān)系管理、實(shí)時(shí)推薦商品、風(fēng)控、推動(dòng)創(chuàng)新制造解決方案、管理網(wǎng)絡(luò)控制訪問以及復(fù)雜酒店庫存管理等。與傳統(tǒng)關(guān)系數(shù)據(jù)庫二維表存儲(chǔ)方式相比,圖數(shù)據(jù)庫的優(yōu)勢(shì)在于:(1)能夠以圖的形式存儲(chǔ)實(shí)體及其連接[5],在節(jié)點(diǎn)和關(guān)系之間的查詢更加簡(jiǎn)單快捷;(2)具備處理超過10GB大型異構(gòu)數(shù)據(jù)集的能力,更豐富的數(shù)據(jù)與更高效的查詢相結(jié)合[6];(3)最大限度地減少編碼決策,可重復(fù)提取復(fù)雜結(jié)構(gòu)信息;(4)有助于多模網(wǎng)絡(luò)分析的推廣[7],在映射真實(shí)實(shí)體和關(guān)系方面具有天然優(yōu)勢(shì)[8]。

  目前,它已經(jīng)在社交網(wǎng)絡(luò)、生物醫(yī)學(xué)網(wǎng)絡(luò)、恐怖主義網(wǎng)絡(luò)等高度關(guān)聯(lián)、節(jié)點(diǎn)多類型的領(lǐng)域顯示出廣泛的應(yīng)用潛力。近年來,隨著一大批開源或商用的圖數(shù)據(jù)庫工具的涌現(xiàn),集成了大量的數(shù)據(jù)挖掘算法與應(yīng)用,主要包括中心性、路徑查找、鏈接預(yù)測(cè)、社區(qū)檢測(cè)和圖可視化,有助于發(fā)現(xiàn)知識(shí)圖譜中的潛在知識(shí)。本文首先對(duì)國內(nèi)外主流圖數(shù)據(jù)庫進(jìn)行調(diào)研梳理,聚焦比較圖數(shù)據(jù)庫應(yīng)用中開發(fā)人員比較關(guān)心的查詢語言、支持接口和集成算法,系統(tǒng)整理了圖數(shù)據(jù)庫在復(fù)雜網(wǎng)絡(luò)分析中的主要算法和應(yīng)用進(jìn)展,以便為推動(dòng)圖數(shù)據(jù)庫技術(shù)在復(fù)雜網(wǎng)絡(luò)分析中的應(yīng)用提供參考。

  2國內(nèi)外主流圖數(shù)據(jù)庫

  通過對(duì)國內(nèi)外圖數(shù)據(jù)庫進(jìn)行調(diào)研,整理出當(dāng)下主流的圖數(shù)據(jù)庫,如表2和表3所示,針對(duì)研究人員關(guān)心的查詢語言、支持接口和集成算法等內(nèi)容進(jìn)行對(duì)比分析。

  首先,國內(nèi)圖數(shù)據(jù)庫的查詢語言主要采用的是Gremlin或Cypher,同時(shí)這也是目前圖數(shù)據(jù)庫領(lǐng)域最流行的兩種查詢語言;除此之外,GeaBase提供了自研的查詢語言,其語法是嵌套式“操作符+屬性”結(jié)構(gòu),單獨(dú)的操作符和屬性構(gòu)成一組獨(dú)立的功能;NebulaGraph采用聲明式圖查詢語言nGQL,這是為開發(fā)和運(yùn)維人員設(shè)計(jì)的類SQL查詢語言,易于學(xué)習(xí),同時(shí)兼容OpenCypher。其次,在支持接口方面,部分開源圖數(shù)據(jù)庫給開發(fā)者提供了多種編程語言調(diào)用接口,如Python、Java、Go等,也有數(shù)據(jù)庫并未指明支持的接口。第三,在集成算法方面,大多數(shù)圖數(shù)據(jù)庫都支持包括PageRank、中心性、社區(qū)檢測(cè)等相關(guān)圖算法,即使部分?jǐn)?shù)據(jù)庫的內(nèi)置圖算法種類較少,但其支持豐富的圖算法擴(kuò)展包,仍然可以滿足研究人員的需求。

  國外圖數(shù)據(jù)庫查詢語言的種類較為豐富,除了被廣范應(yīng)用的Cypher和Gremlin外,Neptune和AllegroGraph還支持SPARQL查詢語言,而TigerGraph和ArangoDB則在標(biāo)準(zhǔn)數(shù)據(jù)庫查詢語言SQL的基礎(chǔ)上研發(fā)了其他的查詢語言GSQL和AQL;目前,最獨(dú)樹一幟的是OrientDB,其支持廣泛使用且易于理解的SQL語言查詢功能。在支持接口方面,國外圖數(shù)據(jù)庫表現(xiàn)更為多樣化,幾乎都支持市面上主流編程語言的API調(diào)用。在集成算法方面,Neo4j和TigerGraph幾乎涵蓋了大多數(shù)圖算法,AllegroGraph、JanusGraph和ArangoDB支持的圖算法相對(duì)較少,且種類單一,OrientDB在這方面并不支持常見的圖算法,只提供索引算法。

  3圖數(shù)據(jù)庫在復(fù)雜網(wǎng)絡(luò)分析中的主要算法及應(yīng)用

  復(fù)雜網(wǎng)絡(luò)(ComplexNetwork)分析是將現(xiàn)實(shí)生活中的復(fù)雜關(guān)系進(jìn)行抽象和挖掘的過程,許多現(xiàn)實(shí)網(wǎng)絡(luò)(例如交通系統(tǒng)、社交網(wǎng)絡(luò)、蛋白質(zhì)結(jié)構(gòu)等)都是以復(fù)雜網(wǎng)絡(luò)形式存在[24]。近年來,復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)由于其強(qiáng)大的節(jié)點(diǎn)和連接的表達(dá)能力、高度復(fù)雜性的呈現(xiàn)能力受到眾多關(guān)注和研究。

  一方面,圖數(shù)據(jù)庫在分析復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)的時(shí)候具備天然的存儲(chǔ)和計(jì)算優(yōu)勢(shì),因此大部分圖數(shù)據(jù)庫都集成了復(fù)雜網(wǎng)絡(luò)分析中的常見算法,另一方面,復(fù)雜網(wǎng)絡(luò)分析需要圖可視化技術(shù)進(jìn)行結(jié)果呈現(xiàn)和分析解讀,因此圖數(shù)據(jù)庫通過集成或在線等方式提供多種圖布局解決方案。本文根據(jù)復(fù)雜網(wǎng)絡(luò)領(lǐng)域中的中心性、路徑查找、鏈接預(yù)測(cè)、社區(qū)檢測(cè)和圖可視化五大應(yīng)用場(chǎng)景,綜述了國內(nèi)外主流圖數(shù)據(jù)庫在復(fù)雜網(wǎng)絡(luò)分析領(lǐng)域的重要圖算法及相關(guān)圖布局。

  3.1中心性

  中心性(Centrality)是復(fù)雜網(wǎng)絡(luò)研究中的重要問題之一,研究的是網(wǎng)絡(luò)中不同節(jié)點(diǎn)的重要性,通常從節(jié)點(diǎn)在網(wǎng)絡(luò)中的位置、可訪問性和置信度等角度識(shí)別特定節(jié)點(diǎn)的角色和對(duì)網(wǎng)絡(luò)的影響。中心性算法可分為兩種:(1)基于相鄰節(jié)點(diǎn)的重要性計(jì)算重要性,包括PageRank、ArticleRank、特征向量中心性(EigenvectorCentrality)等;(2)基于節(jié)點(diǎn)自身特征計(jì)算重要性,包括計(jì)算當(dāng)前節(jié)點(diǎn)出入度數(shù)量、當(dāng)前節(jié)點(diǎn)與其它節(jié)點(diǎn)之間的平均距離、當(dāng)前節(jié)點(diǎn)出現(xiàn)在任意兩個(gè)節(jié)點(diǎn)的最短路徑中的次數(shù)三種方式,由此產(chǎn)生了度中心性(DegreeCentrality)、接近中心性(ClosenessCentrality)、中介中心性(BetweenCentrality)算法。圖數(shù)據(jù)庫中心性分析已經(jīng)被用于識(shí)別保險(xiǎn)/銀行欺詐、分析藥品處方模式、科技管理決策以及評(píng)估社交網(wǎng)絡(luò)集群等。

  國內(nèi)應(yīng)用場(chǎng)景出現(xiàn)在保險(xiǎn)、科研管理等領(lǐng)域。周曉楠等(2020)[28]利用Neo4j分析壽險(xiǎn)公司的保單信息、客戶信息、保全信息和業(yè)務(wù)員信息等數(shù)據(jù),以賠案號(hào)作為主鍵關(guān)聯(lián),通過邏輯回歸(LogisticsRegression)和梯度提升決策樹(GradientBoostingDecisionTree,GBDT)分別對(duì)內(nèi)部和外部的欺詐概率進(jìn)行預(yù)測(cè)和準(zhǔn)確性對(duì)比,選用了度中心度、中介中心性、接近中心性、特征向量中心性等算法計(jì)算各賠案保單節(jié)點(diǎn)在賠案群中的重要程度,研究認(rèn)為,圖數(shù)據(jù)庫分析能夠較好地預(yù)測(cè)內(nèi)部欺詐,中介中心性在預(yù)測(cè)模型中的表現(xiàn)最好。

  王猛(2020)[29]提出利用圖數(shù)據(jù)庫HugeGraph以知識(shí)圖譜形式構(gòu)建面向科技與能力的關(guān)聯(lián)分析系統(tǒng),主要從行業(yè)成果、百度、百科等相關(guān)數(shù)據(jù)源中抽取和清洗數(shù)據(jù),并包含了層次構(gòu)建、關(guān)聯(lián)分析和網(wǎng)絡(luò)分析等流程,其中網(wǎng)絡(luò)分析使用了多種中心性算法來發(fā)現(xiàn)在網(wǎng)絡(luò)中起到核心作用的技術(shù)或指標(biāo)。國外應(yīng)用場(chǎng)景出現(xiàn)在社交網(wǎng)絡(luò)、醫(yī)療和銀行等領(lǐng)域。Kolomeets等(2019)[30]利用圖數(shù)據(jù)庫OrientDB分析了VKontakte社交網(wǎng)絡(luò),在評(píng)估社交群體的過程中,使用中心性算法度量圖中的中心節(jié)點(diǎn),使用PageRank或Laplacian矩陣確定最具影響力的意見領(lǐng)袖。

  Giordani等(2020)[31]利用圖數(shù)據(jù)庫Neo4j展開對(duì)處方模式的監(jiān)測(cè)性研究,以改善各級(jí)醫(yī)療機(jī)構(gòu)的處方實(shí)踐;該研究采集了意大利某地2000年1月至2018年10月所有使用醫(yī)療服務(wù)的患者病史數(shù)據(jù),構(gòu)建了包括患者、處方和醫(yī)生的網(wǎng)絡(luò),通過中介中心性算法確認(rèn)了處方中的抗生素在網(wǎng)絡(luò)中的重要性。RichardHenderson(2020)[32]指出圖數(shù)據(jù)庫有助于分析在線支付活動(dòng)的可疑模式等銀行欺詐,與關(guān)系型數(shù)據(jù)庫不同,圖數(shù)據(jù)庫一旦確定了目標(biāo)賬戶和交易子集,就可以使用中心性和PageRank等復(fù)雜算法發(fā)現(xiàn)一些蛛絲馬跡,自動(dòng)停止可疑交易或者提示進(jìn)一步開展人工調(diào)查。

  國內(nèi)應(yīng)用場(chǎng)景出現(xiàn)在知識(shí)圖譜、醫(yī)學(xué)等領(lǐng)域。馬雨萌(2019)[47]以構(gòu)建中藥活血化瘀領(lǐng)域?qū)n}知識(shí)庫為例,對(duì)文獻(xiàn)中實(shí)體、關(guān)系及屬性進(jìn)行解析、抽取與關(guān)聯(lián)組織,將知識(shí)三元組通過Neo4j圖數(shù)據(jù)庫存儲(chǔ),實(shí)現(xiàn)了基于力導(dǎo)向布局的知識(shí)關(guān)聯(lián)可視化,能夠?qū)⑵ヅ涞闹R(shí)實(shí)例及其來源文獻(xiàn)信息進(jìn)行可視化。馬歡歡(2020)[48]以構(gòu)建癲癇醫(yī)學(xué)知識(shí)圖譜為例,對(duì)3127份電子病歷進(jìn)行命名實(shí)體識(shí)別和關(guān)系抽取,利用Neo4j存儲(chǔ)“疾病和診斷”等5大類實(shí)體和關(guān)系,并在Neo4j中對(duì)“癲癇”和“癥狀性癲癇”一層以內(nèi)的關(guān)系進(jìn)行可視化展示和簡(jiǎn)要分析,解讀出相關(guān)的臨床表現(xiàn)、檢查方式和治療措施。國外應(yīng)用場(chǎng)景出現(xiàn)在生物醫(yī)學(xué)、社交網(wǎng)絡(luò)等。

  Messina等(2018)[49]提出在線分析生物信息學(xué)資源的Web應(yīng)用程序BioGraph,使用基于Neo4j開發(fā)的BioGraphDB作為圖數(shù)據(jù)庫,支持用戶基于功能、基因、蛋白質(zhì)和miRNA等實(shí)體關(guān)系構(gòu)建自定義的復(fù)雜檢索式,并使用Cytoscape.js生成針對(duì)檢索結(jié)果的交互式圖形,為用戶提供動(dòng)態(tài)可視化服務(wù)。Allen等(2019)[50]使用Neo4j對(duì)Twittertroll(網(wǎng)絡(luò)噴語)數(shù)據(jù)集進(jìn)行可視化分析,網(wǎng)絡(luò)節(jié)點(diǎn)大小取決于PageRank分?jǐn)?shù),關(guān)系權(quán)重取決于轉(zhuǎn)發(fā)次數(shù),在最終的可視化圖形中,可以清晰地發(fā)現(xiàn)數(shù)據(jù)集中存在三個(gè)社區(qū),以及每個(gè)社區(qū)內(nèi)最具影響力的Twittertroll賬戶。

  4結(jié)語

  在過去的幾十年里,密集互連數(shù)據(jù)的爆炸式增長(zhǎng)刺激了圖數(shù)據(jù)庫技術(shù)的研究、開發(fā)和應(yīng)用。從早期的圖模型到最近的原生圖數(shù)據(jù)庫,其應(yīng)用已經(jīng)涵蓋了生物醫(yī)學(xué)、金融保險(xiǎn)、科研管理、社交網(wǎng)絡(luò)、交通運(yùn)輸?shù)雀鱾(gè)行業(yè)的需求,其發(fā)展趨勢(shì)越來越支持更自然的表示模型和更好的數(shù)據(jù)集成工作流、挖掘和分析。通過文獻(xiàn)綜述,本文討論了最新的圖數(shù)據(jù)庫解決方案在復(fù)雜網(wǎng)絡(luò)分析中的主流圖數(shù)據(jù)庫、算法/布局、性能以及應(yīng)用實(shí)例。未來,圖數(shù)據(jù)庫在復(fù)雜網(wǎng)絡(luò)分析中的研究趨勢(shì)和特征將主要包括以下幾個(gè)方面。

  (1)圖數(shù)據(jù)庫已經(jīng)成為復(fù)雜網(wǎng)絡(luò)分析與大數(shù)據(jù)挖掘常用的分析工具手段。目前,復(fù)雜網(wǎng)絡(luò)分析研究中應(yīng)用最多的圖數(shù)據(jù)庫是Neo4j,這是由于Neo4j作為最主要的圖數(shù)據(jù)庫應(yīng)用品牌,其社區(qū)版具備安裝便利、操作簡(jiǎn)單、可視化功能強(qiáng)大和集成算法種類齊全等優(yōu)點(diǎn),其企業(yè)版也支持高可用集群部署,同時(shí)開發(fā)社區(qū)非常活躍,維護(hù)技術(shù)難度低,版本更新快,非常受國內(nèi)外學(xué)者喜愛。

  (2)圖數(shù)據(jù)庫可作為復(fù)雜網(wǎng)絡(luò)分析一站式解決方案,涵蓋了圖存儲(chǔ)、圖計(jì)算和圖可視化等各個(gè)環(huán)節(jié)。具體來說,在圖存儲(chǔ)環(huán)節(jié),圖數(shù)據(jù)庫能夠應(yīng)用到知識(shí)圖譜存儲(chǔ)中,通過Cypher等類SQL語言解決數(shù)據(jù)查詢問題,通過單機(jī)或分布式圖數(shù)據(jù)庫解決少量或海量數(shù)據(jù)存儲(chǔ)問題;在圖計(jì)算環(huán)節(jié),圖數(shù)據(jù)庫內(nèi)置算法能夠解決的圖數(shù)據(jù)挖掘應(yīng)用場(chǎng)景,可以通過Cypher等類SQL語言調(diào)用算法進(jìn)行分析,使用起來非常簡(jiǎn)便,這方面前文已經(jīng)進(jìn)行了詳細(xì)闡述;在圖可視化環(huán)節(jié),Cypher、Gremlin等查詢結(jié)果能夠進(jìn)行實(shí)時(shí)可視化,還能在線調(diào)整節(jié)點(diǎn)和關(guān)系的顏色和大小,并支持導(dǎo)出多種圖片格式。

  (3)圖數(shù)據(jù)庫與圖計(jì)算引擎等工具結(jié)合使用,在圖計(jì)算和圖可視化方面也能發(fā)揮重要作用。雖然在圖數(shù)據(jù)挖掘?qū)嵺`中,圖數(shù)據(jù)庫在圖存儲(chǔ)、圖計(jì)算和圖可視化三個(gè)環(huán)節(jié)中所起作用呈依次遞減的態(tài)勢(shì),但圖數(shù)據(jù)庫是存儲(chǔ)與查詢圖數(shù)據(jù)、導(dǎo)出子圖數(shù)據(jù)等操作流程的基礎(chǔ)工具。在圖計(jì)算中,外部機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法能夠利用圖數(shù)據(jù)庫作為數(shù)據(jù)存儲(chǔ)、查詢和導(dǎo)出的工具;在圖可視化中,可以通過圖數(shù)據(jù)庫的Java和Python等驅(qū)動(dòng)包進(jìn)行訪問,獲取到JSON格式數(shù)據(jù),并結(jié)合流行的JavaScript可視化工具,例如Echarts.js、D3.js、Cytoscape.js,通過弦圖、網(wǎng)絡(luò)圖、樹圖、桑基圖和平行坐標(biāo)圖等可視化方式為不同的情報(bào)分析任務(wù)場(chǎng)景呈現(xiàn)不同的可視化效果。

  (4)圖數(shù)據(jù)挖掘工具、算法、應(yīng)用場(chǎng)景將不斷拓展。目前,圖數(shù)據(jù)庫并不是圖數(shù)據(jù)挖掘的唯一工具和手段,在知識(shí)圖譜技術(shù)興起的早期,Gephi等社交網(wǎng)絡(luò)分析軟件也能進(jìn)行一些簡(jiǎn)單的圖數(shù)據(jù)挖掘,例如中心性分析等。而包括圖計(jì)算引擎、圖表示學(xué)習(xí)、圖機(jī)器學(xué)習(xí)和圖神經(jīng)網(wǎng)絡(luò)在內(nèi)的多種工具和方法也在飛速發(fā)展,例如,圖計(jì)算引擎以Spark平臺(tái)中的Graphx組件為代表,集成了PageRank和社區(qū)發(fā)現(xiàn)等算法;圖神經(jīng)網(wǎng)絡(luò)工具以Pytorch的PyG組件,能夠進(jìn)行節(jié)點(diǎn)分類、鏈路預(yù)測(cè)、社區(qū)發(fā)現(xiàn)和圖相似性檢測(cè)等具體應(yīng)用。總體上,圖數(shù)據(jù)庫對(duì)于查詢、表示和挖掘數(shù)據(jù)效果顯著,利用圖算法和子圖匹配查詢可以直觀分析和發(fā)現(xiàn)圖結(jié)構(gòu)中有意義的模式或結(jié)構(gòu);其次,圖數(shù)據(jù)庫更適合數(shù)據(jù)密集型的多維特征分析,其呈現(xiàn)方式更接近現(xiàn)實(shí);此外,圖數(shù)據(jù)庫能夠深度挖掘隱含關(guān)系,將是未來進(jìn)一步拓展復(fù)雜網(wǎng)絡(luò)分析的重要途徑和工具。

  參考文獻(xiàn):

  [1]AlhussienI.,CambriaE,NengShengZ,Semanticallyenhancedmodelsforcommonsenseknowledgeacquisition[C],IEEEInternational.ConferenceDataMining.Work.,IEEE,2018:1014-1021.

  [2]H.Paulheim.Knowledgegraphrefinement:asurveyofapproachesandevaluationmethods[J].SemanticWeb,2017,8(3):489-508.

  [3]沈志宏,趙子豪,王海波.以圖為中心的新型大數(shù)據(jù)技術(shù)棧研究[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2020,4(7):50-65.(ShenZhihong,ZhaoZihao,WangHaibo.BigDataTechnologyStackShifting:FromSQLCentrictoGraphCentric[J].DataAnalysisandKnowledgeDiscovery,2020,4(7):50-65.)

  [4]DBMSpopularitybrokendownbydatabasemodel.[EB/OL][2021-9-2].

  [5]ŠestakM,HeričkoM,DružovecTW,etal.Applyingk-vertexcardinalityconstraintsonaNeo4jgraphdatabase[J].FutureGenerationComputerSystems,2021,115:459-474.

  [6]Gutfraind,A.,GenkinM.Agraphdatabaseframeworkforconvertnetworkanalysis:AnapplicationtotheIslamicStatenetworkinEurope[J].SocialNetworks,2017,51:178-188,

  作者:劉春江1,2,李姝影1,胡汗林3,方曙1,2

主站蜘蛛池模板: 免费区欧美一级毛片精品 | 激情五月黄色 | 国产成人精品综合久久久软件 | 99精品国产一区二区三区 | 99久久综合狠狠综合久久一区 | 五月天丁香婷婷网 | 黄色黄色一级片 | 色婷婷激婷婷深爱五月老司机 | 亚洲精品另类有吗中文字幕 | 久草视频福利在线观看 | 国产一区二区精品人妖系列 | a级国产| 九九99精品 | 国产三级成人 | 性生活网站| 亚洲欧洲国产成人综合一本 | a级毛片视频免费观看 | 欧美日本韩国一区 | www.污网站 | 国产高清大尺度一区二区不卡 | 热久久最新地址 | 日本免费人成黄页在线观看视频 | 嫩草视频在线观看免费 | 国产美女激情 | 三级大片在线观看 | 国产九九精品视频 | 一区二区成人国产精品 | 美女国内精品自产拍在线播放 | 49pao强力在线高清基地 | 九九99在线视频 | 免费观看一级毛片 | 久久免费精品国产72精品剧情 | 久久99国产综合精品 | 亚洲欧美一区二区三区蜜芽 | 日韩中文字幕在线免费观看 | 50-60岁老妇女一级毛片 | 男女爱爱视频在线观看 | 国产免费影院 | 亚洲欧美日韩精品永久在线 | blacked欧美一区二区 | 亚洲 欧美 日韩在线综合福利 |