第一页欧美-第一页综合-丁香花成人另类小说-丁香久久-顶级欧美色妇xxxxbbbb

學(xué)術(shù)咨詢

讓期刊論文更省時(shí)、省事、省心

知識(shí)圖譜在犯罪情報(bào)分析中的應(yīng)用

時(shí)間: 分類:電子論文 次數(shù):

摘 要 隨著大數(shù)據(jù)和人工智能技術(shù)的發(fā)展,知識(shí)圖譜以其豐富的語(yǔ)義表達(dá)和推理給公安情報(bào)業(yè)務(wù)帶來(lái)深刻的變革。本文梳理了知識(shí)圖譜和犯罪情報(bào)的基本概念和特點(diǎn),進(jìn)而闡述基于知識(shí)圖譜的犯罪情報(bào)圖譜的構(gòu)建流程和推理技術(shù),介紹相關(guān)技術(shù)的重點(diǎn)難點(diǎn)及存在的問題,

  摘 要 隨著大數(shù)據(jù)和人工智能技術(shù)的發(fā)展,知識(shí)圖譜以其豐富的語(yǔ)義表達(dá)和推理給公安情報(bào)業(yè)務(wù)帶來(lái)深刻的變革。本文梳理了知識(shí)圖譜和犯罪情報(bào)的基本概念和特點(diǎn),進(jìn)而闡述基于知識(shí)圖譜的犯罪情報(bào)圖譜的構(gòu)建流程和推理技術(shù),介紹相關(guān)技術(shù)的重點(diǎn)難點(diǎn)及存在的問題,給出后續(xù)發(fā)展的方向。文本旨在為構(gòu)建犯罪情報(bào)圖譜提供整體思路,為犯罪情報(bào)圖譜的各環(huán)節(jié)提供現(xiàn)有的可行技術(shù),為犯罪情報(bào)圖譜的實(shí)現(xiàn)和應(yīng)用提供有益的借鑒。

  關(guān)鍵詞 知識(shí)圖譜 情報(bào)分析 犯罪情報(bào) 犯罪情報(bào)圖譜

知識(shí)圖譜

  現(xiàn)今信息技術(shù)日新月異,信息呈爆炸式增長(zhǎng),如何快速實(shí)現(xiàn)犯罪情報(bào)的要素提取、組織、和分析,輔助偵查是公安大數(shù)據(jù)和智慧警務(wù)的發(fā)展方向。知識(shí)圖譜作為一種刻畫大規(guī)模數(shù)據(jù)關(guān)聯(lián)的利器,在犯罪情報(bào)分析應(yīng)用中價(jià)值極大。

  一、知識(shí)圖譜概述

  (一)知識(shí)圖譜表示與建模知識(shí)圖譜源于語(yǔ)義網(wǎng)絡(luò),由Google公司于2012年提出,采用圖模型對(duì)現(xiàn)實(shí)世界的事物及關(guān)聯(lián)建模。知識(shí)圖譜將實(shí)體及關(guān)系表示為三元組G=(ε,R,ξ),ε表示實(shí)體集合,R表示實(shí)體關(guān)系的集合,ξ=R×ε×ε表示圖譜三元組集合[1]。

  三元組的表示規(guī)范主要有資源描述框架(ResourceDescriptionFramework,RDF)、RDFs(RDFSchema)和網(wǎng)絡(luò)本體語(yǔ)言(WebOntologyLanguage,OWL)。RDF是W3C提出用于描述實(shí)體的標(biāo)準(zhǔn),對(duì)每個(gè)資源使用統(tǒng)一資源標(biāo)識(shí)符(URI)標(biāo)識(shí),以網(wǎng)絡(luò)形式連接各實(shí)體,可用多個(gè)三元組表示復(fù)雜語(yǔ)義,但最多僅能表述二元謂詞,表示能力有限。RDFs是描述RDF的輕量級(jí)語(yǔ)言,增加對(duì)實(shí)體的類和屬性描述,可描述實(shí)體和屬性的關(guān)系。OWL基于XML和RDF/RDFs采用含頭部和主體的二元結(jié)構(gòu)。頭部存儲(chǔ)命名空間,主體則描述本體的類別、實(shí)例和屬性間的關(guān)聯(lián)。OWL還提供類、屬性和實(shí)例的等價(jià)、互逆、對(duì)稱等聲明,表達(dá)能力更強(qiáng),是W3C表示本體的推薦語(yǔ)言。

  (二)知識(shí)圖譜的應(yīng)用

  1.優(yōu)化搜索引擎知識(shí)圖譜最早應(yīng)用于提升搜索引擎的能力。傳統(tǒng)搜索引擎通過(guò)關(guān)鍵字實(shí)現(xiàn)網(wǎng)頁(yè)搜,無(wú)法有效應(yīng)對(duì)具有歧義的檢索。知識(shí)圖譜利用其強(qiáng)大的實(shí)體概念表述能力,能夠利用數(shù)據(jù)的語(yǔ)義較為準(zhǔn)確識(shí)別用戶的需求,提高了用戶搜索的準(zhǔn)確性,成為新一代智能搜索引擎的強(qiáng)大動(dòng)力。

  2.突破智能問答瓶頸在自動(dòng)問答方面,知識(shí)圖譜基于關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)自然語(yǔ)言的語(yǔ)義結(jié)構(gòu)化,可提高自動(dòng)問答系統(tǒng)的智能化和精確性。目前,智能問題系統(tǒng)能較好應(yīng)對(duì)事實(shí)性單點(diǎn)問題,效果接近真人。結(jié)合知識(shí)圖譜和機(jī)器學(xué)習(xí)的智能問答系統(tǒng)可提高對(duì)問題的語(yǔ)義理解,增強(qiáng)對(duì)詞組合問題的探索[2]。

  3.實(shí)現(xiàn)機(jī)器推理

  結(jié)合邏輯謂詞和圖搜索等技術(shù),知識(shí)圖譜可完成基于關(guān)系邏輯的硬邏輯規(guī)則提取,完成精確型問題的機(jī)器推理工作,符合人類的推理邏輯,結(jié)果的可解釋性最好[3]。將機(jī)器學(xué)習(xí)與知識(shí)圖譜結(jié)合,把圖譜映射為神經(jīng)網(wǎng)絡(luò),通過(guò)優(yōu)化算法提取實(shí)體鄰接關(guān)系,實(shí)現(xiàn)圖譜的多步推理[4]。

  4.增強(qiáng)推薦系統(tǒng)

  面對(duì)海量電商信息,知識(shí)圖譜可增強(qiáng)商品與用戶的信息語(yǔ)義關(guān)聯(lián),解決系統(tǒng)冷啟動(dòng)問題,增強(qiáng)商品推薦效果。Trans系列[5]嵌入法可獲得實(shí)體和關(guān)系的低維稠密向量,進(jìn)而確定實(shí)體的相似性以實(shí)現(xiàn)推薦。不同類別實(shí)體或關(guān)系構(gòu)成的異質(zhì)知識(shí)圖譜使用圖卷積網(wǎng)絡(luò)可取得較好效果[6]。基于元路徑的挖掘方法也可用于異質(zhì)圖譜推薦,利用路徑相似性獲得物品和用戶的偏好特征,通過(guò)特征向量點(diǎn)積的加權(quán)累積進(jìn)行推薦[7]。文獻(xiàn)[8]使用元圖替代元路徑對(duì)異質(zhì)網(wǎng)絡(luò)進(jìn)行特征提取,更全面展示其中的復(fù)雜特征,提升推薦效果。

  二、犯罪情報(bào)

  (一)犯罪情報(bào)的類型

  犯罪情報(bào)按來(lái)源可分為境內(nèi)和境外情報(bào)。境內(nèi)情報(bào)是從國(guó)內(nèi)獲取的犯罪情報(bào);境外情報(bào)則通過(guò)各種方式從國(guó)外或境外獲取的犯罪情報(bào)。犯罪情報(bào)按其地位分為戰(zhàn)略情報(bào)和戰(zhàn)術(shù)情報(bào)。戰(zhàn)略情報(bào)是指對(duì)犯罪偵查工作具有重大影響的情報(bào),而戰(zhàn)術(shù)情報(bào)是指感知片面情況或局部情況的情報(bào)。在載體方面,犯罪情報(bào)可分為文字情報(bào)、聲像情報(bào)和實(shí)物情報(bào)。從內(nèi)容角度,犯罪情報(bào)分為人員、案件和犯罪組織情報(bào)等。犯罪情報(bào)屬性分為線索型、資料型和預(yù)測(cè)型情報(bào)三類。線索型情報(bào)為犯罪偵查提供引導(dǎo)信息,資料型情報(bào)為犯罪偵查提供基礎(chǔ)信息,預(yù)測(cè)型情報(bào)則指用于預(yù)測(cè)犯罪活動(dòng)在特定時(shí)空范圍內(nèi)演變趨勢(shì)。近年來(lái),開源情報(bào)作為新情報(bào)源已嶄露頭角。

  (二)犯罪情報(bào)的特點(diǎn)

  犯罪情報(bào)具有知識(shí)性、有序性、傳遞性和實(shí)用性等基本屬性。知識(shí)性表明情報(bào)是偵查人員對(duì)客觀犯罪活動(dòng)的認(rèn)知。有序性是指犯罪情報(bào)處理需要一個(gè)漸進(jìn)的加工過(guò)程。傳遞性是指犯罪情報(bào)必須在進(jìn)行傳遞才能發(fā)揮價(jià)值。實(shí)用性則表明犯罪情報(bào)必須服務(wù)實(shí)戰(zhàn)。犯罪情報(bào)的特性表現(xiàn)為社會(huì)性、累積性、時(shí)效性、隨機(jī)性和秘密性等。犯罪活動(dòng)是人類的行為,社會(huì)性是其與生俱來(lái)的天性。犯罪情報(bào)的價(jià)值只有積累到一定規(guī)模才能發(fā)揮作用。犯罪情報(bào)的實(shí)時(shí)性是捕捉戰(zhàn)機(jī)的關(guān)鍵。隨機(jī)性表明單條犯罪情報(bào)僅能反映特定犯罪活動(dòng)在某個(gè)時(shí)空截面的情況。秘密性是指犯罪情報(bào)僅能以隱蔽方式在特定范圍獲取、傳遞和運(yùn)用。

  三、犯罪情報(bào)的知識(shí)圖譜構(gòu)建及運(yùn)用

  (一)基于知識(shí)圖譜的犯罪情報(bào)圖譜構(gòu)建

  1.涉案實(shí)體識(shí)別

  實(shí)體識(shí)別是犯罪圖譜的基礎(chǔ),旨在從情報(bào)中抽取實(shí)體。實(shí)體識(shí)別的對(duì)象分為實(shí)體、時(shí)間和數(shù)字三大類,細(xì)分為人名、機(jī)構(gòu)名、地名、時(shí)間、日期、貨幣、交通工具和武器等。實(shí)體識(shí)別分人工識(shí)別和自動(dòng)識(shí)別。人工識(shí)別相對(duì)準(zhǔn)確,但效率低,僅適用少量樣本的處理。自動(dòng)識(shí)別分為兩大類:基于規(guī)則的實(shí)體識(shí)別和基于機(jī)器學(xué)習(xí)的實(shí)體識(shí)別,機(jī)器學(xué)習(xí)識(shí)別又分為基于特征和基于神經(jīng)網(wǎng)絡(luò)。基于規(guī)則的方法適用于英文環(huán)境,國(guó)外早期系統(tǒng)均采用此法。基于詞典方法依靠匹配規(guī)則簡(jiǎn)單有效,對(duì)中文支持較好,但構(gòu)建詞典耗時(shí)耗力[9]。

  機(jī)器學(xué)習(xí)方法則利用已標(biāo)注的語(yǔ)料庫(kù)訓(xùn)練模型,獲得特定字或詞作為命名實(shí)體整體或部分的概率,常用方法有基于上下文[10]和基于序列化標(biāo)注[11]等。其后,基于LSTMCRF[12]的深度學(xué)習(xí)被用于實(shí)體識(shí)別。由于任務(wù)和需求不同,實(shí)體識(shí)別的粒度也不同。實(shí)體識(shí)別粒度越小則難度和開銷越大,但指導(dǎo)意義更大。當(dāng)前,困擾實(shí)體識(shí)別的要素包括實(shí)體命名形式多變、語(yǔ)言環(huán)境復(fù)雜和實(shí)體存在歧義等。

  2.實(shí)體消歧

  由于形式和語(yǔ)義復(fù)雜,實(shí)體識(shí)別后需進(jìn)行一致性校驗(yàn),即實(shí)體消歧。其原因在于:同一實(shí)體可能有不同的稱謂,同一名稱在上下文中可能表示不同的實(shí)體。消歧的一般方法為有監(jiān)督的機(jī)器學(xué)習(xí)[13]。分類方法通過(guò)構(gòu)建正負(fù)實(shí)例、指稱-實(shí)體對(duì)等形式通過(guò)有監(jiān)督方式進(jìn)行學(xué)習(xí),獲取二元分類模型以實(shí)現(xiàn)實(shí)體消歧。機(jī)器學(xué)習(xí)排序方法分三類,PointWise使用近似回歸模型計(jì)算候選匹配實(shí)體的得分并排序,得分越高則越傾向?yàn)橥粚?shí)體。

  PairWise將候選項(xiàng)匹配成對(duì),利用項(xiàng)與項(xiàng)間的相對(duì)位置關(guān)系構(gòu)建訓(xùn)練樣本,采用分類方法訓(xùn)練排序感知機(jī)實(shí)現(xiàn)消歧;ListWise則將査詢結(jié)果排序列表視為訓(xùn)練實(shí)例,利用ListNet算法訓(xùn)練排序模型進(jìn)行消歧。基于圖的方法將情報(bào)中的實(shí)體指稱及其候選實(shí)體構(gòu)成圖結(jié)構(gòu),利用兩者的關(guān)聯(lián)完成協(xié)同消歧[14]。混合模型綜合運(yùn)用多種模型獲得各自消歧結(jié)果,最后通過(guò)比較得到最優(yōu)結(jié)果,效果好于單模型。實(shí)體消歧過(guò)程要避免實(shí)體的遺漏和流失,以免情報(bào)失真。

  3.實(shí)體關(guān)聯(lián)提取

  實(shí)體關(guān)聯(lián)是構(gòu)建犯罪知識(shí)圖譜的核心環(huán)節(jié),將情報(bào)信息從語(yǔ)言層面上升到內(nèi)容層面。在犯罪情報(bào)方面,實(shí)體關(guān)系主要體現(xiàn)人(組織)、物或事為中心的兩方或多方關(guān)聯(lián),需要時(shí)還可加入時(shí)間或地點(diǎn)。其難點(diǎn)在于同一關(guān)系表述不同、關(guān)系涉及實(shí)體多、同一詞匯表達(dá)不同關(guān)系和存在隱性關(guān)聯(lián)等。基于模板的方法是關(guān)系抽取的傳統(tǒng)方法,根據(jù)實(shí)體指稱的上下文關(guān)系參照模板提取關(guān)系[15]。

  基于機(jī)器學(xué)習(xí)的方法分為有監(jiān)督學(xué)習(xí)和弱監(jiān)督學(xué)習(xí)兩類。有監(jiān)督學(xué)習(xí)方法通過(guò)分類算法學(xué)習(xí)人工標(biāo)注的實(shí)體指稱關(guān)聯(lián)樣本進(jìn)行模型訓(xùn)練,形成語(yǔ)義關(guān)系分類器用于關(guān)系提取[16]。基于弱監(jiān)督學(xué)習(xí)方法以距離監(jiān)督為假設(shè),對(duì)人工標(biāo)注的部分圖譜三元組樣本進(jìn)行學(xué)習(xí)以形成分類器,進(jìn)而自動(dòng)完成其他內(nèi)容的關(guān)系抽取[17]。Hasegawa等提出基于無(wú)監(jiān)督技術(shù)的關(guān)系抽取,按實(shí)體特征進(jìn)行全連通聚類,通過(guò)關(guān)系相似性確定實(shí)體關(guān)系的類型[18]。視頻、圖片、語(yǔ)言等類型的情報(bào)信息進(jìn)行關(guān)系抽取將是今后的發(fā)展方向。

  (二)基于知識(shí)圖譜的犯罪情報(bào)分析與挖掘當(dāng)前的“情報(bào)主導(dǎo)警務(wù)”強(qiáng)調(diào)情報(bào)對(duì)警務(wù)活動(dòng)的指導(dǎo),要求警方有效融合情報(bào),全面深入挖掘情報(bào)內(nèi)涵,知識(shí)圖譜正好滿足需求。

  1.基于圖譜的犯罪信息搜索

  傳統(tǒng)的信息檢索通過(guò)關(guān)鍵字匹配方式完成查找,未考慮關(guān)鍵字的語(yǔ)義和上下文關(guān)系,檢索質(zhì)量不高。基于知識(shí)圖譜的實(shí)體檢索同時(shí)考慮語(yǔ)義相似性和結(jié)構(gòu)相似性,計(jì)算每個(gè)實(shí)體相關(guān)的三元組與用戶查詢之間的相關(guān)度,排序后得到候選實(shí)體[19]。此外,知識(shí)圖譜作為一種存在邏輯結(jié)構(gòu)的有向連通圖,可通過(guò)圖模型進(jìn)行建模檢索,用檢索對(duì)象的特征建立子圖并構(gòu)建圖譜的圖索引[20],通過(guò)子圖篩選技術(shù)實(shí)現(xiàn)犯罪信息檢索。

  當(dāng)檢索目標(biāo)較復(fù)雜時(shí)可綜合多個(gè)圖譜進(jìn)行搜索,基于圖譜的問答技術(shù)用于提高搜索效果[21]。基于詞典-文法的語(yǔ)義解析方法通過(guò)分析問句,構(gòu)建由節(jié)點(diǎn)、邊和操作符組成的語(yǔ)義圖,視其為圖譜子圖并映射到圖譜中,通過(guò)圖匹配完成檢索[22]。目前,基于知識(shí)圖譜的簡(jiǎn)單問題檢索基本成熟,但深層挖掘問題、大規(guī)模搜索和長(zhǎng)尾問題等仍待研究。

  2.基于圖譜的案件推理

  知識(shí)圖譜的結(jié)構(gòu)化形式是其強(qiáng)于數(shù)據(jù)庫(kù)的最大優(yōu)勢(shì),支持信息推理,可用于情報(bào)的補(bǔ)齊、質(zhì)檢和挖掘,輔助研判。知識(shí)圖譜推理著眼實(shí)體和關(guān)系,進(jìn)行演繹推理和基于歸納的推理,由已有信息推斷未知信息。歸納推理用于推理具體事實(shí),利用邏輯規(guī)則獲得某個(gè)事件的過(guò)程;演繹推理則著重提取知識(shí)圖譜中的邏輯規(guī)則。演繹推理包括基于謂詞邏輯的關(guān)系推理[23]、基于概率邏輯的規(guī)則提取[24]和基于隨機(jī)游走的規(guī)則挖掘[25]等。歸納推理包括基于置信規(guī)則推理的關(guān)系預(yù)測(cè)[26],基于路徑的關(guān)系推理[27]等。知識(shí)圖譜推理技術(shù)可輔助事件規(guī)律挖掘、人員畫像構(gòu)建、特定群體發(fā)現(xiàn)、人物關(guān)系梳理等犯罪情報(bào)分析。

  情報(bào)論文投稿刊物:《圖書與情報(bào)》始刊于1981年,由甘肅省圖書館、甘肅省科技情報(bào)研究所聯(lián)合主辦。自創(chuàng)刊以來(lái)一直以學(xué)術(shù)質(zhì)量建設(shè)為核心,關(guān)注圖情業(yè)界的最新學(xué)術(shù)熱點(diǎn)與動(dòng)態(tài),注重刊發(fā)理論與實(shí)踐相結(jié)合、國(guó)內(nèi)與國(guó)外相融匯的科研學(xué)術(shù)成果,是一份圖情界非常有影響的兩棲類學(xué)術(shù)刊物。

  四、結(jié)語(yǔ)

  本文概述知識(shí)圖譜和犯罪情報(bào)的相關(guān)概念和特點(diǎn),介紹犯罪情報(bào)圖譜的構(gòu)建步驟和方法,梳理存在的問題和發(fā)展方向,為相關(guān)研究提供思路。在大數(shù)據(jù)和人工智能等新興技術(shù)不斷發(fā)展的今天,犯罪情報(bào)圖譜賦能公安機(jī)關(guān)占據(jù)信息制高點(diǎn),對(duì)維護(hù)國(guó)家安全和公共安全具有重要作用,是我國(guó)構(gòu)建治理體系和治理能力現(xiàn)代化的重要抓手,在公安情報(bào)工作中大有作為。

  參考文獻(xiàn):

  [1] 趙軍,劉康,何世柱,等.知識(shí)圖譜[M].北京:高等教育出版社,2018:2-5.

  作者:張美璟

中文核心期刊推薦

SCI核心期刊推薦

主站蜘蛛池模板: 亚洲三级一区 | 欧美成人一区二区三区不卡 | 俺去啦网婷婷 | 国产亚洲欧美久久久久 | 99久久精品国产片 | 国产羞羞视频在线观看 | 久久久综合视频 | 欧美一级黄视频 | 在线人成精品免费视频 | 久久免费视频在线观看30 | 国产视频网 | 中文字幕 亚洲 一区二区三区 | 欧美一区二区三区黄色 | 亚洲一区二区在线播放 | 亚洲女人毛片 | 亚洲 午夜在线一区 | 性强烈欧美一级毛片 | 久久国产视频在线观看 | 一级做a级爰片性色毛片视频 | 国产片免费 | 国产午夜精品福利视频 | 欧美一级毛片欧美大尺度一级毛片 | 丁香六月欧美 | 精品精品国产高清a毛片牛牛 | 中文字幕影视 | 97色伦色在线综合视频 | 永久在线观看视频 | 在线观看人成网站深夜免费 | 薰衣草视频高清在线观看免费 | 高清一区高清二区视频 | 91福利区| 国产片毛片 | 亚洲精品字幕一区二区三区 | 亚洲在线一区 | 国产激情视频在线 | 久久精品视频7 | 羞羞色院91| 日韩一区二区三区不卡视频 | ppypp日本欧美一区二区 | 国产思思 | 亚洲国产日韩女人aaaaaa毛片在线 |