第一页欧美-第一页综合-丁香花成人另类小说-丁香久久-顶级欧美色妇xxxxbbbb

學(xué)術(shù)咨詢

讓期刊論文更省時(shí)、省事、省心

基于情感分析的圖書館讀者畫像研究

時(shí)間:2021年02月03日 分類:經(jīng)濟(jì)論文 次數(shù):

摘要:文章提出了基于情感分析的圖書館讀者畫像模型,即通過對(duì)圖書館讀者的評(píng)論文本進(jìn)行情感分析,得出圖書館讀者情感極性從而采用本體的形式構(gòu)建圖書館讀者情感畫像庫(kù),為讀者的個(gè)性化推薦提供了新的研究思路,實(shí)現(xiàn)了讀者的情感知識(shí)語義檢索與共享。 關(guān)鍵詞

  摘要:文章提出了基于情感分析的圖書館讀者畫像模型,即通過對(duì)圖書館讀者的評(píng)論文本進(jìn)行情感分析,得出圖書館讀者情感極性從而采用本體的形式構(gòu)建圖書館讀者情感畫像庫(kù),為讀者的個(gè)性化推薦提供了新的研究思路,實(shí)現(xiàn)了讀者的情感知識(shí)語義檢索與共享。

  關(guān)鍵詞:情感分析用戶畫像本體

圖書館

  一、情感分析與用戶畫像

  情感分析是在框架語義理論的基礎(chǔ)上對(duì)文本提取情感框架知識(shí)并對(duì)文本進(jìn)行情感信息采集、數(shù)據(jù)統(tǒng)計(jì)的過程。框架語義理論是美國(guó)語言學(xué)家菲爾墨于1976年提出的解決詞語含義與句法結(jié)構(gòu)意義的理論方法。該理論目前在國(guó)內(nèi)外均有深入的應(yīng)用,如美國(guó)構(gòu)建了FrameNet語料庫(kù),國(guó)內(nèi)也有漢語框架語義知識(shí)庫(kù)CFN。截至目前,框架語義理論廣泛應(yīng)用于各行各業(yè),如圖書館領(lǐng)域和醫(yī)療情感分析等。框架語義的研究應(yīng)用為本研究提供了豐富的可參考語料知識(shí)。

  圖書館論文范例:公共圖書館服務(wù)平等、開放、共享理念解析

  交互設(shè)計(jì)之父艾倫·庫(kù)珀最早提出了畫像(Persona)的概念,但隨著大數(shù)據(jù)的發(fā)展,目前畫像一般是指在真實(shí)用戶數(shù)據(jù)上構(gòu)建的目標(biāo)用戶虛擬模型。畫像技術(shù)通過對(duì)用戶文本的分析可對(duì)其更深一步地做數(shù)據(jù)挖掘甚至是構(gòu)建智能推薦系統(tǒng);畫像技術(shù)還可以對(duì)服務(wù)或者產(chǎn)品進(jìn)行私人訂制或個(gè)性化服務(wù)。目前國(guó)內(nèi)畫像技術(shù)在圖書館個(gè)性化推薦方面已有相關(guān)應(yīng)用,充分說明用戶畫像技術(shù)與圖書館個(gè)性化服務(wù)的有效性與可行性。

  國(guó)內(nèi)已有文本分析與用戶畫像技術(shù)的有機(jī)結(jié)合,兩項(xiàng)技術(shù)結(jié)合的應(yīng)用也是非常廣泛的,單曉紅利用酒店文本評(píng)論數(shù)據(jù)對(duì)酒店用戶進(jìn)行畫像,而任中杰等人利用微博數(shù)據(jù)構(gòu)建了一種預(yù)測(cè)公眾情感傾向程度的用戶畫像模型。然而,國(guó)內(nèi)圖書館個(gè)性化服務(wù)存在情感缺失、信息獲取不足等問題,不能有效滿足讀者興趣的個(gè)性化讀物推薦需求,對(duì)讀者的深層需求不能有效挖掘。此外,目前情感分析領(lǐng)域存在專業(yè)領(lǐng)域詞典缺乏、情感語料庫(kù)建設(shè)不充分等問題;畫像技術(shù)也較少地提及用戶情感,更多地用于普遍商業(yè)領(lǐng)域。因此,本文提出基于情感分析的圖書館讀者畫像研究方法,在讀者的畫像構(gòu)建方法上提出相關(guān)模型,對(duì)圖書館讀者的情感畫像構(gòu)建方法進(jìn)行探討。

  二、圖書館讀者情感畫像構(gòu)建方法

  (一)圖書館讀者情感畫像模型

  圖書館讀者情感畫像模型可分為四步:爬取在線評(píng)論文本、文本預(yù)處理、讀者語義資源建設(shè)和讀者情感畫像庫(kù)構(gòu)建,其中前三步均是情感分析的內(nèi)容,讀者畫像庫(kù)的構(gòu)建是基于情感分析的。

  (二)圖書館讀者文本情感分析方法

  1.在線文本來源。微信公眾號(hào)、微博和官方網(wǎng)站三個(gè)平臺(tái)是國(guó)內(nèi)圖書館相關(guān)服務(wù)獲取的三個(gè)主要社區(qū)網(wǎng)絡(luò)媒體平臺(tái)。其中,微博平臺(tái)具備用戶實(shí)名制、易追蹤和數(shù)據(jù)爬取容易等優(yōu)勢(shì)。因此,以微博用戶評(píng)論數(shù)據(jù)為基礎(chǔ)數(shù)據(jù),能夠保證畫像的全面性與準(zhǔn)確性。在線文本可借助如八爪魚等專業(yè)的文本爬取工具直接爬取文本相關(guān)信息,如原始文本、用戶昵稱等。

  2.文本預(yù)處理。斷句、分詞和詞性標(biāo)注以及句法分析是文本預(yù)處理的三項(xiàng)主要任務(wù)。國(guó)內(nèi)目前已經(jīng)有相對(duì)成熟的文本預(yù)處理平臺(tái)可供使用,如哈工大語言技術(shù)平臺(tái)LTP,借助該平臺(tái)API接口,可實(shí)現(xiàn)錄入文本直接輸出結(jié)果的快捷化批量完成結(jié)果的過程,從而提高文本預(yù)處理的效率。

  3.讀者情感語義資源建設(shè)。讀者情感語義資源建設(shè)包括情感詞典的建設(shè)與語料知識(shí)庫(kù)的建設(shè)。情感詞典由情感詞和該情感詞的極性值共同組成,語料知識(shí)庫(kù)則由情感詞典與其對(duì)應(yīng)框架相關(guān)元素等共同組成。基于詞典的是情感分析的基礎(chǔ),詞典的準(zhǔn)確性與情感分析的質(zhì)量密切相關(guān)。國(guó)內(nèi)外詞典資源廣泛,如Hownet詞典、BosonNLP情感詞典等等,但領(lǐng)域內(nèi)的情感詞典相對(duì)匱乏,因此有必要在現(xiàn)有詞典的基礎(chǔ)上進(jìn)一步擴(kuò)展領(lǐng)域內(nèi)詞典。針對(duì)圖書館讀者的評(píng)論文本,對(duì)每一個(gè)情感詞選取20個(gè)及以上句子,參考FrameNet和CFN知識(shí)庫(kù),對(duì)情感詞完成框架匹配以及情感極性分類。

  情感極性以數(shù)值表達(dá),如為負(fù)數(shù)值則表示該情感詞為負(fù)面情緒詞,如為0則表示該情感詞為中性詞語,若為正數(shù)值則為正面情緒詞。情感極性值的范圍可定為[-1,1],數(shù)值的絕對(duì)值越大表示該情感詞所表達(dá)的情緒越強(qiáng)烈。此外,情感極性值還需考慮修飾詞的影響,如為程度詞則需要在原有情感極性值的基礎(chǔ)上進(jìn)行計(jì)算,如果原有情感詞極性值為負(fù)數(shù)則減去這一程度值,反之則加;如為否定詞,則整體情感極性值變?yōu)槠湎喾磾?shù)。如下表所示為[難過]框架的基本內(nèi)容:如對(duì)文本“最近心情失落,總不知道想干些什么,索性便開始讀書。”一句中可識(shí)別出情感詞為“失落”,句中無修飾詞,查找詞典得到該詞情感極性值為“-0.3”,隸屬于[難過]框架。

  (三)圖書館讀者畫像方法

  1.圖書館讀者畫像標(biāo)簽體系。畫像結(jié)果一般以標(biāo)簽體系的形式體現(xiàn)。標(biāo)簽體系由畫像獨(dú)立的標(biāo)簽共同組成,圖書館讀者的畫像標(biāo)簽體系可以劃分為讀者基礎(chǔ)信息和情感分析結(jié)果兩個(gè)維度。

  2.讀者情感畫像庫(kù)構(gòu)建方法。對(duì)情感分析之后的情感知識(shí),按照讀者進(jìn)行分類,以個(gè)體為基礎(chǔ)單元對(duì)圖書館進(jìn)行情感畫像。基于本體的用戶畫像構(gòu)建方法雖然相對(duì)復(fù)雜,但是本體的語義理解性高于其他方法,而且借助本體能夠?qū)D書館讀者的情感知識(shí)實(shí)現(xiàn)語義共享與檢索。圖書館的讀者標(biāo)簽數(shù)據(jù)以本體的形式進(jìn)行存儲(chǔ)。本體工具protégé是斯坦福大學(xué)醫(yī)學(xué)院生物信息研究中心研發(fā)的用來存儲(chǔ)RDF三元組的軟件,該工具具備用戶界面友好、支持中文等特點(diǎn)。

  Protégé作為一款本體編輯和知識(shí)獲取軟件,在對(duì)圖書館讀者進(jìn)行畫像時(shí),標(biāo)簽維度以類的形式新建,標(biāo)簽名稱可以作為子類添加,而讀者分析數(shù)據(jù)則可以作為實(shí)例。此外,protégé工具支持圖表化,讀者的畫像數(shù)據(jù)可以直接在該工具中實(shí)現(xiàn)。本體本身具備 規(guī)范性,因此,存儲(chǔ)在本體中的讀者畫像數(shù)據(jù)在上傳之后即可實(shí)現(xiàn)讀者的情感知識(shí)數(shù)據(jù)共享。

  (四)圖書館讀者情感畫像應(yīng)用價(jià)值本文提出了圖書館讀者情感畫像模型,該模型將情感分析與畫像進(jìn)行有機(jī)結(jié)合,應(yīng)用價(jià)值有如下幾點(diǎn):其一,圖書館可以根據(jù)讀者的畫像結(jié)果提高個(gè)性化推薦服務(wù)的質(zhì)量。讀者的畫像結(jié)果中包含了大量情感信息,從情感信息中可以篩出患有心理疾病的讀者,通過對(duì)讀物的匹配可以幫助讀者度過情緒困境,提高個(gè)性化推薦服務(wù)的質(zhì)量。其二,對(duì)圖書館讀者的在線文本進(jìn)行情感分析可以積累完善情感詞典與知識(shí)庫(kù)。從微博評(píng)論中爬取的讀者評(píng)論包含很多情感信息,通過對(duì)這些情感信息的標(biāo)注分析,可以進(jìn)一步完善領(lǐng)域內(nèi)情感詞典缺乏的劣勢(shì)。

  三、結(jié)語

  本文提出了基于情感分析的圖書館讀者畫像研究模型,為圖書館服務(wù)的發(fā)展提供了新的研究方向。圖書館可以根據(jù)讀者的情感畫像結(jié)果為讀者提供個(gè)性化圖書推薦服務(wù),幫助讀者度過情緒低谷;另一方面,基于情感的圖書館讀者畫像豐富了圖書館個(gè)性化推薦的研究方法,為圖書館個(gè)性化推薦提供了新的思路。

  參考文獻(xiàn):

  [1]FillmoreCJ.Framesemanticsandthenatureoflanguage[J].AnnalsoftheNYAcademyofSciences,1976

  [2]劉丹,張興剛,任淑敏.基于用戶畫像的高校圖書館閱讀療法模式[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2018(7)

  [3]由麗萍,何玲玲.基于框架語義的在線醫(yī)療評(píng)論情感分析[J].現(xiàn)代情報(bào),2020(3)

  [4]單曉紅,張曉月,劉曉燕.基于在線評(píng)論的用戶畫像研究——以攜程酒店為例.情報(bào)理論與實(shí)踐,2018(4)

  [5]柳益君,羅燁,蔡秋茹,吳智勤,何勝.基于機(jī)器學(xué)習(xí)的高校圖書館個(gè)性化智能推薦服務(wù)方案[J].圖書館研究與工作,2020(3)

  [6]劉開瑛,由麗萍.現(xiàn)代漢語框架語義網(wǎng)[M].科學(xué)出版社,2015

  作者:蘇菊芳

主站蜘蛛池模板: 国产成人午夜精品影院游乐网 | 精品国产一区二区三区久久 | 国产妇女性爽视频免费 | 日本乱理伦中文三区 | 97精品国产 | 高清一级做a爱视频免费 | 国产精品怕怕怕视频免费 | 久久精品国产亚洲片 | 91福利国产在线观一区二区 | 亚洲欧洲日韩国产aa色大片 | 日本黄色录像视频 | 欧美亚洲国产另类在线观看 | 91视频网页版 | 深夜国产一区二区三区在线看 | 色伊人色成人婷婷六月丁香 | 成人黄色免费 | 久久久国产这里有的是精品 | 日本99视频 | 日韩中文字 | 成人在线视频网站 | 国产剧情演绎在线 | 福利在线不卡 | 成人午夜视频在线 | 台湾亚洲精品一区二区tv | 国产精品永久免费 | 伊人久久综合影院 | 丝袜无码一区二区三区 | 国产乱仑 | 日韩欧美一二三区 | 国产精品尹人在线观看免费 | 不卡中文字幕在线观看 | 久久国产精品高清一区二区三区 | 91网址在线观看 | 国产 另类 在线 欧美日韩 | 色999| 黄视频国产 | 精品大臿蕉视频在线观看 | 丝袜美女被出水视频一区 | 狠狠狠色丁香婷婷综合久久五月 | 区二区三区四区免费视频 | 成人国产激情福利久久精品 |