第一页欧美-第一页综合-丁香花成人另类小说-丁香久久-顶级欧美色妇xxxxbbbb

學術咨詢

讓期刊論文更省時、省事、省心

基于文本和用戶信息的在線評論質量檢測

時間:2020年03月09日 分類:電子論文 次數:

摘要:隨著互聯網的迅速發展,越來越多的用戶評論出現在社交網站上。面對迅速增長的評論數據,如何為閱讀評論的消費者提供準確、真實的高質量評論就顯得尤為重要。評論質量檢測旨在判斷在線評論的質量,在傳統的研究中,文本信息通常獨立地被用于預測評論質

  摘要:隨著互聯網的迅速發展,越來越多的用戶評論出現在社交網站上。面對迅速增長的評論數據,如何為閱讀評論的消費者提供準確、真實的高質量評論就顯得尤為重要。評論質量檢測旨在判斷在線評論的質量,在傳統的研究中,文本信息通常獨立地被用于預測評論質量。但是在社交媒體上,每個文本之間不是獨立的,而是可以通過發表文本的作者與其他文本相關聯,即同一個用戶或相近的用戶發表的評論質量具有一定的相似性。因此,為了更好的構建文本的表示和研究文本之間基于用戶的關聯,該文基于神經網絡模型分別構建用戶和文本的表示,同時,為了放大用戶信息的作用,我們進一步將基于注意力機制的用戶信息融合到文本中,從而提高文本評論質量檢測的效果。在Yelp2013數據集上進行實驗的結果表明,該模型能有效地提高在線評論質量檢測的性能。

  關鍵詞:評論質量;用戶表示;神經網絡模型;注意力機制

用戶信息

  相關論文范文:高?蒲杏脩粜畔⑿枨笱芯楷F狀與啟示

  摘要[目的/意義]全面了解科研用戶信息需求是高校圖書館在現代化環境下持續推進深化服務的前提,分析高?蒲杏脩粜畔⑿枨蟮难芯砍晒蔀榻窈蟮难芯刻峁┮欢ǖ膮⒖己徒梃b。[方法/過程]從近年公開發表的大量文獻中,概括出國內外圖書情報界對高?蒲杏脩粜畔⑿枨笱芯康7種研究方法、8個研究對象,厘清該領域研究的學術思維方式和基本立場。[結果/結論]高?蒲杏脩粜畔⑿枨蟪尸F出的6大特點,反映該主題的熱點與研究方向。綜述高?蒲杏脩粜畔⑿枨髮蒲羞^程4個階段的若干圖書館服務對策,提出后續研究建議。

  0引言

  隨著互聯網技術的普及,網絡購物市場也迅速發展起來,網絡用戶規模不斷擴大,在線評論網站如Yelp.Amazon等也迅速增多。對于網絡購物的潛在消費者而言,其他用戶的在線評論可以幫助他們做出有效的購買決策.他們通過閱讀其他已購買消費的用戶在線評論信息或與其他用戶交流購物感受可以對商品有更深層次的了解,進而做出有效的選擇.買到心儀的產品。而對于商家而言,通過挖掘大量的評論數據來了解該項產品的用戶體驗,發掘用戶最希望提供和改善的功能,以對產品做出針對性的改進。商家合理運用這些在線評論,將會為企業帶來一波生產率的增長和利潤的提高。對于產生在線評論的第三方網站來說,也可以通過提供高質量的評論信息來幫助他們建立良好的口碑,獲取更高的關注度。

  但是隨著在線評論數量的不斷增長,評論質量良莠不齊,故并非所有的評論都具備參考價值。同時由于網絡的匿名性,用戶非面對面接觸,溝通成本低,內部操作空間大,以及各大在線評論網站對評論內容的低約束性,導致一些用戶隨意發表評論,或提交一些與商品無關的評論.極端情況下,有的不良商家會找人撰寫虛假、刻意夸大商品功能的評論。甚至一些同行競爭對手,會故意撰寫詆毀對方商品或服務的惡意評論,這些評論對消費者的參考價值極低.甚至會引導消費者做出不正確的決定。在這種情況下.我們迫切地需要一個自動化的方法來輔助識別在線評論的質量。因此.科學、高效地從海量在線評論中幫助消費者抽取對決策參考價值高的評論信息就是本研究的價值所在。

  目前,國內外的相關學者已經對評論質量檢測做了相關研究,并取得了顯著的成果。但是,以往的研究都認為每條評論是獨立的,對于每條評論的質量進行單獨的檢測。本文與以往的研究不同,在社交媒體上,每個文本之間不是獨立的.而是可以通過發表文本的用戶與其他文本相關聯的。我們在Yelp2013實驗數據集中隨機抽取了兩個用戶發表在社交媒體上的兩條評論,表1給出了評論示例及該評論在社交媒體上的得分。

  用戶A在社交媒體上發表的評論文本信息較為單薄,只有簡單的類似“最好”“很棒”等形容詞,具有強烈的個人傾向性.對大多數閱讀評論的消費者參考價值不大,評論的質量普遍偏低。而用戶B發表的評論描述相對仔細,評論有針對性,例如•會具體到“周末有本地人才的音樂表演”“點單服務態度”等相關的描述,這種表述對閱讀評論的消費者選擇的可參考性較大,他們可以根據自己的愛好和需求進行選擇。因此.在社交媒體上,閱讀評論的消費者對用戶A的評論打分普遍偏低,對用戶B的評論打分普遍偏高。這說明同一個用戶或相近用戶,在社交媒體上發表的評論質量具有一定相關性。

  在本文的研究中,我們將同時考慮文本信息以及用戶信息對于評論質量的影響。本文首先基于神經網絡模型構建用戶和文本的表示,同時為了研究用戶信息對評論質量檢測的影響,考慮到在線評論網站上的評論與傳統評論文本的不同,社交媒體上,每個文本之間不是相互獨立的.通過用戶之間關聯可以找到這些評論質量之間的相關性。

  考慮到注意力機制在自然語言處理的其他任務上表現優異.因此,為了放大用戶信息的作用,我們將基于注意力機制的用戶信息融合到文本信息中。通過設計相關實驗,驗證在文本信息中加入針對用戶信息的注意力機制•對評論的質量檢測性能具有明顯的提升作用。本文組織結構安排如下:第1節介紹了情感分類和在線評論質量檢測的相關工作;第2節介紹了數據收集的過程,且重點描述了本文構建的模型;第3節是實驗設置的介紹和實驗結果分析;最后,是對研究工作進行總結,同時提出下一步的研究方向。

  1相關工作

  評論的質量應該是以該條評論給消費者購物帶來的參考價值來衡量的,評論給消費者帶來的參考價值越高,評論質量就越高。所以.有很多在線評論網站會進行“有用性投票”,即通過一條評論所獲得的有用投票數占總投票數的比例來定義它的質量。實際上這種方法存在一定的弊端,可能會淹沒一些高質量的評論。目前,對在線評論質量檢測方面的相關研究主要從以下方面展開。

  1.1情感分類

  情感分類一直是自然語言處理領域的研究熱點,該任務的目標是對于給定的文本,推測其對應的情感極性,如Positive、Negative和Neutral。情感分類的方法也有很多,有傳統的基于支持向量機、樸素貝葉斯的分類方法,也有基于熱門的深度學習分類方法。Wang等E提出多項樸素貝葉斯(MNB)模型和使用樸素貝葉斯特征的支持向量機模型(NBSVM)來進行情感分類。Pang等⑷以電影評論作為數據集,采用了三種機器學習方法:樸素貝葉斯、最大爛分類和支持向量機,實驗表明這三種機器學習方法在情感分類中的表現不如在主題分類中。Turney⑸提出了一種基于點互信息值來分析特定短語的情感極性.進而判斷整篇文檔情感傾向性的方法,該方法首先將文本進行分詞和詞性標注并提取出形容詞或副詞短語,然后使用“excellent"和“poor”兩個種子詞與未知詞在搜索網頁中的互信息來計算未知詞的情感極性,并用以計算整個文本的情感極性。

  近年來,隨著深度學習、神經網絡的快速發展,很多神經網絡技術也被應用到情感分類中,Cao等⑷發現卷積神經網絡(CNN)與支持向量機(SVM)分類器相比,雖然情感分類的準確度得到了提升,但是不能有效地執行非線性分類,因此.他們提出了一個將CNN與SVM結合起來的模型,實驗表明,該模型能達到較高的情感分類準確率。長短時記憶網絡(LSTM)作為一種具有更復雜計算單元的遞歸神經網絡,因其優良的序列信息保存能力,在各種序列建模任務中取得了很好的效果,Socher等灼將LSTM模型應用到情感分類任務中,也取得了不錯的效果。

  Tai等⑷將傳統的LSTM結構推廣到樹狀網絡拓撲結構來進行情感分類。Qian等:;:通過損失函數將語言學規則引入到現有的句子級別情感分析的LSTM模型中,在沒有增加模型復雜度的情況下,有效地利用情感詞典、否定詞和程度副詞的信息,在實驗數據集上取得了較好的效果。近年來’對情感分類的研究熱度也一直不減,Songpan等X提出了一種新的情感分析方法一情感短語模式匹配(sentimentphrasepatternmatching,SPPM),SPPM與其他算法相比較•準確率、召回率和F1值都有較大幅度的提高.該方法可以根據學生的意見來改善教學策略。Shen等3提出了一種基于擴展特征和動態合并的雙通道卷積神經網絡的文本情感分類算法,該算法比傳統的單通道卷積神經網絡算法具有更好的分類效果。但是以上研究都沒有考慮評論質量的影響.低質量的評論會影響情感分類的準確率,因此,評論質量檢測就顯得尤為重要。

  1.2評論質量檢測

  在線評論質量檢測研究,既可以看作為傳統的文本分類問題,也可以看作成一個回歸問題。以往的評論質量研究都主要集中在利用評論的文本信息,研究影響評論質量的不同特征。例如,Kim等〔⑷研究表明,評論發表距今的時間是顯著影響評論質量的元數據特征。如Ghose等⑼、Li等〔叩、Liu等指出影響評論質量檢測主要的語言特征應包括評論字數、句子數、不同詞性(名詞、動詞、形容詞等)的詞語數等。胡學鋼等「⑷綜合評論文本屬性、評論者屬性和店鋪屬性這三個影響因素.提出了一種基于多元線性回歸算法的在線評論質量預測模型。Archak等⑴指出評論的極端性、評論的深度、評論的產品類型都將會對評論的質量造成影響。Chen等⑴強調在評論所包含的名詞中,產品屬性名詞的頻次是重要的語言特征,高質量的評論中應包含一定數量的產品屬性名詞。近年來,也有一些關于發表評論的用戶信息對評論質量檢測影響的研究。

  Ghose等認為,評論者相關信息是有效的評論質量檢測特征,例如,評論者以往發表的評論數及有用率、評論者身份等。Cheng等"的研究側重于分析評論者追隨者人數、評論圖片質量、評論字數以及周邊路線這些社會因素對評論質量的影響。但是這些研究都是利用評論者自身的屬性,例如,評論者好友的數量、注冊的時間、發表的有用評論數。與上述利用評論者屬性的研究不同.本文直接參考用戶以往發表的在社交網站上的評論文本信息.利用同一個用戶在社交網站上發表的評論質量具有一定的相似性.我們利用用戶發表在社交網站上的歷史評論文本信息構建用戶的表示,以進一步提高評論質量檢測的性能。

  2基于注意力機制用戶信息的評論質量檢測

  本文利用評論的文本信息構建LSTM模型對評論的質量進行檢測,考慮到在線評論網站上的評論與以往獨立的單文本不同,社交網站上,每個評論文本之間不是相互獨立的.通過用戶之間相關性可以找到這些評論質量之間的相關性。一般來說.擁有更多粉絲和已發表的高質量評論數越多的用戶,再次發表的評論質量會更高,因為同一個用戶或者相近的用戶發表的評論質量也是相似的。因此.我們在模型中加入了用戶信息.從而對評論的質量進行全面的預測。最近出現的注意力機制在其他自然語言處理任務上都取得了不錯的效果,注意力機制可以更好地表征文本,在訓練時可以自動獲取更為重要的特征。

  例如,在情感分類任務中,地名、人名等名詞沒有表達情感類的形容詞重要,所以,在神經網絡訓練時.表達情感的形容詞就應該占有更大的權重。因此,引入注意力機制可以將神經網絡的注意力集中在那些對當前任務更重要的向量上,以提高模型的準確率。所以,為了進一步放大用戶信息的作用,我們結合注意力機制將用戶信息融合到文本信息中,實驗結果表明.評論質量檢測分析的性能得到了進一步提高。

  3結論

  互聯網上日益豐富的評論信息確實給人們的生活帶來了便利,為人們在購物時的決策提供了更多的參考。但互聯網上的信息良莠不齊,數據龐大,信息爆炸也為消費者帶來了困惑,同時也影響了評論的參考價值,降低了消費者決策的效率和效果。因此快速地篩選出對消費者決策最有幫助的高質量評論就顯得尤為重要?紤]到社交媒體上同一個用戶發表評論質量的相似性,本文提出一種基于LSTM神經網絡,針對用戶信息引入注意力機制來預測在線評論質量的模型。該模型能幫助消費者從在線評論網站海量的評論中快速識別出有用的評論,做出正確的購買決策。

  類比在模型中加入評論的用戶信息,我們很容易聯想到.加入評論的對象商家信息是否也會提高評論質量分析的性能。我們在分析實驗語料時發現,評論者的好友信息也具備一定的參考價值,有用評論的用戶好友質量普遍比較高,發表的評論數比較多,同時有用的評論也比較多,因此,可以考慮在模型中加入用戶的好友信息。同時,我們受到情感分類的啟發,分析評論的情感信息或許也能更好地篩選質量高的評論。以上所述都有待未來更詳盡的研究工作來完成,本文以后的工作將進一步考慮加入商家信息和情感信息,并探究其對評論質量的影響。

主站蜘蛛池模板: 亚洲欧美日韩激情在线观看 | 日韩毛片大全免费高清 | 女视频www女中国 | 免费能看的黄色网址 | 玖玖在线免费视频 | 插插插av| 日韩另类| 日本一级毛片视频网站 | 久久五月女厕所一区二区 | 亚洲男女视频 | 亚洲国产精品线观看不卡 | 婷婷色在线视频 | 免费国产一区二区在免费观看 | 精品欧美一区二区精品久久 | 日韩黄色免费观看 | 天天色一色 | 91欧美国产 | 免费在线观看黄色网址 | 日本高清不卡中文字幕 | 一级毛片在线播放 | a一级毛片免费播放 | 丁香六月婷婷精品免费观看 | 日韩精品电影一区 | 香蕉97超级碰碰碰碰碰久 | 亚洲另类网 | 免费日韩毛片 | 99亚洲乱人伦精品 | 日本69sex护士www | 亚洲天堂色视频 | 日韩综合网 | 国产在线观看高清精品 | 亚洲综合亚洲综合网成人 | 91精品国产爱久久久久久 | 国产酒店自拍 | 97视频免费看 | 亚洲人成网站色7799在线观看 | 奇米影视亚洲狠狠色 | 国产床戏做爰免费观看网站 | 涩涩网站在线观看 | 国产精品美女一区二区 | 欧美日韩精品一区二区三区 |