第一页欧美-第一页综合-丁香花成人另类小说-丁香久久-顶级欧美色妇xxxxbbbb

學術咨詢

讓期刊論文更省時、省事、省心

基于Python的豆瓣金融類圖書數據分析

時間:2021年10月14日 分類:經濟論文 次數:

【摘要】豆瓣讀書作為豆瓣網的一個子欄目,2005年上線后已發展成為國內擁有信息最齊全、用戶群體規模最大且活躍的閱讀網站。 本文基于Python語言從豆瓣閱讀頁面中采集和獲取與金融類圖書有關的數據,通過對數據進行清洗、提取,把書名、作者、出版社等關鍵信

  【摘要】豆瓣讀書作為豆瓣網的一個子欄目,2005年上線后已發展成為國內擁有信息最齊全、用戶群體規模最大且活躍的閱讀網站‍‌‍‍‌‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‍‍‌‍‌‍‌‍‌‍‍‌‍‍‍‍‍‍‍‍‍‌‍‍‌‍‍‌‍‌‍‌‍。 本文基于Python語言從豆瓣閱讀頁面中采集和獲取與金融類圖書有關的數據,通過對數據進行清洗、提取,把書名、作者、出版社等關鍵信息保存為CSV文件存儲,并對其進行可視化分析‍‌‍‍‌‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‍‍‌‍‌‍‌‍‌‍‍‌‍‍‍‍‍‍‍‍‍‌‍‍‌‍‍‌‍‌‍‌‍。 一方面探究基于用戶生成內容(UGC)的用戶信息進行分析,找出它們之間的關系; 另一方面通過數據可視化分析,深入挖掘豆瓣圖書信息中數據的規律,為讀者和用戶選取金融類圖書閱讀提供幫助‍‌‍‍‌‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‌‍‍‍‌‍‍‍‍‌‍‌‍‌‍‌‍‍‌‍‍‍‍‍‍‍‍‍‌‍‍‌‍‍‌‍‌‍‌‍。

  【關鍵詞】Python; 數據分析; UGC; 可視化

圖書館論文

  豆瓣是目前網上對于圖書信息收錄最全的網站,圖書評論都直接由用戶提供(User-generated  content, UGC),用戶對圖書的記錄是:評分、貼標簽、寫短評等等。 豆瓣的圖書評分可以最直觀地幫助用戶進行圖書挑選,但由于用戶愛好不同、傾向不同,評分仍會帶有一部分主觀因素,不能做到絕對客觀。 因此,本文提出基于Python的數據可視化分析研究方法,對標簽為“金融”的豆瓣圖書進行了更深入的分析,為讀者和用戶如何選取金融類圖書提供指導和建議。

  圖書館論文范例: 高校圖書館利用微媒體技術進行數字化閱讀推廣的策略

  一、研究框架

  本文對豆瓣金融類圖書的研究框架如圖1所示。 首先,用Python抓取網頁源代碼并獲得包含書名、作者、出版社等各個網頁元素的數據。 其次,將所抓取的圖書數據進行處理和分析,并進行格式化存儲,以便于后續的可視化展示。 接著對數值數據和文本數據進行預處理操作,包括異常值處理、數據清洗、缺失數據補齊等。 最后進行數據分析,利用Python做詞云圖、用Excel透視表繪制散點圖、條形圖等直觀的展示圖書各要素之間的關系,評估結果并得出結論。

  二、數據分析

  本文對Python抓取到的1000本豆瓣金融類圖書信息進行了出版社詞云可視化分析、評分可視化分析、評價人數和評分可視化分析。

  (一)出版社詞云可視化分析。 使用Python中的Wordcloud模塊,對1000本金融類圖書的出版社進行分析并生成詞云圖。 從圖中可以看出,出版社這個詞出現的頻率最高,這是因為大部分出版社的后綴都是出版社,但也有部分后綴如出版公司、商務印書館等,因而并未對出版社此后綴做統一處理。 拋開此頻率最高的詞,其余頻率前三的出版社自動加上后綴名,分別為機械工業出版社193本、中信出版社189本和中國人民大學出版社77本,說明國內外學者們尤其是國外學者對這三個出版社的青睞度最高。

  (二)評分可視化分析。 對1000本金融類圖書評分數據進行分析,得出評分最高的5本金融類圖書,通過Excel繪制條形圖。 評分最高的5本金融類圖書分別為:應用公司財務、投資者養成指南(一)、金融隨機分析(共2冊)、證券法學(第四版)和投資者文摘,評分分別為9.9分、9.8分、9.7分、9.7分和9.7分。

  (三)評價人數和評分可視化分析。 對1000本金融類圖書評價人數的數據進行整理,通過Excel繪制散點圖。 由圖中可以發現,絕大部分金融類圖書的評價人數都集中在0-5000人這個區間內,其中評價人數前五的書籍為:貨幣戰爭、原則、經濟學原理(上下)、思考快與慢和偉大的博弈,評價人數分別為43853人、24112人、16539人、14531人和12409人,評分分別為7.2分、8.3分、9.1分、8.1分和8.3分。

  同時又對1000本金融類圖書中評分大于等于9.0以上的評價人數的數據進行整理,通過Excel繪制散點圖。 由圖中看出,絕大部分評分大于等于9.0以上的評價人數都集中在0-4000人這個區間內,其中評價人數前五的書籍為:經濟學原理(上下)、經濟學原理、經濟學原理(第7版)、期貨市場技術分析和彼得·林奇的成功投資,評價人數分別為16539人、10259人、2926人、2398人和2029人。

  將兩張圖對比可以發現,評價人數前五的書籍評分都不高,僅有一本書的評分大于9.0分。 其中評價人數最多的書籍是貨幣戰爭,但其評分只有7.2分; 評分前五的書籍評論人數也不多,僅有經濟學原理(上下)這本書處在評論人數前五的書籍中。 由此得出評論人數多的評分不一定高,評分高的評論人數不一定高,評論人數和評分之間的相關性較弱。

  (四)評分和出版年份可視化分析。 對1000本金融類圖書評價人數的數據進行整理,通過Excel繪制散點圖。 評分大于等于9.0以上的書籍出版年份集中在2005年以后,且評分大多集中在9.0分和9.1分,評分為9.7分及以上的書籍較少。 進一步分析猜測評分大于等于9.0分以上的這些書籍可能是由于出版年份較晚,閱讀和評論人數較少。 而一本書的總體評分受每個評分人給出的評分和評論人數的影響,可能是少部分的評論人數均給出較高的評分,因而評分大于等于9.0分以上的書籍并不代表書的熱度高和受歡迎程度高,這兩者之間的相關性較弱。

  三、結論

  統計學和圖書館學等傳統研究方法并不能深層次地挖掘圖書信息的潛在規律。 本文基于Python語言從豆瓣讀書頁面中獲取金融類圖書相關數據,并對其進行可視化分析,得出以下結論:

  圖書出版社詞云分析得出,機械工業出版社、中信出版社和中國人民大學出版社是出版金融類圖書最多的三個出版社,說明讀者對這三個出版社的青睞度最高。 在選擇圖書出版社時,可優先將自己的作品交給這三個出版社進行出版發行,同時,圖書館、書店等在采購金融類圖書時也可優先關注這三個出版社的信息。

  圖書評分分析得出,評分最高的5本金融類圖書分別為:應用公司財務、投資者養成指南(一)、金融隨機分析(共2冊)、證券法學(第四版)和投資者文摘,這對有意學習金融知識的人來說,具有很好的參考作用,在閱讀金融類圖書時可以更優先考慮評分最高的金融類書籍。

  圖書評價人數和評分分析得出,評價人數前五的書籍評分都不高,僅有一本書的評分大于9.0分。 其中評價人數最多的書籍是貨幣戰爭,但其評分只有7.2分; 評分前五的書籍評論人數也不多,僅有經濟學原理(上下)這本書處在評論人數前五的書籍中。 由此可見評論人數和評分之間的相關性較弱,因而在選擇金融類圖書時,不能夠由評分人數的多少判定圖書的好評度,也不能由評分的高低來判斷圖書的熱度。

  評分和出版年份分析得出,評分大于等于9.0以上的書籍出版年份集中在2005年以后,且評分大多集中在9.0分和9.1分,評分為9.7分及以上的書籍較少。 進一步分析猜測評分大于等于9.0分以上的這些書籍可能是由于出版年份較晚,閱讀和評論人數較少。 而一本書的總體評分受每個評分人給出的評分和評論人數的影響,可能是少部分的評論人數均給出較高的評分,因而評分大于等于9.0分以上的書籍并不代表書的熱度高和受歡迎程度高。 由此可見這兩者之間的相關性較弱,因而在選擇金融類圖書時,不能只根據評分來判定圖書的熱度和受歡迎程度,還需要考慮出版年份、評論人數等多重因素。

  四、結語

  綜上,本文基于Python和Excel透視表對豆瓣金融類圖書信息進行了深入的分析,在用戶對金融類圖書的選擇上給出了更好的建議,同時也給圖書館、書店等采購金融類圖書提供了建設性意見。 但本文在數據預處理部分考慮的并不充分,此外本次研究選擇的僅是對豆瓣金融類圖書進行分析,并未對更多標簽下的圖書信息進行分析,具有一定的局限性。

  【參考文獻】

  [1]朱滌塵,夏換.基于數據可視化和線性回歸的豆瓣圖書榜單數據分析[J].信息技術與信息化,2019(12): 218-220.

  [2]羅培銘.虛擬社區用戶生成內容的影響因素——以小紅書為例[J].新聞研究導刊,2018,9(12):60-61.

  [3]徐亞茹.基于標簽的圖書個性化推薦系統的設計與研究[D].山東師范大學,2018.

  [4]莊瑩.中國圖書排行榜研究[J].中國出版,2015 (12):64-69.

  [5]胡躍鵬.豆瓣圖書排行榜運營策略研究[D].河北大學,2018.

  [6]周洪斌.基于Python的豆瓣圖書評論數據獲取與可視化分析[J].沙洲職業工學院學報,2018,21(04):1-6.

  [7]夏洋.基于用戶參與的社交網站標簽差異及有效性研究——以豆瓣讀書網為例[J].江蘇科技信息,2019, 36(36):67-71.

  作者:揚州大學社會發展學院 馬夢燁; 華中師范大學信息管理學院 王涵

主站蜘蛛池模板: 亚洲天堂一区二区三区四区 | 高清亚洲 | 亚洲综合91社区精品福利 | 欧美.成人.综合在线 | 日本a及毛片免费视频 | 日本特级全黄一级毛片 | 中日韩国语视频在线观看 | 亚洲无线一二三四手机 | 二级黄的全免费视频 | 国产伊人精品 | 日本在线黄 | 国产女人精品性视频 | 浪潮ar二三区 | 特级做a爰片毛片免费看一区 | 伊人久久久久久久久香港 | 美女批日起爽在线观看 | 天天做夜夜操 | 国产精品视频色拍拍 | 国产精品久久久久久久9999 | 外国毛片视频 | 亚洲图欧美日韩色综合图 | 六月丁香激情综合成人 | 色综合久久加勒比高清88 | 亚洲欧美日韩精品久久奇米色影视 | 国产乱人伦偷精品视频不卡 | 国产精品视频免费视频 | 欧美黄色一级 | 国产午夜一级鲁丝片 | 99在线国内精品自产拍 | 精品视频一区在线观看 | 国产亚洲欧美日本一二三本道 | 一区两区三不卡 | 最爽的乱淫片免费 | 黄网站色在线视频免费观看 | 婷婷六月综合 | 亚洲欧美日韩不卡一区二区三区 | 黄色影院免费观看 | 一级毛片免费完整视频 | 日韩岛国片 | 色花堂的网站地址 | 嗯啊在线观看免费影院 |