時間:2020年12月30日 分類:農業論文 次數:
摘要:當前我國內河航道信息服務多局限于被動式搜索,為建立面向航運企業、社會大眾、港航管理單位等多元用戶的主動推送式智能服務體系,向各類用戶提供豐富、及時、主動的信息服務,本研究提出一種基于用戶行為的智能信息推送模型。通過數據挖掘、Word2vec深度學習及地理圍欄等技術,結合長江航道圖APP業務特性,制定相應的服務策略,實現航道信息推送的精細化、智能化,促進航道信息服務由傳統型向智能型轉變。
關鍵詞:數據挖掘;深度學習;地理圍欄;智能推送
1引言
航運是長江流域經濟興旺發展的重要基礎,有力支撐了沿江社會經濟發展。建立智能化的航道信息服務體系對于提升長江航道運行能力、輔助企業航運決策、保障船舶航行安全、提高航行效率等方面具有重要的促進意義。智能化信息服務在國外的應用已經十分廣泛,美國于1993年就開始著手智能航運信息服務網絡系統的研究,該系統在水上交通監管與智能化的信息服務方面發揮了重要作用[1]。
我國學者在航運信息智能化服務中的研究表明,相比國外尤其是歐美等國家內河的智能信息服務建設,長江航道信息智能服務體系相關研究還處于起步階段[2-5],信息推送形式常見于被動式搜索,難以做到智能精準推送。隨著物聯網、大數據、云計算及人工智能等技術的高速發展以及長江航道信息化基礎建設的不斷推進,長江航道信息智能化服務建設步伐不斷加快。
長江航道圖APP自2015年正式對外推廣應用至今,已擁有超過8萬的用戶群體,累計服務200余家航運企業、科研機構、港航管理部門,為航道信息智能推送奠定了數據基礎。本文結合現有長江干線數字航道工程及長江電子航道圖建設成果,利用人工智能相關技術,深度挖掘用戶行為并以此來制定服務策略,結合深度學習來提取航道信息關鍵數據,并基于地理圍欄進行疊加分析以獲取推送對象,最終實現長江航道信息推送的精細化、智能化。
2信息智能推送方法
2.1基于用戶行為的智能推送模型
用戶行為數據是指用戶在使用長江電子航道圖APP過程中的操作記錄,包括位置、時間、功能模塊、訪問模式、用戶等信息,這些記錄描述了不同用戶在不同位置對不同功能模塊的訪問需求。智能推送服務從用戶行為出發,基于不同用戶的不同行為進行個性化定制,基于不同位置進行分析計算,從大量的航道信息數據中挖掘和提取對用戶有用的信息,使信息的推送更加精準、更加智能,從而提升用戶體驗。
本文提出一種基于用戶行為的航道信息智能推送模型,具體描述如下。 通過對用戶的偏好和行為進行分析,預測用戶使用需求。對非結構化的航道通告信息進行特征提取,通過地理圍欄對航道要素信息進行空間位置分析以縮小信息服務范圍,并基于用戶行為分析結果為不同的用戶制定不同的信息推送策略,從而實現航道信息推送的精細化、智能化。
2.2基于數據挖掘的用戶行為分析
行為是用戶對于目標或者對象進行相關操作的基本單元,相同的操作可以以不同的方式或者由不同的人來執行[6-8]。用戶行為分析是指對應用中海量的用戶行為數據進一步分析和挖掘,從而獲取用戶的行為特征和規律[9]。
常見的用戶行為分析方法有:(1)用戶特征分析(2)關聯分析(3)分類與預測(4)異常分析(5)TopN分析其中,TopN分析是用戶行為分析中較為常用的方法[10-16]。通過對某類業務進行TopN分析,可以獲取當前最受關注的業務類型及其訪問規律,TopN業務較大程度代表著該類業務的訪問特性,基于TopN業務分析采取相應的服務策略將是最為有效的方式。本文中的用戶行為分析主要是針對長江航道圖APP目標用戶的業務行為進行TopN分析,目的是找到目標用戶的行為模式和興趣偏好。基于長江航道圖APP功能特性,本文擬從以下兩個維度進行研究。
(1)行為模式:分析不同用戶的業務訪問情況;(2)興趣偏好:分析用戶對不同業務類型的訪問情況;通過上述兩個維度對用戶的行為數據進行分析研究,并用數據透視方法實現多維數據可視化,以此作為信息推送的服務策略,為航道信息的智能推送提供關鍵決策依據。
2.3基于word2vec的關鍵詞提取
關鍵詞提取是指從文本數據中抽取有價值信息的過程。word2vec是谷歌(Google)發布的開源深度學習工具,李躍鵬等人在關鍵詞提取研究中表明,基于word2vec的關鍵詞提取算法準確率較高[17]。word2vec通過一個淺而雙層的神經網絡模型,將詞轉化為向量表示,映射到高維向量空間中,從而尋求詞更深層次的特征,預測詞與詞之間的相似性,進而做聚類分析和詞性分析等。
CBOW模型根據某個中心詞前后N個連續的詞,來計算該中心詞出現的概率,即根據上下文預測當前詞語概率;Skip-gram模型與CBOW模型相反,通過當前中心詞預測上下文概率。對于較大數據量的文本訓練,CBOW在訓練速度上優于Skip-gram[18-20]。結合航道通告信息數據量大、時效性強、非結構化的特點,本文將采用CBOW模型進行位置關鍵詞的提取,將它們轉化為結構化的數據,為下一步位置分析及航道信息的智能推送提供數據支撐。
2.4基于地理圍欄的位置分析
地理圍欄(Geo-fencing)是位置服務(LBS)的一種新應用,它的基本原理在于利用預先設定的虛擬地理邊界來判斷位置源與之對應的空間關系,進而提供相應的服務。這種低成本、高效率的方式使得位置服務更加精準,同時節省功耗,是智能硬件時代消息推送的主流技術模式[21]。本文以“位置點+緩沖區”的形式來構建地理圍欄,并與航道要素信息進行疊加分析,獲取該地理圍欄范圍內所有的水道、水位站、相關通告、障礙物及重要區域等航道要素信息。
3實驗結果及分析
3.1行為分析
實驗以用戶在2020-05-0100:00:00至2020-05-0500:00:00時間段對長江航道圖APP的使用記錄作為數據源。選取10個用戶(以用戶1至用戶10表示)做實驗性分析,以與信息推送相關的氣象詳情、航道尺度詳情、航道公告詳情及水位站詳情作為參量指標,從不同用戶的業務訪問情況、用戶對不同業務類型的訪問情況兩個維度進行分析。
水利論文投稿刊物:《水運工程》月刊是經國家新聞出版署批準,由交通部主管中交水運規劃設計院主辦,面向全國水運工程行業,在國內外公開發行的科技刊物,本刊及時報道國家在水運工程行業方面的方針、政策;重點報道港口、航道與航電樞紐、橋梁、修造船廠、市政建設等勘察、設計、科研、施工、水運經濟及管理方面的新技術、新材料、新工藝新方法及技術發行方面的成果和主要經驗教訓。
4結束語
本文提出一種基于用戶行為的航道信息智能推送模型,首先,利用TopN分析法對用戶行為進行分析;其次,借助Word2vec深度學習工具實現航道通告消息的地名關鍵詞提取;最后,基于用戶行為分析結果制定航道信息智能推送服務的策略,并結合長江航道圖APP進行實驗驗證,初步實現了基于用戶使用習慣的信息個性化、智能化服務方式。當然,研究仍然存在一些不足之處,考慮到用戶行為數據樣本僅為2020-05-0100:00:00至2020-05-0500:00:00時間段的使用記錄,存在一定的局限性,后續隨著用戶數據的不斷豐富,可對用戶行為進行進一步挖掘與細分,不斷逼近、擬合用戶真實的需求,并以此來制定合理的信息推送服務策略,使信息推送更為精準、更加智能。
參考文獻
[1]J.W.Spalding,K.M.Shea,andM.J.Lewandowski.IntelligentWaterwaySystemandtheWaterwayInformationNetwork[C].Proceedingsofthe2002NationalTechnicalMeetingofTheInstituteofNavigation,SanDiego,CA,2002
[2]嚴忠貞,嚴新平,馬楓,等.綠色長江航運智能化信息服務系統及其關鍵技術研究[J].交通信息與安全,2010,28(6):76-81
[3]劉懷漢,曾暉,周俊安,等.內河航道助航系統智能化技術研究現狀與展望[J].水利水運工程學報,2015(6):82-87
[4]郭濤.長江智能航道關鍵技術分析[J].水運工程,2016(1):99-105
作者:朱劍華1李莉1張秋實1李赫1李偉凡1徐健2