時(shí)間: 分類:經(jīng)濟(jì)論文 次數(shù):
摘要在船舶軌跡壓縮方面,通常存在難以有效剔除海量船舶自動(dòng)識(shí)別系統(tǒng)(AIS)數(shù)據(jù)中無用數(shù)據(jù)點(diǎn)的問題。為改進(jìn)船舶軌跡壓縮質(zhì)量,提出基于道格拉斯—普克(DP)改進(jìn)的特征點(diǎn)(FP)–時(shí)空(TS)算法。在FPTSD算法中,關(guān)注船舶行駛過程中加減速、轉(zhuǎn)向、進(jìn)出特殊區(qū)域等重要的動(dòng)態(tài)行為點(diǎn),采用數(shù)值計(jì)算方法提取和保留AIS數(shù)據(jù)中上述動(dòng)態(tài)行為FP,以FP為初始點(diǎn)使用DP算法對(duì)AIS數(shù)據(jù)進(jìn)行壓縮;同時(shí),考慮AIS數(shù)據(jù)的TS特性,以時(shí)空距離為標(biāo)準(zhǔn)進(jìn)行取舍,進(jìn)而在FP和TS特性優(yōu)化的基礎(chǔ)上實(shí)現(xiàn)了船舶軌跡壓縮。結(jié)果表明,在保證壓縮率的前提下,經(jīng)FPTSDP算法壓縮后的軌跡更接近原始軌跡,同時(shí)其重要?jiǎng)討B(tài)行為點(diǎn)留存率更高。
關(guān)鍵詞AIS;FPTSDP算法;軌跡特征點(diǎn);時(shí)空特性;船舶軌跡壓縮
1引言
船舶自動(dòng)識(shí)別系統(tǒng)AutomaticIdentificationSystem,AIS軌跡數(shù)據(jù)中蘊(yùn)含著大量信息[14],包括船舶的靜態(tài)和動(dòng)態(tài)信息、船舶駕駛員的人為因素、船舶避碰行為、船員通常做法和習(xí)慣航路等。通過分析和研究船舶軌跡,可獲取能夠反映船舶規(guī)律的有效和潛在信息,進(jìn)而為海上安全監(jiān)管、船舶通航、航海保障等活動(dòng)提供必要的數(shù)據(jù)支持[5。然而,海量的AIS數(shù)據(jù)中存在一些利用價(jià)值較低的數(shù)據(jù)點(diǎn),當(dāng)移除此類數(shù)據(jù)后船舶軌跡不會(huì)產(chǎn)生改變。由此,為提高數(shù)據(jù)的利用效率,需要對(duì)冗雜的船舶AIS軌跡數(shù)據(jù)進(jìn)行壓縮處理。
通常,包括道格拉斯–普克(Douglaseucker,DP)在內(nèi)的多數(shù)船舶軌跡壓縮算法往往僅考慮軌跡的距離偏移量來壓縮軌跡[7],在壓縮過程中舍棄了船舶航速、航向改變、進(jìn)出某區(qū)域邊界等航跡特征點(diǎn),得到的軌跡忽略了船舶的動(dòng)態(tài)信息,降低了數(shù)據(jù)的利用價(jià)值;少部分壓縮算法通過航向、航速變化率均值來保留船舶軌跡特征點(diǎn)[810],但忽略了由傳感器誤差導(dǎo)致的航速、航向出現(xiàn)的小范圍波動(dòng),進(jìn)而保留了波動(dòng)點(diǎn),使得壓縮后保留的數(shù)據(jù)點(diǎn)過多。
極少數(shù)壓縮算法雖然考慮了船舶的時(shí)空特性[1113],但僅將時(shí)間特性僅作為分類和排序的指標(biāo),一般壓縮后的軌跡失真率較高。為提升軌跡壓縮算法質(zhì)量,充分應(yīng)用船舶動(dòng)態(tài)特征點(diǎn)(FeaturePoint,FP)數(shù)據(jù)以及時(shí)空特性(TemporalandSpatial,TS),在DP算法的基礎(chǔ)上提出FPTSDP船舶軌跡壓縮算法。對(duì)比結(jié)果表明,經(jīng)FPTSDP算法壓縮后的軌跡質(zhì)量得到較好的提升。
2AIS數(shù)據(jù)解碼與預(yù)處理AIS數(shù)據(jù)分析主要包括數(shù)據(jù)解碼、數(shù)據(jù)預(yù)處理和數(shù)據(jù)挖掘個(gè)步驟。數(shù)據(jù)預(yù)處理包括軌跡異常點(diǎn)清除和船舶軌跡壓縮環(huán)節(jié),經(jīng)過預(yù)處理的數(shù)據(jù),較為精簡(jiǎn),具有較高的實(shí)用性和使用價(jià)值。
2.1AIS數(shù)據(jù)解碼
AIS報(bào)文信息是一串復(fù)雜晦澀的字符串,封裝度極高,難以被人們直接理解和應(yīng)用,為獲取直觀信息,需要解碼原始信息。數(shù)據(jù)中的每個(gè)記錄點(diǎn)代表一個(gè)由船載AIS設(shè)備在某個(gè)瞬間發(fā)出的AIS報(bào)告信息。AIS數(shù)據(jù)解碼主要由個(gè)階段實(shí)現(xiàn)14]。首先,將AIS原始數(shù)據(jù)轉(zhuǎn)換為ASCII碼。然后,將ASCII碼值與16進(jìn)制數(shù)80H相比較,如果大于80H,則轉(zhuǎn)換出的ASCII碼值加上20H;如果小于80H,則轉(zhuǎn)換的ASCII碼值加上28H。
經(jīng)變換,原來的ASCII碼變成了位ASCII碼。單條信息轉(zhuǎn)換后全長(zhǎng)最大為168bit,每個(gè)字符都是轉(zhuǎn)換后6bit的ASCII碼,從字符“”開始為有效信息。最后,參照AIS國(guó)際標(biāo)準(zhǔn)信息對(duì)照表,解析出對(duì)應(yīng)信息。解碼后的信息是一連串由數(shù)字和組成的二進(jìn)制編碼,需對(duì)比國(guó)際AIS制定的標(biāo)準(zhǔn)協(xié)議,利用27種電文的格式分配相應(yīng)的比特位,拼接信息后解析出AIS信息。
2.2AIS數(shù)據(jù)預(yù)處理
經(jīng)數(shù)據(jù)解碼后的AIS數(shù)據(jù)不能直接使用,主要是存在許多異常數(shù)據(jù),會(huì)影響船舶軌跡壓縮的結(jié)果。為保證數(shù)據(jù)的準(zhǔn)確性,需要對(duì)AIS數(shù)據(jù)進(jìn)行異常數(shù)據(jù)處理工作。AIS數(shù)據(jù)主要有種異常情況。其一,存在靜態(tài)信息輸入錯(cuò)誤和部分信息未輸入的情況;其二,存在船舶航次相關(guān)信息輸入錯(cuò)誤或信息未輸入的情況;其三,存在因傳感器故障,導(dǎo)致船舶動(dòng)態(tài)信息出現(xiàn)錯(cuò)誤的情況。
由此,針對(duì)解碼后的數(shù)據(jù),需要開展AIS數(shù)據(jù)篩選預(yù)處理工作[15],即需要?jiǎng)h除AIS報(bào)告信息MMSI記錄為的點(diǎn);刪除數(shù)據(jù)中偏離所選水域航道較遠(yuǎn)的點(diǎn),如經(jīng)緯度顯著超出航道,速度出現(xiàn)負(fù)值或超出正常值;刪除時(shí)間相鄰的個(gè)AIS報(bào)告點(diǎn)距離超過實(shí)際可能最大值的軌跡點(diǎn)。在數(shù)據(jù)預(yù)處理階段,刪除無效的、不合理的、偏離航道的數(shù)據(jù),確保獲得有效的AIS數(shù)據(jù)。出于安全考慮,國(guó)際海事組織要求AIS數(shù)據(jù)點(diǎn)的報(bào)告間隔較短。
經(jīng)過上述篩選處理的AIS數(shù)據(jù)規(guī)模非常大,直接使用導(dǎo)致運(yùn)算速度緩慢,難以得到有效應(yīng)用。為此,需要對(duì)AIS數(shù)據(jù)進(jìn)行壓縮處理。傳統(tǒng)DP壓縮算法[16]根據(jù)距離閾值來判定。在DP算法中,通常將軌跡的起點(diǎn)和終點(diǎn)連成直線,計(jì)算軌跡上每個(gè)點(diǎn)到這條直線的距離,選擇其中距離最大的點(diǎn),將其距離與預(yù)設(shè)的距離閾值進(jìn)行比較,小于距離閾值,則舍棄這條直線兩側(cè)的點(diǎn),若大于距離閾值,則保留這個(gè)點(diǎn);然后,將起點(diǎn)和終點(diǎn)分別同這個(gè)點(diǎn)進(jìn)行連線,得到兩條直線,再分別重復(fù)上述步驟,迭代計(jì)算,直至所有點(diǎn)到對(duì)應(yīng)直線的距離都小于距離閾值,則完成壓縮。可知,上述方法壓縮出來的軌跡,動(dòng)態(tài)信息丟失較多、軌跡失真率較高,有必要設(shè)計(jì)一種高質(zhì)量的船軌跡壓縮算法。
3船舶軌跡壓縮FPTSDP算法
3.1特征點(diǎn)優(yōu)化
傳統(tǒng)DP算法一般僅通過距離偏移量來壓縮軌跡,會(huì)導(dǎo)致在壓縮過程中舍棄部分船舶的動(dòng)態(tài)信息、航速及航向改變、進(jìn)出某區(qū)域邊界等航跡特征點(diǎn),降低了數(shù)據(jù)的利用價(jià)值。因此,在DP算法的基礎(chǔ)上,需要優(yōu)化軌跡特征點(diǎn),開展提取和保留特征點(diǎn)研究工作。針對(duì)船舶航速、航向改變點(diǎn)的提取保留工作,可通過判斷各數(shù)據(jù)點(diǎn)的船舶航速、航向改變率是否高于某一設(shè)定閾值來實(shí)現(xiàn)。
船舶駛?cè)氤鲂袨閇18]包括駛?cè)氤龃a頭、錨地、橋區(qū)水域、漁區(qū)水域、環(huán)形道等閉合區(qū)域以及航道、危險(xiǎn)線、邊界線等非閉合區(qū)域。船舶駛?cè)氤鲕壽E特征點(diǎn)是指船舶通過上述非閉合區(qū)域邊界線前后的AIS數(shù)據(jù)點(diǎn)。對(duì)于此類軌跡特征點(diǎn),可以通過判斷相鄰兩個(gè)AIS數(shù)據(jù)點(diǎn)分別代入邊界線方程后值的乘積是否小于。
若小于則標(biāo)記并保留為船舶進(jìn)出某區(qū)域軌跡點(diǎn),構(gòu)成進(jìn)出某區(qū)域點(diǎn)集合。DP算法特征點(diǎn)優(yōu)化即通過上述方法,對(duì)軌跡中的特征點(diǎn)進(jìn)行識(shí)別保留,以特征點(diǎn)為DP算法輸入的初始點(diǎn)進(jìn)行軌跡壓縮。經(jīng)過特征點(diǎn)優(yōu)化后的DP算法進(jìn)行軌跡壓縮,壓縮后的軌跡保留了這些軌跡特征點(diǎn),關(guān)鍵信息含量高于傳統(tǒng)DP算法進(jìn)行壓縮后的軌跡,輪廓特征更加接近于原始軌跡,具有較高的利用價(jià)值。
3.2時(shí)空特性優(yōu)化AIS數(shù)據(jù)的時(shí)空特性
不難看出,在預(yù)期軌跡上偏移點(diǎn)所對(duì)應(yīng)的實(shí)際預(yù)期船位應(yīng)在偏移點(diǎn)計(jì)算到預(yù)期軌跡線歐式距離的船位之前。傳統(tǒng)DP算法計(jì)算軌跡的偏移量的方式往往采用歐式幾何上的垂直距離,此距離略小于時(shí)空偏移距離,使用此距離進(jìn)行壓縮,雖然壓縮后數(shù)據(jù)量較小,但壓縮后軌跡的失真率較高。因此,在DP算法的基礎(chǔ)上,需要進(jìn)行時(shí)空特性優(yōu)化,計(jì)算偏移船位與實(shí)際預(yù)期船位的時(shí)空距離,以時(shí)空距離對(duì)比DP算法距離閾值進(jìn)行偏移點(diǎn)的取舍。
4仿真結(jié)果及分析
長(zhǎng)江武漢段屬于長(zhǎng)江中游與下游的交接段,是長(zhǎng)江中下游水運(yùn)的重要中轉(zhuǎn)站,水運(yùn)較為繁忙,AIS基站僅一天接收到的AIS數(shù)據(jù)就有15萬條之多。水域內(nèi)橋區(qū)多、港區(qū)和停泊區(qū)多,增加了船舶在水域內(nèi)航行的安全隱患。為提升利用AIS數(shù)據(jù)對(duì)船舶軌跡的分析研究,可以從中獲取能夠反映船舶規(guī)律的、有效的、潛在的信息,進(jìn)而為海事機(jī)關(guān)對(duì)船舶違章行為監(jiān)管,修訂航行規(guī)則,推行船舶定線制提供有效的數(shù)據(jù)支持。為提升數(shù)據(jù)利用效率,需要對(duì)數(shù)據(jù)進(jìn)行壓縮處理。
結(jié)論
針對(duì)船舶AIS數(shù)據(jù)中無用數(shù)據(jù)點(diǎn)的剔除問題,本文對(duì)傳統(tǒng)DP算法進(jìn)行了特征點(diǎn)優(yōu)化和時(shí)空特性優(yōu)化,提出了基于FPTSDP算法的船舶AIS軌跡壓縮方法。實(shí)驗(yàn)結(jié)果表明,在保證一定壓縮率的前提下,F(xiàn)PTSDP算法充分考慮了特征軌跡點(diǎn)的保留問題,對(duì)船舶行駛中加速、減速、轉(zhuǎn)向、進(jìn)出特殊區(qū)域等重要的動(dòng)態(tài)行為點(diǎn)較完整地進(jìn)行保留。同時(shí),利用時(shí)空距離壓縮軌跡,較好地保留了原始軌跡的形狀。通過FPTSDP算法簡(jiǎn)化后的數(shù)據(jù)較為簡(jiǎn)潔,且有較大的二次利用價(jià)值。
參考文獻(xiàn)
[1]楊博辰.基于AIS的船舶軌跡分析的研究與應(yīng)用[D].成都:電子科技大學(xué)2018.
[2]DeVriesGKD,VanSomerenM.Machinelearningforvesseltrajectoriesusingcompression,alignmentsanddomainknoledge[J].ExpertSystemswithApplications,2012,39(18):1342613439.
[3]郭乃琨,馬壯壯,岳明橋.船舶軌跡挖掘與可視化技術(shù)分析研究[J].電子元器件與信息技術(shù)2020,4(3):137138.
[4]朱飛祥,張英俊,高宗江基于數(shù)據(jù)挖掘的船舶行為研究[J].中國(guó)航海2012,35(2):5054.
[5]LinK,LiX,ZhangZ,etal.AKmeansclusteringwithoptimizedinitialcenterbasedonHadoopplaform[C].InternationalConferenceonComputerScience&.Education.IEEE,2014:263266.
[6]XuK,ZhenH,LiY,etal.Bigdataacquisitionandanalysisplatformforintermodaltransport[J].InternationalJournalofDatabaseTheoryandAppliction,2016,9(12):6778.
[7]畢月琨.AIS基站系統(tǒng)中的數(shù)據(jù)解析與壓縮[D].舟山:浙江海洋學(xué)院2014.
[8]張永兵,孟凡彬,孟科.一種基于航向和航速變化率的船舶軌跡壓縮方法[P].天津:CN110990504A,20200410.
[9]張廣娜,梁營(yíng)力.船舶高速航行運(yùn)動(dòng)軌跡分段壓縮算法研究[J].艦船科學(xué)技術(shù)2020,42(12):4951.
[10]陳永超.基于數(shù)據(jù)挖掘的船舶軌跡預(yù)測(cè)研究[D].哈爾濱:哈爾濱工程大學(xué)2020.
[11]徐凱,邱家瑜,李燕.一種加入時(shí)間維的船舶軌跡高效離線壓縮算法研究[J].計(jì)算機(jī)科學(xué)2017,44(S2):498502.
作者:江海洋,高超,馬勇
級(jí)別:CSSCI南大期刊,北大期刊,統(tǒng)計(jì)源期刊
ISSN:1003-1707
刊期:進(jìn)入查看
格式:咨詢顧問
級(jí)別:CSSCI南大期刊,北大期刊,統(tǒng)計(jì)源期刊
ISSN:0577-9154
刊期:進(jìn)入查看
格式:咨詢顧問
級(jí)別:CSSCI南大期刊,北大期刊,統(tǒng)計(jì)源期刊
ISSN:1001-4233
刊期:進(jìn)入查看
格式:咨詢顧問
級(jí)別:北大期刊,CSSCI南大期刊
ISSN:1671-7465
刊期:進(jìn)入查看
格式:咨詢顧問
級(jí)別:CSSCI南大期刊,北大期刊,統(tǒng)計(jì)源期刊
ISSN:1005-9245
刊期:進(jìn)入查看
格式:咨詢顧問
級(jí)別:CSSCI南大期刊,北大期刊,統(tǒng)計(jì)源期刊
ISSN:1002-896X
刊期:進(jìn)入查看
格式:咨詢顧問
級(jí)別:北大期刊,CSCD期刊,統(tǒng)計(jì)源期刊
ISSN:0254-1769
刊期:進(jìn)入查看
格式:咨詢顧問
級(jí)別:CSSCI南大期刊,北大期刊,統(tǒng)計(jì)源期刊
ISSN:1002-4921
刊期:進(jìn)入查看
格式:咨詢顧問
級(jí)別:CSSCI南大期刊,北大期刊,統(tǒng)計(jì)源期刊
ISSN:1002-5936
刊期:進(jìn)入查看
格式:咨詢顧問
級(jí)別:CSSCI南大期刊,北大期刊,統(tǒng)計(jì)源期刊
ISSN:1001-8867
刊期:進(jìn)入查看
格式:咨詢顧問
級(jí)別:CSSCI南大期刊,北大期刊,統(tǒng)計(jì)源期刊
ISSN:1003-2886
刊期:進(jìn)入查看
格式:咨詢顧問
級(jí)別:北大期刊,統(tǒng)計(jì)源期刊,CSSCI南大期刊
ISSN:1000-5560
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:2045-2322
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:0284-1851
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:2352-4928
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:0169-4332
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:0960-7412
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:0048-9697
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:0191-2917
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:1741-7007
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:2238-7854
刊期:進(jìn)入查看
格式:咨詢顧問
數(shù)據(jù)庫:SCI
ISSN:2214-7144
刊期:進(jìn)入查看
格式:咨詢顧問