第一页欧美-第一页综合-丁香花成人另类小说-丁香久久-顶级欧美色妇xxxxbbbb

學術(shù)咨詢

讓期刊論文更省時、省事、省心

集時空聚類和指標篩選的公共交通通勤者識別

時間:2021年07月19日 分類:科學技術(shù)論文 次數(shù):

摘要:通勤者作為公共交通乘客構(gòu)成的核心部分,其識別提取是此類人群特征分析的前提。本文基于南京市常規(guī)公交、軌道交通和公共自行車的刷卡與設(shè)施數(shù)據(jù),進行公共交通通勤者識別。首先,根據(jù)數(shù)據(jù)信息是否完整,分別采用兩步聚類法和線路相似性整合法提取相似

  摘要:通勤者作為公共交通乘客構(gòu)成的核心部分,其識別提取是此類人群特征分析的前提。本文基于南京市常規(guī)公交、軌道交通和公共自行車的刷卡與設(shè)施數(shù)據(jù),進行公共交通通勤者識別。首先,根據(jù)數(shù)據(jù)信息是否完整,分別采用兩步聚類法和線路相似性整合法提取相似性出行;然后,識別職住地;最后,通過出行天數(shù)、單次出發(fā)時間差和工作往返出發(fā)時間差項指標完成篩選。經(jīng)通勤調(diào)查驗證和方法有效性比較,各類參數(shù)取值合理,方法有效并存在應(yīng)用優(yōu)勢。本文提出的通勤識別方法將出行時空規(guī)律與指標篩選緊密結(jié)合,并考慮了數(shù)據(jù)完備與不完備條件下的不同數(shù)據(jù)處理思路,方法通用性和操作性強,識別結(jié)果能夠為公共交通通勤乘客特征分析提供數(shù)據(jù)基礎(chǔ),有效指導后續(xù)城市公共交通設(shè)施布局和和服務(wù)優(yōu)化。

  關(guān)鍵詞:公共交通;通勤識別;時空聚類算法;通勤者;多源數(shù)據(jù);相似性出行

公共交通

  引言

  通勤出行在城市出行總量中仍占據(jù)絕對多數(shù),同時存在明顯的時空規(guī)律性,較為適合公共交通方式通過線路布設(shè)、班線運營等方面的高效組織,提升城市交通資源的使用效率。公共交通通勤者識別作為后續(xù)此類群體出行特征分析的基礎(chǔ)工作,在公共交通規(guī)劃與管理研究中至關(guān)重要。早期由于技術(shù)限制,國內(nèi)外文獻多通過傳統(tǒng)通勤調(diào)查或居民出行調(diào)查研究公共交通通勤特征,直接從被調(diào)查的通勤乘客中分析使用公共交通工具出行的乘客特征;后期隨著信息技術(shù)的發(fā)展,學者大多基于公共交通刷卡數(shù)據(jù),輔以其他數(shù)據(jù)或者機器學習等新技術(shù)手段,來開展公共交通通勤人群的識別研究。

  交通論文投稿刊物:《城市公共交通》(月刊)創(chuàng)刊于1989年,是中國土木工程學會、北京市公共交通總公司暨城市公共交通專業(yè)分會主辦及編輯出版的、公開發(fā)行的綜合指導性學術(shù)期刊。

  目前較為常見的依托公共交通刷卡數(shù)據(jù)的通勤者識別方法大致分為三種:一是利用刷卡數(shù)據(jù)中的“卡類型”字段來識別,部分國家如日本會發(fā)行針對通勤(學)人群的“通勤票”;二是融合公共交通刷卡數(shù)據(jù)、空間數(shù)據(jù)、出行調(diào)查數(shù)據(jù)等數(shù)據(jù)來識別,如識別職住地后再提取公交通勤者出行信息;三是僅使用公共交通刷卡數(shù)據(jù),從時間的重復性和穩(wěn)定性角度設(shè)置識別規(guī)則,包括一周首次刷卡總次數(shù)和首次刷卡時間差、高頻OD對的出行頻次和出發(fā)時間標準差等指標,或是利用聚類、分類、神經(jīng)網(wǎng)絡(luò)10等機器學習算法進行判別。

  目前研究較多直接對指標設(shè)定篩選規(guī)則來識別公共交通通勤者,選取指標時主觀性較強,閾值設(shè)定單一,無法較完整和準確地表征通勤者出行規(guī)律;而僅使用機器學習算法識別時,仍存在指標計算復雜、對通勤者表征程度不足的問題;同時,識別方法較少考慮實際數(shù)據(jù)質(zhì)量,實用性較弱。

  因此,本文基于南京市公共交通系統(tǒng)刷卡和設(shè)施數(shù)據(jù),提出一種集時空聚類和指標篩選的公共交通通勤者識別方法,以時空密度聚類算法(DensityBasedSpatialClusteringofApplicationswithNoise,STDBSCAN)為基礎(chǔ)算法,根據(jù)數(shù)據(jù)情況提出兩步聚類法和線路相似性整合法,為基于職住地與指標識別的篩選操作縮小了識別范圍,可操作性和通用性強,能夠為公共交通通勤乘客的相關(guān)分析提供數(shù)據(jù)基礎(chǔ),同時對公共交通設(shè)施與服務(wù)優(yōu)化提供一定的參考依據(jù)。1研究數(shù)據(jù)

  1.1數(shù)據(jù)描述

  本文以南京為案例,研究的公共交通系統(tǒng)數(shù)據(jù)分為刷卡和設(shè)施數(shù)據(jù)兩類,時間范圍為2019年12月。(1)刷卡數(shù)據(jù)包括公交、軌道交通和公共自行車刷卡數(shù)據(jù),包括乘客個人和乘車時空信息(其中公交刷卡數(shù)據(jù)受一票制計費和設(shè)備記錄影響,下車均無位置信息,部分上車無位置信息),匿名乘客編號項成為公共交通系統(tǒng)乘客的唯一標識。(2)設(shè)施數(shù)據(jù)為這三類公共交通方式的線路和站點信息,包括站點線路編號和空間信息。

  1.2數(shù)據(jù)處理

  通勤者的通勤出行具有時空和模式上的穩(wěn)定性,可以作為通勤者識別的依據(jù)。乘客每次公共交通出行的信息提取是基礎(chǔ),需要對數(shù)據(jù)進行預(yù)處理、換乘識別和出行信息整合操作。Step1數(shù)據(jù)清洗。剔除錯誤和重復數(shù)據(jù),統(tǒng)一字段格式,并將刷卡表整合為一份公共交通系統(tǒng)刷卡數(shù)據(jù),共2,239,532條數(shù)據(jù)。Step2換乘識別。由于存在同一次出行對應(yīng)多條數(shù)據(jù)的情況,故需要識別乘客的換乘行為,將不同出行階段的記錄整合為一條出行記錄。本文采用經(jīng)緯度空間距離計算與公交線路可換乘站點提取并行的方法,判別空間層面方式間換乘的可行性,閾值設(shè)為500m11。

  將相鄰出行階段記錄的時間差與95%分位時間閾值比較,得出最終的換乘行為識別記錄。Step出行信息整合。將每位乘客每日每次出行的第一階段出發(fā)地信息作為該次出行的出發(fā)地信息,最后一階段的到達地信息作為該次出行的到達地信息,整理后得到1,562,668條公共交通出行數(shù)據(jù)。本文基于出行時空規(guī)律性來識別通勤者,故需要提取出部分關(guān)鍵的出行字段(如表所示),包括乘客編號USERID、出發(fā)時間ONTIME、出發(fā)地經(jīng)度ON_LNG、出發(fā)地緯度ON_LA、到達地經(jīng)度OFF_LNG、到達地緯度OFF_LAT以及乘坐線路名稱TRIPROUTE。

  2通勤者識別方法

  2.1識別思路

  本文所提識別方法分為相似性出行整合和兩步篩選兩個步驟:首先,依據(jù)乘客在研究周期的出行集合中是否存在相似性出行,對乘客進行初步篩選,以獲得具有規(guī)律性出行特征的候選通勤者;然后,通過識別候選通勤者的職住地并完成對應(yīng)的通勤出行初步提取操作,再利用識別指標進行篩選,以得到最終的通勤者識別結(jié)果。

  2.2相似性出行整合法

  本文中的相似性出行是指具有相似起訖點位置和出發(fā)時間的出行集合,每位乘客在研究周期內(nèi)的出行都將被分為不同的組別,同一組別的出行即為同一類出行。類似地,時空聚類指的是根據(jù)一定的相似性準則將時空實體劃分成一系列較為均勻的子類(即時空簇),其中相似性的判定依據(jù)為時空聚類中的聚類參數(shù),時空實體在本研究中即為公共交通出行,聚類結(jié)果即為相似性出行,每次出行記錄均被賦予對應(yīng)的組別號。考慮到公交刷卡記錄存在信息缺失問題,故將相似性出行整合法分為兩類:數(shù)據(jù)完備時,采用基于STDBSCAN算法的兩步聚類法;數(shù)據(jù)不完備時,對缺失數(shù)據(jù)采用線路相似性整合法,與完整數(shù)據(jù)的兩步聚類結(jié)果進行整合。

  2.2.1基于密度的時空聚類算法(STDBSCAN)

  本文將STDBSCAN算法作為基礎(chǔ)算法的原因在于:(1)該算法考慮時間和空間雙重要素、可識別高密度的簇和低密度的噪聲、無需確定初始核和簇數(shù)量等優(yōu)勢,常被用于出行模式劃分領(lǐng)域。(2)本文所獲取的出行數(shù)據(jù)位置為經(jīng)緯度信息,相比其他算法研究使用的站點編號更為精確,適用于空間聚類算法。算法是將時空實體的時空鄰近域的空間形狀定義為一個圓柱體,底面半徑為,高為△,該鄰近域內(nèi)的實體數(shù)目即為ST的密度,當密度大于等于設(shè)定的最小密度值MinPts時,該實體ST即為核心對象。若ST+1位于核心對象ST的時空鄰近域,則ST+1從ST直接密度可達;密度可達是直接密度可達的傳遞閉包,密度相連是密度可達的傳遞,且為對稱關(guān)系。

  時空鄰近域的劃定和最小密度的取值為算法關(guān)鍵參數(shù),即空間半徑、時間窗口△和密度閾值MinPts。本文基于一整月的研究數(shù)據(jù)進行聚類操作,通過多參數(shù)組合比選,將輪廓系數(shù)和值作為聚類效果評價指標,并依據(jù)肘部法則,最終選定參數(shù)=1200m,△=30min,inPts=5。和△分別代表本研究中位置和出發(fā)時間相似的判定范圍,即相似出發(fā)時間差距應(yīng)≤60min(△),相似位置差距應(yīng)≤1200m();而MinPts=5則代表位于相似判定范圍的出行記錄數(shù)應(yīng)≥個,即同類時空出行的次數(shù)不小于次月。

  2.2.2數(shù)據(jù)完備條件下的兩步聚類法

  當每次出行的出發(fā)地經(jīng)緯度、到達地經(jīng)緯度和出發(fā)時間個要素齊全時,經(jīng)以下步驟可完成對每位乘客多次出行的聚類操作。

  Step1對每次出行的出發(fā)地經(jīng)度、緯度和出發(fā)時間進行STDBSCAN算法聚類,得到Cluster1。以USERID=42的乘客出行為例,分為噪聲點、Cluster1=1和Cluster1=2三類。噪聲點(圓圈)的位置和出發(fā)時間較分散,而Cluster1=1(三角)和Cluster1=2(方塊)的位置和出發(fā)時間相對集中。Step2對每次出行的到達地經(jīng)度和緯度進行DBSCAN算法聚類,得到Cluster2。乘客在此步的聚類結(jié)果,分為噪聲點、Cluster2=1和Cluster2=2三類。

  Step3對每次出行,將對應(yīng)的Cluster1和Cluster2直接組合為最終聚類結(jié)果Cluster3(如Cluster1=1且Cluster2=1時,Cluster3=1)。只有Cluster1和Cluster2取值均非噪聲時,Cluster3按類別順序取值。乘客的最終聚類結(jié)果如圖(c所示,分為噪聲點、Cluster3=1和Cluster3=2三類。噪聲點(細實線)代表無規(guī)律的出行,Cluster3=1(粗實線)的出發(fā)地、到達地位置和出發(fā)時間均集中,代表一類具有時空相似性的出行集合,Cluste=2(粗虛線)代表另一類相似出行集合。

  2.2.3數(shù)據(jù)不完備條件下的線路相似性整合法

  當部分出行的起終點位置存在缺失時,無法按上述數(shù)據(jù)完備條件下的方法完成聚類,因此將出發(fā)時間和乘坐線路名稱兩個字段作為判別屬性,即考慮出行時間和線路選擇的穩(wěn)定性,將符合要求的出行加入到數(shù)據(jù)完備條件下的聚類結(jié)果中,得到最終整合結(jié)果。

  步驟如下:Step1對出行數(shù)據(jù)按乘坐線路名稱字段分組為Class1,提取頻次≥2的Class1,并對每個Class1分組進行出發(fā)時間的聚類,提取其中頻次≥2的子類為Class2;Step2將每個Class2子類中出行數(shù)據(jù)的出發(fā)時間與數(shù)據(jù)完備條件下聚類結(jié)果的各分組Cluster3出發(fā)時間均值相比較,若低于30min則將此Class2子類的類別號更新為Cluster3分組的類別號,另外若Class2子類中超過60%的出行未加入Cluster3分組,該子類自成一類;Step3將處理后的Cluster3和自成一類的Class2進行整合,得到最終的聚類結(jié)果CLUSTER_FINAL。以USERID=9的乘客出行為例,該乘客一月共56次公共交通出行,其中信息完整和不完整的出行均為28次。對信息完整的28次出行進行兩步聚類法。

  得到噪聲和Cluster3=1兩組(圖中未標注噪聲數(shù)據(jù))。然后,對信息不完整的28次出行進行操作,得到的13條非噪聲數(shù)據(jù)結(jié)果。其中Class2=1分組的出發(fā)時間與Cluster3=1的出發(fā)時間相近,故將其加入Cluster3=1分組,而Class2=2分組自成一類。經(jīng)過兩步聚類法和線路相似性整合法操作后,得到最終聚類結(jié)果為噪聲、CLUSTER_FINAL=1和CLUSTER_FINAL=2三組。

  2.3基于職住地與指標識別的兩步篩選法

  2.3.1基于職住地識別的通勤出行標識

  在提取通勤出行前,需要先對每位乘客的職住地進行判別。一般假設(shè)乘客每日首次出行的出發(fā)地是居住地7],通過對乘客的長期出行數(shù)據(jù)進行空間密度聚類可較易得到,點數(shù)最多的簇的空間位置即為居住地所在區(qū)域。

  而工作活動僅為日常活動中的一類,難以直接識別工作地。考慮到通勤出行的規(guī)律性特征,統(tǒng)計處理乘客的相似性出行可識別出工作地,步驟如下:Step基于上文得出的相似性出行數(shù)據(jù),對從居住地出發(fā)出行的到達地和到達居住地出行的出發(fā)地進行空間密度聚類,空間閾值仍取1200m,密度閾值為個;Step2統(tǒng)計聚類結(jié)果中各簇的點數(shù),點數(shù)最多的簇所在空間位置即為工作地所在區(qū)域。將從居住地出發(fā)和到達工作地頻次最高的組別內(nèi)出行標記為上班,反之為下班。對于公交出行記錄位置缺失導致的部分出行起訖點所屬類別無法識別問題,可根據(jù)同類別相似性出行的標識結(jié)果或根據(jù)出發(fā)時間來確定。

  3參數(shù)驗證和方法有效性比較

  通勤者識別過程中的相似性出行整合和指標篩選操作需要確定多項閾值,其對識別效果具有重要影響。考慮到數(shù)據(jù)獲取滯后性及匿名性,本文結(jié)合參數(shù)驗證和方法有效性比較驗證結(jié)果。通過問卷調(diào)查獲取公共交通通勤者在通勤出行頻次、時間等方面的真實特征,以驗證本文所提方法中的指標取值合理性。

  4結(jié)束語

  本文融合時空聚類和指標篩選思路進行公共交通通勤者識別,以時空聚類算法中的STDBSCAN算法為基礎(chǔ)算法,進行具有相似出行OD和出發(fā)時間的出行整合操作,并選取出行天數(shù)、單次出發(fā)時間差和工作往返出發(fā)時間差項指標作為通勤識別指標完成二次篩選。基于南京市數(shù)據(jù),經(jīng)時空聚類,發(fā)現(xiàn)樣本中55.6的乘客不滿足本文設(shè)定的出行時空規(guī)律;經(jīng)指標篩選后得到的公共交通通勤者人均出行頻次為55次月,工作日出行明顯集中于6:009:00和16:0019:00時段,符合傳統(tǒng)對通勤者特征的認知,但樣本中66.7的通勤者不完全在傳統(tǒng)早晚高峰時段進行通勤,本文識別結(jié)果較貼合實際通勤者更加多樣化的通勤特征。

  區(qū)別于傳統(tǒng)研究的指標篩選思路,本文所提的通勤識別方法存在四點優(yōu)勢:(1)不局限于傳統(tǒng)早晚高峰時段,注重出行的時空規(guī)律性;(2)基于出行起終點的經(jīng)緯度位置進行聚類,相比站點聚類更為精準;(3)針對數(shù)據(jù)完備與不完備條件提出不同的處理方法,更符合實際數(shù)據(jù)狀況;(4)基于相似性整合結(jié)果利用指標二次篩選,補充通勤者其他特征的判別條件。識別結(jié)果可為公共交通通勤者的特征分析以及相應(yīng)設(shè)施布局和服務(wù)優(yōu)化提供研究基礎(chǔ),如多層次通勤公共交通服務(wù)體系的構(gòu)建。由于STDBSCAN算法在時空域上具有一定的延展性,以及參數(shù)設(shè)置對識別結(jié)果存在影響,后續(xù)研究可考慮增加簇中時空閾值的限制,同時結(jié)合實際數(shù)據(jù)擬合識別指標,分析取值不同時通勤者與非通勤者的特征差異性,以改進方法并進一步論證,使結(jié)果更為符合通勤者出行特征規(guī)律。

  參考文獻:

  [1]KusakabeT,AsakuraY.Behaviouraldataminingoftransitsmartcarddata:Adatafusionapproach[J].TransportationResearchPartC:EmergingTechnologies,2014,46:179191.

  [2]ZhouJ,MurphyE,LongY.CommutingefficiencyintheBeijingmetropolitanarea:anexplorationcombiningsmartcardandtravelsurveydata[J].JournalofTransportGeography,2014,41:175183.

  [3]王振張志敏,高洪振.基于軌道交通客流的通勤特征分析[C]//創(chuàng)新驅(qū)動與智慧發(fā)展——2018年中國城市交通規(guī)劃年會論文集.北京中國建筑工業(yè)出版社2018.

  [4]李軍,鄧紅平.基于公交IC卡數(shù)據(jù)的乘客出行分類研究[J].重慶交通大學學報(自然科學版),2016,35(6):109114.

  作者:周航1,陳學武2,3,4

主站蜘蛛池模板: 男人午夜影院 | 精品成人一区二区三区免费视频 | 欧美在线二区 | 老头做爰xxxx视频 | 夜色成人免费观看 | 国产在线综合一区二区三区 | 大色综合| 一级片a| 欧美综合国产精品日韩一 | 亚洲一区二区免费 | 黄色一级片免费看 | 成人三级毛片 | 久久精品中文字幕第一页 | 九九视频高清视频免费观看 | 国产综合福利 | 国产欧美另类久久精品91 | 春色影院 | 亚洲国产精品久久久久秋霞小 | 91夜夜操| 这里只有精品视频 | 中国欧美日韩一区二区三区 | 国产精品视屏 | 国产精品系列在线一区 | 国产一级视频播放 | 久久精品在线 | 二级黄绝大片中国免费视频 | 国产激烈无遮挡免费床戏视频 | 久草青娱乐 | 精品不卡| 久久91视频| 国产99热久久这里有精品999 | 色天天色综合 | 777欧美| 免费一级特黄特色大片在线观看看 | 日本精品久久久久中文字幕 1 | 国产a v高清一区二区三区 | 成人免费一级毛片在线播放视频 | 三级黄色在线 | 亚洲qingse | 国产福利91精品一区二区 | 中文字字幕在线 |