基于手機GPS定位的客流數(shù)據(jù)簡介(一)
一、GPS定位原理
全球定位系統(tǒng)(Global Positioning System,GPS)是20世紀70年代由美國陸??杖娐?lián)合研制的衛(wèi)星定位系統(tǒng),20世紀80年代開始民用。利用GPS可以進行全球范圍內(nèi)、全天候、連續(xù)、實時的定位。
GPS系統(tǒng)包括三大部分:由空間星座部分的21顆工作衛(wèi)星和3顆在軌備用衛(wèi)星組成的GPS衛(wèi)星星座;地面監(jiān)控部分提供每顆GPS衛(wèi)星所播發(fā)的星歷,星歷是描述衛(wèi)星運動及其軌道的參數(shù),用于計算衛(wèi)星的位置;用戶設備部分,即GPS信號接收機,包含GPS接收機硬件、數(shù)據(jù)處理軟件和微處理機及其終端設備。
用戶設備跟蹤、接受、放大、處理衛(wèi)星信號,測量出已知位置的衛(wèi)星到用戶接收機之間的距離,然后綜合多顆衛(wèi)星的數(shù)據(jù)來計算接收機的具體位置。衛(wèi)星的位置可以根據(jù)星載時鐘所記錄的時間在衛(wèi)星星歷中查出。接收機到衛(wèi)星的距離測量有兩種方法,一種是偽距測量,一種是載波相位測量。
偽距測量通過紀錄衛(wèi)星信號傳播到用戶所經(jīng)歷的時間,再將其乘以光速得到(由于大氣電離層的干擾,這一距離并不是用戶與衛(wèi)星之間的真實距離,而是偽距)。由于用戶接受機使用的時鐘與衛(wèi)星星載時鐘不可能總是同步,所以除了用戶的三維坐標x、y、z外,還要引進一個變量 t ,即衛(wèi)星與接收機之間的時間差作為未知數(shù),然后用4個方程將這4個未知數(shù)解出來。所以,如果想知道接收機所處的位置,至少要能接收到4個衛(wèi)星的信號。
載波相位測量通過測量得到衛(wèi)星信號載波與測量時刻接收機產(chǎn)生的本振載波相位的差值,從而求得接收機到GPS衛(wèi)星的距離。用戶設備獲取的GPS主要位置數(shù)據(jù)為$GPGGA語句,包含世界時間、緯度、緯度半球、經(jīng)度、經(jīng)度半球、定位質(zhì)量知識,使用衛(wèi)星數(shù)據(jù)量、水平精確度、海拔高度、高度單位等字段。
二、基于GPS定位數(shù)據(jù)的客流統(tǒng)計與分析的步驟與方法
1、數(shù)據(jù)采集
在旅游應用中,手機APP的GPS數(shù)據(jù),需要從數(shù)據(jù)服務商處獲取,而并非自行采集。從數(shù)據(jù)服務商獲取的數(shù)據(jù),是經(jīng)過了加密處理后的不涉及個人隱私的原始數(shù)據(jù),這些數(shù)據(jù)不能直接用來進行數(shù)據(jù)分析和實際應用,需要針對應用目標進行數(shù)據(jù)預處理,預處理后的數(shù)據(jù)才能用來進行應用分析。
2、數(shù)據(jù)預處理
1. 數(shù)據(jù)清洗
去除錯誤數(shù)據(jù)點:檢查數(shù)據(jù)中是否存在異常值或不合理的數(shù)據(jù)點,例如位置跳變過大或速度超過常理范圍的數(shù)據(jù)點。一般使用閾值或規(guī)則來判斷哪些數(shù)據(jù)點是錯誤的,然后將其刪除或進行修正。
平滑處理:GPS數(shù)據(jù)常常包含噪音和抖動,一般使用平滑算法進行處理。常見的平滑算法有移動平均和加權移動平均。這些算法可以減少噪音的影響,提高數(shù)據(jù)的可讀性和可用性。
糾正漂移:GPS設備可能會受到多種因素的影響,導致位置偏移或漂移。通常使用差分定位或基站輔助定位等技術來糾正漂移,并提高位置的準確性。
填充缺失值:在數(shù)據(jù)采集過程中,有時可能會出現(xiàn)GPS信號丟失或設備故障導致某些數(shù)據(jù)缺失。可以使用插值方法或填充算法來估計和填充缺失的數(shù)據(jù),以保持數(shù)據(jù)的完整性和連續(xù)性。
坐標轉(zhuǎn)換:有時GPS設備采集的數(shù)據(jù)可能使用不同的坐標系統(tǒng)或標準,需要進行坐標轉(zhuǎn)換以便進行分析和比較。常見的轉(zhuǎn)換包括經(jīng)緯度和UTM坐標之間的轉(zhuǎn)換。
異常值檢測:通過統(tǒng)計方法或機器學習算法,可以檢測和識別GPS數(shù)據(jù)中的異常值,例如軌跡偏離正常路徑過遠或速度異常變化等。識別異常值可以幫助排除錯誤數(shù)據(jù),提高數(shù)據(jù)的可信度和可靠性。
2. 停留點確定
游客的停留點通過位置數(shù)據(jù)中的經(jīng)緯度來確定。根據(jù)經(jīng)緯度對應的地理區(qū)域坐標,可以判斷游客所在景點或目的地的位置或區(qū)域。
3. 游客識別
出現(xiàn)在給定范圍內(nèi)的手機GPS,不一定是游客。世界旅游組織以及國家文旅部對于“游客”的定義,均無法直接用于基于GPS的游客識別。一般而言,對于景區(qū)的游客識別,可以簡化為景區(qū)內(nèi)出現(xiàn)的用戶均為游客(工作人員可以根據(jù)其在景區(qū)出現(xiàn)的頻次進行排出)。但對于目的地范圍內(nèi)的游客識別,則需要以標準的游客定義(世界旅游組織以及國家文旅部給出)為原則,根據(jù)統(tǒng)計目標以及目的地范圍游客的特點等,制定出不同的游客識別方法。例如,若要總體上大致把握目的地的客流量,則可采用粗分法,即非常住地+統(tǒng)計區(qū)域的方法,如統(tǒng)計鄭州高鐵游客量,采用出現(xiàn)在鄭州高鐵站+鄭州為非常駐地+出現(xiàn)在鄭州及周邊景區(qū)的方式篩選出高鐵游客(如下圖所示)。
基于GPS位置數(shù)據(jù)的海鰻云旅游客流監(jiān)測與分析采用多種專業(yè)化數(shù)據(jù)分析及相關算法,可以實現(xiàn)對旅游目的地及景區(qū)的客流分析、客源分析、游客畫像分析、景區(qū)實時客流分析、節(jié)假日客流分析等。