Similarity measurement of mobile phone u
Similarity measurement of mobile phone user trajectories - a modified edit distance method 2013 網(wǎng)絡(luò) 加州大學(xué) 閱讀原因:由于可能用CDR數(shù)據(jù),所以收集了幾篇CDR有關(guān)的軌跡相似性的文章,從簡(jiǎn)單到難來(lái)看吧 CDR用的是celluar space,因?yàn)檫@些通話信息和GPS數(shù)據(jù)不是連續(xù)的,所以判別相似性的時(shí)候歐氏距離不適用,因此更加適合使用編輯距離。 Dataset:中國(guó)東北9天的CDR數(shù)據(jù)(Yuan et al. 2012) Methodology and preliminary results 編輯距離的增加、刪除、修改的成本函數(shù)的系數(shù)一般默認(rèn)為1。 當(dāng)然,拿刪除來(lái)說(shuō),刪除一個(gè)遠(yuǎn)點(diǎn)和刪除一個(gè)近點(diǎn)的效果是十分不同的,比如刪除遠(yuǎn)點(diǎn)的消費(fèi)技術(shù)應(yīng)該高一點(diǎn)。因此原文定義如下:
這篇論文中的信號(hào)塔覆蓋范圍是以實(shí)際劃分的,并沒(méi)有人為地調(diào)成大小一樣。 用這種方法得到的兩個(gè)相似軌跡在直觀上并不一定相似,因?yàn)榭紤]了移動(dòng)方向。(?) 一個(gè)用戶的獨(dú)特性可以通過(guò)對(duì)比其與其他所有軌跡間距離來(lái)表示。服從偏態(tài)正態(tài)分布。 在計(jì)算相似度的時(shí)候可以考慮時(shí)間段限制,比如探索人們的夜生活規(guī)律。 銳評(píng):很短,也不知道發(fā)在哪的,但或許是編輯距離在軌跡相似度應(yīng)用的鼻祖?也不知道東北CDR數(shù)據(jù)哪來(lái)的