基于GPS定位的出租车轨迹数据挖掘对交通运输和城市规划具有重要意义。主题模型可以有效地从出租车轨迹中提取语义信息,用于分析城市道路的交通情况。常用的LDA模型忽略了轨迹的方向,不能准确地挖掘出租车的运动模式,从而影响交通情况的分析粒度。因此,有必要在主题建模时考虑轨迹的方向信息。
出租车轨迹由若干个GPS位置组成,本文首先将GPS位置与道路名相匹配来对轨迹数据进行文本化,然后利用bigram主题模型提取轨迹主题。由于bigram模型根据前n-1个单词预测当前单词,因此将其结合主题模型用于轨迹主题的提取可以包含方向信息。