您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页基于出租车GPS数据的南京市交通小区的划分

基于出租车GPS数据的南京市交通小区的划分

来源:意榕旅游网
29 1 Q:;§ Science and Technology Innovation Herald 学术论坛 基于出租车G P S数据的南京市交通小区的划分 蔡毅 (湖南师范大学资源与环境科学学院湖南长沙41 5000) 摘 要:在南京市出 ̄1#cGPS海量数据中,提取部分数据对南京市市域进行交通小区的划分,利用SPSS19.0的Kmeans聚类分析方式对其进行分 析,最终将分类数据进行可视化,对交通小区边界确定作出一些改进,以及对出租车GPS数据的利用作出了一些设想。 关键词:GPS数据 交通小区 Kmeans聚类 中图分类号:TN967.1 文献标识码:A 文章编号:1674—098X(2013)08(b)一0218—0l 目前各大城市出租车均搭载了GPS,产 才能在电子地图上显示出相应的位置 。再 被任何交通小区划分的地带,另外也没有 生了海量的数据,而出租车司机的寻客行为 结合Excel对数据进行筛选,排除市域范围 结合土地利用、河流、行政等分界线进行划 很大程度上属于盲目寻客。本文旨在利用这 外的记录。 分。在考虑到交通小区必要的性条件 些数据进行分析,使用乘客上下点进行交通 下,对其进行改进,采取最远距离画圆法进 小区的划分,从而对出租车寻客行为起到一 2聚类分析 行交通小区的边界线划分。具体步骤如下: 定指导作用。 对处理好的数据进行聚类分析,本 (1)坐标系以(0,0)为中心点均分为n 所谓交通小区,最早是在交通规划领 次采用KmeaFIs聚类分析方法进行聚类, 等份区域, 域中提出的,其目的主要是为了定义城市路 Kmeans是一种基于划分的聚类方法,又叫 (2)记录距离中心点最远的点为c 与中 网中交通起讫点的位置,然后使用需求预测 快速聚类法。 心的距离r, 模型对各交通小区间的交通出行量进行预 其算法思路是: (3)以中心点为圆心,r为半径画圆,得到 测“1。 (1)假设将样本划分为K个类。 初步交通小区。 (2)选取K个初始聚类中心。 (4)若与邻近交通小区相交,则以交线 1数据的提取与预处理 (3)从第一个样本开始计算其到各中心 重新分界。 在城市居民出行影响因素中,时间和空 距离,并将该样本划分到距离最短中心所属 (5)若与土地利用、河流、行政等界线相 间分布的研究是最重要的两点,有人把一 类。 交,同样也以交线重新分界。 天分为8个时间段进行居民出行研究,其研 (4)从新计算聚类中心,重复(2)一(3),直 究结果表明工作日的居民出行行为主要是 到准则函数收敛为止。 5结语 通勤出行,其最主要的出行时间段为7:00- 而对于交通小区的划分,一般情况下可 据已有文献查阅,南京市尚未进行过 9:30和l7:00一l 9:30,出行空间分布主要 依照以下原则 : 交通小区的划分,本文利用出租车GPS数 是居住地和工作地 。 (1)区内的经济社会等因素一致。 据对其利用Kmeans聚类进行了交通小区 此次实验数据为南京市201 0年9月 (2)/J,区划分不打破行政区划分。 的划分,并基于以往划分方法,对于边界 3 0日出租车GPS数据,数据库中表字段 (3)数量适当,中等城市约5O个,大城市 划分作出了一些改进。但是仍存在一些问 有ID(点唯一标识)、VehicleSimID(车 约100~l 50个。数量太多加重规划的工作 题,如Kmeans方法的最大问题在于K值的 辆唯一标识)、GPSL atitUde(纬度)、 量,数量太少又会降低分析的精度。 设定。本次实验类别数目K和初始聚类位 GPSLongtitude(经度)、PassengerState 本次实验采用SPSS进行Kmeans聚类 置的确定都很难,本文只是采取随机初始 (0一空车,1一非空车)、CreateDate(记录 分析,设置参数。分类后把含样本数太少的 化聚类中心,后期可以采用canopy算法对 建立时间)。该次试验以7:00-9:30时间段 类别删除,最终剩下33个类别。 Kmeans算法进行改进,在无需确定K值和 的数据为例。 聚类中心情况下进行聚类。另外也没有对聚 1.1提取数据库中的数据 3聚类数据可视化 类结果进行评价,这些在后期研究都应当 利用千万数量级的出租车GPS点数据进 将各类别的数据导入arcgis进行可视 进行。 行交通小区划分,需要乘客上下车点的数据 化,按聚类类别符号化。各圆点为上/下车 (OD)。所谓上车点,即Passengerstate由0 点,各点组成的颜色块为聚类块,五角星为 参考文献 变为1的点(O){所谓下车点即Passengerstate 各聚类中心。 [1】郭峤枫.浅析交通小区划分问题[J】.黑龙 由l变为0的点(D) 本次实验提取7:00—9:30 江科技信息,2010(28). 的所有出租车乘客上下车点数据。 4交通小区边界确定 [21童晓君,向南平,朱定局.基于出租车 1.2数据预处理 现已有一种较好的交通小区边界确定 GPS数据的城市居民出行行为分析[D】. 南京市域地理坐标为 方法,它将平面直角坐标均分为n等份,再 中南大学,2012. 北纬3 l。l 4’~3 2。3 7。,东经 将聚类的点放人坐标系,依次计算第i个区 [3】吕玉强,秦勇,贾利民.基于出租车GP数 l18。22’~ll9。14’。全市行政区域总面积 域里每个点到中心点的距离,最后将离中心 据聚类分析的交通小区动态划分方法 6587.02 km 2。利用精度范围信息,剔除重 点最远的点为连接起来,得到点集相应边 研究[J].物流技术,2010(216). ‘ 复数据,记录不全数据,错误数据;由于最 界 初得到的GPS坐标参数为WGS84坐标,必 此种方法有一些欠缺的地方,比如交 须经过坐标变换,进行高斯平面投影,最后 通小区之间存在较大的空间,往往成为未 ①作者简介:蔡毅(1992.10一),男,湖南常德,最高学历:本科。 21 8 科技创新导报Science and Technology Innovation Herald 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有 赣ICP备2024042794号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务