9.16.10. T形驱动轨迹数据¶
此目录提供 T-Drive GeoMesa摄取命令和转换器配置文件。
T-Drive是微软亚洲研究院的一个项目。这个 overall project 在三个月的时间里,从北京3万多辆出租车上收集了GPS轨迹。这些数据被用来演示更有效的路由系统。
微软对其数据进行了小规模抽样 available for download 。这大约是一周内出租车的三分之一。
在继续操作之前,请查看数据描述并包括 terms of use 。
9.16.10.1. 获取T-Drive数据¶
可以使用提供的下载T-Drive数据集 download-data.sh
在中编写脚本 $GEOMESA_ACCUMULO_HOME/bin/
就其本身而言
./download-data.sh tdrive
或者,从下载T-Drive数据集 here 下载一个或所有压缩文件,然后 unzip
放到一个方便的目录中。
每个压缩包包含数百个CSV,总共有7952个文件和近1500万个数据点。
每个CSV的格式如下:>出租车标识,时间戳,经度,纬度示例:>102,2008-02-02 13:34:27,116.30826,39.94702
9.16.10.2. 接收命令¶
检查是否有 tdrive
在GeoMesa工具类路径中提供了简单要素类型。这是默认情况。
$ geomesa-accumulo env | grep tdrive
如果不是,则合并 reference.conf
使用 $GEOMESA_ACCUMULO_HOME/conf/application.conf
,或确保 reference.conf
vt.在.中 $GEOMESA_ACCUMULO_HOME/conf/sfts/tdrive
。
进行摄取。您可以选择使用以下命令指向不同的Acumulo实例 -i
和 -z
选择。看见 geomesa-accumulo help ingest
了解更多详细信息。
$ geomesa-accumulo ingest -u USERNAME -c CATALOGNAME -s tdrive -C tdrive tdrive_data.txt
接收过程中的任何错误都将记录到 $GEOMESA_ACCUMULO_HOME/logs
。