9.16.10. T形驱动轨迹数据

此目录提供 T-Drive GeoMesa摄取命令和转换器配置文件。

T-Drive是微软亚洲研究院的一个项目。这个 overall project 在三个月的时间里,从北京3万多辆出租车上收集了GPS轨迹。这些数据被用来演示更有效的路由系统。

微软对其数据进行了小规模抽样 available for download 。这大约是一周内出租车的三分之一。

在继续操作之前,请查看数据描述并包括 terms of use

9.16.10.1. 获取T-Drive数据

可以使用提供的下载T-Drive数据集 download-data.sh 在中编写脚本 $GEOMESA_ACCUMULO_HOME/bin/ 就其本身而言

./download-data.sh tdrive

或者,从下载T-Drive数据集 here 下载一个或所有压缩文件,然后 unzip 放到一个方便的目录中。

每个压缩包包含数百个CSV,总共有7952个文件和近1500万个数据点。

每个CSV的格式如下:>出租车标识,时间戳,经度,纬度示例:>102,2008-02-02 13:34:27,116.30826,39.94702

9.16.10.2. 接收命令

检查是否有 tdrive 在GeoMesa工具类路径中提供了简单要素类型。这是默认情况。

$ geomesa-accumulo env | grep tdrive

如果不是,则合并 reference.conf 使用 $GEOMESA_ACCUMULO_HOME/conf/application.conf ,或确保 reference.conf vt.在.中 $GEOMESA_ACCUMULO_HOME/conf/sfts/tdrive

进行摄取。您可以选择使用以下命令指向不同的Acumulo实例 -i-z 选择。看见 geomesa-accumulo help ingest 了解更多详细信息。

$ geomesa-accumulo ingest -u USERNAME -c CATALOGNAME -s tdrive -C tdrive tdrive_data.txt

接收过程中的任何错误都将记录到 $GEOMESA_ACCUMULO_HOME/logs