2. 开始¶
开始使用GeoMesa的第一步是选择持久存储解决方案。这可能取决于您的目标环境,但如果不是这样,则有几个选项可用。
如果您想近乎实时地查看流数据,那么可以考虑使用 Kafka 或 Redis 。
否则,您可以通过以下方式获得类似功能 HBase , Accumulo 或 Cassandra 。HBase和Acumulo支持分布式处理,因此对于某些操作可能会更快。HBase和Cassandra是使用最广泛的技术,而Acumulo经常因为其先进的安全功能而被选择。
另一种选择是 FileSystem 数据存储,具有非常低的进入门槛,可以读取各种文件格式的现有数据。当由云本地对象存储支持时,文件系统数据存储可以提供极低成本的存储;然而,它通常不如使用实际数据库的性能高。
对于高级使用情形,可以通过以下方式组合多个商店 组合数据存储区视图 以提供高性能(针对最新数据)和低成本(针对较旧数据)。
无论您选择哪种存储解决方案,GeoMesa API都是相同的(除了一些特定于后端的配置选项)。对于大多数用户来说,只需极少的代码更改即可换出后端。
2.1. 快速入门¶
地理台地 quick start tutorials 是开始使用GeoMesa的最快、最简单的方式。它们是通向其他教程的一个很好的垫脚石,这些教程提供了如何使用GeoMesa的越来越复杂的示例。这些教程展示了如何编写自定义Java代码来使用GeoMesa获取和查询数据,以及如何可视化Geoserver中所做的更改。
2.2. 数据摄取¶
GeoMesa提供了 ingestion framework 这可以使用JSON进行配置,这意味着无需编写任何代码即可获取您的数据。这使得您可以快速轻松地开始使用您的自定义数据格式,并且无需更改代码即可即时处理更新。
2.3. 火花¶
GeoMesa在Spark和Spark SQL之上提供空间功能。要开始使用,请参阅 数据分析 。