geopandas.read_parquet#

geopandas.read_parquet(path, columns=None, storage_options=None, **kwargs)#

从文件路径加载Parquet对象,返回GeoDataFrame。

属性可以读取文件中列的子集 columns 参数。但是,返回的GeoDataFrame的结构将取决于您读取的列:

  • 如果未读取任何几何列,这将引发 ValueError -你应该用熊猫 read_parquet 方法,而不是。

  • 如果保存到此文件的主几何图形列未包含在列中,则第一个可用几何图形列将被设置为返回的GeoDataFrame的几何图形列。

需要‘pyrow’。

0.8 新版功能.

参数
path字符串、路径对象
columns类似列表的字符串,默认为无

如果不是无,则仅从文件中读取这些列。如果不包括主几何图形列,则从文件中读取的第一个辅助几何图形将被设置为返回的GeoDataFrame的几何图形列。如果不存在几何图形列,则会出现 ValueError 都会被举起。

storage_optionsDICT,可选

对特定存储连接有意义的额外选项,例如主机、端口、用户名、密码等。对于HTTP(S)URL,键-值对作为头选项转发到urllib。对于其他URL(例如,以“s3://”和“gcs://”开头),键-值对被转发到fsspec。有关更多详细信息,请参阅fsspec和urllib。

当未提供存储选项并且文件系统由两者实施时 pyarrow.fsfsspec (例如“s3://”),则 pyarrow.fs 最好使用文件系统。提供实例化的fsspec文件系统 filesystem 关键字,如果您希望使用其实现。

**kwargs

传递给pyarrow.parquet.read_table()的任何其他kwargs。

退货
GeoDataFrame

示例

>>> df = geopandas.read_parquet("data.parquet")  

指定要读取的列:

>>> df = geopandas.read_parquet(
...     "data.parquet",
...     columns=["geometry", "pop_est"]
... )