geopandas.read_parquet#
- geopandas.read_parquet(path, columns=None, storage_options=None, **kwargs)#
从文件路径加载Parquet对象,返回GeoDataFrame。
属性可以读取文件中列的子集
columns
参数。但是,返回的GeoDataFrame的结构将取决于您读取的列:如果未读取任何几何列,这将引发
ValueError
-你应该用熊猫 read_parquet 方法,而不是。如果保存到此文件的主几何图形列未包含在列中,则第一个可用几何图形列将被设置为返回的GeoDataFrame的几何图形列。
需要‘pyrow’。
0.8 新版功能.
- 参数
- path字符串、路径对象
- columns类似列表的字符串,默认为无
如果不是无,则仅从文件中读取这些列。如果不包括主几何图形列,则从文件中读取的第一个辅助几何图形将被设置为返回的GeoDataFrame的几何图形列。如果不存在几何图形列,则会出现
ValueError
都会被举起。- storage_optionsDICT,可选
对特定存储连接有意义的额外选项,例如主机、端口、用户名、密码等。对于HTTP(S)URL,键-值对作为头选项转发到urllib。对于其他URL(例如,以“s3://”和“gcs://”开头),键-值对被转发到fsspec。有关更多详细信息,请参阅fsspec和urllib。
当未提供存储选项并且文件系统由两者实施时
pyarrow.fs
和fsspec
(例如“s3://”),则pyarrow.fs
最好使用文件系统。提供实例化的fsspec文件系统filesystem
关键字,如果您希望使用其实现。- **kwargs
传递给pyarrow.parquet.read_table()的任何其他kwargs。
- 退货
- GeoDataFrame
示例
>>> df = geopandas.read_parquet("data.parquet")
指定要读取的列:
>>> df = geopandas.read_parquet( ... "data.parquet", ... columns=["geometry", "pop_est"] ... )