注解

此笔记本可在此处下载: 02_DATA_French_Road_Safety_Database.ipynb

#Setup
%load_ext autoreload
%matplotlib nbagg
%autoreload 2
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib as mpl

实际工作:查看法国道路安全数据库

本课程的目的是使用panda模块突出显示此数据库的一些数据。

数据可以下载到以下地址: https://www.data.gouv.fr/fr/datasets/base-de-donnees-accidents-corporels-de-la-circulation/#_

所有可用数据的链接都可用 here .

所需的文件也可在此笔记本的数据目录中找到。

数据库分为4个文件,将使用以下文件:

  • “caracteristiques_2016.csv”:给出了事故的全球特征

  • “usagers_2016.csv”:提供相关人员的信息

  • “lieux_2016.csv”:提供位置信息

该基地的详细说明见文件:“description_des_bases_de_donnees_ONISR_uannees_2005_A_2016.pdf”(法语)

问题

问题1 :加载3个数据库并观察不同字段。哪一个对所有数据库都是通用的?将3个数据库连接在一起?(使用熊猫德康卡特司令部)

问题2 :发生事故的男女比例是多少?以图形方式显示结果。

问题3 :仅考虑司机,事故中男女比例是多少?以图形方式显示结果。

问题4 :提出一个图形化的描述,以突出相关受害者的年龄。(首先,你应该计算这个人的年龄)

问题5 :考虑到所有受害者都期望司机,事故涉及的男女比例是多少?以图形方式显示结果。

问题6 :提出一个图形表示,以突出在大都市地区发生的每起事故的地理位置。

问题7 :白天、晚上和过渡白天/晚上发生的事故的比率是多少?以图形方式显示结果。