注解
此笔记本可在此处下载: 02_DATA_French_Road_Safety_Database.ipynb
#Setup
%load_ext autoreload
%matplotlib nbagg
%autoreload 2
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib as mpl
实际工作:查看法国道路安全数据库
本课程的目的是使用panda模块突出显示此数据库的一些数据。
数据可以下载到以下地址: https://www.data.gouv.fr/fr/datasets/base-de-donnees-accidents-corporels-de-la-circulation/#_
所有可用数据的链接都可用 here .
所需的文件也可在此笔记本的数据目录中找到。
数据库分为4个文件,将使用以下文件:
“caracteristiques_2016.csv”:给出了事故的全球特征
“usagers_2016.csv”:提供相关人员的信息
“lieux_2016.csv”:提供位置信息
该基地的详细说明见文件:“description_des_bases_de_donnees_ONISR_uannees_2005_A_2016.pdf”(法语)
问题
问题1 :加载3个数据库并观察不同字段。哪一个对所有数据库都是通用的?将3个数据库连接在一起?(使用熊猫德康卡特司令部)
问题2 :发生事故的男女比例是多少?以图形方式显示结果。
问题3 :仅考虑司机,事故中男女比例是多少?以图形方式显示结果。
问题4 :提出一个图形化的描述,以突出相关受害者的年龄。(首先,你应该计算这个人的年龄)
问题5 :考虑到所有受害者都期望司机,事故涉及的男女比例是多少?以图形方式显示结果。
问题6 :提出一个图形表示,以突出在大都市地区发生的每起事故的地理位置。
问题7 :白天、晚上和过渡白天/晚上发生的事故的比率是多少?以图形方式显示结果。