Qualité de l'air dans le Métro Parisien - Part 1

September 22, 2018
datajournalisme pollution air metro paris ratp opendata airquality

Hello !

Ceci est le début d’une série d’articles autour d’un sujet qui plus que jamais intéresse tout(e) citadin(e), celui de la qualité de l’air que nous respirons. Je vais plus particulièrement m’intéresser à l’air dans les transports parisiens. En effet, il est réputé assez pollué du fait de la circulation des rames & de la fréquentation.

Nous utiliserons des données publiques issues de capteurs de pollution du réseau SQUALES (Surveillance de la Qualité de l’Air de L’Environnement Souterrain). Elles sont disponibles en temps réel ici.

N’ayant pas trouvé d’analyse approfondie sur le sujet, j’ai décidé de me lancer dessus :)

Nous allons utiliser les données récoltées dans la station de métro/RER Auber (Opéra).

Cette première partie sera purement exploratoire, et permettra de visualiser les mesures en les confrontant aux valeurs limites permettant de protéger sa santé.

I. D’abord, les données

1. Import

Commençons par récupérer les données, à disposition sur le portail OpenData de la RATP (merci à eux !) Nous les transformons ensuite en une série chronologique multivariée. Cela veut dire que les données de capteurs sont représentées en fonction du temps, ce qui permet d’en suivre l’évolution.

Plus d’informations sur le site de l’organisme Airparif, un organisme français agréé par le ministère de l’Environnement pour la surveillance de la qualité de l’air en Île-de-France.

library(readr)
df <- read_delim("qualite-de-lair-mesuree-dans-la-station-auber.csv", 
     ";", escape_double = FALSE, col_types = cols(`DATE/HEURE` = col_character(), NO = col_integer()), trim_ws = TRUE) %>%
  as.data.frame()

2 Quels indicateurs de pollution ?

Nous avons donc les données suivantes :

  • DATE.HEURE : Ceci est … la date & l’heure de la mesure ! (#WOW) - Les relevés sont faits toutes les heures et s’étalent sur la période du 1er Janvier 2013 au 27 Juillet 2018

  • Paramètres climatiques :

    • TEMP : Température ambiante en °C
    • HUMI : Humidité relative en %
  • Qualité de l’air :

Paramètre Signification Impacts Seuil à ne pas dépasser en exposition prolongée/fréquente
NO Concentration moyenne en monoxyde d’azote en µg/m3 Pluies acides 40 µg/m3
NO2 Concentration moyenne en dioxyde d’azote en µg/m3 Pluies acides & inflammations pulmonaires 40 µg/m3
PM10 Concentration moyenne en PM10 en µg/m3 Maladies cardiovasculaires & respiratoires, cancers pulmonaires 40 µg/m3
PM2.5 Concentration moyenne en PM2,5 en µg/m3 Vecteurs de substances toxiques pouvant passer la barrière pulmonaire 25 µg/m3
CO2 Concentration moyenne en CO2 en ppm (partie par million) Marqueur de mauvais renouvellement de l’air 1000 ppm

PM vient de l’anglais “Particulate Matter” et désigne les matières solides en suspension dans l’air. C’est un mélange complexe de substances chimiques organiques et inorganiques, communément appelé “particules”. Elles sont classées selon leur taille en µm (1 micromètre = un millième de millimètre). Les particules les moins fines (+ de 10µm) sont retenues par le nez et la bouche. Les PM10 sont dites respirables et peuvent pénétrer dans les bronches. Les PM2.5 pénètrent plus profondément, jusqu’aux alvéoles pulmonaires.

Ces polluants sont principalement issus de l’activité humaine. Ils sont produits dans les souterrains ou à l’extérieur, à Paris-même ou transportés sur de longues distances.

Les principales causes de pollution de l’air sont :

  • Le trafic des rames : freinage, etc.
  • La fréquentation humaine
  • Le trafic routier
  • Le chauffage domestique et tertiaire
  • Les chantiers & travaux
  • L’industrie & l’agriculture

La notice explicative officielle des données est par ici

II. Exploration

Nous avons donc 47274 observations, dont voici un extrait :

DATE.HEURE NO NO2 PM10 PM2.5 CO2 TEMP HUMI
47269 2018-07-27 18:00:00 15 62 324 120 824 29.6 44.0
47270 2018-07-27 19:00:00 13 51 417 194 893 29.7 45.3
47271 2018-07-27 20:00:00 16 47 443 233 847 29.9 47.9
47272 2018-07-27 21:00:00 13 53 206 82 667 29.1 48.1
47273 2018-07-27 22:00:00 15 45 252 121 560 28.3 49.8
47274 2018-07-27 23:00:00 9 38 238 117 516 28.0 51.9
library(dygraphs)

Dans ce qui suit, quelques éléments vous permettent de mieux comprendre les données :

  • Sous chaque graphique, un curseur permet de zoomer sur une période en particulier
  • En bas à gauche de chaque graphique, un nombre vous permet de lisser les données, afin de mieux y voir. Plus le nombre entré sera grand, et plus le graphique sera lisible sur une période longue
  • Pour l’humidité et la température, une droite horizontale bleue représente la valeur médiane. Concernant les polluants, la valeur limite est représentée en rouge.

1. Monoxyde d’azote (NO)