Découverte du package pandas (Python) illustrée avec données de l'ADEME

Descripción

Le jeu de données des émissions de gaz à effet de serre territorialisé est un jeu de données idéal pour découvrir les manipulations de données usuelles. Associé aux autres informations communales, notamment les bases de données Filosofi de l'Insee, il est possible d'illustrer de nombreuses tâches classiques de data engineering.

Ce jeu de données est utilisé dans le cadre de plusieurs chapitres du cours Python pour la data science de l'ENSAE. Il sert d'exemple fil rouge pour illustrer la manipulation de données avec le package pandas:

  • Un premier chapitre propose un tutoriel détaillé des opérations couramment menées par les data scientists. C'est l'occasion d'explorer quelques caractéristiques du jeu de données, notamment certaines statistiques agrégées
  • Un second chapitre présente une série d'exercices pédagogiques pour explorer de manière pédagogique la richesse du jeu de données fourni par l'ADEME lorsqu'il est associé à d'autres sources de données communales.

Les codes utilisés dans ces chapitres, comme l'ensemble du contenu du site web pythonds.linogaliana.fr, sont open-source, disponibles sur Github

Topic

Education and research

Tipo

Publicación

Etiquetas

  • datascience

  • enseignement

  • pandas

  • python

Fecha de creación

29 de diciembre de 2022

Last update

30 de abril de 2024

1 used dataset

Statistics for the year

Views

848

37 in jul 2024

Followers

0

Discussions

There are no discussions for this reuse yet.

1 reuse from the same creator