Commit 273bb4f3 authored by François Bouchet's avatar François Bouchet
Browse files

Mise à jour cours 07

parent 4a7648ec
%% Cell type:markdown id: tags:
# Data Mining & Visualisation (DaMiVis)
# Séance 7 - Classification
# Exercices
*(NOM Prénom -- A EDITER)*
%% Cell type:code id: tags:
``` python
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import os
from graphviz import Source
from sklearn.tree import export_graphviz
from IPython.display import SVG
os.environ['PATH'] += os.pathsep + "C:/Program Files/Graphviz/bin/"
```
%% Cell type:markdown id: tags:
### Arbre de décision sur iris
Entraîner un arbre de décision sur les données Iris et évaluer sa performance en fonction des différentes métriques d'évaluation présentées en séparant bien un ensemble d'entraînement (90% des données) et un ensemble de test (10%).
%% Cell type:code id: tags:
``` python
iris = _
```
%% Cell type:code id: tags:
``` python
X_iris = _
```
%% Cell type:code id: tags:
``` python
y_iris = _
```
%% Cell type:code id: tags:
``` python
from sklearn.tree import DecisionTreeClassifier
model = _
```
%% Cell type:code id: tags:
``` python
y_pred = _
```
%% Cell type:markdown id: tags:
### Classifieur sur Exam2017
Reprendre le jeu de données Exam2017 et entraîner un classifieur (au choix) pour prédire si un étudiant va valider ou non le cours. On prendra soin de ne sélectionner que les attributs pertinents pour cette tâche. On utilisera une validation croisée.
%% Cell type:code id: tags:
``` python
df_exam = _
```
%% Cell type:code id: tags:
``` python
X_exam = _
```
%% Cell type:code id: tags:
``` python
y_exam = _
```
%% Cell type:code id: tags:
``` python
classif = _
```
%% Cell type:markdown id: tags:
### Classifieur sur "Drinks by Country"
Reprendre le jeu de données "drinks by country". Entraîner plusieurs classifieurs permettant de prédire le continent d'un pays en fonction de sa consommation de bière, vin et spiritueux. Estimer la performance de chacun des classifieurs à l'aide du kappa de Cohen. Tester notamment différentes valeurs d'hyperparamètres pour chacun.
Quel classifieur donne le meilleur résultat ? Quel est le kappa associé ?
%% Cell type:code id: tags:
``` python
df_drinks = pd.read_csv("http://bit.ly/drinksbycountry")
```
%% Cell type:code id: tags:
``` python
X_drinks = _
y_drinks = _
```
%% Cell type:markdown id: tags:
### Régresseur sur données météorologiques
* Récupérer le jeu de données météorologique dans la ville de Szeged (Hongrie) entre 2006 et 2010 (source : https://www.kaggle.com/budincsevity/szeged-weather)
* Pouvez-vous prédire la température apparente en fonction de l'humidité ?
%% Cell type:code id: tags:
``` python
df_weather = pd.read_csv("data/weatherHistory.csv")
df_weather.head()
```
%% Output
Formatted Date Summary Precip Type Temperature (C) \
0 2006-04-01 00:00:00.000 +0200 Partly Cloudy rain 9.472222
1 2006-04-01 01:00:00.000 +0200 Partly Cloudy rain 9.355556
2 2006-04-01 02:00:00.000 +0200 Mostly Cloudy rain 9.377778
3 2006-04-01 03:00:00.000 +0200 Partly Cloudy rain 8.288889
4 2006-04-01 04:00:00.000 +0200 Mostly Cloudy rain 8.755556
Apparent Temperature (C) Humidity Wind Speed (km/h) \
0 7.388889 0.89 14.1197
1 7.227778 0.86 14.2646
2 9.377778 0.89 3.9284
3 5.944444 0.83 14.1036
4 6.977778 0.83 11.0446
Wind Bearing (degrees) Visibility (km) Loud Cover Pressure (millibars) \
0 251.0 15.8263 0.0 1015.13
1 259.0 15.8263 0.0 1015.63
2 204.0 14.9569 0.0 1015.94
3 269.0 15.8263 0.0 1016.41
4 259.0 15.8263 0.0 1016.51
Daily Summary
0 Partly cloudy throughout the day.
1 Partly cloudy throughout the day.
2 Partly cloudy throughout the day.
3 Partly cloudy throughout the day.
4 Partly cloudy throughout the day.
%% Cell type:code id: tags:
``` python
df_temp = _
```
This diff is collapsed.
# DaMiVis
Sources du cours Data Mining & Visualisation (M1 Master Management de l'Innovation - Sorbonne Université)
\ No newline at end of file
Sources du cours Data Mining & Visualisation (M1 Master Management de l'Innovation - Sorbonne Université)
* Pour créer une version HTML des slides nommée notebook.slides.hml:
`jupyter nbconvert notebook.ipynb --to slides --template=slides_jupyterFB.tpl`
* utilise le fichier custom.css situé dans USER/.jupyter/custom
* l'ajout de `--post serve`permet d'afficher le résultat après conversion
* il faut l'ajout du plugin `title-footer`de reveal.js pour avoir le bas de slide
* Pour créer ensuite une version PDF :
`decktape notebook.slides.html --load-pause 500 --key=n --size 1280x720 notebook.slides.pdf`
* nécessite l'installation de decktape depuis https://github.com/astefanutti/decktape
* load-pause permet de s'assurer que les images soient bien chargées avant export
* size permet d'éviter des débordements avec une résolution trop élevée
* key permet de spécifier qu'on avance avec la touche n et donc de ne pas sauter les subslides
%% Cell type:markdown id: tags:
Ceci est juste un notebook de test
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment