corso-open-notebook-science
descrizione:
questo corso è stato pensato per gli studenti di Scienze Politiche dell'Università di Firenze.
Questa sezione su github si concentra sull'utilizzo dell'ecosistema python per la Data Science e si inserisce
nel più ampio corso di open notebook science (slide dell'edizione 2018)
Qui introduzione sintetica all' open notebook science nelle Scienze Sociali
prerequisiti
- nessuna conoscenza pregressa di programmazione informatica
- concetti base di metodologia della ricerca e di statistica
le materie trattate sono:
- conoscenza di base del linguaggio di programmazione Python
-
conoscenza di base della libreria di gestione e analisi dati Pandas per
- importazione dati da diversi formati
- caricamento dei dati in DataFrame di Pandas
- trasformazione e analisi dei dati
- creazione di tabelle e grafici
- utilizzo di jupyter notebook
- utilizzo di github per la condivisione della ricerca
Esercizi - percorso the hard way - per utenti che vogliono imparare direttamente su jupyter notebook
- esercizio 1: sistematizzazione di dati non strutturati presenti in un file di testo in un dizionario di python
- esercizio 2: sistematizzazione di dati non strutturati con operazione batch su più file di testo in un dizionario di python
- esercizio 3: dal dizionario di python al DataFrame di Pandas
- esercitazione finale: effettuare una ricerca a partire da un dataset a scelta e restituzione dell'analisi su jupyter notebook, github passanto per linux
Esercizi - percorso the soft way - per utenti che vogliono esplorare l'open notebook science grazie a google colaboratory
in fase di standardizzazione
questa versione del corso scende meno in profondità sul linguaggio di programmazione di Python ma permette comunque di eseguire semplici elaborazioni con l'utilizzo di Pandas
- esercizio 1: caricamento di un dataset in google colaboratory partendo da un google spreadsheet
- esercizio 2: analisi di base di alcune variabili di un Dataframe
- esercizio 3: creazione di semplici grafici
- esercitazione finale: effettuare una ricerca a partire da un dataset a scelta e restituzione dell'analisi su google colaboratory
risorse generate per il corso
Bignami di Pandas e Python
libreria per la conversione dei TSV di Eurostat in DataFrame di Pandas
questionario di valutazione della classe
link per l'installazione di Anaconda python
per eseguire il corso senza installare Anaconda python
Versione google - colaboratory
Versione Binder