Taller de mineria i anàlisis de dades
[Impartit per Oscar Marin]
#Dates: del 4 al 8 de març 2013 de 18h a 22h
#Inscripció tancada: 50€ tallers@telenoika.net
#Lloc: C/ Sant Pau, 58 – 08001 Barcelona
Taller de Minería y Análisis de Datos impartido a partir de ejemplos prácticos. Daremos una introduccion / repaso a los lenguajes Python y R, con ejercicios de asentamiento intercalados.
Posteriormente se enseñará como explotar el API de Twitter y otras técnicas de adquisición, como el webscraping, Open Data, etc..
Por último, se realizarán ejercicios de análisis, que incluirán el análisis de coocurrencias (redes), minería de texto (sentiment/mood analysis) e instrumentos estadísticos como histogramas y regresiones. Dado el carácter práctico del taller, el alumno deberá estar familiarizado con algún lenguaje de programación (no necesariamente los del curso). Se trata de hacer para aprender y no al revés.
Este taller es el primero de los dos talleres que efectuaremos sobre datos. La semana siguiente (del 11 al 15 de marzo), se realizará el segundo: el taller de Visualizacion de Datos.
Minería de Datos: Python+R+Gephi
Primer día
==========
Introducción a la minería de datos: Métodos y herramientas [1h]
Introducción a Python: Set-up del entorno [1h]
Introducción a Python: Elementos [1h]
Introducción a Python: Ejercicio [1h]
Segundo día
===========
Introducción a Python: Cadenas y Listas. Ejercicio [2h]
Introducción a Python: Diccionarios y Ficheros. Ejercicio [2h]
Tercer día
==========
Adquisición de datos desde el API de Twitter con Python [1h]
Adquisición de datos: CSV y JSON. Ejercicio con Python [1h]
Análisis de datos: Histograma de followers. Ejercicio con Python [1h]
Dibujando el histograma de followers con R [1h]
Cuarto día
==========
Correlaciones: Dibujando con R la relación followers/número de tweets [1h]
Análisis de datos: Mood + Sentiment Analysis. Ejercicio [2h]
Procesado del Lenguaje Natural: Métodos, Herramientas y Librerías[1h]
Quinto día
==========
Dibujando el mood con wordle [1h]
Minería de relaciones: Red de Retweets [1h]
Dibujando relaciones y grafos: Gephi [2h]
CV
Óscar Marín (@oscarmarinmiro) es Ingeniero de Telecomunicaciones por la UPM. Cuenta con 13 años de experiencia profesional en el desarrollo software y 11 en la Ingeniería de Datos. Actualmente trabaja como Ingeniero de Datos en el Colectivo Outliers (www.outliers.es), donde trabaja como Ingeniero de Datos; especializado en visualización y análisis de datos, con clientes como TV3,Telefónica Digital,HAVAS Media, y Bitext.