Análisis de datos I. Análisis de datos con R

Análisis de datos I. Análisis de datos con R

2-5 junio del 2015

En estos momentos no es posible inscribirse a este curso.

Imprimir

Este documento ofrece una visión esquemática del contenido del curso "Análisis de datos con R". El curso tiene dos objetivos principales. El primero es servir como plataforma de transición pensada para aquellas personas que están acostumbradas a usar otros paquetes de análisis (SPSS, STATA, etc.) y que desean pasarse a R. En este sentido, el curso está diseñado para ofrecer todo lo necesario para poder hacer con R todo lo que ya se hace con otros paquetes estadísticos y, por tanto, poder
 ponerse a trabajar con R inmediatamente después del curso. El segundo objetivo es aportar la introducción al entorno de programación de R para ofrecer una visión aplicada de flujo de trabajo en ciencias sociales, haciendo del editor (RStudio, en este caso) la herramienta central para llevar a cabo todas las tareas del proceso: creación y documentación de proyectos de análisis, importación, limpieza y gestión de datos (data munging), exploración, análisis estadístico, creación de gráficos de calidad publicable, redacción de informes. La integración de estos dos objetivos en un curso que sea útil, evitará la presentación de listados de comandos por parte del tutor. En cambio, el curso tendrá la forma de un proyecto de análisis de datos reales (por ejemplo, una encuesta o grupo de encuestas del CIS o CEO), de forma que los asistentes puedan llevar a cabo todas las tareas necesarias (importación de datos, fusión de encuestas, transformación, limpieza, exploración, resumen, análisis, etc.) de forma aplicada, a la vez que aprenden funciones y librerías básicas de R. El curso está basado en sesiones o bloques que combinan exposición de contenido, que pueden ser replicados por los asistentes en tiempo real, y ejercicios prácticos orientados a la progresiva ejecución del proyecto de análisis. Cada una de las cuatro jornadas del curso incluye entre dos y tres sesiones de contenido, más ejercicios prácticos Al final de cada sesión se planteará un ejercicio para realizar para el día siguiente, que implique un avance en el proyecto.

02/06/2015 -
09:15 - 13:00 Análisis de datos I. Análisis de datos con R
Introducció a R i instal·lació
Què és R i com el podem instal·lar de forma gratuïta.
El CRAN
Les comunitats d'usuaris com a font d'ajuda permanent
L'editor o entorn de programació
Introducció a l'editor RStudio
Altres editors utils (emacs)
Tipus d'objectes d'R
Vectors
Matrius
Data frames
Operacions bàsiques
(a) Indexació
(b) Assignació de variables
(c) Operadors lògics
09:15 - 13:00 Análisis de datos I. Análisis de datos con R
Flux de treball per a les ciències socials
Un flux de treball per a les ciències socials
Anàlisi com a projectes
Estructura en forma de directoris del projecte
Els scripts de codi
Projecte d'anàlisi de dades
5.1 Dades: importació i lectura
La grandesa del text pla
Importació de dades en diversos formats (read.table i read.csv)
La llibreria foreign (SPSS, STATA...)
5.2 Dades: transformació i munging
Primer contacte amb les dades (head(), tail(), summary())
Neteja de dades (valors perduts, missing data, is.na())
Format i transformació de dades (dades llargues i amples): melt(), dcast() (llibreria reshape2)
Fusió de bases de dades (merge(), rbind())
5.3 Recodi ficació de variables
Canvi d'etiquetes en variables categòriques
Recodifi cació d'una variable contínua en categòrica (ifelse(), cut())
Transformacióo d'una variable contínua en una nova variable (log(), sqrt())
Accions massives i nous valors condicionats per variables categòriques (les famílies plyr i apply)
09:15 - 13:00 Análisis de datos I. Análisis de datos con R
5.4 Exploració de dades
Taules descriptives
Descriptius estadístics (summary(), stargazer(), etc.)
Taules de contingència (prop.table(), xtabs())
5.5 Gràfi cs I: la llibreria bàsica
Exploració gràfi ca de variables soles (hist(), barplot(), boxplot()
Exploració de relació entre diverses variables (plot())
Arguments gràfics útils
5.6 Gràfi cs II: gràfi cs avançats
La gramàtica dels gràfi cs
La família ggplot2
09:15 - 13:00 Análisis de datos I. Análisis de datos con R
5.7 Anàlisi estadística bàsica
Anàlisi d'independència (chisq.test(),t.test())
Models lineals (lm(), aov())
Models no lineals (la família glm per a regressions no lineals)
Resum de resultats (summary(), one command to rule them all...)
Exportacióo de taules de regressióo per publicar (mtable, stargazer)
5.8 Gràfics III: simulació i gràfi cs per publicar
Integració dels resultats de regressions en gràfi cs (abline(), text())
Simulació i predicció a partir de models de regressió (predict(), newdata)
Gràfi cs de coefi cients de regressió en comptes de taules (la llibreria effects, coefplot() i la creació manual)
5.9 Generació d'informes, articles i llibres des de l'editor mateix
Els formats que no són Microsoft Word (markdown, LATEX, org, odt)
Integració del projecte d'anàlisi amb la redacció d'informes individuals i col·laboratius
Integració de codi R en informes o articles per a publicació (markdown, knitr)
Aspectes pràctics (publicació de taules en llocs web, github com a repositori en línia i web per a cada article, etc.)
  • En estos momentos no es posible inscribirse a este curso.

Compartir