Anàlisi de dades I. Anàlisi de dades amb R

Anàlisi de dades I. Anàlisi de dades amb R

2-5 juny del 2015

En aquests moments no és possible inscriure's a aquest curs.

Imprimir

Aquest document ofereix una visió esquemàtica del contingut del curs "Anàlisi de dades amb R". El curs té dos objectius principals. El primer és servir com a plataforma de transició pensada per aquelles persones que estan avesades a fer servir altres paquets d'anàlisi (SPSS, STATA, etc.) i que volen passar-se a R. En aquest sentit, el curs està dissenyat per oferir tot el que cal per poder fer amb R tot allò que ja es fa amb altres paquets estadístics i, per tant, poder
posar-se a treballar amb R immediatament després del curs. El segon objectiu es apor tar la introducció a l'entorn de programació de R per oferir una visió aplicada de flux de treball en ciencies socials, fent de l'editor (RStudio, en aquest cas) l'eina central per dur a terme totes les tasques del procés: creació i documentació de projectes d'anàlisi, importació, neteja i gestió de dades (data munging), exploració, anàlisi estadística, creació de gràfics de qualitat publicable, redacció d'informes. La integració d'aquests dos objectius en un curs que sigui útil, s'evitarà la presentació de llistats de comandaments per part del tutor. En canvi, el curs tindrà la forma d'un projecte d'anàlisi de dades reals (per exemple, una enquesta o grup d'enquestes del CIS o CEO), de forma que els assistents puguin dur a terme totes les tasques necessàries (importació de dades, fusió d'enquestes, transformació, neteja, exploració, resum, anàlisi, etc.) de forma aplicada, alhora que aprenen funcions i llibreries bàsiques de R. El curs està basat en sessions o blocs que combinen exposició de contingut, que poden ser replicats pels assistents en temps real, i exercicis pràctics orientats a la progressiva execució del projecte d'anàlisi. Cadascuna de les quatre jornades del curs inclou entre dues i tres sessions de contingut, més exercicis pràctics. Al fi nal de cada sessió es plantejarà un exercici per fer per al dia seguent, que impliqui un avenç en el projecte.

02/06/2015 - Facultat de Comunicació i Relacions Internacionals Blanquerna - URL Aula I 2 Planta -1
09:15 - 13:00 Anàlisi de dades I. Anàlisi de dades amb R
Introducció a R i instal·lació
Què és R i com el podem instal·lar de forma gratuïta.
El CRAN
Les comunitats d'usuaris com a font d'ajuda permanent
L'editor o entorn de programació
Introducció a l'editor RStudio
Altres editors utils (emacs)
Tipus d'objectes d'R
Vectors
Matrius
Data frames
Operacions bàsiques
(a) Indexació
(b) Assignació de variables
(c) Operadors lògics
09:15 - 13:00 Anàlisi de dades I. Anàlisi de dades amb R
Flux de treball per a les ciències socials
Un flux de treball per a les ciències socials
Anàlisi com a projectes
Estructura en forma de directoris del projecte
Els scripts de codi
Projecte d'anàlisi de dades
5.1 Dades: importació i lectura
La grandesa del text pla
Importació de dades en diversos formats (read.table i read.csv)
La llibreria foreign (SPSS, STATA...)
5.2 Dades: transformació i munging
Primer contacte amb les dades (head(), tail(), summary())
Neteja de dades (valors perduts, missing data, is.na())
Format i transformació de dades (dades llargues i amples): melt(), dcast() (llibreria reshape2)
Fusió de bases de dades (merge(), rbind())
5.3 Recodi ficació de variables
Canvi d'etiquetes en variables categòriques
Recodifi cació d'una variable contínua en categòrica (ifelse(), cut())
Transformacióo d'una variable contínua en una nova variable (log(), sqrt())
Accions massives i nous valors condicionats per variables categòriques (les famílies plyr i apply)
09:15 - 13:00 Anàlisi de dades I. Anàlisi de dades amb R
5.4 Exploració de dades
Taules descriptives
Descriptius estadístics (summary(), stargazer(), etc.)
Taules de contingència (prop.table(), xtabs())
5.5 Gràfi cs I: la llibreria bàsica
Exploració gràfi ca de variables soles (hist(), barplot(), boxplot()
Exploració de relació entre diverses variables (plot())
Arguments gràfics útils
5.6 Gràfi cs II: gràfi cs avançats
La gramàtica dels gràfi cs
La família ggplot2
09:15 - 13:00 Anàlisi de dades I. Anàlisi de dades amb R
5.7 Anàlisi estadística bàsica
Anàlisi d'independència (chisq.test(),t.test())
Models lineals (lm(), aov())
Models no lineals (la família glm per a regressions no lineals)
Resum de resultats (summary(), one command to rule them all...)
Exportacióo de taules de regressióo per publicar (mtable, stargazer)
5.8 Gràfics III: simulació i gràfi cs per publicar
Integració dels resultats de regressions en gràfi cs (abline(), text())
Simulació i predicció a partir de models de regressió (predict(), newdata)
Gràfi cs de coefi cients de regressió en comptes de taules (la llibreria effects, coefplot() i la creació manual)
5.9 Generació d'informes, articles i llibres des de l'editor mateix
Els formats que no són Microsoft Word (markdown, LATEX, org, odt)
Integració del projecte d'anàlisi amb la redacció d'informes individuals i col·laboratius
Integració de codi R en informes o articles per a publicació (markdown, knitr)
Aspectes pràctics (publicació de taules en llocs web, github com a repositori en línia i web per a cada article, etc.)
  • En aquests moments no és possible inscriure's a aquest curs.

Compartir