class: front <!--- Para correr en ATOM - open terminal, abrir R (simplemente, R y enter) - rmarkdown::render('static/docpres/07_interacciones/7interacciones.Rmd', 'xaringan::moon_reader') About macros.js: permite escalar las imágenes como [scale 50%](path to image), hay si que grabar ese archivo js en el directorio. ---> .pull-left[ # R para el análisis de datos ## **Kevin Carrasco** ## Sociología - UAH ## 1er Sem 2025 ## [.green[R-data-analisis.netlify.com]](https://R-data-analisis.netlify.com) ] .pull-right[ .right[ <br> ## .yellow[Sesión 4: Planteando una investigación cuantitativa]  ] ] --- layout: true class: animated, fadeIn --- class: inverse, bottom, right, animated, slideInRight # .red[Sesión 4] <br> Introducción y bases de la investigación cuantitativa Datos y variables Niveles de medición <br> <br> <br> <br> --- class: inverse, bottom, right # .red[Sesión 4] <br> .yellow[Introducción y bases de la investigación cuantitativa] Datos y variables Niveles de medición <br> <br> <br> <br> --- # Introducción y bases de la investigación cuantitativa * En la investigación cuantitativa se asume que hay una realidad "allá afuera" que quien investiga puede conocer a través de su **cuantificación** -- * Permite lidiar con la **incertidumbre** -- * Foco en la teoría (*generalmente* se enfatiza el **método hipotético-deductivo**, buscando probar hipótesis de teorías previamente estudiadas) --- # Introducción y bases de la investigación cuantitativa * Explicar lo que es, no lo que debería ser -- * Conocer y explicar grupos de personas de manera general, no individuos por sí solos --- # Proceso de investigación cuantitativo (D'Ancona 2001) 1. Formulación de un problema de investigación 2. Operacionalización del problema - Hipótesis - Operacionalización de conceptos teóricos - Delimitación de unidad de análisis 3. Diseño de la investigación: cómo se realizará la investigación (diseños transversales, longitudinales, experimentales) 4. Factibilidad de la investigación: Cronología de tareas; recursos disponibles (materiales y humanos); etc. --- # Proceso de investigación cuantitativo (D'Ancona 2001) 1. Formulación de un problema de investigación 2. Operacionalización del problema - Hipótesis - .red[Operacionalización de conceptos teóricos] - Delimitación de unidad de análisis 3. Diseño de la investigación: cómo se realizará la investigación (diseños transversales, longitudinales, experimentales) 4. Factibilidad de la investigación: Cronología de tareas; recursos disponibles (materiales y humanos); etc. --- class: roja, center, middle # Medición y operacionalización --- # Medición y operacionalización - Operacionalización = "codificación" de un fenómeno con el fin de hacerlo **medible** - Hay muchas formas de "codificar" un mismo concepto - ¿Por qué es importante definir operacionalmente los conceptos? --- # Medición y operacionalización .center[¿Qué concepto se pretende medir con esta pregunta?] .center[] --- # Medición y operacionalización .center[¿Y con estas preguntas?] .center[] --- # Medición y operacionalización .center[y si quisiéramos medir un concepto más complejo?] -- .center[¿cómo se puede medir cohesión social?] --- # Medición y operacionalización - Cohesión social según CEPAL (2021) .center[] --- # Medición y operacionalización - Cohesión social según Observatorio de cohesión social (ocs-coes) (2020) .center[] --- # Introducción y bases de la investigación cuantitativa * Diseños de investigación transversal * Diseños de investigación longitudinal * Diseños de investigación experimentales --- * Diseños de investigación transversal .center[  ] --- * Diseños de investigación longitudinal .center[  ] --- * Diseños de investigación experimentales .center[  ] --- class: inverse, bottom, right # .red[Sesión 4] <br> Repaso sesión anterior Introducción y bases de la investigación cuantitativa .yellow[Datos y variables] Medidas de tendencia central <br> <br> <br> <br> --- ##.yellow[Datos] y variables * Los datos miden al menos una *característica* de a los menos una *unidad* en a lo menos *un punto en el tiempo* -- + Ejemplo: La esperanza de vida en Chile el 2017 fue de 79,9 años - Característica (variable) : esperanza de vida - Unidad: Años - Punto en el tiempo: 2017 --- ##.yellow[Datos] y variables * Base de Datos * Forma "rectangular" de almacenamiento de datos: .center[] --- ##.yellow[Datos] y variables - cada .blue[fila] representa una unidad o caso (ej: un entrevistad_) - cada .orange[columna] una variable (ej: edad) - cada .purple[variable] posee valores numéricos - los valores numéricos pueden estar asociados a una etiqueta (ej: 1=Mujer) --- ##.yellow[Datos] y variables ### Ejemplos de estudios / bases de datos 1. [Encuesta Centro de Estudios Públicos](https://www.cepchile.cl/encuesta/encuesta-cep-n-90/) 2. [Encuesta CASEN 2022](https://observatorio.ministeriodesarrollosocial.gob.cl/encuesta-casen-2022) 3. [Encuesta Latinobarómetro](https://www.latinobarometro.org/lat.jsp) 4. [ELSOC](https://coes.cl/encuesta-panel/) 5. [Banco de datos MINEDUC](https://datosabiertos.mineduc.cl/) --- ## Datos y .yellow[variables] - Una variable representa cualquier cosa o propiedad que varía y a la cuál se le asigna un valor. Es decir: - `\(Variable \neq Constante\)` --- ## Datos y .yellow[variables] - discretas (Rango finito de valores): - Dicotómicas - Politómicas - continuas: - Rango (teóricamente) infinito de valores. --- ## Escalas de medición de variables - NOIR: Nominal, Ordinal, Intervalar, Razón .small[ | Tipo | Características | Propiedad de números | Ejemplo| |------------ |----------------------------------------------|--------------- |----------- | | *Nominal* | Uso de números en lugar de palabras | Identidad | Nacionalidad | | *Ordinal* | Números se usan para ordenar series | + ranking | Nivel educacional | | *Intervalar* | Intervalos iguales entre números | + igualdad | Temperatura | | *Razón* | Cero real | + aditividad | Distancia | ] --- class: inverse, bottom, right # .red[Sesión 4] <br> Repaso sesión anterior Introducción y bases de la investigación cuantitativa Datos y variables .yellow[Medidas de tendencia central] <br> <br> <br> <br> --- ## Medidas de tendencia Central * **Moda**: valor que ocurre más frecuentemente -- * **Mediana**: valor medio de la distribución ordenada. Si N es par, entonces es el promedio de los valores medios -- * **Media** o promedio aritmético: suma de los valores dividido por el total de casos --- ## Medidas de tendencia Central ### Dispersión: * **Varianza**: promedio de la suma de las diferencias del promedio al cuadrado * **Desviación Estándar**: - Raiz Cuadrada de la varianza. - Expresada en la mismas unidades que los puntajes de la escala original --- class: middle, center # Más sobre datos, variables y varianza en: ##- [Moore: 1.Comprensión de los datos (1-54)](https://multivariada.netlify.app/docs/lecturas/moore_comprensiondelosdatos.pdf) --- class: inverse, bottom, right # .red[Sesión 4] <br> Introducción y bases de la investigación cuantitativa Datos y variables Niveles de medición .yellow[Trabajo 1] <br> <br> <br> <br> --- # Estructura de carpetas  --- # Repositorio  --- # Github pages  --- class: center ## Protocolo de trabajo reproducible  .small[.right[fuente: [lisa-coes.com/ipo-repro](https://lisa-coes.com/ipo-repro)]] --- class: inverse, middle, center # .red[Repositorios y apertura] ### La escritura en texto simple (como Markdown o Quarto) permite implementar un sistema de control de versiones, además de herramientas de respaldo, colaboración y comunicación --- # El origen: Abriendo un sistema operativo .pull-left[  - [TED talk](https://www.youtube.com/watch?v=o8NPllzkFhE&ab_channel=TED) ] .pull-right[ - Linus Torvalds, 1991 (21 años) - Crea sistema operativo libre **Linux** y lo abre a la colaboración. Postea: > "I'm doing a (free) operating system (just a hobby, won't be big and professional...)" ] --- # Git .pull-left[  ] .pull-right[ - Es una especie de memoria o registro local que guarda información sobre: - quién hizo un cambio - cuándo lo hizo - qué hizo - Mantiene el historial completo del repositorio - Se puede sincronizar con un repositorio remoto (ej. GitHub) ] --- # Git / GitHub .pull-left[  ] .pull-right[ - Git / GitHub tiene más de 100 millones de repositorios - Mayor fuente de código en el mundo - Desde el desarrollo de software, se ha expandido a otros ámbitos - Favorece la ciencia abierta - En 2018, Microsoft compró GitHub por USD 7500 millones - Aunque generó preocupación, sigue siendo la principal plataforma de colaboración ] --- # Git ≠ archivos individuales ### Git no es un registro de archivos específicos, sino de la carpeta completa - Guarda *"fotos"* de momentos específicos del proyecto - Cada "foto" se toma mediante un .red[commit] ---  --- # Commits - El **commit** es la base del control de versiones - Git no registra automáticamente, sino que requiere el paso de "comprometer" cambios - Un commit: - selecciona los archivos (stage) - registra un mensaje explicativo --- # ¿Cuándo hacer un commit? - Cuando haya un cambio que valga la pena registrar - No para cambios triviales - No esperar a tener demasiados cambios distintos - Que cada commit tenga sentido como “foto” del estado del proyecto --- ### Algunos términos .font50[ | Término | Definición | |--------------|------------| | Remote | Repositorio en GitHub, no en tu equipo local | | Clonar | Descargar una copia completa del repositorio | | Branch | Versión paralela de los archivos del repositorio | | Fork | Copia personal de un repositorio para modificarlo | | Upstream | Rama del repositorio original desde el cual se hizo fork | | Merge | Aplicar cambios de una rama en otra | | Pull request | Solicitud para integrar cambios de una rama en otra | ] --- # Branch - Una **branch** es una copia paralela del repositorio - Permite trabajar en nuevas ideas sin modificar la rama principal ---  --- # Conflicted branch - Si dos personas modifican el mismo archivo, puede haber **conflictos de versiones** ---  --- # ¿Cómo evitar conflictos? - Trabajar en archivos o momentos diferentes - Usar *pull request* para que una persona coordine los cambios --- ## Guía de trabajo en: # .center[[**https://r-data-analisis.netlify.app/practicos/taller-github-collab**](https://r-data-analisis.netlify.app/practicos/taller-github-collab)] --- class: front .pull-left[ # R para el análisis de datos ## **Kevin Carrasco** ## Sociología - UAH ## 1er Sem 2025 ## [.green[R-data-analisis.netlify.com]](https://R-data-analisis.netlify.com) ] .pull-right[ .right[ <br> ## .yellow[Sesión 4: Planteando una Investigación cuantitativa]  ] ]