ESTADÍSTICA
La estadística es el conjunto de procedimientos y técnicas empleadas para recolectar, organizar y analizar datos, los cuales sirven de base para tomar decisiones en las situaciones de incertidumbre que plantean las ciencias sociales o naturales.
ESTADÍSTICA DESCRIPTIVA
La estadística descriptiva se refiere a la recolección, presentación, descripción, análisis e interpretación de una colección de datos que permiten resumir por medio de elementos de información (medidas descriptivas) características de la totalidad de los mismos y llegar a una conclusión sobre la muestra o población que se analiza.
Figura 1. estadística descriptiva.
ANALISIS ESTADÍSTICO
El análisis estadístico es todo el proceso de organización, procesamiento, reducción e interpretación de datos para realizar inferencias.
DATOS Y VARIABLES
Variables: Es toda característica que varía de un elemento a otro de la población.
Datos: Son medidas o valores de las características susceptibles de observar y contar, se originan por la observación de una o más variables de un grupo de elementos o unidades
CLASIFICACIÓN DE VARIABLES
Figura 2. Clasificación de variables.
Categóricas o cualitativas: Son atributos o cualidades que no tienen ningún grado de comparación numérica. Por ejemplo: sexo, estado civil, color de ojos, etc.
Numéricas o cuantitativas: Son características contables o medibles que se expresan numéricamente. Por ejemplo: número de estudiantes, peso, calificaciones, etc.
Las variables cuantitativas pueden ser de dos tipos:
Discretas: Solo pueden tomar ciertos valores aislados en un intervalo. Por ejemplo el tamaño de la población (1,2,3... personas).
Continuas: que pueden tomar cualquier valor en un intervalo. Por ejemplo la estatura de una persona (160cm, 160.1cm, 160.15cm ,etc).
Población, en estadística, también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan unas de las observaciones. Población (‘population’) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo.
Muestra (también llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una población estadística.
Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo.
FRECUENCIA
Figura 3. Frecuencia.
Es la cantidad de veces que se repite un suceso en un rango de un espacio muestral dado.
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Frecuencia absoluta: La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.
Se representa por \(\large f_i\).
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por \(\Huge n\).
Frecuencia relativa: La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se representa por \(\Huge n_i\).
Frecuencia acumulada: La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada: La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Límites de la clase:
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
Amplitud de la clase:
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Marca de clase:
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
FENOMENOS ALEATORIOS
Figura 4. Definición de experimento.
Ejemplo 1: Carlos y Manolo, organizaron una actividad o experimento para pasar el rato, mientras sus compañeros juegan fútbol. Lanzan una moneda y observan que se dan dos resultados: si aparece la denominación o valor de ella, escriben S (sello); si aparece la imagen de un précer o un motivo colombiano, escriben C (cara).
Figura 5. Ejemplo 1.
Cada uno escoge una opción. Deben hacer \(20\) lanzamientos y contar el número de caras y sellos obtenidos. Ganará quien elija la opción que más veces se repita.
Inician el juego:
Carlos, que ha elegido “cara”, lanza la moneda; ¿cuántos resultados puede obtener? Saca cara y muy feliz anota C en la primera casilla.
Manolo, quien gana con “sello”, lanza en segundo lugar. ¿Podrá asegurar que la moneda va a caer en sello?
Saca “sello” y anota S en la segunda casilla.
En el segundo lanzamiento de cada uno, ambos sacan “sello”; el resultado lo anotan en las casillas tres y cuatro. Luego, continúan el juego hasta completar los \(20\) lanxzamientos.
Al final, la tabla aparece así:
Tabla 1. Lanzamientos ejemplo 1.
¿Cuál de los amigos ganó?
Durante la hora de práctica de fútbol alcanzan a jugar cuatro “partidas” de \(40\) lanzamientos cada una. Con los resultados del juego, arman la tabla siguiente:
Tabla 2. 40 lanzamientos.
Carlos se declara ganador, pero Manolo propone contar los resultados totales.
El resumen de los lanzamientos lo anotaron en la tabla:
Tabla 3. Resultados.
Si se consideran los totales, la frecuencia de caras y de sellos es casi igual. Según nuestro ejemplo, Manolo fue el ganador.
Ejemplo 2: En un curso, el profesor solicita, a cada uno de sus \(25\) alumnos, indicar cuántos hermanos y cuántas hermanas tiene.
El profesor agrupa los datos en una tabla:
Tabla 4. Agrupación del profesor, ejemplo 2.
Podemos asegurar que el experimento “tener hermano” es un fenómeno aleatorio? ¿Cuáles son en este caso las frecuencias absoluta y relativa del evento “tener hermano”?
En la tabla 4 observamos que el total de hermanos se puede contabilizar así:
\(\( 0 \times 6 \) \ + \ \(1 \times 10 \) \ + \ \(2 \times 5 \) \ + \ \( 3 \times 3 \) \ + \ \(4 \times 1 \) \ =\ 33\).
En total son \(33\) hermanos.
El número de hermanas es:
\(\( 0 \times 8 \) \ + \ \(1 \times 8 \) \ + \ \(2 \times 5 \) \ + \ \( 3 \times 2 \) \ + \ \(4 \times 2 \) \ =\ 32\)
En total son \(32\) hermanas.
Ahora veremos los resultados del experimento “clasificación por sexo de los hermanos”, en la tabla siguiente se muestra la frecuencia de cada resultado: “sexo masculino” y “sexo femenino”, y las frecuencias relativas de ellos.
Tabla 5. Clasificación de sexos.
La experiencia de tener un hermano –o la de tener un hijo-- tiene, respecto al sexo, dos posibles resultados. Además, antes de conocer el sexo por métodos como la ecografía, no puede anticiparse ese resultado. Por ello este hecho se considera un fenómeno aleatorio.
Los resultados de la encuesta del profesor respecto al sexo de los hermanos de sus alumnos, pueden representarse gráficamente mediante diagramas de barras (estudiaremos los diagramas en las siguientes lecciones):
Figura 6. Diagrama de barras del experimento del profesor.
PREGUNTA: Teniendo en cuenta que las variables se clasifican en categóricas y numéricas. La numérica se clasifica a su vez en discretas y continuas; se puede concluir que la variable edad es: