• Aucun résultat trouvé

Gráficos para variables cuantitativas

2. R EPRESENTACIONES GRÁFICAS

2.3. Gráficos para variables cuantitativas

Las representaciones gráficas que hemos visto hasta ahora tienen en cuenta la existencia de una serie de categorías que expresan valores cualitativos sin una unidad de medida y por tanto sin una distancia entre ellos que se pueda cuantificar. Ahora las posibilidades gráficas se amplían por el hecho de ser cuantitativas, aunque siempre tendremos la opción, si se considera adecuada, de representar alguna variable de escala numérica con algunos de los gráficos que hemos visto hasta ahora. No obstante, las variables cuantitativas que tienen un número importante de valores no se representan adecuadamente en los gráficos anteriores y se precisa agruparlos previamente. Los nuevos gráficos que veremos a continuación permiten esa agrupación a partir de la construcción de intervalos de valores, de forma automatizada cuando los realizamos con la computadora.

La representación gráfica habitual es el histograma que contiene la distribución de la variable a partir de levantar, para cada intervalo consecutivo que se construye, un rectángulo de área proporcional a la frecuencia. Estos rectángulos se disponen de forma adyacente y suelen ser de igual amplitud, determinando así su altura la presencia de más o menos casos en casos dentro del intervalo. El eje horizontal del gráfico dispone los intervalos mientras que el vertical se refiere a las frecuencias, pero en términos de densidad: es el número de casos por unidad de la variable que se dispone en el eje horizontal.

En el Gráfico III.3.5 se representa el histograma de la variable edad con dos versiones, la propuesta inicialmente y de forma automatizada por el software estadístico, en este caso el SPSS, y una agrupación personalizada elaborada por nosotros. En el primer caso el ancho de intervalo es menor y en el segundo hemos construido intervalos de una anchura de 10 años, indicando que el intervalo empezara en los 15 años (si bien nuestros datos se inician en 18). En consecuencia, la escala en el eje vertical será diferente en cada caso para reflejar la mayor o menor densidad de casos de cada rectángulo en cada histograma.

Gráfico III.3.5. Histograma de la variable P34 (la edad)

La forma y el contorno de los gráficos varía algo de un gráfico a otro, pero en ambos casos el área total que comprenden todos los rectángulos es la misma, es una misma unidad resultado de sumarlos todos: la podemos expresar en términos de casos (suman 2800 y el área total sería de 2800), en términos de proporciones (suman 1 y el área es de 1) o en términos de porcentajes (suma 100 y el área total es 100).

Del gráfico se concluye claramente que a medida que aumenta la edad, en un primer momento y hasta más o menos los 50 años el número de personas va aumentando mientras que a partir de esa edad, por “ley de vida”, el número de persona va progresivamente decreciendo. Se da además una cierta mayor concentración de casos en las edades más jóvenes hasta esos 50 años aproximadamente.

Una representación gráfica también de interés con variables cuantitativas es el polígono de frecuencias. Se construye a partir del histograma uniendo mediante una línea poligonal los puntos medios de las bases superiores de los rectángulos (sus marcas de clase). En el Gráfico III.3.6 se presenta de nuevo la distribución de la edad bajo la

forma de polígono de frecuencias, en el segundo caso, con la edad más agrupada, se presenta superpuesto con el histograma.

Gráfico III.3.6. Polígono de frecuencias de la variable P32 (edad)

Para una variable cuantitativa que incrementa el número de casos y el número de intervalos, haciéndolos cada vez de menor amplitud, el contorno del histograma tiende a suavizarse progresivamente hasta dibujar una línea continua que expresaría idealmente el perfil de la distribución.

Representaremos en diversas ocasiones los histogramas con esa línea continua idealizando el carácter de la distribución. Veremos también que algunas de estas distribuciones ideales se corresponden con funciones matemáticas (funciones de densidad) que dibujan esa forma ideal continua del histograma. Será objeto de tratamiento sobre todo en el próximo capítulo al hablar de inferencia estadística y al tratar con distribuciones teóricas. Entre ellas destaca por su importancia en la teoría estadística la distribución normal cuya forma es perfectamente simétrica con forma de campana:

La ojiva es un polígono de frecuencias acumuladas, es decir, un diagrama con una línea poligonal siempre creciente. Con datos porcentuales la línea crece desde el 0% hasta el 100%. El Gráfico III.3.7 no se representa la línea, pero se deriva a partir de un histograma de frecuencias acumuladas. En este tipo de gráfico se puede apreciar

visualmente cómo, por ejemplo, el 50% de las personas entrevistadas se acumula hasta los 45 años de edad.

Gráfico III.3.7. Histograma de frecuencias acumuladas de la variable P32 (edad)

Los histogramas, y también los gráficos de barras, se pueden representar en forma de pirámides. Cuando la información que se maneja es la edad y la distribuimos entre varones y mujeres generamos una pirámide de población. El Gráfico III.3.8 presenta esta representación con los datos de la Tabla III.3.6 para el año 2011. En este caso se trata de un gráfico de barras en forma de pirámide.

Gráfico III.3.8. Pirámide de población. Distribución de la edad (en quinquenios) según el sexo. España. Censo de Población de 2011

El Gráfico III.3.9 reproduce la pirámide de población con los datos del estudio del CIS 3041 a partir de un histograma donde automáticamente se ha determinado la amplitud de los intervalos.

Gráfico III.3.9. Pirámide de población. Distribución de la edad (en quinquenios) según el sexo. España. Censo de Población de 2011

Cuando introduzcamos más adelante el análisis exploratorio de datos veremos otra representación de interés tan relevante como el histograma para dar cuenta de la distribución de una variable cuantitativa: el diagrama de caja. Para ello necesitamos introducir algunos conceptos previos relacionados con las medidas de resumen de las características de una distribución de frecuencias.