7.3 Scaterplot
Un diagrama de dispersión o Scaterplot representa cada observación como un punto, posicionado según el valor de dos variables. Además de una posición horizontal y vertical, cada punto también tiene un tamaño, un color y una forma. Estos atributos se denominan estética y son las propiedades que se pueden percibir en el gráfico. Cada estética puede asignarse a una variable o establecerse en un valor constante. Para realizar este tipo de gráfico se usará la función geom_point
. Para ejemplificar el uso de esta función, se graficarán las variables ingresos y gastos como se muestra a continuación:
<- ggplot(
plot19_Ponde data = encuesta,
aes(
y = Income,
x = Expenditure,
weight = wk)) +
geom_point() +
theme_cepal()
plot19_Ponde
Note, que en este caso el parámetro
weight
no está aportando información visual al gráfico. El parámetro weight
se puede usar para controlar el tamaño de los puntos, y así, tener un mejor panorama del comportamiento de la muestra:
<- ggplot(
plot20_Ponde data = encuesta,
aes(y = Income, x = Expenditure)) +
geom_point(aes(size = wk), alpha = 0.3) +
theme_cepal()
plot20_Ponde
Otra forma de usar la variable wk
, es asignar la intensidad del color según el valor de la variable:
<- ggplot(
plot21_Ponde data = encuesta,
aes(y = Income, x = Expenditure)) +
geom_point(aes(col = wk), alpha = 0.3) +
theme_cepal()
plot21_Ponde
Se puede extender las bondades de los gráfico de ggplot2
para obtener mayor información de las muestra. Por ejemplo, agrupar los datos por Zona. Para lograr esto se introduce el parámetro shape
:
<- ggplot(
plot22_Ponde data = encuesta,
aes(y = Income,
x = Expenditure,
shape = Zone)) +
geom_point(aes(size = wk, color = Zone), alpha = 0.3) +
labs(size = "Peso") + scale_color_manual(values = colorZona) +
theme_cepal()
plot22_Ponde
De forma similar se puede obtener el resultado por sexo:
<- ggplot(
plot23_Ponde data = encuesta,
aes(
y = Income,
x = Expenditure,
shape = Sex)) +
geom_point(aes(
size = wk,
color = Sex),
alpha = 0.3) +
labs(size = "Peso") +
scale_color_manual(values = colorSex) +
theme_cepal()
plot23_Ponde
Un resultado equivalente se obtiene por región:
<- ggplot(
plot24_Ponde data = encuesta,
aes(
y = Income,
x = Expenditure,
shape = Region)) +
geom_point(aes(
size = wk,
color = Region),
alpha = 0.3) +
labs(size = "Peso") +
scale_color_manual(values = colorRegion) +
theme_cepal()
plot24_Ponde