Declaración de Histograma SAS con Procedimiento UNIVARIADO y Curva Normal

El aspecto más importante del análisis de datos es una representación de los datos en forma de gráficos y tablas. Hoy veremos cómo representar nuestros datos en forma de histograma en lenguaje de programación SAS. Además de esto, también veremos las diferentes funciones y parámetros que se pueden agregar a nuestro histograma SAS para que sea más fácil de entender. También estudiaremos la curva normal del histograma univariado del PROC.

Comencemos con instrucciones de Histograma SAS.

 Histograma SAS

Manténgase actualizado con las últimas tendencias tecnológicas
¡Únase a DataFlair en Telegram!!

¿Qué es el histograma SAS?

En estadística, un histograma es una visualización gráfica de frecuencia tabulada. El histograma SAS difiere de un gráfico de barras en que es el área de la barra la que indica el valor, no la altura. Los histogramas en SAS le permiten explorar sus datos al mostrar la distribución de una variable continua (porcentaje de una muestra) frente a categorías del valor. Puede obtener la forma de la distribución y los datos se distribuyen simétricamente. En SAS, los histogramas se pueden producir utilizando PROC UNIVARIATE, PROC CHART o PROC GCHART.

Explore el concepto de conjuntos de datos de clasificación SAS Proc

Procedimiento UNIVARIADO SAS

La sintaxis para crear un histograma SAS-

PROC UNIVARIATE DATA = DATASET;HISTOGRAM variables / options;RUN;

Con el uso de la instrucción de histograma SAS en PROC UNIVARIATE, podemos tener una forma rápida y sencilla de revisar la distribución general de una variable cuantitativa en una pantalla gráfica.

Puede usar cualquier número de instrucciones de histograma en SAS después de una instrucción UNIVARIADA PROC. Los componentes de la instrucción de HISTOGRAMA SAS son:

Variables

Esto se usa para crear histogramas SAS. Si no especifica variables en una instrucción VAR o en la instrucción HISTOGRAMA, de forma predeterminada, se crea un histograma para cada variable numérica en el conjunto de datos DATA=. Si utiliza una instrucción VAR y no especifica ninguna variable en la instrucción HISTOGRAMA, de forma predeterminada, se crea un histograma para cada variable enumerada en la instrucción VAR.

¿Lo sabes? – Cómo fusionar conjuntos de datos SAS

Por ejemplo, supongamos que un conjunto de datos llamado Steel contiene exactamente dos variables numéricas llamadas Length y Width. Las instrucciones siguientes crean dos histogramas, uno para Length y otro para Width:

proc univariate data=Steel; histogram;run;

Del mismo modo, las siguientes instrucciones crean histogramas para Longitud y Anchura:

proc univariate data=Steel; var Length Width; histogram;run;

Las instrucciones siguientes crean un histograma solo para la longitud:

proc univariate data=Steel; var Length Width; histogram Length;run;

Opciones

Añade características al histograma. Especifique todas las opciones después de la barra diagonal (/) en la instrucción de HISTOGRAMA SAS.

Por ejemplo, en las instrucciones siguientes, la opción NORMAL muestra una curva normal ajustada en el histograma, la opción MIDPOINTS= especifica los puntos medios para el histograma y la opción CTEXT = especifica el color del texto:

proc univariate data=Steel; histogram Length / normal midpoints = 5.6 5.8 6.0 6.2 6.4 ctext = blue;run;

Histograma SAS con Curva normal

Comencemos creando un histograma SAS simple de la variable de PESO. Usaremos el conjunto de datos incorporado sashelp.clase:

TITLE 'Summary of Weight Variable (in pounds)'; PROC UNIVARIATE DATA = sashelp.class NOPRINT;HISTOGRAM weight / NORMAL; RUN;

Podemos tener más de una variable de análisis en la declaración de histograma SAS. Cada variable tendrá un histograma separado en SAS. La opción NOPRINT suprime las estadísticas de resumen, la opción NORMAL presenta una curva normal.

 Histograma SAS con Curva normal

Debe aprender: Estructura importante del Programa SAS

Histograma SAS con diferentes Opciones personalizables

Con la instrucción de histograma SAS, se pueden agregar diferentes opciones a lo siguiente:

1. Podemos agregar la opción CFILL para rellenar el color del histograma y la instrucción INSET para insertar un cuadro de las estadísticas de resumen directamente en el gráfico.

2. De forma predeterminada, la fuente del texto en el recuadro bo dentro del gráfico es FONT=SIMPLEX.

3. La opción MIDPOINTS = especifica los puntos medios para el histograma,

4. La opción CTEXT = especifica el color del texto.

Ejemplo-

PROC UNIVARIATE DATA = sashelp.class;HISTOGRAM weight / NORMAL CFILL = ltgray;INSET N = 'Number of students' MEDIAN (8.2) MEAN (8.2) STD='Standard Deviation' (8.3) / POSITION = ne;RUN;

Histograma SAS con diferentes Opciones Personalizables

El gráfico anterior muestra el histograma SAS con diferentes opciones personalizables

Resumen

Vimos dos formas de diseñar el histograma SAS, una era básica, la otra tenía diferentes opciones para satisfacer nuestros requisitos. SAS tiene un repositorio de estilos de texto, colores y opciones que se pueden agregar a nuestro histograma para una mejor legibilidad. Puede revisarlos en el directorio de ayuda de SAS.