Istruzione istogramma SAS con procedura UNIVARIATA e curva normale

L’aspetto più importante dell’analisi dei dati è una rappresentazione dei dati sotto forma di grafici e grafici. Oggi vedremo come rappresentare i nostri dati sotto forma di istogramma nel linguaggio di programmazione SAS. Oltre a questo, esamineremo anche le diverse funzioni e parametri che possono essere aggiunti al nostro istogramma SAS per renderlo più facile da capire. Studieremo anche la curva normale dell’istogramma univariato di PROC.

Iniziamo con le istruzioni dell’istogramma SAS.

 Istogramma SAS

Rimani aggiornato con le ultime tendenze tecnologiche
Unisciti a DataFlair su Telegram!!

Che cos’è l’istogramma SAS?

In statistica, un istogramma è una visualizzazione grafica della frequenza tabulata. L’istogramma SAS differisce da un grafico a barre in quanto è l’area della barra che indica il valore, non l’altezza. Gli istogrammi in SAS consentono di esplorare i dati visualizzando la distribuzione di una variabile continua (percentuale di un campione) rispetto alle categorie del valore. È possibile ottenere la forma della distribuzione e i dati sono distribuiti simmetricamente. In SAS, gli istogrammi possono essere prodotti utilizzando PROC UNIVARIATE, PROC CHART o PROC GCHART.

Esplora il concetto SAS Proc Sort Data Sets

SAS UNIVARIATE Procedure

La sintassi per la creazione di un istogramma SAS-

PROC UNIVARIATE DATA = DATASET;HISTOGRAM variables / options;RUN;

Con l’uso dell’istruzione istogramma SAS in PROC UNIVARIATE, possiamo avere un modo semplice e veloce per rivedere la distribuzione complessiva di una variabile quantitativa in una visualizzazione grafica.

È possibile utilizzare qualsiasi numero di istruzioni istogramma in SAS dopo un’istruzione UNIVARIATA PROC. I componenti dell’istruzione ISTOGRAMMA SAS sono:

Variabili

Viene utilizzato per creare istogrammi SAS. Se non si specificano variabili in un’istruzione VAR o nell’istruzione ISTOGRAMMA, per impostazione predefinita, viene creato un istogramma per ogni variabile numerica nel set di dati DATA=. Se si utilizza un’istruzione VAR e non si specificano variabili nell’istruzione ISTOGRAMMA, per impostazione predefinita viene creato un istogramma per ogni variabile elencata nell’istruzione VAR.

Lo sai? – Come SAS Merge Dataset

Ad esempio, supponiamo che un set di dati denominato Steel contenga esattamente due variabili numeriche denominate Length e Width. Le istruzioni seguenti creano due istogrammi, uno per la lunghezza e uno per la larghezza:

proc univariate data=Steel; histogram;run;

Allo stesso modo, le seguenti istruzioni creano istogrammi per Lunghezza e Larghezza:

proc univariate data=Steel; var Length Width; histogram;run;

Le istruzioni seguenti creano un istogramma solo per Length:

proc univariate data=Steel; var Length Width; histogram Length;run;

Opzioni

Aggiunge funzionalità all’istogramma. Specificare tutte le opzioni dopo la barra ( / ) nell’istruzione ISTOGRAMMA SAS.

Ad esempio, nelle istruzioni seguenti, l’opzione NORMALE visualizza una curva normale montata sull’istogramma, l’opzione MIDPOINTS = specifica i punti medi per l’istogramma e l’opzione CTEXT = specifica il colore del testo:

proc univariate data=Steel; histogram Length / normal midpoints = 5.6 5.8 6.0 6.2 6.4 ctext = blue;run;

Istogramma SAS con Curva Normale

Iniziamo creando un semplice istogramma SAS della variabile di PESO. Useremo il set di dati integrato sashelp.classe:

TITLE 'Summary of Weight Variable (in pounds)'; PROC UNIVARIATE DATA = sashelp.class NOPRINT;HISTOGRAM weight / NORMAL; RUN;

Possiamo avere più di una variabile di analisi nell’istruzione istogramma SAS. Ogni variabile avrà un istogramma separato in SAS. L’opzione NOPRINT sopprime le statistiche di riepilogo, l’opzione NORMALE presenta una curva normale.

Istogramma SAS con curva normale

Deve imparare – Struttura importante del programma SAS

Istogramma SAS con diverse opzioni personalizzabili

Con l’istruzione istogramma SAS, è possibile aggiungere diverse opzioni a quanto segue:

1. Possiamo aggiungere l’opzione CFILL per riempire il colore per l’istogramma e l’istruzione INSET per inserire una casella delle statistiche di riepilogo direttamente nel grafico.

2. Per impostazione predefinita il carattere del testo nel riquadro bo all’interno del grafico è FONT = SIMPLEX.

3. L’opzione MIDPOINTS = specifica i punti medi per l’istogramma,

4. L’opzione CTEXT = specifica il colore del testo.

Esempio-

PROC UNIVARIATE DATA = sashelp.class;HISTOGRAM weight / NORMAL CFILL = ltgray;INSET N = 'Number of students' MEDIAN (8.2) MEAN (8.2) STD='Standard Deviation' (8.3) / POSITION = ne;RUN;

SAS Istogramma con Diverse Opzioni Personalizzabili

Il grafico sopra riportato mostra l’istogramma SAS con diverse opzioni personalizzabili

Sommario

Abbiamo visto in due modi design SAS istogramma, uno era fondamentale, l’altro con diverse opzioni per soddisfare le nostre esigenze. SAS ha un repository di stili di testo, colori, opzioni che possono essere aggiunti al nostro istogramma per una migliore leggibilità. È possibile passare attraverso di loro nella directory della guida SAS.