SAS Histogram erklæring med UNIVARIATE Procedure & Normal Curve
det vigtigste aspekt af dataanalyse er en repræsentation af data i form af grafer og diagrammer. I dag vil vi se på, hvordan vi repræsenterer vores data i form af et histogram i SAS programmeringssprog. Derudover vil vi også se på de forskellige funktioner og parametre, der kan føjes til vores SAS histogram for at gøre det lettere at forstå. Vi vil også studere PROC univariate histogram normal kurve.
lad os starte med SAS Histogram udsagn.
Hold dig opdateret med nyeste teknologi tendenser
Deltag DataFlair på Telegram!!
hvad er SAS Histogram?
i statistik er et histogram en grafisk visning af tabuleret frekvens. SAS histogram adskiller sig fra et søjlediagram, idet det er området på bjælken, der angiver værdien, ikke højden. Histogrammer i SAS giver dig mulighed for at udforske dine data ved at vise fordelingen af en kontinuerlig variabel (procentdel af en prøve) mod kategorier af værdien. Du kan få formen på distributionen, og dataene fordeles symmetrisk. I SAS kan histogrammerne produceres ved hjælp af PROC UNIVARIATE, PROC CHART eller PROC GCHART.
Udforsk SAS Proc-Sorteringsdatasætkonceptet
SAS UNIVARIATE Procedure
syntaksen for oprettelse af et SAS histogram-
PROC UNIVARIATE DATA = DATASET;HISTOGRAM variables / options;RUN;
med brug af SAS Histogram erklæring i PROC UNIVARIATE, vi kan have en hurtig og enkel måde at gennemgå den samlede fordeling af en kvantitativ variabel i et grafisk display.
du kan bruge et vilkårligt antal Histogramerklæringer i SAS efter en proc UNIVARIATE-erklæring. Komponenterne i SAS HISTOGRAM-erklæringen er:
variabler
dette bruges til at oprette SAS histogrammer. Hvis du ikke angiver variabler i en var-sætning eller i HISTOGRAMSÆTNINGEN, oprettes der som standard et histogram for hver numerisk variabel i DATA= datasættet. Hvis du bruger en var-sætning og ikke angiver nogen variabler i HISTOGRAMSÆTNINGEN, oprettes der som standard et histogram for hver variabel, der er angivet i var-sætningen.
ved du det? – Hvordan SAS fletter datasæt
Antag f.eks., at et datasæt med navnet Steel indeholder nøjagtigt to numeriske variabler med navnet længde og bredde. Følgende udsagn opretter to histogrammer, en for længde og en for bredde:
proc univariate data=Steel; histogram;run;
ligeledes opretter følgende udsagn histogrammer for længde og bredde:
proc univariate data=Steel; var Length Width; histogram;run;
følgende udsagn opretter kun et histogram for længde:
proc univariate data=Steel; var Length Width; histogram Length;run;
indstillinger
det tilføjer funktioner til histogrammet. Angiv alle indstillinger efter skråstreg (/) i SAS HISTOGRAM-sætningen.
for eksempel viser indstillingen NORMAL i de følgende udsagn en monteret normal kurve på histogrammet, indstillingen MIDPOINTS= angiver midtpunkter for histogrammet, og indstillingen CTEKST= angiver farven på teksten:
proc univariate data=Steel; histogram Length / normal midpoints = 5.6 5.8 6.0 6.2 6.4 ctext = blue;run;
SAS Histogram med Normal kurve
lad os starte med at oprette et simpelt SAS histogram af VÆGTVARIABLEN. Vi bruger det indbyggede datasæt sashelp.klasse:
TITLE 'Summary of Weight Variable (in pounds)'; PROC UNIVARIATE DATA = sashelp.class NOPRINT;HISTOGRAM weight / NORMAL; RUN;
vi kan have mere end en analysevariabel i SAS Histogram-erklæringen. Hver variabel vil have et separat histogram i SAS. Noprint-indstillingen undertrykker oversigtsstatistikken, den normale indstilling viser en normal kurve.
skal lære – vigtig struktur af SAS-programmet
SAS Histogram med forskellige indstillinger, der kan tilpasses
med SAS histogram-erklæringen kan forskellige muligheder tilføjes til følgende:
1. Vi kan tilføje CFILL-indstillingen for at udfylde farve til histogrammet og INDSATSERKLÆRINGEN for at indsætte en boks med oversigtsstatistikken direkte i grafen.
2. Som standard er skrifttypen for teksten i indsatsbo inde i grafen FONT=simpleks.
3. Indstillingen MIDPOINTS= angiver midtpunkter for histogrammet,
4. Indstillingen CTEKST= angiver farven på teksten.
eksempel-
PROC UNIVARIATE DATA = sashelp.class;HISTOGRAM weight / NORMAL CFILL = ltgray;INSET N = 'Number of students' MEDIAN (8.2) MEAN (8.2) STD='Standard Deviation' (8.3) / POSITION = ne;RUN;
ovenstående graf viser SAS histogram med forskellige indstillinger, der kan tilpasses
Resume
vi så to måder at designe SAS histogram på, den ene var en grundlæggende, den anden var med forskellige muligheder, der passer til vores krav. SAS har et lager af tekstformater, farver, muligheder, der kan føjes til vores histogram for bedre læsbarhed. Du kan gennemgå dem i SAS-hjælpekataloget.