Sas Histogram Statement met UNIVARIATE Procedure & Normal Curve

het belangrijkste aspect van gegevensanalyse is een weergave van gegevens in de vorm van grafieken en grafieken. Vandaag bekijken we hoe we onze gegevens kunnen weergeven in de vorm van een histogram in Sas-programmeertaal. Daarnaast zullen we ook kijken naar de verschillende functies en parameters die kunnen worden toegevoegd aan ons SAS histogram om het gemakkelijker te begrijpen. We zullen ook PROC univariate histogram normale curve bestuderen.

laten we beginnen met Sas Histogram Statements.

Sas-Histogram

blijf op de hoogte met de nieuwste technologische trends
Word lid van Dataflair op Telegram!!

Wat is Sas-Histogram?

in statistieken is een histogram een grafische weergave van getabelleerde frequentie. SAS histogram verschilt van een staafdiagram in dat het de oppervlakte van de staaf die de waarde aangeeft, niet de hoogte. Histogrammen in SAS kunt u uw gegevens te verkennen door het weergeven van de verdeling van een continue variabele (percentage van een monster) tegen categorieën van de waarde. U kunt de vorm van de distributie verkrijgen en de gegevens worden symmetrisch verdeeld. In SAS, kunnen de histogrammen worden geproduceerd gebruikend PROC UNIVARIATE, proc grafiek, of PROC GCHART.

Onderzoek Het Sas Proc Sorteer datasets concept

SAS UNIVARIATE Procedure

de syntaxis van het maken van een SAS histogram-

PROC UNIVARIATE DATA = DATASET;HISTOGRAM variables / options;RUN;

met het gebruik van Sas Histogram statement in PROC UNIVARIATE, kunnen we een snelle en eenvoudige manier hebben om de algehele verdeling van een kwantitatieve variabele in een grafische weergave te bekijken.

u kunt een willekeurig aantal Histogram statements in SAS gebruiken na een proc UNIVARIATE statement. De componenten van het SAS HISTOGRAM statement zijn:

variabelen

dit wordt gebruikt om SAS histogrammen te maken. Als u geen variabelen opgeeft in een VAR-statement of in het HISTOGRAM-statement, wordt standaard een histogram gemaakt voor elke numerieke variabele in de DATA= – gegevensset. Als u een VAR-statement gebruikt en geen variabelen specificeert in het HISTOGRAM-statement, wordt standaard een histogram gemaakt voor elke variabele die in het VAR-statement wordt vermeld.

weet u het? – Hoe SAS datasets

samenvoegen bijvoorbeeld, stel dat een gegevensset met de naam Steel precies twee numerieke variabelen bevat met de naam lengte en breedte. De volgende statements maken twee histogrammen, een voor lengte en een voor breedte:

proc univariate data=Steel; histogram;run;

op dezelfde manier creëren de volgende statements histogrammen voor lengte en breedte:

proc univariate data=Steel; var Length Width; histogram;run;

de volgende statements maken alleen een histogram voor lengte aan:

proc univariate data=Steel; var Length Width; histogram Length;run;

opties

het voegt functies toe aan het histogram. Specificeer alle opties na de slash (/) in het SAS HISTOGRAM statement.

bijvoorbeeld, in de volgende statements, toont de normale optie een passende normale curve op het histogram, de MIDPOINTS = optie specificeert midpoints voor het histogram, en de ctext = optie specificeert de kleur van de tekst:

proc univariate data=Steel; histogram Length / normal midpoints = 5.6 5.8 6.0 6.2 6.4 ctext = blue;run;

Sas Histogram met normale Curve

laten we beginnen met het maken van een eenvoudig SAS histogram van de GEWICHTSVARIABELE. We zullen de ingebouwde dataset sashelp gebruiken.klasse:

TITLE 'Summary of Weight Variable (in pounds)'; PROC UNIVARIATE DATA = sashelp.class NOPRINT;HISTOGRAM weight / NORMAL; RUN;

we kunnen meer dan één analyse variabele in de SAS Histogram statement. Elke variabele heeft een apart histogram in SAS. NOPRINT optie onderdrukt de samenvatting statistieken, de normale optie presenteert een normale curve.

Sas-Histogram met normale Curve

moet leren-belangrijke structuur van Sas-programma

Sas-Histogram met verschillende aanpasbare opties

met het statement SAS-histogram kunnen verschillende opties aan het volgende worden toegevoegd:

1. We kunnen de CFILL optie Toevoegen om de kleur voor het histogram en INSET statement te vullen om een doos van de samenvattende statistieken direct in de grafiek in te voegen.

2. Standaard is het lettertype van de tekst in de inzet bo in de grafiek FONT = SIMPLEX.

3. De MIDPOINTS = optie specificeert midpoints voor het histogram,

4. De optie CTEXT = specificeert de kleur van de tekst.

voorbeeld-

PROC UNIVARIATE DATA = sashelp.class;HISTOGRAM weight / NORMAL CFILL = ltgray;INSET N = 'Number of students' MEDIAN (8.2) MEAN (8.2) STD='Standard Deviation' (8.3) / POSITION = ne;RUN;

Sas Histogram met verschillende aanpasbare opties

de bovenstaande grafiek toont het sas histogram met verschillende aanpasbare opties

samenvatting

we zagen twee manieren om SAS histogram te ontwerpen, de ene was een basis, de andere was met verschillende opties aan onze eisen. SAS heeft een repository van tekststijlen, kleuren, opties die kunnen worden toegevoegd aan ons histogram voor een betere leesbaarheid. Je kunt ze doorlopen in de SAS help directory.