Declarație histogramă SAS cu procedură univariată și curbă normală
cel mai important aspect al analizei datelor este reprezentarea datelor sub formă de grafice și diagrame. Astăzi ne vom uita la modul de reprezentare a datelor noastre sub forma unei histograme în limbajul de programare SAS. În afară de aceasta, vom analiza și diferitele funcții și parametri care pot fi adăugați la histograma noastră SAS pentru a facilita înțelegerea. Vom studia, de asemenea, proc univariate histograma curba normală.
să începem cu declarațiile histogramei SAS.
rămâneți la curent cu cele mai recente tendințe tehnologice
Alăturați-vă DataFlair pe telegramă!!
ce este histograma SAS?
în statistici, o histogramă este o afișare grafică a frecvenței tabelate. Histograma SAS diferă de o diagramă de bare prin faptul că zona barei este cea care denotă valoarea, nu înălțimea. Histogramele din SAS vă permit să explorați datele dvs. afișând distribuția unei variabile continue (procent dintr-un eșantion) în funcție de categoriile valorii. Puteți obține forma distribuției și datele sunt distribuite simetric. În SAS, histogramele pot fi produse folosind proc UNIVARIATE, proc CHART sau PROC GCHART.
explorați conceptul seturilor de date SAS Proc Sort
procedura univariată SAS
sintaxa creării unei histograme SAS-
PROC UNIVARIATE DATA = DATASET;HISTOGRAM variables / options;RUN;
cu utilizarea declarației histogramei Sas în proc UNIVARIATE, putem avea o modalitate rapidă și simplă de a revizui distribuția generală a unei variabile cantitative într-un afișaj grafic.
puteți utiliza orice număr de declarații histogramă în SAS după o declarație proc UNIVARIATE. Componentele Declarației de histogramă SAS sunt:
variabile
aceasta este utilizată pentru a crea histograme SAS. Dacă nu specificați variabile într-o instrucțiune VAR sau în instrucțiunea histogramă, atunci în mod implicit, este creată o histogramă pentru fiecare variabilă numerică din setul de date= date. Dacă utilizați o instrucțiune VAR și nu specificați nicio variabilă în instrucțiunea histogramă, atunci în mod implicit, este creată o histogramă pentru fiecare variabilă listată în instrucțiunea VAR.
știi? – Cum Sas Merge Seturi de date
de exemplu, să presupunem că un set de date numit oțel conține exact două variabile numerice numite Lungime și lățime. Următoarele afirmații creează două histograme, una pentru lungime și una pentru lățime:
proc univariate data=Steel; histogram;run;
de asemenea, următoarele afirmații creează histograme pentru lungime și lățime:
proc univariate data=Steel; var Length Width; histogram;run;
următoarele afirmații creează o histogramă numai pentru lungime:
proc univariate data=Steel; var Length Width; histogram Length;run;
Opțiuni
se adaugă caracteristici la histograma. Specificați toate opțiunile după slash ( / ) în instrucțiunea histogramă SAS.
de exemplu, în următoarele instrucțiuni, opțiunea NORMAL afișează o curbă normală montată pe histogramă, opțiunea MIDPOINTS = specifică punctele medii pentru histogramă, iar opțiunea CTEXT = specifică culoarea textului:
proc univariate data=Steel; histogram Length / normal midpoints = 5.6 5.8 6.0 6.2 6.4 ctext = blue;run;
histograma SAS cu curba normală
să începem prin crearea unei histograme SAS simple a variabilei de greutate. Vom folosi setul de date încorporat sashelp.clasa:
TITLE 'Summary of Weight Variable (in pounds)'; PROC UNIVARIATE DATA = sashelp.class NOPRINT;HISTOGRAM weight / NORMAL; RUN;
putem avea mai mult de o variabilă de analiză în declarația histogramă Sas. Fiecare variabilă va avea o histogramă separată în SAS. Opțiunea NOPRINT suprimă Statisticile sumare, opțiunea normală prezintă o curbă normală.
trebuie să învețe – structura importantă a programului SAS
histograma SAS cu diferite opțiuni personalizabile
cu declarația histograma SAS, diferite opțiuni pot fi adăugate la următoarele:
1. Putem adăuga opțiunea CFILL pentru a umple culoarea pentru histograma și instrucțiunea INSET pentru a insera o casetă a statisticilor sumare direct în grafic.
2. În mod implicit, fontul textului din inserția bo din interiorul graficului este FONT=SIMPLEX.
3. Opțiunea puncte medii = specifică punctele medii pentru histogramă,
4. Opțiunea CTEXT = specifică culoarea textului.
exemplu-
PROC UNIVARIATE DATA = sashelp.class;HISTOGRAM weight / NORMAL CFILL = ltgray;INSET N = 'Number of students' MEDIAN (8.2) MEAN (8.2) STD='Standard Deviation' (8.3) / POSITION = ne;RUN;
graficul de mai sus arată histograma SAS cu diferite opțiuni personalizabile
rezumat
am văzut două moduri de a proiecta histograma SAS, una a fost una de bază, cealaltă a fost cu opțiuni diferite pentru a se potrivi cerințelor noastre. SAS are un depozit de stiluri de text, culori, opțiuni care pot fi adăugate la histograma noastră pentru o mai bună lizibilitate. Puteți trece prin ele în directorul de ajutor SAS.