Instrukcja histogramu SAS z procedurą UNIVARIATE i krzywą normalną

najważniejszym aspektem analizy danych jest reprezentacja danych w postaci wykresów i wykresów. Dzisiaj przyjrzymy się, jak przedstawić nasze dane w formie histogramu w języku programowania SAS. Poza tym przyjrzymy się również różnym funkcjom i parametrom, które można dodać do naszego histogramu SAS, aby ułatwić zrozumienie. Będziemy również badać PROC univariate histogram krzywej normalnej.

zacznijmy od instrukcji Sas Histogram.

Histogram SAS

Bądź na bieżąco z najnowszymi trendami technologicznymi
Dołącz do DataFlair na Telegramie!!

co to jest Histogram SAS?

w statystykach histogram jest graficznym wyświetlaczem tabelarycznej częstotliwości. Histogram SAS różni się od wykresu słupkowego tym, że jest to obszar słupka, który oznacza wartość, a nie Wysokość. Histogramy w SAS pozwalają na badanie danych poprzez wyświetlenie rozkładu zmiennej ciągłej (procent próbki) względem kategorii wartości. Można uzyskać kształt dystrybucji i dane są rozmieszczone symetrycznie. W SAS histogramy mogą być wytwarzane przy użyciu PROC UNIVARIATE, PROC CHART lub PROC GCHART.

poznaj koncepcję Sas Proc Sort data Sets

procedura UNIVARIATE SAS

składnia tworzenia histogramu SAS-

PROC UNIVARIATE DATA = DATASET;HISTOGRAM variables / options;RUN;

korzystając z instrukcji Sas Histogram w PROC UNIVARIATE, możemy mieć szybki i prosty sposób na przegląd ogólnego rozkładu zmiennej ilościowej na wyświetlaczu graficznym.

możesz użyć dowolnej liczby instrukcji Histogram w SAS po instrukcji PROC UNIVARIATE. Składnikami instrukcji histogramu SAS są:

zmienne

służy to do tworzenia histogramów SAS. Jeżeli zmienne nie zostaną określone w instrukcji VAR lub w instrukcji HISTOGRAM, to domyślnie dla każdej zmiennej numerycznej w zestawie DATA= data zostanie utworzony histogram. Jeśli używasz instrukcji VAR i nie określasz żadnych zmiennych w instrukcji HISTOGRAM, to domyślnie dla każdej zmiennej wymienionej w instrukcji VAR tworzony jest histogram.

– Jak SAS Scala zbiory danych

na przykład załóżmy, że zestaw danych o nazwie Steel zawiera dokładnie dwie zmienne numeryczne o nazwie długość i szerokość. Poniższe stwierdzenia tworzą dwa histogramy, jeden dla długości i jeden dla szerokości:

proc univariate data=Steel; histogram;run;

podobnie, następujące stwierdzenia tworzą histogramy długości i szerokości:

proc univariate data=Steel; var Length Width; histogram;run;

poniższe polecenia tworzą histogram tylko dla długości:

proc univariate data=Steel; var Length Width; histogram Length;run;

opcje

dodaje funkcje do histogramu. Określ wszystkie opcje po ukośniku (/) w instrukcji SAS HISTOGRAM.

na przykład w poniższych instrukcjach opcja NORMAL wyświetla dopasowaną krzywą normalną na histogramie, opcja MIDPOINTS = określa punkty środkowe dla histogramu, a opcja CTEXT = określa kolor tekstu:

proc univariate data=Steel; histogram Length / normal midpoints = 5.6 5.8 6.0 6.2 6.4 ctext = blue;run;

Histogram SAS z krzywą normalną

zacznijmy od stworzenia prostego histogramu SAS zmiennej wagi. Użyjemy wbudowanego zestawu danych sashelp.Klasa:

TITLE 'Summary of Weight Variable (in pounds)'; PROC UNIVARIATE DATA = sashelp.class NOPRINT;HISTOGRAM weight / NORMAL; RUN;

możemy mieć więcej niż jedną zmienną analityczną w instrukcji histogramu SAS. Każda zmienna będzie miała oddzielny histogram w SAS. Opcja NOPRINT tłumi statystyki zbiorcze, opcja normalna prezentuje krzywą normalną.

Histogram SAS z krzywą normalną

Must Learn – ważna struktura programu SAS

Histogram SAS z różnymi konfigurowalnymi opcjami

Dzięki instrukcji histogram SAS można dodać różne opcje do następujących:

1. Możemy dodać opcję cfill, aby wypełnić kolor dla histogramu i instrukcji INSET, aby wstawić pole statystyk podsumowania bezpośrednio na wykresie.

2. Domyślnie czcionka tekstu w wstawce bo wewnątrz wykresu to FONT = SIMPLEX.

3. Opcja MIDPOINTS = określa punkty środkowe dla histogramu,

4. Opcja ctext = określa kolor tekstu.

przykład-

PROC UNIVARIATE DATA = sashelp.class;HISTOGRAM weight / NORMAL CFILL = ltgray;INSET N = 'Number of students' MEDIAN (8.2) MEAN (8.2) STD='Standard Deviation' (8.3) / POSITION = ne;RUN;

Histogram SAS z różnymi konfigurowalnymi opcjami

powyższy wykres pokazuje histogram SAS z różnymi konfigurowalnymi opcjami

podsumowanie

widzieliśmy dwa sposoby projektowania histogramu SAS, jeden był podstawowy, drugi miał różne opcje, aby spełnić nasze wymagania. SAS ma repozytorium stylów tekstu, kolorów, opcji, które można dodać do naszego histogramu dla lepszej czytelności. Możesz je przejrzeć w katalogu pomocy SAS.