SAS Histogram Statement with UNIVARIATE Procedure & Normal Curve

Der wichtigste Aspekt der Datenanalyse ist die Darstellung von Daten in Form von Graphen und Diagrammen. Heute werden wir uns ansehen, wie wir unsere Daten in Form eines Histogramms in der Programmiersprache SAS darstellen können. Außerdem werden wir uns die verschiedenen Funktionen und Parameter ansehen, die unserem SAS-Histogramm hinzugefügt werden können, um das Verständnis zu erleichtern. Wir werden auch PROC univariate Histogramm Normalkurve studieren.

Beginnen wir mit SAS-Histogramm-Anweisungen.

SAS-Histogramm

Bleiben Sie mit den neuesten Technologietrends auf dem Laufenden
Treten Sie DataFlair auf Telegram bei!!

Was ist ein Histogramm?

In der Statistik ist ein Histogramm eine grafische Darstellung der tabellarischen Häufigkeit. Ein Histogramm unterscheidet sich von einem Balkendiagramm dadurch, dass der Bereich des Balkens den Wert und nicht die Höhe angibt. Mit Histogrammen in SAS können Sie Ihre Daten untersuchen, indem Sie die Verteilung einer kontinuierlichen Variablen (Prozentsatz einer Stichprobe) anhand von Kategorien des Werts anzeigen. Sie können die Form der Verteilung erhalten und die Daten werden symmetrisch verteilt. In SAS können die Histogramme mit PROC UNIVARIATE, PROC CHART oder PROC GCHART erstellt werden.

SAS Proc Sort Data Sets concept kennenlernen

SAS UNIVARIATE Procedure

Die Syntax zum Erstellen eines SAS-Histogramms-

PROC UNIVARIATE DATA = DATASET;HISTOGRAM variables / options;RUN;

Mit der Verwendung der Histogram-Anweisung in PROC UNIVARIATE können wir die Gesamtverteilung einer quantitativen Variablen schnell und einfach in einer grafischen Anzeige überprüfen.

Sie können eine beliebige Anzahl von Histogrammanweisungen in SAS nach einer PROC UNIVARIATE-Anweisung verwenden. Die Komponenten der SAS HISTOGRAM-Anweisung sind:

Variablen

Dies wird zum Erstellen von SAS-Histogrammen verwendet. Wenn Sie keine Variablen in einer VAR-Anweisung oder in der HISTOGRAM-Anweisung angeben, wird standardmäßig für jede numerische Variable im DATA=-Datensatz ein Histogramm erstellt. Wenn Sie eine VAR-Anweisung verwenden und in der HISTOGRAM-Anweisung keine Variablen angeben, wird standardmäßig für jede in der VAR-Anweisung aufgelistete Variable ein Histogramm erstellt.

Wissen Sie? – Zusammenführen von Datensätzen

Angenommen, ein Datensatz mit dem Namen Steel enthält genau zwei numerische Variablen mit den Namen Length und Width . Die folgenden Anweisungen erstellen zwei Histogramme, eines für Länge und eines für Breite:

proc univariate data=Steel; histogram;run;

Ebenso erstellen die folgenden Anweisungen Histogramme für Länge und Breite:

proc univariate data=Steel; var Length Width; histogram;run;

Die folgenden Anweisungen erstellen ein Histogramm nur für die Länge:

proc univariate data=Steel; var Length Width; histogram Length;run;

Optionen

Fügt dem Histogramm Funktionen hinzu. Geben Sie alle Optionen nach dem Schrägstrich (/) in der Anweisung SAS HISTOGRAM an.

In den folgenden Anweisungen zeigt beispielsweise die Option NORMAL eine angepasste Normalkurve im Histogramm an, die Option MIDPOINTS= gibt Mittelpunkte für das Histogramm an und die Option CTEXT= gibt die Farbe des Textes an:

proc univariate data=Steel; histogram Length / normal midpoints = 5.6 5.8 6.0 6.2 6.4 ctext = blue;run;

SAS-Histogramm mit normaler Kurve

Beginnen wir mit der Erstellung eines einfachen SAS-Histogramms der Gewichtsvariablen. Wir werden den eingebauten Datensatz sashelp verwenden.klasse:

TITLE 'Summary of Weight Variable (in pounds)'; PROC UNIVARIATE DATA = sashelp.class NOPRINT;HISTOGRAM weight / NORMAL; RUN;

Wir können mehr als eine Analysevariable in der SAS Histogram-Anweisung haben. Jede Variable hat ein separates Histogramm in SAS. NOPRINT Option unterdrückt die zusammenfassende Statistik, die NORMAL Option stellt eine normale Kurve.

SAS-Histogramm mit Normalkurve

Muss lernen – Wichtige Struktur des SAS-Programms

SAS-Histogramm mit verschiedenen anpassbaren Optionen

Mit der Anweisung SAS histogram können verschiedene Optionen zu Folgendem hinzugefügt werden:

1. Wir können die Option CFILL hinzufügen, um die Farbe für das Histogramm zu füllen, und die Anweisung INSET, um ein Feld der Zusammenfassungsstatistik direkt in das Diagramm einzufügen.

2. Standardmäßig ist die Schriftart des Textes in der Einfügemarke innerhalb des Diagramms FONT=SIMPLEX.

3. Die Option MIDPOINTS= gibt Mittelpunkte für das Histogramm an,

4. Die Option CTEXT= gibt die Farbe des Textes an.

Beispiel-

PROC UNIVARIATE DATA = sashelp.class;HISTOGRAM weight / NORMAL CFILL = ltgray;INSET N = 'Number of students' MEDIAN (8.2) MEAN (8.2) STD='Standard Deviation' (8.3) / POSITION = ne;RUN;

 SAS-Histogramm mit verschiedenen anpassbaren Optionen

Die obige Grafik zeigt das SAS-Histogramm mit verschiedenen anpassbaren Optionen

Zusammenfassung

Wir haben zwei Möglichkeiten gesehen, das SAS-Histogramm zu entwerfen. SAS verfügt über eine Sammlung von Textstilen, Farben und Optionen, die zur besseren Lesbarkeit zu unserem Histogramm hinzugefügt werden können. Sie können sie im SAS-Hilfeverzeichnis durchgehen.