SASヒストグラムステートメントと一変量プロシージャと正規曲線

データ分析の最も重要な側面は、グラフやチャートの形でデータを表現することです。 今日は、SASプログラミング言語でヒストグラムの形でデータを表現する方法を見ていきます。 これに加えて、理解しやすくするためにSASヒストグラムに追加できるさまざまな関数とパラメータについても検討します。 また、PROC一変量ヒストグラム法線曲線についても検討します。

まず、SASヒストグラムステートメントから始めましょう。

最新の技術動向で更新滞在
電報にDataFlairに参加!!

統計では、ヒストグラムは集計された頻度のグラフ表示です。 SASヒストグラムは、高さではなく、値を示すバーの面積であるという点で、棒グラフとは異なります。 SASのヒストグラムを使用すると、値のカテゴリに対する連続変数(サンプルの割合)の分布を表示することで、データを探索できます。 分布の形状を得ることができ、データは対称的に分布します。 SASでは、PROC UNIVARIATE、PROC CHART、またはPROC GCHARTを使用してヒストグラムを作成できます。

SAS Proc Sortデータセットの概念を探る

SAS一変量プロシージャ

SASヒストグラムを作成する構文-

PROC UNIVARIATE DATA = DATASET;HISTOGRAM variables / options;RUN;

PROC UNIVARIATEでSAS Histogram statementを使用すると、グラフィカル表示で定量的変数の全体的な分布を迅速かつ簡単に確認することができます。

SASでは、PROC UNIVARIATE文の後に任意の数のヒストグラム文を使用できます。 SASヒストグラムステートメントのコンポーネントは次のとおりです。

変数

これは、SASヒストグラムを作成するために使用されます。 VAR文またはHISTOGRAM文で変数を指定しない場合、デフォルトでは、DATA=データ-セット内の各数値変数に対してヒストグラムが作成されます。 VAR文を使用し、HISTOGRAM文に変数を指定しない場合、デフォルトでは、VAR文にリストされている各変数に対してヒストグラムが作成されます。

知っていますか? -SASがデータセットをマージする方法

たとえば、Steelという名前のデータセットに、LengthとWidthという名前の数値変数が正確に2つ含まれているとします。 次のステートメントは、長さと幅の二つのヒストグラムを作成します:

proc univariate data=Steel; histogram;run;

同様に、次のステートメントは、長さと幅のヒストグラムを作成します:

proc univariate data=Steel; var Length Width; histogram;run;

次のステートメントは、長さのみのヒストグラムを作成します:

proc univariate data=Steel; var Length Width; histogram Length;run;

オプション

ヒストグラムに機能を追加します。 SAS HISTOGRAM文のスラッシュ(/)の後にすべてのオプションを指定します。

たとえば、次のステートメントでは、NORMALオプションはヒストグラムに近似法線曲線を表示し、MIDPOINTS=オプションはヒストグラムの中点を指定し、CTEXT=オプションはテキ:

proc univariate data=Steel; histogram Length / normal midpoints = 5.6 5.8 6.0 6.2 6.4 ctext = blue;run;

正規曲線を使用したSASヒストグラム

まず、重み変数の単純なSASヒストグラムを作成しましょう。 組み込みのデータセットsashelpを使用します。クラス:

TITLE 'Summary of Weight Variable (in pounds)'; PROC UNIVARIATE DATA = sashelp.class NOPRINT;HISTOGRAM weight / NORMAL; RUN;

SAS Histogram文には、複数の分析変数を含めることができます。 各変数には、SASに個別のヒストグラムがあります。 NOPRINTオプションは、要約統計量を抑制し、NORMALオプションは、通常の曲線を提示します。

Normal Curveを使用したSASヒストグラム

Must Learn–SASプログラムの重要な構造

さまざまなカスタマイズ可能なオプションを使用したSASヒストグラム

SAS histogram statementを使用すると、

1. ヒストグラムの色を塗りつぶすためのCFILLオプションと、要約統計のボックスをグラフに直接挿入するためのINSETステートメントを追加できます。

2. デフォルトでは、グラフ内のインセットbo内のテキストのフォントはFONT=SIMPLEXです。

3. MIDPOINTS=オプションは、ヒストグラムの中点

4を指定します。 CTEXT=オプションは、テキストの色を指定します。

PROC UNIVARIATE DATA = sashelp.class;HISTOGRAM weight / NORMAL CFILL = ltgray;INSET N = 'Number of students' MEDIAN (8.2) MEAN (8.2) STD='Standard Deviation' (8.3) / POSITION = ne;RUN;

異なるカスタマイズ可能なオプションを持つSASヒストグラム

上のグラフは、異なるカスタマイズ可能なオプションを持つSASヒストグラムを示しています

概要

SASヒストグラムを設計する二つの方法を見ました。 SASには、テキストスタイル、色、オプションのリポジトリがあり、ヒストグラムに追加して読みやすくすることができます。 SASヘルプディレクトリでそれらを調べることができます。