Déclaration d’histogramme SAS avec Procédure UNIVARIÉE et courbe normale
L’aspect le plus important de l’analyse des données est une représentation des données sous forme de graphiques et de tableaux. Aujourd’hui, nous allons examiner comment représenter nos données sous la forme d’un histogramme en langage de programmation SAS. En plus de cela, nous examinerons également les différentes fonctions et paramètres qui peuvent être ajoutés à notre histogramme SAS pour le rendre plus facile à comprendre. Nous étudierons également la courbe normale de l’histogramme univarié PROC.
Commençons par les instructions d’histogramme SAS.
Restez à jour avec les dernières tendances technologiques
Rejoignez DataFlair sur Telegram!!
Qu’est-ce que l’histogramme SAS?
En statistiques, un histogramme est un affichage graphique de la fréquence tabulée. L’histogramme SAS diffère d’un graphique à barres en ce sens que c’est l’aire de la barre qui indique la valeur, pas la hauteur. Les histogrammes dans SAS vous permettent d’explorer vos données en affichant la distribution d’une variable continue (pourcentage d’un échantillon) par rapport aux catégories de la valeur. Vous pouvez obtenir la forme de la distribution et les données sont distribuées symétriquement. Dans SAS, les histogrammes peuvent être produits à l’aide de PROC UNIVARIATE, de PROC CHART ou de PROC GCHART.
Explorer le concept d’ensembles de données de tri SAS Proc
Procédure UNIVARIÉE SAS
La syntaxe de création d’un histogramme SAS-
PROC UNIVARIATE DATA = DATASET;HISTOGRAM variables / options;RUN;
Avec l’utilisation de l’instruction d’histogramme SAS dans PROC UNIVARIATE, nous pouvons avoir un moyen rapide et simple de revoir la distribution globale d’une variable quantitative dans un affichage graphique.
Vous pouvez utiliser n’importe quel nombre d’instructions d’histogramme dans SAS après une instruction UNIVARIÉE PROC. Les composants de l’instruction d’HISTOGRAMME SAS sont :
Variables
Ceci est utilisé pour créer des histogrammes SAS. Si vous ne spécifiez pas de variables dans une instruction VAR ou dans l’instruction HISTOGRAM, un histogramme est créé par défaut pour chaque variable numérique de l’ensemble DATA=data. Si vous utilisez une instruction VAR et que vous ne spécifiez aucune variable dans l’instruction HISTOGRAM, un histogramme est créé par défaut pour chaque variable répertoriée dans l’instruction VAR.
Le Savez-vous ? – Comment SAS fusionne les ensembles de données
Par exemple, supposons qu’un ensemble de données nommé Steel contient exactement deux variables numériques nommées Longueur et Largeur. Les instructions suivantes créent deux histogrammes, l’un pour la longueur et l’autre pour la Largeur:
proc univariate data=Steel; histogram;run;
De même, les instructions suivantes créent des histogrammes pour la Longueur et la largeur:
proc univariate data=Steel; var Length Width; histogram;run;
Les instructions suivantes créent un histogramme pour la longueur uniquement:
proc univariate data=Steel; var Length Width; histogram Length;run;
Options
Il ajoute des fonctionnalités à l’histogramme. Spécifiez toutes les options après la barre oblique (/) dans l’instruction d’HISTOGRAMME SAS.
Par exemple, dans les instructions suivantes, l’option NORMALE affiche une courbe normale ajustée sur l’histogramme, l’option MIDPOINTS= spécifie les points médians de l’histogramme et l’option CTEXT= spécifie la couleur du texte:
proc univariate data=Steel; histogram Length / normal midpoints = 5.6 5.8 6.0 6.2 6.4 ctext = blue;run;
Histogramme SAS avec Courbe normale
Commençons par créer un histogramme SAS simple de la variable de POIDS. Nous utiliserons l’ensemble de données intégré sashelp.classe:
TITLE 'Summary of Weight Variable (in pounds)'; PROC UNIVARIATE DATA = sashelp.class NOPRINT;HISTOGRAM weight / NORMAL; RUN;
Nous pouvons avoir plus d’une variable d’analyse dans l’instruction d’histogramme SAS. Chaque variable aura un histogramme séparé dans SAS. L’option NOPRINT supprime les statistiques récapitulatives, l’option NORMALE présente une courbe normale.
Doit apprendre – Structure importante du programme SAS
Histogramme SAS avec différentes options Personnalisables
Avec l’instruction d’histogramme SAS, différentes options peuvent être ajoutées aux éléments suivants:
1. Nous pouvons ajouter l’option CFILL pour remplir la couleur de l’histogramme et insérer une boîte des statistiques récapitulatives directement dans le graphique.
2. Par défaut, la police du texte dans l’encart bo à l’intérieur du graphique est FONT=SIMPLEX.
3. L’option MIDPOINTS= spécifie les midpoints pour l’histogramme,
4. L’option CTEXT= spécifie la couleur du texte.
Exemple-
PROC UNIVARIATE DATA = sashelp.class;HISTOGRAM weight / NORMAL CFILL = ltgray;INSET N = 'Number of students' MEDIAN (8.2) MEAN (8.2) STD='Standard Deviation' (8.3) / POSITION = ne;RUN;
Le graphique ci-dessus montre l’histogramme SAS avec différentes options personnalisables
Résumé
Nous avons vu deux façons de concevoir l’histogramme SAS, l’une était basique, l’autre avec différentes options pour répondre à nos exigences. SAS dispose d’un référentiel de styles de texte, de couleurs, d’options qui peuvent être ajoutés à notre histogramme pour une meilleure lisibilité. Vous pouvez les parcourir dans le répertoire d’aide SAS.