Les analyses statistiques avec R 

Cours les analyses statistiques avec R , tutoriel & guide de travaux pratiques en pdf.

Quelques concepts avant de demarrer

Une fois R installe sur votre ordinateur, il su t de lancer l’executable correspondant pour demarrer le programme. L’attente de commandes (par defaut le symbole ‘>’) apparait alors indiquant que R est pr^et a executer les commandes. Sous Windows en utilisant le programme Rgui.exe, certaines commandes (acces a l’aide, ouverture de chiers, . . .) peuvent ^etre executees par les menus. L’utilisateur novice a alors toutes les chances de se demander Je fais quoi maintenant ? > Il est en e et tres utile d’avoir quelques idees sur le fonctionnement de R lorsqu’on l’utilise pour la premiere fois : c’est ce que nous allons voir maintenant.
Nous allons dans un premier temps voir schematiquement comment R tra-vaille. Ensuite nous decrirons l’operateur < assigner > qui permet de creer des objets, puis comment gerer les objets en memoire, et nalement comment utiliser l’aide en ligne qui est extr^emement utile dans une utilisation courante.

Comment R travaille
Le fait que R soit un langage peut e rayer plus d’un utilisateur potentiel pensant < Je ne sais pas programmer >. Cela ne devrait pas ^etre le cas pour deux raisons. D’abord, R est un langage interprete et non compile, c’est-a-dire que les commandes tapees au clavier sont directement executees sans qu’il soit besoin de construire un programme complet comme cela est le cas pour la plupart des langages informatiques (C, Fortran, Pascal, . . .).
Ensuite, la syntaxe de R est tres simple et intuitive. Par exemple, une regression lineaire pourra ^etre faite avec la commande lm(y ~ x). Avec R, une fonction, pour ^etre executee, s’ecrit toujours avec des parentheses, m^eme si elles ne contiennent rien (par exemple ls()). Si l’utilisateur tape le nom de la fonction sans parentheses, R a chera le contenu des instructions de cette fonction. Dans la suite de ce document, les noms des fonctions sont generalement ecrits avec des parentheses pour les distinguer des autres objets sauf si le texte indique clairement qu’il s’agit d’une fonction.
Quand R est utilise, les variables, les donnees, les fonctions, les resultats, etc, sont stockes dans la memoire de l’ordinateur sous forme d’objets qui ont chacun un nom. L’utilisateur va agir sur ces objets avec des operateurs (arithmetiques, logiques, de comparaison, . . .) et des fonctions (qui sont elles-m^emes des objets).
Les arguments peuvent ^etre des objets (< donnees >, formules, expressions,. .) dont certains peuvent ^etre de nis par defaut dans la fonction ; ces valeurs par defaut peuvent ^etre modi ees par l’utilisateur avec les options. Une fonc-tion de R peut ne necessiter aucun argument de la part de l’utilisateur : soit tous les arguments sont de nis par defaut (et peuvent ^etre changes avec les options), ou soit aucun argument n’est de ni. On verra plus en detail l’utilisa-tion et la construction des fonctions (p. 72). La presente description est pour le moment su sante pour comprendre comment R opere.
Toutes les actions de R sont e ectuees sur les objets presents dans la memoire vive de l’ordinateur : aucun chier temporaire n’est utilise (Fig. 1). Les lectures et ecritures de chiers sont utilisees pour la lecture et l’enregistre-ment des donnees et des resultats (graphiques, . . .). L’utilisateur execute des fonctions par l’intermediaire de commandes. Les resultats sont a ches direc-tement a l’ecran, ou stockes dans un objet, ou encore ecrits sur le disque (en particulier pour les graphiques). Les resultats etant eux-m^emes des objets, ils peuvent ^etre consideres comme des donnees et ^etre analyses a leur tour. Les chiers de donnees peuvent ^etre lus sur le disque de l’ordinateur local ou sur un serveur distant via internet.
Les fonctions disponibles sont stockees dans une bibliotheque localisees sur le disque dans le repertoire R HOME/library (R HOME designant le repertoire ou R est installe). Ce repertoire contient des packages de fonctions, eux-m^emes presents sur le disque sous forme de repertoires. Le package nomme base est en quelque sorte le c ur de R et contient les fonctions de base du langage, en particulier pour la lecture et la manipulation des donnees. Chaque pa-ckage a un repertoire nomme R avec un chier qui a pour nom celui du package (par exemple, pour base, ce sera le chier R HOME/library/base/R/base). Ce chier contient les fonctions du package.
Une des commandes les plus simples consiste a taper le nom d’un objet pour a cher son contenu. Par exemple, si un objet n contient la valeur 10 : n [1] 10
Le chi re 1 entre crochets indique que l’a chage commence au premier element de n. Cette commande est une utilisation implicite de la fonction print et l’exemple ci-dessus est identique a print(n) (dans certaines situations, la fonction print doit ^etre utilisee de facon explicite, par exemple au sein d’une fonction ou d’une boucle).
Le nom d’un objet doit obligatoirement commencer par une lettre (A{Z et a{z) et peut comporter des lettres, des chi res (0{9), des points (.) et des ‘espaces soulignes’ ( ). Il faut savoir aussi que R distingue, pour les noms des objets, les majuscules des minuscules, c’est-a-dire que x et X pourront servir a nommer des objets distincts (m^eme sous Windows).
L’appel de l’aide ouvre une page (le comportement exact depend du systeme d’exploitation) avec sur la premiere ligne des informations generales dont le nom du package ou se trouvent la (ou les) fonction(s) ou les operateurs docu-mentes. Ensuite vient un titre suivi de paragraphes qui chacun apporte une information bien precise.

Description: breve description
Usage: pour une fonction donne le nom avec tous ses arguments et les even-tuelles options (et les valeurs par defaut correspondantes) ; pour un operateur donne l’usage typique.
Arguments: pour une fonction detaille chacun des arguments.
Details: description detaillee.
Value: le cas echeant, le type d’objet retourne par la fonction ou l’operateur.
See Also: autres rubriques d’aide proches ou similaires a celle documentee.
Examples: des exemples qui generalement peuvent ^etre executes sans ouvrir l’aide avec la fonction example.
Pour un debutant, il est conseille de regarder le paragraphe Examples. En general, il est utile de lire attentivement le paragraphe Arguments. D’autres paragraphes peuvent ^etre rencontres, tel Note, References ou Author(s).
Une recherche par mots-clefs est possible avec cette aide html. La rubrique See Also contient ici des liens hypertextes vers les pages d’aide des autres fonctions. La recherche par mots-clefs est egalement possible depuis R avec la fonction help.search. Cette derniere recherche un theme, speci e par une cha^ne de caractere, dans les pages d’aide de tous les packages installes. Par exemple, help.search(« tree ») a chera une liste des fonctions dont les pages d’aide mentionnent < tree >. Notez que si certains packages ont ete installes recemment, il peut ^etre utile de rafra^chir la base de donnees utilisee par help.search en utilisant l’option rebuild (help.search(« tree », rebuild = TRUE)).

Les objects
Nous avons vu que R manipule des objets : ceux-ci sont caracterises bien s^ur par leur nom et leur contenu, mais aussi par des attributs qui vont speci er le type de donnees represente par un objet. A n de comprendre l’utilite de ces attributs, considerons une variable qui prendrait les valeurs 1, 2 ou 3 : une telle variable peut representer une variable entiere (par exemple, le nombre d’ ufs dans un nid), ou le codage d’une variable categorique (par exemple, le sexe dans certaines populations de crustaces : m^ale, femelle ou hermaphrodite).
Il est clair que le traitement statistique de cette variable ne sera pas le m^eme dans les deux cas : avec R, les attributs de l’objet donnent l’information necessaire. Plus techniquement, et plus generalement, l’action d’une fonction sur un objet va dependre des attributs de celui-ci.
Les objets ont tous deux attributs intrinseques : le mode et la longueur. Le mode est le type des elements d’un objet ; il en existe quatre principaux : numerique, caractere, complexe7 , et logique (FALSE ou TRUE). D’autres modes existent qui ne representent pas des donnees, par exemple fonction ou expres-sion. La longueur est le nombre d’elements de l’objet. Pour conna^tre le mode et la longueur d’un objet on peut utiliser, respectivement.

1 Préambule 
2 Quelques concepts avant de demarrer 
2.1 Comment R travaille
2.2 Creer, lister et eacer les objets en memoire
2.3 L’aide en ligne
3 Les donnees avec R 
3.1 Les objects
3.2 Lire des donnees dans un chier
3.3 Enregistrer les donnees
3.4 Generer des donnees
3.5 Manipuler les objets
4 Les graphiques avec R 
4.1 Gestion des graphiques
4.2 Les fonctions graphiques
4.3 Les fonctions graphiques secondaires
4.4 Les parametres graphiques
4.5 Un exemple concret
4.6 Les packages grid et lattice
5 Les analyses statistiques avec R 
5.1 Un exemple simple d’analyse de variance
5.2 Les formules
5.3 Les fonctions generiques
5.4 Les packages
6 Programmer avec R en pratique 
6.1 Boucles et vectorisation
6.2 Ecrire un programme en R
6.3 Ecrire ses fonctions
7 Litterature sur R

Cours gratuitTélécharger le cours complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *