R pour Statistique

«Le logiciel libre n’a pas de prix, mais il a une grande valeur, comme l’eau, l’air ou les mathématiques.» Pierre Cohen-Bacrie

2015-04-04 09_03_31-R_ The R Project for Statistical Computing R est un logiciel de statistique, gratuit et au nombre illimité de licences, qui représente une alternative libre à SPSS et à SAS pour l’enseignement et l’apprentissage. Avec une interface graphique conviviale comme R Commander, il n’y a pas d’obstacle à utiliser R.

R est un logiciel libre, sous licence GPL, destiné à l’analyse statistique, qui fonctionne sous GNU/Linux, Windows et Mac OS X. Ce logiciel a connu une progression fulgurante depuis le début des années 2000. Bien que des logiciels commerciaux comme SPSS et SAS conservent sans doute une longueur d’avance dans la recherche, R se rapproche de la position de tête.  Il offre également de nombreux outils qui ne peuvent que profiter à l’enseignement supérieur. C’est particulièrement vrai pour les établissements collégiaux québécois qui n’ont pas forcément les moyens d’acheter les licences de tous les logiciels non libres aux fins d’enseignement.

2015-09-17 20_08_38-Quick-R_ Home Page
Illustration de Quick R.

R est à la fois un logiciel d’analyse statistique et un langage de programmation. Il dispose également de très bonnes capacités de représentation graphique. Autour d’un noyau de statisticiens et de programmeurs, des centaines de bénévoles de partout dans le monde s’activent à perfectionner et à étendre les fonctionnalités de ce logiciel.

La valeur ajoutée des modules

R est un logiciel de type modulaire. On installe une version de base qui comprend un répertoire étendu de commandes relatives à la manipulation de fichiers de données, à des fonctions statistiques et graphiques et à des opérations de programmation. L’usager peut ensuite enrichir cette version en puisant dans une banque de modules appelés packages. Ces modules couvrent une extraordinaire variété de techniques d’analyse dans des disciplines fort variées : sciences économiques, sociologie, linguistique, biologie, administration, médecine, etc. Au moment où ces lignes sont écrites, il y a 7176 packages disponibles sur le site officiel. Le logiciel R dépasse de très loin les ressources des logiciels commerciaux d’analyse statistique.

De la ligne de commande aux menus déroulants

2015-09-18 18_32_34-R-relu-bis.docx [Lecture seule] [Mode de compatibilité] - Word

Le logiciel R est un logiciel en lignes de commande. Pour se servir de R, il faut taper des commandes dans une fenêtre. Son interface graphique de base est plutôt rudimentaire.  L’apprentissage de R requiert de maîtriser le vocabulaire et la syntaxe des commandes. L’apprentissage initial de R exige donc plus d’efforts que d’utiliser les menus déroulants et les clics d’une souris. Noter que RStudio, logiciel de la famille R, offre une interface beaucoup plus riche.

2015-09-17 20_23_36-Rcmdr.com

Cependant, pour le novice qui ne voudrait pas s’astreindre à maîtriser la logique des commandes, il existe des interfaces graphiques avec des menus déroulants plus développés. L’interface la plus connue est R Commander, disponible avec le package Rcmdr. R Commander donne accès à des tests statistiques et à des graphiques qui rivalisent avec la version de base de SPSS.

Valeur de R pour la recherche

Le fait que R soit également un langage de programmation ouvre plusieurs possibilités. Le chercheur peut automatiser des procédures répétitives. Le chercheur peut modifier les fonctions statistiques et graphiques déjà disponibles dans R et les combiner pour leur faire épouser les besoins de son domaine de recherche. Il peut mettre en application des avancées théoriques en mathématiques et en statistiques. Éventuellement, le chercheur peut rendre son travail disponible sous forme de package. Ces remarques ne doivent pas laisser entendre que le chercheur qui entreprend l’apprentissage de R est destiné, toute sa carrière durant, à passer de longues heures à rédiger des scripts pour en tirer un certain bénéfice. Passé la période initiale d’apprentissage, le chercheur utilise un certain répertoire de scripts, qu’il a composés lui-même ou qu’il a tout simplement empruntés. Le plus souvent, il applique «mécaniquement» ces scripts à de nouveaux jeux de données. Toutefois, il conserve toujours le loisir d’affiner ses analyses et donc de modifier ses scripts.

R Commander rend l’utilisation de R conviviale

Comme nous l’avons dit en début de texte, avec une interface graphique plus conviviale comme R Commander, il est possible d’utiliser R pour l’enseignement. Outre la production des analyses statistiques et des graphiques, R Commander a la grande qualité de générer les scripts correspondants. L’étudiant ou même l’utilisateur autodidacte peut alors bénéficier d’un aperçu du vocabulaire et de la syntaxe de R.

R dans l’enseignement supérieur

  • Cours universitaire en français, complet, sur R – Lyon, depuis 2009, mis à jour : http://j.mp/-lyonR

paris-sud-

  • Un aide-mémoire qui va à l’essentiel (en anglais), Quick-R: http://www.stamethods.net/index.html
  • L’ouvrage de référence en français: P. Lafaye de Micheaux et al., Le logiciel R, Paris, Springer, 2011, 488 p.
  • A contrario, dans l’enseignement supérieur, acquérir de nouvelles versions ou modules de SPSS à des milliers de dollars par année serait, du point de vue de Richard Stallman, «payer pour sa servitude volontaire» 🙂

Télécharger R en français

http://cran.univ-lyon1.fr/ Dept. of Biometry & Evol. Biology, University of Lyon
http://mirror.ibcp.fr/pub/CRAN/ CNRS IBCP, Lyon
http://ftp.igh.cnrs.fr/pub/CRAN/ Institut de Genetique Humaine, Montpellier
http://cran.irsn.fr/ French Nuclear Safety Institute, Paris
http://cran.univ-paris1.fr/ Université Paris 1 Panthéon-Sorbonne
[NDLR : voir aussi l’article sur PSPP]

Dans l’article qui lui est consacré dans le New-York Times, Robert Ihaka déclare: “R is a real demonstration of the power of collaboration, and I don’t think you could construct something like this any other way,”  “We could have chosen to be commercial, and we would have sold five copies of the software.” Source.

Michel Lalonde
Professeur de sociologie au Cégep du Vieux-Montréal
Article publié le 30 septembre 2016 et mis à jour le 5 juin 2018

 

Cet article, comme tous les articles publiés par Logilibre (sauf indication contraire) est sous licence Creative Commons CC BY-SA 3.0. Paternité – Partage à l’Identique 3.0 non transposé.

Hits: 19640