Analyse factorielle : les logiciels
Les calculs
Il est possible d’utiliser des macros Excel pour faire une analyse factorielle. Certaines sont disponibles dans le commerce, comme celles jointes au livre de Jean-Pierre Georgin, Analyse interactive des données (ACP, AFC) avec Excel 2000, Rennes, Presses universitaires de Rennes, 2002. Cependant, comme le titre l’indique, ces macros ne réalisent pas d’ACM, bien plus utiles aux historiens (pour savoir pourquoi, voir notre « Repères » !).
FactoMineR
On se rabat donc le plus souvent sur les logiciels de statistique généralistes. Méfiance toutefois : l’ACM reste une méthode très française, et de ce fait, certains de ces logiciels, notamment SPSS, n’en proposent qu’une version « bridée », en particulier du côté des variables supplémentaires ou de la représentation des individus. Tant pour le caractère libre que pour la facilité d’usage, nous recommandons l’utilisation de R avec le package FactoMineR, dont l’installation est expliquée ici. Il produit des graphiques assez laids, mais il n’est pas très compliqué d’exporter les résultats pour faire les graphiques sous Excel, ou encore d’utiliser le module dédié dynGraph, comme décrit dans le tutoriel ci-dessous.
Vous pouvez télécharger ici un petit tutoriel pour l’ACM avec FactoMineR. Nouveauté de juin 2009 (en plus de quelques précisions et clarifications) : des éléments sur la façon de réaliser, en complément, des graphes en ellipses et des classifications automatiques. Nouveauté de janvier 2010 : présentation de dynGraph, unmodule graphique (et d’aide à l’interprétation) qui change beaucoup de choses...
À noter aussi : il existe maintenant un manuel dédié à FactoMineR, qui explique aussi des choses plus générales sur l’analyse factorielle et sur R. Voir ici.
DtmVic
Il existe un logiciel libre plutôt convivial réalisant entre autres plusieurs types d’analyses factorielles, téléchargeable sur la page de Ludovic Lebart (un des grands spécialistes de ces méthodes) : DtmVic. Merci à Jean-Claude Deroubaix qui nous a signalé ce logiciel. En attendant peut-être des explications plus circonstanciées, voici quelques premières impressions. Avantages :
- le logiciel est fourni avec des fichiers d’exemples et une aide très claire (mais en anglais) ;
- importation facile des données, notamment depuis Excel, avec peu de contraintes de forme (intitulés courts, mais qui peuvent être codés par des mots et pas seulement des chiffres) ;
- graphiques factoriels assez jolis et surtout multiples possibilités pour les visualiser et interpréter, y compris les ellipses de concentration – si on veut faire encore plus joli, on peut bien sûr toujours exporter les coordonnées et faire les graphiques ailleurs ;
- pour l’interprétation avancée, multiples possibilités de classification automatique, jusques et y compris les cartes de Kohonen ;
- logiciel à la fois plutôt facile à prendre en mains (boutons) et ouvert à des utilisations plus avancées (les programmes produits sont modifiables).
- DtmVic fait aussi de la lexicométrie ! (sans lemmatiser, bien sûr)
Inconvénients :
- par défaut, l’ajout de chiffres un peu disgracieux à la fin des noms de modalités (on peut le modifier manuellement dans le fichier « dictionnaire », sinon cela encombre les graphes) ;
- pas d’autres traitements que les analyses factorielles, classifications et lexicométrie (pas de régressions ni même de tris croisés ou encore de graphiques descriptifs) ;
- pas d’explication, même courte, dans le logiciel sur le sens des traitements effectués : il faut se référer aux manuels de statistiques pour les comprendre – l’auteur en a d’ailleurs produit de très bons.
Trideux
Il faut mentionner aussi le Trideux de Philippe Cibois, logiciel libre proposant des fonctions bien sympathiques (tableaux croisés, PEM, chi-2, etc.) en plus de l’analyse factorielle. Toutefois, la nécessité d’un codage numérique précis des données en amont le rend un peu moins ergonomique.
On ne peut, cela dit, que conseiller la lecture des deux billets de Philippe Cibois et Pierre Mercklé qui expliquent comment faire une analyse factorielle avec Trideux : ne serait-ce que parce que le second de ces billets explique très bien l’interprétation de l’analyse, l’intérêt de revenir à des tableaux croisés, etc.
Les représentations graphiques
Quelle que soit la manière dont vous avez obtenu les coordonnées (et contributions, etc.) de vos points, nous ne pouvons que recommander de réaliser les graphiques, pour la version à publier, sous Excel, grâce à la macro « ACM 97 », très facile d’emploi (ouvrez-la et vous comprendrez, même sans savoir ce qu’est une macro), très souple et qui produit des résultats à la fois clairs, voire jolis et publiables.