Utiliser Excel pour gérer des bases de données historiques
Quelques "trucs"
Cette page ne prétend pas au statut de tutoriel, ce qui serait d’ailleurs rendu vain par les différences entre versions. Il ne s’agit pas non plus d’une publicité pour Microsoft, mais il faut bien « faire avec » l’équipement de la plupart des historiens. Même si la plupart de ces conseils semblent transposables sur le tableur d’Openoffice.org.
Voici donc quelques fonctions utiles et souvent peu connues de l’outil. Peu connues notamment parce qu’elles ont des noms bizarres. Reste, pour vous, à chercher où elles sont dans les menus ou à aller voir dans l’aide comment les utiliser...
Préalables généraux
Voir aussi, pour une présentation très claire de l’environnement de travail (avec captures d’écran), le début de ce tutoriel.
- Une case d’un tableau Excel s’appelle « Cellule » pour le logiciel.
- Le bon endroit pour voir ce qui est écrit dans une cellule et pour le modifier, ce n’est pas la cellule elle-même (simple lieu de sélection et d’affichage des résultats), c’est la barre horizontale située au-dessus du tableau et sous les boutons (avec fx écrit à gauche). C’est crucial si vous voulez utiliser des formules, mais c’est de bonne méthode dans tous les cas.
- Pour sélectionner une ligne ou une colonne entière, cliquer sur la case à gauche du début de la ligne ou au-dessus du début de la colonne, cases qui portent des chiffres ou des lettres. Pour sélectionner une feuille de calcul entière, cliquer sur la case tout en haut à gauche du tableau, entre la case « 1 » et la case « A ».
- Penser très souvent aux menus contextuels, adaptés à l’objet sélectionner (clic droit sur PC, Ctrl+clic sur Mac récent).
- À connaître, les fonctions de copie automatique/incrémentation. Sélectionner une cellule, se placer au coin en bas à droite (le pointeur change de forme) et draguer vers le bas ou la droite (draguer = cliquer, garder appuyé, déplacer, lâcher). Selon les cas, Excel remplit les cellules avec le même contenu ou il utilise la fonction Incrémenter (1, 2, 3, 4, voire 1, 3, 5, 7 ou 1, 10, 100, 1000 si vous avez judicieusement rempli et sélectionné deux cellules au départ et non pas une). Pour passer de l’une à l’autre de ces deux fonctions si Excel a mal anticipé vos intentions, voir le menu contextuel obtenu quand on est sur ce fameux coin en bas à droite.
- Penser à utiliser la fonction « Commentaire » (probablement dans le menu Insertion) qui permet d’ajouter une petite bulle indiquant par exemple la source d’une information, ou encore vos choix de codage ou de saisie.
- Pour ajouter des colonnes ou des lignes au milieu de colonnes ou de lignes existantes, sélectionner le nombre de colonnes/lignes correspondant au nombre que vous voulez ajouter, à droite ou en dessous de l’endroit où vous voulez les ajouter. Puis agir sur le menu contextuel (Insertion) ou aller chercher la fonction dans les menus déroulants. Cela fonctionne aussi pour ajouter des cellules (= moins qu’une ligne ou une colonne entières). Dans ce cas, on vous demande dans quel sens décaler les cellules existantes.
- Pour scinder l’information contenue dans une colonne. Si vous n’avez pas suivi nos « Dix Commandements de la saisie » (vous avez bien tort... voir le « Repères » !) et que vous vous retrouvez avec une colonne donnant à la fois noms et prénoms, ou jours, mois et années pour une date, ou un événement et sa date... Tout n’est pas perdu si vous avez structuré l’information dans la colonne, ie par exemple si les noms sont toujours avant les prénoms et qu’ils sont séparés par un espace, ou si les jours sont toujours avant les dates et qu’ils sont séparés par un / ou un tiret. Pour vous en sortir, voir ce tutoriel en ligne. Nous ne connaissons pas encore l’équivalent de cette fonction sous Openoffice.org...
Questions d’affichage et d’impression
- Quand on a trop de colonnes et/ou de lignes : penser à « Figer les volets » (menu Fenêtre, a priori). Cela permet de garder fixes les lignes/colonnes avec les intitulés (noms des individus, des variables...) tout en faisant défiler le reste.
- Il existe une sorte d’équivalent pour l’impression : si le tableau imprimé fait plus d’une page, cela permet de faire répéter automatiquement sur chaque page une ou plusieurs lignes ou colonnes (noms des individus, des variables...). La fonction s’appelle « Titres à imprimer ». Dans les versions que je connais, ça se trouve dans Fichier/Mise en page, onglet « Feuille ».
- Retour à l’affichage : quand on multiplie les colonnes (cf. les « Dix Commandements » de notre « Repères » !), on a parfois envie d’en cacher certaines. C’est ce que permet un menu contextuel obtenu une fois sélectionnées la/les colonnes/lignes à cacher, sous le nom « Masquer ». On le trouve aussi dans les menus déroulants. Si vous ne voulez plus masquer, il faut faire « Afficher » : soit après avoir sélectionné toute la feuille de calcul (toutes les lignes et colonnes s’affichent), soit après avoir sélectionné les lignes ou colonnes qui sont autour de la/les lignes/colonnes masquées que vous voulez ré-afficher.
- Retour à l’impression : pour n’imprimer qu’une partie du tableau, faire avant d’aller dans l’Aperçu avant impression « Zone d’impression/définir ». Si vous voulez de nouveau imprimer tout, il suffit de sélectionner toute la feuille et de la définir comme zone d’impression.
- Problèmes de cadrage du tableau dans la page : penser à l’option « Ajuster à x pages en largeur et y en hauteur », accessible dans le menu de Mise en page, onglet Page (à ma connaissance, on y accède soit dans le menu Fichier, soit à partir de l’Aperçu avant impression). Il permet comme son nom l’indique de dire combien de pages vous voulez à l’arrivée. Il faut un peu d’habitude pour voir à partir de quel % de réduction le résultat est trop petit pour être lisible…
Exploration d’une base de données
- Trois fonctions clés, qui sont normalement dans le menu « Données » : Tri, Filtre, Tableau croisé dynamique (la fonction s’appelle même « Rapport de tableau croisé dynamique »… il s’agit de bien tableaux croisés, tout simplement : ils sont utilisés pour savoir par exemple combien de personnes sont à la fois des femmes et des jeunes, ou encore des membres de la Chambre de commerce et des banquiers).
- Tri : bien penser à sélectionner toute la feuille avant de trier. Penser à la case qui permet de dire que la première ligne contient les intitulés des variables, sans quoi elle aussi se retrouve triée. Penser à l’utilité du tri pour le recodage : regrouper les modalités identiques permet rapidement de les recoder (soit toutes ensembles soit séparément).
- Parfois, un problème de tri se produit parce qu’Excel trie vos nombres comme du texte (par « ordre alphabétique » : 1, 10, 101, 2…). Cela peut se résoudre en lui disant explicitement qu’il s’agit de nombres, dans Format/Cellule. À propos, il faut lui interdire d’utiliser le format « Date » qu’il croit parfois reconnaître (ça marche très mal, et pas du tout pour les dates d’avant le xxe siècle…).
- Filtre : permet d’agir non seulement sur ce qui est écrit au début d’une cellule comme le tri, mais aussi de repérer les cellules contenant tel ou tel mot ou suite de caractères. Le « Filtre automatique » suffit à la plupart des usages (il offre la fonction « Personnaliser »). Quand vous avez filtré, les lignes non concernées n’ont pas disparu, elles sont simplement masquées.
- Tableau croisé dynamique : dans les dernières versions d’Excel, penser à cliquer sur la case « Disposition… » dans la dernière boîte de dialogue, ce qui vous permet de construire votre tableau avant de le visualiser, plutôt que l’inverse… Pour plus de détails sur cette fonction, voir ici. Et sur les tris et filtres, on peut utiliser ce tutoriel.
Varia
- Pour les graphiques (ainsi que pour le calcul de taux de croissance, moyennes, indices...), on vous renvoie à un petit tutoriel fait autrefois pour des étudiants en DEUG par Claire Lemercier. À savoir surtout que les graphiques produits « par défaut » sont très laids, mais que tout peut se corriger par le recours aux menus contextuels (en cliquant sur chaque élément du graphique : axes, titres, légendes, etc.). On peut regarder aussi un manuel assorti d’un site fournissant des exemples.
- Parfois, les copier-coller donnent des résultats bizarres parce que vous avez cru copier un résultat, mais que vous avez copié une formule (une opération à faire). Soit une formule créée par vous, soit les formules contenues « naturellement » dans les Tableaux croisés dynamiques. Pour ne copier que le résultat, il faut faire classiquement « couper » ou « copier », mais au lieu de faire « coller », faire « Collage spécial » (à aller chercher dans le menu Édition ou dans le menu contextuel). Là, vous pouvez choisir de ne copier que les « Valeurs ». C’est à faire dès que vous êtes sûrs de ne plus vouloir modifier les résultats obtenus : c’est plus sûr.
- Le Collage spécial permet également (option à cocher en bas de la boîte de dialogue) de « transposer », c’est-à-dire de transformer les lignes en colonnes ou réciproquement. C’est parfois très utile.
- Pour faire faire des calculs à Excel, même si vous n’êtes pas un crack, essayez de cliquer sur le fx susmentionné, ou bien de faire Insertion/Fonction (c’est la même chose). Vous verrez, l’Assistant (boîtes de dialogue) vous tient la main et vous arriverez vite à faire des moyennes, ou encore à concaténer (mettre bout à bout le contenu de deux colonnes, par exemple pour fabriquer « nom et prénom » à partir de « nom » et « prénom »), faire des sommes, etc. Cela dit, Excel comprend aussi les symboles mathématiques classiques +, -, / et * (et les parenthèses pour les priorités). Il suffit de commencer le contenu d’une cellule par « = », de poser l’opération et de finir en frappant sur Entrée pour obtenir un résultat. C’est très utile pour obtenir des âges à partir de dates de naissance, par exemple. Cela dit, l’utilisation des références absolues ou relatives, qui permet beaucoup d’économies d’énergie, n’est pas forcément triviale. Sur ce sujet, voir le milieu du tutoriel associé au manuel de Jacques Cellier, Martine Cocaud, Traiter des données historiques. Méthodes statistiques/ techniques informatiques, Presses Universitaires de Rennes, 2001.
- Pour recoder, penser à la fonction « Remplacer ». En particulier, il est possible de remplacer toutes les cellules vides d’une certaine zone par « 0 » ou « non renseigné » par exemple. Penser pour cela à la case à cocher « Totalité du contenu de la cellule » de la boîte de dialogue « Remplacer » (cette case s’obtient, chez moi, en cliquant d’abord sur « Options>> »).
- Exemple, parmi tant d’autres, de fonctions utiles : la fonction ALEA.