Temps ~ variable en fonction du volume de données et de leur propreté initiale : 1h – 10h
Si cette étape est bien réalisée l’analyse des données sera très rapide et facile.
De plus il sera beaucoup plus facile de trouver une personne apte à vous aider pour les statistiques si votre base de données est prête à être analysée. L’étape de data management est la partie la plus chronophage, la moins plaisante à réaliser et pourtant la plus importante.
Voici les points clés :
- Un seul tableau par page Excel.
- Le nom des colonnes est renseigné sur la première ligne.
- Pas de colonnes entièrement vide, pas de lignes entièrement vides.
- Une colonne du classeur Excel = une variable = un nom unique.
- Pour le nom des variables :
- Commence par une lettre
- Pas d’espaces : on remplace les espaces par des _
- Pas d’accents
- Court mais explicite [prendre le temps pour faire ce travail]
- Pour le contenu des colonnes
- Les données manquantes : laisser vide
- Dates : choisir un format unique [21/03/2022, 21-03-2022, 2022/03/21 …]. Pour vous faciliter la tâche, écrivez les dates en chiffre uniquement.
- Variables qualitatives à plusieurs modalités (ex : le mode de respiration, le nom de médicament…) :
- Assigner une seule écriture à chaque modalité : ventilation spontanée ≠ vent. spontanée ≠ vs ≠ VS
- Limiter le nombre de modalité possible à 4 ou 5 maximum [= Nécessite un travail de réflexion pour regrouper des classes]. Vous pouvez garder la colonne d’origine pour éviter de perdre un niveau de précision mais dans la majorité des cas cette variable ne pourra pas être analysée si elle comporte trop de modalités.
- Variables qualitative à deux modalités (ex : sexe, hta ?, décès_m12 ?) :
- Valeur en 0 ou 1
- 0 : homme / 1 : femme,
- 0 : pas d’hta / 1 : hta présent
- Valeur en 0 ou 1
- Variables quantitatives (ex : le dosage d’un médicament, le poids du patient …)
- Que du chiffre (pas de texte dans les cellules de votre classeur Excel)
- S’il s’agit de chiffre à virgules : n’utiliser que la virgule dans Excel
Si vous voulez garder des commentaires pour vos variables (par exemple pour garder une trace de la raison de telle ou telle valeur manquante) vous pouvez créer une colonne ‘commentaire_’ Cette donnée ne sera pas analysée mais vous pourrez garder trace de vos explications)
FIN