Analyser des données qualitatives à l’aide d’un CAQDAS

Si vous souhaitez vous appuyer sur une méthodologie qualitative pour votre mémoire (voir sur ce point le chapitre 7 de notre livre), la question de l’analyse des données risque fort de vous donner du fil à retordre. En effet, contrairement aux méthodes quantitatives, les protocoles d’analyse des données qualitatives sont relativement peu standardisés. Vous disposerez donc d’une certaine liberté pour adapter les différentes méthodes d’analyses aux enjeux spécifiques de votre mémoire.

Il ne s’agit pas ici de dire que les méthodes qualitatives sont moins rigoureuses que les méthodes quantitatives (gardez-vous bien de prendre partie sur cette question dans votre mémoire, vous risqueriez de froisser inutilement vos professeurs) mais d’affirmer que vous allez devoir faire des choix.

Le premier choix auquel vous allez devoir être confronté concerne la tradition d’analyse dans laquelle vous allez vous inscrire. Dans notre livre, nous distinguons d’une part les analyses thématiques qui reposent sur un codage des données (c’est à dire une organisation du contenu de ces dernières dans des catégories constituant une grille d’analyse) et d’autre part les analyses lexicales (qui reposent sur un dénombrement de la fréquence d’apparition de mots et d’associations de mots dans les données).

Les outils que nous allons passer en revue dans cet article sont – avant tout – des outils pouvant servir à réaliser des analyses thématiques. Ces logiciels sont souvent regroupés sous le terme générique de CAQDAS : Computer Assisted Qualitative Data Analysis Software. Comme leur nom l’indique, les CAQDAS ne réaliseront pas l’analyse des données à votre place mais vous proposeront des fonctionnalités pour gagner en efficacité et en finesse.

Il existe de nombreux logiciels appartenant à la catégorie des CAQDAS : NVivo, Atlas.ti, MaxQDA, Transana, Dedoose et QDA Miner sont les CAQDAS les plus connus. Ces produits proposent un socle de fonctionnalités relativement générique auquel vient s’ajouter des spécificités propres à chaque produit. Cet article vous permettra de comprendre à quoi servent les CAQDAS. Dans un autre billet, nous passerons en revue cinq produits afin que vous puissiez choisir celui qui sera le plus adapté pour votre mémoire.

Organisation des données

La collecte des données qualitatives est un exercice relativement facile. En effet, de nombreuses données qualitatives sont déjà disponibles sur Internet ou sur les réseaux sociaux. Peut-être seront-elles pertinentes pour votre mémoire (pensez aux interviews des personnalités politiques ou des dirigeants d’entreprises dans la presse, aux avis des consommateurs sur des sites de commerce en ligne, aux tweets ou aux messages postés sur Facebook, etc.) Il est également possible de réutiliser des données déjà collectées dans le cadre d’un travail antérieur à condition bien sûr que ces dernières soient adaptées à votre travail, que votre directeur de mémoire n’y voit pas d’objection et que vous citiez correctement le travail original (en vous assurant explicitement du consentement des auteurs).

Même dans le cas où vous collecteriez vous-même vos données (en réalisant des entretiens semi-directifs par exemple), vous serez souvent surpris de la facilité à accéder au terrain : la réalisation du mémoire et votre statut d’étudiant vous ouvriront de nombreuses portes.

Cette facilité à accumuler les données peut rapidement se transformer en piège : les données qualitatives sont volumineuses et peu structurées. Vous allez donc devoir faire preuve d’organisation et pourrez trouver dans votre CAQDAS préféré une aide précieuse.

La plupart des logiciels disponibles sur le marché permettent de traiter plusieurs formats de données : du texte (des retranscriptions de vos entretiens ou des notes d’observation par exemple) mais également des fichiers pdf (tels que des extraits de rapports annuels, des articles de presse ou des articles scientifiques), des vidéos, des sons, des images et des tableaux (qui peuvent par exemple avoir été compilés dans le cadre d’une enquête en ligne comprenant des questions ouvertes).

Les CAQDAS vous permettront d’organiser les données dans des dossiers et des sous-dossiers mais surtout, d’associer à chaque document des propriétés. Ainsi, si vos données consistent en des entretiens, vous pourrez associer à chaque retranscription une date de collecte, une durée ainsi que des informations relatives à l’âge au genre et à la profession de chaque répondant.

Reprenant une préconisation figurant dans la plupart des ouvrages de méthodologie consacrés à l’analyse des données qualitatives, les CAQDAS vous permettent enfin d’organiser vos documents de travail (mémos) pour tenir un journal de recherche, consigner vos procédures d’analyse, rédiger des résultats intermédiaires ou des synthèses de la littérature, etc.

Organisation des documents dans Atlas.ti 8 (version Mac)
Codage des données

Une fois que vous aurez importé et organisé les données dans votre projet, les CAQDAS vous permettront de réaliser le codage de ces dernières. Les outils mis à votre disposition seront plus flexibles qu’un tableau Excel. Ils vous permettront d’assigner un ou plusieurs codes à des paragraphes ou à des phrases issues des entretiens ou encore à des séquences tirées de vidéos ou de sons.

Il existe de nombreuses techniques de codage des données (voir notamment notre article sur les ouvrages incontournables pour analyser des données qualitatives) : les codes peuvent être définis a priori en fonction de la littérature sur votre sujet ou émerger au fur et à mesure de l’analyse, ils peuvent permettre de décrire les données (pour les organiser) ou renvoyer à des catégories plus conceptuelles, etc.

En règle générale, la grille d’analyse est organisée de façon hiérarchique (avec des codes et des sous-codes) mais ce n’est pas toujours le cas. Quelle que soit l’approche retenue, vous trouverez dans les CAQDAS une aide précieuse pour le codage. Ces outils sont en effet beaucoup plus flexibles que les logiciels de traitement de texte ou que les tableurs. Les codes peuvent être renommés, réorganisés, modifiés à n’importe quel moment sans perdre le bénéfice des analyses antérieures.

Codage des données dans NVivo 12 (version Windows)

Pour vous aider dans votre codage, les CAQDAS les plus avancés proposent des fonctionnalités reposant sur un dénombrement des mots et des expressions apparaissant dans les données. Contrairement aux logiciels de lexicométrie qui permettent de réaliser des analyses statistiques approfondies sur la base des fréquences de mots, ces outils n’ont cependant pas vocation à se substituer au codage réalisés par les analystes mais à l’alimenter en faisant apparaitre des pistes de travail qui n’avaient pas forcément été envisagées.

Nuage de mots dans Atlas.ti 8 (version Windows)

Certains logiciels tels que NVivo ou Atlas.ti proposent de prolonger le codage manuel par des fonctionnalités d’automatisation du codage. Il est ainsi possible de demander aux logiciels d’assigner un code spécifique aux paragraphes tirés des données lorsque ces derniers contiennent une expression spécifique. Les logiciels les plus avancés proposent en outre un codage s’appuyant sur un dictionnaire embarqué dans le logiciel ou un codage automatisé s’appuyant sur le machine learning (vous devrez alors faire un codage manuel sur une partie des données pour éduquer le logiciel et ce dernier terminera le travail).

Assistant de codage automatique dans NVivo 12 Plus (version Windows)
Extraction des citations et quantification de l’analyse

Le codage vous permettra d’une part de structurer votre grille d’analyse (certains logiciels vous permettront d’éditer un tableau reprenant l’ensemble de vos codes et des définitions associées : idéal pour alimenter les annexes de votre mémoire) et de retrouver des extraits de données en fonction du codage que vous aurez réalisé. Il devient alors possible de retrouver, en quelques clics, les citations issues des entretiens se rapportant à tel ou tel concept et éventuellement de croiser cette recherche avec des propriétés descriptives ou socio-démographiques. La rédaction du chapitre de résultats de votre mémoire sera alors grandement facilitée.

La plupart des logiciels permettent par ailleurs de quantifier les fréquences d’apparition des codes et de leurs co-occurences (ce qui serait très difficile à réaliser manuellement). Les résultats pourront alors être exportés au format Excel et éventuellement, faire l’objet de traitements statistiques.

Tableau croisant des codes et des propriétés socio-démographiques dans MaxQDA 2018 (version Mac)
Représentations visuelles

Sur la base de ces outils de quantification, les CAQDAS proposent en général des fonctionnalités permettant de construire des représentations visuelles.

Graphique représentant la fréquence d'apparition de codes dans NVivo 12 (version Windows)

Des outils de représentation visuelle vous permettant de construire des modèles sur la base de votre codage sont également offerts dans la plupart des CAQDAS.

Modèle construit dans NVivo 12 (version Windows)
Travail en équipe et taux de fiabilité inter-codeurs

Les CAQDAS permettent en général à plusieurs utilisateurs de travailler sur le même projet. Si vous réalisez votre mémoire en binôme (comme cela est autorisé dans certaines institutions), cet aspect sera très important. Deux grands cas de figure méritent ici d’être distingués :

  • Les CAQDAS qui nécessitent une installation sur votre ordinateur (NVivo, Atlas.ti ou MaxQDA) vous proposeront en général de travailler séparément sur le projet et de fusionner les différentes versions afin que le travail réalisé par tous les membres de l’équipe soit centralisé. Il sera alors très utile d’utiliser un système de partage de fichiers tel que Dropbox, OneDrive ou Google Drive et de veiller à la bonne coordination des différents membres de l’équipe.
  • Les CAQDAS qui se présentent sous la forme d’une web app (c’est le cas de Dedoose) vous permettront de travailler en simultané sur le même projet sans avoir à fusionner les différentes versions. Ces logiciels facilitent grandement le travail en équipe mais présentent un inconvénient majeur : vous devrez être connecté à Internet lorsque vous voudrez travailler sur l’analyse de vos données.

Ces fonctionnalités de travail en équipe vous permettront notamment de réaliser un double codage et de calculer un taux de fiabilité inter-codeurs. Pour faire simple, le double codage consiste à faire analyser les mêmes données par deux personnes en leur demandant d’utiliser la même grille d’analyse. Si le travail d’analyse a été réalisé sérieusement et que les codes qui constituent la grille d’analyse ont été définis précisément, les deux utilisateurs devraient faire les mêmes choix quant à l’affectation des codes aux différents segments de données (phrases ou paragraphes). On pourra alors quantifier le nombre d’accord et de désaccords et calculer un taux de fiabilité inter-codeurs (nombre d’accords / somme des accords et des désaccords) pour mesurer la rigueur du codage. Ce taux peut d’ailleurs être purgé de la concordance aléatoire (on parle alors de Kappa).

Le calcul du taux de fiabilité intercéder ou du Kappa figure rarement dans les mémoires de master mais peut constituer une opportunité vous permettant de différencier votre travail et de marquer des points. Si vous travaillez seul sur votre mémoire, demandez à un de vos camarades de vous aider et de double-coder un ou deux entretiens (en échange de quoi vous pouvez proposer de double-coder un ou deux entretiens issus de son mémoire). Si vous travaillez à plusieurs sur le mémoire, ce sera encore plus simple.

Quelques conseils pour choisir votre CAQDAS

Le choix du CAQDAS est une question essentielle si vous souhaitez analyser des données qualitatives dans le cadre de votre mémoire ou de votre thèse. Compte tenu du temps nécessaire pour apprendre à utiliser ces logiciels, il convient de ne pas attendre la dernière minute pour régler cette question. La diversité des produits disponibles sur le marché rend ce choix particulièrement difficile et nous avons consacré un article à cette question. Voici néanmoins les critères qui doivent – selon nous – être intégrés à votre réflexion :

Le coût

Le coût de la licence est un paramètre de première importance. La plupart des logiciels proposent des tarifs étudiants compris entre 70 et 90 euros pour une licence de 24 mois. Ces tarifs sont beaucoup plus intéressant que les tarifs commerciaux ou académiques (jusqu’à 10 fois moins cher !) mais représentent néanmoins un investissement significatif. Avant de vous engager dans un tel achat, vous pouvez :

  • Vous faire la main sur la version d’évaluation afin de vérifier que le logiciel répond bien à vos besoins
  • Vous renseigner auprès de votre institution pour savoir si cette dernière n’a pas fait l’acquisition d’une licence d’établissement dont vous pourriez bénéficier
La compatibilité avec vos outils

La plupart des CAQDAS proposent des versions Windows et Mac mais attention, ces dernières ne sont pas forcément équivalentes. Ainsi, les fonctionnalités de codage automatisé proposées par NVivo sont disponibles sur la version NVivo 12 Plus Windows mais pas sur la version Mac. Dans le même ordre d’idée, l’importation de données depuis Evernote ou depuis un logiciel de gestion des références bibliographiques est proposée sur la version Windows de Atlas.ti mais pas dans la version Mac. Les éditeurs proposent généralement des tableaux récapitulant les fonctionnalités sur leur site Internet. N’hésitez pas à les consulter.

Votre directeur de mémoire et vos camarades

Votre directeur de mémoire utilise peut-être un CAQDAS pour ses propres recherches et pourra – le cas échéant – vous donner des conseils précieux. De la même façon, il est souvent judicieux d’utiliser le même logiciel que vos camarades afin de pouvoir bénéficier de leurs retours d’expérience.

Les fonctionnalités

Même s’ils proposent le même socle de fonctionnalités, les logiciels ne sont pas tout à fait équivalents et ils ont chacun leurs points forts et leurs points faibles. Consultez notre article sur le choix des CAQDAS pour identifier le logiciel qui répond le plus à vos besoins.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *