15 février 2019

Curation de données et netnographie

Image: Pixabay/PhotoMIX-Company

J'ai écrit quelques billets sur la curation de contenus web au cours des dernières années (en 2010 et en 2011, entre autres). C'était toujours dans une perspective de bonification d'informations reliées à une entreprise ou à un champ particulier d'activités. 

Cette pratique tire en partie ses origines de la surabondance d'informations. En cette ère de désinformation et de "Fake News", la curation est sans doute aussi pertinente maintenant qu'à l'époque...

Curation de données et netnographie

Aujourd'hui, je souhaite plutôt vous parler de curation de données et d'une technique de recherche appelée la netnographie. En gros, elle s'intéresse aux interactions et surtout aux comportements dans les médias sociaux. Elle semble attirer à nouveau l'attention des spécialistes du marketing et des relations publiques, entre autres.


Source: ResearchGate
La netnographie est donc une méthode de recherche qualitative inventée en 1995 par Robert Kozinets. Il s'agit d'une approche anthropologique issue de l'ethnographie appliquée aux médias sociaux. En 1995, bien entendu, les médias sociaux tels qu'on les connaît aujourd'hui n'existaient pas. À vrai dire, l'internet regroupait à peine 50 millions d'utilisateurs...

Par contre, il y avait des centaines et même des milliers de personnes membres de communautés virtuelles diverses - américaines surtout - qui se parlaient et qui échangeaient des informations (par le biais des forums de discussion et des BBS, entre autres). C'est ici que Kozinets a commencé à s'intéresser de près à ces interactions qui se sont développées par la suite dans le web de manière exponentielle...

Selon Kozinets, la netnographie s'intéresse de très près au contexte des activités individuelles: conversations, interactions, diffusions, statuts, partages, etc. Si les données massives analysent plutôt les conversations de manière statistique et décontextualisée, la netnographie se concentre sur la signification de ces activités.

Les données sont disponibles ... pour la curation.

C'est par le biais de la superbe revue Dialogues du programme de relations publiques de Seneca College que j'ai appris que le professeur Kozinets avait récemment fait une recherche netnographique pour le compte d'un fabricant de matériel informatique. 

Le fabricant voulait savoir comment les clients catégorisaient ses produits. Le professeur s'est tourné vers un canal que les chercheurs traditionnels utilisent très peu: Pinterest, une plateforme de curation d'images, entre autres.

L'avantage d'une recherche netnographique est double: son coût et la disponibilité des données (par rapport à des groupes-témoins, à des entrevues semi-dirigées en face à face ou à des sondages téléphoniques, par exemple).

En matière de curation de données, plusieurs données sont même déjà catégorisées quand on pense aux mots-clics (#hashtags), ou aux informations dites virales et autres tendances du moment... Et il y a toujours la bonne vieille méthode de la recherche par mot clé !

Un exemple d'une approche netnographique plus discursive 

Voici un lien vers une recherche assez récente portant sur la façon dont les hôtels peuvent s'ajuster aux besoins de leurs clients grâce à l'analyse discursive des critiques laissées sur les sites mêmes des hôteliers ou encore sur des sites tels que TripAdviser ou Expedia...

How can hotel websites discursively adjust to customer preferences using online criticism (Francisca Suau-Jiménez).


Approche éthique ?

Tout bon chercheur devra comprendre ce qu'il se passe dans Internet et dans les divers réseaux sociaux. 

Par contre, même si les données (du moins une grande quantité de données) sont en accès libres et ouvertes à tous, qu'en est-il de l'éthique sur la recherche en ligne ? 

Les règles éthiques de la recherche qui s'appliquent dans "la vraie vie" (collecte et analyse par exemple) sont-elles les mêmes pour la recherche en ligne ?

Généralement, en recherche traditionnelle, on doit obtenir la permission des participants et leur fournir un maximum d'informations sur la recherche. Chez certains groupes de recherche, les participants sont même rémunérés.

Toutes les grandes universités de recherche se dotent de comités d'éthique de la recherche comme ici à l'UdeM.   

Tout cela n'existe pas en recherche netnographique. C'est pourquoi le professeur Kozinets a établi une série de procédures et de conseils pour ceux et celles qui s'intéresseraient à ce type de recherche: Netnography: Doing Ethnographic Research Online.

Autre réflexion, après coup... Le journalisme de données

Les journalistes Jeff Yates et Roberto Rocha font également, à leur façon, de la curation de données pour raconter leurs histoires et débusquer les "Fake News", entre autres.

Leur article du 12 février 2019, De faux comptes Twitter contre les pipelines et l'immigration au Canada, relate comment ils ont pu isoler des publications (tweets) visant à influencer des Canadiens. 

Ils ont choisi d'utiliser plus d'une soixantaine de mots-clés contenant des noms de politiciens et de personnalités, d'entreprises et d'organismes ainsi que des mots-clics populaires.

Bien entendu, ils ont reçu un bon coup de main de Twitter qui a rendu publics des faux comptes, désactivés depuis avec leurs tweets (voir ici) dans le cadre de son programme Elections Integrity

Les journalistes ont aussi profité d'un code en accès libre permettant d'analyser les tweets en question par le biais de GitHub.

Voici d'ailleurs l'espace GitHub de Roberto Rocha: robroc/twitter-trolls-canada

En plus d'une possible campagne d'influence iranienne au sujet des pipelines canadiens, les journalistes ont trouvé une série de comptes russes (faux) qui ont tenté de propulser et d'amplifier des messages négatifs sur l'immigration.

C'est vrai qu'ici, contrairement à la recherche netnographique sur les hôtels vue plus haut, l'analyse discursive y est plutôt courte et le phénomène d'amplification y prend une place importante. 

Qu'à cela ne tienne, plusieurs ingrédients menant à une recherche netnographique y sont: collecte ou curation de données, configuration et codage particulier (avec du code comme python), choix et analyse de mots-clés, compréhension fine du contexte, signification des activités, et enfin compte-rendu final.  


Source: https://github.com/robroc/twitter-trolls-canada/blob/master/TwitterTrolls.ipynb

Oui, l'analyse de millions de tweets nécessite un degré certain de connaissances informatiques et devient plus compliquée qu'une analyse discursive de quelques centaines ou même de milliers d'avis sur un hôtel. Mais, dans les deux cas, il y a tout de même beaucoup de travail. 

Il n'en reste pas moins que tout chercheur en communication devra développer une culture des données qui deviendra certes de plus en plus sophistiquée mais qui se révélera essentielle pour l'avenir...

Merci de votre lecture !

Patrice Leroux
 
Creative Commons License
patriceleroux by patrice leroux is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 2.5 Canada License.
Based on a work at patriceleroux.blogspot.com.