Conspiracy Watch | l'Observatoire du conspirationnisme
Conspiracy Watch | l'Observatoire du conspirationnisme

Cartographie du web conspirationniste francophone : méthodologie et approche

La génèse du projet

Avec l’essor d’Internet, les théories du complot ont trouvé un espace propice à la diffusion de leurs croyances et ont su gagner de nouveaux publics. La liberté offerte par ce médium a permis à ses adeptes les plus convaincus de concevoir leur propre portail afin d’y diffuser leur vision du monde et convertir une communauté qui se fait aujourd’hui le relai de leurs idées. Au fil des années s’est alors construit un réseau complexe d’acteurs qui participent ensemble à désinformer le grand public.

Ce foisonnement d’acteurs œuvrant à la désinformation est tel qu’il devient aujourd’hui de plus en plus difficile pour l’internaute de s’orienter dans le paysage informationnel. Distinguer les acteurs fiables des acteurs malintentionnés est toujours plus difficile et les risques de basculement vers une lecture complotiste de la réalité augmentent. La pandémie de Covid-19 a été un exemple frappant de cette tendance. Nous connaissons tous autour de nous, des proches qui, malheureusement, se sont enfermés dans une bulle de désinformation, incapables d’en sortir après une longue exposition à ces contenus nocifs. Rejetant ainsi les grands médias, selon eux complices du grand complot qui se déroulerait à notre insu. Les études d’opinion sur la crédibilité accordée par les Français aux médias en témoignent. Si l’on peut considérer que les médias historiques ont leur part de responsabilité, il ne faut pas négliger l’influence des acteurs de la désinformation et du complotisme dans cette perte de confiance.

Depuis sa création, Conspiracy Watch s’est fixé pour objectif d’alerter sur les dangers de ces discours et d’informer le public sur l'existence de ces mouvements. C’est ce qui a motivé ce projet de cartographie du web conspirationniste.

L'intérêt du projet

Il nous est apparu important de proposer un état des lieux des sites web conspirationnistes dans l’espace francophone, afin que chacun puisse constater l’étendue de son réseau et retrouver, sur un même portail, des supports d’information fiables et factuels qui permettent de contextualiser leur présence et l’origine des théories qui y sont développées.

Nous souhaitons, à travers cette cartographie, permettre à tous d’acquérir les clés de compréhension de cette sphère en représentant son réseau dense et hétéroclite. Elle est également pour nous le moyen de mettre en valeur le travail d’analyse et de documentation du phénomène complotiste que nous réalisons depuis de nombreuses années. Les notices d’information produites sur les acteurs du conspirationnisme sont mises en perspective dans cette carte interactive. Tout en laissant à l’internaute la liberté de naviguer dans cet univers et de comprendre les liens entre ces acteurs.

L'objectif est de montrer l’organisation du réseau conspirationniste, ses différentes thématiques, branches et influences. S’il existe en effet des groupes bien distincts ayant une idéologie politique ou religieuse ainsi que des thèmes très éloignés voire opposés, d’autres ne sont pas engagés dans une démarche à proprement parler politique (on peut prendre l’exemple des théories portées sur les mystères ou l’espace). Bien qu'il puisse y avoir parfois entre ces groupes des porosités étonnantes.

Qu’est-ce qu’une cartographie de réseau ?

La cartographie du web vise les mêmes objectifs que la cartographie classique que l'on retrouve en géographie. Elle cherche à mettre au jour les territoires d'un espace donné en traçant les détails de ce dernier. Si la structuration du web est immensément complexe, et parfois abstraite, il reste toutefois un ensemble documentaire ordonné que l’on peut théoriquement  photographier pour le rendre concret en lui donnant une forme. Le web s’est converti en un terrain d’investigation dont on peut mesurer la distance ou la densité. Cela est rendu possible par sa particularité première : le lien hypertexte. Ce sont ces liens qui produisent le web (tout en lui donnant le nom) par un rattachement continu au corpus de pages existantes. On peut ainsi mesurer la distance entre deux pages par le nombre minimal de liens permettant d’accéder de l’une à l’autre ; la densité par le nombre de liens reliés à une page ; l’autorité d’un site par le nombre de renvois existants vers ce site. En somme, le lien est l’unité de mesure première du web.

La cartographie permet la représentation sur une carte des mesures, distances, densités et hiérarchies au sein du domaine étudié déterminées. On parle de cartographie parce qu’elle permet une représentation géométrique et spatiale de la structuration du territoire. C’est un dispositif d’écriture particulier qui permet de mettre en scène les données et d’apporter une rhétorique visuelle concrète d’une réalité abstraite (ou du moins invisible pour l’utilisateur). L'internaute, dans sa navigation, n’a pas la possibilité de prendre de la hauteur pour observer les dynamiques du réseau qu'il emprunte. Dans sa navigation courante, il “butine” de page en page, de lien en lien, et peut difficilement saisir les ramifications existantes entre les sites consultés.

Quel site fait référence dans un domaine ? À quelle fréquence est-il cité par d’autres ? La cartographie est en ce sens une solution permettant d’adopter un point de vue d’ensemble pour disposer d'une vue globale d’une communauté sur le web.

Si une cartographie de sites web permet de représenter une galaxie de sites en fonction des liens hypertextes existants entre eux, c'est parce que la connexion sur le web est porteuse de sens : le fait qu’un site propose des liens vers d’autres sites témoigne d’une proximité d’idées ou de valeurs entre eux. Marta Severo le rappelle dans son ouvrage La cartographie du Web : le lien social sur le Net :

« L’intérêt de cette technique dérive de deux régularités observées maintes fois dans la pratique de la création de liens hypertextes : les auteurs de sites web ne citent d’autres sites que s’ils partagent un intérêt thématique ou social ; les auteurs de sites web ne citent pas les sites qui ont un point de vue opposé au leur, même ceux traitant des mêmes thématiques. Si le premier type de comportement n’est pas surprenant, le deuxième l’est davantage. Les personnes et les groupes ayant des positions opposées ont tendance à s’ignorer sur le web : ils ne se citent pas négativement, ils ne se citent pas tout court ».

Ainsi, sur une cartographie de réseaux, plus un site va renvoyer vers un autre site, plus il va être spatialement proche de lui afin de figurer visuellement cette proximité. Cette représentation est réalisée grâce à des algorithmes de spatialisation qui utilisent les liens entrants et sortants de chaque éléments du corpus pour déterminer leur emplacement par un jeu d'attirance et de répulsion, à la façon d'aimants.

Pour récolter les données nécessaires à ce travail, on utilise la méthode du crawling qui consiste à faire parcourir à un robot les pages de sites préalablement définis en lui demandant de lister l'ensemble des liens externes qu'il trouve en intégrant à la liste tous les sites partageant des liens communs. Une fois les liens externes des différents sites compilés, un travail d’harmonisation s’opère afin d’obtenir une base structurée et passer à l’étape de mise en forme graphique des données. Plusieurs algorithmes de spatialisation permettent d’ajuster le rendu. C’est la mise sous forme de graphe qui rend lisibles les données collectées et l’analyse du domaine. Aboutissant à cette carte de réseau.

Cette page a vocation à présenter avec le plus de clarté possible l’objectif que nous avons cherché à réaliser et la méthode que nous avons appliquée pour y parvenir. Nous vous proposons donc ici une description détaillée de notre travail, de l’organisation du projet et des moyens mis en œuvre.


Structuration du projet

 

A - Travail de cartographie de réseau sur les sites web complotistes francophones.

Ce premier axe s’appuie sur le travail de spécialistes de l’analyse du web et des cartographies de réseau (data scientist, web analyst). Un travail conjoint de Deep Opinion et de OuestWare. Avec l’objectif de produire un graphe de réseau montrant la structuration de l’univers étudié. Cela afin de montrer les relations et les proximités qu’entretiennent les sites de notre étude.

B - Enquête, catégorisation et documentation de l’ensemble des sites.

Le second axe a été consacré à l’étude du contenu et la description de fond de la complosphère sur le web francophone : analyse des contenus, catégorisation de grandes familles et production d’une documentation. Pour ce faire, nous avons dédié un temps d’enquête sur chacun des sites afin d’analyser leurs contenus et proposer à l’utilisateur une description de l’ensemble du corpus. Ce travail a aboutit à la création ou la mise à jour de 126 notices d'information, une pour chaque site. Et permet de proposer une classification et des filtres pour que l'utilisateur puisse naviguer librement sur la carte.

C - Constitution du corpus

Le corpus de sites a été établi à partir du travail de veille médiatique effectué depuis plus de dix ans par Conspiracy Watch. Sur la base d'une sélection de plusieurs dizaines de sites web connus pour leur propension à diffuser des théories du complot, OuestWare a effectué à l’aide de l’outil Hyphe une opération de crawling ayant permis de mettre au jour plusieurs nouveaux sites liés à notre corpus initial. Après analyse qualitative de leurs contenus, nous avons ajouté un certain nombre d’entre eux au corpus final.

Quid des réseaux sociaux ?

Préférant la clarté à l'exhaustivité, nous avons fait le choix de circonscrire notre étude aux seuls sites web et blogs conspirationnistes, en laissant donc délibérément de côté les autres médias de ce type qui peuvent exister sous la forme de chaînes YouTube, TikTok ou Telegram, de comptes X, Facebook ou Instagram ou d'autres comptes de plateformes sociales.

Exclusion de sites

Les sites non-présents (mais qui auraient pu l’être) :

  • Fdesouche : ne produit pas à proprement parler de contenus originaux. Il ne nous est pas apparu conforme d’intégrer le site à notre corpus.
  • RT France et Sputnik : nous avons exclu les médias qui, bien qu’ayant pu relayer par le passé ou au cours des années écoulées des contenus à caractère conspirationniste, sont contrôlés et financés par des États, comme le sont RT France et Sputnik. En outre, ils ne sont de toute façon plus accessibles en Europe depuis l’invasion de l’Ukraine par la Russie en février 2022.
  • Comité Valmy : ce site, proche du Réseau Voltaire, bien qu’il puisse à une époque avoir eu une influence par son contenu et son militantisme, est aujourd’hui trop passif selon nous pour figurer dans notre corpus.
  • Alterinfo.net : site fermé au cours de l’étude.
  • Boulevard Voltaire : si le site dirigé par Gabrielle Cluzel demeure fidèle à sa ligne conservatrice et à son tropisme d’extrême-droite (notamment à travers certains de ses invités), il n'a, sauf erreur de notre part, pas endossé en 2022 de théories du complot à proprement parler.
  • Santé Plus Mag : de la même manière, le site (plus de 14 millions de visites par mois), centré sur les questions de santé, de « bien-être » et de naturopathie, n’y figure pas, même s’il a pu s’illustrer dans le passé en diffusant de fausses informations. Cette nature de contenus est trop minoritaire selon nous pour qu'il figure sur la carte que nous proposons.
  • Esprit Spiritualité Métaphysique : le site (822 000 visites mensuelles), centré sur l’ésotérisme et l’astrologie, même s’il a pu s’illustrer dans le passé en diffusant de fausses informations, ne contient pas majoritairement de contenus à caractère conspirationnistes.

Exception/particularité

Sites n’ayant pu être crawlés pour différentes raisons mais qu'il nous semblait utile, du fait de leur audience ou de la toxicité de leurs contenus, de maintenir dans notre cartographie.

Données de fréquentation des sites

Similarweb est une entreprise fondée en 2009. Elle fournit des services d’audience de sites web, du forage de données et d’informatique décisionnelle. Partenaire de ce projet, Similarweb a réalisé pour nous une étude d’audience moyenne mensuelle de l’ensemble des sites de notre corpus pour l’année 2022.

Ces données de fréquentation ont ensuite été utilisées pour définir la taille des nœuds sur la carte. Plus l’audience moyenne mensuelle est importante, plus le nœud aura une taille importante sur le graphe.

Données complémentaires

  • Responsables légaux des sites web
  • Pays d’origine du site
  • Année de création du site web

L’ensemble de ces données ont été compilées au sein d’une base de données à laquelle notre cartographie est connectée pour produire les fiches descriptives.

Catégorisation du corpus

 

Thématiques abordées

Pour préparer le travail de modélisation et de structuration de la cartographie, une typologie des théories du complot a été mise en place. Ces catégories nous ont permis de produire des grands ensembles auxquels nous avons associé les acteurs et les sites complotistes. La consultation et l’enquête menées sur notre corpus nous a permis de lister les théories du complot développées par les différents acteurs étudiés. Nous nous sommes inspirés des travaux de Michael Barkun qui, dans son ouvrage A Culture of Conspiracy: Apocalyptic Visions in Contemporary America, distingue trois grands types de conspirationnisme :

  • le conspirationnisme d’événement : théorie du complot portant sur un événement isolé (assassinat de JFK, premier pas de l'homme sur la Lune, attentats du 11-Septembre...).
  • le conspirationnisme systémique : plusieurs événements rattachés à une seule théorie du complot qui dessinent un complot à grande échelle.
  • le super-conspirationnisme : consiste à croire que tous les événements à travers le monde et l’histoire sont le fait d’un seul et même plan.

Pour des besoins de clarté, nous avons regroupé conspirationnisme systémique et super-conspirationnisme. La typologie que nous cherchions à produire ayant vocation à être intégrée à notre base de données, nous avons décidé de ne pas multiplier les sous-catégories. Le niveau de profondeur est identique pour chaque groupe.

Dans ce travail préparatoire, toutes les grandes théories du complot recensées sur ces sites ont été rattachées à l'une de ces deux catégories : conspirationnisme événementiel ou conspirationnisme systémique. A titre d’exemple, au sein du conspirationnisme systémique, on retrouve des théories qui ont trait soit à un thème général politique, soit à un thème général scientifique ou pseudo-scientifique. Dans la sous-catégorie des théories pseudo-scientifiques, certaines renvoient à la santé (Big Pharma, médecines alternatives...), à l’environnement (le projet Haarp, les chemtrails...) à la pseudo-histoire (créationnisme, récentisme, continents perdus...) ou à l’espace (Terre plate, Lune creuse, ovnis...).

Ce travail de catégorisation nous a par la suite permis de dresser, par théorie du complot, un ensemble de termes spécifiques qui indiquent généralement des discours promouvant ces théories. Ceci afin d'établir une liste de requêtes ciblées utilisées pour repérer plus simplement les thématiques développées dans les sites étudiés.

Paramétrage de requêtes ciblées

Afin de recenser les thématiques selon notre typologie des théories du complot et d’évaluer l’intensité complotiste de notre corpus, nous avons mis en place des requêtes affinées à partir d’une liste de mots-clés pour mieux cibler nos recherches.

Cette liste de mots-clés a été élaborée à partir d’un vocabulaire commun aux discours conspirationnistes. Nous avons consacré un temps de lecture à la littérature complotiste sur le web (à caractère proprement complotiste ou d’analyse de ces théories) et des différentes thématiques retenues afin d’identifier les termes les plus couramment utilisés. Ces termes ont été catégorisés et classés selon les grandes thématiques du complotisme (complotisme sanitaire, “forces occultes”, géopolitique, pseudo-science, “grand remplacement”, ésotérisme, etc). Donnant ainsi des requêtes spécifiques pour déterminer les grandes thématiques développées par les sites de notre étude.

Nous avons ensuite lancé ces différentes requêtes indépendamment sur chaque site. Et selon le nombre de résultats obtenus par requête, cela nous a permis d’avoir une idée des thématiques développées sur ces derniers. Enfin, nous avons consacré à chaque site un temps de consultation égal pour identifier et répertorier les théories du complot développées et promues.

Conditions d’ajout d’une théorie du complot à un site :

  • Présence de contenus originaux ou émanant d'autres médias faisant la promotion de cette théorie du complot.
  • Interview d’une personnalité défendant cette théorie sans critique ni prise de distance de la part du média invitant.
  • Présence de contenus autour de cette théorie qui la présentent sous un jour favorable.

L’intensité complotiste

La navigation au sein des sites et la compilation des thématiques complotistes relevées sur chacun d’eux, nous a permis de produire un barème pour déterminer le niveau de complotisme de chacun des sites. En effet, tous ne partagent pas un niveau de complotisme égal. Si certains versent dans une vision complotiste effrénée, se déployant sur une grande variété de thématiques, d’autres au contraire se distinguent par une spécialisation dans les thèmes abordés.

Cet indicateur est basé sur une échelle à trois niveaux. L'échelle d'intensité conspirationniste (EIC) fournit une indication de la diversité des thématiques conspirationnistes présentes sur un site donné telle qu'elle ressort de l'analyse des contenus qu'il diffuse :

  • Modéré : entre une et deux théories du complot promues par le site.
  • Forte : entre trois et six théories du complot promues par le site
  • Très forte : Sept théories du complot ou plus promues par le site

Évaluer le niveau de complotisme d’un média présente selon nous l’intérêt d’aider l’utilisateur à mieux se figurer l’univers que nous lui présentons. Tous les sites ne se valent pas dans leur propension à diffuser du contenu complotiste. A titre d'exemple, un site comme climato-realistes.fr peut être considéré comme mono-thématique puisque celui-ci est principalement consacré à la remise en cause de la réalité du réchauffement climatique et de son origine. Sa thématique unique fait de ce site un élément dont l’intensité complotiste est de niveau 1.

Les familles complotistes

A partir des étapes préalablement décrites, nous avons pu élaborer un début de catégorisation des sites, selon les taux de réponses en fonction des requêtes thématiques. Cette étape est le fruit d’un travail collaboratif au sein de Conspiracy Watch, enrichi par l’expertise des différents collaborateurs de l’Observatoire. Le but étant d’aider l’internaute à mieux se figurer les “grandes familles” ou tendances qui existent dans la sphère étudiée.

Notre travail nous a permis d’aboutir à ces six familles :

  • "Nouvel Ordre Mondial", "État Profond", "réseaux pédocriminels élitistes"
  • Pro-Kremlin, antiaméricanisme, "terrorisme fabriqué"
  • Antisémitisme, antisionisme, antimaçonnisme
  • "Grand Remplacement", anti-Islam, identitaires
  • Covido-scepticisme, anti-masque, anti-vax
  • Pseudo-science, ésotérisme, "santé alternative"

Création d’une cartographie de réseau

 

Constituer le corpus de liens

Le crawl a été réalisé au début du mois d'avril 2023 sur la base d'une liste des 126 sites. Une extraction des liens hypertextes a été réalisée avec Hyphe, outil open source du Médialab de Sciences Po. Il permet aux chercheurs de créer des corpus constitués de pages web et de liens entre elles sur un sujet spécifique.

Chaque site recensé a ainsi été visité par un robot (crawler) qui a extrait les liens hypertextes des pages web. Ce robot a continué sa visite au sein des sites en ne suivant que les liens internes. Pour ce projet, il a été configuré pour s'arrêter à une profondeur de 3 clics (i.e. Hyphe récupère les pages internes citées sur la page d'accueil, les pages internes citées dans les pages précédentes et enfin les pages internes citées dans toutes les pages explorées), et recense tous les liens externes. Certains sites n'ont pas pu être crawlés pour diverses raisons (cf. Constitution du corpus). Mais nous avons tenu à les faire figurer sur l’outil interactif. Ils apparaissent en bas à droite du graphique de réseau. L'ensemble des informations recueillies permet ainsi de déterminer pour chaque site le nombre des liens hypertexte qui pointent vers les autres sites du corpus. Dans ce projet, ce sont plus d'un million de liens hypertextes qui sont pris en compte.

Créer le graphe via un algorithme

Sur le graphe proposé dans l’outil open source Retina, chaque nœud (bulle colorée) représente un site web du corpus et chaque arc (trait) représente l'ensemble des liens hypertextes entre deux sites qu'il connecte. L’épaisseur de chaque arc est proportionnelle au nombre de liens hypertexte qu'il représente. La position des nœuds a été calculée à l'aide d'un algorithme « basé sur les forces » :

  • Chaque paire de nœuds se repousse comme si les nœuds étaient deux aimants (plus ils sont proches, plus ils se repoussent fortement).
  • Chaque arc attire les deux nœuds qu'il connecte comme s'il était un élastique (plus les nœuds sont éloignés, plus ils s'attirent fortement).

Après un certain temps, l'algorithme finit par se stabiliser, donnant cette visualisation. On peut lire les choses ainsi : Plus les nœuds sont proches dans la visualisation, plus ils ont de chances d'être très connectés, directement et/ou indirectement (s'ils ont beaucoup de voisins communs, par exemple). Lorsque beaucoup de nœuds sont proches les uns des autres, ils peuvent représenter une zone plus "dense" du réseau, avec beaucoup de liens qui connectent les différents sites.

Partenaires, sources et ressources

 

Partie éditoriale et commanditaire

Conspiracy Watch : idée originale, auteur de la définition du projet et des objectifs. Conception du corpus de sites, enquête sur le web complotiste francophone, conception de la base de données, catégorisation des sites grâce à la typologie des acteurs de la complosphère (familles complotistes) et de la typologie des théories du complot (thématiques).

Réalisation technique

  • OuestWare : scraping et extraction des liens avec Hyphe (outil open source du MédiaLab de Science Po). Réalisation de l’outil avec Retina de OuestWare.
  • Occurrence : suivi du projet, appui et conseils techniques.
  • Deep Opinion : suivi du projet, appui et conseils techniques.

Réalisation visuelle

Wedodata : conception visuelle, coordination avec les partenaires techniques.

Partenaires et ressources

Avec le soutien de la Fondation Jean-Jaurès

Similarweb : données de fréquentation des sites. Similarweb nous a fourni l’audience moyenne mensuelle en 2022 de l’ensemble des sites du corpus fourni.

 

(Dernière mise à jour le 30/11/2023)

Depuis seize ans, Conspiracy Watch contribue à sensibiliser aux dangers du complotisme en assurant un travail d’information et de veille critique sans équivalent. Pour pérenniser nos activités, le soutien de nos lecteurs est indispensable.  

Faire un don !
Partager :
à propos de l'auteur
Conspiracy Watch | l'Observatoire du conspirationnisme
© 2007-2024 Conspiracy Watch | Une réalisation de l'Observatoire du conspirationnisme (association loi de 1901) avec le soutien de la Fondation pour la Mémoire de la Shoah.
cross