Filtrage de l'information

Le filtrage de l’information sur les réseaux sociaux

  • La personnalisation des contenus mis en avant sur les réseaux sociaux se fait grâce à un filtrage du flux d’informations.
  • Le filtrage de l’information est un processus qui consiste à extraire d’une masse importante les informations les plus pertinentes. Il s’agit donc de proposer à l’utilisateur un contenu susceptible de correspondre à ses besoins, après que celui-ci ait défini ses centres d’intérêt (hashtags ou pages suivies).
  • C’est le profil de l’utilisateur, qui détermine les informations qui lui seront transmises (selon le modèle canonique, le modèle explicite et le modèle automatique).
  • Le filtrage intègre aussi les opérations d’exploitation et de présentation des résultats. Les informations à mettre à la disposition de l’utilisateur sont extraites de sources différentes et évoluent dans le temps.
  • La connaissance des besoins stables de l’usager est un point central dans le filtrage de l’information.
  • La recherche d’information correspond à un fonds documentaire formé de données qui ont été déjà indexées. Les ressources sont alors considérées comme statiques.
  • En revanche, le filtrage d’information s’applique à une donnée dès son apparition dans le système. Le flux d’information est dynamique.
  • Un système de filtrage est un système qui élimine les données redondantes ou indésirables en provenance d’une ou plusieurs sources extérieures à l’utilisateur.
  • Le filtrage par contenu constitue l’approche la plus ancienne dont le but est d’établir une correspondance entre les ressources et les usagers. Le système analyse alors le contenu des ressources, puis effectue des recommandations.
  • Le filtrage par contenu est approprié pour le matériel textuel. Il a pour avantage de faciliter l’entrée d’un nouvel item dans le système. Néanmoins, cette approche ne présente aucun aspect collaboratif.
  • Le filtrage par collaboration est une approche plus récente dont le but est d’établir une correspondance entre les usagers en fonction de leurs profils.
  • Les principaux avantages de ce filtrage sont nombreux : la capacité de recommander des items dissemblables et l’utilisation des formats variés de ressources.
  • C’est dans l’ajout de nouveaux items que réside la principale problématique du filtrage par collaboration. Comment évaluer des contenus qui n’ont pas encore été consultés ?

Algorithme EdgeRank

  • L’algorithme Edgerank, aussi appelé algorithme de Facebook est un algorithme utilisé par le réseau social Facebook qui repose sur un principe de tri des informations et de choix des contenus.
  • L’algorithme fait l’inventaire de tout ce qui est publié par nos amis et par les pages que nous suivons, et il analyse les publications qui nous intéressent (signaux).
  • Il prédit ainsi ce qui pourrait nous intéresser, toutes les informations n’ont pas le même poids.
  • Ce poids, appelé score de pertinence, est calculé à partir de la formule suivante :

$$\text{Score (p)}= \text{A}\times \text{T}\times \text{F}$$ avec :

  • $\text{p}$ une publication postée par un ami (l’auteur) sur Facebook ;
  • $\text{A}$ l’affinité entre l’utilisateur et l’auteur ;
  • $\text{T}$ l’attractivité du contenu ;
  • $\text{F}$ la fraîcheur du contenu.

Profilage publicitaire et ingénierie sociale

  • Les réseaux sociaux font appels à différents modèles économiques.
  • Il existe le modèle freemium où l’utilisation et l’accès sont gratuits alors que certaines fonctions sont payantes.
  • Beaucoup de réseaux sont financés par les espaces de publicités présents sur leurs plateformes.
  • Les publicités sont ciblées et programmées pour être envoyées à certains profils (selon les préférences et les intérêts des individus). En effet, elles sont sélectionnées préalablement par des algorithmes de profilage selon les sites visités et les informations divulguées sur Internet.
  • Les utilisateurs sont les principaux vecteurs de la communication publicitaire.
  • L’ingénierie sociale est l’ensemble des techniques utilisées pour modifier et changer intentionnellement des comportements de groupes sociaux.
  • La bulle de filtre est un concept théorisé par Eli Pariser, qui désigne le filtrage de l’information par des algorithmes utilisés sur les réseaux sociaux. Ces algorithmes recommandent aux usagers des contenus en adéquation avec leurs préférences, renforçant ainsi leurs croyances et les enfermant dans une sorte de bulle personnalisée.
  • D’un côté les réseaux sociaux favorisent le bonding qui est la formation de liens affectifs entre des personnes semblables (de même âge, d’une même région…).
  • Cela ne les empêche pas de favoriser également le phénomène de bridging, par la création de ponts entre des personnes différentes (qui ne se ressemblent pas).
  • Les affaires de fuites de données personnelles mettent en avant les questions liées aux modèles économiques des applications de réseautage social.
  • Il faut toujours avoir en tête ce slogan : « Quand c’est gratuit, c’est vous le produit ! »