Dans la série des risques en eRéputation ou des techniques de référencement dîtes blackshat : cas d’école

Votre veille fait apparaître des blogs avec du contenu incompréhensible qui ressemblent à une bouillie de mots ? – Alors vous êtes probablement face un spam blog (splog). De la famille des Scraper sites ou blog scrapin, le splog est un blog alimenté par un logiciel qui auto-génère du contenu à partir des contenus disponibles sur le Web (action de scraper)… le votre (votre identité numérique), entres autres. Mais c’est une duplication de contenu (duplicate content) sans recherche de sens; un mixte, une bouillie.

« ça a l’aspect d’un blog, il est constitué de billets comme sur un blog mais ce n’est pas un blog…  » Faut-il s’en méfier (réputation) ou est-ce une pollution numérique inhérente à la Webosphère ? Faut-il tenter de les effacer ou être en lâcher-prise ?

Billet en réponse au billet de Marie « Ethique et référencement » suite au jeu Seotons. Vous en serez plus en lisant la « petite » histoire ci-dessous. Je remercie Marie et les lecteurs de pink-seo.com pour le débat autour des techniques de référencement … et leurs conseils :-)

De quoi allons nous parler ?

  • Commençons par définir les splogs en s’appuyant deux cas d’école pour en comprendre l’origine, les « conséquences » et le comportement à avoir
  • Je terminerai par une question ouverte : Quid de l’utilisation des noms de personne dans les techniques de référencement via les splogs.

Des mots, des mots certes … mais derrière un nom il y a un être vivant !

Splog vous avez dit Spam Blog: Qu’est-ce que c’est ?

Définition splog appelé aussi Spam Blog

Un blog est personnalisable et accessible à tous ; une expression individuelle ou collective; Prenant la forme d’un journal de bord dynamique, évolutif et communautaire; mono/ bi/ multi/média : intime, professionnel, citoyen ou thématique; gratuit ou payant

Un blog ou blogue est un site Web constitué de billets agglomérés au fil du temps et souvent classés par ordre antéchronologique (les plus récents en premier). Chaque billet (appelé aussi « note » ou « article ») est – à l’image d’un journal de bord ou d’un journal intime – un ajout au blog. La blogueuse/le blogueur (i.e.: la personne s’occupant du blog) y délivre un contenu souvent textuel, enrichi d’hyperliens et d’éléments multimédias, sur lequel chaque lecteur peut généralement déposer des commentaires. Selon Wikipédia

  • Par définition un spam ou pourriel (au Québec), c’est

Dans le langage populaire, il s’agit de tous les messages indésirables qui ne respectent pas la Netiquette (règles de conduite et de politesse recommandées sur les médias et Internet); sous forme de publicité ou de messages en chaîne; utilisant parfois les techniques d’hameçonnage (phishing) voire d’harcelement. A l’origine du mot une marque de jambon en boîte et d’un sketch comique des Monty Python d’après Wikipédia (à lire).

  • De facto, le splog, c’est

Blog + spam = Splog

Étude de cas

Depuis 6 mois, ma veille me fait remonter des articles incompréhensibles. Faut dire aussi, que depuis le mois de juin, j’utilise Alerti comme outil de veille et de gestion d’eRéputation. Ce dernier, scrute pour moi tout le Web et m’alerte tous les jours par email des parutions Web sur les requêtes pré-programmées (entres autres, nom/prénom et speudo). En monitorant ainsi ma veille, je dispose d’un tableau de bord qui me permet d’avoir une vision générale des publications où mon nom/pseudo apparait; de pouvoir les suivre en les rangeant dans une rubrique « Action » et de les recenser avec leur attribuant une tonalité (positif,négatif,neutre). Peut être en avais-je auparavant … Quoi qu’il en soit, ils ont attiré mon regard car:

  • Ils n’apparaissaient pas dans les premières pages des résultats Google avec une simple requête Google de votre identité numérique Ex: « fadhila brahimi » ou « fbrahimi »
  • Les alertes Google par email ne les faisaient pas remonter. Ou alors de manière très succincte. Liste incomplète
  • Ils apparaissaient en masse sur une période courte allant d’une semaine à un mois
  • Le contenu des billets mentionnait dans le texte, le titre ou dans l’url, une activité parfois différente de la mienne voire opposée, dégradante même – avis personnel Question de perception et de réputation !
  • Certains citaient mon nom ou mon speudo, avec mes photos et de nombreux BackLinks (liens hypertextes) sur des mots clefs de mon activité (exemple « eRéputation » « community managament » « barcamp » « identité numérique ») mais ils pointaient vers d’autres blogs. Le rendu général ressemblait à une toile d’araignée composée de blogs avec toujours mon nom ou mon pseudo, mes photos, mes mots clefs avec un titre trompeur
  • Les blogs étaient souvent hébergés à l’étranger par des solutions masquant le propriétaire (Privacy Protect)

Cas d’école

EXEMPLES N°1

Comme vous le savez, je suis coach certifiée par l’International Coach Federation . Je ne gère pas le destin des personnes que j’accompagne. Le coaching de destin n’existe pas et serait totalement contraire au code de déontologie du Coaching qui lutte parallèlement contre les dérives sectaires. Je ne suis pas non plus un nettoyeur du Web. La réputation se construit et se gère; je crois plus à la production de contenu qu’à l’effacement.

  • Vous reconnaitrez ma photo avec les cheveux tirés en arrière prise au premier Barcamp sur l’eReputation

Sur cette copie écran vous ne voyez pas mon nom car il était présent plus bas dans le texte.

Je vous laisse imaginer ma surprise …

Ces blogs répétaient en masse les mots suivants: eRéputation, eNotoriété, identité numérique, Barcamp, Community Management, etc.

Ils sont apparus pendant que j’organisais le Barcamp eReputation et à la suite de l’événement. Comme vous le savez j’organise et participe à deux nombreux barcamp sur le community management, l’e-Réputation et l’identité numérique.

En effectuant des requêtes croisées: nom + mot clef. Ils apparaissaient parfois sur la première page des résultats Google (les premiers jours) ; puis sur la seconde page au fil de mes publications (effet d’écrasement). Malheureusement, au départ je n’ai pas eu le réflexe de faire une copie écran – aujourd’hui j’ai un livre 😉

Mais regardez ici les 90% des urls sont des splogs.

——————————————————————————————————————-

——————————————————————————————————————-

Impressions et questionnements

Ayant eu affaire au hacking de mon blog, à des attaques massives sur celui-ci pour le faire tomber, à des harcelements par email et des insultes publiques … etc

J’ai supposé que c’était soit :

  • Le nouveau jeu de mes détracteurs; pour me polluer mon référencement ou occuper mon temps= Acte malveillant des délinquants ?
  • Le jeu de petits malins qui souhaitaient profiter du buzz sur le Barcamp eRéputation pour capter notre audience et faire rediriger ses splogs vers des sites marchands (ce fut le cas pour 1/3)
  • Un pur hasard…dans quel but ?

Alors j’ai réalisé d’autres recherches et demandé autour de moi si d’autres subissaient le même sort.

Et oui… quelques jours après Franck et Emilie apparaissaient sur les mêmes splogs. Mais tandis que moi j’en recensais plus de 200 au bout d’une semaine; eux en avaient entre 5-10.

A ce stade et voyant les splogs se multiplier pendant que je publiais sur les résultats du eReputationCamp, j’ai re-paramétré mes accès à image et photo sur Flickr puis j’ai décidé d’aller à la poursuite des auteurs de ses plogs afin de demander le retrait immédiat de ces articles avec les arguments suivants :

  • Mon nom est déposé en tant que marque
  • Mon image est utilisée à mon issu
  • Les mots clefs portant atteinte à mon intégrité professionnelle

Pourquoi ?

  • Parce-que je ne connaissais pas la finalité ni le but : allait-il continuer ou non
  • Parce-que je voulais savoir s’il s’agissait d’un acte malveillant délibéré ou non
  • Parce-que je pensais que ces splogs pouvaient polluer les requêtes croisées
  • Parce-que les mots qui ne me correspond pas pouvaient peut être altérer aux résultats des moteurs de recherche de personnes comme WebMii, 123 people et YouSeeMe

Et puis c’était un excellent exercice 😉 Fatigant, long, fastidieux … mais intéressant.

Quelques jours plus tard, après avoir fait le tour du monde (pour de vrai!) des hébergeurs et signalé les pages frauduleuses à Google : 75% des splogs furent retirés.

Mais … oui il y a un mais….

EXEMPLE N°2

Récemment, d’autres splogs ont fait leur apparition. Cette fois-ci seul mon nom ou mon pseudo était utilisé. Ils avaient tous un mot commun : seotons

Si comme moi vous tapez le mot « seotons » sur Google ; vous verrez que le résultat est impressionnant. Mais ça ce n’est rien. Allons sur Twitter search pour regarder si quelqu’un parle du phénomène « Seotons ».

Non non ce n’est pas une blague : le seotons semble intéressé beaucoup de personnes. Mais Késako ????

Je repars en recherche et je trouve finalement un site explicatif au possible !

Le Seotons est un jeu concours pour des référenceurs. Le but est d’utiliser toutes les techniques possibles et imaginables sur une période donnée pour arriver dans les premiers résultats de Google avec le mot Seotons.La tâche est difficile car il faut générer un maximun de blogs avec le mot clef Seotons qui pointent vers un « blog maître » en essayant de ne pas se faire repérer par les Webmaster de Google dont l’une des préoccupations est de supprimer les pages dites « indésirables ». Le tout étant arrosé de techniques dont je ne ferais pas l’épilogue ici tant ce n’est pas ma spécialité.

Donc vous avez bien lu: Toutes les techniques sont autorisées.

Ben, allons-y : mon nom/pseudo est donc jeté en pâture dans des bouillies pour qu’un référenceur-joueur puisse gagner un gadget en prouvant  sa haute compétence technique :-(

J’interpelle alors quelques participants via twitter : les réponses furent immédiates. En somme, rigolade du style « Viens me chercher … tu ne me trouveras pas ». Bah voui, c’est certain ! Avec la masse de publications…. impossible.

Ouais… bon « y-a-t-il quelqu’un sur le pont pour m’expliquer pourquoi mon nom nom/pseudo est utilisé ? Quelles sont les conséquences pour mon référencement ? Jusqu’à quand ma veille va-t-elle être polluée par des splogs ?

Un concours, c’est bien; c’est motivant, instructif ;Maintes fois je l’ai répété et notamment ici : « Intérêts d’un concours : comment, pourquoi, règles et apports« Mais un concours sans règles, sans cadre c’est un appel à toutes les digressions !

Une semaine après , j’obtiens des réponse  de deux joueurs; qui me présentent leurs excuses; et de Marie : qui lance un débat sur l’éthique et le référencement.

——————————————————————————————————————-

Extrait de son post :

——————————————————————————————————————-

Résumé des réponses:

  • Ce jeu permet aux référenceurs de tester leurs compétences dans un esprit compétitif observable sur une période donnée
  • Les splogs ont une durée de vie limitée
  • C’est le lot de la visibilité
  • Les référenceurs pratiquent des techniques appelées soit Black hat (chapeau noir) ou White hat (chapeau blanc) pour optimiser un mot clef ou un domaine sur les moteurs de recherche (SEO). En référence au Western, les techniques de Black hat sont dîtes frauduleuses (cloaking, spamdexing, pages satellites) et celles du White hat suivraient les consignes « éthiques »; notamment en évitant d’utiliser des noms de marque

Quelle conclusion, quel comportement adopter ?

Ben, vraisemblablement, j’ai écrit ce long post et partagé cette histoire pour arriver à la conclusion suivante : Lâcher-prise.

Les auto-splog peuvent créer 300 blogs en un clic. Autant dire, qu’il est totalement inutile de s’y intéresser soit pour lutter soit pour en connaitre la source.

Toutefois, si des référenceurs visitent ce blog et lisent ce post; j’aimerais attirer leur attention sur les faits suivants:

  • L’activité de veille devient monnaie courante pour le lambda qui souhaite gérer son identité numérique sur la base d’un nom
  • Les noms de marque ne concernent pas que des people, des personnes politiques …  des personnes ultra-visibles mais aussi des indépendants, par ex.
  • Un nom ce n’est pas qu’un mot mais la représentation alpha d’un être vivant
  • Le nom d’une personne c’est une composante essentielle de l’identité numérique et de l’eRéputation des personnes
  • Voir son nom associé à des mots déplaisants est une forme d’agression:une agression digitale
  • Quid de la distinction entre un « jeu » et un acte malveillant ???

Un avis, des réponses à partager par rapport à ces questions ou ce post en général ?

Share and Enjoy:
  • Print
  • email
  • Digg
  • del.icio.us
  • Facebook
  • Google Bookmarks
  • LinkedIn
  • Live
  • Netvibes
  • RSS
  • Twitter
  • Posterous
  • Technorati
  • Tumblr
  • FriendFeed
  • viadeo FR
  • Diigo
  • Identi.ca
  • Wikio FR
  • MySpace
  • PDF
  • Reddit
  • StumbleUpon