Les digg-like : une fausse bonne idée

Conseil | Web 2.0

La recherche d'information intéressante est un problème récurrent sur le web auquel les digg-like ont cru apporté une solution. J'expose, dans ce billet, ma théorie pour expliquer cet échec et aborde les solutions qui, à mon avis, vont émerger.

Dans Blogasty et les limites du web 2.0, j'avais abordé le problème de l'intelligence collective et la qualité car blogasty promettait de « promouvoir les blogs selon la qualité de leurs billets ». Mais il est évident que d'une part la qualité est subjective et d'autre part l'information qui m'intéresse n'est pas toujours de qualité. J'aime assez le site Je galère au taff bien que je ne le considère pas comme un site de qualité. Les digg-like s'appuient sur la courbe popularisée par Chris Anderson dans son article La Longue Traîne traduisant le fait qu'une minorité d'articles est plébiscité par un majorité de personne.

Dessin de la courbe longue traine
La La longue traîne est représentée en jaune (image Wikipédia)

Mais cette image est trompeuse pour deux raisons :

  • Un contenu populaire n'est plébiscité que par un petit nombre d'utilisateur.
  • Ma courbe d'intérêt ne se superpose pas à celle-ci.

Ne disposant pas de données chiffrées, j'expose ma théorie avec des données purement fictives, qu'il serait très intéressant de confronté à la réalité pour confirmer ou infirmer ce modèle.Prenons l'exemple d'un site de social news (mais ce pourrait être un [site de e-]commerce) comportant 1 000 000 articles et ayant 10 000 utilisateurs actifs. La courbe ressemblerait à quelque chose comme ça :

Courbe
Distribution des articles en fonction de leur popularité décroissante

La popularité d'un article est le rapport, exprimé en pourcentage, entre le nombre de personne ayant voté pour un article et le nombre d'utilisateur du site. Ici l'article le plus populaire, le blockbuster a un score de Pmax = 1 % : il a obtenu 100 votes (je pense que dans la réalité, ce score est inférieur). Un article populaire n'intéresse qu'un faible pourcentage de lecteur.

Plaçons-nous, maintenant du point de vue d'un lecteur ayant lu 100 articles qu'il a classé du moins intéressant (score = 1) au plus intéressant (score = 100). Si l'on ne conserve, sur la courbe précédente, que ces 100 articles et que l'on superpose la courbe des scores de notre lecteur, je pense que nopus obtiendrons une courbe ressemblant à la suivante :

Courbes représentant la distribution des articles lus en fonction de leur popularité décroissante et de leur score
Distribution des articles en fonction de leur popularité décroissante superposée au score obtenu

Les articles qui m'intéressent le plus sont les moins populaires ! Dans ce cas comment un digg-like peut-il m'aider à trouver des articles intéressants ?

Il est assez amusant de constater que les algorithmes de recommandation soient très populaires dans le monde du e-commerce, ainsi que pour la musique et les DVD, mais pas du tout dans le monde l'information textuelle (journalisme, blogosphère, etc.) geekomatik est le seul exemple dans ce domaine, à ma connaissance. Malheureusement, le système de recommandation est, à mon avis, perdu au milieu de fonctionnalités peu ergonomiques et sans valeur ajouté, ce qui limite l'attrait du site, limite la taille de la communauté et limite donc la pertinence des recommandations. (Alexis, je suis prêts à reprendre nos échanges si tu le souhaites.)

Que pensez-vous de cette théorie ?

Raisonnement déraisonnable

Ta démonstration est totalement subjective, mais remet en cause le principe de notation de l'information, comme le fait de nombreux sites autres que Digg.

Selon moi il y a 2 problématiques à résoudre :
- proposer un système de vote simple, mais avec une prise en compte de l'environnement de l'utilisateur (un Geek donne un vote plus fort à destination d'un autre Geek, qu'à une jeune fille de 14 ans)
- l'information populaire doit être mise en valeur, mais sans être trop valorisée au risque d'auto-alimenter sa popularité

Je ne vois pas d'autres moyen que d'abandonner ces sites généralistes et de se retrouver sur nos bons vieux sites spécialistes.

Déraisonnable ?

En quoi ce raisonnement est-il déraisonnable ? En quoi cette démonstration est-elle totalement subjective ?

Les problématiques que tu cites sont centrales au problème, nous sommes bien d'accord. J'ai déjà eu l'occasion de m'exprimer sur le sujet dans Blogasty et les limites du web 2.0. Ta solution n'est pas complètement viable, car si un site est bon, il attirent du monde (n'est-ce pas le but de beaucoup de site que de faire de l'audience ?) et sa qualité décroît alors...

Bonjour David et merci pour

Bonjour David et merci pour le lien vers Geekomatik. En effet, Geekomatik est né de réfléxions similaires aux tiennes en ce qui concerne la faiblesse du concept d'intelligence collective VS celui de la recommnadation de contenu.

voir :
http://encoreungeek.com/nouvelle-generation-digg-like-sites-sociaux-information
http://encoreungeek.com/nouvelle-generation-d-agregateurs-sociaux
http://encoreungeek.com/karma-et-intelligence-collective
http://encoreungeek.com/agregateurs-sociaux-et-veille-collaborative-les-faiblesses-des-solutions-actuelles

Cela dit, je suis aussi surpris que toi que le concept de recommandation ne soit pas encore plus présent dnas le domaine de l'information! Je sais que Digg va ajouter un système de recommandation avant la fin de l'année, j'ai au moins la fierté d'avoir été le premier à l'avoir fait aec Geekomatik ;P. J'espère aussi avoir le temps de lancer la version anglo du site avant que digg ne lance son truc ;)..

Pour ce qui est de ton invitation à reprendre contact, je suis super d'accord, envoie moi un mail avec tes critiques et tes commentaires, ils sont toujours les bienvenus!

Alexis

Digg et aussi Google

Salut Alexis,

Merci pour ton commentaire et sache que je suis abonné à ton flux RSS... je connais donc les billets que tu m'indiques.

Je ne savais pas que Digg allait faire de la recommandation. Par contre Google, oui, dans Google Reader. Et là ça risque de faire mal !

Bonjour David,

Bonjour David,

Je suis curieux de savoir de quelle fonctions qui n'ont pas de valeur ajoutée tu parles?? À t'entendre le site semble presque inutilisable, je pense que je gagnerais bcp à ce que tu précises un peu ta pensée à ce sujet...
A+ et merci

Comme tu le sais, je place

Comme tu le sais, je place toujours la satisfaction du besoin utilisateur au centre. Quel besoin utilsiateur geekomatik est-il supposer satisfaire ? En ce qui me concerne, il ne satisfait pas mon besoin qui est de trouver de nouveaux billets (ou blogs) m'intéressant. En effet, j'utilise Google Reader pour lire mes flux, et je n'ai pas envie d'aller sur un autre site pour trouver de l'information nouvelle, sachant que je vais devoir passer un peu de temps dessus avant d'avoir quelques chose de correct. J'aurai donc aimé pouvoir remplacer Google reader par geekomatik en tant que lecteur de flux intégrant les recommandations. Mais geekomatik n'est pas un lecteur de flux et ne me permet pas d'importer les flux que je lis déjà.

Sachant que ma motivation principale est celle-ci, les fonctions sans valeur ajoutée (substantielle) sont les forums, les groupes, les favoris, etc. Mais peut-être que je ne suis tout simplement pas dans la cible...

Oui en effet...

Je comprends ta position, et sache que je suis à quelque jours de lancer le lecteur rss de Geekomatik, je pense que cela sera une agréable surprise pour tous les membres. Geekomatik prendra un peu le virage netvibes, dans le sens que tous les membres pourront facilement centraliser leurs flux sur le site ainsi que de profiter des recommandations sur le contenu.

Le seul problème que j'ai pour le moment c'est comment gérer les flux ajoutés par les membres dont ils ne sont pas les auteurs...Est ce que tous les flux devraient être ajoutés dans la liste des sources, ou est-ce que ce serait acceptable de laisser une zone 'perso' à chaque membre ou il pourrait ajouter ses flux persos qui ne seraient pas intégrés dans le contenu "principal" de geekomatik, mais bien consignés dans la page perso du membre en question..?

Oui en effet...

Je comprends ta position, et sache que je suis à quelque jours de lancer le lecteur rss de Geekomatik, je pense que cela sera une agréable surprise pour tous les membres. Geekomatik prendra un peu le virage netvibes, dans le sens que tous les membres pourront facilement centraliser leurs flux sur le site ainsi que de profiter des recommandations sur le contenu.

Le seul problème que j'ai pour le moment c'est comment gérer les flux ajoutés par les membres dont ils ne sont pas les auteurs...Est ce que tous les flux devraient être ajoutés dans la liste des sources, ou est-ce que ce serait acceptable de laisser une zone 'perso' à chaque membre ou il pourrait ajouter ses flux persos qui ne seraient pas intégrés dans le contenu "principal" de geekomatik, mais bien consignés dans la page perso du membre en question..?

Bonne nouvelle

Bonne nouvelle en effet. Il est évident que chacun puisse lire TOUS ses flux dans le lecteurs, quitte à ce que certains soient mis dans un espace perso... Si tu n'autorise pas l'utilisateur à lire tous les flux auxquels il est abonné dans geekomatik, tu peut être certain qu'il ne se servira pas de geekomatik pour lire ses flux !

Netvibes... J'espère que cela ressemblera plus à Google Reader qu'à Netvibes.

Pourquoi

Pourquoi, netvibes est quand même pas si mal?? Aussi, je ne pourrais sûrement pas satisfaire toutle monde, mais je vais faire mon max pour offrir un lecteur de qualité qui intégre les recommandations sur toutes les sources...

Netvibes

Parce que netvibes n'est pas un lecteur de flux mais une page de démarrage... La finalité n'est pas la même, les usages ne sont pas les mêmes !

Que pensez-vous de cette théorie ?

Je l'aime beaucoup. Elle me parait pleine de sens mais ca ne prend en compte la partie social de digg like.

Si TF1 marche, c'est aussi parce qu'on peut parler de l'émission d'hier avec une personne sur trois en france le lendemain.

Et puis sur digg on peut avoir des "amis" selectionnés en fonction de leur centre d'interet et ne suivre que leur recommandation.

Si on garde l'optique, "je cherche la meilleur information pour moi", tu as 100% raison mais ce n'est pas ca les digg like à mon sens.

Salut Tuf, Tu as

Salut Tuf,

Tu as entièrement raison :

Le côté culture commune permet de renforcer le sentiment d'appartenance (Maslow) et on peut chercher des informations dans ce but. Cette culture est généralement le plus petit dénominateur commun (l'émission de TF1 n'est généralement pas d'un niveau très élevé) et l'information n'est généralement pas très intéressante pour moi, mis à part le fait que je vais pouvoir en parler avec mes amis et collègues le lendemain.

Beaucoup de sites ajoutent des fonctionnalités sociales qui permettent de trouver de l'information intéressante. Mais je pense que pour la grande majorité des utilisateurs (non geeks ;-) ces fonctionnalités ne sont pas pertinentes parce que non utilisées.

Ceci dit, tu as raison, la recherche d'information doit prendre en compte ce volet social : l'information ne vaut que si elle est partagée. Ma théorie doit donc être restreinte à la recherche d'information qualitativement intéressante... et Google devrait bientôt apporter une solution à ce problème avec un système de recommandations !

Fake ?

...ou troll ?

Oui, c'est cela... oui.

Anonyme, excuse-moi de ne pas t'avoir répondu plus tôt, mais la profondeur intellectuelle de ton commentaire m'a obligé à prendre un peu de recul.

Fake [feik] article faux ou truqué.

Ma théorie serait-elle truquée ? Non. C'est donc que c'est un troll... ce qui n'est pas très étonnant, vu que c'est un peu ma marque de fabrique ces derniers temps.

Merci (couard) Anonyme d'avoir fait avancer le débat.

Don't forget the karma

Déjà content de voir que notre site te plait.
Ensuite tu parles de qualité mais c'est une notion très subjective...
De plus le grand problème des digg like et dont tu ne tiens pas compte ici c'est "le karma" qui fait que les membres les plus "influents" (ou plus simplement connu) ont plus de poids sur la popularité du billet.
Et de même manière ce membre dit "influent" passera plus facilement grâce à sa seule notoriété et non en fonction de la qualité de son billet en laissant derrière des articles intéressants mais écrits par des bloggeurs non connus.

Par contre concernant ton histoire de "courbe des scores d'un lecteur" j'aimerai bien savoir sur quoi tu te bases pour sortir une telle courbe -_-
Mais bon je suis allé lire l'article de wiki sur la longue traîne et tout ceci me fait mal à la tête ^^

Salut Sword, Tu as tout à

Salut Sword,

Tu as tout à fait raison, je n'ai absolument pas tenu compte du karma dans ma réflexion. Et effectivement le karma (l'expérience pour blogasty ?) biaise le côté popularité en l'orientant vers la vue particulière des forts en karma, ce qui est une façon de reproduire la vue d'une petite communauté (ou d'une ligne éditoriale dans un journal).

« Par contre concernant ton histoire de "courbe des scores d'un lecteur" j'aimerai bien savoir sur quoi tu te bases pour sortir une telle courbe -_- » DE MON PETIT CRÂNE ! Suite à une réflexion (très poussée), j'ai produit cette merveilleuse courbe issue d'une image dans un miroir verticale de la précédente pour imager ma lumineuse idée à moi que j'ai eu !

Vive les niches !

Je suis arrivé au même constat mais à une conclusion différente. Si mes goûts ne collent pas avec la majorité c'est qu'il faut développer une niche, c'est par exemple ce que je fais lorsque je m'abonne au fil RSS d'une recherche sur un digg-like sur un mot-clé particulier. Ça réduit énormément le bruit et j'arrive à un rapport assez intéressant au final. Mais il devrait y avoir mieux, je suis bien d'accord...

Tout dépend du point de vue...

Salut David !

Ta solution est une (bonne) solution cliente (et non producteur) d'un utilisateur avancé (power user)... Par conséquent, ta solution est nécessairement limitée à une certaine catégorie d'utilisateur (dont tu fais partie). Et puis (mon crédo), c'est à l'informatique de s'adapter, pas à l'utilisateur.

D'autre part, ta solution est valable quand tu sais ce que tu cherches. Mais le problème que je soulève est de trouver de l'information m'intéressant, sans nécessairement la chercher, i.e. savoir ce que je cherche. C'est un peut reproduire la démarche de chiner.

Je retiens ta solution pour mon usage personnel...