10
09
07

Rendere scopribili i contenuti, o perché Digg è fallato

12:19 Technocracy

Digg è spesso preso come esempio della capacità delle masse di creare contenuti. Sebbene questo sia vero, vi è un grosso e sostanziale problema nel metodo utilizzato da Digg per determinare quando una notizia è degna della prima pagina: il voto.

Questo sistema sebbene sia estremamente democratico e sia probabilmente il più efficiente che possiamo pensare in questo momento, presenta lo stesso medesimo problema che abbiamo con il sistema PageRank, ma anche più indietro con il concetto stesso di popolarità.

Ovvero:

  1. Piove sempre sul bagnato: un sito famoso avrà moltissime probabilità in più di uno con pochi lettori di arrivare in prima pagina (esattamente come avrà più probabilità di essere primo sui motori di ricerca).
  2. Premia il rumore e non la qualità: questo è il problema più rilevante, seppure sia ancora più difficile definire cosa sia la qualità. In realtà non è preciso dire che premia il rumore, ma una sorta di via di mezzo popolare (che non è strettamente sinonimo di qualità).

Ma c’è un problema di minore entità, sul quale però trovo sia importante riflettere perché è un ostacolo di design non da poco: Digg non fornisce alcuno strumento per la scoperta di nuovi contenuti.

Il problema è questo: Digg per portare storie in prima pagina si appoggia sul voto popolare e quindi non fa altro che utilizzare la popolarità dei siti già conosciuti per determinare quali storie siano importanti. In una certa misura lo strumento funziona: in questo modo è infatti un eccellente strumento per vedere l’umore della rete in un dato istante. E’ una sorta di termometro del rumore della rete.

Digg di per sé però non ha alcuno strumento interno per rendere nuove storie scopribili indipendentemente dalla popolarità della fonte. Ho infatti provato più volte ad inserire link, ma non ho mai ricevuto più voti di quelli che avevo richiesto esplicitamente alle persone che conoscevo.
La pagina “Upcoming Stories”, oltre ad essere raramente guardata, si aggiorna troppo velocemente e non riceve alcun interesse da parte degli utenti. Non solo: è una semplice lista cronologica, del tutto inefficiente e sovrastata dal rumore di fondo.

Lo so che non sto dicendo niente di nuovo: di fatto, questo è il problema che attanaglia da anni Google e chiunque faccia search engine e dall’altro lato è il ‘graal’ dei sistemi di analisi linguistica basati sulla semantica.
Mi sembrava comunque importante provare a fissare nero su bianco un po’ di pensieri.

20 comments Add yours below

1

Daniela Trifone 2007 09 10 at 16:25

Anche io, lavorando quotidianamente nel campo del SEO, mi sono scontrata con questo fenomeno sempre più evidente al crescere della popolarità del mezzo.
Sul web sappiamo bene che ognuno ha voce in capitolo, nessuno però ci spiega che il volume della voce dipende da fattori esterni indipendenti dalla nostra volontà e, purtroppo, dai nostri sforzi per farci sentire.

Lentamente ma inesorabilmente l'anarchia di internet a mio parere sarà via via drogata dalla popolarità offline e dunque da investimenti in campagne di comunicazione ancora una volta di tipo "push" che colpiscono masse di utenti più vulnerabili (e più numerose). L'oligarchia è già fra noi, solo che spesso non ce ne accorgiamo (provate a cercare su Google informazioni sulle assicurazioni per auto e guardate quante opinioni negative di consumatori scontenti dei rialzi vengono visualizzate ;).

Il narrowcasting purtroppo sta rivelando i suoi limiti, moltissimi esprimono la propria opinione attraverso un blog, ma quanti realmente ascoltano la miriade di fonti disponibili? La svolta per la credibilità e la visibilità sembrava rappresentata dagli User Generated Content, ma sistemi alla DIGG mi sembra proprio che non funzionino a dovere.

Voi cosa ne pensate?
2

Folletto Malefico 2007 09 10 at 16:44

A livello di individuo, c'è una sorta di piccola capanna per cui ci si puàò limitare all'ascolto delle proprie conoscenze, che quindi funzioneranno come una sorta di pre-filtro.
Ma è evidente che questo non sia affatto sufficiente.

Anche ipotizzando un approccio semantico, risulta comunque di un ordine di grandezza superiore la determinazione di cosa sia la qualità. Purtroppo - o per fortuna - il concetto di qualità è molto più di una semplice considerazione semantica. :/

La mia domanda quindi potrebbe volgersi su un problema più di architettura dell'informazione, semantica o che altro: è possibile che ci sia un modo di filtrare i nuovi contenuti in modo che sia effettivamente possibile ridurre il rumore di fondo senza fare affidamento sulla popolarità pregressa?

P.S.: dimenticavo di citare nel post TechMeme, che è per ora l'unico servizio di aggregazione news di tipo tecnico con una bassa percentuale di rumore. A detta dell'autore, è algoritmico.
3

riffraff 2007 09 10 at 20:10

> Digg non fornisce alcuno strumento per la scoperta di nuovi contenuti.
è per questo i Veri Uomini usano reddit, perché il motore che apprende dai tuoi gusti e ti propone le storie che potrebbero interessarti funziona discretamente bene :)
4

Folletto Malefico 2007 09 10 at 20:27

Proverò allora appena possibile. ;)
Spero che le proposte non siano bilanciate con la popolarità, se no siamo da capo. :D

Io cmq al momento uso TechMeme per le notizie importanti e Digg per l'umore e le cazzate. :P
5

paolo 2007 09 13 at 09:53

Per mettere un po' di ordine, Yahoo! ha messo giu' il pattern “Vote to Promote”
http://ajaxian.com/archives/yahoo-introduces-new-vote-to-promote-pattern
con tanto di galleria su Flickr
http://www.flickr.com/photos/xian/sets/72157600669632171/detail/
6

Folletto Malefico 2007 09 13 at 13:27

Mi sembra il solito pattern "è ovvio ma lo dico lo stesso". :P
Scherzi a parte, ineressante che venga formalizzato, anche se comunque rimane quel che è. :)
7

Daniela Trifone 2007 09 14 at 11:21

"La mia domanda quindi potrebbe volgersi su un problema più di architettura dell'informazione, semantica o che altro: è possibile che ci sia un modo di filtrare i nuovi contenuti in modo che sia effettivamente possibile ridurre il rumore di fondo senza fare affidamento sulla popolarità pregressa?"


Quando i nuovi contenuti sono troppi rispetto a quanto si possa umanamente fruire non diventano essi stessi rumore a prescindere dalla loro qualità/aderenza con la necessità espressa dall'utente?

Personalmente mi affido sempre più al caso e alle segnalazioni degli amici per trovare nuove fonti, l'information overload ha preso il sopravvento, è un nemico contro il quale ho deposto le armi :(
8

Folletto Malefico 2007 09 14 at 11:41

Si, se son troppi si. Il punto è proprio questo: esiste un sistema che permetta di selezionare automaticamente dal rumore quello che è umanamente fruibile? :)

Al momento, la cerchia di amici, ovvero il 'proprio' network, è una forma di selezione. :)
9

Gianmario 2007 09 14 at 17:28

Secondo me in questo momento nessun sistema automatico puo' fare quello che dovremmo fare noi, e siccome la quantita' di dati a disposizione cresce esponenzialmente, ci troviamo davanti un grosso problema.

Consideriamo il caso del Page Rank di Google. E' una sorta di auditel che non assicura assolutamente la qualita'. Lo poteva fare fino ad un po' di tempo fa e lo puo' fare limitatamente ad alcuni campi anche oggi. Ma con l'esplosione dei blog e dei siti di informazione semi-professionali l'utilita' di questo strumento e' limitata alla conoscenza dei fatti. Cioe' se voglio sapere qualcosa sulla provincia di Reggio Emilia Google mi puo' fornire la soluzione cercata con i primi link proposti.

Ma se sto cercando informazioni affidabili su un determinato argomento allora il discorso cambia. Il Page Rank presuppone secondo me un comportamente da robot, ovvero non dovremmo, per esempio, nei nostri siti internet/blog, linkare siti si amici per il solo fatto che sono tali.

Ma c'e' un'altra cosa che pensavo in questi giorni. I commenti dei post in un blog dovrebbero essere un indice interessante sull'utilita'/affidabilita' di un blog. Ma se su 80 commenti 60 sono solo commenti del tipo "avevi ragione!" , "la penso anche io cosi'", "ma quanto sei simpatico!", allora il discorso cambia e tutto si tramuta in rumore.

Son uscito un po' fuori tema ma infondo e' tutta informazione :)
10

Folletto Malefico 2007 09 14 at 18:15

Il grosso problema sono i tentativi di "hijack". Ovvero, sfruttare il sistema algoritmico per fregarlo e quindi salire in classifica. Il grosso problema è questo, altrimenti il PageRank o sistema analogo funzionerebbe discretamente bene.

Questo, salvo ovviamente la considerazione di cui sopra, ovvero che il voto popolare non significa necessariamente qualità.

Non sei fuori tema, anzi aggiungo una considerazione: sono rari i commenti del tipo 'hai ragione', mentre è molto più facile fare scoppiare una polveriera. Sono i post 'negativi' quelli che generano commenti, mentre quelli costruittivi sono meno frequentati, di solito, perché sono "giusti, quindi non ho altro da dire". Costruire su qualcosa di già corretto è più difficile che tirare l'ennesima martellata ad un muro storto. :)
11

Gianmario 2007 09 14 at 19:43

Si infatti come sai ci son intere aziende che si occupano di come falsare il ranking di Google e soci e sinceramente questa non e' cosa buona per l'utente.

Per la seconda parte vedi dipende secondo me, penso che quando si fa un post fatto bene c'e' sempre qualcosa da aggiungere e da argomentare. I problemi che mi vengono in mente sono due :

1) si fa un post fatto male in stile "10 comandamenti della Bibbia"e allora non e' possibile argomentare piu' di tanto;

2) chi scrive e' diventato una specie di dio dei blog ed e' circondato da tanti paggetti festanti e schiamazzanti. In questo secondo caso il rumore e' altissimo. Potrei fare nomi ma non e' simpatico :)

I tuoi post sono solitamente interessanti anche perche' permettono di guardare un problema da piu' punti di vista, io sono per la commistione delle specializzazioni (l'eccessiva specializzazione rende l'uomo cieco). :)
12

Folletto Malefico 2007 09 14 at 23:21

Oh si, c'è sempre da aggiungere. Se esistessero i post 'perfetti' sai che noia? :)
Per quello credo fermamente nelle critiche costruttive e nei commenti, motivo per cui ad esempio la grafica che ho fatto su questo blog cerca di porre i commenti con stesso font e peso analogo al post che precede. :)

Purtroppo comunque è vero: l'umanità è creativa e lo è anche nel rumore. Peraltro, c'è anche da considerare che il rumore per qualcuno magari è interesse per qualcun altro.

Su questo filo di pensiero si arriva alla 'coda lunga': il discorso è sensato, ma richiederebbe un post ad hoc (e commenti a seguire). :D
13

Bru 2007 09 15 at 18:20

Argomento interessante. Sì hai messo nero su bianco l'ovvio, ma ne è nata una interessante conversazione, il che dimostra che non era superfluo :)

Un paio di considerazioni:
1. popolarità vs. qualità. La scelta di Google, come quella di Digg, è prettamente "economica". Affidare la pole position al post o articolo più popolare significa dare la miglior risposta possibile nella maggior parte dei casi. In media quindi l'utente di Google è felice.
Il problema nasce dal fatto che non esiste una verità (Qualità) oggettiva: ciò che ha valore per me probabilmente lascia totalmente indifferenti il 95% degli utenti di Google; e se da un lato abbiamo l'illusione, grazie alla rete, alle tecnologie UGC ed ai media interattivi in genere, di essere in grado di "costruire" canali di informazione altamente personalizzati in base ai nostri gusti, la verità è che la ricerca di contenuti (che è la tecnologia costituente le fondamenta degli ipotetici "personal media") a costituire il limite, spingendo tutti nella direzione dei contenuti più popolari.
Siamo lasciati liberi di giocare con i lego per costruire fantasiose architetture, ma con gli stessi pezzi.

2. Non sono un grande fan delle soluzioni algoritmiche quando si tratta di ricercare la Qualità. Anche perché un motore di ricerca qualitativo per me dovrebbe essere in grado di rispondere non solo alla domanda "Quali sono i nuovi trend?" (Techmeme ci riesce piuttosto bene, come hai detto), ma soprattutto "Fammi vedere un sunto di tutte le opinioni su questa notizia, e la loro diffusione".
Nell'attesa di una tale tecnologia, l'anno scorso proposi alblogtalk una soluzione "umana" al problema dell'information overload, magari è tempo di riprenderla in mano ;)
http://video.google.de/videoplay?docid=7784367314297536207&hl=de
14

leeander 2007 09 18 at 10:30

Mai usato DIGG. Ne ho visto una presentazione all'eTech almeno 4 anni fa e già allora non mi aveva convinto. Il principio per cui la selezione -nel vasto mare dei contentuti- sia fatta per votazione della massa indistinta, rende troppo "generico" il vincitore. Per cui -leggendo DIGG- di fatto non trovavo mai nulla di veramente interessante per me. Anche perchè -personalmente- sono interessato ai segnali deboli (che appaiono quando un cambiamento è ancora all'inizio della sua vita) e non alle strombazzate che giungono quando oramai i giochi sono fatti.

Trovo molto piu' interessante il concetto di "personal search engine", ovvero di motore che cerca in fonti da te selezionate, ma -soprattutto- è in grado di proporti delle fonti alternativa parimenti valide. Concetto questo del tutto realizzabile se si profilano i propri lettori e si verificano gli ARGOMENTI realmente letti. Uno dei tanti tentativi in tal senso lo sta mettendo in piedi un personaggio DOC della user experience, ovvero Dirk Knemeyer. Al momento il suo Spivot è per soli user registrati etc etc, ma sapendo l'ambizione che c'è dietro, se dovesse funzionare...
15

Babele Dunnit 2007 09 18 at 10:43

Siamo sempre li', e' il solito feedback positivo. Piu' e' votato, piu' e' di moda, piu' e' di moda e piu' e votato. Il caro vecchio "effetto valanga" della Teoria della Complessita'. Ci vorrebbero invece algoritmi capaci di muoversi "sull'orlo del caos", INTORNO a questi attrattori che sono delle CATASTROFI, dei punti di morte e cristallizzazione dell'informazione. Cosi' potrebbero scoprire notizie CORRELATE a quelle "di moda", non semplicemente le solite palle.... pero' adesso non mi viene in mente nulla, magari andate avanti voi e fatemi un fischio quando inizia a funzionare... :)
16

Folletto Malefico 2007 09 18 at 11:00

@Leeander: questo mi fa venire in mente una meta-considerazione. Ovvero, che in modo analogo in cui internamente a Digg le notizie di moda sono votate creando un circolo vizioso, anche Digg stesso in quanto di moda si autoalimenta in modo vizioso: io utente ho il controllo! Quindi lo uso!
Due forme di viralità quindi, una interna ed una esterna...

@Babele: muoversi sull'orlo del caos. Sarebbe fantastico. :) Credo che prima dovremo passare per un più semplice 'selettore più furbo di contenuti', come accennava Bru, ma credo che la meta possa essere sicuramente quella... per quanto, in ogni caso, sarebbe anche in tale ottica solamente un certo tipo di Qualità, quella che interessa a noi.

In definitiva, mi sembra esca da quasi tutti un concetto interessante, che Lee ha sintetizzato bene con 'segnali deboli', anche se amo l'espressione 'muoversi sull'orlo del caos'. :D
17

Lobotomia 2007 09 18 at 18:08

beh dalla mia non sono mai riuscito ad utilizzare Digg, per i miei gusti è troppo "ammassato", però si, il nome, l'essere i primi, l'essere americani etc etc fa tanto... purtroppo...
18

Folletto Malefico 2007 09 18 at 18:45

Non credo comunque che il suo successo sia dettato da fattori estrinseci come nazionalità e essere primi: alla fine si tratta del miglior sistema attualmente esistente e a basso costo. Come credo detto anche da Bru, la qualità di Digg per una buona percentuale di persone è sufficiente, perché esprime i suoi interessi.

Ora però serve il passo successivo... sia per chi vuole la Qualità, sia per tutti gli altri che comunque ne beneficerebbero. ;)
19

Lady 2007 09 19 at 17:38

conclusione : avremo bisogno ancora per un po' dei giornalisti... mi bastano una trentina di anni, tempo di andare in pensione :p
20

Folletto Malefico 2007 09 19 at 22:33

La figura del giornalista non credo sinceramente andrà in crisi, al più lo andranno i giornali cartacei, ma quella è un'altra storia. ;)

Leave your Comment

required

required, hidden, never shared

Some HTML allowed: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Trackback this post ~ Subscribe to the comments via RSS Feed