08
11
07

Su internet, o perché i feed potrebbero essere una strada senza uscita

22:04 Technocracy

Come spesso mi succede, oggi mentre facevo le azioni automatizzate della routine quotidiana mi è venuto in mente quanti pochi dei miei lettori si accorgessero che il sottotitolo di questo blog cambia ogni tot giorni.
Al che, un pensiero: e se i feed fossero una strada senza uscita?

Pensando un attimo all’evoluzione del web, abbiamo avuto agli esordi HTML 1.0 che era ingenuo e incompleto, ma possedeva una chiara struttura semantica. I tag esistenti erano strutturati.

An HTML instance is like a text file, except that some of the characters are interpreted as markup. The markup gives structure to the document.
HTML 1.0 RFC, 1993

Poi ci si accorse che le pagine erano come quelle su carta, e si sono iniziati ad aggiungere elementi per arricchire la visualizzazione, rendendo il codice di fatto non un formato per strutturare dati, ma un formato per visualizzare contenuti.

Successivamente ci si accorse che in questo modo era impossibile leggere la pagina in modo automatico. Non c’era più alcun significato semantico: h1 usati per evidenziare testi, pagine senza struttura, farciture di colore, banner pubblicitari.

Idea: usiamo XML, facilmente elaborabile dalle macchine, e rendiamo disponibile un contenuto uniforme sul web (glisserò su XSLT, che considero un aborto tecnicista).
Nacque così RSS e i successivi figli RDF, Atom e simili. Ovvero dei contenitori per uniformare le fonti testuali in modo da renderle comparabili.

Feed evolves into HTMLAl che, pensavo: ma lo scopo di RSS e simili non è alla fine lo stesso che aveva HTML 1.0, ovvero strutturare contenuto?

Rifinito, certo. Raffinato dalla comprensione di cosa sia realmente necessario e da anni di teoria (ontologia, fra le altre) e pratica (spider, validatori, reader).

E se alla fine di tutto questo, si tornasse ad (X)HTML, puro, con la giusta separazione di dati e presentazione fatta tramite CSS?

27 comments Add yours below

1

Stefano Epifani 2007 11 08 at 22:24

non vedrei l'RSS come un sistema per strutturare contenuto, quanto piuttosto come un sistema per fare syndacation...
2

Folletto Malefico 2007 11 08 at 22:30

Beh le due cose si sovrappongono in modo abbastanza stretto. Syndication significa pubblicare su più fonti, quindi per farlo è sufficiente che il contenuto sia elaborabile.

Il problema è appunto che il contenuto dei blog non lo è perché privo di struttura e quindi è stato necessario creare un formato per fare syndication ad-hoc, RSS. :)
Per funzionare, RSS deve essere strutturato, altrimenti mancherebbe al suo scopo. E internamente se andiamo a vedere si sta evolvendo, arricchendo la struttura con un numero sempre crescente di funzionalità.

Se ci pensi nel senso che ho suggerito io c'è già l'iniziativa dei microformats, che utilizza l'HTML definendo dei formati standard uniformi. ;)
3

Alberto 2007 11 08 at 22:33

Era mesi che non entravo nel tuo blog: ti leggo sempre via feed.
E' buffo pensare che mi farebbe piacere che i miei lettori mi leggessero sul blog e poi io leggo gli altri via feed.
E' evidente però che l'uso del feed permette una maggior velocità e quindi la possibilità di leggere più informazioni.

Se avessimo la fibra ottica fino in casa non si noterebbe la differenza di tempo tra caricamento di un feed e del blog ma sono certo che riempiremmo il blog di roba pesante (tanto c'è la fibra) e torneremmo a creare la differenza di velocità tra i feed e il blog!
4

Folletto Malefico 2007 11 08 at 22:38

Beh io ho la fibra ottica, l'aggregatore è comunque necessario non tanto per il peso, ma per la quantità di dati. Una volta resa gestibile quella, salta poi fuori di nuovo il problema della presentazione dei contenuti, un po' come un cane che si morde la coda. :)

Tra l'altro su NetVibes che uso c'è una interessante modalità ibrida che dal feed apre la pagina giusta del sito invece del testo del feed. Utilissimo su certi blog. :)

P.S.: tu pensa, io che mi faccio pure un mazzo tanto per avere la grafica del sito bella e nessuno che la guarda. ;)
5

Alberto 2007 11 08 at 23:14

Non ha la fibra ottica come la intendo io.
Tu hai la fibra fino all'edificio (FTTB), in rame poi arriva all'HAG e hai 10Mbit di banda simmetrica condivisa con tutto il vicinato. Tanto per peggiorare la cosa hai un simpatico NAT con improbabili indirizzi privati interni.

Io parlo di fibra fino in casa FTTH che termina almeno a 100Mbit simmetrici e che garantisce il 100% della banda fino alla centrale (singolo colore su fibra dedicato o al massimo condiviso con pochi altri) e poi meno fino ad internet.

A parte la mini polemica sulla "fibra" di Fastweb concordo sulla mole di dati e sul fatto che leggerla via feed è l'unico modo per non esplodere.
6

Folletto Malefico 2007 11 08 at 23:23

Uh? 10mbit con tutto il vicinato? :) No, no. Non funziona mica così. :)
Al Cisco Catalyst nel palazzo arriva fibra, e non sono 10mbit. Fastweb è FTTH (1, 2). :) Ti assicuro che io ho in casa la fibra, con praticamente 1.2Mbytes/s di banda disponibile 24/24h. ;)

~

In any case, come dicevamo il problema non è la mole tecnica di dati, ma la mole dei contenuti e la sua elaborazione. Un HTML veramente semantico potrebbe aiutare? Non lo escludo. :)


7

Simbul 2007 11 09 at 00:33

Provo a buttare giù una prospettiva diversa: quello che fanno i feed è scremare ciò che cambia da ciò che non cambia.
Poco tempo + tante informazioni = vogliamo vedere solo quello che è cambiato, perché non possiamo permetterci di perderci anche sul resto.

Quindi devi fare un feed per il sottotitolo del blog :P
8

Folletto Malefico 2007 11 09 at 01:07

Con quella definizione salta immediatamente all'occhio che:
1. un feed RSS è un'altra fonte dati, diversa dal sito di origine
2. un feed RSS non mostra cosa è cambiato, ma fornisce (come il sito) una sequenza cronologica di informazioni
3. un blog 'ridotto' corrisponde alla stessa definizione
4. non è necessario strettamente RSS

In altri termini, se quello fosse lo scopo E avessimo la strutturazione semantica in HTML, il feed non sarebbe altro che una serie di link. Nessuna replicazione di contenuto. :)
9

Nemo 2007 11 09 at 01:17

La strutturazione imposta dagli RSS (e compagni) fa sì di non obbligare le persone a strutturare i propri contenuti allo stesso modo, pur garantendo una struttura parallela dello stesso contenuto che è uguale per tutti. In sostanza, chi pubblica contenuti oggigiorno, si avvale di due strutturazioni differenti dello stesso contenuto. L'una, quella Web classica, dettata dalle esigenze più disparate, non ultima la SEO. L'altra, piatta, uguale per tutti, quella RSS/Atom/altro, che permette un usufrutto di contenuti diversi strutturati però allo stesso modo.

La differenza tra le due strutture non sta nella tecnologia (si legga, tra l'altro, linguaggio di markup) con la quale la struttura viene realizzata, ma nelle esigenze e nei concetti che giacciono dietro tale struttura.

Per ripetermi, come è mio solito fare, le esigenze dietro la strutturazione Web sono molteplici, le esigenze dietro l'RSS sono poche, sostanzialmente quella di eguagliare la strutturazione di contenuti provenienti da fonti differenti, questo al fine (principale, ma non solo) di poter disporre di un modo univoco per accedere ai dati, alle singole entry, alle singole novità, che portano poi alla fruizione del web in maniera asincrona, che è la vera e unica comodità dal punto di vista utente di una tale metamorfosi.

Che poi un feed possa essere in XML, HTML, XHTML, SGML, e chissà qualche altro mostro ameno, non conta chissà quanto.

Attualmente i più disparati aggregatori di Feed sono capaci di applicare CSS anche personalizzati ai contenuti di un feed, poiché il concetto non cambia: il linguaggio di markup struttura, il linguaggio di stile modella. E molti, tra l'altro, fanno ciò che Folletto ha già citato, ovvero caricare la pagina originale in luogo del contenuto "spoglio", quando si visita una voce di un feed. Funzionalità tra l'altro banale per il 99% degli aggregatori client che usano il motore di rendering di qualche browser.

Aggiungo, giusto per esser completi, che se il feed è creato bene dall'applicazione web che lo produce (o meglio ancora, da chi ha scritto la funzionalità dell'applicazione web che lo produce), e se l'aggregatore anche è fatto bene, tutto ciò che è considerato contenuto, viene mostrato nel feed.

Infatti, il mio aggregatore legge benissimo anche titolo e sottotitolo del blog del qui presente Folleto, e io mi accorgo benissimo del fatto che cambi.

È bene avere chiaro che non c'è nessuna entità soprannaturale che crea i feed e che, se un feed non riporta qualcosa che invece si ritiene debba riportare, allora ciò non vuol dire che il concetto di feed, lo strumento feed, è sbagliato o limitato. Vuol dire una cosa più semplice: il feed, inteso come instanza specifica, come struttura parallela dei contenuti di uno specifico sito, è creato male. Basta aggiustare questo.
10

Folletto Malefico 2007 11 09 at 01:33

Mi sa che nel discorso che hai fatto si è un po' perso il punto da cui ero partito. In altri termini, devi iniziare dallo scopo che un feed ha e perché è nata quella necessità, non da cosa il feed è e cosa serve oggi. :)

In altri termini, facciamo una speculazione: HTML è un linguaggio dati come ora è RSS (o semantico) e non una struttura per definire il layout grafico.
In una situazione simile, cosa sarebbe successo?
Probabilmente, il feed sarebbe nato, ma come necessità funzionale e non come struttura dati parallela. Quindi, il feed avrebbe al suo interno il link alle risorse, precise, che sono state variate sul sito originale, in rapporto alle necessità dell'autore di segnalarle.

L'aggregatore, in questa ipotetica situazione, andrebbe quindi sulla risorsa segnalata, questa volta semantica, e potrebbe tranquillamente rilevare - esattamente come fa oggi - la nuova pagina che è apparsa sul sito (o il nuovo contenuto, non dimentichiamo dell'esistenza degli anchor).

In questa ipotetica situazione si esplicita a mio avviso in modo eccellente perché il feed è una strada senza uscita.
Perché oggi sta succedendo - e l'hai detto anche tu - che i feed si arricchiscono di metadati anche grafici. Alcuni introducono CSS e javascript.
Dall'altro punto di vista, si evidenzia simultaneamente il fatto che al diffondersi dei feed nascono gli stessi problemi che si hanno con l'HTML: output non standard, browser non compatibili, encoding errati, CSS letti qui si e là no. History repeats. :)

Non si tratta di un problema di feed, quindi. ;)
E' più chiaro ora il ragionamento? :)
11

Nemo 2007 11 09 at 02:14

Oggi l'HTML non è più tanto votato al layouting.

Ad ogni modo, manca sicuramente di strutture aggiuntive che permettano di definire metainformazione.

Ma avere la metainformazione nello stesso file del contenuto strutturato non è a mio avviso una cosa buona. Una terza separazione. Questo è il punto giusto, secondo me. Come è avvenuto per lo stile.

Ma veniamo ai giorni nostri. Abbiamo i feed. Il feed non è una strada senza uscita. Il feed è il feed. È un paliativo. Per connotare pseudosemanticamente il cotenuto, lo duplica, senza tra l'altro avere nessun riferimento stretto col contenuto originale, che permetta di sfruttare la connotazione semantica nei motori di ricerca (o altri modi).

Lo scopo che il feed ha potuto avere in origine perde di importanza di fronte a ciò che è. La realtà fa la differenza. Quindi il feed a tutti gli effeti è un modo per accedere asincronamente al web. E solo quello.

Per il resto, bisogna studiare altre soluzioni, che poi, come effetto collaterale, potranno avere anche un "ridimensionamento" dei feed, che potranno divenire qualcosa di simile a ciò che tu hai in mente.

Magari è per questo discorso che tu vedi il feed una strada chiusa. Ma il fatto è che agli albori, RDF è nato per far sì di inserire stralci di contenuti provenienti da vari siti all'interno del portale My Netscape. Insomma, è nato per aggregare contenuti. Che è quello che fa tutt'oggi RSS, agli atti pratici.

Quello che tu dici, non esiste ancora. E non mi spiego neanche perché. Non è né la prima né l'ultima volta che penso alla metainformazione come "foglio terzo" che "etichetta" il contenuto. E non mi pare male.

Per finire, voglio precisare che prima non ho detto che nei feed si trovano nuovi metadati di tipo risorsa (grafica, javascript, etc.), anche perché non mi risulta questa cosa e sopratutto è sicuramente fuori standard. Ho semplicemente detto che, essendo una struttura XML, tutti i gli aggregatori ci attacano sopra un (proprio o user-defined) CSS per presentarlo.
12

Folletto Malefico 2007 11 09 at 02:29

Infatti, quello che dico non esiste... per quello era un pensiero che mi è venuto che ha portato ad una interessante discussione. :)

Per il resto, è ovvio che ci si deve rifare alla situazione attuale, la spiegazione di cui sopra serviva solamente per chiarire il punto. :)

In ogni caso, ora ci siamo. Infatti il punto non è neppure che "la via sia HTML", bensì che è curiosa la genesi molto simile di entrambi gli strumenti e la deriva che entrambi han compiuto. :)

Interessante l'approccio che richiederebbe una terza entità. Riprenderei infatti il discorso XSLT dal punto di vista concettuale, che per quanto lo ritenga fatto malissimo, il suo scopo "in astratto" (mai realizzato) potrebbe essere questo:
- XHTML per la semantica
- XSLT per il layout
- CSS per la grafica
- RSS/RDF/Atom per i feed
Peraltro, questo è stato anche il mio primo approccio a XSLT, che fallì miseramente quando notai anni fa che il supporto sui browser era nullo. :)

Certo, si può anche definire (X)HTML per il layout e "qualcos'altro" per la strutturazione (o la semantica). Per certi versi sarebbe più semplice, per altri più complesso. :)
Oppure, è anche possibile che tutta la parte di layout la faccia CSS, e quindi non serva altro.
Ancora, è possibile che invece un formato tipo RDF si ampli al punto di inglobare il markup XHTML.

Il ragionamento è comunque interessante. :)

~

Apro una parentesi sul titolo del post: strada chiusa per la funzione che i feed stanno avendo oggi: ridistribuire i contenuti, veicolando *ANCHE* il contenuto. Questa è la possibile strada chiusa.

In altri termini, la veicolazione del contenuto potrebbe diventare una replicazione di una struttura che in futuro potrebbe già trovarsi altrove, più ricca. In quest'ottica, il feed si "svuoterebbe" e tornerebbe allo scopo iniziale identificato bene da Simbul. :)
13

Khorne 2007 11 09 at 08:44

Io so solo che i feed non li uso, mi passo tutti i blog a uno a uno (sai che fatica... ne leggo al massimo sei o sette) e ogni volta che il sottotitolo cambia me ne accorgo :P
14

curson 2007 11 09 at 14:15

Ti dirò, condivido (almeno in parte) il tuo pensiero di partenza.
Alla fine un feed RSS lo vedo come una consegna a domicilio, quando invece visitare un blog direttamente è andarsi a mangiare la pizza fuori.
Personalmente ho una lista di Feed a cui sono sottoscritto che è lunga chilometri, ma mi serve solo per fare una scrematura. Leggo i Feed meno interessanti (tra l'altro in testo puro, niente HTML con immagini, per scelta...) direttamente tramite l'aggregator del mio browser (Opera), ma clicco quasi sempre sui link dei post che mi interessa leggere meglio ed eventualmente commentare.
Insomma: sono uno da ristorante, tranne quando sono di fretta.

p.s.: io il tuo blog lo visito, ma mica mi ero accorto del sottotitolo :p
15

Telemaco 2007 11 09 at 14:40

Riflessione interessante. Il punto e' che i feed hanno una struttura semantica allo stesso tempo piu' leggera e piu' rigida. Fondamentalmente, nel feed piu' base che si possa concepire, basterebbero due "tag": titolo, contenuto. Nell'HTML, c'e' chi per il titolo usera' h1, chi h2, chi h3, chi . Per il contenuto non ne parliamo. div, p, li, sono elementi che fanno da contenitore al "postbody" dei diversi blog. Per utilizzare l'(X)HTML come linguaggio strutturato per gli aggregatori, occorrerebbe che tutti i blog utilizzassero lo stesso markup strutturale.

Onestamente, un peccato anche per la creatività del singolo. Tutto questo, rigorosamente IMVHO.
16

Folletto Malefico 2007 11 09 at 16:15

@curson: Il sottotitolo è in effetti una finezza mia, se volessi realmente che fosse valorizzato l'avrei feedato. :P
Mi piace la metafora. :)
"Io sono uno da ristorante, tranne quando sono di fretta". :)
17

Folletto Malefico 2007 11 09 at 16:20

@Telemaco: hai colto il punto essenziale a mio avviso nella distinzione fra i due, in altri termini, la "reale" differenza esistente se entrambi fossero semantici. :)

Ci ho pensato... e riflettevo che si dovrebbe poter ottenere il meglio delle due fonti. Allora:

A.
Da un lato, potremmo avere un feed che linka una specifica parte della pagina e l'aggregatore pesca tutto quello presente al suo interno e nient'altro. Una sorta di 'estrazione' di contenuto. Invece che prendere il campo "description", prenderebbe il campo "entro cui è presente l'anchor dell'URL".
Computazionalmente più esoso, ma in prospettiva potrebbe fruttare molto bene.

B.
Microformats. In fondo, un motore blog invece di farsi problemi per generare feed, potrebbe farseli per taggare i post con classi e id specifici. Con un parser per microformats, basterebbe analizzare quello e si estrarrebbe il contenuto.

Queste sono le prime idee che mi sono venute... :)
18

Lady 2007 11 09 at 19:00

un ciclo continuo... la vita è ciclica...
in verità non uso mai i feed. non mi piacciono, mi fanno distrarre... troppo testo. non provocano nessuna affezione particolare... preferisco navigarli i siti... e pensare "chissà che ha scritto folle", "chissà cosa dice xxx" e andare sul sito. anche perchè, cercando una cosa se ne trova un'altra. con i feed raramente è così...
19

Telemaco 2007 11 10 at 00:02

Finito ora di leggere i commenti. Sia tu che Nemo ad un certo punto individuate la soluzione nell'aggiungere un livello di complessità alla strutturazione di una pagina Web; Nemo immaginando un "foglio semantico" da affiancare al foglio di stile, mentre tu immagini un "foglio layout". L'adozione di una delle due proposte potrebbe essere una soluzione ma a mio parere:
- entrambe "tradirebbero" i due fogli gia' a a disposizione. La strutturazione semantica e' esattamente lo scopo dell'HTML, e la gestione del layout quella dei CSS
- entrambe sarebbero soluzioni dall'impatto notevole sullo sviluppo e sul design, non so quanto realmente digeribili dalla comunità degli sviluppatori e ancor di piu' dai grossi provider di contenuti e servizi che dovrebbero adeguarsi.

I microformats secondo me sono un buon approccio al problema: c'e' bisogno di piu' semantica? Potenzio il foglio semantico che ho gia' a disposizione! Anche questa soluzione pero' e' viziata dall'approccio "additivo". Nuovi parametri per attributi che ho a disposizione, parametri che si puntano a rendere standard e a far leggere da browser, rendendoli quindi "stilabili" tramite CSS. Uno strumento potente, se standardizzato: vero.

Io partirei con un approccio ancora piu' conservativo, utilizzando quello che ho gia' a disposizione. Esempio? Rendere "stilabili" i tag nell'head-section. Il tag , ad esempio. Perche' devo ripetere il titolo del mio blog e sprecare un livello di intestazione, quando e' un'informazione che gia' ho? Cosi' facendo, "libererei" gli , che diverrebbero finalmente SOLO le intestazioni per i titoli di contenuto. Avremmo standardizzato gia' il titolo dei post. Idem per la description, author, keyword, eccetera: e' contenuto, e' markuppato, perche' non ho la possibilita' di renderlo a schermo? Ed e' GIA' uno standard. Solo una volta utilizzato *tutto* quello che ho gia' a disposizione, partirei con l'introdurre tag e attributi semanticamente forti e stra-standard. L'ho riletta, quasi quasi non e' una ideaccia eh?
20

Telemaco 2007 11 10 at 00:05

Oddio, mi spiace: i tag sono filtrati, non ci avevo fatto caso. Nella parte finale mi riferisco al tag *title*, ad *h1*, e agli attributi del tag *meta*
21

Folletto Malefico 2007 11 10 at 00:31

Beh, ovviamente stiamo speculando quindi si tratta di un ragionamento volto più alla nostra comprensione che ad uno scopo progettuale. ;)

Posso dirti però che personalmente ritengo più plausibile la via dei microformat rispetto ad un documento aggiuntivo, più o meno per i motivi che hai già citato. :)

Non credo però che la standardizzazione che citi sia funzionale: stai limitando uno strumento che già esiste con una struttura che è comunque da imparare e che restringe le possibilità.

Imparare per imparare, a quel punto è meglio usare i microformat: aggiungere un paio di attributi lascia la libertà di realizzazione del documento originale, e la parte da apprendere è comunque un livello sopra, con la differenza che è additiva e non sottrattiva. :)
22

bru 2007 11 14 at 02:27

saró breve, che scrivo dal palm: bella discussione. sí direi che rss ha fatto I'll suo tempo. benvenuti quindi microformat. dai un'occhiata a hAtom.
23

Telemaco 2007 12 04 at 18:32

Ciao, forse sto ravvivando un argomento morto e sepolto, ma ti volevo far dare un'occhiata a questo articolo sulle nuove specifiche dell'HTML5: http://www.alistapart.com/articles/previewofhtml5

Ipersemantico, eh? ;)
24

Folletto Malefico 2007 12 04 at 19:20

L'ho letto anche io oggi. :)
Il vero problema è che, almeno per quell'articolo, sembra che abbiano semantizzato elementi di layout... di fatto può aver senso, perché comunque HTML è presentazione e X(HT)ML è semantica... però mi mette qualche dubbio. Prima di tutto sulla reale praticità della cosa (non è sufficiente usare bene i CSS) e poi non mi è chiaro il senso semantico di quella scelta. :)

Sono un po' dubbioso, ma vedrò di chiarirmi i dubbi appena ci sarà qualcosa di più definitivo su cui parlare, anche raffrontato a XHTML. :)
25

Telemaco 2007 12 05 at 13:45

Detto tra noi, sottovoce, io sono assolutamente in disaccordo con la filosofia dietro le specifiche di HTML5. Online c'e' chi ha fatto dissertazioni ben piu' argomentate, che mi sentivo di sottoscrivere quantomeno al 90%; ma avevo studiato il tutto qualche mese fa. Nel caso ritrovassi qualcosa, ci faccio un post :)
26

deeproland 2007 12 05 at 18:13

non credo di poter fare a meno dei feed. anni fa esistevano meno posti dove andarsi a leggere le notizie e non c'erano i blog.
riuscivo a leggere quindi quei cinque o sei, anche dieci, siti al giorno, ma se avevo necessità di ritrovarmi delle notizie dovevo lavorare di bookmark.
adesso utilizzo un semplicissimo reader che fa per me gran parte del lavoro, e riesco a guardare per primo quel che mi interessa e man mano tutto il resto. ad esempio sono capitato qui per caso indirizzato da qualche altro blog di cui tengo traccia.
da utente meno specializzato (per nulla, diciamocelo) sulle caratteristiche dei nuovi standard del web, non mi pare una cosa negativa.
chissà quando inizieranno a metterceli sotto controllo?
27

Folletto Malefico 2007 12 05 at 21:51

@Telemaco: a naso penso che siano gli stessi motivi dietro ai miei dubbi. Comunque mi piacerebbe leggere la tua opinione dettagliata in merito (segnalala pure qui se ne scrivi). :)

@deeproland: ma infatti nessuno dice di abolire i feed come concetto, fai attenzione. :) Gli aggregatori potrebbero comunque esistere, semplicerebbe utilizzerebbero le stesse pagine che da utente vedi: la magia starebbe nel modo in cui le pagine verrebbero costruite. ;)

Leave your Comment

required

required, hidden, never shared

Some HTML allowed: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Trackback this post ~ Subscribe to the comments via RSS Feed