Nel 2019 BuzzFeedNews ha scoperto e denunciato un mercato losco per la vendita di linkrot del New York Times, della BBC, di Forbes, della CNN e di altri importanti siti di notizie, e ha raccontato il caso di un uomo che nel 2012 aveva pubblicato sul NYT un necrologio con un link che puntava ad un sito commemorativo. Il sito invitava i lettori a fare beneficenza in memoria del morto.
Ad un certo punto, dice Dean Sterling Jones, collaboratore di BFN, l’uomo ha smesso di pagare per il nome di dominio, e ciò ha permesso a esperti di SEO e marketing digitale di acquistarlo per rivenderlo a un’azienda che offriva hack sulla Marijuana, notizie e informazioni sulla Cannabis ricreativa e medica, e perfino ricette per tortini a base di erba e video da guardare quando si è sballati.
Il fenomeno dei linkrot è molto esteso. Jenny Halasz, esperta SEO su searchenginejournal.com, dice che i motivi del fenomeno sono riconducibili a quattro cause:
1) errori sul sito live a causa di pagine rimosse o spostate;
2) errori causati da vecchi collegamenti a pagine che non esistono più;
3) malformazione dei link dovuta a errori nella digitazione degli URL in un collegamento. Se guardi i log del server di un qualsiasi sito web, dice Halasz, vedrai tonnellate di questo tipo di errori;
4) Errori 404 sistemici, dovuto a un malfunzionamento della mappa XML del sito, che incasina gli URL, oppure a qualcosa nel codice del sito che crea URL non validi che Google trova durante la scansione.
Il 21 maggio scorso, con un tweet, Jonathan Zittrain, Professore di diritto internet e diritto internazionale alla Harvard Law School, e Professore di informatica alla Harvard School of Engineering and Applied Sciences, ha annunciato che, insieme al Digital Team del New York Times, ha compilato un elenco di 2,2 milioni di collegamenti ipertestuali (link) che dal sito dal NYT puntano verso siti esterni.
L’obiettivo della ricerca era scoprire quanti di questi link erano diventati dei linkrot.
Il problema, dice Zittrain, va oltre il giornalismo. In uno studio del 2014, ad esempio, abbiamo scoperto che quasi la metà di tutti i collegamenti ipertestuali nei pareri della Corte Suprema portavano a contenuti che erano scomparsi da internet.
Quando un host, intenzionalmente o meno, elimina il contenuto di un URL, i lettori trovano un sito Web non raggiungibile. Questo decadimento dei contenuti Web, spesso irreversibile, è comunemente noto come linkrot.
I ricercatori della Harvard Law School, sulla base di un set di dati forniti dal New York Times, hanno esaminato i collegamenti ipertestuali negli articoli del giornale a partire dal lancio del sito web del Times nel 1996 e fino alla metà del 2019.
Il sostanziale linkrot e la deriva dei contenuti che abbiamo trovato, dice Zittrain, riflettono le difficoltà intrinseche del collegamento a lungo termine a parti di un «Web volatile».
Abbiamo scoperto che, dice Zittrain, “i 553.693 articoli da noi esaminati contenevano 2.283.445 collegamenti ipertestuali che puntavano a contenuti esterni a nytimes.com. Il 72% di questi erano link diretti, con un percorso a una pagina specifica, come example.com/article, che è dove abbiamo concentrato la nostra analisi“.
Il 25% di questi deep link, dice Zittrain, erano completamente inaccessibili. Il Linkrot, dice, è diventato più comune nel tempo: il 6% dei link del 2018 era marcio, rispetto al 43% dei link del 2008 e al 72% dei link del 1998. Il 53% di tutti gli articoli che contenevano link profondi aveva almeno un link marcio (rotted).
Visto lo spostamento sul web di tutti i siti di informazione e di tutte le riviste scientifiche, o il deposito in archivi internet dei libri, in alcuni casi pubblicati solo in formato digitale, il problema dell’archiviazione e della citazione scientifica assume una nuova rilevanza.
È del tutto inutile perseverare nelle pratiche citazionistiche sviluppate per la carta, e ritenere che, una volta indicato il rimando corretto alla fonte, il proprio compito sia stato assolto. Bisogna ripensare i termini dell’archiviazione e il nostro rapporto alla storia.
Tenendo a mente il motto di Rosenzweig: l’istante può salvarsi dalla potenza eternamente invecchiante del passato soltanto in quanto viene generato nuovo a ogni istante. Questo incessante rinnovamento del presente però è opera del futuro. Se vogliamo salvare quel bel mondo fatto di carta e pergamene, con tutte le sue pratiche da topo di biblioteca, non si può divinizzare il passato – il futuro ci rimacinerà comunque.
Secondo un’inchiesta dl CJR del 28 marzo 2019 (cjr.org) gli intervistati, spesso (e erroneamente), hanno identificato il backup digitale e l’archiviazione in Google Docs o nei sistemi di gestione dei contenuti, come sinonimi di archiviazione. Non sono la stessa cosa – dice Zittrain. Il backup si riferisce alla creazione di copie per il ripristino dei dati in caso di danni o perdite, mentre l’archiviazione si riferisce alla conservazione a lungo termine, garantendo che i record saranno ancora disponibili anche se le tecnologie di formattazione e distribuzione cambiano in futuro. La mera archiviazione o il salvataggio non garantiscono il corretto funzionamento dei rimandi delle citazioni.
Le soluzioni trovate sino ad adesso, per esempio archive.org, con la sua WayBackMachine, oppure il sistema implementato da Wikipedia per sostituire automaticamente i collegamenti marci con quelli di archiv web, sono apprezzabili, ma non sono sufficienti. E nemmeno il DOI (digital object identifier) sembra, per adesso, rispondere pienamente a questa esigenza, anche se può rappresentare un passo intermedio nella soluzione del problema.
In ogni caso bisogna stare in campana, altrimenti si rischia l’azzeramento della memoria, che non consiste in un lavaggio del cervello, perché il cervello, da solo, non ha la capacità di tenere il passato con la stessa persistenza della carta o del silicio.
- © Riproduzione possibile DIETRO ESPLICITO CONSENSO della REDAZIONE di CONTROPIANO
Ultima modifica: stampa