Linkrot: un tortino di marijuana e un morto

Nel 2019 BuzzFeedNews ha scoperto e denunciato un mercato losco per la vendita di linkrot del New York Times, della BBC, di Forbes, della CNN e di altri importanti siti di notizie, e ha raccontato il caso di un uomo che nel 2012 aveva pubblicato sul NYT un necrologio con un link che puntava ad un sito commemorativo. Il sito invitava i lettori a fare beneficenza in memoria del morto.

Ad un certo punto, dice Dean Sterling Jones, collaboratore di BFN, l’uomo ha smesso di pagare per il nome di dominio, e ciò ha permesso a esperti di SEO e marketing digitale di acquistarlo per rivenderlo a un’azienda che offriva hack sulla Marijuana, notizie e informazioni sulla Cannabis ricreativa e medica, e perfino ricette per tortini a base di erba e video da guardare quando si è sballati.

Il fenomeno dei linkrot è molto esteso. Jenny Halasz, esperta SEO su searchenginejournal.com, dice che i motivi del fenomeno sono riconducibili a quattro cause:

1) errori sul sito live a causa di pagine rimosse o spostate;

2) errori causati da vecchi collegamenti a pagine che non esistono più;

3) malformazione dei link dovuta a errori nella digitazione degli URL in un collegamento. Se guardi i log del server di un qualsiasi sito web, dice Halasz, vedrai tonnellate di questo tipo di errori;

4) Errori 404 sistemici, dovuto a un malfunzionamento della mappa XML del sito, che incasina gli URL, oppure a qualcosa nel codice del sito che crea URL non validi che Google trova durante la scansione.

Il 21 maggio scorso, con un tweet, Jonathan Zittrain, Professore di diritto internet e diritto internazionale alla Harvard Law School, e Professore di informatica alla Harvard School of Engineering and Applied Sciences, ha annunciato che, insieme al Digital Team del New York Times, ha compilato un elenco di 2,2 milioni di collegamenti ipertestuali (link) che dal sito dal NYT puntano verso siti esterni.

L’obiettivo della ricerca era scoprire quanti di questi link erano diventati dei linkrot.

Il problema, dice Zittrain, va oltre il giornalismo. In uno studio del 2014, ad esempio, abbiamo scoperto che quasi la metà di tutti i collegamenti ipertestuali nei pareri della Corte Suprema portavano a contenuti che erano scomparsi da internet.

Quando un host, intenzionalmente o meno, elimina il contenuto di un URL, i lettori trovano un sito Web non raggiungibile. Questo decadimento dei contenuti Web, spesso irreversibile, è comunemente noto come linkrot.

I ricercatori della Harvard Law School, sulla base di un set di dati forniti dal New York Times, hanno esaminato i collegamenti ipertestuali negli articoli del giornale a partire dal lancio del sito web del Times nel 1996 e fino alla metà del 2019.

Il sostanziale linkrot e la deriva dei contenuti che abbiamo trovato, dice Zittrain, riflettono le difficoltà intrinseche del collegamento a lungo termine a parti di un «Web volatile».

Abbiamo scoperto che, dice Zittrain, “i 553.693 articoli da noi esaminati contenevano 2.283.445 collegamenti ipertestuali che puntavano a contenuti esterni a nytimes.com. Il 72% di questi erano link diretti, con un percorso a una pagina specifica, come example.com/article, che è dove abbiamo concentrato la nostra analisi“.

Il 25% di questi deep link, dice Zittrain, erano completamente inaccessibili. Il Linkrot, dice, è diventato più comune nel tempo: il 6% dei link del 2018 era marcio, rispetto al 43% dei link del 2008 e al 72% dei link del 1998. Il 53% di tutti gli articoli che contenevano link profondi aveva almeno un link marcio (rotted).

Visto lo spostamento sul web di tutti i siti di informazione e di tutte le riviste scientifiche, o il deposito in archivi internet dei libri, in alcuni casi pubblicati solo in formato digitale, il problema dell’archiviazione e della citazione scientifica assume una nuova rilevanza.

È del tutto inutile perseverare nelle pratiche citazionistiche sviluppate per la carta, e ritenere che, una volta indicato il rimando corretto alla fonte, il proprio compito sia stato assolto. Bisogna ripensare i termini dell’archiviazione e il nostro rapporto alla storia.

Tenendo a mente il motto di Rosenzweig: l’istante può salvarsi dalla potenza eternamente invecchiante del passato soltanto in quanto viene generato nuovo a ogni istante. Questo incessante rinnovamento del presente però è opera del futuro. Se vogliamo salvare quel bel mondo fatto di carta e pergamene, con tutte le sue pratiche da topo di biblioteca, non si può divinizzare il passato – il futuro ci rimacinerà comunque.

Secondo un’inchiesta dl CJR del 28 marzo 2019 (cjr.org) gli intervistati, spesso (e erroneamente), hanno identificato il backup digitale e l’archiviazione in Google Docs o nei sistemi di gestione dei contenuti, come sinonimi di archiviazione. Non sono la stessa cosa – dice Zittrain. Il backup si riferisce alla creazione di copie per il ripristino dei dati in caso di danni o perdite, mentre l’archiviazione si riferisce alla conservazione a lungo termine, garantendo che i record saranno ancora disponibili anche se le tecnologie di formattazione e distribuzione cambiano in futuro. La mera archiviazione o il salvataggio non garantiscono il corretto funzionamento dei rimandi delle citazioni.

Le soluzioni trovate sino ad adesso, per esempio archive.org, con la sua WayBackMachine, oppure il sistema implementato da Wikipedia per sostituire automaticamente i collegamenti marci con quelli di archiv web, sono apprezzabili, ma non sono sufficienti. E nemmeno il DOI (digital object identifier) sembra, per adesso, rispondere pienamente a questa esigenza, anche se può rappresentare un passo intermedio nella soluzione del problema.

In ogni caso bisogna stare in campana, altrimenti si rischia l’azzeramento della memoria, che non consiste in un lavaggio del cervello, perché il cervello, da solo, non ha la capacità di tenere il passato con la stessa persistenza della carta o del silicio.

Ultima modifica: 24 Maggio 2021, ore 7:10 stampa

Lun	Mar	Mer	Gio	Ven	Sab	Dom
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Cookie	Durata	Descrizione
cookielawinfo-checkbox-advertisement	1 anno	Impostato dal plugin GDPR Cookie Consent, questo cookie viene utilizzato per registrare il consenso dell'utente per i cookie nella categoria "Pubblicità".
cookielawinfo-checkbox-analytics	11 mesi	Questo cookie è impostato dal plug-in GDPR Cookie Consent. Il cookie viene utilizzato per memorizzare il consenso dell'utente per i cookie nella categoria "Analisi".
cookielawinfo-checkbox-functional	11 mesi	Il cookie è impostato dal consenso cookie GDPR per registrare il consenso dell'utente per i cookie nella categoria "Funzionali".
cookielawinfo-checkbox-necessary	11 mesi	Questo cookie è impostato dal plug-in GDPR Cookie Consent. I cookie vengono utilizzati per memorizzare il consenso dell'utente per i cookie nella categoria "Cookie Tecnici".
cookielawinfo-checkbox-others	11 mesi	Questo cookie è impostato dal plug-in GDPR Cookie Consent. Il cookie viene utilizzato per memorizzare il consenso dell'utente per i cookie nella categoria "Altri".
cookielawinfo-checkbox-performance	11 mesi	Questo cookie è impostato dal plug-in GDPR Cookie Consent. Il cookie viene utilizzato per memorizzare il consenso dell'utente per i cookie nella categoria "Prestazioni".
CookieLawInfoConsent	1 anno	Registra lo stato del pulsante predefinito della categoria corrispondente e lo stato del CCPA. Funziona solo in coordinamento con il cookie principale.
viewed_cookie_policy	11 mesi	Il cookie è impostato dal plug-in GDPR Cookie Consent e viene utilizzato per memorizzare se l'utente ha acconsentito o meno all'uso dei cookie. Non memorizza alcun dato personale.

Cookie	Durata	Descrizione
_ga	2 anni	Il cookie _ga, installato da Google Analytics, calcola i dati di visitatori, sessioni e campagne e tiene anche traccia dell'utilizzo del sito per il report di analisi del sito. Il cookie memorizza le informazioni in modo anonimo e assegna un numero generato casualmente per riconoscere i visitatori unici.
_gat_gtag_UA_20623897_1	1 minuto	Impostato da Google per distinguere gli utenti.
_gid	1 giorno	Installato da Google Analytics, il cookie _gid memorizza informazioni su come i visitatori utilizzano un sito web, creando anche un report analitico delle prestazioni del sito web. Alcuni dei dati raccolti includono il numero di visitatori, la loro fonte e le pagine che visitano in modo anonimo.
CONSENT	2 anni	YouTube imposta questo cookie tramite i video di YouTube incorporati e registra dati statistici anonimi.

Cookie	Durata	Descrizione
VISITOR_INFO1_LIVE	5 mesi 27 giorni	Un cookie impostato da YouTube per misurare la larghezza di banda che determina se l'utente ottiene la nuova o la vecchia interfaccia del lettore.
YSC	sessione	Il cookie YSC è impostato da Youtube e viene utilizzato per tracciare le visualizzazioni dei video incorporati sulle pagine di Youtube.
yt-remote-connected-devices		YouTube imposta questo cookie per memorizzare le preferenze video dell'utente utilizzando il video YouTube incorporato.
yt-remote-device-id		YouTube imposta questo cookie per memorizzare le preferenze video dell'utente utilizzando il video YouTube incorporato.

Linkrot: un tortino di marijuana e un morto

Argomenti:

Lascia un commento Annulla risposta

ARTICOLI CORRELATI

L’illusione di essere eruditi 2.0

La Germania annuncia la competizione con gli Usa sulle reti internet

Lo sceriffo di Nottingham è tornato