Os hiperlinks são uma ferramenta poderosa, seja para SEO ou para melhor entendimento de leitores, a perda de material de referência traz impactos negativos no SEO, perda de contextos ou conteúdos.
Uma equipe da Harvard Law trabalhou em conjunto com a equipe digital do New York Times examinando hiperlinks desde o lançamento do site do Times em 1996 até 2019. E foi descoberto que dentre 553.693 artigos estudados haviam 2,22.283.445 hiperlinks apontando para conteúdo externo, sendo 72% deles para uma página específica e 25% deles estavam inacessíveis.
Também foi descoberto que com o passar do tempo os links tinham mais probabilidade de morrer: 6% dos links de 2018 haviam estavam podres, em comparação com 43% dos links de 2008 e 72% dos links de 1998. 53% de todos os artigos continham pelos menos um link podre.
A pesquisa analisou também prevalência de desvio de conteúdo, pegaram 4.500 URLs dos links intactos e concluiu-se que 13% deles haviam mudado significativamente – não apontando para informações às quais o artigo original se referia quando foi publicado – e 4% dos links publicados em artigos de 2019 foram desviados, em comparação com 25% dos links acessíveis de 2009.
Um estudo também desenvolvido pela Harvard Law mostrou que um código 400 ou 500 (incluindo 404, 503, etc.), é quase sempre um sinal de podridão de link (a única exceção é se uma página da web estiver temporariamente fora do ar). Porém, código 200 não significa que uma fonte está presente, mas pode acompanhar uma página exibindo arrependimentos, um redirecionamento ou a página também pode ter mudado de conteúdo – e este é o mais difícil de ser detectado.
Já tem algumas iniciativas para preservar links, como a Internet Archive que hospeda milhares de arquivos. Há também o Projeto Perma.cc, desenvolvida pela Harvard Library Innovation Lab., que tenta corrigir o problema de podridão de links em citações legais e periódicos acadêmicos, fornecendo uma versão arquivada da página, com um link para a fonte original. Por exemplo, a Wikipédia pede que os colaboradores que escrevem citações considere arquivar o documento referenciado ao escrever o artigo em serviços de arquivamentos como Wayback Machine e archive.today caso eles suponham que um artigo pode mudar e dá passos do que pode ser feitos caso isso aconteça.
A pesquisa mostra a volatilidade fundamental da Web e aponta para a necessidade de novas práticas, fluxos de trabalho e tecnologias, mesmo que tenha alguns movimentos para melhorar está questão ainda é um problema que está longe de ser resolvido totalmente.