Wayback Machine和Cloudflare合作,对更多的网络内容进行归档

互联网档案馆和Cloudflare合作,对使用Cloudflare的Always Online服务的网站内容进行归档,增加了用户在网站中断期间能够查看网站最新版本的机会。此次合作将增加互联网档案馆扫描的网页数量,使该组织的Wayback Machine对广大互联网用户更加有用。

SEO技术,数据分析,统计

"启用Cloudflare的Always Online服务的网站现在将自动将其内容存档,如果碰巧Cloudflare无法使用原始主机,那么互联网档案馆将介入,以确保网页能够传递给用户。"互联网档案馆Wayback Machine总监Mark Graham在公告中表示。

Cloudflare表示,其 "始终在线 "功能会在原服务器不可用时,保存 "缓存网站的有限副本,以保持网站为访问者在线",确保网站的 "最受欢迎的页面得到体现"。Cloudflare首席执行官Matthew Prince表示,使用Wayback Machine将改善Always Online服务。

"互联网档案馆的Wayback Machine拥有令人印象深刻的基础设施,可以大规模地对Web进行归档,"Prince说。

此次合作将反过来提高Wayback Machine归档Web的能力。Graham写道:"非营利性互联网档案馆的系统并不能抓取整个网络,但已经提供了超过468亿个归档网页,并且每天增加超过10亿个新的归档网址。它 "通过各种不同的方法来实现这一目标,比如从数百万个网站的列表中 "抓取",如用户通过Wayback Machine的 "立即保存页面 "功能提交的网站,[网站]添加到维基百科文章中,在推特中引用,以及基于其他一些 "信号 "和来源,如[新闻]故事的多个馈送,"Graham解释说。

Cloudflare的Always Online服务现在是Wayback Machine查找和归档网站的一个额外途径。"随着新的URL被添加到使用该服务的网站上,它们将被提交给Wayback Machine存档,"Graham写道。"在某些情况下,这将是一个URL第一次被我们的系统看到,并导致'第一次归档'事件。" 在所有情况下,这些新归档的URL "将提供给任何使用Wayback Machine的人。"

格雷厄姆预测,这种合作关系将让互联网档案馆 "更好地备份更多的公共Web,并以此帮助使Web更加有用和可靠"。

发表评论

电子邮件地址不会被公开。 必填项已用*标注