来源:奔跑的奶酪
一、如何找回百度贴吧消失的帖子?百度贴吧,可能是大多数人学会玩论坛的第一个去处。它也是全球最大的中文社区,草根文化的舞台,兴趣的集中地,不论什么样的主题,你总能在这里找到和你志同道合的人,你在贴吧发起的提问总是总能迅速得到回应。早在初中的时候,奶酪就开始混迹于各个贴吧,见识过许多神贴和传奇人物。
百度贴吧的“精品贴”区更是查找资源的好地方,它们往往都是圈内大佬们花费几个月,甚至几年的时间精心制作的内容。当年很多精品帖子被盗用到其他地方,人们气愤不已,现在可能还要“感谢”他们,真是让人感慨不已。
(上贴吧 找组织)
如果此次事件后续没有恢复手段,这将是中国互联网史上的一次大事件。十年之功,废于一旦,一个时代的共同记忆被删除,以后的历史学术考究也将无从谈起。一个找回帖子可行的方法,是使用百度快照来查看历史记录。
1、打开 高级搜索,输入要搜索的用户名、关键词、吧名(无需三个都填),获取用户的发贴记录。
2、复制贴子的链接地址,去掉链接 ? 之后的所有字符,比如 http://tieba.baidu.com/p/4430278431
3、在百度搜索引擎里搜索该链接,点击”百度快照“查看贴子内容。
二、如何找回任意一个消失的网页?在国内网络的大环境下,由于法律政策、论坛规则、发贴人主动删除等原因,你收藏的网页很有可能在某个时间点就会打不开消失不见,贴吧是这样,其他的网站也是如此。下面介绍三个找回网页内容的方法,适用于所有网站。
方法 1:网页快照
网页快照,是搜索引擎在收录网页时,对该网页进行索引,然后存入服务器缓存里,网页快照因此也只能显示网页的最新收录结果。大多数搜索引擎都会显示”网页快照“的选项,但在网站 https://2tool.top 上,输入网页地址可以同时查看多个搜索引擎的网站快照。
(2tool.top)
方法 2:Internet Archive
Internet Archive 是一个成立于 1996 年的非营利性的数字图书馆组织,以保护数字文化遗产为使命,它会定期收录并永久保存全球的网页,就像收藏旧报纸一样收藏旧网页,直到2012年10月,其信息储量已经达到了 10PB。
(2008年,你和谁一起看的北京奥运会?)
使用方法很简单,只需要将网页地址输入,查询即可。右上角的黑色柱状条表明了存档的年份和数量的多少,页面中间的圆圈则表示网页存档量的多少。通过查询我们就可以知道某个网页的变化史,比如网传有一个叫张伟波的人800万卖掉 weibo.com,然而经过查询并没有这回事。
Internet Archive 是爬虫自动收录,不同的网站,其收录的数量和周期也不一样,大网站可能每天都会收录一次,小网站也可能会一年才收录一次,一些重要的网页,我可以手动提交保存。
方法是在 https://web.archive.org/save/ 后面加入要保存的网页地址即可。比如 https://web.archive.org/save/https://www.runningcheese.com,也可以使用拓展或者小书签来一键保存。
方法 3:Archive Today
由于 Internet Archive 是爬虫收录,且遵循 Robots 协议,如果网站已经声明不允许收录某个网页、目录、甚至是全站,那么将不会收录。
Archive Today 是一个类似于 Internet Archive 的网站,由私人资助,采取的是主动存档策略,可以保存任意一个网页,保存速度快,而且还提供了网页打包下载。Archive Today 可以说是对 Internet Archive 的补充。
(Archive Today)