第十二节 404 信息保存

中国网民在 GFW 内的微信、微博等平台上发布的涉及敏感事件和话题(如 2017 年的红黄蓝幼儿园事件、北京清退“低端人口”事件等)的内容往往会被管理者以“多人举报”、“违反《网络安全法》”等借口删除,即人们常说的“404”。本节内容旨在介绍几种在敏感信息被“404”将之保存下来以便二次传播的方法。

一、网页存档

在使用网页存档工具保存网页的优势在于可以基本保持网页的原貌,主要用以保存微信公众号文章以及财新网等墙内媒体的新闻报道。

(一)archive.is

archive.is 是一个私人资助的数字时间囊网站,提供抓取网页内容的服务。archive.is 还拥有 archive.li、archive.fo 等多个不同的域名,支持以“archive.today.xxx”的短链接形式转发分享。该网站已被 GFW 屏蔽。

(二)archive.org

archive.org 是一个非营利性的数字图书馆组织,同样提供网页存档服务,它的中文名称是“互联网档案馆”。虽然它的 archive.is 的域名很相像,两者在网页抓取方式上存在差别。

二、截图

长截图工具主要用于保存微博等难以直接存档的社交媒体内容,或者用以获取墙外媒体资讯分享到墙内,例如香港端传媒的客户端自身支持将文章导出为长图的功能,以便用户转发传播。

(一)网页截图/长截图

1. 移动端

iOS 平台上的长截图应用有 Picsew 和 Tailor,另外图片标注应用 iMark(我的标记)与智能剪贴板应用 Pin 也提供网页截图的功能。Android 平台上的知名长截图应用有 PPIICC。

2. 桌面端

利用Chrome开发者工具进行网页长截图(Chrome版本要求:59或更高版本)

macOS: Command + Option + I ①截取整个网页的内容 Command + Shift + P 输入命令:Capture full size screenshot ②(模拟移动设备)截取手机版网页长图 Command + Shift + M 点击右上方的扩展按钮选择“Capture full size screenshot”

Windows: ①Control + Option + F12 截取整个网页的内容 ②Control + Shift + P 输入命令:Capture full size screenshot

参见 少数派:利用 Chrome 原生工具进行网页长截图 | 一日一技 archive

macOS 平台上的截图应用 Xnip 也支持长截图。

(二)截图拼接

对于过长的截图,长截图工具可能无法一次性抓取,此时可以采取分页截图后再拼接的方法。iMark 提供最高支持 9 张图片的拼图功能,其生成的长图能保持高清不留痕迹,值得推荐;如果分页截图超过 9 张,还可以在生成的长图的基础上继续拼接。

三、页面存储

在 Windows 和 macOS 这样的桌面级操作系统上,可以利用浏览器提供“页面存储”功能将相关网页存储到本地。其缺点是最终得到的是一个文件,难以直接分享。(使用 macOS 的 Safari 浏览器存储的网页归档文件类型为“.webarchive”,在 Windows 上可用 IE 等浏览器打开该类文件)

在移动设备上可以将网页导出为 pdf 或 epub 文件,缺点同上。

四、Telegraph

Telegraph 是由加密即时通讯应用 Telegram 提供的匿名博客服务,用户可以将涉及敏感话题的网页内容转录到 Telegraph 后加以转发分享。

五、区块链

将区块链用于首见于 2018 年 4 月的北大岳昕事件,有网友将她的公开信写入了以太坊 ETH 的交易信息,使之就此长存于区块链。

你也可以选择 SteemitMatters 等以区块链作为底层技术的平台存储信息。

参见:

一天世界 | 聊天软件安全图例 v1.2