你是否经常点一个连结的网址,然后屏幕出现「这个连结已不复存在」或是「讯息错误」?对于需要搜寻相关数据的人,这显然成为一项恼人的困扰。
每年约有10%连结不见
奥德达美利安大学(Old Dominion University)的两位计算机科学家汉妮‧莎拉‧奥登(Hany Salah Eldeen)和麦可‧尼尔逊(Michael L Nelson)2013年9月发表一篇题为〈为甚么很多分享在网络社群媒体的资源已不复见?〉的研究,该文特别以6个曾在推特(Twitter)上引起热议的事件为研究对象,包括H1N1病毒的爆发、麦可‧杰克森之死、伊朗选举与抗议、欧巴马的诺贝尔和平奖、埃及革命及叙利亚暴动。
两位计算机科学家分析连接到这些推特的发文,然后检验这些网络资源是否还可以连接得上、或是否被数字存盘、还是已不复存在。他们有个惊人发现:平均在事件发生一年后,有11%的连结来源消失了,只有20%被存盘保管,两年半之后,约有27%遗失,41%被存盘。
这只是初步研究,研究数据显示,每年大约有10%的讯息来源不见了,相当于每天有0.02%的讯息遗失。
虽然这两位计算机科学家仍试图利用技术重现这些消失的网页,不过,只有40%的机率可以重建,最多也只能恢复70%的原始内容。
「活生生的现代历史」解体
对于需要利用大量社交媒体的资源以进行营销与研究分析的公司而言,这个现象影响重大。
很多连接到社群媒体的相关来源都正在消失,其中还包括数百万人每日生活经验的影音数据与更新。两位计算机科学家的研究并无法阻止这种「活生生的现代历史」的解体。
对于研究者而言,网络是一项无止尽的宝藏,虽然很多思想创意都是以复制、剪贴方式而流传,然而,照目前这种情势发展,不到三十年后,很多原始来源与科技平台不仅无法找到,而且是根本不复存在。
事实上,从网络上寻找十七世纪的主要思想比寻找近五十年的容易,因为图书馆里的很多旧数据都已逐步被数字化,网络搜寻容易。但是,相反的,很多近年的关键数字数据已变成支离破碎的存在,包括语词文字的起源、政治辩论的思考,甚至革命等,不是被锁起来,就是在几年后消失。
这种随兴的、不切实际的交流对于分享现代最重要的问题是最完美不过,但这同时产生了以前没有的历史问题。
保存资料将成棘手问题
身为一个历史学家或社会学研究者,必须知道那个时代的人们在谈些甚么,因为这些分享与辩论正是珍贵的点滴。所以,不仅日记、书信是重要的史料,电子邮件及社群媒体也成为重要的史料来源。研究21世纪的历史学家们将发现,他们研究的成功与否,将大部分取决于是否拥有这些大量的现代社会历史资料。
美国国会图书馆在2010年公布,将进行保存推特数据的计划,也是因为看到了它的历史价值。推特的法律顾问亚力士‧麦克基立伟(Alex MacGillivray)说:「光想到我们可以从这些资料了解到人类以及周围的世界,就让我感到十分惊奇了。」
如何保存数据却是很棘手的问题,因为这些数据的性质和以往不同,大多关系到私人利益、个人隐私及频繁更新的问题。
从历史层面来看,如此快速转变的历史资料面貌是前所未见的。不仅未来的研究者将倍加辛苦,现今的使用者也必须更具有数据保存与运用的概念,否则历史将成为指缝的流沙,一点一点地流失。抑或许,我们应该重新思考「历史」的概念,不要太看重这些数据来源的转换与更新,因为我们没法跟上其速度,能掌握的只有「当下」。