谢选骏:我保留中文互联网的历史记忆
《为什么说:中文互联网正在加速崩塌?》(何加盐 2024-05-23)报道:
1、
先问你一个小问题:
如果我们在百度上搜索“马云”这两个字,把时间设定在1998年到2005年,能搜出来的信息,大概有多少条呢?是1亿条,还是1000万条,还是100万条?
我在几个群问过,大家普遍的猜想是,应该是百万或者千万的级别。毕竟,互联网信息如此浩如烟海。马云作为那个时代的风云企业家,在网上留下的痕迹肯定是非常多的。
但实际上能搜出的全部结果如下:
用百度搜索,选定日期范围为“1998年5月22日到2005年5月22日”,含有马云的信息,总共是1条(2024年5月22日数据)。
而仅有的这一条信息,也是虚假的。点进去会发现,文章的发布时间其实是2021年,不属于上面限定的时间段,只是不知怎么回事,它被莫名其妙地搜索出来。
也就是说,如果我们想要了解那一段时间关于马云的经历、报道、人们对他的讨论、他的讲话、公司的发展史等等,我们能得到的有效的原始信息量,是零。
你可能会觉得,这是不是百度的问题啊?如果换必应或谷歌,会不会能搜出来?
我测试过,这两个网站搜出来的有效信息,和百度没有太大区别,比百度略多一些,但也只是个位数。更多的也都是时间紊乱的无效信息,只不过不知道是什么技术原因,被错误地抓取出来。
你可能还会觉得,是不是因为马云属于比较有争议的人,由于某种不可描述的原因,所以他的信息才无法搜到?
但实际上,不仅仅是马云的情况如此,我们去搜马化腾、雷军、任正非等,甚至是罗永浩和芙蓉姐姐这样在那个时候红极一时的网红,或周杰伦、李宇春那样曾经火遍全网的明星,结果也都一样的。如搜雷军的情况,结果是这样的:
在测试过不同网站、不同人名、不同时间段之后,我发现一个令人震惊的现象:
几乎所有在那个年代曾经红火过的中文网站,如网易、搜狐、校园BBS、西祠胡同、凯迪猫眼、天涯论坛、校内网(人人网)、新浪博客、百度贴吧、以及大量的个人网站等,在一定年份之前的信息都已经完全消失不见了,甚至大部分网站是所有年份的信息都消失了。唯一例外的是新浪网,还能找到一些十几年前的信息,但也是极少数的寥寥几条,其他99.9999%以上的内容,全都消失了。
大家都没有意识到一个严重的问题:中文互联网正在迅速崩塌,移动互联网出现之前的中文互联网内容,已经几乎消失殆尽。
我们原以为,互联网是有记忆的,但没有想到,这种记忆,原来是像金鱼一样的记忆。
2、
我之所以注意到这个问题,是因为何加盐公众号的主题是研究牛人,所以我需要经常查找他们的资料。
这两年来,我有一个非常明显的感觉:网上能找到的原始资料,每年都以断崖式的速度在锐减。之前还能看到一些原始的报道,后来慢慢没有了;之前还能找到主人公的演讲或者他们写的文章,后来慢慢找不到了;之前还能看到很多采访或对谈的视频,后来慢慢消失了。
似乎有一个吞噬网页的怪兽,它沿着历史的时间线,从过去向着现在吞噬,先是小口小口,然后大口大口,把中文互联网的一切内容,以五年、十年为单位,一口吞掉。
等我们回过神来,会发现,在移动互联网之前曾经存在过的中文互联网的一切,不管是门户网站、机构官方网站、个人网页,还是校园BBS、公众论坛,还是新浪博客、百度贴吧,还是文件、照片、音乐、视频等,都已消失不见。
记得十几年前,我曾经因为换电脑,把一些照片和文章打成一个压缩包,存在某BBS上,几年之后发现,那整个BBS都没有了。我曾经用过hotmail的邮箱,里面有很多很珍贵的邮件,后来全都没有了。我还写过人人网、MySpace,后来全都没有了。
我们曾经以为互联网可以保留一切,但结果是一切都没能保留。
这让我想起刘慈欣《三体》里面提到过的“二向箔”。歌者文明发现了太阳系有智慧生物的存在,出于宇宙先进文明的清除本能,他们向太阳系扔出一张二向箔,于是,整个太阳系以光的速度从三维坍塌成二维,变化成一张酷似梵高“星空”的画片。一切生命、一切文明的痕迹,从此都不复存在。
在互联网上,我们已经处于二向箔的吞噬之中。这种二向箔可以称之为“时间的二向箔”,它吞噬的是时间那一维。
太阳系被歌者文明的二向箔拍扁之后,好歹还留下了一幅《星空》图,而互联网被时间的二向箔吞噬后,只留下一片虚空。
3、
为什么会出现这种情况呢?我猜想,主要原因可能是两个:
一是经济原因。
网站的存在,需要服务器、需要带宽、需要机房、需要人员运维,还有很多杂七杂八的监管和维护费用,这些都是成本。如果是有战略价值(例如需要向外展示公司想要展示的信息),或者有短期流量价值(例如还时不时有较多的人上来看),同时公司账上也不差钱,那么还会有动力去维持。
但是如果公司在商业上走了弯路,没钱了,整个网站就会直接死掉。例如人人网就是典型代表。
即便公司还有钱,从运营的角度来看,如果一个网页一年到头都没有几个人来点击,对公司来说,就成了一笔负担,从经济上最理性的方法,就是直接关掉。搜狐、网易早年的内容大量丢失,以及以天涯论坛为代表的BBS集体消亡,都是这个原因。
二是监管原因。
总体而言,互联网信息的监管,是从无到有,从宽到严,从严到更严的过程。以前可以合法存在的内容,后来不符合监管要求了;或者是以前可以灰色存在的内容,后来被定义为黑色了。这些内容都会直接被咔嚓掉。
还有一些是随着时代的变化,舆论的两极分化越来越极端,以前“只道是平常”的内容,在后来的舆论环境中显得非常尖锐、敏感,尽管不违法,但是可能激化矛盾,形成混乱,监管方也有可能会要求处理掉。
除了官方部门之外,愤怒的网友,也时时充当着舆论监管员的角色。他们会翻出十几年前某人无意中说的某句话,揪着不放,把人网暴至“社会性死亡”。
但监管上最重要的影响,还不是监管部门的处理或愤怒网友的攻击,而是它们会造成公司与个人的“自我审查”。
因为谁也不知道,网站上存在的哪一条内容,某人曾说过的哪一句话,会不会在若干年后,给当事人带来灭顶之灾。最好的办法,就是直接把这些潜在的“定时炸弹”全部清除,也就是把网站关掉或者把内容全部删除。
当然,除了上述两个原因之外,还会有其他很多原因。
例如,在南斯拉夫解体之后不久,所有“yu”(南斯拉夫国名Yugoslavia的缩写)这个国际域名之下的网页内容全部消失了。又如,随着版权保护的加强,曾经随处可下载的音乐和电影网站,就都消失了。还有一些机构和个人,纯粹是由于自己的原因,不想在对外展示信息了,就把官网或个人主页关掉等等。
但这些原因都是次要的、局部的。整个互联网内容系统性的、大规模的消失,主要就是由于经济规律和自我审查。
本质上,互联网内容和生命一样,也受进化论的支配。其存在的标准只有一条:以尽可能低的成本争取尽可能多的注意力。
当一个内容能够在互联网上的海量内容中争取到足够多的注意力,而维持这个内容的成本(包括经济成本、监管成本和对抗监管的成本)比其他方式更低时,这个内容就有可能存活在互联网上。只不过它有可能会换一种呈现方式,例如从文字变为图片,从静图变为动图,从动图变为视频,未来可能从二维视频变为三维全息视频等等。承载这个内容的平台也会变迁,从门户网站到BBS,到个人博客,到微博微信,到抖音视频号,到未来可能一个我们不知道什么平台。
当一个内容不能再吸引到足够多的注意力,或者维持这个内容的成本比其他方式更高时,这个内容就会从互联网上消失。以电脑为浏览端、以网页为载体的传统互联网的集体消亡,只不过是这种“信息进化竞争”的必然结果而已。
生物的进化秘诀是“物竞天择,适者生存”,而互联网内容的进化秘诀是“信息竞,注意力择,适者生存”。由于网络效应,这种竞争比自然界还要猛烈万倍,残酷万倍。传统互联网不是单个物种式的灭绝,而是几乎所有内容的整体性灭绝。
每一代新的互联网崛起,旧的互联网必将崩塌,时间二向箔是所有网站、所有内容无可逃避的宿命。
4、
如果未来的文明是互联网的文明。我们这一代人,将是没有历史的。因为互联网没有留下我们的痕迹。
“没有历史”,这件事情重要吗?
当然很重要。
我曾经为了写邵亦波的文章,想尽了一切办法,试图找到邵亦波2007年参加《波士堂》节目的原始视频,以及他妻子鲍佳欣以“文爱妈咪”网名在宝宝树社区发了好几年的帖子。最终还是没有找到,只能深深遗憾。
虽然《红尘已忘邵亦波》那篇文章,依然很受大家欢迎,短短一周就有70多万人阅读,2万多人转发,但我十分肯定,我一定还是错过了某些非常重要的信息。如果它们能呈现在那篇文章里,文章质量会更好。
但是我找不到,就只能让文章以不完美的方式呈现。
你可能会觉得:这只是对何加盐这样的研究者和写作者有用,我又不写这样的文章,互联网信息没有就没了,对我又没什么影响。
真的吗?
如果我们已经看不到马云的所有演讲,看不到任正非的以《我的父亲母亲》和《一江春水向东流》为代表的所有文章,看不到段永平在雪球的所有发帖,你会不会觉得有点可惜?
好吧,你说你并不觉得可惜。
那如果我们已经搜不到黄峥的公众号,看不到张一鸣的微博,上不了王兴的饭否,你会不会觉得有点遗憾?
好吧,你说你也并不觉得遗憾。
那如果某一天,知乎如同天涯论坛一样没了,豆瓣就像人人网一样消失,B站好比新浪博客一样已无人问津,你会不会有点心痛?
如果某一天,你喜欢的微博博主所有的微博只显示“作者已设置只展示半年内微博,此微博已不可见”,你常看的公众号只显示“此账号已被屏蔽,内容无法查看”,你在抖音或小红书搜索某些信息,结果显示“作者已清空全部内容”……
甚至,微博、公众号、抖音、小红书,就像曾经存在过的bbs、贴吧、空间、博客一样,全部消亡……
你会不会为此难过哪怕是短短的一分钟?
作为传统互联网的一代人,七零后、八零后已经找不回我们的历史。因为它们已经全部消失了。
新生代也许还能看看朋友圈,但是朋友圈也越来越多“三天可见”,越来越沉默不语。
唯一还在热情发圈的,只剩下一水的营销信息。
未来就连这些营销信息,也终将消亡。
5、
如果一件事对我们很重要,而它正在消亡,我们有什么办法挽救它吗?
有人曾作出这样的尝试。美国有一个网站叫做“Internet Archive”,中文译作“互联网档案馆”,保存了很多原始网页。但是我试过,中文的原始网页,保存的很少,而且使用非常麻烦,搜索功能十分原始低效,和没保存差不多。
从技术层面来讲,保存从中国有互联网以来,到移动互联网兴起的十来年时间的所有网页,应该并不难,成本也不高,毕竟比起现在的视频时代,原始互联网的那些图文网页,占的空间几乎可以忽略不计。
问题是,谁来做这件事,有什么动机?
商业机构不会做。因为没有任何商业利益。
政府或许可以像建图书馆、博物馆一样,搞一个能保存所有网页的档案馆。但是政府为什么要花钱费力干这件事?除了保存历史之外,似乎也没有其他理由。再说了,就算是政府做了这件事,对普通网民也没有任何意义,因为这个档案馆肯定也会需要一定的登陆权限,以免信息被滥用。
况且,就算是有机构愿意做这件事,现在也晚了。移动互联网兴起之后,传统互联网的中文内容,几乎已经消失殆尽了。粗略估算,99%以上应该都已经没有了。
从某种意义上,何加盐写的牛人系列文章,也为保存这些牛人们存在过的历史,做出了一点贡献。如果我没有写他们,很多历史就已经在网上找不到了。但毕竟这也不是原始信息,只是经我整合过的二手信息。
现在的中文互联网上,这个世纪前十年发生过的所有重大事件,所有留下过深深痕迹的名人,目前还能找到的信息,几乎已经全是经自媒体编辑过的二手信息,甚至是传过多手,早已面目全非的信息。
关于它们的原始报道没有了,原始视频没有了,原始讲话没有了,原始的网友目击没有了,原始的评论没有了……
再过一些年,这些二手信息和N手信息,也都会消失。就像那些事件从未发生过、那些人从未存在过一样。
我们已经无能为力,只能接受现实。
在未来的互联网时代里,回首看21世纪的前二十年,将是没有历史记录的二十年。
我们是互联网时代消失的一代人。
如果你现在还能看到一些中文互联网的古早信息,那只是夕阳的最后一抹余晖。
如果你明白了它们的转瞬即逝,可能会像临死前的浮士德一样感叹:
你真美啊,请停留一下吧。
但那抹余晖,很快将和你这句感叹一起,被时间的二向箔吞没,陷入虚空。
《三体》中,程心和艾AA还能有幸乘坐唯一的一艘曲率飞船,逃离正在二维化的太阳系。
而我们,连曲率飞船都没有。
逃无可逃。
现在你所看到的、你所创造的几乎所有内容,连同这篇文章,这个平台,终究也会淹没在虚空中。
网民嚎叫:
一条小路 发表评论于 2024-05-23 17:12:12
有了習思想還要什麼互聯網。
zzbb-bzbz 发表评论于 2024-05-23 16:24:36
结论正好相反,说明中国的中文互联网2005年之后爆发式发展。
zzbb-bzbz 发表评论于 2024-05-23 16:20:02
只能说海外中文互联网正在加速崩塌,1998-2005年期间,百度能查到一条关于马云,而谷歌一条也没有。
谢选骏指出:我早就发现了“网站=杀手”的公式,所以手动保存了数万网文——集成《谢选骏全集360卷》……以此保留中文互联网的历史记忆。
《“中文互联网崩塌”引热议 你的朋友圈文章还在吗?》(往事与随想 2024-05-23)报道:
今天有篇文章很火,早上刚看到才几千点击,现在已经好几万了,等我写完估计已经10万+了。文章标题叫《中文互联网正在加速崩塌》,大致意思是说很多互联网内容已经消失不见了,尤其是2005年以前的。但看朋友圈转发,则远不局限于2005年前,大家谈的更多是这几年的事情。
这里面有很多角度,技术问题、经济问题、监管问题……但之所以戳中人心的,我猜还是长期主义的衰败,由此让人想到,你不仅没有未来,甚至没有过去,这种个体不能承受生命之轻的痛楚。
可谈的很多,但这里只想谈一点:给用户提供备份下载服务是互联网内容平台的基本义务。光哀叹没用,我们总得提点具体的诉求才行。
先回顾一下鄙人在互联网上生产的内容,如今安在?
最早是天涯,现在没了,去年大家让邢明(天涯老板)搞个打包下载个人内容的收费项目,也没见他搞出来,真是让人无语。
然后是凤凰网,当初疯狂卷自己,一开始天天写,后面隔天写一篇,少说也写了一两百篇“评中评”,现在栏目没了,从文章页点进栏目页也404了。
再后面是腾讯微博,嗯,也没了。
还有腾讯大家,这个我迄今写得最认真的专栏,虽然不多,也没了(我从邮箱中找了部分出来发在公号)。
还有豆瓣,虽然久不更新,也收到过两次通知:一次通知我的一篇N年前发的《悲情城市》影评被删了,把备份内容发给我;还有一次通知我同样是N年前做的《农民问题的书单》卷首语被屏蔽了,我去改了一下。
我现在最操心的就是朋友圈内容,很久前就说,谁要开发一个朋友圈备份工具,我愿意付费(100块一次)使用。等了两年没等到,准备自己动手,找了个程序员朋友合作,他开发我运营,但这哥们半天没动手,另外也担心被微信官方封杀,拖着拖着就黄了。写这篇文章的时候又搜了一下,两个月前有个技术博主倒是做了了一个,但看反馈,产品还有瑕疵,好像目前并不能备份全部内容,尤其是发得时间比较长,内容比较多的。
事情既然到了今天,我觉得必须得给互联网平台公司提出一个明确的要求,开发相应功能以保障用户备份自己内容的权利。
如果说之前大家还相信这些内容可以永续留存的话,现在这个梦已经破灭了,你们已经搞砸了这么多次,为什么还不留个后手呢?
道理很简单,内容是用户创造的,理所当然拥有所有权。六七年前霍炬兄就写过一篇《互联网完蛋了,已经。》,讲得非常清楚,里面还提到了微信朋友圈:“理论上说它应当属于用户,但实际上用户拿不到它,甚至没法备份它,只能被企业利用。一个比较直观的例子:你能很容易的备份自己的朋友圈吗?……朋友圈本来完全是你自己创造的数据,最后你反而没有对它的控制权,这就是现在这个时代的荒唐之处。”
分析前面我个人的案例,内容湮灭不外乎两个原因,一个是经济原因,比如公司经营不下去(天涯),产品运营不下去了(比如腾讯微博),一个是政治原因,比如对所谓敏感内容的承受力下降(比如豆瓣),比如产品被迫下线(比如腾讯大家)。而这两大原因,在今天愈发严峻,所以开头提到的那篇文章才会格外触动大家的心弦。
大环境不好,大家都能理解。凛冬将至,公司都在未雨绸缪,搞降本增效,收缩投资。但这种情况下,就完全不考虑一下用户吗?你们天天喊的“用户至上”是被狗吃了吗?这也不是多麻烦的事情,外面的程序员这么不方便都能干,你们自己开发还不是分分钟的事情?非不能也,实不为也。
请注意,这只是要求自我备份,不是要求在互联网永续留存,不需要公司付出成本。万一哪天产品要下线,公司要倒闭,好歹给用户留点念想——这么说可能不吉利,但你能保证你公司产品能一直经营下去吗?
好,就算微信这样的产品,腾讯这样的公司,我相信它也许比我活得还要久(我也不怕这么说不吉利),但你能保证你能扛得住压力,不封我账号吗?
如果既不能保证产品永不下线,公司永不倒闭,也不能保证不删我内容不封我账号,还有什么理由不给我备份呢?
对了还有一个特别愚蠢不值一驳的观点,认为互联网上的内容水得要命,本来也不值得留存,对此不必在意。这实在是傻得冒烟,因为价值总是因人而异,在你看来一钱不值,在我看来可能千金难买。
举个例子,我翻到了2013年4月5日我发的第一条朋友圈,内容是这样的:
“中文互联网崩塌”引热议 你的朋友圈文章还在吗?
这样的内容,是我人生最重要的组成部分,这样的记录,也是我人生最珍贵的记录——不夸张地说,这11年来,朋友圈承载无数这样的回忆,一朝湮灭,难以想象。不消说,对很多人来说,都是如此。
为什么这篇文章重点谈朋友圈,谈微信,谈腾讯?因为在我看来,腾讯/微信还是可以对话的,张小龙说过很多把用户放在第一位的话,腾讯这几年也一直在强调“科技向善”,既然如此,毋以善小而不为。
网民嚎叫:
秋林小屋 发表评论于 2024-05-23 22:51:00
如果现在的人类文明毁灭了,给下一代文明几乎留不下什么信息。什么硬盘internet,根本都是笑话,书也不过几百几千年。古人的智慧是石刻,可以几十万年。而现代人类最愚蠢,最自以为是,不会留信息,还拼命地挖掘古迹破坏上一代人类给后世留的信息。
。
来梦 发表评论于 2024-05-23 20:07:00
最早接触的是China ren,雅虎相册,网易相册。都特么没了,从那以后再也不信国货,各人资料通过代理蜗牛式的也要搬到境外大网站。
谢选骏指出:人说——“中文互联网崩塌”引热议 你的朋友圈文章还在吗?我看——特别不能思议的是,自己的文字为何自己不保留,而要期待别人来保留?你们没有见过文革期间铺天盖地的大字报吗?而今何在?难道这就是“巨婴的嚎哭”吗?
而我,为了保存网文,我花费了二十多年的时间和精力进行搜索和拼接,经常由于原文错置,使我无法掌握完整和正确的信息。这就是网文作业的苦楚。但即使这样,我还是尽力而为,在《谢选骏全集360卷》,留下了比比皆是的印记。因为我向上帝说过,我要学习耶稣的无私奉献,尽我所能,为这个时代保留一些见证。