标签谢选骏全集

2023年1月21日星期六

谢选骏: 中国是一个“404国家”



《中文网站点击率低,移动互联网表示“这锅我背了”》(2020年11月02日 界面新闻)报道:


得益于国内的庞大市场,自成体系的中文互联网如今在全球也已经有了更多的影响力,而按照目前已上市互联网企业的市值来计算,如今全球互联网行业巨头级企业基本都是来自中美两国。然而近日在网络技术调查机构W3Techs公布的一份统计榜单中,中文互联网的排名却非常低,那么这是什么原因所造成的呢?


作为web领域的知名的信息提供者,W3Techs是经常会更新web上各种类型技术使用情况的相关信息。除了“最流行的客户端编程语言”、“最流行的服务器端编程语言”、“最受欢迎的数据中心提供商”、“最受欢迎的广告网络”等偏技术向的统计数据外,还还有一个“全球点击量最高1000万个网站使用的语言”榜单。


在日前W3Techs所公布的这份排行榜中,除了作为全球语言的英语(60.4%)外,俄语网页(8.6%)占比超过了法语、德语、日语,以及朝鲜语网页之和,而中文网页(1.5%)的占比甚至低于越南语(1.6%)。


在W3Techs的进一步说明中强调,其统计的范围是Alexa(专门发布网站的全球排名)前一千万以及Tranco前一百万位的网站,并排除重定向的网站,将同一域名下的不同子域名合并,且去掉了没有有用内容的网站所得出的结果。


以我们三易生活的官网为例,Alexa上的全球排名是12910,日均PV在14万左右,而当日均PV达到1后,Alexa排名就可以在200万名左右。因此换句话来说,从W3Techs所公布的这一统计数据,可以看到目前web端还有人点击的网站中,访问者的语言构成。


英语由于其作为全球语言的地位,导致了几乎所有使用非英语作为母语的开发者想要“出海”寻求更广阔的市场,都必须要搭建一个英文版网站。俄语之所以能够排名第二,则与排在它前面的英语,以及此后的西班牙语和法语不同,外界普遍认为这并不是因为独联体国家普遍使用俄语,而是由于目前来自俄罗斯的黑客已经成为当下互联网中最为主要的免费资源来源,比如游戏玩家们耳熟能详的fitgirl repack,以及绝大多数从事学术研究的人都访问过的SCI-HUB。


事实上,来自Internet World Stats的统计数据显示,2019年全球使用中文的网民数量为8.63亿,已经占据了全球网民的19.7%。但这一数据与W3Techs的榜单进行对比,就能得出一个很奇怪的结论,就是占全球网民五分之一的中文用户能够拿得出手的网站,却仅占全球网站的1.5%,因此使用中文的网站比例与使用中文的网民数量不成比例显然并不正常。


值得一提的是,在2010年W3Techs给出的同一榜单中,中文网站的比例在4%左右,排名第三。也就是说在10年时间里,中文互联网在web端的内容产出量大幅度下跌了250%左右。但是这种“衰退”背后当然是有原因的,其中的奥妙就在于W3Techs统计的是web端网站,而网站这个概念则是PC互联网时代的主流。


纵观以国内市场为核心的中文互联网世界,无疑在近些年来有着跨越式的发展。其一是快速渡过了互联网1.0与2.0时代,直接进入了移动互联网时代。从2010年至今,这10年间正好是国内移动互联网蓬勃发展的时期,除了建成全球最大的4G网络之外,不少网民的第一台“计算机”其实是智能手机。


而移动互联网发展极为迅速所导致的结果,就是如今中文网民中呈现出了PC用户少,手机用户多的情况,并且移动生态的发达反过来也压倒了传统的web端。在移动互联网时代,APP而不是浏览器已经成为了网民消费者内容的核心阵地,如今手机用户在移动端使用浏览器浏览网页的情况其实并不那么多。


因此当下中文互联网世界的情况,是大量信息已经聚集在各式各样的APP中,并且这些信息也难很通过网络爬虫获取,就导致其很难进行准确的统计。比如说目前微信公众号已经超过2000万个,就可以看作是2000万个PC时代的博客,但在W3Techs的统计中,因为它们的域名都是微信公众号的域名,所以就只能算成一个网站。


广告

再加上中文互联网行业巨头如今的平台化,也降低了使用中文作为母语的中小企业建设自己网站的兴趣。毕竟相比于自行建站的成本,直接托庇于这些平台才是更具性价比的选择,比如说服装企业直接在天猫上开店,以及餐厅在美团上提供外卖服务的成本,显然远低于自己建设网站并进行推广。


当然,中文互联网出现这种头部网站数量与网民数量倒挂的情况,在某种意义上来说,其实是国内互联网企业有意促成的。如今几乎所有的国内互联网企业都在有意无意地将用户向APP端驱赶,许多朋友可能都遇到过“打开APP查看全部内容”这样的情况。由于在web端的体验甚至都不是完整的情况下,只有APP上才能体验到更多的功能和服务了。


之所以会出现这样的情况,固然有在流量为王的影响下互联网企业的“入口思维”作祟,毕竟web端需要从浏览器打开,入口并没有掌握在自己手里。


更为重要的是,APP相比于网页来说,既能访问相册、通讯录、各种记录、读取硬件信息、获取IMEI等权限,可以提供的用户个人信息比浏览器+公网IP的网页版多了太多。因此为了获得更为完整的用户画像,进而实现更加精确的广告投放,互联网厂商自然也希望用户更多使用APP,而不是web端了。


谢选骏指出:上文不懂“中国是一个“404国家”——共产党天天消灭互联网页,就像劫匪军“消灭了八百万蒋匪军”一样,天天血流成河,导致“全球互联网行业巨头级企业”云集的中国实际上只是一个网页上的泥足巨人——中文互联网的排名甚至不如越南文!中文网页(1.5%)的占比甚至低于越南语(1.6%),相比之下,英语网页的占比是60.4%——是中文的四十多倍!而英语作为母语的人口,甚至还不如汉语作为母语的人口。


网文《按人口排列的語言列表》报道:


本條目為主要語言人口列表,羅列現時世上主要語言的語言人口,並依其人口排序。所謂語言人口,係指以該語言為母語的人口。由於不同統計之間的數據有所分別(有以母語為基礎,或以第一語言為基礎),本列表試圖從現有的數據中整理出一個大概出來。不過,本列表列出的數據,可能會跟各種語言本身條目內的數據有出入。主要原因,是因為條目可能各自引用不同的數據來源,而這些不同的數據來源對「語言」及「方言」有不同的定義。舉例說:阿拉伯語在《民族語》 (Ethnologue) 被歸入一種語言內,但在美國中央情報局出版的《世界概況》裏卻被認為是一個語言集合。又例如:中文本身不論是語言及文字本身都有不同的種類。有觀點把漢語看做一種語言,而官話、吳語、粵語、閩語等作為漢語的方言來處理,而得出中文的人口有12億人。亦有觀點把這些方言看作10多種獨立的語言,那麼其中亦有5種語言(官話、吳語、粵語、閩語、晉語)有資格列有全球25大語言人口內。相反地,印地-烏爾都語實際上只是一種語言,在下表中卻被分開了。


《民族語》第23版(2019年)

下表列出使用人口超過4500萬人的語言,根據2019年出版的民族語。但使用人口總計可能不準確,基於不同時間或資料來源,數據存在差異。


排名 語言 語系 母語使用者 母語排名 第二語言使用者 第二語言排名 總計

1 英語 印歐語系-日耳曼語族 3.67億 3 8.984億 1 12.68億[1]

2 漢語(官話方言) (包括現代標準漢語) 漢藏語系-漢語族 9.215億 1 1.987億 4 11.12億[2]

3 印地語 印歐語系-印度-雅利安語支 3.42億 4 2.953億 2 6.373億[3]

4 西班牙語 印歐語系-羅曼語族 4.63億 2 7490萬 9 5.379億[4]

5 法語 印歐語系-羅曼語族 7730萬 15 1.993億 3 2.766億[5]

6 阿拉伯語 亞非語系-閃米特語族 - - 2.74億 - 2.74億[6]

7 孟加拉語 印歐語系-印度-雅利安語支 2.285億 5 3680萬 13 2.652億[7]

8 俄語 印歐語系-斯拉夫語族 1.536億 7 1.043億 6 2.58億[8]

9 葡萄牙語 印歐語系-羅曼語族 2.279億 6 2420萬 15 2.522億[9]

10 印尼語 南島語系-馬來-波利尼西亞語族 4360萬 24 1.554億 5 1.99億[10]

11 烏爾都語 印歐語系-印度-雅利安語支 6900萬 18 1160萬 7 1.706億[1]

12 德語 印歐語系-日耳曼語族 7500萬 17 5610萬 10 1.316億[2]

13 日語 日本-琉球語系 1.262億 8 12.15萬 27 1.264億[4]

14 斯瓦希里語 尼日爾-剛果語系-班圖語支 1620萬 27 8230萬 8 9850萬[5]

15 馬拉地語 印歐語系-印度-雅利安語支 8310萬 10 1220萬 17 9530萬[6]

16 泰盧固語 達羅毗荼語系 8240萬 11 1100萬 18 9300萬[7]

17 粵語 漢藏語系-漢語 8450萬 9 40.2萬 24 8490萬[11]

18 土耳其語 阿爾泰語系-突厥語族 7940萬 12 38萬 20 8250萬[12]

19 泰米爾語 達羅毗荼語系 7780萬 14 600萬 19 8380萬[13]

20 旁遮普語 印歐語系-印度-雅利安語支 - - - - 8280萬[14]

21 吳語 漢藏語系-漢語 8170萬 12 6.34萬 28 8180萬[15]

22 朝鮮語 阿爾泰語系或獨立 - - - - 7940萬[16]

23 越南語 南亞語系 7600萬 16 100萬 23 7700萬[17]

24 豪薩語 亞非語系-乍得語族 4770萬 23 2500萬 14 7270萬[18]

25 爪哇語 南島語系-馬來-波利尼西亞語族 - - - - 6830萬[19]

26 埃及阿拉伯語 亞非語系-閃米特語族 - - - - 6830萬[20]

27 意大利語 印歐語系-羅曼語族 6460萬 19 310萬 22 6770萬[21]

28 泰語 壯侗語系 2070萬 26 4000萬 12 6070萬[22]

29 古吉拉特語 印歐語系-印度-雅利安語支 5650萬 20 420萬 21 6070萬[23]

30 康納達語 達羅毗荼語系 4360萬 25 1290萬 16 5650萬[24]

31 波斯語 印歐語系-伊朗語支 - - - - 5500萬[25]

32 博杰普爾語 印歐語系-印度-雅利安語支 5220萬 21 16萬 26 5240萬[26]

33 閩南語 漢藏語系-漢語 4820萬 22 38.7萬 25 4850萬[27]

34 菲律賓語 南島語系 - - 4500萬 11 4500萬[28]

參考文獻

來源

Ethnologue (頁面存檔備份,存於互聯網檔案館) 《民族語》網上版

CIA - The World Factbook -- World (頁面存檔備份,存於互聯網檔案館)

 English. Ethnologue. [2020-08-21]. (原始內容存檔於2016-08-13) (英語).

 Chinese, Mandarin. Ethnologue. [2020-08-21]. (原始內容存檔於2016-09-26) (英語).

 Hindi. Ethnologue. [2020-08-21]. (原始內容存檔於2017-05-25) (英語).

 Spanish. Ethnologue. [2020-08-21]. (原始內容存檔於2017-11-23) (英語).

 French. Ethnologue. [2020-08-21]. (原始內容存檔於2021-02-24) (英語).

 Arabic, Standard. Ethnologue. [2020-08-21]. (原始內容存檔於2021-02-25) (英語).

 Bengali. Ethnologue. [2020-08-21]. (原始內容存檔於2020-04-10) (英語).

 Russian. Ethnologue. [2020-08-21]. (原始內容存檔於2021-02-23) (英語).

 Portuguese. Ethnologue. [2020-08-21]. (原始內容存檔於2021-02-14) (英語).

 Indonesian. Ethnologue. [2020-08-21]. (原始內容存檔於2017-10-24) (英語).

 Chinese, Yue. Ethnologue. [2020-08-21]. (原始內容存檔於2017-11-12) (英語).

 Turkish. Ethnologue. [2020-08-21]. (原始內容存檔於2021-02-24) (英語).

 Tamil. Ethnologue. [2020-08-21]. (原始內容存檔於2020-05-29) (英語).

 Punjabi, Western. Ethnologue. [2020-08-21]. (原始內容存檔於2017-07-12) (英語).

 Chinese, Wu. Ethnologue. [2020-08-21]. (原始內容存檔於2017-10-11) (英語).

 Korean. Ethnologue. [2020-08-21]. (原始內容存檔於2018-07-06) (英語).

 Vietnamese. Ethnologue. [2020-08-21]. (原始內容存檔於2021-02-27) (英語).

 Hausa. Ethnologue. [2020-08-21]. (原始內容存檔於2021-03-08) (英語).

 Javanese. Ethnologue. [2020-08-21]. (原始內容存檔於2019-04-04) (英語).

 Arabic, Egyptian Spoken. Ethnologue. [2020-08-21]. (原始內容存檔於2021-03-08) (英語).

 Italian. Ethnologue. [2020-08-21]. (原始內容存檔於2015-07-30) (英語).

 Thai. Ethnologue. [2020-08-21]. (原始內容存檔於2021-02-11) (英語).

 Gujarati. Ethnologue. [2020-08-21]. (原始內容存檔於2020-05-10) (英語).

 Kannada. Ethnologue. [2020-08-21]. (原始內容存檔於2020-05-09) (英語).

 Persian. Ethnologue. [2020-08-21]. (原始內容存檔於2021-01-23) (英語).

 Bhojpuri. Ethnologue. [2020-08-21]. (原始內容存檔於2017-11-29) (英語).

 Chinese, Min Nan. Ethnologue. [2020-08-21]. (原始內容存檔於2017-06-11) (英語).

 Filipino. Ethnologue. [2020-08-21]. (原始內容存檔於2020-05-10) (英語).


谢选骏指出:作为母语位居使用人数第一的中文,互联网页经过的404大屠杀却七零败落“敬陪末座”,再次证明了“万恶的共产主义,让中国血流成河”!为了抵抗这一屠杀,二十多年来我不断保存记录思考探讨评论了这些不断消失的网页资料,愿能集成三五百卷,缔造一个史无前例的基督教中国……借用《易经》的话来说,可谓盛德大业至矣哉。

没有评论:

发表评论

谢选骏:绿色技术下面隐藏着血红的机密

《中国加快开采绿色技术所需金属 但在多国引发焦虑》(BBC 2024年4月30日早上8点46分)报道: 智利北部的阿塔卡马沙漠位于“锂三角区”,是锂的重要产地。 今年早些时候的一个夜晚,在位于阿根廷北部的宿舍里熟睡的艾清突然被屋外愤怒的口号声惊醒。 她向窗外望去,看到阿根廷工人包...