互联网语言使用人数排行以及占比(更新至2020年2月)

万维网上访问最多的网站的网页中,略有一半以上是英文的,并提供了许多其他语言的各种信息。据W3Techs称,其他主要语言是俄语,德语,西班牙语,法语,日语,葡萄牙语,意大利语和波斯语。

在现有的7,000多种语言中,只有几百种被认为是用于万维网上的网页的。

什么?没看到中文?别急,其实这是一个正常的东西,国外的统计主要是参考了网站的数量等信息,就像百度、淘宝这样的大网站,也只能算是一个,所以你现在看不到中文是正常的,继续看下去。

互联网语言使用人数排行以及占比(更新至2020年2月)

互联网使用语言大体概述

关于互联网上使用最广泛的语言存在争议。联合国教科文组织在2009年发布了一份报告,对网站语言进行了长达12年的监测,从1996年到2008年,这份报告发现,英语网页的比例逐年稳步下降,从1998年的75%下降到2005年的45%。作者发现英语2005年保持在45%的内容研究结束的,但相信这是由于搜索引擎索引更多英文内容的偏见而不是真正的英文内容的比例稳定在万维网上。

W3Techs的持续监测显示,2015年3月,在访问量最大的网站中,只有55%的网站有英文主页。据W3Techs网站统计,在100万个访问量最大的网站中,至少有2%的网站使用的其他热门语言是俄语、德语、日语、西班牙语、法语、汉语和葡萄牙语

W3Techs研究的数据基于Alexa.com排名的100万个访问量最大的网站(即,根据2011年12月的数据,约占所有网站的0.27%),在大多数情况下,仅使用网站的主页来识别语言(例如,所有维基百科都基于对语言的检测)。[5]因此,与所有网站的数字相比,这些数字显示许多语言(尤其是英语)的百分比要高得多。所有网站的数据不详,但一些来源估计英语低于50%;例如,见《迈向多语言网络空间》和2009年教科文组织报告。

非英语网页的数量正在迅速增加。从2001年到2011年,网络英语的使用增长了281%,低于同期西班牙语(743%)、汉语(127%)、俄语(1826%)和阿拉伯语(251%)的增长速度。

根据2000年的一项研究,国际辅助语言世界语在搜索引擎查询的所有语言中排名40,在所有依赖拉丁文字的语言中排名27。

互联网语言使用人数排行以及占比

W3Techs估计,截至2020年2月,使用各种内容语言的万维网排名前1000万的网站所占的百分比:

排行 语言 百分比
1 英语 58.5%
2 俄语 8.1%
3 西班牙文 4.4%
4 德语 3.4%
5 法文 3.0%
6 波斯语 2.6%
7 土耳其 2.6%
8 日本 2.6%
9 葡萄牙语 2.3%
10 中文 1.4%
11 越南文 1.2%
12 义大利文 1.2%
13 波兰语 1.0%
14 阿拉伯 0.8%
15 荷兰语 0.7%
16 希腊语 0.7%
17 韩语 0.7%
18 印度尼西亚 0.6%
19 捷克文 0.5%
20 泰国 0.4%
21 瑞典 0.3%
22 希伯来语 0.3%
23 罗马尼亚语 0.3%
24 匈牙利 0.3%
25 乌克兰 0.3%
26 丹麦文 0.2%
27 斯洛伐克文 0.2%
28 塞尔维亚 0.2%
29 保加利亚语 0.2%
30 芬兰 0.2%
31 克罗地亚语 0.1%
32 立陶宛语 0.1%
33 挪威语 Bokmål 0.1%
34 挪威 0.1%
35 斯洛文尼亚文 0.1%
36 印地语 0.1%
37 拉脱维亚语 0.1%
38 爱沙尼亚语 0.1%
39 加泰罗尼亚语 0.1%
40 阿塞拜疆 0.1%

所有其他语言在不到0.1%的网站中使用。即使包括所有语言,百分比总和也可能不等于100%,因为有些网站包含多种内容语言。

互联网用户的语言排行

截至2019年4月30日,InternetWorldStats按语言对互联网用户数量的估计:

排行 语言 互联网
用户
百分比
1 英语 1,105,919,154 25.2%
2 中文 863,230,794 19.3%
3 西班牙文 344,448,932   7.9%
4 阿拉伯 226,595,470   5.2%
5 葡萄牙语 171,583,004   3.9%
6 印尼 / 马来语 169,685,798   3.9%
7 法文 144,695,288   3.3%
8 日本 118,626,672   2.7%
9 俄语 109,552,842   2.5%
10 德语 92,304,792   2.1%
1-10 十大语言 3,346,642,747   76.3%
-- 其他 1,039,842,794  23.7%
4,386,485,541 100%

互联网语言使用人数排行以及占比(更新至2020年2月)

2人评论了“互联网语言使用人数排行以及占比(更新至2020年2月)”

  1. W3Techs研究的数据基于Alexa.com排名的100万个访问量最大的网站(即,根据2011年12月的数据,约占所有网站的0.27%)。
    拿着0.27%的样本做出来的调研数据,有什么好讨论的?????

    我去查了W3Techs的网站,现在他们的数据基于谷歌chrome的用户体验报告。
    也就是说,不是用chrome的用户,都是不统计在内的。
    我相信如果用360浏览器的用户体验报告做样板,也许会调研出90%网页都是中文网页吧?

    对于没有自研浏览器,却有一定网民人口的民族,排名反而会高,因为他们用chrome的人多啊。

    而且“We do not consider subdomains to be separate websites. For instance, sub1.example.com and sub2.example.com are considered to belong to the same site as Example Domain. That means for example, that all the subdomains of wix.com, wordpress.com and similar sites are counted only as one website.
    机翻:我们不认为子域是独立的网站。例如,sub1.example.com和sub2.example.com被视为与example.com属于同一个网站。这意味着,例如,wix.com、wordpress.com和类似网站的所有子域都只算作一个站点。”

    也就是说,谁占有的顶级域名越多,谁被统计的次数就越多,例如新浪的内容再庞杂,也算是一个网站,但一个美国中学的网站,如果能有.edu域名,也能拿到跟新浪同样的权重。

    所以。。。。。别反省了,先看看自己是不是被人忽悠了

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注