印度上网的人多不多(为什么印度人上网基本靠嘴)(1)

科技有温度。

文 | 贡晓丽

世界互联网的未来在印度,CNN经过一番调查,得出这样的结论。

印度上网的人多不多(为什么印度人上网基本靠嘴)(2)

理由倒也简单,全球76亿人口,41亿已接入互联网,剩下的35亿中,四分之一在印度。再者,印度互联网人口为5.1亿,而据尼尔森的预测,到2025年,印度网民将达到8.5亿,超过G7国家的总人口数。

印度,早已是科技巨头们瞄准的一块肥肉,但任何一家想要讨好印度网民的公司,都绕不过一道难关——多语言。

四大语系近2万种方言

新加坡国父李光耀生前遇到过一个很尬的提问。

公开场合,一位印度官员问李光耀:“如果今天印度归您管,您能否在印度施行过去三十年在新加坡的政策?”

印度上网的人多不多(为什么印度人上网基本靠嘴)(3)

这个问题不太好回答,内容敏感、角度宏观、尺度又难把握,但李光耀只抓住一点,便使出一招太极推手,将提问原封不动的推了回去。

“没有哪个人可以独自改变印度,因为印度人讲320种语言,辛格总理可以讲印地语,但是十二亿人民里,只有两亿人可以理解他说的话,这是一个无法解决的结构性问题。”

印度上网的人多不多(为什么印度人上网基本靠嘴)(4)

印度的多语言问题,其实远比李光耀说的严重。

2018年印度人口普查分析报告显示,印度有印欧语系、达罗毗荼语系、澳亚语系和汉藏语系四大语系,各种语言或方言的种类超过19500种。其中,仅印度宪法认证的官方语言,就有22种。被1万人或以上人群当作母语的语言,更是多达121种。

如果两个素不相识的印度人碰面,他们相互交谈和理解的可能性仅为36%。假使甘地、尼赫鲁、泰戈尔有幸坐到一起,也只能用英语交流。

而且,和我们以往的印象不同,13亿多印度人中,精通英语者不过5000万,而粗通英语者大约在2亿。

印度上网的人多不多(为什么印度人上网基本靠嘴)(5)

同为人口大国,中国也有“十里不同音”的方言文化,但感谢秦始皇,中国人有统一的书面文字,而且90%的人都能听懂普通话。

语言限制印度人口流动

作为联邦制国家,语言是印度诸邦划分边界的基础,每个邦各说各话,各有自己的税收和经济体系。

在小农经济主导的时代,鸡犬之声相闻,民至老死不相往来,多语言问题的麻烦并未显现。但随着印度汇入全球化大潮,在工业化与城镇化的历史进程中,没有统一的文字与语言,就成了一大难题。

理论上讲,印度的劳动力年轻、廉价、充裕,最适合发展劳动密集型产业。可是各邦语言不通,文字不通,印度人走出家门到另一个邦,感觉就像出了国,看不懂也听不懂其他语言,这让相当一部分印度人,既没有能力也没有意愿,背井离乡去外地讨生活。

十几年前,富士康就跑去印度开代工厂,没想到在当地盖一座两万人规模的工厂都很难,而中国的富士康工厂,哪座规模不是动辄以十万人计。

中国人可以为了生计背井离乡跨越几个省区去外地打工,以至于每年春节前后都会出现几亿人口大迁移的奇观,相比之下,印度人口却严重缺乏流动性,这样一来,外企在印度开厂就必须先调研清楚,当地究竟有多少可用的人力资源。

即便如愿招到足够数量的工人,如何管理仍是难题,《今日印度》曾刊文称,如果在新德里郊区建一家工厂,工人约5000人,不论是文字通告、使用手册还是日常工厂管理,工厂应该使用什么文字或语言才能与来自不同背景的工人沟通?无解。

印度首富制造在线繁荣

就是这样一个多语言多民族,组织松散的联邦制国家,却在一夜之间乘上了互联网的东风——2018年4月至6月期间,印度消耗了全球近22%的移动数据流量,数以亿计的印度网民,操着各地方言汇聚到以in为后缀的域名之下。

“印度人不像西方人和中国人,是从台式机、笔记本电脑、然后到移动互联网……印度人跳过所有这些阶段,直接从不上网到通过智能手机在线。”小米印度业务负责人Manu Jain说。

印度上网的人多不多(为什么印度人上网基本靠嘴)(6)

印度的在线繁荣,几乎是该国首富Mukesh Ambani以一己之力推动,如果当初没有他的免费互联网策略,农村里的印度人至今还要爬在树上寻找手机信号。

2016年9月,Mukesh Ambani建立的移动运营商Reliance Jio,在印度全国3100个城市推出了免费SIM卡,并慷慨提供免费通话和免费4G流量的试用套餐,用户可以无限量地看视频、浏览网页和网络通话,不收取任何费用——这一任性的策略维持半年之久,Reliance Jio借此吸引了整整1亿用户。

此举一出,顿时引发了移动运营商之间的价格战,大幅削减了印度的数据流量资费。

现在,印度网民拥有全世界最低廉的数据流量资费——平均1GB流量售价仅为0.26美元(约合1.8元人民币)。以Reliance Jio推出的充值套餐为例,网民每月只需要支付149卢比(约合人民币14.8元),就可以享受1.5GB/日的流量、28天免费语音通话及100条免费短信服务。

对印度人来说,能否上网反而取决于智能手机的价格。最便宜的中国品牌智能手机也要花费大约10000卢比(137美元),对许多平均年收入不到2000美元的印度人来说仍然太贵,大多数印度人仍在使用12美元一台的键盘手机。

印度上网的人多不多(为什么印度人上网基本靠嘴)(7)

“如果我们有一款价格更实惠的智能手机,那么一夜之间就可以让印度的用户群增加一倍。”谷歌印度副总裁Rajan Anandan说。

逼出来的印度语音上网

不管怎么说,超过5亿的印度人,借助手机和廉价网费迈入互联网时代,随着印度各地人民的交流变得便利频繁,没有统一国语的烦恼也进一步放大。

一是读不懂。在印度,The Daily Hunt(印度版“今日头条”)支持12种印度当地语言,仍无法保证全部印度网民可以读懂。因为语言太多,该国90%的出版物没有网站。

印度上网的人多不多(为什么印度人上网基本靠嘴)(8)

二是写不出。不说121种方言,仅印度22种官方语言,就需要22种键盘输入法,许多印度网民无法用实体或触屏键盘输入熟悉方言的文字信息。

除了多语言障碍,根据联合国教科文组织2014年发布的报告,印度还是世界上文盲人口最多的国家,成年人文盲人口达2.87亿,这些人同样不具备读写能力。

种种限制,造就了一个印度特色的互联网。比如,印度网民更倾向于访问视频网站而非静态网页,因为打字、检索和阅读都会受到语言读写能力的限制,而滑动屏幕、使用语音和观看视频,就连文盲也可以照常使用。

数亿印度网民的特殊需求,正在重塑互联网的使用方式,包括谷歌业务的基石:搜索。

“在我们看来,语音识别是一项先进的技术,但在印度这样的国家,似乎变成了一项基本需求。”出生于坦桑尼亚,并在印度班加罗尔长大的谷歌搜索负责人戈麦斯说,“发展中国家的许多语言,从未真正拥有过我们所常见的键盘——我学了10年印地语,但我至今不知道如何打字——所以语音比打字更容易使用。”

为了方便印度网民,Google Go开发了一项技术,能让印度用户以印地语、孟加拉语、马拉亚拉姆语、马拉地语和泰米尔语等28种方言聆听网页内容,通过自然语言处理和语音合成AI技术实现了网页内容的语音化。

印度上网的人多不多(为什么印度人上网基本靠嘴)(9)

“由于多语言的原因,印度用户更愿意与互联网语音对话,而不是点击或打字,因此,印度的语音搜索查询每年增长270%,这是惊人的。”谷歌印度副总裁Anandan说,“谷歌已经拥有视频第一的网站,如果你问我,我会说我们将拥有世界上第一个语音第一的网站。”

印度成智能语音试验场

其他杀入印度市场的科技巨头,也将多语言内容运营能力当成攻略印度市场的基本功,而在人机交互方式上,大家不约而同选择跳过键盘或和鼠标,直接使用人工智能技术加持的语音识别技术。

微软今年5月更新Windows 10操作系统时,专门发布了一款支持10种印度方言的语音键盘。它能够对用户的行为模式和遣词造句进行研究,并为方言用户提供个性化的单词联想,进而提高文本输入的准确性。

2017年,亚马逊的Alexa进入印度时,亚马逊Alexa驻外经理Kumar就曾说过:“我们必须打破常规,Alexa不能只懂得英语。我们需要训练Alexa,让它了解泰米尔语、印地语、泰卢固语、旁遮普语和马拉雅拉姆语等。”

去年,亚马逊在Alexa印度站点推出了一项新技术,旨在帮助平台学习印地语以及泰米尔语、马拉地语、卡纳达语、孟加拉语、古吉拉特语和泰卢固语等地区方言。

不过,把印度方言玩得最溜的还是谷歌。

印度上网的人多不多(为什么印度人上网基本靠嘴)(10)

谷歌语音助手支持8种印度方言的输入,Chrome浏览器支持印度11种方言的在线翻译,YouTube印度区主页提供10种语言版本,60%播放量来自印度6个最大的城市之外的地区。

“YouTube(在印度)最初的1亿用户主要是大城市居民,语言主要是印度英语,可是接下来的1亿用户不仅来自大城市,也来自城镇和村庄。如果你是第一次使用,YouTube会根据你的位置更多显示附近用户正在观看的视频,用的语言也是本地语言。”YouTube印度内容合作部主管 Satya Raghavan 说。

在YouTube上,印地语是印度使用人数最多的语言,但随着来自全国各地的用户增多,其它地区语言视频的需求和观看数也在上升。除了印地语外,泰卢固语视频在2016至2019年间的观看数和上传量最高。订阅泰卢固语视频的用户从2016年的1600万飙升到了2018年的1.66亿。

别小瞧了印度创新

印度当地的初创公司也抓住多语言的现实需求,大力投入发展语音技术。

印度初创公司Gnani.ai致力于为银行日常业务提供高质量方言服务,他们已经开发出基于印度语、卡纳达语、泰卢固语、泰米尔语和古吉拉特语等方言的语音识别系统,这些系统同时适用于那些会讲英语但带有浓重印度口音的用户。

印度上网的人多不多(为什么印度人上网基本靠嘴)(11)

班加罗尔的语音技术开发公司Vokal,主打印度本土语言版的“百度知道”,用户可以在该平台上使用自己熟悉的语言提问,然后其他用户的解答,会自动转换成提问者惯用的语言。

“语音是未来。印度农民尤其喜欢用语音搜索感兴趣的内容。目前,如果你不会英语,就很难在各大平台上搜索和获取信息。”Vokal的创始人之一Aprameya 说。Vokal花费了大量时间来训练机器学习算法,使其能理解各种提问并显示相关回答。

不过,有国外媒体尝试过Vokal的埃纳德语和泰卢固语语音搜索,用它查找了烹饪、农作、旅行和健康生活指导等方面的内容,结果却不尽如人意,显然,Vokal还需要一些时间,扩大用户基数,深入挖掘数据,从而进而优化其AI搜索引擎,以达到99%准确率的目标。

根据MarketsandMarkets的《语音识别市场》的报告,全球语音识别市场预计将从2018年的75亿美元增长到2024年的215亿美元,复合年增长率为19.18%。埃森哲预计,今年印度将有1.5亿用户使用语音助手。

巨大投资和特殊需求,让印度成为一个实验室,而这种将想法和产品转化为影响互联网的方式,已经超越了印度的边界。

,