“计算隐私”有风险,投资下注需谨慎。
作者 | 张核
制表 | 王泽华
编辑 | 杨杨
“其实隐私计算这个名字很容易产生误解,我们并不是要去‘算’别人的隐私,”华控清交董事长张旭东向「甲子光年」笑着聊起他与老友聚会时被调侃的场面,“我们最起码也是隐私保护计算嘛。”
即使还很少有人理解“隐私计算”究竟算的是什么、甚至没有多少人听说过这个技术,但隐私计算赛道的融资已经火起来了。2021年7月到10月,仅仅四个月时间内,这个赛道已经从VC基金手里融到了超10亿元人民币。
另一个颇受关注的点是,瓜分这笔巨资的是仅仅十几起融资案例,也就是说单笔融资金额平均在亿元级水平,“金主”们在隐私计算行业里是下了重注的。
但资本并不是一边倒的,也有人表示看不懂。成立于2018年、刚刚完成B轮融资的华控清交,B轮融资额5亿元,估值已经超过了40亿,本轮的投资方包括联想创投、中关村科学城、华兴资本、朗玛峰创投、同创伟业、OPPO战略发展部、迅策科技、中金公司、浦耀信晔。为什么这家隐私计算公司能值这么多钱?高估值以及盈利模式、盈利预期的不清晰,是质疑的主要来源。
“(隐私计算)项目估值都很高,但是暂时还没有看到相匹配的营收节奏,”一位投资人告诉「甲子光年」,“另外,因为隐私计算的前提是数据,所以不少公司都是先帮助客户做前期的数据处理,还没有到大规模开始用隐私计算技术产品的阶段。”
有人望而却步,不过更多的人看好这一技术前景,对此表现得相当乐观。红点中国的合伙人张鸣晨就认为,“随着政策的落地,数据安全必须提上桌面,这个赛道内三到五年之间就会出一家10亿元营收的公司。”在他看来,这是与国家战略挂钩的赛道。VC们做投资决策的时候,更多看的是赛道够不够宽、够不够长,其次才是公司一定时间内的收入、盈利可能。
还未形成市场共识,但热钱、高估值以及支持者坚定的态度难免让旁观者陷入焦虑。隐私计算究竟是解决什么问题的技术?进入这一赛道的投资人看到了怎样的未来?这个未来到底什么时候会来?「甲子光年」通过走访投资人及企业,得出以下结论:
隐私计算技术可以让多个数据持有方在互相不信任的前提下完成联合计算,企业及投资方认为这一技术及其配套的制度政策将是大数据时代的下一代基础设施;隐私计算中的核心技术已经得到了理论层面的认证,但要能实际落地,还需要融合不同技术流派以及区块链、AI等互补技术,企业尚在摸索期;隐私计算的主要落地场景在金融、政府、医疗等受政策监管程度高的领域,除了技术能力,产品能力、销售渠道也被投资人所看重;隐私计算市场刚刚起步,商业模式尚未成熟,距离实现行业数据互通的愿景还要十年甚至更久。
1.隐私计算,下一代基础设施?在B轮融资交流会上,华控清交打出了“建设下一代基础设施”的口号。同期,包括星云cluster、数牍科技、翼方健数等在内的隐私计算厂商,也都在着重强调隐私计算作为基础设施的未来愿景。
一提到基础设施,你会想到什么?与人们日常生活息息相关的水电、交通、通讯等,以及支撑这些行业运转的大型工程项目,比如看得见的发电站、水厂、铁轨,都属于基础设施的范畴。
隐私计算为什么可以被看作是基础建设的一环?在数牍科技的联合创始人蔡超超看来,这是因为“数据流通的价值巨大,而隐私计算可以让数据流通的顾虑更少”。数据作为生产要素具有可共享、可复制、可无限供给等特殊性,所以在缺少信任的前提下,很难做到自由流通。而隐私计算这种技术手段所能起的作用,就是确保在数据流通过程中,让不同持有方的数据可以联合计算,即彼此之间无需看到其他方的数据而只能看到计算结果,也就是做到数据的“可用不可见”。
只要是基础设施,就一定是一条“既宽又长”的赛道。据国家互联网信息办公室,中国数字经济规模已达31万亿元约占GDP三分之一。IDC数据表明,2019年全球数据量已达为41ZB,到2025年将达到175ZB并保持指数级增长趋势。中国的数据量占全球数据量的近1/3并不断扩大,预计到2025年将赋能我国10万亿规模的GDP增量。
“假设隐私计算能占到其中的十分之一,这个市场规模已经相当可观了。”张旭东说。
隐私计算也并不是一个近两年才兴起的技术,上世纪八九十年代,多方安全计算、同态加密等隐私计算技术体系中的重要技术已经被理论认证了。那为什么在大数据产业已经轰轰烈烈发展了十余年,隐私计算技术却“姗姗来迟”、今年才火呢?
因为技术之外,完善的基础设施建设还需要包括制度、法规、市场体系全方位地支撑。《个人信息保护法》、《数据安全法》两部重磅法案先后在2021年9月、11月生效,《数据安全法》中规定,数据的控制方如果不能证实自己保护了数据安全,最高会面临当年收入5%的惩罚额。
“法规一旦明确的话,大甲方就会有相应的动力和预算去做这个事。”联想之星合伙人高天垚告诉「甲子光年」。
过往的现实也印证了这一点。在数据规范要求高的领域,隐私计算已经率先落地。目前隐私计算企业的目标市场,集中在金融、政务、运营商、医疗四个行业。这是因为它们的一些共通特性:首先,它们都属于数据密集行业;其次,政策对于这四个行业的数据规范关注度最高、具体条例也相对明晰;再次,这些行业内以大型企业居多,预算更加充足。
这四个行业中,金融行业内隐私计算公司的“扎堆”最为严重。根据企名片pro数据,目前赛道内融资在A轮及以上的11家公司中,有7家都在主攻金融业务。
金融行业对于隐私计算技术的需求确实也最为迫切。金融行业内数据规范度高、应用场景丰富,为隐私计算产品进入提供天然良好的条件。政府自2020年开始的严监管措施则是直接推动力,去年央行对民生银行、光大银行、华泰证券等开出千万元以上的罚单,直接推动了隐私计算产品的商业化落地。同年,华控清交、蓝象智联、冲量在线等隐私计算公司纷纷开始在银行内部测试产品。
2.“跑十年、十五年的准备”法规出台迅速推动数据安全措施落地,这其实在三年前的欧洲已经上演过一回。欧盟对于个人隐私的保护法案《通用资料保护規則》(GDPR)于2018年生效之后,Facebook、Google等大厂因此频频被罚。2021年9月,Facebook旗下的WhatsApp又因违反欧盟隐私法被罚约2.7亿美元,2019年1月,Google也因数据隐私问题被法国数据保护监管机构罚款5000万欧元。
对于隐私数据安全的立法整顿,互联网大厂似乎总是在“中枪”的一线,这也促使它们持续加大隐私保护的研发力度,甚至联邦学习(隐私计算的重要技术之一)就是最先由海外互联网大厂Google的一位工程师提出的。国内,蚂蚁、腾讯也同样在隐私计算方面深入布局。
政策推力之下,随风起舞的并不止大厂们。在中国,与法律、法规落地同步,2020年被称为“隐私计算元年”,创投市场开始集中关注隐私计算。赛道内融资事件约15起,而在此之前,创投市场几乎没有发生过在这个赛道上的投资。
“2020年市场上做隐私计算的企业有两百多家”。锘崴科技首席科学家王爽教授向「甲子光年」分享说。
大量的创业公司涌了进来。现在已获投资的隐私计算初创企业可以分为两类,一类企业专精于隐私计算技术,大多成立于2018年以后,例如华控清交、锘崴科技、数牍科技、蓝象智联、冲量在线等;另一类是先专注于区块链、风控、产业信息化等相关领域,在看到数据流通的痛点与价值后,转攻隐私计算,例如富数科技、翼方健数等。
在数据、技术资源以及市场渠道天然占优的大厂面前,初创公司还有机会吗?
答案是肯定的。在《一家隐私计算公司怎么才能年入十个亿?| 甲子光年》一文中,就提到,“中立性”与“专注度”是创业公司的优势。除此之外,因为技术产品还在快速迭代期,小型创业公司具有能够快速调整方向的灵活性,这也是大厂所欠缺的特质。
另外,张旭东还强调,未来主要产生数据的还是机器及终端。工业、交通、能源等国家支柱型产业所产生的数据规模,会远超个人所能产生的数量,相比之下,更关注C端数据的互联网大厂所要处理的数据量其实并不大。但与金融、政务相比,这些领域的数字化程度相对低,要在这些行业推进隐私计算,时间会更长。
但也有投资人向「甲子光年」表示,现阶段搭建大数据平台,大厂天然的优势仍然无法被忽略。“即使因为中立性原因很难向外拓展,大厂与大厂之间的数据互通平台也还是更有可能由自己来做。”这一块蛋糕的体量始终不容小觑,而初创公司要切一块分食,更有可能的方式还是作为技术或单一产品的提供方,不太有可能成为搭建底座的角色。
元年的另一重意思,就是指这个行业才刚刚开始。高天垚认为,“行业还在很早期的阶段。”
与许多to B的赛道一样,隐私计算也是个“慢热”的赛道,需要积累,也需要创业者做好长跑的准备。56岁的张旭东说,已经做好了在这个赛道再跑十年、十五年的准备。蓝象智联的CEO徐敏则表示,能够做到在金融行业让客户拥有以数据驱动业务的能力,需要十年以上的时间,“等做到就能退休了。”
从美国回来不久的蔡超超也多次强调,技术、市场、法规是并行发展、交错向上进化的,需要更多时间达到完善成熟。
隐私计算赛道涉及生产要素的流通与交易,未来也很有可能受到政策的强监管。有投资人认为,未来作为基础设施存在的数据交易平台更有可能是由政府或国有企业来搭建,而完全市场化的隐私计算企业可能只能作为技术的供应商,如果是这样,预想的赛道天花板就会降低不少。
其次,隐私计算保护数据安全,那么谁来保证隐私计算系统的绝对安全?在张旭东看来,整套体系的完善会是“一个长期的过程”。现在,隐私计算企业已经在这方面有所探索,未来技术产品会不停迭代,同时配套的新的制度体系也会不停更新。
3.投资人的困境:不止估值尽管如此,隐私计算企业的估值早已经水涨船高了。“关于数据安全的赛道现在估值都相对高。”高天垚告诉「甲子光年」。
一个市场火热起来的过程中,总免不了有人浑水摸鱼。“很多企业只是套用了开源框架,并没有真正的自研技术”,一位业内人士告诉「甲子光年」。
数据安全保护涉及的技术门类多、门槛高、各种专业术语让人晕头转向,而且因为数据不可见不可感,产品效果大多只能靠听企业介绍来了解。花了钱、引入的数据保护产品究竟用到的是什么技术?能不能切实保护数据不被泄露?大多数人都不懂密码学和计算机技术,很容易陷入迷茫。
相对于此,投资人要面对的一个更大挑战,是隐私计算的技术路线也还在探索之中。
隐私计算技术现在有三种技术流派:多方安全计算、联邦学习、可信执行环境,这三种流派分别有不同的优劣势:多方安全计算安全级别最高,但是对算力要求高、现在能支持的功能较少;联邦学习不收集原始数据而是通过模型来完成计算,但是模型难以完全保密;可信执行环境的运算效率最快,但前提是“信任硬件”,因此容易受到硬件成本、对硬件厂商信任度的制约。
2018年到2020年期间,率先进入这个领域内的公司都是先从一种技术路径开始进行研发,但是在面对客户时,单一路径的技术往往不能满足所有需求,2020年之后,三种技术路径的融合逐渐成为主要趋势。
“现阶段,隐私计算公司要想承接大项目,必须是三种路径都要做的。”创世伙伴CCV投资人张弘告诉「甲子光年」。现在各家公司在融合多种技术方面都是“新手”,谁能在技术方面跑得最快、最远,还没有明确定论。
「甲子光年」走访的多家企业都表示,现在的研发是“两头进行”:一边根据用户的实际需求寻找最可行的技术路径,一边关注理论与技术的前沿突破、持续寻找新的可能性,这也对隐私计算公司的团队提出了更高的要求。
另一个困境则是,隐私计算的商业化落地如今仍是困扰各家公司的一大难题。
“数据自由流通”是一项既宏大又琐碎的愿景。一方面,数据流通所能创造的价值已经成为大数据时代的共识;另一方面,要让公司与公司、行业与行业之间的数据能真正做到自由流通,并不仅仅是引入隐私计算技术就能搞定,其中涉及的环节复杂而耗时,隐私计算企业首先要帮助客户构建“数据底座”,用数据打通企业内、行业内的每一个环节。
一位投资人告诉「甲子光年」,在行业内已经有积累的公司能更好地理解客户的业务场景,但现阶段更重要的是拿下标杆客户的能力,“隐私计算主要应用于金融、政务、运营商、医疗方面,进入这些行业不仅要靠技术产品能力,销售渠道的资源也非常关键。”在宣布B轮融资前不久,华控清交成为北京国际数据交易所的唯一隐私计算合作商。
相比之下,医疗行业引入隐私计算的难度更大。国内医疗行业的数字化水平参差不齐,数据缺乏统一的管理标准,隐私计算企业要想让产品落地,首先要做的第一件事情是从一个个科室开始做数据工作。一位投资人还向「甲子光年」提到,医院并没有真实的动力来推动医院与医院之间的数据打通,更想做这件事情的可能还是医药研发企业,因此这其中的商业模式会更复杂:使用隐私计算产品的是医院,但首先使用计算结果的却是药企,而能推动院与院之间联通,还需要政府助力——这对隐私计算企业的渠道能力提出了非常高的要求。
但无论是选择进入什么行业,客户最看重的特质都是理解业务场景的能力和提供“开箱即用”产品的能力。“面对客户不同的场景,我们都需要持续做更新和迭代,让产品能做到实用性强、适用性高。”蔡超超说。
在张弘看来,和大部分to B领域一样,投资人则更看重产品标准化的能力。但现实却是隐私计算产品的标准化程度还很低,而做定制化、服务大客户意味着周期长、重人力。多家隐私计算公司都表示,2020到2021年间,团队规模在迅速扩张,这一方面是市场需求在急速增长,另一方面也是因为各家公司都在做定制化,堆人力是不得不选的路。
一位投资人告诉「甲子光年」,几乎所有隐私计算公司现在的盈利模式都是项目制签单、提供全套解决方案,距离设想中的“平台分润”,也就是“按数据交易量抽成”还有很远的距离。
“投资人始终高度关注团队能将项目经验沉淀进产品的能力”,蔡超超也提到,“眼下,我们的产品还处于随着项目深入不停迭代扩展的阶段。”在他看来,产品本身是不断进步迭代的,满足客户需求和提高产品标准化并不冲突,这也是产品走向成熟的必经阶段。
,