作者 | 薛从豪、司嘉

图片来源|网络

人类社会已经进入大数据时代,大数据无处不在,以美国帕兰提尔(Palantir)公司为代表的大数据独角兽企业横空出世,不断推动行业的发展与进步。2020年9月30日,Palantir以直接上市(Direct Listing)模式登陆纽交所;同年11月12日,Palantir公布上市以来首份财报,营收大幅增长52%,表现相当亮眼;截止12月末,Palantir市值已近400亿美元。

Palantir成立于2003年,最初服务于FBI、CIA等政府机构,而后将触角伸向金融、能源等多个领域,曾因协助美军方成功定位本·拉登的藏身地而名声大噪。回顾Palantir从初创到崛起,直至上市的发展历程,其中有不少值得我国大数据产业链相关公司学习与借鉴的地方。

大数据未来趋势(市值400亿美元大数据龙头Palantir)(1)

图1:Palantir2020年股价走势图

一、Palantir发展历程回顾

Palantir成立于2003年,由Paypal创始人兼Facebook早期投资人的PeterThiel和他在斯坦福大学的老同学Alex Karp,及Joe Lonsdale、Stephen Cohen、Nathan Gettings等人共同创立,总部位于美国加州帕洛阿尔托。回顾Palantir的成长路径,大致可分为三个阶段:初创时期的6年时间内专注情报分析,凭借成功案例和政府客户影响力在大数据领域树立名望;在快速攀升阶段不断拓展业务到需求最迫切、定价较高的金融领域,完成估值的飞跃;在稳定发展阶段将业务领域向其他多个领域拓展延伸。

(一)起步阶段:由反恐情报起家

Palantir创立之初正值美国反恐情绪最高涨的时期,恐怖主义以及大规模杀伤性武器等非传统安全的威胁已经上升成为当时美国主要威胁来源,美军方先后在伊拉克和阿富汗开辟战场。当时的美国情报界急需新的政策框架、科技手段来预防恐怖分子行动。但在信息爆炸的时代,海量的信息无疑给政府或者企业造成了数据处理的难题,现有的算法和分析工具无法满足安全部门的需求。

对碎片信息进行分析与处理正是Palantir最擅长的,从杂乱无章的数据中找出内部关联,从而为政府机构提供解决问题所需的核心情报。时代机遇与自身过硬的实力将Palantir送上了发展的快车道,首个客户就拿下美国中央情报局(CIA)。后来CIA还通过旗下创投基金In-Q-Tel给Palantir打了200万美元风投款,这也是Palantir的第一笔外部投资。

这一时期,Palantir依靠大数据分析系统的强大的信息处理能力,每一次的情报都不是孤立地分析,而是在情报间形成紧密的联系网路,从而构成一个庞大的数据库,这大大增强了情报分析处理效率。从Palantir创立到2008年,CIA一直是公司唯一的大客户,其给予的投资与支持帮助Palantir度过了艰难的初创期。

2008年开始,美国政府开始与Palantir正式签订合约,国家安全局(NSA)、联邦调查局(FBI)等都是其客户。同年,在一个年度数据可视化和计算机会议上,Palantir向外界展示其处理和分析复杂数据的能力。根据一份机密报告陈述,在场英国政府通信总部的代表当时用“令人屏息”来形容Palantir辅助情报机构的巨大潜力。

真正让Palantir名噪一时的事件得益于其与美国军方的合作。2011年,基于Palantir大数据的情报,美军方成功定位到本·拉登的藏身之地,随后击毙了这个世界上最著名的恐怖分子头目。这一事件也使得Palantir进入了大众的视野。

除此之外,Palantir还协助美军方分析阿富汗战争中的恐怖活动模式和袭击模式,辅助其进行精准打击行动;协助美国土安全部打击墨西哥贩毒网络,抓获猖獗在美墨边境的贩毒分子;帮助美国联邦调查局侦查经济犯罪,2008年,Palantir协助FBI在整合40年的记录及海量数据并充分挖掘之后,终于发现了麦道夫(Bernie Madoff)的“庞氏骗局”,从而揭露了这个美国“世纪巨骗”的阴谋。

(二)发展阶段:向金融等领域扩展业务版图

在情报领域的声名大噪也成为Palantir进入其它市场的门票。依靠公司雄厚的数据分析和可视化技术实力,Palantir开始向定价更高的金融等领域进军。

Palantir的创立之初的核心理念是基于PayPal应对俄罗斯犯罪团伙的洗钱和信用卡欺诈的系统,故其在金融业也有一批忠实客户,如摩根大通、摩根斯坦利、桥水等。2010年,摩根大通成为Palantir的首批非政府客户。摩根大通使用Palantir的技术保护账户安全、识别盗号欺诈者,并将Palantir的产品用于房产定价,解决房产抵押贷款的纠纷。此后,Palantir成为华尔街重要的数据分析提供商。

Palantir 强调“人机结合”的方式,因为犯罪分子的洗钱欺诈手段每天变换,而计算机只能识别固定的模式。在Palantir 部署中,由人类分析员设置规则,操作计算机梳理历史数据和新信息,以筛选出一定的模式,再由人类分析员以直觉、经验和专业知识来识别计算机提供信息。Palantir 出色的技术得到了金融业界的认可,目前许多银行、保险、对冲基金乃至美国证券交易委员会都在使用他们的技术。

(三)扩张阶段:持续拓展多元业务领域

凭借已有的渠道、人才、资金的积累,Palantir持续拓展业务领域。据IDC统计,2013年-2020年期间数据量将扩张十倍大数据技术已经形成了十余种解决方案,据官网披露,Palantir的解决方案遍布反诈骗、资本市场分析、网络安全、保险分析、情报分析、行为监控、案例管理、灾害防范、危机应对等领域,涉及行业包括银行、保险、零售、医疗保健、石油和天然气、个人征信等。

随着业务的扩展Palantir解决的问题范围也日渐广泛,美国银行、对冲基金Bridgewater Associates使用它们的技术监管交易;好时则使用Palantir的工具来提高巧克力产品的利润;Palantir的产品还用于问题房产的定价,基于当地经济信息得出结论,避免在拥有问题房产贷款的地方引起社会混乱。Palantir以政府项目起家,但随着不断向华尔街及各种商业公司拓展,非政府客户已达到 70%以上。

Palantir自成立以来,已经历19轮融资,总计募资约26亿美元。Palantir表示,预计2020年收入将达到11亿美元,同比增长42%,其上市首日估值更是高达220亿美元,成为继Uber、小米、Airbnb之后,全球估值第四高的创业公司。

二、Palantir的技术产品及商业模式分析

Palantir是基于知识图谱技术,提供了数据集成、搜索、知识管理、协作、发现五大板块的大数据分析平台。Palantir最初的业务是脱胎于Peter Thiel创办的PayPal的反欺诈技术,该技术为Palantir的发展奠定了基础。Palantir最大的技术“卖点”在于,其不仅可以同时处理多种数据来源,并且可以允许用户通过多种方式快速浏览,查找和分析自己想要的信息,通过数据分析帮助用户做出决策,甚至是“预测未来”。这也是其公司名称背后暗含的寓意。[1]从当前业务发展来看,Palantir主要聚焦两大核心产品,并采取了独特的商业盈利和客户管理模式。

(一)Palantir两大核心产品

Palantir与其他数据分析公司或者咨询公司为客户定制解决方案有所不同,其业务呈现高度“产品化”的特征。Palantir主要有两款产品:Palantir Gotham和Palantir Foundry。上述两款产品几乎可以部署到任何环境中,提供了整合客户数据和操作所需的关键基础设施。此前,Palantir曾推出过Metropolis产品,但后来取消,并于2016年推出了Foundry产品,这也是Palantir公司从定制化软件生产转向标准化软件产品生产的关键一步。

Palantir Gotham和Palantir Foundry两大产品垂直集成的特性允许不同技术能力的用户在其平台上进行有效合作。数据工程师可以集成新的数据源,分析师可以清理和转换数据,数据科学家可以编写模型,业务用户可以执行日常工作流程,高级领导可以做出关键决策。这两个平台既可以单独使用,也可以捆绑在一起作为一个生态系统。围绕它们的数据、分析、决策和元数据都使用细粒度的访问控制进行保护。每个平台都由面向用户的、针对特定行业和部门的应用程序组成。

1、Palantir Gotham大数据分析平台

Palantir Gotham大数据分析平台最初为国防和情报部门的政府特工建立,该平台使用户能够识别隐藏在数据深处的模式,有助于分析人员和运营用户之间的切换,帮助客户计划和执行现实世界的应对措施,以应对平台内识别的威胁。Palantir Gotham包括Graph、Gaia、Dossier、Stencil、Video、Table、Ava、Forward、Mobile等子产品。Palantir Gotham主要应用于国防、安保、反恐等,其运行流程以多源数据为起点,与用户协定制定人本模型,对源数据进行记录、存储和分析。

大数据未来趋势(市值400亿美元大数据龙头Palantir)(2)

图2:Palantir产品将数据关系可视化(资料来源:Palantir官网)

Palantir Gotham分析平台前端提供了一整套的集成工具,这套工具在语义分析、时间分析、地理空间分析、全文分析方面均做了优化,结合后端勾连的海量数据库,使用户能够识别隐藏在数据集深处的模式。Palantir Gotham能够整合从侦察终端信号到来自线人的报告,当数据流入平台时,它并映射到统一的数据模型中。在此基础上客户可根据具体需求配置不同的功能模块。当前,Palantir Gotham大数据分析平台已广泛应用于美国政府各部门,同时也向商业客户提供服务,其中就包括那些与欺诈调查有关的金融服务行业的客户。

2、Palantir Foundry大数据分析平台

随着业务合作对象由政府部门扩展到金融等其他行业,Palantir于2016年发布了第二个软件平台Palantir Foundry,用以解决公司或企业在数据方面面临的问题与挑战。Palantir Foundry包含Monocle、Contour等11款产品,支持代码编辑、无代码编程、报告生成、时间序列数据分析等功能。该平台通过为数据创建一个中央操作系统,改变了组织运作的方式。

大数据未来趋势(市值400亿美元大数据龙头Palantir)(3)

图3:Palantir产品的医疗场景应用(资料来源:Palantir官网)

Palantir Foundry构建了全新的数据使用方式,消除了后端数据管理和前端数据分析之间的障碍,即使计算机技术能力有限的用户也能够在其专业领域内处理数据。通过Palantir Foundry,任何人都可以获取、连接并将数据转换成他们想要的任何形式。该数据分析平台使用人们能理解的语言,把数据放在语境中,将数据转换为对组织中的每个人都有意义的对象。例如,物流公司的数据具象化为港口、船只、集装箱和客户等。用户可以一次搜索所有的数据源,探索不同的假设,显示未知的连接和模式。

(二)Palantir商业模式分析

Palantir成立之初瞄准政府大数据分析需求,并逐步向商业市场横向拓展。从技术路径上来看,Palantir选择独立于标准化与纯定制的第三条路线,沉淀垂直行业共性需求并标准化,同时保留客制化的模式。从目标客户群体来看,Palantir将支付能力较强的政府客户及大企业作为目标客户,可及市场或超过千亿美元。

Palantir依托行业龙头打造垂直行业数据操作系统,并实现横向拓展。Palantir将旗下产品定位为行业操作系统,在这一愿景下,开放生态是技术基础。从技术层面来看,Palantir的大数据分析平台可以兼容用户原有数据系统,并可实现灵活开发,向用户开放生态的同时,提高底层平台的切换成本;从用户层面来看,Palantir与行业龙头共同打造垂直行业平台,将行业秘诀(Know-How)及共性需求沉淀,以提高数据分析平台的产品化程度,并保留针对用户的定制化特点。行业层面的聚集效应或可聚集更多行业内玩家接入,企业内部的网络效应则可进一步提升平台价值,提高用户粘性。

Palantir的收入成本主要包括工资、基于股票的薪酬费用、执行操作和专业服务的人员的福利,以及第三方云托管服务、分配的开销和其他直接成本。在刚进入一个领域时由于对行业了解的不充分,其需要的研发人员工资、与第三方的沟通成本都较高,而随着对各个垂直行业的了解不断深入,后续订单所需成本都将大大降低。2019年以来Palantir收入成本的绝对值随着收入的增长而增加,而成本在收入中的占比仅为30%左右。

Palantir的营业收入早期年复合增长率曾高达700%,近年保持10%-20%的速度增长。从2008年到2019年,Palantir总共创造了34亿美元的收入。Palantir在2019年收入为7.426亿美元,比2018年增长了25%。在地缘政治不稳定和经济萎缩的2020年上半年,Palantir收入的增长反而加快了,2020年上半年创造了4.812亿美元的收入,比2019年上半年的3.277亿美元增长49%。

(三)Palantir客户管理模式

在客户管理模式上,Palantir对客户进行阶段化分类,实行精细化管理,以提升转化率。根据客户所贡献的年收入及边际贡献,公司将客户分为潜在客户获取(Acquire)、客户培育与拓展(Expand)、客户规模化(Scale)三个阶段。Palantir会在每年的最后一天(12月31日)对所有的客户的分组进行再评定。部分客户可能会迅速通过“获取”阶段之后,却要经过较长的“培育与拓展”阶段,其他一些客户可能会跳过“培育与拓展”阶段直接进入“规模化”阶段。

在客户“获取”阶段,Palantir通常通过短期试点部署软件来获取新的机会,以挖掘潜在客户的需求,从而给的客户带来最小的风险。Palantir将当年创造营收少于10万美元的客户或潜在客户定义为获取阶段。2019年Palantir获取阶段客户产生了60万美元的收入,并带来了0.65亿美元的负边际贡献。2020年上半年,这些相同的客户产生了0.19亿美元的收入,边际贡献亏损缩窄至0.14亿美元。

在客户“培育与拓展”阶段,Palantir深入了解客户痛点,并依托公司产品满足客户需求。这一阶段的投资非常重要,因为Palantir希望了解客户面临的主要挑战,并确保软件可提供价值和结果。公司将当年创造营收超过10万美元但毛利率为负的客户划归到这一阶段。2019年处于培育阶段的客户产生了1.76亿美元的收入,边际贡献率为-43%,2020年上半年相同客户产生了1.61亿美元的收入,边际贡献由负转正,实现35%。但是值得注意的是,Palantir客户客单价或存在不稳定的情况,因此客户可能在不同阶段往返,即部分客户可能存在一定程度上的流失。

在“规模化”阶段,Palantir实施成本显著下降,主要依托软件平台的运营服务获得收入,故边际贡献率转正。这一阶段,客户可以在使用大数据分析平台时变得更加自给自足,包括正在开发的软件,以及在公司的平台上运行的应用程序,同时仍继续从公司的运营和维护服务的支持中受益。Palantir将当年收入超过10万美元但毛利率为正的客户定义为“规模化”阶段。2019年“规模化”阶段客户产生了5.66亿美元收入,边际贡献率为55%,2020年上半年这些客户产生了2.96亿美元的收入,边际贡献率上升至68%。规模化阶段客户占比的提升,将有效优化公司的成本结构,或是公司能否盈利的关键。

三、Palantir对我国企业的启示

当前,我国大数据产业规模持续高速增长,在政府持续发力支持下,大数据企业未来将迎来新的发展机遇。数据显示,我国2019年大数据产业规模高达5397亿元,同比增长23.1%。预计2020年整体规模可达6670.2亿元,而这一数字将在2022年突破万亿元。在大数据产业蓬勃发展的时代背景下,相关公司与企业如何抓住机遇,实现跨越式发展,是摆在面前的一道重要课题。Palantir从创始到实现上市的过程有不少值得大数据产业链相关公司借鉴学习的地方。

(一)秉承独特产品哲学,不断解决客户“痛点”

Palantir的成功有赖于其深谙用户业务逻辑,产品解决客户“痛点”,从而让议价权牢牢掌握在自己手中。在初创期,Palantir瞄准大数据分析领域的两大痛点:一是现有的大数据处理技术及使用的便捷性无法满足客户需求;二是数据处理的成本非常高,企业传统的数据服务方式是自己开发软件或向系统集成商购买,数据处理工具之间是独立的,导致数据整合和数据分析的不连贯,随着业务发展要不断增加购买,成本高。

针对上述两大痛点,Palantir一方面立足“数据融合”,通过构建统一数据本体及统筹“人”“机”各自优势,建立起全新数据处理方式。Palantir整合组织所有数据流,既包括结构化的也包括非结构化的,将它们映射到一个统一的模型中,提供一次性解决方案,降低客户长期成本。不同于直接提供解决方案的算法黑箱,Palantir致力于将机器的计算能力的优势及人的思维逻辑相结合,将人机各自优势发挥到极致。Palantir认为数据融合不是为了让机器取代人的决策,而是为人提供辅助,人思考并提出问题、判断需要哪些数据,而机器则负责查找数据和识别规律,二者共同解决问题。

Palantir另一方面形成了与客户合作的独特方式,以客户业务为核心实现真正为客户创造价值。Palantir注重研发人员从直接参与客户的工作中获得的经验,经验的积累将带来业务效率的提升。Palantir认为工程师必须亲身体验,通过实地参与客户的工作,对客户需要什么、如何做决策、如何计算权衡有深刻理解,才能了解不同行业面临的具体问题,并确保平台继续进行相应改进。Palantir在构建平台时往往要对该行业进行数万个小时的实际工作学习。

(二)从G端向B端拓展,逐步完善垂直行业布局

Palantir在初创期与政府部门合作,专注G端用户长达6年之久。在行业内部逐步站稳脚跟后,Palantir凭借多年积淀的政府业务影响力,才逐渐进入了金融领域,而后再将业务逐渐覆盖至多个行业。得益于业务领域的拓展,Palantir在近两年时间内,估值从90亿美元飞跃至200亿美元。

Palantir的成长路径对我国大数据企业也具有重要的借鉴意义,提供给了一个非常好的发展思路:在发展初期,公司可将自身客户定位于具有较高社会和市场影响力的政府机关、大型集团或知名企业,深耕大数据的某一细分行业领域;发展中期,在细分行业领域取得成功案例和大客户信任后,拓展到需求旺盛、定价较高的其他领域,实现技术沉淀和名望积累的快速变现,完成估值飞跃;在中后期,凭借已有的渠道、人才、资金的积累,继续拓展业务范围,巩固业内领先地位。

发展的每一个阶段对公司都极为重要,可以说每一个阶段的晋升都是一场赛跑,并且每一个阶段都在为下一个阶段进行准备。大数据公司须统筹分析自身的竞争优势,选择最佳的市场定位,制定明确的跨领域发展规划,才能在大数据的赛场上拔得头筹。

此外,找到重点拓展的行业领域对公司的发展也非常重要。Palantir在开拓B端市场上首先选择了金融领域。当前,我国金融业体量正在快速增长,随之而来的营销、风控、运营、定价等大数据需求也会相应增长,因此金融也是我国大数据公司在发展初期可以选择开拓业务的重要领域。

(三)秉承“人机结合”理念,重视吸纳大数据分析人才

目前,大多大数据公司的业务模式仍局限于系统搭建和运维服务,而Palantir通过搭建系统将所有关联数据进行整合,并呈现给大数据分析师。分析师使用系统内的各种数据分析工具进行深度数据分析,寻找客户的深层需求和数据之间的深度关联,不断优化解决方案。计算机擅长处理海量数据,但“人”与“机”的无缝交互才是解决难题的关键。

在大数据的某些应用领域,由于数据关联性的复杂多变,“人机结合”成为有效开展业务的重要模式。例如情报分析和反欺诈过程中,犯罪分子作为分析对象,其犯罪手段是在不断变化、升级的,这种情况下必须使用人脑和系统相结合的方式,才能够对这种变化尽快作出反应,做到有效的打击。

Palantir实质上是结合数据、技术、分析师的专业能力,将人和计算机完美地融合在一起,并将各自的优势发挥到了极致。从Palantir的成功不难看出,“人机结合”是大数据公司开展业务的重要模式,其优势是将人的洞察和逻辑与高效的机器辅助手段相结合起来。吸纳相关领域的人才对大数据企业来说至关重要。Palantir创立之初,已经具有社会威望的四位创立者和原PayPal技术人员就组成了强大的技术团队。随着Palantir的发展逐步形成了一种强调人才激励的企业文化,激发员工热爱工作,打造市场上最优产品。企业文化是一种无形的激励力量,它可以潜移默化的激励全体员工共同奋斗,实现企业的目标。Palantir每个月还发布一次软件更新, 工程师们利用元素周期表中的元素来命名这些更新, 并设计专门的 T 恤加以纪念。

未来,人工智能时代必定是人机结合的时代。对于大数据公司来说,吸纳相关领域的人才,构建出生态系统,不断提升对数据的驾驭能力非常重要。

[1] 编者注:Palantir借用《魔戒》中能看到未来的“真知晶球(Palantír)”作为其公司名。

,