前段时间,一直有人在问,为什么国内无法注册ChatGPT,网上的回答也五花八门,主要的归为两类:“不可抗拒力”、“因为基于谷歌的机器学习服务,所以被限制”

第一个回答等于啥都没说。对于第二个,笔者内心总是盘旋着一个词“瞎扯

今天正好新的文章还在做信息梳理,就抽1小时和大家聊聊。


先证伪 - 我们从2个角度先来交叉验证这句话是“瞎扯”哈:

1、OpenAI的商业脉络

结论:从整个脉络来看,google完全没有介入OpenAI,而且从始至终都是竞争关系(灭霸和复仇者联盟........)

2、AI整个生态底层服务组成

AI由算法、模型 数据集、上层应用组成

结论:这些ChatGPT的关键要素扒开来看,就没有任何google身影,更何况基础模型都是开源的。

综上,我们推翻了“因为google服务所以无法在国内使用”的猜测。那到底是因为什么?


做假设和论证 - 网上那么多大神都没说明白为什么,笔者当然也不敢造次,所以今天选择从“模型准确性”角度来说一说国内不开放的理由。

大家都知道,ai的核心是对数据进行特征鉴别(也叫学习)并通过反馈来强化学习。然后运用计算机超强的算力帮助人类对所有处理后数据进行归类、统计、分析甚至于创造性的工作。那么对于数据特征的鉴别准确性就是一个关键指标(举个栗子,你家要买指纹锁,有1%的认假率,你敢买吗?肯定不敢。但现在认假率已经远远小于0.001%,所以才形成了目前的市场规模)。只有识别准确,之后的分析、统计工作才有价值。

我们再来看ChatGPT是如何训练来做提升模型准确性的(RLHF技术):

chatgpt如何使用简单教程(全网都没有说明白)(1)

这张图网上已经放过好多轮了,用通俗一点的文字来说:

第一步:用高质量数据集进行训练【人类公认理性回答

第二步:多个结果让AI挑最符合人性【有情商的回答给个糖吃

第三步:通过回传来迭代优化第二步,直到模型收敛。【通过大量实践,越来越有情商

第一和第二都是需要OpenAI内部来完成,但第三步是通过ChatGPT上线后大量API调用的反馈来实现(待进一步验证)。

是不是有点品出那味儿了?

第一步“40岁的阿姨,妈妈教我们要叫阿姨”;

第二步“40岁的阿姨,叫姐姐”,然后你老妈给你奖颗糖;

第三步“40岁的阿姨,叫漂亮姐姐”,然后阿姨给你吃了一颗糖

关键是,这颗糖是阿姨给你吃的!

现在我们来看ChatGPT为什么国内不能访问?也许根本就不是OpenAI不给我们用,而是我们不想给OpenAI提供数据和反馈。糖留着给自己的孩子呀!(比如3月将发布的百度AI聊天工具)

写到这里,感觉差不多闭环了,说服我自己可以发了。


介绍一下自己:30年游戏玩家,14年游戏相关行业从业者。聚焦科技创新 商业化落地解决方案。

未来我们会每周调研一个AIGC相关细分赛道,如果您也有想要了解和探索的方向,欢迎一起交流合作。也欢迎各位交流行业、市场、产品、技术、管理等方面内容。

,