自chatGPT开放使用以来,AI领域的发展日新月异,GPT4的发布更是让人们看到了AI的强大之处。在此,我们整理了近期对AI领域的投资方面的思考,如有错漏之处,欢迎指出交流。
未来的大模型格局?是OpenAI一家独大、双寡头垄断、还是OpenAI逐渐被其他家追上?
纵观计算机领域的发展历史,有很多领域都是被一家或两家公司垄断,比如EUV光刻机只有ASML能做,先进制程晶圆代工只剩下台积电和三星,CPU长期以来都是Intel和AMD,GPU是NVDA和AMD,PC操作系统是Windows和Mac,手机操作系统是安卓和苹果。而且双寡头的市占率往往是二八开甚至是一九开。那么,在未来的AI大模型环节,究竟会是什么样的格局呢?我们从2B和2C两个层面来分析。
首先是2B层面,目前看到的主要是两种应用,其一是大模型开放API或插件给其他应用型公司,以及接入其他公司的本地数据库做查询分析,其二是开放基础模型给其他公司用独家数据做微调。其中第一种没有涉及到模型训练,第二种则涉及到了模型微调。目前来看,这两种openAI应该已经都做了,其中API和插件已经广为人知,而微调的案例则包括Microsoft Office全家桶Copilot,Morgan Stanley使用GPT4辅助财务顾问,Stripe使用GPT反诈骗等等(根据官方资料推测)。
openAI在2B层面可能拥有的竞争优势包括know how,高研发投入带来的技术不断进步,生态网络等等。从know how的角度来看,大模型的预训练和微调本来就是充满了技术细节(可以类比于台积电制造晶圆时的一步步工艺细节),比如GPT4的预训练在去年8月完成,微调又花了6个月的时间。而且GPT4的technical report中提到的作者超过了上百名,不论是人才密度还是工程合作难度都是难以被模仿的。此外,openAI从GPT4开始不再公布技术细节,使得竞争对手想要追赶openAI愈发困难。从技术进步的角度来看,如果一家公司的技术可以在上一代的基础上不断迭代进步,那么领先者的优势就很难被超越,典型的就是台积电的先进制程。虽然也存在其他技术方向再一次颠覆大模型的可能性,但是这种概率目前来看还很低,而大模型的潜力还远未达到上限。最后,从生态网络的角度看,openAI同过插件的形式把自己的能力输出到各个软件当中,如果将来开发者可以通过openAI来调用其他软件的功能,并且形成丰富的生态网络的话,那么openAI实际上就成为了AI时代的操作系统、应用商店,这种网络效应的生命力是非常持久的(参考windows),可能这也是openAI快速地与大量公司建立合作的原因,目的就是抢占坑位。这三者当中,按照重要程度排序是生态网络>技术进步>know how。如果没有技术不断进步的话,know how的壁垒也早晚会被其他玩家攻破;而如果没有建立生态网络的话,即使openAI的技术远远超过其他公司,具体到每一家公司在面临使用openAI大模型、使用行业第二或开源大模型、自研大模型的选择时,也往往会基于数据保护、细分领域优势、利润分配、使用场景是否真的需要超高智能等考虑而不采用openAI。在这种情况下,当然openAI也能在高价值领域活得很好(就像是今天的Apple),但是却失去了更广阔的的市场空间。
在2C领域,openAI本身目前的产品只有chatGPT。一般来说,2C产品的竞争优势主要有用户习惯,切换成本(包括学习成本、数据沉淀、试错成本等等),以及规模和网络效应。可以说,目前的chatGPT只有一些用户习惯、数据沉淀、规模效应,但是未来openAI能做的还有很多,比如把历史问答数据都沉淀下来,并且接入其他应用的能力,这样chatGPT就会更接近私人助理,一方面用得越久就越依赖它,另一方面它成为了流量入口,其他应用的流量价值都转移到了openAI手里。不过这种形式的产品仍然不一能保证它一家独大的垄断地位,除非它能进一步建立用户与用户的网络效应,比如把社交通信的功能也抢过来。
尽管我们对openAI的战略选择做了一些推演,但是具体怎么选择还是取决于openAI的价值观。openAI的目标始终是建立通用人工智能(AGI),但是这将是一个耗资巨大的梦想,只靠融资是不够的,因此Samuel Altman的决策就是一边赚钱一边资助这个梦想,这就是openAI从一家非营利组织转变到有盈利上限的商业组织的原因。从这个角度看,openAI应该还是会在未来几年积极竞争,确保自己的盈利能力的。
总的来说,未来大模型的格局大概率是openAI一家独大,其他公司与开源大模型主要应用于细分市场和特殊领域,而openAI能否建立成熟、广泛的生态网络则是它能成为苹果还是微软的关键。
未来AI行业的格局会是什么样的?上下游哪里的投资机会更大?
类比目前的半导体行业,未来的AI行业的上游是大模型(对应目前的晶圆厂),下游是各类AI应用(对应目前的芯片设计公司),但是价值量主要集中在下游。从现在openAI的定价机制上看,它根据调用API的token数量收费,也就是一种基于成本的定价模式。那么生成同样的字数,用于闲聊和用于生成法律合同的价值量相差了千百倍,而openAI并没有赚到这些额外价值,这些价值由下游应用公司赚走了。从这个角度看,直面用户的公司如果能利用好AI能力帮助客户创造更大的价值的话,他们的成长空间是很可观的。
但是还有一些传统的软件公司,比如Adobe,尽管自身的优势仍然很强,但是如果未来的大趋势是AIGC的话,Adobe的价值量也会大大降低甚至是被完全取代。目前来看,AIGC只能生成初始概念图,还需要用Adobe做进一步的修改,但是随着技术进步可能修改的功能也会由AI来完成。
在c端,可以预见的是,未来每个人都会拥有一个AI助手,这个助手可以操作所有的其他软件,相当于一个超级流量入口(类似于更强的微信小程序),那么那些做用户和商家之间的平台型公司价值就减少了一半,比如淘宝、booking等等。但是如果某些公司拥有丰富的数据沉淀,可以利用好历史数据和AI能力,提供更大的价值量的话,就能从中获益。
拾象判断的价值拆分情形:
一些猜想:
猜想1:openAI的份额在30%-90%之间(非中国区域),取决于:其他公司及开源模型能不能跟上openAI进步速度;openAI能不能做出来网络效应(比如通过chatGPT可以调用其他应用);高端AI需求是多数还是少数。
初步猜测(仅仅是猜测),openAI有31%的概率占据90%的份额(类似于Windows),42%的概率占据60%的份额(类似于TSM),27%的概率占据30%的份额(类似于Apple)
市场环境也会影响其他公司的追赶速度:如果openAI做出了网络效应,或者低端AI的需求非常少,那么即使大模型技术有上限,其他公司也根本活不到追上openAI的那一天。
我们目前的猜想是:其他公司有29%的概率能追上openAI,8%的概率是神和虫的差距(技术奇点),63%的概率是大学生和中学生的差距(落后1-2年)。
猜想2:openAI只做2B,下游交给各个应用公司来做。openAI采用成本定价模式,就像是AI时代的Azure等云平台(不过openAI的竞争格局比Azure好很多),下游的应用范围和市场规模会远远超过上游(即使openAI不再按照用量定价,而是采用Arm授权那种基于销售价抽成,也还是下游的规模大很多)。(拾象说的是价值量的80%给基础模型,但是还是很怀疑,下游应用比如个人助理的价值量未必低于基础模型。)
猜想3:原有的Search Optimization的逻辑都面临重构。因为LLM可以给出更为直接和更符合人性的回答。这不仅仅可能对搜索引擎产生影响,本质上大量的网站、APP都是对信息进行检索、分发的,而这都将面临大量的商业模式重构。可以想象作为信息分发机构的价值会受到严重的挑战,而优质的服务商可能能够得到更好的匹配。
猜想4:本质上长期行业空间依然显著低估。基于语言逻辑的产业规模巨大无比,本质上人类几乎所有的社会关系基础、协作基础都是建立在语言和信息之上的。。。因此LLM可以助力和颠覆原有生产关系的地方几乎是无穷无尽的。
猜想5:在我们的投资框架(标准的价值投资)中的竞争优势来源中:Policy、IP、稀缺资源(数据)、Complicated with other cares(比如信任成本)、试错成本、high capex、Sales network、Service network、users & users网络效应、Users, providers, servicers网络效应暂时还不会被AI颠覆,但是学习成本(直接告诉AI做什么)、用户习惯(新的交互方式)、high R&D(提高效率,使用AI弯道超车)、双边网络效应(用户端被新的super app吸走)都有可能会被AI颠覆。其中最危险的就是学习成本和习惯。也就是未来通过建立用户学习成本和习惯(其核心因为用户自身的大脑算力有限,而这些限制在AI面前都不存在)形成壁垒的商业模式可能受到一些挑战。
当然,猜想还有很多很多。。。
实际上LLM或者更为广义的AI对世界的影响才刚刚开始,一切尚未有定论,我们只是有一些很模糊的看法,也完全可能错误。。。但我们相信这是一次革命性的、有着非常广大影响力的技术变革。。。
Comments