Closed NodeBE4 closed 1 year ago
投资要点
GPT系列等大模型带动的AI革命正席卷各行各业,面对不甚清晰的未来,本文我们将尝试回答两个之于当下最关键的问题:1)大模型的竞争格局将会如何,是一家独大还是存在差异化竞争的空间?2)AI革命将改变哪些行业,如何改变,难点是何(本次以C端行业为主进行讨论)?
□ 中国大模型竞争格局畅想:速度与场景的较量
我们认为,国内大模型的竞争格局会趋向高水平的集中,达成事实上的寡头竞争的格局,而各家厂商的差异化,将主要取决于大模型上线速度、平台独有场景。主因有二:1)为何格局高度集中?大模型的训练及调试需对固定成本投入要求较高、但边际使用成本却相对较低且呈快速下降的趋势,这意味着较高的准入门槛一定程度上排除了中小玩家,且对于此类玩家较低的边际使用成本意味着接入服务的经济性高于自研,因此仅巨头有较大可行性且有较强意愿参与竞赛。2)为何无法一家独大,各家厂商如何差异化?我们将大模型的竞争拆分为三个维度:数据、算力、算法。对于巨头而言,算力上彼此储备力量和补充渠道类似,算法上起步节奏和技术路线接近,具有一定同质性,仅数据维度存在较为显著的差异化竞争,则掌握私有数据的头部玩家将获得此优势。而数据独占性,则主要取决于两点,即大模型上线速度、以及互联网平台的独有场景。
□ AI革命的空间畅想:AI革命将对C端做出什么改变
互联网平台的本质是信息的重塑,包含信息的生产、分发、接收三个环节。AI革命或颠覆生产、分发两大环节。对于生产端,AI革命料将重塑信息的生产方式,一方面极大的促进信息的生产,但另一方面也将快速降低信息生产的壁垒。内容生产的主体将逐渐迁移,虽然早期AI将提升内容生产机构的效率,但是随着AI技术跃进,将使得UGC替代PGC,随后又将使得AIGC替代UGC。此间,虽行业整体规模上行,但以效率著称的内容商(如营销素材制作方)的份额和利润率都将受到挑战,而拥有版权和原创再生能力的内容商(如精品小说文库)将提升其份额和利润水平,行业出现较明显分化。对于分发端,AI革命将大幅冲击传统的流量入口,包括泛搜索入口(如百度、淘宝)、推荐入口(如抖音),它们或被更加中心化的AI入口所取代。
□ 投资建议
我们认为,大模型带动的AI革命有望引领未来较长时间区间内的社会、经济变革,我们密切关注AI革命与行业结合后带来颠覆性机会。
1)大模型机会:大模型中综合实力较为领先的公司包括腾讯、字节、百度、阿里,紧随其后的三六零、华为等公司或也能获取一定的市场份额。我们看好腾讯、字节的私有数据优势,看好百度的技术积淀与上线速度,看好阿里在电商场景的私有数据优势。
2)内容领域机会:内容领域将在一定时间内处在“AI蜜月期”,短期的降本增效将改善部分公司的利润率状况。我们短期内看好游戏、动漫、电影领域的AI所致降本增效。
3)泛电商领域机会:我们认为短期能见度较高的变革是传统人工客服被部分替代,但这对大多数电商公司的利润率改善有限。而中长期来看,AI革命对泛电商的推动或将是颠覆性的。
□ 风险提示
1)技术发展不及预期风险;2)市场监管风险;3)版权风险。
正**文**
1 我们回答本轮AI革命的两个关键问题:格局与空间
GPT系列等大模型带动的AI革命,正成为下一次技术革命的事实起点,改变着各行各业。站在革命风潮中,展望尚未清晰的未来,我们致力于画出尽可能清晰的图谱,回答两个之于当下最关键的问题:
1、大模型的竞争格局将会如何?是一家独大,还是存在差异化竞争的空间?
2、AI革命将改变哪些行业,如何改变,难点是何(本次以C端行业为主进行讨论)?
于此开篇,简单写明我们的研究结论:
竞争格局方面:我们认为,国内大模型的竞争格局会趋于寡头竞争,一方面是由于模型训练的高固定成本导致市场集中度较高,存在一定的行业壁垒,另一方面是大模型所依赖的算法、算力基本趋于同质化,但过去积累的行业数据存在一定差异,数据或将成为企业的核心竞争力,掌握网络效应的头部玩家将获得此优势。
行业空间方面:1、泛搜索入口、泛推荐入口或被AI推荐取代。在这里,我们将基于搜索和推荐的所有入口都纳入定义,包括通用搜索引擎(如百度、三六零),电商平台(如阿里、拼多多)、内容平台(如微博、抖音)。它们可能将被AI推荐所取代;2、内容生产将逐渐产生剧变,虽然早期AI将提升内容生产机构的效率,但是AI的持续发展,或将使得UGC替代PGC,随后又可能使得AIGC替代UGC;3、AI有助于提升智能客服能力,从而较大幅度缓和非标品的信息不对称问题,提高对应品类的线上渗透率。
2 中国大模型竞争格局畅想:速度与场景的较量
我们旨在解决市场颇存分歧的一个问题,即在中国的大模型竞争中,最终是会一家独大,还是形成寡头竞争的格局。我们认为:1、高固定成本(主要为训练成本)、低边际成本(主要为应用成本)的成本结构,将使大模型走向高集中度;2、终极竞争中将是数据为王,进一步的,是先发优势和独有场景为王。
2.1 竞争格局:高固定、低边际的成本结构导向高集中度
大模型的训练及调试需对固定成本投入要求较高、但边际使用成本却相对较低且呈快速下降的趋势,这意味着高水平的行业集中度,至少是寡头竞争的格局。
1)训练成本上,Cathie Wood的方舟投资管理公司在《Big Ideas 2023》投资报告书中测算,要将一款大型语言模型训练至GPT-3等级,2020年得花费近460万美元;在4月8日的人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家、国际欧亚科学院院士、IEEE/CAAI Fellow田奇发表题为《AI赋能千行百业智能升级》的演讲,其中提到大模型开发和训练的单次费用可高达1200万美元。
2)应用成本上,OpenAI首席执行官Sam Altman在回复推特首席执行官马斯克时表示 ChatGPT “单次对话的平均费用可能仅为几美分”。美国当地时间3月1日,OpenAI官方宣布,开放API(应用程序接口),允许第三方开发者通过API将ChatGPT集成至他们的应用程序和服务中。接口服务定价为 0.002美元/每1000 tokens,这一定价较GPT 3.5模型便宜约90%。
2.2 竞争要素:算力和算法趋向同质化,数据成为核心竞争力
我们将大模型的竞争拆分为三个维度:数据、算力、算法。那么我们可以看到,对于巨头而言,算力和算法具有高度同质性,仅数据维度存在显著差异化竞争。我们认为,终极竞争中将是数据为王,进一步的,是先发优势和独有场景为王。
2.2.1 算力和算法的同质化竞争
与海外不同,国内的大模型竞争中,算力和算法或将趋向于同质化,这或将使得国内外的竞争格局出现显著差异。
1. 算力层面
算力层面趋向同质化竞争的核心原因在于,算力均由第三方提供,各家公司均可购买,对于有足够的资金的大厂,不构成差异化竞争。虽然因为美国禁运事宜,导致各家大厂在算力储备上有所差异,但并非本质差异。储备问题上:头部大厂尤其是曾涉猎云计算业务的部分参与者,当前的算力储备均较为充足,较大可能性满足GPT-3.5级别模型的训练算力要求;算力补充问题上:供应商已提供替代方案,在财力允许的范围内,各家均可得到对应所需的算力补充。根据观察者网报道,2022年8月31日,英伟达被美国政府要求限制向中国出口芯片A100和H100,这是进行大模型训练的主流芯片。为此,英伟达公司研发了可进行替代的芯片A800与H800。以A800为例,相比A100系列,A800系列的规格基本相同,主要差异点在于NVLink互连总线的连接速率,前者为600 GB/s,后者则是400 GB/s。故整体而言,追赶为主的中短期内,算力侧竞争接近同质化竞争。
具体到各参与方:以硬件计算能力来看,华为以升腾和昆腾两个芯片作为底层算力,计算能力在国内处于领先地位。百度云作为云计算领域的先驱具有较好的储备和计算工程经验,这一点腾讯(发布超强算力集群对外提供服务)和阿里逻辑相似。字节起步较晚,相对于老牌互联网企业,基础较差,但是理论上字节或可通过TikTok获得购买海外H100芯片(H100算力是A100的3倍左右)。商汤SenseCore AI大装置算力层面亦有冗余可支持外借输出。即互联网大厂中,各家在算力方面各有其解决途径。其他如360和讯飞,虽然算力基础良好,但是储备水平和财务实力层面相比于前者有着一定差距。
2. 算法层面
行业的技术开放度总体较高,足以满足国内追赶到GPT3.5的阶段性目标。GPT3、GPT3.5虽未开源,但给出了详细论文,各家大厂均在论文框架下构建算法,并没有显著差异。目前各家大厂还没有到向GPT4冲击的阶段,在此之前,主要参考的还是GPT2的开源代码、GPT3/GPT3.5的论文,这就造成了算法层面总体的相对同质化竞争。
核心算法上,各家殊途同归。虽然在早期阶段,部分大厂的路线未必是GPT路线,包括已推出的产品,也未必是GPT路线,事实上目前主流的模型路径演变成了三种,分别是GPT(Generative Pre-trained Transformer)、T2T-Enhanced Adversarial Modeling(简称TEAM)、BERT(Bidirectional Encoder Representations from Transformers),但它们都基于Transformer模型。对于用户而言,不同模型架构最终的使用体验感差别有限。且为逼近GPT3.5、GPT4的效果,后续大厂普遍优先采用了GPT路线进行追赶。因此在国内的大型技术企业中,虽然底层模型架构不同,但是难以仅凭此因此拉开差距。
模型训练与微调的工程实践中,国内或可利用ChatGPT的输出“抄近道”。在训练时,通过将ChatGPT针对某些问题的输出作为校准目标,进行微调,可加速模型训练节奏。
2.2.2 数据的竞争:先发优势与场景优势
数据具有显著差异化,将成为大厂之间决出胜负手的核心竞争要素。我们认为,数据竞争的本质在于速度与场景的竞争。第一,是否能快速上线,享受数据飞轮带来的模型优化;第二,是否有合适的场景,支持积累足够的私有数据。
1. 数据的飞轮效应:用户与模型的正循环
上线越早,用户和模型的互动反馈越多,模型就可以优化的越好。理论上,1)数据量级越大、数据层次和涉猎维度越丰富全面、更新越及时,模型泛化表现愈发优越;2)对于GPT路线的大模型而言,RLHF(带人类反馈的强化学习)是模型调优的核心环节,它将人类的反馈纳入训练过程,通过人类对机器生成结果的反馈,对模型进行持续调优。可以认为,模型正式上线后的用户实际使用(包括但不限于工程师基于Deep Speed Chat所做的尝试),就是非常宝贵的RLHF,对促进模型的优化至关重要。
2. 数据、场景的独特性造就差异化机会
1) 训练数据来源分为三个维度。
第一个维度是常见的网络爬虫。网络爬虫的优势在于容易获得。同时缺点是数据质量较低,因为此类数据多为碎片化UGC内容,缺乏谱系,语境混杂,清洗难度较大。在该维度下,国内企业并无明显优劣之分。
第二个维度是数据业务公司。企业可以付费购买高质量的数据,相比于第一个维度,第二个维度可以获得更高质量的数据,然而,该维度的数据并无排他性,因此第二个维度也无法彰显企业的优势。
第三个维度是沉淀的业务数据,该维度也是真正拉开企业之间差距的关键。例如阿里拥有菜鸟的物流数据,淘宝和天猫的电商数据,这类数据作为其他企业无法获得的独有资源,将塑造阿里在该维度的壁垒。在该维度,每一家企业的数据擅长品类和优劣差距较为明显。
2) 大平台的场景优势造就差异化大模型机会
大平台具有场景优势,可以产生大量私有数据,这或成就差异化的大模型机会。大型平台公司利用私有数据对大模型微调,将会使得大模型在领域的能力更为突出。场景的优势包括两种:
场景的历史积累:即公司在互联网平台运作期间积累的数据。如若阿里的大模型研发成功并上线,和其私有的电商数据相结合,或在电商导购等场景上具有更强的竞争力。
适合大模型的场景:即公司拥有的场景可以作为大模型的入口,进而积累数据。如对于腾讯来说,微信、QQ对话虽然带来了海量数据,但信息含量较低,且出于合规因素无法自由使用。但微信、QQ对话界面非常适合作为大模型的入口,一旦在其中加入大模型,将带来大量的私有数据。
私有数据重要性不言而喻,数据的私有化是相对而言的。如百度和腾讯双方虽然都有达千亿PB级别的数据储量,但因微信的社交生态闭环,百度搜索无法直接获得其中的数据内容(如大量公众号内容)。然而由于搜索引擎的特殊性,腾讯可以较为顺利地顺利获取引擎上公开的网页数据,虽然百度拥有网页和搜索词匹配机制的数据,但腾讯亦运营搜狗搜索,可部分削弱这一优势。据此纬度,腾讯在私有数据场景方面具有一定优势。
2.3 中外比较:国内生态之争为主,海外最终是技术之争
考虑到合规等问题,海外模型在国内商业化落地的可能性极低,中外将在事实隔离的状态中各自发展,中外大模型竞争格局将出现显著差异。国内,数据有较大差异,而算法和算力更接近同质化竞争,最终体现为生态之争为主,技术之争为辅;海外,算法之争仍变数较大,而数据和算力更接近同质化竞争,最终体现为技术之争。
如前所述,国内竞争中,数据具有差异化,算法和算力更接近同质化竞争。所以,最后的核心竞争力主要在于企业的私有数据,数据可能有三个来源:1、企业的私有数据,以腾讯为例,公众号、视频号数据即为私有数据;2、生态合作伙伴的私有数据,如腾讯投资公司的私有数据;3、用户使用数据,这一方面取决于模型的上线速度,另一方面取决于场景,如腾讯将对话功能置入微信、QQ对话中,将获取大量有效的用户使用数据。我们看到,除模型上线速度与技术有关联外,其余竞争点,本质均为生态之争。
海外竞争中,算法具有差异化,数据和算力更接近同质化竞争:
1. 算法层面:OpenAI一马当先,尤其是工程层面的优势处于断层领先地位,且利用数据飞轮进一步加固其优势,其他公司或由于路线错误,或由于重视不够,普遍处于追赶地位,但Google等科研经验丰厚、人才储备丰富的大厂仍保有相当实力。当前大模型技术仍处于快速迭代、发展甚至技术爆炸的阶段,技术格局还未企稳。
2. 数据层面:
1) 国外训练集数据量级高出国内一个量级。OpenAI的GPT-3在训练时使用了经过基础过滤的全网页爬虫数据集(4290亿个词符)、维基百科文章(30亿词符)以及两个不同的书籍数据集(一共670亿词符),其训练集达到5万亿tokens;
2) 国外的数据相较之下自由度高,可得性好。一方面,头部平台提供了一定规模的公开数据库,如微软已宣布开源Deep Speed Chat,而Deep Speed 是一个为大规模深度学习而设计的库,可显著提高训练速度和降低训练成本。另一方面,第三方数据集亦较为丰富,如HumanEval数据集由164个编码问题组成,可作为一个性能指标测试模型的编程逻辑和熟练程度等各个方面,用在数据集上的平均通过率评估模型。微软研究团队在该数据集上测试了 GPT-4 ,其准确率高达 82%;
3) 各大厂亦保有差异化数据优势,在海外,Google拥有大量的搜索数据和用户行为数据,Facebook擅于社交网络数据和用户数据,Amazon销售数据和供应链数据积累深厚,Microsoft可调用海量软件数据和云服务数据。
3. 算力层面:均可市场化购买,大厂都有足够的资金。在这样的竞争环境下,技术所决定的算法将是海外的核心竞争点,未来是否存在弯道超车的机会,主要也是看算法技术是否实现突破。
2.4 垂类机会:强运营需求、或私有化数据限制
在大厂的通用大模型占据主要市场的同时,我们认为,垂直品类依然存在机会。其中主要来自于两种可能性,第一是AI革命后依然需要强运营的品类,第二是存在大量私有数据限制的品类。
2.4.1 大模型在部分行业难以单独发挥作用催生强运营机会
依然有强运营需求的品类,或有垂类机会。大模型带来的变革作用于不同行业时效果与节奏有所区别,在部分领域,大模型暂只能起到辅助作用,无法替代人类完成工作,即使能够部分实现,也必须经过人为严格的监管和把控,即大模型对于推动这些行业的发展属于必要但非充分条件,需与重度运营相配合,或催生垂类机会。
1. 低容错率行业技术风险较高,人为把控有必要
低容错率的行业往往有着高技术要求,而大模型的训练存在自我修正的过程,每一次的训练就是在原有的基础上进一步优化输出结果。对于仅有一次机会的低容错率行业,所以即使AI技术能够完成过程实现和结果判断,依然需要人工进行监督和检验,以防止可能存在的错误和风险。例如在医疗行业,大模型虽然能够通过自然语言处理等功能实现智能问诊和简单治疗,但复杂病情和大型治疗目前是不可能由AI来替代的,通常需要专业医生根据病人实际情况和治疗风险等综合给出治疗建议,此外,伦理也难以允许人类彻底脱离。这时候就需要有同时具备模型研发和B端运营的公司满足需求。
2. 高度非标准化行业面临复杂的环境时依赖人为再加工
在一些高度非标准化的行业,每一次的生产流程与标准均根据实际情况而有所调整,这些行业也往往依赖高度的专业知识和人为判断,相应地人为检测和把控也是必不可少的,对AI结果的再加工需求将大幅增加。举例:
在法律行业,大模型可帮助完成一些简单处理工作,如智能匹配案件相关法条、检索判例等,但遇到大型复杂的案件时,依然需要法律从业者根据专业知识和经验进行判断,并出席线下场景。
在公安领域,警察能够利用AI模型实现犯罪监控、行为预测、监狱智能化管理等,但具体的案件推理和罪犯抓捕等工作都需要警察根据具体情况实施。
3. 高度线下化行业多依赖劳动力,机器人领域潜力待挖掘
高度线下化行业一般是一些劳动力密集的领域,例如外卖员、快递员,这类行业的工作难度可控,AI技术能够用以提高工作效率,如智能点餐、订单响应、配送地点快速定位等,但它却无法完全替代人完成配送服务等实物工作。大模型若想在这类领域发挥更优作用,需与机器人硬件和IOT成果深度结合。
4. 情感需求和人际关系复杂度高的领域需要人工与AI共进
AI虽然建立在模仿人类行为活动的基础之上,但还未进化出真正的主观情感和意识,难以处理复杂的人类情绪与社交关系。我们认为,这类行业中,人工仍是价值主体且将长期占据主导地位,大模型将更多地作为辅助技术工具输出底层能力,提升工作流效率,配合人工完成服务交付。
像心理咨询师、社会工作者等职业,他们的工作涉及大量的、精妙的、基于丰富专业素养和社会经验的情绪处理工作,且面对面的人文关怀亦是心理辅导重要组成部分,目前人机自然语言交互上,大模型能力止于实现简单的智能对话或聊天,实现心理疏导和治疗仍需心理咨询师担当主力。
此外,教师行业尤其是幼儿园、小学的教师,其教学内容涉及儿童心理成长和认知完善,对主观和经验化的内容,及切实的人文陪伴始终有一定需求。根据科大讯飞智慧教育官方公众号文章所述,教育是一项心灵工程,它的实施者—教师是富于情感和智慧、想象力与创造力的人类,这些特质是人工智能无法比拟的。同时,大模型在伦理层面表现仍存疑义,人工干预无法缺位。
2.4.2 数据隐私性要求催生大模型私有化部署和垂类模型机会
对数据隐私性要求越高的行业其数据自由度越低,导致参与算法训练的数据不足或无法流通,从而影响模型的训练效果。由此催生的大模型私有化部署或垂直应用可能成为未来特定行业的一种发展趋势。
1. 数据隐私性越高自由度越低,大模型应用受限
高私密性数据一般包含以下几种情况:
1) 数据性质导致:涉及到个人隐私,如支付平台中大量的用户个人信息、关联的银行账户和资金、平台交易信息等,这些数据有访问权限,必须获得用户本人的允许才能使用;
2) 行业性质导致:部分行业生态较为封闭,如医院、安保公司、学校等;
3) 数据管理主体性质导致:一些担心泄漏商业机密的企业或者涉及国家机密的政府机关对数据的流通会提出较高的要求,或警惕大模型的进入。
同时,大模型相关的监管措施正在逐步完善,如中国支付清算协会发布了关于支付行业从业人员谨慎使用ChatGPT等工具的倡议,警告跨境数据泄露风险。
在以上情境中,一方面,大模型部署受限;另一方面,数据自由程度较低,模型的训练效果或受损。
2. 大模型私有化部署和垂类模型或成为新发展点
接上文,拥有私有数据积累的企业在某种程度上反而拥有数据竞争优势,它们可以通过私有化部署或垂直化应用的方式引进模型。如何发挥这部分私有数据的作用目前主要有两种可能的解决途径。
一是将私有数据加入基础模型进行调优训练,补足模型的数据缺失。一般基础模型采用的是通用数据,文本泛化能力更强,在细分领域上的精准度没有那么高,把私有数据加入到数据库中就可以进一步地弥补这部分知识缺失,打造一个企业专属的大模型。企业的自有数据成为了核心竞争点,如果抢先完成了融合突破,很有可能带来行业格局的变化,那么如何保证自有数据的价值和粘性就成为了关键。
二是针对垂类数据采用一种大小模型并存的架构,根据具体的数据和问题使用不同的模型进行回答和训练。例如,当用户与AI进行智能聊天时,一部分数据通过基础大模型回答,而一部分数据通过专属的小模型回答。
3 空间畅想:AI革命终将改变什么
3.1 改变信息的生产、分发
互联网平台的本质是信息的重塑,包含信息的生产、分发、接收三个环节。AI革命或将彻底颠覆生产、分发两大环节。
对于生产端,AI革命料将彻底改变信息的生产方式,一方面极大的促进信息的生产,但另一方面也将快速降低信息生产的壁垒。
对于分发端,AI革命将大幅冲击传统的流量入口,包括搜索入口(如百度、阿里)、推荐入口(如抖音)。
3.2 内容行业:内容大爆发,平台被颠覆,利益再分配
在AI浪潮下,内容行业将是最早被重构的行业。我们判断,随着内容生产成本的快速下降,意味着创作壁垒的快速下降,因此内容生产将会出现巨大的繁荣,但现有的内容平台,或被彻底颠覆。
3.2.1 生产:内容生产成本下降、壁垒变低,生成主体逐步迁移
AI浪潮下的内容生产将呈现为三个阶段,每个阶段依次发生,上一个阶段的生产模式不会消失殆尽,但不再作为主流存在:
1. 辅助PGC生产:
1) 目前改变已经发生,这一阶段的前提是AI生产内容能力还不够强大,还只能对PGC生产的专业内容进行辅助,但对于UGC而言,由于普通用户并没有强大的内容修改能力,故提振并不明显。我们看到,目前短视频、游戏、影视等行业,已经进入这一阶段。
2) 实操上,由于PGC创作者本身具有较强的专业性,且在过去的创作中在特定领域积累了一定的经验,对AIGC上手快,可清晰表达指令,较少调修即可大幅提升AIGC成品效果,更好的发挥人力在AIGC创作中的杠杆效应,随着应用铺开,同赛道的尝鲜创作者社区生态日益繁荣,或可打造垂类创作平台。
3) 此时AIGC生成主要以拼接融汇为主,具有公式化创作的特点,在创意性和情感表达或有所缺失。其次,AI所生成内容的相关商业价值和法律问题还有待商榷,比如AI模型的产出所涉及到的版权争议、商业定价、社会价值等目前还难以明确界定。
4) 在这一阶段,内容生产商的成本得到下降,对于其中竞争格局较集中的行业,净利率或得到提升。但对于竞争格局较分散的行业,成本的下降并不能显著改善净利率。我们看到,对于大多数内容生产行业细分赛道,竞争格局是较为分散的。
2. UGC替代PGC:
1) 随着AI生产内容的能力进一步提升,UGC与PGC之间的鸿沟或被抹去,UGC开始替代PGC。在图片内容生产这一领域,这一趋势已有雏形。
2) 在这一阶段,内容生产的壁垒快速下降,生产力发生质变,生成资料向广大普通创作者予以让渡,虽然行业整体规模上行,但是具有PGC属性的头部厂商的份额和利润率都将受到挑战。
3. AIGC替代UGC:
1) 随着AI生成内容能力进一步提升,AIGC将胜过UGC,主要因为AIGC的两大优势:1、快速:AI具有更高效、快速生产内容的能力;2、精准:AI已能够充分明晰用户的意图和喜好,且完全不受个人创作偏好影响。
2) 此时,内容生产的壁垒基本打破,内容极大丰富,UGC不会消失但会以与AIGC形成一定的差异化,UGC或主攻先锋创意类生成,技巧性和效率性生成将基本让渡与AIGC,二者并且将在版权归属、权益分配等方面有明文可依,生成关系逐渐与生产力发展相匹配。
3) 这一阶段,行业整体规模将进一步上行,但以效率著称的内容商(如营销素材制作方)份额和利润率都将受到挑战,而拥有版权和强原创再生能力的内容商将提升其份额和利润水平,行业出现较明显分化。
3.2.2 分发:AI或替代内容摄取的传统渠道,现有平台料被颠覆
1. 随着AI在内容分发(供需匹配)上的能力逐渐增强,搜索和推荐入口或将被颠覆,这也可能带来现有平台形态的颠覆。一旦内容生产进入到AIGC为主的阶段,搜索(用户主动获取信息)和推荐入口(平台主动推送信息)或都将AIGC化。譬如,当我们在搜索引擎上搜索时,得到的内容是AI根据关键词即时生产的(目前的GPT4已有雏形),当我们在短视频平台下滑短视频时,刷到的内容也是AI根据用户过往喜好即时生产的。
2. 随着AI泛化能力增强,平台入口料将逐渐收束。我们认为,正如在腾讯这一超级平台上,众多App转变为小程序形态存在着,AI对于入口的收束预计将进一步加深平台入口的集中度。以Copilot中的AI助手为例,能够沟通各类数据库、覆盖不同任务类型的AI将承担互联网中类似IOT系统中的管家角色,我们可以在不同情景中调起“管家”进行信息检索和内容消费的支持,但正如IOT行业面对的难点,平台间的贯通将成为超越技术实现的卡点。
3.3 泛电商行业:线上化率提升,平台被颠覆,履约演化方向存疑
3.3.1 智能客服将带动线上化率提升
智能客服或是电商领域的首个重要应用,但节省客服成本只是初级阶段,在后期阶段AI的结合终将通过降低信息不对称水平,带动大量商品和服务线上化率提升。我们看到,目前标品的线上化率已经较高,但是非标品的线上化率较为停滞不前,这主要在于非标品领域有大量的信息不对称,使得消费者线上购买受阻。
所以在短期维度上,我们看到,智能客服仅仅是对人工客服的替代,但更长远来看,智能客服或将使AI通过对商品的学习、对用户消费习惯和心理的了解,促进非标信息标准化、线上化,可引导商品线上化率的提升。叠加三维化的发展,文生图工具可以绘制用户目标商品小样、AI数字人生成工具可以生产导购虚拟形象、3D建模快速生成工具可以生成商品立体形象,支持上身试穿试用等。譬如鞋类的线上化率一直处于较低水平,就在于鞋型和脚型都高度非标,线上购买具有较大风险,但随着AI技术的发展,通过鞋型、脚型的信息标准化,通过将海量用户反馈集成,叠加模拟试穿试用,或可以大幅提高鞋类的线上化率。
3.3.2 泛电商平台或被颠覆:AI会更好的完成供需匹配
AI具有更强大的供需匹配能力,也许将颠覆电商(含实体电商与本地生活)的搜索和推荐入口。随着AI在商品服务数据上的积累,在用户喜好数据上的积累,AI可能会越来越强的完成商品和服务的供需匹配,对传统的搜索和推荐入口形成可观的冲击。
我们看到,在OpenAI第一批推出的插件中,就出现了基于AI入口的商品推荐、本地生活推荐。未来的选品流程中或有AI顾问助手参与,模型通过多轮对话了解用户需求(消费目的、使用场景、预算、喜好等)后给出建议,更接近真实购物体验。特别是复杂度较高的商品和服务品类,如旅游产品、娱乐票务、医疗服务,叠加付费策略(优惠计算、消费贷计量)等,AI或将提供千人千面的交付。
3.3.3 履约长期演化方向,取决于AI技术与其它技术的融合
商品和服务上的履约能力依然是壁垒,AI革命短期内还停留在线上,并不能送外卖、送快递,所以具有重线下履约的平台,将依然保有其壁垒。而履约环节的长期演化方向,则主要取决于AI技术与其它技术的结合,如自动驾驶、机器人等。
本轮AI革命短期内对自动驾驶影响有限,现阶段产业的动作仍是实验性质为主。本轮AI革命由大模型带动,在这一驱动力下,对自动驾驶的帮助并不彻底。1、自动驾驶的容错率极低,但 前期GPT路线的通用大模型权宜下部分牺牲了专用领域的准确率,提升了泛化、通用能力。这与自动驾驶的要求相悖;2、自动驾驶要求实时级别的计算,超过了目前大模型的能力,虽然在未来,计算速度可以得到很大的提高,但是否能满足自动驾驶的要求依然存在不确定性;3、自动驾驶所涉及的一些前期工作如高精地图构建、实地测绘仍需要补充;4、自动驾驶涉及的政策性等卡点仍难以彻底解决。
本轮AI革命中,大模型与机器人技术的结合正在积极探索,未来或有突破。目前Google发布了PaLM-E,作为一种多模态视觉语言模型,它集成了控制机器人视觉和语言的能力,展现了软硬件协同应用前景。微软也在“图像+语言模型”的路径上积极布局:在今年2月底发表的研究中,微软展现了如何使用ChatGPT为大疆Tello无人机编写“找饮料”程序的案例;微软最近发布的“ChatGPT for Robotics”论文,就尝试以类似于谷歌PaLM-E的方式将视觉数据和大型语言模型结合起来,对机器人进行控制。
3.4 产品与公司的兴衰并不一致
AI革命将颠覆很多现有的产品,但是我们要强调,产品与公司的兴衰并不一致。在互联网时代,门户三巨头新浪、搜狐、网易是最早的互联网巨头,其中有脚步滞缓的搜狐,也有焕然新生的网易。在AI时代,亦是如此。虽然很多产品要被AI颠覆,但产品的被颠覆并不必然的导致公司的衰亡,相反,相应公司反而有机会凭借数据和场景的优势,成功切换到AI时代。看向终局,虽然头部公司维持头部的概率出现了显著下降,但维持头部依然是大概率事件。
这其中最重要的原因在于,产品被颠覆并不是突发的,而是渐变的过程,传统入口的消亡与AI入口的崛起会经历一个漫长的过程。以抖音所处的短视频平台举例,虽然我们认为短视频可能会进入AIGC为主的阶段,届时抖音所积累的创作者资源、历史内容或许都不再成为壁垒。但是,这一过程是渐变发展的,AIGC、UGC、PGC在抖音将是长期共存的。如此,抖音积累的历史数据是领先的,抖音的AI入口使用反馈也是领先的,这都有利于抖音平台的AI入口调优。
在这样的情况下,我们判断,早期阶段,AI技术的有无与优劣将成为平台竞争的分水岭,但是后期随着AI技术走向同质化,行业或重新走向流量、规模为王,因为流量、规模决定了AI发展的质量。由此可见,AI技术高速迭代的行业早期,是弯道超车的宝贵窗口期。
4 投资建议
我们认为,大模型带动的AI革命有望引领未来较长时间区间内的社会、经济变革,我们关注AI革命与行业结合后带来颠覆性机会。
1) 大模型中综合实力较为领先的公司包括腾讯、字节、百度、阿里,紧随其后的三六零、华为等公司或也能获取一定的市场份额。我们看好腾讯、字节的私有数据优势,看好百度的技术积淀与上线速度,看好阿里在电商场景的私有数据优势。
2) 内容领域机会:内容领域将在一定时间内处在“AI蜜月期”,短期的降本增效将改善部分公司的利润率状况。我们短期内看好游戏、动漫、电影领域的AI所致降本增效。
3) 泛电商领域机会:我们认为短期能见度较高的变革是传统人工客服被替代,但这对大多数电商公司的利润率改善有限。而中长期来看,AI革命对泛电商的推动将是颠覆性的。
5 风险提示
1) 技术发展不及预期风险:大模型的开发、训练、运维等成本较高,技术研发难度较大,技术产品落地进程和效果具有不确定性,可能会导致产品的质量和效果不如预期,进而影响用户体验和市场反应。同时,技术跟进难度和成本高于预期,也可能会对企业的财务状况和发展前景造成负面影响。
2) 市场监管风险:随着大模型的普及和应用,中国相关的立法机关及市场监管机构可能加强对AI产品和服务的监管力度。如果企业在开发和应用过程中违反相关法律法规或者监管要求,可能面临罚款、停业整顿等风险。
3) 版权风险:在大模型的开发和应用过程中,多涉及知识产权问题,如专利、商标、著作权等。若企业在开发和应用过程中侵犯了他人知识产权,可能会面临业务停滞、侵权诉讼、赔偿、企业形象受损等风险。
欢迎互联网行业人士/一级市场投资者/二级市场投资者与我交流,**如果想加我微信,请后台留言。**
分析师:谢晨
执业证书号:S1230521070004
免 责 声 明 |
行业的投资评级:
以报告日后的6个月内,行业指数相对于沪深300指数的涨跌幅为标准,定义如下:
1、看好 :行业指数相对于沪深300指数表现+10%以上;
2、中性 :行业指数相对于沪深300指数表现-10%~+10%以上;
3、看淡 :行业指数相对于沪深300指数表现-10%以下。
我们在此提醒您,不同证券研究机构采用不同的评级术语及评级标准。我们采用的是相对评级体系,表示投资的相对比重。
建议:投资者买入或者卖出证券的决定取决于个人的实际情况,比如当前的持仓结构以及其他需要考虑的因素。投资者不应仅仅依靠投资评级来推断结论
法律声明及风险提示
本公众号为浙商证券互联网团队设立。本公众号不是浙商证券互联网团队研究报告的发布平台,所载的资料均摘自浙商证券研究所已发布的研究报告或对报告的后续解读,内容仅供浙商证券研究所客户参考使用,其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,使用本公众号内容应当寻求专业投资顾问的指导和解读,浙商证券不因任何订阅本公众号的行为而视其为浙商证券的客户。
本公众号所载的资料摘自浙商证券研究所已发布的研究报告的部分内容和观点,或对已经发布报告的后续解读。订阅者如因摘编、缺乏相关解读等原因引起理解上歧义的,应以报告发布当日的完整内容为准。请注意,本资料仅代表报告发布当日的判断,相关的研究观点可根据浙商证券后续发布的研究报告在不发出通知的情形下作出更改,本订阅号不承担更新推送信息或另行通知义务,后续更新信息请以浙商证券正式发布的研究报告为准。
本公众号所载的资料、工具、意见、信息及推测仅提供给客户作参考之用,不构成任何投资、法律、会计或税务的最终操作建议,浙商证券及相关研究团队不就本公众号推送的内容对最终操作建议做出任何担保。任何订阅人不应凭借本公众号推送信息进行具体操作,订阅人应自主作出投资决策并自行承担所有投资风险。在任何情况下,浙商证券及相关研究团队不对任何人因使用本公众号推送信息所引起的任何损失承担任何责任。市场有风险,投资需谨慎。
浙商证券及相关内容提供方保留对本公众号所载内容的一切法律权利,未经书面授权,任何人或机构不得以任何方式修改、转载或者复制本公众号推送信息。若征得本公司同意进行引用、转发的,需在允许的范围内使用,并注明出处为“浙商证券研究所”,且不得对内容进行任何有悖原意的引用、删节和修改。
浙商证券研究所
上海总部地址:杨高南路729号陆家嘴世纪金融广场1号楼25层
北京地址:北京市东城区朝阳门北大街8号富华大厦E座4层
深圳地址:广东省深圳市福田区广电金融中心33层
邮政编码:200127
电话:(8621)80108518
传真:(8621)80106010
浙商证券研究所:http://research.stocke.com.cn
文章内容源自5月10日外发的报告《大模型带动的AI革命之C端畅想——行业深度报告》
https://wechatscope.jmsc.hku.hk/api/html?fn=gh_51e4bcbc6c82_2023-05-10_missing_Mv0WFIUlcz.y.tar.gz