来源:亚布力企业家论坛CEF
8月30日,在2024亚布力企业家第二十届夏季年会【开幕论坛】上,物美集团创始人、多点 Dmall 创始人张文中,58同城CEO姚劲波,百度副总裁石清华,科大讯飞副总裁、研究院院长刘聪,猎豹移动董事长兼 CEO、猎户星空董事长傅盛,零一万物联合创始人祁瑞峰聚焦“大模型:技术革命与产业应用”,一同探索如何避免大模型作为“智力引擎”陷入空转?大模型技术在产业应用中还存在哪些挑战?企业能从这场技术革命中,挖掘出哪些新机遇?英才元投资管理有限公司董事长宋立新为本场对话主持人。
以下为内容实录:
宋立新:我的第一个问题是,怎么看待大模型,大模型对大家所在企业有何赋能?
张文中:首先,我认为大模型的出现更多代表着机遇,当然也有挑战,因为挑战和机遇从来都是相伴而生的。多点很早就开始尝试使用大模型,2022年GPT的火爆,也让我们很快意识到相关问题。随后,多点关于大模型的应用越来越多,例如AI能源系统、AI温控系统、AI客服,等等。对于大模型,我们要有一个拥抱的态度,只要根据自己的场景积极地去试,还是有很多机会的。
大模型可以大大提高效率,降低成本。例如,原来我们的质量检验环节需要花费很多人力资源,有了大模型的帮助之后,大概可以节省50%的人力,服务标准也没有因此打折扣。
祁瑞峰:以大模型技为代表的AI 2.0是有史以来最伟大的技术革命和平台革命,正在穿透各行各业,重塑全球生产力和经济格局。大模型为代表的AI 2.0在技术上确实还有一定的限制,目前的主要落地场景聚焦在内容生成和问答方面的提效,而在复杂的推理以及任务的规划、执行上还面临着一定的挑战。很积极的一面是,大模型的能力每天都在进步。从To B的角度来看,我们需要深入到行业内,结合行业和业务场景进入客户的业务系统,根据行业痛点落地“AI 2.0+产业”,从而实现提效,甚至帮他们直接带来GMV的增长和ROI的改善。这可能才是客户愿意付大价钱去接受大模型赋能的基础。
姚劲波:上周,我们公司做了一次AI内部工具的培训,这是我们历史上参加人数最多的一次培训,大概有1400人。我想,他们之所以愿意来参加这场培训,肯定是因为内心既焦虑又兴奋,一是担心自己如果不拥抱AI,就会被这个时代淘汰;二是他们或许看到了机会,认为掌握了AI这个工具,就有可能取得更高的成就。其实,企业和创业者也存在这种心态。我的期待就是,所有的大模型厂商越“卷”越好,融的钱越多越好,招的人越多越好,产品价格越低越好,产品性能越高越好。
在我看来,目前AI有两大问题:一是它还不够智能,虽然GPT5.0马上发布,但今天要想在更大规模上应用大模型,其实还是有障碍的;二是大模型的价格仍然比较贵,用户更希望大模型的性能更强大,成本更低,最好可以免费提供服务。
我们公司内部有很多场景在使用AI,大家普遍认为已经有10%-20%的工作量可以被AI替代。所以可以预期,未来几年如果AI继续往前演进,可能每个人的工作都会更轻松,大家可以把更多的精力放到畅想未来上。我特别希望大家可以拿出一个能让我算得过账的大模型,我一定愿意为此付费,而且我不是按照成本来付,而是按照这个大模型给我创造的价值来付。那一天,也许就是大模型厂商真正能跑起来的时候。
宋立新:姚劲波总说出了很多用户对大模型的心声:更强的功能和更便宜的价格。石总你认为百度能满足这种奢望吗?
石清华:可以满足。姚总说了几个重点:一是大模型的确有用。这个是最核心的,有用才是真正的价值;二是他说希望大模型厂商越“卷”越好,希望价格越来越低。这是一个期望,是一个正向的鞭策;三是愿意为价值来付费。这才是我们大模型厂商最终追求的结果,即早晚有一天能用价值来定义大模型的含金量。
首先分享两组数字,第一组来自大模型训练过程,投入非常大。比如,一个万卡集群每天的耗电量相当于北京市东城区一天的耗电量,可以说训练大模型是非常消耗资源的;二是文心一言在发布一年后,已经有3亿用户在使用,针对企业提供服务的千帆平台,在一年之内也已经服务了15万家企业。文心一言大模型平均每天的调用量超过了6亿次,换成Token的话大概是1万亿Tokens了。第二组数字表明大模型真正被用起来了,不然它不会有这么多的调用量。
百度很笃定的是,我们要把大模型应用到具体的场景里。举两个例子:一是最近我们和全国总工会进行了合作,总工会是一个很大的体系,它有4亿多的会员,每年要处理很多劳务纠纷,如果用人工处理,一是工作量比较大,二是没有统一的标准,最后我们用三个月时间做了一个法律援助助手解决了这个问题,这在过去可能需要一年时间;二是我们用大模型做信控优化也就是调控红绿灯的时长,从而提高了城市交通的通行效率。这种例子比比皆是,我认为不应该无限地去打价格战,我更相信早晚有一天大模型可以通过价值来定价。
宋立新:请问刘总,与百度文心一言、零一万物所做的这些大模型相比,科大讯飞的优势是什么?差异化在哪儿?
刘聪:2022年12月15日,讯飞启动“1+N”,决心既要做“1”的底座,也要做“N”的场景。有了底座之后,大模型可以持续迭代;而且在“N”的场景里,它的软硬件产品可以持续升级。
“1”不只是指文本大模型,在“从文本大模型向多模态的理解、语音大模型”等全栈能力上,我们基于原有技术再结合大模型,现在讯飞大模型可以直接超过OpenAI的Whisper大模型。我们最近又发布了极速语音交互功能,相当于基本具备了全面底座的能力。
讯飞除了算法自主可控,在国内国产化方面也做得很不错。在以像华为、寒武纪为代表的国产化芯片上,我们构建出了整个训练推理的框架,这是我们的特色。去年10月24日,我们基于华为的910B,构建了国内首个万卡的国产化集群。包括现在大家看到的一系列的各类底座大模型都是基于国产化集群训练出来的,这是讯飞星火模型的又一个特点。以央国企为例,上半年我们在央国企的底座中标方面,做得也比较靠前。
宋立新:傅盛总,你作为AI方面的专家,同时你们公司也在做大模型和机器人,请你总结下。
傅盛:这波AI是一场掀起巨大浪潮的社会生产力革命,但这波浪潮今天已经呈现出明显的泡沫迹象。“泡沫”体现在以下几点:
一是大模型从出现到发展,已经过去将近一年的时间,但最顶级大模型的模型没有明显提升。在一个以科技为核心的技术浪潮中,这是不太正常的。虽然我也尊重各位做的大模型,但客观来说,谁家大模型有什么优势,基本尚属“一家之言”,其实用户用起来没有感觉到太大差别。我每次写不同的东西,都会用好几个大模型互相比较,有时候这个大模型更好用,有时那个更好用。当前大模型的同质化很严重。
二是我们讲了这么久的人工智能,但真正的KillerAPP并没有出现,KillerAPP不仅在C端没有出现,在B端也未能出现。很多行业大模型都说自己有不少应用,但真正提效的并不多。可能在营销文案或者图片生成等领域可以提效,但想要将大模型真正变成一个明显能够提效的应用,还很有难度。
不过,我不认为泡沫就会使得大模型发展崩塌,有时有点泡沫也很正常。以前互联网早期也出现过泡沫。
未来大模型的成功可能取决于两个点:
一是大模型的天花板能再上一个台阶。今天的大模型有20-30%的知识幻觉,这个错误在很多岗位上用不起来,而且“它不知道自己不知道”,这是今天大模型在企业应用上的非常重要的一大卡点。想要真正落地一个应用,得用大量工程化的手段去解决以前所谓通用人工智能认为它能干的活,这中间是有差距的。所以模型本身能否再上一个台阶很重要。
二是能不能做出真正让用户觉得好的应用。以ToB为例,你做出的大模型能否真的可以在某些岗位上减员增效,甚至改变商业模式。我们猎户星空现在采取的模式是与B端客户共担风险,用压力倒逼自己不断努力,以获得真正追求效果的目的,而不只是单纯追求“人工智能”这四个字。
宋立新:傅盛总写东西最常用应用是哪款?
傅盛:我最常用秘塔搜索。
宋立新:祁总还有补充吗?
祁瑞峰:我们特别关注的一个B端痛点是,如何在B端赋能企业价值,以及通过企业价值增加有规模的营收。零一万物也在toB端探索,有了初步的方法论。
好的一点是,基于大模型能力做AI 2.0的应用、产品和解决方案,不像原来AI 1.0时代那样动辄上百人去堆叠。很多AI 1.0时代的公司在B端的打法是从数据到模型到应用到交付,都是自己做,做着做着一抬头就变成1000人了,重度定制带来的是成本不断攀升,烧钱烧得太狠。
现在确实有一些范式的变化。我们自己尝试聚焦行业场景,希望提供能帮客户带来价值的云服务,让大模型在知识迭代的基础上成为可以标准化的产品。此外,我们也在测试,是否有可能通过大模型赋能数字人直播的场景中,比如,给物美每个线下的店对应开个线上的虚拟直播店,直接带来有毛利的GMV的增长。
最近通过与欧美市场的交流发现,欧美企业在做大模型、做集群管理时,可以有千万美元预算的项目。国内的大模型厂商一般都希望不只是去做“云”,而且愿意做私有化的部署,但在欧美市场里,从供给端真正愿意给企业做私有化部署的,可能只有Cohere这一家企业,它是做云上的专区私有化,并不是做客户现场的私有化。
最近,欧盟《人工智能法案》的出台,对金融、医疗等行业有大量合规和数据监管的强要求,他们现在基本上只能挂在OpenAI上,还得自己做SFT(监督微调),这也是一个很大的代差。在这些私有化的工程能力上,中国大模型团队具有全球优势,这是另一个我们在探索的路径。
宋立新:大模型出来之后,SaaS的收入显著萎缩,尤其餐饮业也受到了影响。前几天发布的餐饮业相关数据显示,在它们100元的收入里,只有0.37元的利润,超市压力也特别大。先请问张文中总,你焦虑么?请你谈谈对未来中国大模型发展的看法。
张文中:我们先要弄清楚什么是“焦虑”。只有当你觉得完全不确定未来在哪里,不知道下一步要怎么办的时候,这时的焦虑才有意义。但经过了过去一年多的演进,大家都很确定,人工智能就是人类的未来。
既然大家已经达成共识,那么企业就要快速拥抱和迭代,尽早进入智能时代。但全面拥抱数字化、智能化的同时,也一定要记住一点:你做的所有事都是为了彻底回归商业本质,即帮助消费者解决问题,提高自己企业的运营效率,让你的商品更有竞争力,其他的说再多都没用。老百姓认又实惠又好的东西,今天卷的就是“又便宜又好”。这对企业来说是个挑战,但你如果知道未来在哪里,那就坚定不移地去做,不用焦虑。
人工智能到底会不会创造价值?我的答案是:肯定会创造价值。能创造价值,消费者就一定会买单。问题在于你能不能帮他解决问题。还有,在国内是软件和硬件结合永远是一个很好的营收方法。
综上,你们这些搞大模型的企业大胆往前走吧,没问题,一定会有人买单的。
宋立新:有人认为中国丰富的产业应用场景和供应链优势可能有助于缩短与美国在AI发展水平上的差距,姚劲波总认同这个观点吗?
姚劲波:中国和美国最大的优势在于市场规模庞大,拥有众多的人口、数据和亟需满足的场景需求。在追赶芯片和算法方面,我认为由于开源资源的丰富,我们与美国的差距并没有那么大。现在全球范围内,只有中国和美国在这方面的竞争最为激烈,而中国还有很多场景非常适合AI的应用。虽然我不会去“卷”大模型本身,但我会结合大模型提供的算法或开源工具,以及58同城自己积累20年的独特数据,训练出一个行业模型,以更好地服务我们的用户。
在58同城和安居客上,每天都有百万级的商家活跃。比如,当有人找工作并投递简历时,公司需要判断这个人是否初步符合他们的需求,然后决定是否打电话给求职者安排面试。同样,当有人在找房子时,房产经纪人需要判断并推荐适合的房源。原本这些动作都发生在线下,但现在它们全都在网上进行,未来一两年内,可能50%的工作还会被AI替代。到那时,我给消费者提供的服务将会更加可靠和优质。比如,AI相比中介会更清楚某个房源是否是北京101学区房,更清楚房贷利率的问题。AI能够提升我的服务水平,并将其转变为纯在线、实时的服务。
过去的19年中,58同城一直在做信息平台和连接服务。未来,利用AI技术来进一步实现服务的闭环和智能化,可能还需要我们再奋斗19年。对此,我和我的团队都感到非常兴奋。
宋立新:你认为现在中国的企业在为to B的智能化服务做准备时,愿意投入多少资金打造实际应用场景?
姚劲波:我认为,中国在大模型领域的竞争比美国更为激烈。美国仅有三家在该领域占主导地位的公司,他们的融资总额达几十亿美金,而中国则有20到30家公司涉足该领域,且其中十几家的融资额都超过了3亿美金。而且,国外公司的开源模型也在为中国服务,所以,即使在中国资本市场状况不佳的情况下,中国在大模型方面的竞争态势依然如此强势。如果中国的资本市场像3年前一样活跃,那么这些公司可能融资的就不止3亿美金,而是20亿美金甚至更多。这种激烈的竞争无疑会加速整个大模型的成熟,加速我们发布产品的进程,并催生一些具有颠覆性的应用。如果能在58同城平台上用AI替代每天活跃的百万级招聘专员和房产经纪,这件事对我来说将是足够伟大的成就。
宋立新:想问石总,中国现在的大模型是不是太多了?地方政府还应该对大模型加大投资吗?
石清华:中国的大模型数量确实不少,并且类型多样、地域集中、应用也非常广泛。但是我们不能简单地用数量多少来评判,而更应该关注大模型的质量、应用价值以及它对整个产业的贡献和推动。比如像百度文心4.0这样参数量更大、能力更强的大模型,直接使用就能表现出非常好的效果,节省大量的人力成本和时间成本。目前,百度智能云千帆平台提供包括文心大模型、主流开源大模型在内的近80款大模型服务,还提供覆盖开发大模型、AI原生应用全生命周期的工具链。此外,百度两款主力模型全面免费开放,两款旗舰模型大幅降价,进一步帮助客户降低大模型使用门槛和试错成本。不仅如此,我们还推出了千帆行业场景解决方案,深入到了客户“研、产、供、销、服”的核心业务场景和业务流中。
百度秉承这样两个态度。首先,不断探索下一代大模型的边界;其次,坚持大模型必须为企业带来实际价值,无论是提高效率、降低成本还是增强产品竞争力,这样企业才会愿意投资。
对于第二个问题,我建议各地政府可根据当地的产业结构来有针对性地投入,因为大模型是没有属性的,但是地区是有各自的特点的。例如,一些地方的经济结构以钢铁为主,而另一些地方以机器人产业为主。每个地方的情况都不同。但我建议大家不要再去卷基础模型了,可以根据地区的产业情况来投入研发垂直领域的大模型。例如58同城拥有大量的垂直领域数据,这些数据结合大模型进行训练和迭代,有可能解决58同城的人工替代问题。再如百度智能云和唐山市政府合作,基于在百度智能云千帆平台,规划建设国内首个产业级垂类大模型工厂,就是和当地的产业情况结合,探索“大模型+”钢铁等主导产业,“大模型+”机器人等新兴产业,“大模型+”陶瓷、“大模型+”农业的传统及特色产业等全面赋能的案例。所以,在基础通用大模型的基础上,结合当地的数据研发垂直领域的大模型,可以解决当地企业垂直场景的问题,我认为这样的投入是有必要的。
宋立新:我们把话筒给刘聪,大模型多久能实现盈利?它将如何形成一个良性循环?
刘聪:我在公司主要负责技术创新工作,我的主要职责是推动技术进步,而不是直接挣钱,所以很难给出具体的时间和数字。不过,就核心技术支持业务、共同服务客户的路径,我可以分享一下看法。
首先,我赞同张总的观点,可能没您想的那么焦虑。这件事科大讯飞已经做了20多年,知道它的发展规律,前期肯定要投入,后期才会看到实际价值。因此,我认为机遇大于焦虑。比如,OpenAI今年预计亏损50亿美元,但他们依然风生水起,看起来并没有特别焦虑。无论是互联网大厂,还是像科大讯飞这样的人工智能企业,甚至是创业公司,最终目标还是商业成功。
我认为,现在有三个主要的落地路径:
API。大家都知道,由于价格战,API目前可能不会立刻带来盈利。但它更加便宜的价格可以吸引很多用户,这也是培养用户心智和习惯的过程,有助于推广。同时,随着未来出现更高效的大模型,这个领域还是有机会的。
结合现有的底座与行业应用,比如AI搜索、文生图、文生视频德国软件。还有一些软硬件的协同,例如科大讯飞的学习机。在已有场景中引入大模型,可以直接提升能力价值,进而带动产品价值和销量,科大讯飞的学习机就是一个成功例子,站在生产线的角度上说就已经产生盈利了。
以央国企为代表的GB端。大模型的投入确实很大,面临很多问题,企业客户也还在摸索应用场景,思考它能创造哪些价值。这里可以用两个词来形容:由点及面和蓄势待发。
“由点及面”是指,以前企业更多是做局部提效,比如语音客服或会议管理。但现在,大模型底座能力结合企业内部知识库后,可以深入到业务主场景,为企业创造更多价值。比如,科大讯飞和交通银行合作,通过代码助手功能,将代码接纳率提升至15%,可为交通银行节约数百个人力,随着未来技术持续进步,代码接纳率可能达30%
“蓄势待发”则是说,技术在央国企落地也有一个过程。首先是中标入围,接着是帮助企业熟悉大模型应用,打造大模型底座+工具链。例如,科大讯飞近期与中国石油的昆仑大模型合作,帮助他们结合场景发布了330亿代表性的行业大模型,这是大模型在企业端形成具体场景的成功案例。再之后,是如何从定制到非定制,一方面在重点领域的央国企做深做透,另一方面可以在同行业其他地方进行推广。我再举一个例子,招投标可能每个企业都会做,之前繁琐的招投标程序,通过大模型可以快速完成清标和辅助评判工作,科大讯飞最早在国能应用,后来又在中国煤炭实现了推广。
最后,我想总结一下,要基于实际场景需求,与客户深入合作,并在核心技术发展上做到行业领先。如果与这个基础,我相信盈利只是一个自然而然的过程。
宋立新:其实摆在零一万物面前的问题也是挺严峻的,你们这样的创业公司,怎么找到自己的生存和发展空间?
祁瑞峰:首先,基础大模型创业确实是一个烧钱、烧资源的事。我们对行业有两个顾虑,并且思考了它的解决方案。
第一个顾虑是,中外大模型公司在融资上的差距。AI 2.0大模型应用未来可能会爆发,出现一个比互联网大10倍的平台型发展机会。大模型的能力竞争在当下已经成为一个全球科技竞争的重要战场。中国的基础大模型融资,目前行业称的“六小虎”基本是数亿美元的数量级,而美国则是50亿美元的数量级。未来,中国如何与美国竞争,这一点是个挑战。
另一个顾虑是,国外一些头部大模型公司的 “流血打法”。OpenAI经常“不讲武德”,比如推出GPT-4水平的GPT-4omini,还免费向ChatGPT用户开放。尽管每年可能要消耗二三十亿美元的推理成本,他们仍然愿意免费,从商业逻辑上,我们想破脑袋也想不通为什么,但是他们就这么干了。从我自己近10年的创业经验来看,中国的软件创业公司的努力和前赴后继,导致中国To B的市场比美国更艰难,因为标准化不足带来高定制化,导致可复制性、可扩充性下降,项目有毛利,但公司不赚钱。例如,最近几家上市公司的财报显示,他们的现金流和亏损没有实质性改善,这反映了行业普遍的挑战。
零一万物如何突破这些挑战,我们可以考虑以下几点:
首先,中国人有一个优良传统,即我们更能吃苦、拼搏,更善于多快好省地做事情。例如,零一万物开发了一个基础架构优化的万卡集群,可以把它管理得更高效,这样可以用更少的资源训练出与世界科技巨头性能齐平的大模型。
第二,未来的大模型服务会越来越便宜,关键在于能否降低推理成本,把商业模式跑通。换言之,谁家在AI infra能力超群,能把推理成本尽量做更便宜,那么大模型的服务就能启用“薄利多销”的模式进一步穿透B端,白菜价也有可能赚钱。在这方面,零一万物在Day 1就重注AI infra的能力建设,其推理成本优化率显著优于业内指标,进一步夯实自己的技术护城河,为自身的B端发力奠定了雄厚的技术基础。
第三,解决中国To B市场的挑战,要结合行业和应用场景将大模型能力尽量转化为标准化云服务的产品。无论大模型能力多强,ToB企业是没有体感的,核心在于能否提供有效的产品,帮助客户提升GMV和降本增效,这是一个双赢的模式。
第四,拓展海外市场。欧美这么大的市场,竟然只有Cohere在做私有化,而且它也是一家创业的小公司,从中国的角度看是一件不可思议的事情。最近我与许多欧美和中东客户沟通发现,在大模型时代,美国的ToC应用领先中国,但在ToB应用方面,中国反而领先于美国。例如,我与二三十家欧美的世界500强企业沟通,他们大多在做RAG,连SFT都做得较少,企业专属模型更少见。这表明,这是中国模型厂商值得关注的、有巨大的潜在价值市场。
宋立新:最后请傅盛总整体总结一下。
傅盛:第一个结论,中美在大模型的顶尖水平上确实存在差距,但这个差距肯定没有十年那么大。举个例子,今年年初Sora发布时大家惊呆了,但此后至今Sora都还没有再发布新的产品,而国内的一些大模型反而已经发布了几款出色的文生视频产品。而且大模型的理论性没有那么强,它是试出来的,在工程化尝试上,中国团队一直有优势。
第二个结论,大模型厂商未来5-10年内不用过于关注盈利,这是我的观点。因为大模型最终将成为一种基础服务,就像水电一样。最初需要大量补贴以吸引用户,例如亚马逊亏损多年才成为平台级公司。大模型的市场最终将由一两家或两三家平台主导,在中国,则通过竞争角逐决定最终赢家,这也是我们的一贯做法。
第三个结论,做大模型应用公司,其实已经开始盈利,但这通常发生在水面下。这个生态在不断形成,会进入中国人最擅长的模式,先把应用做好,不少应用公司做得挺厉害的。例如,我们猎豹移动投资的一家AI直播公司(灵犀深智),发展非常迅速,预计下个月就会盈利。一些ToC领域也已经开始盈利。此外,大模型出海一定有机会。现在是中国企业新一波的出海潮,在国内卷,卷出去放在哪个维度,在国际市场都是有竞争力的。