MiniMax副总裁刘华把脉大模型创业新生态：从狂热到冷静，从广度向深度

时间： 2024-12-11 02:02

21世纪经济报道记者白杨北京报道

自ChatGPT两年前问世以来，生成式AI迅速引爆全球科技行业，并掀起了一场跨越技术、商业和文化的变革。

它不仅彻底颠覆了人们对AI的认知，也让大模型成为几乎所有科技企业的核心战略。无论是初创公司还是巨头企业，纷纷涌入这一赛道，试图通过大模型抢占下一个科技高地。

然而，经历过去年的市场狂热，行业今年逐渐回归理性，技术门槛的不断提升与市场化进程的减缓，促使一批急于求成的玩家逐步退出舞台。

目前，业界已经形成共识——大模型行业的竞争将不再是广度上的扩张，而是深度上的突破。只有那些具备硬核技术能力、独特产品定位以及可持续商业模式的企业，才能真正站稳脚跟，继续留在这场牌局之中。

因此，基础大模型的赛道最终只会保留少数几家企业。那么，谁会留下？业内普遍认为，除了头部的科技大厂外，市场也会给优秀的创业公司留有一席之地。

而MiniMax无疑是这批大模型创业公司中的佼佼者。一方面，它是行业为数不多在ChatGPT出现之前，就瞄准大模型赛道进行创业的公司；另一方面，它也是率先在大模型商业化层面取得成绩的创业公司之一。据媒体报道，MiniMax的年收入将超过7000万美元。

近日，MiniMax副总裁刘华在接受21世纪经济报道等媒体的采访时，就行业趋势、大模型商业化及未来发展方向等话题，分享了他的观察和思考。

行业趋势：Scaling Law没有放缓

从OpenAI推出ChatGPT之后，全球人工智能进入了一波新的热潮。目前来看，在这新一波人工智能热潮里，中、美两个国家是主要玩家。

“整体而言，美国的大模型行业还是处于领先的地位，但好就好在，从2022年底到现在，中美之间的差距没有拉大，尤其在一些细分领域，比如语音、视频等，我们追赶的速度非常快。”刘华表示。

对于大模型未来的发展，业内有声音认为“Scaling Law在放缓”。对此，刘华指出，“我们没有感受到Scaling Law在放缓，2024年对于MiniMax来讲，依然是大模型飞速发展的一年。”

其认为，今年有更多的模型研发方向涌现，“大模型从一个只会写文章的文科生，变成了一个更全面的大模型”。而从Scaling Law的角度，刘华以前觉得Scaling Law更多在训练上奏效，今年发现，Scaling Law在模型推理上同样有上升空间。

因此，在Scaling Law依然奏效的背景下，大模型仍会保持较快的迭代速度。而MiniMax的大模型研发主要瞄准三个方向：一是继续把多模态做好；二是实现无限长的输入和输出；三是将错误率降低至个位数，比如2%-3%的水平。

刘华称，上一代的GPT系列模型，存在的一个问题就是错误率偏高，大概是30%左右，这导致GPT在一些严肃的生产场景无法适用。所以，大模型要想进入严肃的生产、研发、科研等场景，错误率必须降低至个位数。

商业化：坚持做标准化产品

据刘华介绍，MiniMax的开放平台在20个国家已经实现业务落地，C端产品则已触达超180个国家和地区。

刘华表示，海外的业务市场很大，MiniMax做海外产品主要有两个心得：

首先是因为自研大模型，所以对于用户的反馈，能够在下一代模型研发中进行改进，所以即便是同类产品，用户慢慢也会觉得MiniMax的产品体验会比竞品好一些。

其次，是中国企业拥有工程师红利。“中国的工程师对C端产品的理解比较深刻，同时也比较勤奋，因此跟海外友商相比，我们的迭代速度要快很多”。

虽然相比中国市场，海外C端用户的付费习惯会更好，但对MiniMax而言，中国市场依然重要。

“中国市场的优势，是用户量很大，特别是用户高频的使用，都在帮助MiniMax改进模型”。刘华坦言，在商业变现方面，国内的C端最终确实要考虑流量变现，即做广告。因此，国内的C端产品，能否达到一定的用户量级，很关键。

但刘华也强调，新产品做适量的宣传投放是必要的，但那些单纯以扩大用户总规模为目的的投流，价值不大。“对大模型研发来讲，最重要的是到底有多少用户能留下来且高频地使用产品，只有这种用户，才能够给模型迭代提供非常好的反馈”。

而在B端市场，MiniMax明年的主要目标是希望通过提高模型的推演能力，让其进入更多比较严肃的生产和研发环节。

刘华表示，MiniMax在全球做B端业务，都会按照标准化业务的模式，不太接受本地化、私有化的项目。

“只有标准化的产品，才更符合大模型赛道创业公司的发展”。刘华称，大模型创业公司的研发力量应该主要放在基础大模型的研发上，如果做定制化项目，不仅投入的成本会更多，且落地周期要更慢。

在刘华看来，如果一个模型服务一家公司，需要做非常多定制化需求，那就说明这代模型没有能力去服务它，最好的选择就是抓紧改进迭代模型。

大模型创业：需要不断对技术做创新和突破

对于目前市场讨论较多的“大模型泡沫”话题，刘华向记者表示，市场总体上没有太多泡沫，但之前最大的问题是，太多企业都说自己能做基础大模型，这块一定程度上造成了资源浪费。

“现在整个行业格局正逐渐改善，因为大家意识到，能够做基础大模型的企业没几家”。在刘华看来，最终留下的企业会有优秀的大厂，也会有优秀的创业公司，除此之外，很多企业都要转去做AI应用。

而谈及大厂和创业公司的关系，刘华认为，大厂做大模型肯定有很多优势，但同时，创业公司也能得到大厂的支持，比如MiniMax就得到了腾讯云的支持。

另外，MiniMax也实现了成功的商业化，在这些基础上，刘华认为创业公司继续留在赛道中，持续迭代研发模型的可能性，还是非常大的。

据其介绍，MiniMax目前与腾讯云的合作已经覆盖到模型训练与推理、海量数据处理与管理以及内容安全、全栈安全防护等方面。

腾讯云北区云原生总经理田丰在接受21世纪经济报道记者采访时提到，腾讯云与 MiniMax 早在三年前就建立了合作。“像MiniMax这样的大模型公司客户早期的需求是聚焦在算力、大数据处理，现在对数据存储、数据库、大数据、安全等都有了新的需求。随着业务发展，训练集群、推理集群的规模都在快速扩大。”

“这个规模对我们的组网的能力、集群的运维，都是一个非常大的、全新的挑战，跟原来完全是不一样的”。田丰介绍，腾讯云为MiniMax 提供了一系列集计算、存储、网络为一体的高性能智算产品，让MiniMax释放更多的精力聚焦在模型本身的训练和工程化上。

刘华也表示，MiniMax一开始对腾讯的需求更多是模型的训练，但随着模型的发展，MiniMax现在也要通过公有云去做业务。

目前，MiniMax在公有云上的业务主要是两种方式：一是API调取；二是在公有云上构建私有化专区。

“特别是在第二种方式上，腾讯给予了我们巨大的支持。我们在做B端业务时，很多客户对数据隐私的要求比较高，这时候我们在腾讯的支持下，开发了云上专区，基于这种模式，许多原本对数据安全有顾虑的企业，也愿意使用大模型服务了，所以这对我们业务推广起到了非常重要的作用。”刘华表示。

当然，大模型创业公司也面临较大的市场挑战，尤其是开源模型的快速发展，很可能给创业公司带来灭顶之灾。

刘华表示，“一个模型如果要提供商业化服务，需要不断对技术做创新和突破，实现更好的产品体验和生态，再用商业化的所得反哺技术。这是我们期待的良性生态。”。

在其看来，当技术突破创新不断加强，产品体验变得越来越好，商业化会是一件自然而然的事，“若无法做到在底层技术上持续创新，那继续研发基础大模型也无意义，不妨将重心转向AI应用领域。”刘华说道。

本文来源于网络，不代表北京新闻港立场，转载请注明出处

我要收藏

0个赞

上一篇 机构调研步履不停，权益类基金扛起发行“大旗”

下一篇 大规模裁员？海信辟谣：均为不实猜测

转发到:

信息排行

栏目最新

欢迎光临北京新闻港！

MiniMax副总裁刘华把脉大模型创业新生态：从狂热到冷静，从广度向深度