国内10亿参数以上大模型达79个 “百模大战”打响突围还看创新

来源：北京日报 2023-07-04 07:02:55

2023年的科创圈“顶流”非大模型莫属。科技部新一代人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示，我国10亿参数规模以上的大模型已发布79个，几乎进入“百模大战”。

作为全球人工智能竞赛的“主战场”，大模型的下一个“赛点”在哪里？多位业内人士提到了创新与效率。北京智源研究院院长黄铁军表示，大模型时代，通过创新来提高效率、降低成本将会是行业的长久课题。

科技公司逐鹿大模型

(资料图片仅供参考)

今年3月，基于文心大模型3.0打造的百度新一代知识增强大语言模型“文心一言”公开邀测。紧接着，阿里通义千问、讯飞星火大模型、智谱AI的ChatGLM 等纷纷发布。此后，美团、百川智能、云知声、美图、腾讯……新加入大模型赛道的国内科技公司此起彼伏，一场围绕大模型的“军备竞赛”已趋白热化。

作为最早发布者，文心一言正在“跑步”迭代。近日，公司首席技术官王海峰向记者透露，文心大模型目前已迭代到3.5版本，在此前知识增强和检索增强的基础上，进一步提出了“知识点增强技术”，显著提升大模型对知识的掌握和运用，从而提升其在各种任务中的表现。

记者梳理发现，从已发布的情况来看，通用大模型为主，主要聚焦自然语言处理、计算机视觉、语音识别等技术领域。此外也有针对或更偏重于金融、汽车、医疗、工业等垂直领域的金融风控、自动驾驶、医疗诊断预测、工业质量控制等大模型。

推动应用落地成新课题

大模型纷纷涌现，然而百行千业，各有考量，如何加速落地“最后一公里”成为新课题。

作为一名教育规划领域公司创始人，林先生对于在教育规划中引入大模型的态度是“让子弹再飞一会儿”。“目前大模型层出不穷，既不知道选哪个更好，也不知道哪种更适合教育垂直领域。”林先生坦言，引入大模型的效果和成本是要考虑的关键因素。

正如林先生所顾虑的，垂直大模型的训练、精调以及形成多个大模型的组合等都成为“落地战”的关键，而经过特定训练的垂直领域中小模型，表现可能并不逊色。

例如，微软以医学文章数据精调了生物领域的BioGPT-Large模型，仅有15亿参数，其在PubMedQA（生物医学研究问答数据集）基准测试中的准确率却优于有着千亿级别参数的大型通用语言模型。“这种中小规模模型，推理成本可以降低到原来的十分之一。”火山引擎的业务算法负责人吴迪表示。

为了加速推动大模型落地，提供安全计算、模型精调、评测等服务的平台也开始出现。近日，火山引擎就发布了“火山方舟”，首批集成百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等7家AI科技公司及科研院所的大模型，意在打造一个大模型“优选店”。公司总裁谭待介绍，基于“方舟”，企业可同步试用多个大模型，选用更适合自身业务需要的模型组合。

未来之争聚焦创新提效

“百模大战”的下一个“赛点”在何处？百度创始人、CEO李彦宏近日在公开演讲中提出，新的国际竞争战略关键点不是一个国家有多少个大模型，而是大模型上有多少原生的AI应用，这些应用在多大程度上提升了生产效率。“如果我们能挤上牌桌，获得竞赛入场券，中国将拥有更壮大的数字化产业，数字经济规模将获得巨大增长。”

“大模型发展中没有绝对的壁垒和护城河，有了大模型就像人类多年前学会了发电，后续还会有各种各样的‘发电手段’不断演进迭代。”黄铁军认为，大模型时代，通过创新来提高“发电”效率、降低成本将会是行业的长久课题。

对于国内从科技巨头、科研机构到初创企业等一众力量均投身大模型热潮的现象，黄铁军表示，如果类比PC互联网时代和移动互联网时代，全球范围内的大模型底层平台很可能不会超过三个。就像移动互联网初期也曾有很多操作系统，但最后只剩下iOS和安卓。他呼吁，国内的大模型行业参与者应走出“山头林立”、各自为战的思路，加强协作。

谭待则判断，企业使用大模型，未来可能会呈现“1+N”的模式：“1”是通过自研或深度合作，形成1个主力模型；由于成本和场景复杂多元等原因，在这个主力模型之外，还会有N个模型同时应用。

多位投资人也提醒，应审慎看待热到发烫的大模型竞赛。九合创投创始人王啸说，不能太“神化”AI大模型，大模型不能解决所有需求，有些场景用大模型解决的是伪问题，对待大模型创业项目需要拉长周期来看。

国内10亿参数以上大模型达79个 “百模大战”打响 突围还看创新

来源：北京日报 2023-07-04 07:02:55