进入爆发期的国产大模型如何走出差异化?
稿件来源:贾奥胜
□ 本报记者贾奥胜 近期,国产大模型领域呈现出“周周有新品、月月有突破”的井喷式发展格局,在通用模型、垂直场景及开源生态等方面均取得了显著成果,令人目不暇接。 今年的政府工作报告提出,持续推进“人工智能+”行动。 近日,交通运输部已启动综合交通运输大模型(简称交通大模型)建设工作,并组建工作专班,多次组织专题调研和论证,研究交通大模型架构和建设路径。 这一繁荣景象的背后,不仅有技术迭代的推动,更有政策与资本的双重助力,同时在交通、能源等多个行业也涌现出诸多创新应用案例。 国产大模型井喷式爆发 交通运输大模型建设采用“1 + N + X”体系,即基于1个通用基础大模型,开发N个行业垂域模型,服务于物流调度、交通规划、应急响应等典型场景。对物流行业意义重大,有望推动物流行业的智能化升级,提高运输效率和服务质量。 这一建设工作的起步,实则是国产大模型蓬勃发展的有力见证。 2024年11月,深度求索DeepSeek - R1以数学推理和代码生成能力为核心,借助强化学习显著提升了性能,成为首个对标OpenAI o1的国产深度推理模型。 一时间,引燃AI热潮。 第三方即配平台顺丰同城成为首批接入DeepSeek大模型的物流企业,将依托DeepSeek低成本、高性能、高开放度的三重优势,为顺丰同城全场景业务和全生态链参与者提升智慧化赋能。 同期,阿里通义QwQ系列推出32B参数推理模型。2024年12月,月之暗面Kimi - K1突破200万字长文本处理能力,重点优化法律合同解析与学术研究场景,成为长文本领域的标杆。 2025年2月,阿里通义Qwen2.5 - Max基于MoE架构的千亿级模型,在Chatbot Arena盲测中综合性能跻身全球前五,多模态能力显著提升。华为昇腾DeepSeek系列接入国家超算互联网平台,实现低成本推理服务,获微软CEO纳德拉公开认可其计算效率。 一季度,MiniMax - Text - 01和首个全国产算力训练的深度推理模型讯飞星火X1相继问世。 助推物流业新生态构建 国产AI 大模型的爆发式增长,背后是供应链全链路数字化升级的必然结果。我国通过政策引导和资本投入,大力推动算力基础设施的规模化建设。如今,覆盖全国的智算中心和算力网络已初具规模,如合肥第二总部、中国移动“九天”大模型平台等。 我国庞大的用户基数和丰富的应用场景,如电商、物流、工业等,产生了海量多模态数据,为AI 大模型训练提供了丰富的“燃料”。同时,数据基础设施不断完善,MineData 平台、国汽智图等通过数据脱敏、合规传输机制,有效解决了数据安全与隐私问题,加速了数据流通,使得数据能够更好地服务于模型训练。 国产AI 企业纷纷通过“芯片- 框架- 模型- 应用”全栈布局,形成闭环生态。京东物流超脑大模型与智能仓储硬件实现端到端调度,提高了物流运作的智能化水平。 供应链各环节的智能化需求倒逼大模型技术创新。在制造业,AI 大模型用于需求预测,菜鸟“天机π”将交付周期缩短;在物流领域,智能调度和OCR 识别技术得到广泛应用,百度地图物流大模型做到了运输成本的优化。 国务院国资委将出台专项支持政策,持续深化中央企业“AI+”专项行动,工信部“大模型产业化应用”政策等为技术研发和场景落地提供了有力的政策支持。例如,北京市车路云一体化项目通过政企合作探索数据共享机制,推动了AI 大模型在智能交通领域的应用。 我国AI 大模型的爆发是供应链全链路数字化升级的必然结果。上游算力与数据的突破、中游技术生态的整合、下游场景需求的拉动,叠加政策与资本红利,共同推动了国产AI 大模型的快速发展。 狂欢背后的冷思考 AI大模型的爆发助推了我国全社会物流成本的有效降低。但在繁荣背后,也面临着诸多隐忧与挑战。 从技术层面来看,技术同质化与资源分散问题较为突出。当前,大多数机构研发的大模型集中于通用对话、代码生成等场景,导致在这些领域竞争激烈,而在部分垂直领域,如农业、能源等,仍缺乏高质量模型。这不仅限制了国产大模型在更多行业的应用,也造成了资源的浪费。 同时,尽管国产芯片适配率有所提升,但大部分头部模型仍依赖英伟达A100/H100 进行训练。华为昇腾等国产算力集群虽然取得了一定进展,但尚未完全解决软件生态兼容问题,这使得国产算力在市场竞争中处于劣势。 训练资源的限制也是一大难题。据公开信息,训练GPT - 4 消耗了约2.4 亿度电,使用2.5 万块英伟达 A100 GPU(每块功耗 400W),单次训练耗时3个月。 而国内拥有1 万枚GPU 的企业很少,且单枚GPU 普遍弱于英伟达A100。由于英伟达A100 及以上性能GPU 被列入管制清单,中国企业能获取的替代品为英伟达 A800,但A800 也存在缺货和溢价的情况。这导致国内大模型训练面临硬件资源不足和成本高昂的双重困境。 商业化与可持续性难题同样不容忽视。多数厂商依赖API 调用收费,但DeepSeek - R1 等开源模型的出现挤压了付费空间,使得部分创业公司因资金链断裂而退出市场。 |