DeepSeekV4多模态模型即将发布国产AI生态再升级
DeepSeekV4多模态模型即将发布国产AI生态再升级
2月28日,据金融时报报道,DeepSeek将于下周发布其最新的大型语言模型V4,这是一款具备图片、视频和文本生成功能的多模态模型。这是DeepSeek自2025年1月推出R1推理模型以来的首个重大版本更新,有望进一步填补国内低成本、开源模型的市场需求。
首个重大版本更新
据两位知情人士透露,位于杭州的DeepSeek实验室计划发布V4模型,这是一款具备图片、视频和文本生成功能的多模态模型。他们表示,DeepSeek已与中国人工智能芯片制造商华为和寒武纪合作,针对这两家公司的最新产品对V4模型进行优化。
这将是DeepSeek自2025年1月发布R1推理模型以来推出的首个重要模型。该公司声称,其构建的系统仅需极少的计算能力,即可媲美硅谷领先的人工智能模型。这一举动震动了美国科技股,一些专家将其描述为人造卫星时刻,标志着中国作为人工智能强国的迅速崛起。
与国产芯片深度合作
值得注意的是,DeepSeek并未与英伟达合作,为其产品优化模型。英伟达继续主导着训练芯片市场,尤其是在计算密集型的预训练阶段,模型需要在此阶段吸收海量数据。
去年发布的R1版本附带了一份详细的技术报告,阐述了DeepSeek如何更高效地利用Nvidia芯片来训练和运行其模型。DeepSeek因分享其开发推理模型的训练方法而备受赞誉,这使得其他实验室能够研究并应用他们的发现。
AI大模型竞争格局重塑
业内人士分析,当前AI大模型的竞争焦点不再局限于参数规模的比拼,而是转向成本控制与场景适配。2026年,AI大模型商业化将迎来从"技术验证"迈向"价值兑现"的重要阶段。
从一句"帮我买……"实现自动下单,到"一键生成"专属新春拜年视频,再到进一步抢占AI硬件入口……近期国产AI大模型密集推新,技术趋势已从通用聊天工具全面转向垂直生产力工具。
华西证券研报指出,今年"春节档",字节跳动凭借内容创作与流量生态领跑,阿里依托办事能力与全域生态强势突围,此外,智谱AI侧重工程级专业场景,MiniMax与DeepSeek则通过开源策略与成本优势形成有力补位。




