大模型开源开发趋势报告: 企业与开发者的必修课

  • 2025-09-22 21:23:48
  • 334

2025年,蚂蚁开源联合InclusionAI发布《全球大模型开源开发生态全景与趋势报告(2.0版)》,通过筛选Github全域项目(含114个项目、覆盖22个技术领域),呈现大模型开源生态核心态势:领域迭代迅猛(62%项目诞生于2022年“GPT时刻”后),中美主导36万开发者市场,传统开源定义被打破,AIAgent聚焦AICoding等方向、AIInfra侧重模型运维与全生命周期管理,基座模型青睐MoE架构等技术。

蚂蚁开源联合InclusionAI在2025年发布了2.0版《全球大模型开源开发生态全景与趋势报告》(下文简称“报告”)。报告直接对Github下面的全域项目进行检索,通过分析开发者、项目、社区之间的互动关系,评估各大大模型开源项目的影响力和开发者的贡献度。

相比于今年5月份发布的1.0版本,报告剔除了1.0版本中的60个项目,新纳入了39个项目,可以说是非常客观的反映了当前开源生态下的技术和产品趋势。如下图所示,大模型开源开发生态全景图中共有114个项目,覆盖22个技术领域,整体分为AIAgent与AIInfra两大方向。

(图源https://antoss-landscape.my.canva.site/)

报告从这100+项目中萃取以下观点:

1、大模型开发领域迭代极快。约62%的项目诞生于2022年“GPT时刻”之后,项目平均“年龄”仅约30个月,说明该领域迭代极快。

2、在大模型生态中中国和美国占主导地位。参与这些项目的全球开发者约36万人,其中美国约占24%、中国约占18%,其次是印度、德国、英国等。

3、传统的软件开源定义逐步被颠覆。比如Dify、n8n等热门开源项目都在开源许可上增加了用户使用的限制,以保护自己的商业利益。比如Cursor等闭源项目并没有在Github发布代码,但通过Github收集用户反馈。

4、在AIAgent层面,以AICoding、聊天机器人、Agent开发框架为核心增长领域。尤其是AICoding,目前面向开发者的产品形态有CLI、IDE、插件、协作开发工作流4种形态,产品功能也从最开始代码补全升级到全栈式开发和项目协作。

5、在AIInfra层面,以模型运维、模型全生命周期管理为核心增长领域,关注是的如何一站式地完成大模型训练、评测和部署,以及可靠地进行大模型在线服务。值得一提的是,像英伟达等大厂也在布局Infra开源工具,以建造供自身商业化产品发展的技术护城河。

6、在基座大模型技术架构层面,MoE专家混合架构逐渐被各大厂商所青睐,这种架构一方面允许模型在训练时可以构建更多参数的网络,另一方面通过动态路由等手段降低了推理时的参数激活,减少了计算成本。基于强化学习的Reasoning能力也成为很多模型的必备能力,支持用户根据不同的问题场景使用不同的推理方式。同时,多模态模型成为今年发布的焦点,无论是视频、图像等生成都给到一些惊喜。下图是蚂蚁开源整理的从2025年1月-8月的基座大模型发布情况,可以清楚地印证这些观点。

从报告中对大模型生态的分析,我们可以获得一些启发:

1、大模型工程化的能力很重要,比如工具调用、可靠服务、推理优化等,这些将成为影响大模型融于业务场景的关键因素。

2、自研产品和技术的核心部门需要闭源,但是周边的通用能力可以开源,从而拥抱大模型开源生态的注意力红利。

3、报告强调要关注大模型项目的快速更迭与社区协作,建议在选型开源项目时,不能仅仅看star数,而是要参考项目提交频率、issue处理、贡献者分布、依赖生态等来决定是否在生产使用。

参考