大模型开源开发趋势报告: 企业与开发者的必修课

2025-09-22 21:23:48
334

2025年，蚂蚁开源联合InclusionAI发布《全球大模型开源开发生态全景与趋势报告（2.0版）》，通过筛选Github全域项目（含114个项目、覆盖22个技术领域），呈现大模型开源生态核心态势：领域迭代迅猛（62%项目诞生于2022年“GPT时刻”后），中美主导36万开发者市场，传统开源定义被打破，AIAgent聚焦AICoding等方向、AIInfra侧重模型运维与全生命周期管理，基座模型青睐MoE架构等技术。

蚂蚁开源联合InclusionAI在2025年发布了2.0版《全球大模型开源开发生态全景与趋势报告》（下文简称“报告”）。报告直接对Github下面的全域项目进行检索，通过分析开发者、项目、社区之间的互动关系，评估各大大模型开源项目的影响力和开发者的贡献度。

相比于今年5月份发布的1.0版本，报告剔除了1.0版本中的60个项目，新纳入了39个项目，可以说是非常客观的反映了当前开源生态下的技术和产品趋势。如下图所示，大模型开源开发生态全景图中共有114个项目，覆盖22个技术领域，整体分为AIAgent与AIInfra两大方向。

（图源https://antoss-landscape.my.canva.site/）

报告从这100+项目中萃取以下观点：

1、大模型开发领域迭代极快。约62%的项目诞生于2022年“GPT时刻”之后，项目平均“年龄”仅约30个月，说明该领域迭代极快。

2、在大模型生态中中国和美国占主导地位。参与这些项目的全球开发者约36万人，其中美国约占24%、中国约占18%，其次是印度、德国、英国等。

3、传统的软件开源定义逐步被颠覆。比如Dify、n8n等热门开源项目都在开源许可上增加了用户使用的限制，以保护自己的商业利益。比如Cursor等闭源项目并没有在Github发布代码，但通过Github收集用户反馈。

4、在AIAgent层面，以AICoding、聊天机器人、Agent开发框架为核心增长领域。尤其是AICoding，目前面向开发者的产品形态有CLI、IDE、插件、协作开发工作流4种形态，产品功能也从最开始代码补全升级到全栈式开发和项目协作。

5、在AIInfra层面，以模型运维、模型全生命周期管理为核心增长领域，关注是的如何一站式地完成大模型训练、评测和部署，以及可靠地进行大模型在线服务。值得一提的是，像英伟达等大厂也在布局Infra开源工具，以建造供自身商业化产品发展的技术护城河。

6、在基座大模型技术架构层面，MoE专家混合架构逐渐被各大厂商所青睐，这种架构一方面允许模型在训练时可以构建更多参数的网络，另一方面通过动态路由等手段降低了推理时的参数激活，减少了计算成本。基于强化学习的Reasoning能力也成为很多模型的必备能力，支持用户根据不同的问题场景使用不同的推理方式。同时，多模态模型成为今年发布的焦点，无论是视频、图像等生成都给到一些惊喜。下图是蚂蚁开源整理的从2025年1月-8月的基座大模型发布情况，可以清楚地印证这些观点。

从报告中对大模型生态的分析，我们可以获得一些启发：

1、大模型工程化的能力很重要，比如工具调用、可靠服务、推理优化等，这些将成为影响大模型融于业务场景的关键因素。

2、自研产品和技术的核心部门需要闭源，但是周边的通用能力可以开源，从而拥抱大模型开源生态的注意力红利。

3、报告强调要关注大模型项目的快速更迭与社区协作，建议在选型开源项目时，不能仅仅看star数，而是要参考项目提交频率、issue处理、贡献者分布、依赖生态等来决定是否在生产使用。

参考

枯木龙吟照大千三发布网,提供枯木龙吟照大千三发布信息,第一时间发布列表及资讯,枯木龙吟下一句是缠中说禅枯木龙吟照大千解读_枯木龙吟下一句首选资讯平台。