Nous Research's NousCoder-14B is an open-source coding model landing right in the Claude Code moment
Nous Research 是一家由加密风险投资公司 Paradigm 支持的开源人工智能初创公司。该公司于本周一发布了新的竞争编程模型 NousCoder-14B,声称其在多个大型专有系统上匹配或超越,并且仅用了四天时间在 48 块 Nvidia 最新的 B200 GPU 上进行训练。该模型在 LiveCodeBench v6 标准评估中取得了 67.87% 的准确率,比其基模型 Qwen3-14B 提升了 7.08 个百分点。模型的训练过程采用了可验证奖励机制:模型生成代码后在沙盒环境中执行测试用例,依据是否通过给出二元奖励。为实现大规模执行,研究团队使用了 Modal 平台进行并行沙箱执行,并采用了 DAPO(动态采样策略优化)技术以及动态采样策略,剔除模型全解或全错的样本以提升学习信号。训练时先使用 32,000 令牌的上下文窗口,随后扩展到 40,000 令牌,评估时进一步扩展到约 80,000 令牌以获得最佳效果。整个训练流水线实现了推理与验证的流水并行,最大化 GPU 利用率。技术报告指出,竞争编程领域的高质量可验证问题数据已接近上限,约 24,000 道题目已覆盖了互联网上大多数可获取的题目,未来的研究需要在合成数据生成和数据高效算法上投入更多。报告提出了多轮强化学习、控制响应长度以及问题生成与自我对弈等方向作为后续工作。Nous Research 在 2025 年 4 月完成了 5000 万美元的融资,总融资额约为 6500 万美元,显示了对去中心化 AI 训练的兴趣。该模型已在 Hugging Face 上以 Apache 2.0 许可证公开,完整的 Atropos 训练栈也已开源,任何拥有足够算力的研究者都可以复现或扩展这项工作。随着模型在短时间内实现了相当于人类两年练习的提升,未来 AI 编码工具可能会自行生成训练题目,实现自我教学,进一步推动软件开发的自动化。
The Last 24 Hours | 安全无小事