王小川评代码会变成大模型下一步的核心能力
-
王小川评代码会变成大模型下一步的核心能力
主笔:张小珺编辑:石丁出品:腾讯新闻《潜望》2024年9月,OpenAI预热已久的“Strawberry”(草莓)项目终于问世,它重置命名模式,没有沿用原有的GPT命名,而是取名为o1模型——业界认为,o1代表了AGI范式的一次大转移或者大升级。在靠语言模型预训练的ScalingLaw这个经典物理规律遇到瓶颈后,包括OpenAI在内的多家硅谷明星公司,已经把它们的资源重心押宝在一条新路径上:强化学习。o1的发布把以强化学习为基础的后训练,推到了焦点中心。百川智能创始人兼CEO王小川很早就开始在公开演讲中谈论强化学习...