今日重磅发布! DeepSeek 最新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线!所有用户都可以通过登录官方网页 chat.deepseek.com,体验 R1-Lite 带来的超乎想象的超强推理对话。这一突破性的模型,不仅使用强化学习训练,而且推理过程中深度反思和验证的操作层叠数万字,在数学、代码甚至各种复杂逻辑推理任务上,直接叫板媲美了 o1-preview 的强大推理效果,并且向世界公开了 o1 未公布的完整思考过程!
全面提升的推理性能
DeepSeek-R1-Lite 预览版模型在数学和编程领域的表现尤为瞩目,其成绩在 美国数学竞赛(AMC) 中高难度的 AIME 以及全球顶级编程竞赛 codeforces 等权威评测中,大幅超越了广受好评的 GPT-4o 等知名模型。
成绩突出,下表为 DeepSeek-R1-Lite 在各项相关评测中的得分情况: (此处应插入得分表格,由于资料中未提供具体数据,此处无法展示)
深度思考的效果与潜力
DeepSeek-R1-Lite 的推理过程之长、反思和验证之多,在高难度数学题目的得分与允许思考时间成正比的情况下,展现出其强大的相关性。
红色实线 显示出模型能够达到的准确率与所允许的推理长度成正比;相比传统的 多次采样+投票(Majority Voting) 方法,模型思维链的长度延长 显著提高了解题效率。
全面上线,尝鲜体验
现在,立刻登录 chat.deepseek.com,点击输入框并选择 “深度思考” 模式,即可与 DeepSeek-R1-Lite 预览版展开对话。“深度思考” 模式专为复杂的数学、编程等逻辑推理问题设计,提供比普通问题更全面、清晰的解答,展示长思维链的优势。
对话开启示例: (由于资料中未提供具体对话示例,此处无法展示)
适用场景与效果示例: (由于资料中未提供具体场景与效果示例,此处无法展示)
上下滑动,查看更多
新的开始,敬请期待
虽然 DeepSeek-R1-Lite 目前正处于迭代开发阶段,目前仅支持网页使用,暂不支持 API 调用,但目前所使用的也仅是较小的基座模型,未能完全释放长思维链的全部潜力。DeepSeek 团队正在持续迭代推理系列模型。未来,正式版 DeepSeek-R1 模型将完全开源,我们将公开技术报告,并部署 API 服务。
——End——