DeepSeek 版 o1 震撼登场,数学代码力压 OpenAI

发布时间:2024-11-21 来源:时事 作者:通悟AI

2024 年 11 月 21 日,DeepSeek 版 o1 如一颗重磅炸弹在科技领域掀起波澜。模型名为 DeepSeek-R1-Lite,发布即上线,现在就能体验。它在难度较高的数学和代码任务上展现出惊人实力,超越了 o1-preview,大幅领先 GPT-4o 等。


DeepSeek-R1-Lite 使用强化学习训练,推理过程含大量反思和验证,遵循新的 Scaling Laws——推理越长,表现越强。在 AIME 测试基准中,随着计算时间增加,其得分稳步提升。目前该模型仍在开发阶段,官方表示正式版 DeepSeek-R1 模型将完全开源,包括公开技术报告并提供 API,这无疑让众多开发者和科技爱好者充满期待。


网友们纷纷开始实测。登录官方网页,打开深度思考按钮,每天有默认 50 次的免费使用。在实际测试中,有网友让模型破解密码,OpenAI o1-preview 答错,而 DeepSeek-R1-Lite-Preview 推理正确给出了正确答案。还有网友进行系统性测试,发现该模型在数学推理问题上表现出色,但在编码任务和复杂知识理解方面还有提升空间。此外,在玩井字棋游戏时表现欠佳,不过有网友反馈一些新模型虽不能在第一次尝试时成功,但继续尝试可画出正确结果。


总的来说,DeepSeek 版 o1 的出现为科技领域带来了新的活力和挑战,其在数学和代码方面的超越表现以及未来的开源计划,都值得我们持续关注。


上一篇: 扣子 OpenAPI:智能语音战场的新势力 下一篇: 北大等发布多模态版 o1:LLaVA-o1 引领视觉推理新潮流