当前位置
:
首页
»
标签存档:DeepSeek R1
学习资料教程
DeepSeek R1的100问
这是一篇关于DeepSeek-R1模型的学术论文,主要介绍了DeepSeek-R1模型如何通过纯强化学习(RL)和冷启动数据提升推理能力,以及其在多种任务中的表...
2025-03-02
690 ℃
‹‹
1
››