Dice-Roll-Sequence
CodeFore每日一题题解
433 字
|
2 分钟
Sieve-of-Erato67henes
CodeFore每日一题题解
261 字
|
1 分钟
Heapify-1
CodeFore每日一题题解
709 字
|
4 分钟
Array-and-Permutation
CodeFore每日一题题解
677 字
|
3 分钟
Friendly-Numbers
CodeFore每日一题题解
422 字
|
2 分钟
Game
CodeFore每日一题题解
459 字
|
2 分钟
Parkour-Design
CodeFore每日一题题解
790 字
|
4 分钟
论文深度解读:DeepSeek-R1——强化学习开启逻辑推理的新纪元
DeepSeek-R1 放弃了传统的 PPO 算法,转而采用 GRPO。理解这篇论文的关键,在于理解下面这个核心目标函数及其背后的数学动机
1086 字
|
5 分钟