Dylan Chiang
Open Menu
Close Menu
首頁
論文
講座
參會
新聞
經歷
專案
教學
RLVR
論文閱讀:Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?
探討強化學習與可驗證獎勵(RLVR)在提升 LLM 推理能力上的真實效果
Nov 22, 2025