大模型“缩放定律”悖论:RL(强化学习)越强,AGI(通用智能)越远? 在人工智能迈向通用智能(AGI)的竞赛中,当前最受追捧的强化学习(RL)路径,可能正将我们引向一条歧路——RL越强,距离真正的AGI或许越远。12月24日,知名科技...