排序
信通院&清华提出FedRE:用「纠缠」搞定联邦学习三难困境|CVPR 26
FedRE联邦学习框架
LeCun炮轰Hinton:他认可LLM就是想摆烂退休了!
LeCun专访:驳LLM
无需构造偏好对:TGO用标量反馈对齐视觉生成模型|ICML’26
TGO偏好对齐新范式
一只机器狗,把英伟达的算力王座拱翻了
蔚蓝发布BabyAlpha A3
Agent会协作还会决策?我对Mavis的技术实现很好奇
Mavis多Agent协作系统
龙虾之父月烧940万元的token!要不是入职OpenAI还真用不起
AI Agent协作开发
SFT别急着接RL!你的多模态大模型可能一直在“带伤训练”
SFT到RL的断层