无需构造偏好对:TGO用标量反馈对齐视觉生成模型|ICML’26
TGO偏好对齐新范式
一只机器狗,把英伟达的算力王座拱翻了
蔚蓝发布BabyAlpha A3
Agent会协作还会决策?我对Mavis的技术实现很好奇
Mavis多Agent协作系统
龙虾之父月烧940万元的token!要不是入职OpenAI还真用不起
AI Agent协作开发
SFT别急着接RL!你的多模态大模型可能一直在“带伤训练”
SFT到RL的断层
6.4k Stars!用Claude Code写论文的全套流水线,有人打包开源了
ARS开源论文流水线
蛰伏四年后,45.98 万的全新一代理想 L9 能再造爆款吗?
理想L9押注具身智能