阿里提出强化学习新算法 GSPO 阿里为持续拓展强化学习,提出了 Group Sequence Policy Optimization (GSPO) 算法。相较于 GRPO,GSPO 具有训练效率高、稳定性出色、对基础设施友好等优势 2025/07/31 mmexport1753917920846.mp4
微软出手重塑上网方式,浏览器变AI智能体,一键读取你所有网页 微软AI浏览器来了!Edge浏览器推出“Copilot模式”,能同时读懂你打开的所有网页,比如总结9篇论文、提取长文重点、标签页自动分组等,限时免费体验 2025/07/31 mmexport1753916645839.mp4
智谱发布 GLM-4.5 模型 智谱发布新一代旗舰模型 GLM-4.5,专为智能体应用打造,已在 Hugging Face 与 ModelScope 同步开源 2025/07/30 mmexport1753838543028.mp4