AI日报:苹果 DiffuCode-7B-cpGRPO,基于 Qwen2.5-7B 的无序代码生成大师;Character.AI 推出 TalkingMachines,让 AI 角色视频互动逼真如面对面;免训练加速!上交大 EEdit 攻克扩散模型图像编辑时空冗余难题

AI ToolBox
AI ToolBox
2025年7月5日

一、苹果推出 DiffuCode-7B-cpGRPO,革新代码生成

近日,苹果在 Hugging Face 平台发布开源 AI 模型 DiffuCode-7B-cpGRPO。该模型基于阿里 Qwen2.5-7B 改造,参考论文《DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation》,将扩散机制引入代码生成,突破传统自回归模型从左到右的线性生成局限,当采样温度从 0.2 提升至 1.2,token 排列自由度显著增强。经 20000 + 精选编码示例微调,在主流编程基准测试中,性能比现有基于扩散的编程模型高出 4.4% 。

二、Character.AI 发布 TalkingMachines,升级 AI 角色互动

AI 聊天机器人平台 Character.AI 推出自回归扩散模型 TalkingMachines。该模型基于 Diffusion Transformer(DiT)技术,融合流匹配扩散、音频驱动交叉注意力机制等多项创新技术,实现输入图片和声音即可生成类似 FaceTime 的实时视觉对话效果,大幅提升生成速度与 AI 角色互动真实感,且支持多种风格,目前尚未上线主平台 。相关资源链接:

三、上交大 EEdit⚡优化扩散模型图像编辑效率

上海交通大学 EPIC Lab 张林峰教授团队联合香港科技大学,推出入选 ICCV 2025 的 EEdit⚡方法。针对扩散模型图像编辑中的反演耗时、冗余计算等问题,EEdit⚡通过特征复用和区域控制减少时空冗余,基于开源 FLUX-dev 模型直接推理,无需额外训练,推理速度提升超 2.4 倍,在多个权威数据集评估中,关键指标表现优异,加速比等部分指标优于其他缓存加速算法 。

四、上交大 MAS-GPT 开启多智能体系统便捷生成

针对传统多智能体系统(MAS)的局限性,上交大推出 MAS-GPT。其采用生成式设计范式,将 MAS 构建转化为语言生成任务,用户输入 Query 即可输出可执行 Python 代码。经数据池建设等阶段构建 11K 条高质量训练样本并监督微调。在基准任务和主流模型测试中,平均准确率比基线高 3.89%,推理成本低,且广泛兼容多种 LLM,还发起 MASWorks 开源社区推动领域发展 。相关链接:

五、Grok 4 基准测试成绩泄露引关注

X 平台博主 @legit_api 泄露 Grok 4 基准测试结果,涵盖通用旗舰模型和专攻编程的 Grok 4 Code。Grok 4 在多项测试表现出色,如 HLE 自由回答测试推理后得分 45% 远超竞品,Grok 4 Code 在编程任务中与 Claude Opus 4 齐平。但 HLE 测试高分引发真实性争议,目前 Grok 4 尚未正式发布,其若成绩属实将推动 AI 大模型发展 。