AI日报:微软推出 Phi-4-mini-flash-reasoning 端侧 AI 模型;欧盟《通用人工智能行为准则》发布,AI治理新篇章;AWS在AI竞争中加码基础设施,SageMaker平台迎来重大升级
AI ToolBox
2025年7月11日
一、模型与技术创新
- 微软推出Phi-4-mini-flash-reasoning端侧AI模型 微软发布新一代小语言模型,重点强化数学与逻辑推理能力,适用于边缘设备、移动应用等资源受限场景。采用创新SambaY架构及Gated Memory Unit(GMU)提升信息共享效率,实现吞吐量提升10倍、延迟降至原有1/2-1/3。目前已在Azure AI Foundry、NVIDIA API Catalog、Hugging Face平台上线。
- Mistral AI发布Devstral系列开源AI模型 联合All Hands AI推出面向软件工程的Devstral 2507系列,包括240亿参数的开源模型Devstral Small1.1(Apache2.0许可,支持128k上下文,可本地部署)和企业级模型Devstral Medium2507(仅API或私有部署)。在SWE-Bench Verified测试中分别取得53.6%、61.6%通过率,侧重代码推理与结构化任务,适配不同开发场景。
- Flash Attention作者推出QuACK内核库 Tri Dao团队推出全新内核库QuACK,基于Python与CuTe-DSL构建(无CUDA代码),在H100 GPU上比PyTorch torch.compile等主流库性能提升33%-50%。聚焦内存密集型内核优化,利用GPU内存层级与硬件特性提升效率,已公开技术教程,获英伟达、PyTorch团队认可。
二、政策与治理
欧盟《通用人工智能行为准则》发布 7月10日,欧盟委员会发布最终版准则,聚焦安全与稳定性、透明度、版权保护三大核心,由13位独立专家主导,千名相关方参与制定。8月2日起正式生效,此前训练的AI模型可在2年内合规,此后训练的新模型需1年内完成调整。企业可自愿签署以减轻行政负担,附带模型文档表格样本助力信息披露。
三、平台与基础设施
AWS SageMaker平台重大升级 亚马逊云服务对机器学习平台SageMaker升级,新增三大功能:可观察性工具(定位模型性能下降原因)、本地IDE连接(支持本地代码一键部署至云端)、GPU集群性能管理(提升资源调度效率)。同时强化SageMaker HyperPod功能,支持动态调度GPU资源(推理在白天、训练在非高峰时段),提升成本与性能平衡能力。
四、企业动态与生态
- 谷歌启动第二届AI基础设施学院 面向种子轮至A轮初创企业,提供4个月无股权支持(含领导力培训、销售指导),线上为主+谷歌总部面对面峰会。本届入选17家企业,涉及网络安全、医疗、供应链等领域。谷歌同时通过“AI未来基金”及2000万美元投入推动AI教育与创新。
- Manus AI中国区业务调整 通用AI智能体公司Manus对中国区业务进行人员优化(现有约120人),核心技术人员调往新加坡总部,其官方微博、小红书内容清空,官网显示“所在地区不可用”,战略重心向全球总部倾斜。
- 谷歌DeepMind开源GenAI Processors 推出模块化工具库,支持Python异步处理多模态数据流(音频、图像等),优化Gemini API应用开发,降低实时场景(智能客服、实时翻译)开发难度。采用流式API与并发机制,缩短首token响应时间,开源于GitHub,未来计划拓展多语言支持。
五、应用与工具
- 墨刀AI:3分钟生成高保真原型 推出AI原型生成功能,支持自然语言输入30秒生成可编辑原型(适配多设备),支持草图、线框图、竞品截图等图像识别,可多轮对话优化。提供双模式编辑、自动化文档生成,原型与代码实时同步,对接开发流程,适用于电商、社交等场景。
- 马蜂窝AI产品升级 推出“AI路书”,通过“主动提问-需求校准-精准生成”流程定制行程,支持联系当地指路人;“AI小蚂”新增三大功能:代订日本餐厅(截图识别+自动预订)、7种语言实时翻译、菜单拍照识图(含菜品图像),覆盖出境游全链路智能化。
相关文章

Mistral AI发布Devstral:240亿参数开源AI模型,赋能软件工程

Manus AI官方微博和小红书清空,业务调整引发关注

谷歌DeepMind GeminiCodeAssist:AI编程助手,降低技术门槛

微软推出 Phi-4-mini-flash-reasoning 端侧 AI 模型

刀AI:产品经理的效率神器,3分钟快速生成高保真原型

马蜂窝AI产品升级,打造智能出境游新体验

谷歌AI教育新篇章:最新一届美国人工智能基础设施学院学员名单揭晓

AWS在AI竞争中加码基础设施,SageMaker平台迎来重大升级

Flash Attention作者新作:QuACK加速H100 GPU,无需CUDA代码
