AI 在线工具 | 最新人工智能新闻与工具

一、模型与技术创新

微软推出Phi-4-mini-flash-reasoning端侧AI模型 微软发布新一代小语言模型，重点强化数学与逻辑推理能力，适用于边缘设备、移动应用等资源受限场景。采用创新SambaY架构及Gated Memory Unit（GMU）提升信息共享效率，实现吞吐量提升10倍、延迟降至原有1/2-1/3。目前已在Azure AI Foundry、NVIDIA API Catalog、Hugging Face平台上线。
Mistral AI发布Devstral系列开源AI模型 联合All Hands AI推出面向软件工程的Devstral 2507系列，包括240亿参数的开源模型Devstral Small1.1（Apache2.0许可，支持128k上下文，可本地部署）和企业级模型Devstral Medium2507（仅API或私有部署）。在SWE-Bench Verified测试中分别取得53.6%、61.6%通过率，侧重代码推理与结构化任务，适配不同开发场景。
Flash Attention作者推出QuACK内核库 Tri Dao团队推出全新内核库QuACK，基于Python与CuTe-DSL构建（无CUDA代码），在H100 GPU上比PyTorch torch.compile等主流库性能提升33%-50%。聚焦内存密集型内核优化，利用GPU内存层级与硬件特性提升效率，已公开技术教程，获英伟达、PyTorch团队认可。

二、政策与治理

欧盟《通用人工智能行为准则》发布 7月10日，欧盟委员会发布最终版准则，聚焦安全与稳定性、透明度、版权保护三大核心，由13位独立专家主导，千名相关方参与制定。8月2日起正式生效，此前训练的AI模型可在2年内合规，此后训练的新模型需1年内完成调整。企业可自愿签署以减轻行政负担，附带模型文档表格样本助力信息披露。

三、平台与基础设施

AWS SageMaker平台重大升级 亚马逊云服务对机器学习平台SageMaker升级，新增三大功能：可观察性工具（定位模型性能下降原因）、本地IDE连接（支持本地代码一键部署至云端）、GPU集群性能管理（提升资源调度效率）。同时强化SageMaker HyperPod功能，支持动态调度GPU资源（推理在白天、训练在非高峰时段），提升成本与性能平衡能力。

四、企业动态与生态

谷歌启动第二届AI基础设施学院 面向种子轮至A轮初创企业，提供4个月无股权支持（含领导力培训、销售指导），线上为主+谷歌总部面对面峰会。本届入选17家企业，涉及网络安全、医疗、供应链等领域。谷歌同时通过“AI未来基金”及2000万美元投入推动AI教育与创新。
Manus AI中国区业务调整 通用AI智能体公司Manus对中国区业务进行人员优化（现有约120人），核心技术人员调往新加坡总部，其官方微博、小红书内容清空，官网显示“所在地区不可用”，战略重心向全球总部倾斜。
谷歌DeepMind开源GenAI Processors 推出模块化工具库，支持Python异步处理多模态数据流（音频、图像等），优化Gemini API应用开发，降低实时场景（智能客服、实时翻译）开发难度。采用流式API与并发机制，缩短首token响应时间，开源于GitHub，未来计划拓展多语言支持。

五、应用与工具

墨刀AI：3分钟生成高保真原型 推出AI原型生成功能，支持自然语言输入30秒生成可编辑原型（适配多设备），支持草图、线框图、竞品截图等图像识别，可多轮对话优化。提供双模式编辑、自动化文档生成，原型与代码实时同步，对接开发流程，适用于电商、社交等场景。
马蜂窝AI产品升级 推出“AI路书”，通过“主动提问-需求校准-精准生成”流程定制行程，支持联系当地指路人；“AI小蚂”新增三大功能：代订日本餐厅（截图识别+自动预订）、7种语言实时翻译、菜单拍照识图（含菜品图像），覆盖出境游全链路智能化。