AI日报:荣耀Magic V5首发,成功完成全球首个端侧语音大模型 的部署落地;xAI即将发布Grok4系列模型;武汉首发AI智能外卖车,配送效率大升级
AI ToolBox
2025年7月2日
硬件与终端创新
- 荣耀 Magic V5 首发全球首个端侧语音大模型:荣耀在 Magic V5 海外版中完成全球首个端侧语音大模型部署,该突破得益于其在 Interspeech 发表的两篇论文成果。此外,该机搭载 “最抗摔铰链”(鲁班缓震铰链,采用宇航服同款材料)、AI 内屏异物检测,影像上支持长焦微距(目标 “折叠机最强影像系统”),配备 6100mAh 超薄青海湖刀片电池(硅含量 25% 量产),7 月 2 日正式发布。
AI 模型与技术突破
- xAI 即将发布 Grok4 系列模型:Grok4 定位全能型旗舰模型,提升自然语言处理、数学推理等能力;Grok4Code 专注编程,将与 Cursor 集成。支持 130,000 令牌上下文窗口,侧重推理速度与实时响应,已通过 API 开放文本处理功能,后续拓展多模态。xAI 一年多完成从 Grok1 到 Grok4 的迭代,深度整合 X 平台实时数据。
- Anthropic 年入 40 亿领跑 AI 赛道,Cursor 强势追赶:Anthropic 年化收入突破 40 亿美元(月均 3.33 亿美元),较年初增长近四倍。Cursor(基于 Anthropic 技术)挖角两位主导 Claude Code 的高管,加速提升竞争力,AI 编程工具市场竞争升温。
- 智谱 AI 开源新一代视觉模型 GLM-4.1V-Thinking:该 9 亿参数模型引入思维链推理,在 28 项测试中 23 项获 10 亿参数级别最佳,18 项持平 / 超越 72 亿参数模型。支持 64K 上下文、4K 图像分辨率,单张 3090 显卡可运行,免费商用授权,开源后全球下载量突破 3000 万次,部分指标超越 GPT-4o。
应用与服务升级
- 武汉首发 AI 智能外卖车 “智音车”:北斗与雅迪联合研发,定位误差≤1 米,支持人车绑定、路线优化等。配送效率提升 30%,骑手日均增收约 80 元,配备车路协同、电子刹车等系统,已服务外卖行业。
- 百度搜索十年大改版:AI 赋能体验升级:推出 “智能框”,支持千字文本及多模态输入,调用 AI 写作 / 作图工具;“百看” 功能接入智能体和真人服务;AI 助手新增视频通话,支持一句话生成 3 分钟视频;接入视频生成模型 MuseSteamer(全球首个中文音视频一体化生成模型)及创作平台 “绘想”,构建国内最大 AI 生态。
- 谷歌 Gemini Live 重大升级:将集成 Google Maps、Spotify 等多应用,支持摄像头输入提取信息,采用卡片式界面展示实时信息,强化实时交互。优化隐私保护,计划打造统一 AI 控制中心,逐步推送新功能。
- 蚂蚁医疗 AI 平台斩获 SAIL 奖:蚂蚁医疗 AI 全流程健康管理平台入围 WAIC 的 SAIL 奖 TOP30,应用于蚂蚁健康 AQ,服务 8 亿用户及数千医疗机构。依托自研医疗大模型,在 MedBench 评测中获双榜冠军,ADMIRE 架构入选 KDD2025。
商业与生态动态
- Figma 迈出 IPO 关键一步,有望融资高达 15 亿美元:2024 年营收 7.49 亿美元(同比增 48%),2025 年 Q1 增 46%,毛利率 91%。CEO 迪伦・菲尔德掌握约 75% 投票权,正布局生成式 AI 应对竞争,IPO 进程加速。
- Cloudflare 推出 “按爬虫付费” 新模式:网站主可设定 AI 爬虫访问费率(允许、免费或禁止),解决中小型出版商收益困境。新建网站默认阻止 AI 爬虫,获康泰纳仕等支持,未来或引入稳定币结算,推动基于许可的内容抓取。
- 京东战略提速,构建智能互动新生态:旗下 JoyInside 与十余家机器人企业合作,聚焦 “一人一狗一玩具” 场景,接入魔法原子、元萝卜等品牌产品。618 期间智能机器人自营销售额同比增 300%,具身智能机器人增 1600%,加速布局智能机器人市场。
内容创作与工具
- 百度发布 MuseSteamer:全球首个支持中英文音视频一体化生成的模型,VBench I2V 综合得分 89.38% 居全球榜首。可由静态图生成 10 秒 1080p 视频,人物微表情、镜头调度专业,同步上线 “绘想” 创作平台,降低视频创作门槛。