AI日报:4倍速输入神器!腾讯混元自研ASR登陆ima,复杂场景照单全收;阿里开源“核弹级”代码模型!Qwen3-Coder 480B MoE 今天上线,性能直接对标 Claude Sonnet4;史上最大私募!OpenAI 3000 亿美元估值封神,软银豪掷 300 亿美元登顶
AI 行业日报
科技巨头动态
腾讯
7 月 22 日,腾讯混元将自主研发的 ASR(语音识别)大模型应用于 ima 平台,首次在手机 App 端实现语音输入功能。该模型每分钟可识别 300 字,速度是手动输入的 4 倍,在复杂环境及中英文混合场景下表现突出,广泛应用于知识库问答、笔记创作等场景,iOS 用户还可通过桌面小组件快速提问。未来团队将优化模型,增强方言与多语言识别能力。
阿里
- 7 月 23 日,阿里云宣布最新 AI 编程大模型 Qwen3-Coder 正式全面开源,其中性能最强的 Qwen3-Coder-480B-A35B-Instruct 采用先进的 MoE 架构,参数总量达 4800 亿,激活参数 350 亿,原生支持 256K 上下文,在多个编程任务中表现出色。同时开源命令行工具 Qwen Code,已在魔搭社区、HuggingFace 等平台上线,很快将接入阿里云 AI 编程产品通义灵码。
- 消息称,阿里巴巴将于本周推出首款自研 AI 眼镜,具备语音助手、实时翻译等基础功能,深度整合高德地图、支付宝和淘宝等生态,有不带显示和带显示(AI+AR)两个版本,采用双芯片架构,由天猫精灵硬件团队和夸克 AI 研发团队协同完成。
微软
7 月 22 日,微软发布博文阐述 AI 对 Windows 11 的重塑,推出 Recall、Click to Do 等创新功能。其中,系统级 AI 智能体可通过自然语言指令完成系统设置;Click to Do 支持文本总结、改写等操作,还能解析图像内容;照片应用上线 Relight 功能,画图应用有贴纸生成与对象识别功能,截图工具新增精准捕获与颜色识别功能。
谷歌
谷歌 Gemini 2.5 在图像处理上实现革新,不仅能识别物体,更能理解抽象概念与关系,可处理关系查询、逻辑指令、抽象概念等,在图像编辑、工作场所安全、保险行业等多领域有巨大应用潜力。开发者可通过 Gemini API 调用相关服务。
苹果
苹果发布 iOS26 的第四个开发者测试版,有 AI 驱动的新闻通知摘要功能回归、Liquid Glass 界面调整、新增动态壁纸等更新。此前因 BBC 投诉暂停的 AI 新闻摘要功能,设置页面新增提示,提醒用户核实信息。同时,有消息称苹果推迟 Siri 重大升级,可能放弃完全自主研发 AI 模式,转而与第三方大语言模型合作。
亚马逊
亚马逊确认收购 AI 穿戴设备初创公司 Bee,其主打产品是售价 49.99 美元的手环,能持续记录环境声音并生成提醒和待办事项。此次收购标志着亚马逊在 AI 穿戴设备领域的进一步拓展。此外,亚马逊云科技上海 AI 研究院于 7 月 23 日正式解散,官方称这是对组织和战略方向评估后的决定,将全力支持员工过渡。
融资与估值
- OpenAI 计划于 7 月 28 日重启融资,由软银领投,拟筹集 300 亿美元,融资完成后总估值将达 3000 亿美元。同时,OpenAI 与甲骨文签署每年 300 亿美元的数据中心服务协议,涉及 4.5 千兆瓦电力容量,是 “星际之门” 项目的重要组成部分。
- 印度商业消息初创企业 Gupshup 完成超 6000 万美元融资,结合股权和债务融资,旨在扩大在多个高速增长市场的业务。其创始人表示未来 18 - 24 个月可能考虑在印度股市 IPO。
- 蛋白质设计领域的 Latent Labs 完成 5000 万美元融资,推出网页 AI 模型 LatentX,能从头设计全新分子,精确到原子层级结构,以技术授权方式服务外部组织。
行业观点与趋势
- OpenAI 首席执行官山姆・奥尔特曼认为,在 AI 浪潮下,客服支持行业受冲击最大,未来可能完全被替代,甚至会出现整个职业类别消失的情况。他还提到 AI 在医疗领域诊断能力已超越多数医生,但人们仍希望有人类医生参与。
- 360 集团创始人周鸿祎在 2025 中国互联网大会上指出,大模型面临三类安全风险,分别是 “幻觉” 导致信息误导、降低网络攻击门槛、推动国家级攻击智能化升级。360 已启动构建智能体安全专家和推出 “大模型卫士” 等应对措施。
- 美国科技亿万富翁马克・库班表示,未来五年内,AI 将成为职场人士必备基本技能,企业主能否有效运用 AI 将决定其竞争力,AI 助手将改变工作方式,助力个人创业。
新产品与技术
- Kimi K2 上线,拥有 1 万亿参数,激活参数 320 亿,采用全新优化器 MuonClip,处理 15.5 万亿 token 数据,引入 “重述法” 提升理解能力,在全球开源模型排行榜表现出色。
- Meta 推出 AU - Net 架构,基于自回归 U - Net 结构,能动态组合字节形成多层次序列表示,采用收缩与扩张路径,融合宏观语义与局部细节,提升推理效率。
- Hedra 推出 Live Avatars,每分钟成本仅 0.05 美元,比现有方案便宜 15 倍,响应时间低于 100 毫秒,兼容主流 LLM 和 TTS 技术,应用场景广泛。
- Fogsight AI 是一款基于 LLM 的动画引擎,能将复杂理论转化为动画,输入关键词即可生成带双语旁白的短片,适合科普创作等场景,已在 GitHub 开源。
- 夸克健康大模型通过中国 12 门核心学科的主任医师笔试评测,融入夸克 AI 搜索,具备 “慢思考能力”,依托双数据产线与双奖励机制等体系,在复杂医学推理任务中表现突出。
人才与团队变动
微软消费级 AI 战略负责人穆斯塔法・苏莱曼在过去半年内从 DeepMind 挖走至少 24 名核心员工,包括前谷歌 Gemini 聊天机器人工程负责人阿马尔・苏布拉马尼亚,这一动作影响了谷歌 AI 研发力量,也推动行业 AI 人才薪酬上涨。谷歌也从微软反向挖角部分研究人员,人才争夺战白热化。
其他重要资讯
- Anthropic CEO 达里奥・阿莫代承认,为在 AI 领域保持领先,公司不得不与部分威权政府合作,接受来自阿联酋和卡塔尔的投资,引发关于商业伦理与社会责任的讨论。
- OpenAI 赢得与 Open AI 的商标诉讼,法院认定后者在注册过程中存在误导行为,需停用相似名称,此次判决强化了 OpenAI 的品牌地位。
- 360 集团创始人周鸿祎在 2025 中国互联网大会上指出,大模型面临 “幻觉” 与信息误导、攻击门槛降低、国家级攻击智能化升级三类安全风险,并介绍了 360 的应对措施。
- 360 公司将推出 AI 录音笔与智能眼镜,AI 录音笔能智能识别场景并提炼关键信息;智能眼镜因具备显示功能,可作为提词器、用于实时翻译等场景。
相关文章

Win11 AI 新功能:智能体、截图工具、照片应用,让 PC 更智能

OpenAI 胜诉:法院禁止 Open AI 使用相似名称,保护品牌权益

AU-Nets 问世:Meta 用创新模型革新文本处理方式

MIT 辍学生打造 AI 合规独角兽:从实习生到百亿美金 CEO 的传奇

Anthropic CEO 承认与威权政权妥协,只为获取人工智能资金

Latent Labs 推出 LatentX:网页 AI 模型助力蛋白质设计民主化

Kimi K2 上线两天即封神!技术报告详解其全球开源赛场的制胜秘籍

五年内必修!库班警告企业:人工智能是生存的“基本技能”

Mixus 革命:邮件秒变 AI 助手操控中心,智能任务管理新时代来临

阿里开源“核弹级”代码模型!Qwen3-Coder 480B MoE 今天上线,性能直接对标 Claude Sonnet4

4倍速输入神器!腾讯混元自研ASR登陆ima,复杂场景照单全收

AI 浪潮下人工客服的未来:奥尔特曼称其或被完全替代

苹果AI团队的困境:自研模型受限,开源计划被否,第三方大模型成新选择

360 推出智能眼镜和 AI 录音笔:眼镜带显示,录音笔会分析

夸克 AI 搜索的“大模型”:通过主任医师评测,健康搜索更专业

大模型安全危机:周鸿祎警告攻击门槛降低,注入攻击风险飙

5 美分/分钟颠覆行业!Hedra Live Avatars 上线,实时数字人成本骤降 15 倍

史上最大私募!OpenAI 3000 亿美元估值封神,软银豪掷 300 亿美元登顶

美国职场“AI 假面舞会”:1/6 员工假装用 AI,只为取悦老板

iOS 26 Beta 4 上线!苹果 AI 新闻摘要功能回归,智能通知全新升级

谷歌 Gemini 2.5 革新图像处理:不止识别物体,更能理解抽象概念与关系

昔日战友反目!微软 AI 主管苏莱曼“带队挖角”谷歌 20+ DeepMind 核心员工,硅谷大地震

300 亿美元年单!OpenAI 与甲骨文签下史上最大云合同,4.5 GW 算力堪比两座胡佛水坝

Gupshup 获 6000 万美元融资,独角兽之路能否再现辉煌?

49 美元手环秒变 AI 秘书!亚马逊收购 Bee,开启全天候语音记录时代

亚马逊上海 AI 研究院解散:官方回应“艰难决定”,全力支持员工顺利过渡

阿里发布 AI 眼镜:双版本深度整合生态,开启智能穿戴新纪元
