AI 快讯 · 第 11 页

marktechpost #联邦学习#NVIDIA FLARE#FedAvg#FedProx#CIFAR-10

NVIDIA FLARE 实战教程：在非独立同分布 CIFAR-10 上构建并比较 FedAvg 与 FedProx 联邦学习

本文提供一份使用 NVIDIA FLARE 框架在非独立同分布 CIFAR-10 数据集上构建联邦学习实验的详细指南。通过对比 FedAvg 和 FedProx 两种聚合算法，展示如何处理标签分布不均的现实场景，并可视化全局模型精度变化。适合有 PyTorch 基础、希望入门联邦学习的开发者。

2026/05/25
marktechpost #模型优化#量化#开源

Together AI 开源 OSCAR：注意力感知的 2-bit KV Cache 量化系统，长上下文推理提速 3 倍

Together AI 开源 OSCAR，一种基于注意力感知协方差旋转的 INT2 KV Cache 量化方法。相比传统 Hadamard 旋转，OSCAR 在 2.28 bits 精度下将 BF16 差距缩小至 1.42 分（Qwen3-8B），实现 8 倍 KV 内存压缩和 3 倍解码加速（100K 上下文）。本文详解技术原理、性能数据及对中文用户的实际价值。

2026/05/25
the_decoder #行业分析#安全#模型发布

Anthropic被五角大楼列为供应链风险，但仍可能向NSA供应Claude模型

尽管被五角大楼标记为供应链风险，Anthropic仍可能继续向NSA提供Claude模型。原因在于情报机构缺乏NVIDIA最新Grace Blackwell芯片，而Anthropic的Mythos模型可在旧硬件上运行。此前争议的“任何合法用途”条款未包含在协议中。本文分析事件细节及对中文圈用户的启示。

2026/05/24
the_decoder #模型训练#多模态#长文档

字节跳动研究：用提问训练多模态模型处理长文档，效果优于逐页转录

字节跳动Seed团队发现，通过提问方式训练7B参数的多模态大模型（LMM），在处理超长图文文档时，准确率超过更大模型，且无需逐页转录。该研究为长文档理解提供了新思路，对中文用户处理合同、论文等场景有参考价值。

2026/05/24
the_decoder #行业分析#AGI#AI争议

DeepMind哈萨比斯称人类已站在奇点山脚，LeCun反驳当前AI不具真正智能

DeepMind创始人哈萨比斯认为人类已进入奇点初期，而Meta首席AI科学家LeCun直言当前AI并非真正智能。Gemini联合负责人Vinyals则持中间立场：今天的模型在七年前会被视为AGI，但仍缺乏从经验中学习的能力。本文梳理三位AI领袖的观点分歧，并探讨对中文圈用户的技术认知影响。

2026/05/24
marktechpost #模型发布#工具评测#微软

微软发布 Webwright：终端原生网页代理框架，GPT-5.4 在 Odysseys 基准上从 33.5% 提升至 60.1%

微软研究院推出开源框架 Webwright，让 AI 代理通过编写 Playwright 脚本控制浏览器，而非逐次点击。在 Odysseys 基准上，GPT-5.4 得分从 33.5% 跃升至 60.1%，超越此前最佳。本文详解其工作原理、性能数据及对中文开发者的实用价值。

2026/05/24
marktechpost #模型发布#线性注意力#NVIDIA

NVIDIA 发布 Gated DeltaNet-2：解耦擦除与写入的线性注意力层，长上下文检索大幅提升

NVIDIA 开源 Gated DeltaNet-2，一种新型线性注意力层，通过通道级擦除门和写入门解耦记忆编辑，在 1.3B 参数、100B tokens 训练下超越 Mamba-2/3、KDA 等模型，长上下文检索任务提升显著。了解其技术原理、性能对比及对中文开发者的实用价值。

2026/05/24
simon_willison #开源#AI伦理#GitHub Issue

Armin Ronacher 吐槽 AI 生成的 GitHub Issue：全是自信满满的胡扯

Flask 作者 Armin Ronacher 发文批评用户用 AI 重写 issue 导致信息失真、结论错误。他呼吁开发者回归原始观察，按四步模板提交。对中文开源社区同样适用，提醒我们 AI 辅助沟通的陷阱。

2026/05/24
the_decoder #模型发布#功能更新#行业分析

AutoTTS让Claude Code自主发现AI缩放算法，计算量减少70%且精度不变

马里兰大学、Google、Meta等机构的研究人员利用AutoTTS框架，让Claude Code作为编码智能体自主发现AI推理控制算法。该算法相比标准自一致性方法减少约70%计算量，同时保持相同精度，整个搜索仅花费40美元和160分钟。

2026/05/24
the_decoder #模型选择#AI偏见#工具评测

AI工具默认模型陷阱：Copilot、Gemini默认设置为何不可靠，用户需主动选择

数学家Adam Kucharski测试发现，Microsoft Copilot默认模型在数据分析中会编造国家差异，输出刻板印象。本文揭示Copilot、Gemini等AI工具的默认模型陷阱，并给出中文用户应对建议。

2026/05/24
google_ai_blog #功能更新#AI搜索#园艺

谷歌搜索AI模式推出园艺技巧：5个方法让植物更健康

谷歌搜索新增AI模式、Search Live和购物功能，帮助用户解决园艺问题。本文介绍5个实用技巧，包括植物识别、病虫害诊断、浇水提醒等，对中文用户意味着更智能的园艺助手。

2026/05/24
ai_news #芯片#AI Agent#阿里巴巴

阿里发布专为AI Agent设计的Zhenwu M890芯片，三年路线图对标英伟达

阿里巴巴推出Zhenwu M890 AI芯片，专为AI Agent优化，性能是前代三倍，并公布2027/2028年升级路线图。同时发布Qwen 3.7-Max模型，构建从芯片到云的全栈闭环。对中文圈用户意味着国产AI基础设施加速自主可控。

2026/05/24
aws_ml_blog #AWS#SageMaker AI#OpenAI 兼容 API

Amazon SageMaker AI 端点支持 OpenAI 兼容 API，无需修改代码即可调用模型

AWS 宣布 SageMaker AI 实时推理端点支持 OpenAI 兼容 API，用户只需更改 endpoint URL 即可使用 OpenAI SDK、LangChain 等框架调用模型。本文详解 bearer token 认证、多模型部署及安全最佳实践，对国内用户意味着更低门槛的私有化部署。

2026/05/24
aws_ml_blog #AWS#实时语音转文字#vLLM#SageMaker AI#模型部署

AWS SageMaker AI 联合 vLLM 推出实时语音转文字服务，支持双向流式推理

AWS 宣布 SageMaker AI 支持双向流式推理，结合 vLLM 的 Realtime API 可部署实时语音转文字模型。本文详解如何用 Voxtral-Mini-4B 搭建端到端服务，实现音频流输入与转录文本同时输出。对中文用户，该方案可替代自建 WebSocket 基础设施，但需注意模型对中文的支持程度。

2026/05/24
google_ai_blog #功能更新#行业分析#工具评测

Google Translate 20周年：从2006年AI实验到支持近250种语言的翻译工具

Google Translate 迎来20周年，分享20个趣味事实和隐藏功能。从最初仅支持英语-阿拉伯语翻译，到如今覆盖近250种语言、服务超10亿用户，本文回顾其发展历程并介绍新功能，对中文用户使用翻译工具有何启示？

2026/05/24
ai_news #企业AI#AI安全#物理AI

TechEx北美大会第二天：企业AI落地障碍、安全挑战与物理AI成焦点

TechEx北美大会第二天深入探讨企业AI部署的“AI坟墓”现象、影子AI安全风险、agentic AI规模化难题，以及物理AI和机器人前景。了解企业如何避免AI项目停滞、构建安全可扩展的AI架构。

2026/05/24
google_ai_blog #模型发布#功能更新#行业分析

Google I/O 2026 发布：AI 更实用，Gemini 2.5 与 Project Mariner 等新功能亮相

Google I/O 2026 大会发布多项 AI 更新，包括 Gemini 2.5 模型、Project Mariner 智能助手、以及面向开发者的新工具。本文总结核心发布，并分析对中文用户的实际影响与可用性。

2026/05/24
marktechpost #向量搜索#开源工具#RAG

Turbovec 开源向量索引：基于 Google TurboQuant 算法，16 倍压缩，无需训练码本

Turbovec 是一个基于 Rust 的向量索引库，提供 Python 绑定，采用 Google Research 的 TurboQuant 算法实现 16 倍压缩，无需码本训练。在 ARM 上搜索速度比 FAISS IndexPQFastScan 快 12–20%，适合本地 RAG 场景。

2026/05/24
aws_ml_blog #模型发布#工具评测#多模态

AWS 发布多模态评估器：MLLM-as-a-Judge 用于图像到文本任务，支持 Strands Evals SDK

AWS 推出四个新的多模态大语言模型（MLLM）评估器，用于 Strands Evals SDK，可自动检测图像到文本任务中的幻觉、事实错误和指令违规。本文介绍评估器功能、使用方法和中文用户的应用场景。

2026/05/24
ai_news #芯片出口#中美博弈#国产替代

Nvidia H200对华出口获批但冻结：特朗普峰会未解困局，华为Ascend加速替代

特朗普北京峰会未推动H200芯片出货，美国已批准出口但中国限制国内使用。华为Ascend芯片获DeepSeek、阿里等支持，国产替代加速。了解中美芯片博弈最新动态及对AI产业影响。

2026/05/24