AI 快讯 · 第 11 页
-
NVIDIA FLARE 实战教程:在非独立同分布 CIFAR-10 上构建并比较 FedAvg 与 FedProx 联邦学习
本文提供一份使用 NVIDIA FLARE 框架在非独立同分布 CIFAR-10 数据集上构建联邦学习实验的详细指南。通过对比 FedAvg 和 FedProx 两种聚合算法,展示如何处理标签分布不均的现实场景,并可视化全局模型精度变化。适合有 PyTorch 基础、希望入门联邦学习的开发者。
-
Together AI 开源 OSCAR:注意力感知的 2-bit KV Cache 量化系统,长上下文推理提速 3 倍
Together AI 开源 OSCAR,一种基于注意力感知协方差旋转的 INT2 KV Cache 量化方法。相比传统 Hadamard 旋转,OSCAR 在 2.28 bits 精度下将 BF16 差距缩小至 1.42 分(Qwen3-8B),实现 8 倍 KV 内存压缩和 3 倍解码加速(100K 上下文)。本文详解技术原理、性能数据及对中文用户的实际价值。
-
Anthropic被五角大楼列为供应链风险,但仍可能向NSA供应Claude模型
尽管被五角大楼标记为供应链风险,Anthropic仍可能继续向NSA提供Claude模型。原因在于情报机构缺乏NVIDIA最新Grace Blackwell芯片,而Anthropic的Mythos模型可在旧硬件上运行。此前争议的“任何合法用途”条款未包含在协议中。本文分析事件细节及对中文圈用户的启示。
-
字节跳动研究:用提问训练多模态模型处理长文档,效果优于逐页转录
字节跳动Seed团队发现,通过提问方式训练7B参数的多模态大模型(LMM),在处理超长图文文档时,准确率超过更大模型,且无需逐页转录。该研究为长文档理解提供了新思路,对中文用户处理合同、论文等场景有参考价值。
-
DeepMind哈萨比斯称人类已站在奇点山脚,LeCun反驳当前AI不具真正智能
DeepMind创始人哈萨比斯认为人类已进入奇点初期,而Meta首席AI科学家LeCun直言当前AI并非真正智能。Gemini联合负责人Vinyals则持中间立场:今天的模型在七年前会被视为AGI,但仍缺乏从经验中学习的能力。本文梳理三位AI领袖的观点分歧,并探讨对中文圈用户的技术认知影响。
-
微软发布 Webwright:终端原生网页代理框架,GPT-5.4 在 Odysseys 基准上从 33.5% 提升至 60.1%
微软研究院推出开源框架 Webwright,让 AI 代理通过编写 Playwright 脚本控制浏览器,而非逐次点击。在 Odysseys 基准上,GPT-5.4 得分从 33.5% 跃升至 60.1%,超越此前最佳。本文详解其工作原理、性能数据及对中文开发者的实用价值。
-
NVIDIA 发布 Gated DeltaNet-2:解耦擦除与写入的线性注意力层,长上下文检索大幅提升
NVIDIA 开源 Gated DeltaNet-2,一种新型线性注意力层,通过通道级擦除门和写入门解耦记忆编辑,在 1.3B 参数、100B tokens 训练下超越 Mamba-2/3、KDA 等模型,长上下文检索任务提升显著。了解其技术原理、性能对比及对中文开发者的实用价值。
-
Armin Ronacher 吐槽 AI 生成的 GitHub Issue:全是自信满满的胡扯
Flask 作者 Armin Ronacher 发文批评用户用 AI 重写 issue 导致信息失真、结论错误。他呼吁开发者回归原始观察,按四步模板提交。对中文开源社区同样适用,提醒我们 AI 辅助沟通的陷阱。
-
AutoTTS让Claude Code自主发现AI缩放算法,计算量减少70%且精度不变
马里兰大学、Google、Meta等机构的研究人员利用AutoTTS框架,让Claude Code作为编码智能体自主发现AI推理控制算法。该算法相比标准自一致性方法减少约70%计算量,同时保持相同精度,整个搜索仅花费40美元和160分钟。
-
AI工具默认模型陷阱:Copilot、Gemini默认设置为何不可靠,用户需主动选择
数学家Adam Kucharski测试发现,Microsoft Copilot默认模型在数据分析中会编造国家差异,输出刻板印象。本文揭示Copilot、Gemini等AI工具的默认模型陷阱,并给出中文用户应对建议。
-
谷歌搜索AI模式推出园艺技巧:5个方法让植物更健康
谷歌搜索新增AI模式、Search Live和购物功能,帮助用户解决园艺问题。本文介绍5个实用技巧,包括植物识别、病虫害诊断、浇水提醒等,对中文用户意味着更智能的园艺助手。
-
阿里发布专为AI Agent设计的Zhenwu M890芯片,三年路线图对标英伟达
阿里巴巴推出Zhenwu M890 AI芯片,专为AI Agent优化,性能是前代三倍,并公布2027/2028年升级路线图。同时发布Qwen 3.7-Max模型,构建从芯片到云的全栈闭环。对中文圈用户意味着国产AI基础设施加速自主可控。
-
Amazon SageMaker AI 端点支持 OpenAI 兼容 API,无需修改代码即可调用模型
AWS 宣布 SageMaker AI 实时推理端点支持 OpenAI 兼容 API,用户只需更改 endpoint URL 即可使用 OpenAI SDK、LangChain 等框架调用模型。本文详解 bearer token 认证、多模型部署及安全最佳实践,对国内用户意味着更低门槛的私有化部署。
-
AWS SageMaker AI 联合 vLLM 推出实时语音转文字服务,支持双向流式推理
AWS 宣布 SageMaker AI 支持双向流式推理,结合 vLLM 的 Realtime API 可部署实时语音转文字模型。本文详解如何用 Voxtral-Mini-4B 搭建端到端服务,实现音频流输入与转录文本同时输出。对中文用户,该方案可替代自建 WebSocket 基础设施,但需注意模型对中文的支持程度。
-
Google Translate 20周年:从2006年AI实验到支持近250种语言的翻译工具
Google Translate 迎来20周年,分享20个趣味事实和隐藏功能。从最初仅支持英语-阿拉伯语翻译,到如今覆盖近250种语言、服务超10亿用户,本文回顾其发展历程并介绍新功能,对中文用户使用翻译工具有何启示?
-
TechEx北美大会第二天:企业AI落地障碍、安全挑战与物理AI成焦点
TechEx北美大会第二天深入探讨企业AI部署的“AI坟墓”现象、影子AI安全风险、agentic AI规模化难题,以及物理AI和机器人前景。了解企业如何避免AI项目停滞、构建安全可扩展的AI架构。
-
Google I/O 2026 发布:AI 更实用,Gemini 2.5 与 Project Mariner 等新功能亮相
Google I/O 2026 大会发布多项 AI 更新,包括 Gemini 2.5 模型、Project Mariner 智能助手、以及面向开发者的新工具。本文总结核心发布,并分析对中文用户的实际影响与可用性。
-
Turbovec 开源向量索引:基于 Google TurboQuant 算法,16 倍压缩,无需训练码本
Turbovec 是一个基于 Rust 的向量索引库,提供 Python 绑定,采用 Google Research 的 TurboQuant 算法实现 16 倍压缩,无需码本训练。在 ARM 上搜索速度比 FAISS IndexPQFastScan 快 12–20%,适合本地 RAG 场景。
-
AWS 发布多模态评估器:MLLM-as-a-Judge 用于图像到文本任务,支持 Strands Evals SDK
AWS 推出四个新的多模态大语言模型(MLLM)评估器,用于 Strands Evals SDK,可自动检测图像到文本任务中的幻觉、事实错误和指令违规。本文介绍评估器功能、使用方法和中文用户的应用场景。
-
Nvidia H200对华出口获批但冻结:特朗普峰会未解困局,华为Ascend加速替代
特朗普北京峰会未推动H200芯片出货,美国已批准出口但中国限制国内使用。华为Ascend芯片获DeepSeek、阿里等支持,国产替代加速。了解中美芯片博弈最新动态及对AI产业影响。