AI 快讯 · 第 12 页
-
SageMaker Feature Store 新增 Lake Formation 集成与 Iceberg 管理
AWS 宣布 SageMaker Python SDK v3.8.0 为 Feature Store 带来三项新能力:原生 Lake Formation 集成实现列/行/单元格级访问控制、Apache Iceberg 表属性管理控制元数据膨胀、以及 SDK v3 模块化升级。本文详解这些功能如何解决特征存储的安全与成本痛点,并提供代码示例。
-
TechEx北美大会:AI落地依赖电力、基础设施与安全,企业需关注边缘与数据中心
TechEx North America大会首日聚焦AI落地的现实挑战:电力、基础设施与安全。边缘计算、数据中心和网络安全议题揭示,企业需在部署AI前解决物理限制与合规问题。本文总结大会关键洞察,为中文圈企业提供实用参考。
-
阿里Qwen3.7-Max发布:自主运行35小时优化自研芯片代码,性能对标Claude Opus 4.6
阿里通义千问团队发布Qwen3.7-Max,专为长时间自主代理任务设计,在基准测试中与Claude Opus 4.6持平,超越DeepSeek V4 Pro和Kimi K2.6。模型曾自主运行35小时优化自研芯片代码,并演示控制四足机器人。本文详解模型能力、中文用户实际可用性及国产替代对比。
-
Amazon Nova Act 获得 HIPAA 合规认证,医疗 AI 代理可处理受保护健康信息
AWS 宣布 Nova Act 成为 HIPAA 合格服务,允许医疗和生命科学组织在浏览器中部署自主 AI 代理,自动化处理涉及 ePHI 的复杂工作流,如理赔处理、预约协调等。本文解读该功能对中文医疗 AI 用户的意义。
-
Amazon Bedrock AgentCore 突破上下文窗口限制:用递归语言模型处理超长文档
AWS 推出基于 Amazon Bedrock AgentCore 的递归语言模型(RLM)方案,通过 Code Interpreter 和 Strands Agents SDK 实现无上限上下文处理。本文详解架构、实现步骤及评测结果,并分析对中文用户的实际意义与替代方案。
-
SuperClaude框架教程:用命令、代理、模式和会话记忆构建Claude工作流
本文详细讲解SuperClaude框架的搭建与使用,包括克隆仓库、发现命令/代理/模式、Python桥接动态加载Markdown行为文件,以及通过多个实战示例展示如何让Claude调用更一致、角色感知更强。适合想提升Claude开发效率的中文开发者。
-
Amazon Bedrock AgentCore 多租户代理架构设计:Silo/Pool/Bridge 模式与租户隔离实践
AWS 发布多租户 AI 代理架构指南,详解使用 Amazon Bedrock AgentCore 构建 SaaS 级代理应用的五大设计考量:租户隔离、模型选择、工作流模式、RAG 数据隔离与身份传播。适合国内云厂商与 SaaS 开发者参考。
-
Cohere 发布 Command A+:218B 稀疏 MoE 模型,专为 Agent 工作流设计,最低仅需 2 块 H100 GPU
Cohere 开源了 Command A+,一个 218B 总参数、25B 激活参数的稀疏 MoE 模型,支持多模态推理、48 种语言,可在 2 块 H100 上运行。本文详解其架构、量化方案、性能提升及对中文开发者的实际意义。
-
Kiro CLI 接入 Amazon Bedrock AgentCore Memory:实现跨会话持久记忆,告别重复上下文
AWS 发布新方案,通过自定义 MCP 服务器将 Amazon Bedrock AgentCore Memory 集成到 Kiro CLI,让终端 AI 助手记住跨会话的对话历史、偏好和项目细节。本文详解架构、两步检索策略及部署步骤,对使用 Kiro CLI 的开发者意味着更高效的上下文感知体验。
-
Google Lighthouse新增Agentic Browsing审计,检查网站对AI代理和llms.txt的兼容性
Google在Lighthouse工具中实验性推出Agentic Browsing审计,评估网站对AI代理的友好程度,包括是否支持llms.txt标准。这对网站运营者和AI开发者意味着什么?中文用户如何应对?
-
谷歌AI Mode上线一年:美国用户从关键词搜索转向自然语言提问
谷歌AI Mode推出一年后,美国用户搜索习惯发生显著变化:自然语言查询占比超40%,长尾问题增长3倍。本文详解AI Mode如何改变搜索行为,并分析对中文用户的影响与启示。
-
CopilotKit 2026 年重新定义 Agentic AI 栈:AG-UI 协议、AIMock 测试套件与 Pathfinder 知识基础设施
CopilotKit 在 2026 年推出三大产品:AG-UI 协议填补人机交互层空白,AIMock 解决 AI 测试不可靠问题,Pathfinder 提供自托管知识检索。本文详解其架构及对中文开发者的影响,包括国产替代方案与合规考量。
-
开源模型生态如何产生复利效应:中国AI生态的高参与度与开放优先策略分析
本文分析中国AI生态中开源模型如何通过知识共享降低研发成本,形成复利效应。核心观点:80%算力用于研发而非最终训练,开放生态让中国实验室能持续迭代。对中文用户而言,这意味着更低的模型使用成本和更快的技术迭代,但也面临工具链不完整等挑战。
-
Amazon Bedrock 三种方式实现编程式工具调用(PTC):自建 Docker 沙箱、托管 Code Interpreter 与 Anthropic
AWS 发布 Amazon Bedrock 编程式工具调用(PTC)实现指南,提供三种部署方案:自托管 ECS Docker 沙箱、托管 Bedrock AgentCore Code Interpreter 以及 Anthropic SDK 兼容代理。PTC 通过让模型一次性生成 Python 代码并在沙箱中执行,大幅降低多工具调用场景的延迟与 token 消耗。本文详解架构、系统提示词…
-
AWS 推出 Bedrock AgentCore Runtime 集成 MCP 协议,自然语言直接调用 AWS CLI 命令
AWS 发布新方案,通过 Bedrock AgentCore Runtime 的 MCP 支持,将 Amazon Quick 与 AWS API MCP Server 连接,实现用自然语言查询 EC2 实例、管理资源,无需切换工具或记忆 CLI 语法。本文详解架构、部署步骤和成本,适合 DevOps 和 SRE 关注。
-
AI Agent 优化放射科工作流:AWS 发布智能排班方案,减少诊断延迟与成本
AWS 推出基于 AI Agent 的放射科工作流优化方案,利用 Amazon Bedrock AgentCore 和 Strands Agents SDK 构建智能排班系统。该方案通过分析放射科医生专长、工作负荷、疲劳程度和病例复杂度,实现上下文感知的病例分配,减少 17.7 分钟紧急病例延迟,为医院网络节省 210 万至 420 万美元成本。
-
深入中国AI实验室:从文化差异看中美大模型竞赛的隐性优势
本文作者走访中国多家顶级AI实验室后,从文化角度剖析中国团队在LLM竞赛中的独特优势:更少内耗、更多学生参与、更务实的工作风格。对中文圈用户而言,这意味着国产模型在工程迭代和成本控制上可能持续领先,但原创性研究仍是短板。
-
Nvidia Vera芯片:黄仁勋不想让你忽视的2000亿美元赌注,推理市场新战场
Nvidia Q1营收816.2亿美元超预期,但CEO黄仁勋在电话会中透露Vera CPU将开辟2000亿美元推理市场,预计本财年贡献200亿美元收入。本文解析Vera芯片的战略意义、供应链挑战及对中文圈AI芯片格局的影响。
-
字节跳动开源Lance:3B参数统一模型,同时搞定图像视频理解、生成与编辑
字节跳动智能创作实验室发布Lance,一个仅3B激活参数的开源统一多模态模型,原生支持图像和视频的理解、生成与编辑。本文详解其架构、训练方法、性能表现,并分析对中文开发者和用户的实际意义。
-
加州大学伯克利法学院2026年夏季起禁止AI用于评分作业,法律教育划出硬线
UC Berkeley Law宣布从2026年夏季起,禁止学生在几乎所有评分作业中使用AI,包括大纲、起草和校对,仅保留研究用途。校方认为未来律师必须先学会独立思考,才能有意义地使用AI。本文分析该政策对法律教育及中文圈法学学习者的影响。