发布时间:2025 年 5 月 19 日
智能体正在改变各处的开发工作,而 Web 领域的变革速度尤为迅速。它正在重新定义我们构建的内容、构建方式和构建者。随着智能体网络时代的到来,我们看到了一种转变,它弥合了复杂开发者工作流、底层平台功能和日常用户体验之间的差距。
在 2026 年 Google I/O 大会上,我们公布了这一时代的美好愿景。这些想法将 Web 生态系统的三个核心领域联系起来:赋能 AI 智能体,使其能够通过新功能构建网站并与网站互动;突破 Web 界面和性能的界限;以及通过 Chrome 中的 Gemini 将浏览器转变为面向日常用户的强大主动式助理。通过将高效的内置 AI 模型 直接集成到浏览器中,并为 Chrome 带来自动浏览等强大的自动化工具,我们正在让所有人都能更智能、更快速、更轻松地使用网络。
以下是我们在 2026 年 Google I/O 大会上分享的 15 项重大更新,旨在帮助您在智能体时代的 Web 浏览领域取得成功。
为 Web AI 智能体赋能
智能体正在改变我们与软件的互动方式,我们认为 Web 必须能够引导它们。我们正在推出强大的新功能和工具,例如 WebMCP 和 Modern Web Guidance,让您能够更清晰、更快速地打造现代 Web 体验。我们还为您提供了 AI 辅助工具,让您能够比以往更快、更准确地构建、调试和优化代码。
1. WebMCP:将网站转变为智能体工具包
我们率先向您介绍 WebMCP,这是一种拟议的开放 Web 标准,可让您将 JavaScript 函数和 HTML 表单等结构化工具公开给基于浏览器的智能体。通过定义这些工具,您可以准确地指示代理如何以及在何处与您的网站互动。效果如何呢?现在,智能体可以调用机器友好型函数,在几秒钟内完成复杂的任务,同时具有更高的可靠性、精确性和个性化程度。假设用户正在规划多城市度假行程。他们无需观看代理点击浏览旅游表单,而是可以授权代理直接查询后端 API,立即构建个性化且根据天气优化的行程,供他们审批。
实验性 WebMCP 源试用将在 Chrome 149 中开始。Chrome 中的 Gemini 将很快支持 WebMCP API。我们已经看到全球消费品牌在试用 WebMCP,以便为用户打造更愉悦、更具吸引力的体验。

2. 现代 Web 指南:指导编码智能体构建现代 Web 应用的蓝图
现代 Web 指南现已推出抢先体验版,其中包含一系列经过专家审核的常青技能,可指导您的编码代理在许多常见使用情形下构建最易于访问、性能最高且最安全的现代 Web 体验。它可直接与 Baseline 集成,让您专注于想要构建的内容,而工具会自动确定要在所选 Baseline 目标中使用哪些合适的功能和回退。 在 Google Antigravity 中通过 npx 或作为编码代理中的扩展程序,只需点击一下即可安装。现代 Web 指南功能支持 100 多种用例,涵盖数十项最新功能,并且会定期添加更新。
3. 使用 Chrome 开发者工具自动调试智能体
利用 Chrome 开发者工具扩展代理工作流程,该工具可提供实时验证、调试和优化代码的可见性。通过为代理提供对开发者工具功能的直接访问权限(例如控制台日志、网络流量和无障碍树),代理无需人工监督即可验证和自动修复问题。 面向代理的 Chrome 开发者工具现已面向 Antigravity 和其他 20 多款编码代理推出。
4. 利用 Chrome 开发者工具中的 AI 辅助调试功能获取深入的分析洞见
Chrome 开发者工具中的 AI 辅助功能现在可以访问 Lighthouse 数据,并能自动搜索上下文,从而回答之前无法回答的更多开放式问题。 此外,借助 widget,您可以全面了解 Gemini 的推理过程,从而帮助您进行调试。
5. 无需服务器、预算和繁琐流程:利用内置 AI 解锁 AI 功能
内置 AI 完全在浏览器中运行,可让您部署个性化、主动式功能,而这些功能在服务器上会非常昂贵。无需再为令牌付费,也无需再考虑其他障碍,可完全专注于为用户提供独特价值。最重要的是,浏览器可以管理并跨网站共享优化后的模型,从而让更多用户在网络上享受 AI 体验。
为了帮助您打造这些顺畅的 AI 增强功能,我们正在扩展 Web AI 工具包:
- Prompt API 已稳定:Chrome 148 使用 Gemini Nano,支持多模态输入和结构化输出,可提供丰富的体验;可靠的 JSON 可实现无缝集成;支持更多语言。
- Gemma 197M:这款超高效的专家模型可以透明地为特定任务 API(例如 summarizer)提供支持,从而自动将您的功能扩展到更广泛的设备。
探索完整的内置 AI 套件,包括我们现有的 Translator 和 Language Detector API,并加入早期试用计划 来测试即将推出的 API。
突破 Web 界面和性能的界限
我们正在开发下一代平台功能,以进一步模糊 Web 应用与原生应用之间的界限。新的声明式 API(例如 HTML-in-Canvas 和声明式部分更新)可为您处理复杂的渲染和性能任务,让您能够比以往更轻松地在 Web 上构建美观、现代、高保真、高性能且互动性强的体验。
6. HTML-in-Canvas 和元素级视图过渡:利用新一代界面打破界限
借助新的 HTML-in-Canvas API 和元素范围的视图转换,您可以实现以前无法实现的界面,从而为网页带来高保真、应用般的互动体验。借助 HTML-in-Canvas API,您可以将真实的 DOM 元素直接集成到使用 WebGL 和 WebGPU 的画布中,从而打造可搜索、可访问、可原生翻译且可与内置浏览器功能无缝互动的沉浸式 3D 体验。将此功能与视图过渡(例如元素范围过渡,现已在 Chrome 147 中提供;以及双阶段过渡,目前正在测试中)相结合,即可创建分层界面运动并为中间状态添加动画效果,而不会阻塞网页互动。通过将复杂的互动转化为声明式 API,我们默认提供高保真性能。HTML-in-Canvas API 源试用现已推出。
7. 性能和界面方面的改进:SPA 的 Core Web Vitals 等
Chrome 正在启用新方法来提升现代类应用 Web 体验的性能。新更新包括即将发布的 Chrome 版本中提供的 Soft Navigations API,可将 Core Web Vitals 指标测量引入单页应用。我们还推出了新的声明性部分更新原语,可为平台带来原生无序 HTML 更新,并提供新的流式传输 API,以便更轻松地将 HTML 插入网页,而无需进行繁重的 DOM 操作。这些 API 现已可供测试。
8. 使用“立即”界面模式实现身份验证现代化
作为身份更新的一部分,即时界面模式将密码和通行密钥统一到一个由浏览器管理的登录流程中。当用户点击您网站上的“登录”时,Chrome 会自动显示可用的凭据,以便用户使用已保存的密码或通行密钥进行无缝身份验证。首先,请参阅即时界面模式实现指南。
9. 利用真实路况数据规划基准目标值
您无需再使用导出的 TSV 文件来整理数据!直接连接到更新后的 Google Analytics API,准确了解实际用户中有多少百分比支持现代功能。选择基准目标,放心地向用户发布最新功能,同时了解何时使用回退。
利用 Chrome 中的 Gemini 大幅提升浏览体验
现在,我们已在桌面版、iOS 版和 Android 版 Chrome 中推出 Chrome 中的 Gemini,为用户提供强大的全新方式来浏览、创作和处理事务。从使用自动浏览功能自动执行复杂的多步骤任务,到使用光标或语音进行直观的多模态互动,Chrome 中的 Gemini 可让用户轻松获得强大的生产力。
10. Android 版 Chrome 中的 Gemini:手机上的浏览助理。
我们将在 6 月推出 Android 版 Chrome 中的 Gemini,让它成为您的专属浏览助理,帮助您更好地理解网页内容。借助该功能,您无需切换应用,即可总结长篇文章、提出具体问题并获得详细说明。 除了回答问题之外,它还是一款多功能的效率提升工具,可与日历、Keep 和 Gmail 等 Google 应用关联,帮助您快速完成任务。借助 个性化智能服务,如果你选择关联 Gmail 和 Google 相册等应用,这个安全且能感知上下文的浏览助理甚至可以根据你的独特兴趣、爱好等提供量身定制的回答。
11. 使用自动浏览功能处理繁琐的任务
Android 版自动浏览功能已在桌面设备上推出,可自动执行数字杂务,让您充分利用 Chrome 中的 Gemini,专注于更重要的任务。借助自动浏览功能,您可以在 Android 手机上轻松完成各种任务,包括预约、派对策划、查找有货商品等。例如,如果您即将前往观看喜剧表演,但忘记预订停车位,自动浏览功能可为您提供帮助。只需问问 Chrome 中的 Gemini,它就会从您的门票中收集活动详情,为您找到停车位。
在桌面设备上,我们将在未来几个月内将自动浏览功能与 Gemini Spark 集成,以便您的全天候私人 AI 智能体能够代表您在浏览器中执行操作。
12. 随时随地使用 Nano Banana 转换图片
借助 Nano Banana,您可以在 Android 设备上浏览网页时即时创建或自定义图片。只需在学习时问问 Chrome 中的 Gemini“将此页面转换为信息丰富的图表”,或在浏览公寓时问问 Gemini“修改图片以包含现代客厅必需品”。
13. Chrome 中的技能:将出色的 AI 提示转化为一键式工具
借助 Chrome 中的技能,您可以在桌面版 Chrome 中的 Gemini 中保存并重复使用最实用的 AI 提示。只需保存一次多标签页工作流(例如在购物时并排比较规格,或扫描长文档以查找关键信息),即可随时通过单击一下按钮立即再次高效运转该工作流。
14. 在 Chrome 中选择屏幕内容来提示 Gemini
现在,您可以使用鼠标指针向 Chrome 中的 Gemini 询问您正在查看的网页的特定部分,而无需准确描述您的意图。例如,您可以在页面上选择两款商品,然后立即比较它们的主要功能。或者,如果您想使用 Nano Banana 编辑图片,可以选择要更改的确切图片部分
15. 在整个网络中使用语音
很快,您就可以在桌面版 Chrome 中使用语音在网站上输入内容了。借助语音功能,您可以更轻松、更自然地执行各种操作,例如撰写评论、填写表单中的长字段或撰写电子邮件。此功能将使用 Gemini 模型清理转写内容(去除“嗯”“啊”等语气词,并根据上下文进行调整,同时保留您的声音),或根据您的要求填充相应字段。
后续步骤
智能体网络正在我们眼前逐步成形。通过弥合强大的底层 AI 功能与日常 Web 开发之间的差距,我们正在消除历史上减缓和限制创新的摩擦。
我们正在从需要您完成所有繁重工作的网络转向主动为您服务的网络。无论您是想与基于浏览器的代理无缝集成,还是想突破网页的视觉极限,亦或是想简化自己的调试工作流程,我们都能为您提供相关工具,助您打造未来的网络。
如需查看完整指南和深入的技术分析,请访问 developer.chrome.com 和 web.dev。我们期待看到您利用这些新功能构建的精彩内容。快来分享您的项目,并务必关注我们的 X、LinkedIn 和 YouTube 账号。
期待在下一届 Google I/O 大会上与您相会!