15 Updates von der Google I/O 2026: Das agentenbasierte Web mit neuen Funktionen, Tools und Features in Chrome

Veröffentlicht: 19. Mai 2025

Agents verändern die Entwicklung überall und nirgendwo geschieht diese Transformation schneller als im Web. Sie definiert neu, was wir entwickeln, wie wir entwickeln und wer entwickelt. Mit dem Aufkommen des agentenbasierten Webs sehen wir eine Verschiebung, die die Lücke zwischen komplexen Entwickler-Workflows, zugrunde liegenden Plattformfunktionen und alltäglichen Nutzererfahrungen schließt.

Auf der Google I/O 2026 haben wir eine Vision für diese Ära vorgestellt. Diese Ideen verbinden drei Kernbereiche des Web-Ökosystems: KI-Agents stärken, damit sie mit neuen Funktionen Websites erstellen und mit ihnen interagieren können, die Grenzen von Web-UI und Leistung verschieben und den Browser in einen leistungsstarken, proaktiven Assistenten für alltägliche Nutzer mit Gemini in Chrome verwandeln. Durch die Integration effizienter, integrierter KI-Modelle direkt in den Browser und die Einführung leistungsstarker Automatisierungstools wie dem automatischen Browsen in Chrome machen wir die Nutzung des Internets für alle intelligenter, schneller und zugänglicher.

Hier sind die 15 wichtigsten Updates, die wir auf der Google I/O 2026 vorgestellt haben, um Ihnen bei der Entwicklung von und dem Erfolg in der agentischen Ära des Webbrowsens zu helfen.

KI-Agenten für das Web optimieren

Agenten verändern die Art und Weise, wie wir mit Software interagieren. Wir sind der Meinung, dass das Web darauf vorbereitet sein muss, sie zu unterstützen. Wir führen leistungsstarke neue Funktionen und Tools wie WebMCP und Modern Web Guidance ein, mit denen Sie moderne Weboberflächen schneller und einfacher erstellen können. Außerdem stellen wir Ihnen KI-gestützte Tools zur Verfügung, mit denen Sie Code schneller und genauer als je zuvor erstellen, debuggen und optimieren können.

1. WebMCP: Websites in Agent-Toolkits umwandeln

Wir geben Ihnen einen ersten Einblick in WebMCP, einen vorgeschlagenen offenen Webstandard, mit dem Sie strukturierte Tools wie JavaScript-Funktionen und HTML-Formulare für browserbasierte Agents verfügbar machen können. Wenn Sie diese Tools definieren, können Sie KI-Agenten genau anweisen, wie und wo sie mit Ihrer Website interagieren sollen. Das Ergebnis: Ein Agent kann jetzt maschinenfreundliche Funktionen aufrufen, um komplexe Aufgaben in Sekundenschnelle mit höherer Zuverlässigkeit, Präzision und Personalisierung zu erledigen. Stellen Sie sich vor, ein Nutzer plant eine Reise mit mehreren Städten. Anstatt einem Kundenservicemitarbeiter dabei zuzusehen, wie er Reiseformulare durchklickt, können sie ihn autorisieren, direkt Backend-APIs abzufragen, um sofort einen personalisierten, wetteroptimierten Reiseplan zu erstellen, den sie dann genehmigen können.

Der experimentelle Ursprungstest für WebMCP beginnt in Chrome 149. Gemini in Chrome wird bald WebMCP-APIs unterstützen. Globale Verbrauchermarken experimentieren bereits mit WebMCP, um ihren Nutzern ansprechendere und interessantere Erlebnisse zu bieten.

Logos von Expedia, Booking.com, Shopify, Credit Karma, TurboTax, Redfin, Etsy, Instacart und Target

2. Leitfaden für das moderne Web: Ein Blueprint, der Coding-Agents bei der Entwicklung für das moderne Web unterstützt

Modern Web Guidance ist jetzt in der Vorabversion verfügbar. Es handelt sich um eine Reihe von bewährten und von Experten geprüften Fähigkeiten, die Ihre Coding-Agents in vielen gängigen Anwendungsfällen unterstützen, um moderne Webanwendungen zu erstellen, die möglichst barrierefrei, leistungsstark und sicher sind. Sie ist direkt in Baseline integriert, sodass Sie sich auf das konzentrieren können, was Sie entwickeln möchten. Ihre Tools ermitteln automatisch die richtigen Funktionen und Fallbacks, die für Ihr ausgewähltes Baseline-Ziel verwendet werden sollen. Die Installation ist mit einem einzigen Klick in Google Antigravity, über npx oder als Erweiterung in einem Coding-Agent möglich. Die Modern Web Guidance-Funktionen unterstützen über 100 Anwendungsfälle für Dutzende der neuesten Funktionen. Sie werden regelmäßig aktualisiert.

3. Debugging mit Chrome-Entwicklertools für Agenten automatisieren

Mit Chrome-Entwicklertools für Agents können Sie Ihren Workflow skalieren. Sie bieten Echtzeit-Transparenz, um Code zu überprüfen, Fehler zu beheben und zu optimieren. Wenn Sie Agenten direkten Zugriff auf die Funktionen von Entwicklertools wie Konsolenprotokolle, Netzwerkverkehr und Barrierefreiheitsbäume gewähren, können sie Korrekturen ohne manuelle Aufsicht überprüfen und automatisieren. Chrome-Entwicklertools für Agents sind ab heute für Antigravity und mehr als 20 weitere Coding-Agents verfügbar.

Ein zusammengesetztes Bild, das die Leistungssteigerung zeigt.
LY Corporation hat Chrome-Entwicklertools für Agents verwendet, um ein automatisiertes KI-basiertes System zur Leistungsüberprüfung zu entwickeln. Dadurch konnte die manuelle Analyse um 96–98% reduziert werden und es sind On-Demand-Prüfberichte für jedes Team verfügbar.

4. Mit KI-basiertem Debugging in den Chrome-Entwicklertools detaillierte Informationen erhalten

Die KI-Unterstützung in den Chrome-Entwicklertools hat jetzt Zugriff auf Lighthouse-Daten und kann automatisch nach Kontext suchen, um offene Fragen zu beantworten, was bisher nicht möglich war. Außerdem bieten Widgets vollständige Transparenz über die Argumentation von Gemini, um Ihnen bei der Fehlerbehebung zu helfen.

KI-Unterstützung in den Chrome-Entwicklertools und interaktive Widgets reduzieren die Komplexität der Leistungsfehlersuche erheblich und ermöglichen gleichzeitig eine nahtlose Zusammenarbeit zwischen Mensch und KI.

5. Server, Budgets und Bürokratie umgehen: KI-Funktionen mit integrierter KI nutzen

Die integrierte KI wird vollständig im Browser ausgeführt und ermöglicht es Ihnen, personalisierte, proaktive Funktionen bereitzustellen, die auf dem Server zu kostspielig wären. Überspringen Sie die Abrechnung von Tokens und andere Hindernisse, um sich ganz auf den einzigartigen Nutzerwert zu konzentrieren. Das Beste daran: Der Browser verwaltet und teilt optimierte Modelle auf verschiedenen Websites, sodass mehr Nutzer KI-Funktionen im Web nutzen können.

Damit Sie diese reibungslosen KI-Verbesserungen entwickeln können, erweitern wir das Web-KI-Toolkit:

  • Prompt API ist stabil:Chrome 148 verwendet Gemini Nano mit multimodalen Eingaben und strukturierter Ausgabe für umfassende Funktionen, zuverlässiges JSON für nahtlose Integrationen und Zugriff auf erweiterte Sprachunterstützung.
  • Gemma 197M:Dieses hocheffiziente Expertenmodell kann auf transparente Weise aufgabenspezifische APIs wie Summarizer unterstützen und Ihre Funktionen automatisch auf ein breiteres Spektrum von Geräten skalieren.

Entdecken Sie die gesamte integrierte KI-Suite, einschließlich unserer vorhandenen Translator- und Language Detector-APIs, und nehmen Sie am Early Preview-Programm teil, um die kommenden APIs zu testen.

Trip.com: nutzt integrierte KI, um personalisierte Reiseübersichten lokal auf dem Gerät zu erstellen. So werden Server-Overhead vermieden und unbegrenzte Anfragen ohne Budgetbeschränkungen ermöglicht.

Grenzen der Web-UI und Leistung ausreizen

Wir entwickeln Plattformfunktionen der nächsten Generation, die die Grenzen zwischen Web- und nativen Apps weiter verschwimmen lassen. Neue deklarative APIs wie HTML-in-Canvas und Declarative Partial Updates übernehmen komplexe Rendering- und Leistungsaufgaben für Sie. So können Sie einfacher als je zuvor ansprechende, moderne, interaktive und leistungsstarke Webanwendungen mit hoher Wiedergabetreue erstellen.

6. HTML-in-Canvas und ans Element gebundene Ansichtsübergänge: Grenzen mit der Benutzeroberfläche der nächsten Generation überwinden

Die neue HTML-in-Canvas API und View-Übergänge mit Elementbereich ermöglichen bisher unmögliche Benutzeroberflächen, die eine hohe, app-ähnliche Interaktivität im Web bieten. Mit der HTML-in-Canvas API können Sie echte DOM-Elemente direkt in ein Canvas mit WebGL und WebGPU einbinden, um eine immersive 3D-Umgebung zu erstellen, die durchsuchbar, zugänglich und nativ übersetzbar ist und nahtlos mit den integrierten Browserfunktionen interagiert. In Kombination mit Ansichtsübergängen wie elementbezogenen Übergängen, die jetzt in Chrome 147 verfügbar sind, und zweiphasigen Übergängen, die sich derzeit in der Testphase befinden, können Sie mehrschichtige UI-Animationen erstellen und Zwischenzustände animieren, ohne die Interaktivität der Seite zu blockieren. Indem wir komplexe Interaktionen in deklarative APIs umwandeln, bieten wir standardmäßig eine hohe Leistung. Der Ursprungstest für die HTML-in-Canvas API ist jetzt verfügbar.

Mit der HTML-in-Canvas-API können Sie jetzt HTML-Elemente und CSS-Stile in hochauflösenden, mehrdimensionalen Umgebungen kombinieren, um neue kreative Layouts und Effekte zu erstellen.

 7. Leistungs- und UI-Verbesserungen: Core Web Vitals für SPAs und mehr

Chrome bietet neue Möglichkeiten, die Leistung moderner appähnlicher Weboberflächen zu verbessern. Zu den neuen Updates gehört die Soft Navigations API, die in einem demnächst erscheinenden Chrome-Release verfügbar sein wird, um die Core Web Vitals-Messung in Single-Page-Anwendungen zu ermöglichen. Außerdem führen wir neue Primitiven für deklarative partielle Updates ein, die native HTML-Updates in beliebiger Reihenfolge auf der Plattform ermöglichen. Außerdem gibt es neue Streaming-APIs, mit denen sich HTML einfacher in die Seite einfügen lässt, ohne dass das DOM stark manipuliert werden muss. Diese APIs sind jetzt zum Testen verfügbar.

8. Authentifizierung mit dem Immediate UI-Modus modernisieren

Im Rahmen unserer Identitätsupdates werden Passwörter und Passkeys im Sofort-UI-Modus in einem einzigen, vom Browser verwalteten Anmeldevorgang zusammengeführt. Wenn ein Nutzer auf Ihrer Website auf „Anmelden“ klickt, werden in Chrome automatisch die verfügbaren Anmeldedaten angezeigt. So ist eine nahtlose Authentifizierung mit gespeicherten Passwörtern oder Passkeys möglich. Leitfaden zur Implementierung des Immediate UI-Modus

9. Baseline-Zielvorhaben mit tatsächlichen Verkehrsdaten planen

Sie müssen Daten nicht mehr mit exportierten TSV-Dateien verschieben. Stellen Sie eine direkte Verbindung zur aktualisierten Google Analytics API her, um genau zu sehen, wie viel Prozent Ihrer tatsächlichen Nutzer moderne Funktionen unterstützen. Wählen Sie ein Baseline-Ziel aus und stellen Sie Ihren Nutzern die neuesten Funktionen zur Verfügung. Sie wissen dann auch, wann Sie Fallbacks verwenden müssen.


Gemini in Chrome macht das Browsen noch besser

Mit Gemini in Chrome auf dem Computer, unter iOS und jetzt auch unter Android bieten wir Nutzern leistungsstarke neue Möglichkeiten zum Surfen, Erstellen und Erledigen von Aufgaben. Von der Automatisierung komplexer, mehrstufiger Aufgaben mit dem automatischen Browsen bis hin zu intuitiven multimodalen Interaktionen mit dem Cursor oder per Sprache – Gemini in Chrome bietet Nutzern leistungsstarke Produktivitätsfunktionen.

10. Gemini in Chrome für Android: Ein Browser-Assistent auf Ihrem Smartphone.

Ab Juni ist Gemini in Chrome für Android als persönlicher Browser-Assistent verfügbar, der Ihnen hilft, Inhalte im Web besser zu verstehen. Sie können sich lange Artikel zusammenfassen lassen, bestimmte Fragen stellen und detaillierte Erklärungen erhalten, ohne die App wechseln zu müssen. Bard kann nicht nur Fragen beantworten, sondern auch als vielseitiges Produktivitätstool eingesetzt werden, das mit Google-Apps wie Kalender, Notizen und Gmail verbunden ist, damit Sie Aufgaben schnell erledigen können. Und mit Personal Intelligence kann dieser sichere, kontextbezogene Browsing-Assistent, wenn Sie Apps wie Gmail und Google Fotos verbinden, sogar maßgeschneiderte Antworten basierend auf Ihren individuellen Interessen, Hobbys und mehr liefern.

Gemini in Chrome fügt Rezeptzutaten zu Google Notizen hinzu.

11. Mit der Funktion „Automatisches Browsen“ mühsame Aufgaben erledigen

Das automatische Browsen für Android ist bereits auf Desktopcomputern verfügbar und ermöglicht es Ihnen, Gemini in Chrome optimal zu nutzen, indem Sie Ihre digitalen Aufgaben automatisieren und sich so auf wichtigere Aufgaben konzentrieren können. Mit dem automatischen Browsen können Sie ganz einfach Aufgaben erledigen, von der Terminbuchung über die Partyplanung bis hin zum Finden von Artikeln, die auf Lager sind – alles auf Ihrem Android-Smartphone. Wenn Sie beispielsweise zu einer Comedy-Show aufbrechen, aber vergessen haben, einen Parkplatz zu reservieren, kann das automatische Browsen Ihnen helfen. Fragen Sie einfach Gemini in Chrome, und das Tool sucht anhand der Ticketdetails einen Platz für Sie.

In den kommenden Monaten werden wir Automatisches Browsen mit Gemini Spark auf dem Computer integrieren, damit Ihr persönlicher KI-Agent, der rund um die Uhr verfügbar ist, in Ihrem Namen Aktionen im Browser ausführen kann.

Automatisches Browsen findet einen Parkplatz.

12. Bilder unterwegs mit Nano Banana transformieren

Mit Nano Banana können Sie beim Surfen im Web auf Ihrem Android-Gerät im Handumdrehen Bilder erstellen oder anpassen. Bitten Sie Gemini in Chrome einfach, „diese Seite in eine informative Infografik umzuwandeln“, wenn Sie lernen, oder „das Bild so zu bearbeiten, dass es moderne Wohnzimmer-Essentials enthält“, wenn Sie nach Wohnungen suchen.

Nano Banana generiert eine Infografik auf Grundlage eines Blogposts.

13. Skills in Chrome: Die besten KI-Prompts in One-Click-Tools umwandeln

Mit Skills in Chrome können Sie Ihre hilfreichsten KI-Prompts in Gemini in Chrome auf dem Desktop speichern und wiederverwenden. Speichern Sie einen Workflow mit mehreren Tabs einmal, z. B. um beim Einkaufen nebeneinanderliegende Spezifikationsvergleiche zu erstellen oder lange Dokumente nach wichtigen Informationen zu durchsuchen, und führen Sie ihn jederzeit mit einem einzigen Klick aus.

Skills in Chrome, die dabei helfen, den Proteingehalt eines Rezepts zu maximieren.

14. Gemini in Chrome über die Auswahl auf dem Bildschirm auffordern

Sie können jetzt mit dem Mauszeiger Gemini in Chrome nach bestimmten Teilen der angezeigten Webseite fragen. So müssen Sie nicht genau beschreiben, was Sie meinen. So können Sie beispielsweise zwei Produkte auf einer Seite auswählen und sofort ihre wichtigsten Funktionen vergleichen. Wenn Sie ein Bild mit Nano Banana bearbeiten möchten, können Sie genau den Teil des Bilds auswählen, den Sie ändern möchten.

Image
Bilder auf einer Seite mit dem Mauszeiger vergleichen

15. Sprachbefehle im Web verwenden

Bald können Sie in Chrome auf dem Computer per Spracheingabe Text auf Websites eingeben. Mit Sprache wird es einfacher und natürlicher, Dinge wie das Verfassen von Kommentaren, das Ausfüllen langer Formularfelder oder das Schreiben von E-Mails zu erledigen. Dabei werden Gemini-Modelle verwendet, um das Transkript zu bereinigen, also Füllwörter wie „äh“ und „hm“ zu entfernen und es an den Kontext anzupassen, ohne dabei Ihre Stimme zu verändern. Alternativ kann das Feld auch wie gewünscht ausgefüllt werden.

Text im Web per Spracheingabe eingeben und von Gemini-Modellen bearbeiten lassen

Nächste Schritte

Der Übergang zum agentischen Web findet direkt vor unseren Augen statt. Wir schließen die Lücke zwischen leistungsstarken zugrunde liegenden KI-Funktionen und der alltäglichen Webentwicklung und beseitigen so die Reibung, die Innovationen in der Vergangenheit verlangsamt und eingeschränkt hat.

Wir bewegen uns weg von einem Web, in dem Sie die ganze Arbeit erledigen müssen, hin zu einem Web, das proaktiv für Sie arbeitet. Ganz gleich, ob Sie browserbasierte Agents nahtlos einbinden, die visuellen Grenzen einer Webseite ausreizen oder einfach nur Ihren eigenen Debugging-Workflow optimieren möchten – wir bieten Ihnen die Tools, mit denen Sie die Zukunft des Webs gestalten können.

Auf developer.chrome.com und web.dev finden Sie ausführliche Anleitungen und technische Informationen. Wir sind gespannt, was Sie mit diesen neuen Funktionen entwickeln. Teilen Sie also Ihre Projekte und folgen Sie uns auf X, LinkedIn und YouTube.

Wir sehen uns auf der nächsten Google I/O!