Najważniejsze informacje z warsztatów „AI w praktyce”

Damani Brown
Damani Brown
Melissa Mitchell
Melissa Mitchell
Mari Viana
Mari Viana

Opublikowano: 14 października 2025 r.

We współpracy z grupą startupów z Nowego Jorku zorganizowaliśmy warsztaty techniczne „AI in Action” (AI w działaniu). Cel był prosty: pokazać, jak sztuczną inteligencję po stronie klienta i wbudowane interfejsy API AI można bezpośrednio zintegrować z produktami, aby zwiększyć szybkość, prywatność i poprawić wrażenia użytkowników.

Łącznie gościliśmy 24 deweloperów z 8 innowacyjnych startupów. Podczas sesji porannej eksperci ds. usług i inżynierii wygłosili prezentacje na temat ogromnego potencjału modeli open source i modeli na urządzeniu oraz strategicznego znaczenia wprowadzenia AI bezpośrednio na platformę internetową. Specjaliści techniczni udzielili następnie praktycznych wskazówek dotyczących rozpoczęcia pracy z wbudowanymi interfejsami API AI.

Uczestnicy uznali to wydarzenie za bardzo wartościowe, ponieważ okazało się, że korzystanie z tych interfejsów API jest łatwe niezależnie od posiadanej wiedzy na temat uczenia maszynowego. Dzięki eksperymentom odkryli też nowe zastosowania swoich aplikacji. Z radością potwierdziliśmy, że nasza dokumentacja jest zgodna z wymaganiami. Jedna z grup pomogła nam nawet zidentyfikować i odtworzyć złożony błąd, dzięki czemu mogliśmy przesłać poprawkę.

Uczestnicy opracowali 10 prototypów z wykorzystaniem AI po stronie klienta. Przyjrzyj się niektórym z ich projektów i dowiedz się, jakie wrażenia wywarło na nich to wydarzenie.

Wykrywanie zdarzeń przez adapter za pomocą interfejsu Prompt API

Celem Adaptera jest stworzenie „centrum dowodzenia naszym codziennym życiem, które pozwoli nam maksymalnie wykorzystać czas wolny, a nie czas spędzany przed ekranem”. Stworzyli rozszerzenie z modelem koncepcyjnym, które miało 2 funkcje:

  • Inteligentne i dopasowane wykrywanie wydarzeń, które identyfikuje wydarzenia na stronie internetowej podczas przeglądania (koncerty, restauracje, wydarzenia), a następnie dostosowuje je do kontekstu osobistego, w tym dostępności w kalendarzu osobistym, preferencji życiowych i sygnałów społecznościowych w czasie rzeczywistym. Wszystkie te dane są przetwarzane lokalnie.
  • przekształcanie treści w czasie rzeczywistym, które personalizuje kolejność treści na stronie internetowej zgodnie z Twoimi zainteresowaniami na żądanie;

Adapter używał interfejsu Prompt API do analizowania, wnioskowania i wywoływania narzędzi oraz interfejsu Writer API do lokalnego generowania tekstu.

„Przeprowadzamy złożone rozumowanie i wieloetapowe procesy na urządzeniu, przy czym kompromisy w zakresie prywatności są ograniczone. Umożliwia to korzystanie z aplikacji wykorzystujących inteligencję osobistą, które byłyby niepraktyczne, gdyby każde wnioskowanie wymagało przesyłania danych przez sieci, a jednocześnie zwiększa możliwości obliczeń zdalnych”. – Dillon Ponzo, inżynier założyciel Adaptera

Wbudowane interfejsy AI API w Chrome umożliwiają korzystanie z lekkich modeli, które przetwarzają dane lokalnie, domyślnie chroniąc prywatność. Założyciele Adaptera, Aidan Crank i Dillon Ponzo, uznali to za potwierdzenie swojej filozofii architektonicznej.

„Większość rozszerzeń AI przechwytuje kontekst i wysyła go gdzie indziej” – wyjaśnia Crank, który przed dołączeniem do Adaptera pracował w AWS nad inżynierią uczenia maszynowego na dużą skalę. „Wbudowana AI w Chrome odwraca ten model. Twoje dane osobowe pozostają na urządzeniu, ale możesz korzystać z inteligentnych funkcji, które wcześniej były niedostępne”.

Współzałożyciel firmy Adapter, Adam Ghetti, którego poprzednia firma Ionic Security była pionierem autonomicznego zabezpieczania danych na dużą skalę, dostrzega głębsze implikacje: „Prywatność nie jest funkcją, którą się dodaje, ale architekturą, którą się wybiera. Wbudowana w Chrome AI sprawia, że ta architektura jest praktyczna”.

Wraz z rozwojem tych możliwości w Chrome dzięki obsłudze wielu trybów i bogatszym interfejsom API urządzenia brzegowe nie tylko doganiają chmurę. W przypadku osobistej i prywatnej AI chodzi o przewyższenie jej tam, gdzie ma to sens.

Podwarstwa kategoryzuje obrazy za pomocą interfejsu Prompt API, aby ulepszać warianty

Sublayer stworzył zabawną aplikację o nazwie Photoslider, która ma zrewolucjonizować sposób interakcji z obrazami i generowania ich wariantów.

Aby użyć PhotoSlider, użytkownik przesyła zdjęcie lub robi nowe i klika Analizuj. Interfejs Prompt API wysyła te obrazy do modelu w celu analizy, prosząc go o zidentyfikowanie 3 kluczowych atrybutów i przypisanie im wartości od 1 do 10. Atrybut może mieć na przykład wartość „tradycyjny” lub „jasność”.

Po stronie klienta użytkownik widzi obraz i suwaki do dostosowywania wartości lub wprowadzania nowych atrybutów z wartościami niestandardowymi. Prośby o zmiany i obraz są wysyłane do AI po stronie serwera, dzięki czemu większy model z możliwościami wyjściowymi w wielu formatach może wygenerować zupełnie nowy obraz na podstawie zmienionych specyfikacji. Ten iteracyjny proces można powtarzać w nieskończoność, co daje pełną kontrolę, dopóki nie uzyskasz idealnego obrazu.

Scott Werner, dyrektor generalny Sublayer, wyraził swój entuzjazm: „Naprawdę interesuje nas, jak wygląda wnioskowanie lokalne. Dostępność tej funkcji w przeglądarce na urządzeniach użytkowników jest domyślnie o wiele łatwiejsza niż poleganie na tym, że użytkownicy poradzą sobie ze złożonym procesem instalowania modeli bezpośrednio”.

Echo3D przetwarza modele 3D na bogate dane, które można przeszukiwać.

Echo3D udostępnia platformę i interfejs API, które umożliwiają firmom bezproblemowe przechowywanie, zabezpieczanie i udostępnianie modeli i skanów 3D różnym zespołom i organizacjom. Zaawansowane potoki 3D i tekstowe skutecznie przetwarzają modele 3D w bogate dane, które można przeszukiwać.

Podczas tego wydarzenia firma echo3D opracowała narzędzia do konwersji 3D na tekst i z tekstu na 3D, które zwiększają wizualne zrozumienie komponentów. Użyli interfejsu Prompt API do zautomatyzowania tagowania modeli, wykrywania duplikatów oraz usprawnienia katalogowania i dokumentowania obszernych bibliotek 3D.

{
  "description": "A 3D model of a large, tan-colored sandcastle with one main
    tower, four small towers, and staircases wrapping around. The towers
    have multiple windows. There is a main gate.",
  "tags": ["sand","castle","gate","tan","tower","staircase"]
}

Dzięki temu każdy zasób ma bogaty, spójny i umożliwiający wyszukiwanie opis, co sprawia, że cała biblioteka użytkownika jest bardziej uporządkowana i dostępna. Dodatkowo oszczędza miejsce na dysku i zapobiega konfliktom wersji spowodowanym przez zbędne pliki.

„Nasz zespół bardzo docenił to wydarzenie. Szczególnie duże wrażenie zrobiła na nas łatwość, z jaką funkcje AI można zintegrować z aplikacjami internetowymi za pomocą wbudowanej AI. Możliwość prototypowania i wdrażania bezpiecznych funkcji AI po stronie klienta w tak krótkim czasie była znaczącą zaletą”. – Alon Grinshpoon, prezes echo3D

Spot2 utworzył uporządkowane metadane z przesłanych obrazów

Aplikacja Spot2 zawiera listę nieruchomości na wynajem w Meksyku. Często w przypadku takich usług w informacjach brakuje kluczowych metadanych i innych cennych informacji. Szczegóły są bardzo zróżnicowane w zależności od dbałości dostawcy o szczegóły. Spot2 spędził dzień na poprawianiu jakości danych za pomocą interfejsu Prompt API.

Zespół opracował funkcję, która automatycznie przetwarza i organizuje strukturę metadanych informacji. Ten proces rozpoczyna się w momencie przesłania zdjęcia, co pomaga zachować kompletność i spójność. Dzięki wykonywaniu tego zadania po stronie klienta zamiast po stronie serwera funkcja jest opłacalna.

Jeśli ta funkcja zostanie wprowadzona, będzie miała podwójny wpływ: znaczną poprawę jakości danych i wyraźne obniżenie kosztów operacyjnych. „Spodziewamy się, że wyższa jakość informacji o produktach przełoży się też na wyższy współczynnik konwersji”.

Dołącz do nas następnym razem