Wat is kunstmatige intelligentie?

Alexandra Klepper
Alexandra Klepper

Kunstmatige intelligentie (AI) omvat veel complexe, opkomende technologieën die voorheen menselijke input vereisten en nu door een computer kunnen worden uitgevoerd. In brede zin is AI een niet-menselijk programma of model dat een breed scala aan probleemoplossende vaardigheden en creativiteit demonstreert.

De afkorting AI wordt vaak door elkaar gebruikt om verschillende soorten technologieën binnen het vakgebied van kunstmatige intelligentie aan te duiden, maar deze kunnen sterk uiteenlopen in reikwijdte.

Er zijn diverse termen en concepten die kunstmatige intelligentie en machine learning definiëren en die wellicht nuttig voor u kunnen zijn. Hier vindt u termen die veelvuldig voorkomen in de Chrome-documentatie, met name met betrekking tot client-side AI.

Client-side AI

Hoewel de meeste AI-functies op het web afhankelijk zijn van servers, draait client-side AI in de browser van de gebruiker en voert de berekeningen uit op het apparaat van de gebruiker. Dit biedt tal van voordelen , waaronder een lagere latentie, lagere kosten voor het ontwikkelen van functies, meer privacy voor de gebruiker en offline toegang.

Client-side AI maakt gebruik van kleinere, geoptimaliseerde modellen die zijn geoptimaliseerd voor prestaties . Het is mogelijk dat dergelijke modellen voor specifieke taken betere prestaties leveren dan grotere server-side modellen. Analyseer uw specifieke toepassing om te bepalen welke oplossing het beste bij u past.

Ingebouwde AI

Met ingebouwde AI maakt uw website via browser-API's verbinding met de lokale processor. Het ingebouwde browsermodel stuurt een reactie, die de API vervolgens terugstuurt naar uw website.

Ingebouwde AI is een vorm van client-side AI, waarbij de kleinere modellen in de browser zijn ingebouwd. Voor Chrome omvat dit bijvoorbeeld Gemini Nano en expertmodellen. Zodra deze modellen zijn gedownload, kunnen alle websites en webapplicaties die gebruikmaken van ingebouwde AI de downloadtijd overslaan en direct overgaan tot het uitvoeren van functionaliteiten en lokale inferentie.

De ingebouwde AI-API's zijn ontworpen om inferentie uit te voeren met het juiste type model voor de betreffende taak. De Prompt API voert bijvoorbeeld inferentie uit met een taalmodel, terwijl de Translator API inferentie uitvoert met een ingebouwd expertmodel.

Server-side AI

Server-side AI omvat cloudgebaseerde AI-services. Denk bijvoorbeeld aan Gemini 1.5 Pro dat in de cloud draait. Deze modellen zijn doorgaans veel groter en krachtiger. Dit geldt met name voor grote taalmodellen .

Hybride AI

Hybride AI verwijst naar elke oplossing die zowel een client- als een servercomponent bevat. Bijvoorbeeld:

  • Client-side modellen met een fallback naar server-side modellen, ontworpen voor taken die niet effectief op het apparaat kunnen worden uitgevoerd.
    • Het apparaat beschikt mogelijk niet over voldoende resources.
    • Het model of de API is alleen beschikbaar in bepaalde omgevingen.
  • Een model dat voor de veiligheid is opgesplitst tussen client en server.
    • Je zou bijvoorbeeld een model kunnen opsplitsen, zodat 75% van de uitvoering aan de clientzijde plaatsvindt en de resterende 25% op een server. Dit biedt voordelen aan de clientzijde , terwijl een deel van het model zich buiten het apparaat bevindt en dus privé blijft.

Als je de Prompt API gebruikt, kun je een hybride architectuur opzetten met Firebase AI Logic .

Generatieve AI

Generatieve AI is een vorm van machinaal leren waarmee gebruikers content kunnen creëren die vertrouwd aanvoelt en lijkt op menselijke creaties. Generatieve AI gebruikt taalmodellen om data te ordenen en tekst, afbeeldingen, video en audio te creëren of aan te passen op basis van de aangeleverde context. Generatieve AI gaat verder dan patroonherkenning en voorspellingen.

Een groot taalmodel (LLM) heeft talloze (tot wel miljarden) parameters die je kunt gebruiken om een ​​breed scala aan taken uit te voeren, zoals het genereren, classificeren of samenvatten van tekst of afbeeldingen.

Een klein taalmodel (SLM) heeft aanzienlijk minder parameters om vergelijkbare taken uit te voeren en kan aan de clientzijde worden gebruikt.

Natuurlijke taalverwerking (NLP)

Natuurlijke taalverwerking is een onderdeel van machine learning dat zich richt op het helpen van computers bij het begrijpen van menselijke taal, van de regels van een bepaalde taal tot de eigenaardigheden, dialecten en slang die door individuen worden gebruikt.

Agent of AI-agent

Een agent is software die autonoom een ​​reeks acties plant en uitvoert om een ​​taak namens een gebruiker te voltooien, terwijl deze zich aanpast aan veranderingen in de omgeving. Acties kunnen bestaan ​​uit API-functies of databasequery's, uitgevoerd op een webpagina of via een applicatie van derden, zoals Project Mariner .

Een chatbot is niet per se een agent. Terwijl een chatbot reageert op een boodschapper (menselijk of anderszins) en gebruikmaakt van een model om content te genereren, zoals antwoorden op vragen, interacteert een agent met tools of een database om een ​​taak te voltooien.

Invoer en uitvoer

De invoer en uitvoer van een model kunnen verschillende modaliteiten hebben, waaronder tekst, afbeeldingen, audio en video. Een model kan slechts één modaliteit accepteren of meerdere ( multimodale modellen ). Het is belangrijk om te bepalen welke modaliteiten u nodig hebt voordat u een model kiest.

Invoer en uitvoer kunnen in streamingblokken of op aanvraag worden verzonden en ontvangen.

Streaming

Streaming verdeelt de bron die je verzendt of ontvangt in kleinere stukken, waardoor de resultaten in realtime beschikbaar zijn. De output past zich continu aan naarmate er input wordt toegevoegd en aangepast.

Dit is een veelgebruikte techniek in browsers voor het ontvangen van mediabestanden, zoals het bufferen van video's of het gedeeltelijk laden van afbeeldingen.

Op verzoek gebaseerde uitvoer

Bij uitvoer op basis van een verzoek (of "niet-streaming") wacht het model tot de volledige invoer is gegenereerd, verwerkt deze invoer in zijn geheel en produceert vervolgens de uitvoer.

In een chatvenster bijvoorbeeld, wacht het model niet met het genereren van een reactie terwijl de gebruiker typt, maar wacht het tot de gebruiker op een verzendknop klikt. Zodra het bericht is verzonden, houdt het model rekening met alle invoer en geeft het vervolgens een reactie.

Aanvullende bronnen

Als je nog niet bekend bent met AI op het web, bekijk dan onze verzameling AI-bronnen van web.dev .

,

Alexandra Klepper
Alexandra Klepper

Kunstmatige intelligentie (AI) omvat veel complexe, opkomende technologieën die voorheen menselijke input vereisten en nu door een computer kunnen worden uitgevoerd. In brede zin is AI een niet-menselijk programma of model dat een breed scala aan probleemoplossende vaardigheden en creativiteit demonstreert.

De afkorting AI wordt vaak door elkaar gebruikt om verschillende soorten technologieën binnen het vakgebied van kunstmatige intelligentie aan te duiden, maar deze kunnen sterk uiteenlopen in reikwijdte.

Er zijn diverse termen en concepten die kunstmatige intelligentie en machine learning definiëren en die wellicht nuttig voor u kunnen zijn. Hier vindt u termen die veelvuldig voorkomen in de Chrome-documentatie, met name met betrekking tot client-side AI.

Client-side AI

Hoewel de meeste AI-functies op het web afhankelijk zijn van servers, draait client-side AI in de browser van de gebruiker en voert de berekeningen uit op het apparaat van de gebruiker. Dit biedt tal van voordelen , waaronder een lagere latentie, lagere kosten voor het ontwikkelen van functies, meer privacy voor de gebruiker en offline toegang.

Client-side AI maakt gebruik van kleinere, geoptimaliseerde modellen die zijn geoptimaliseerd voor prestaties . Het is mogelijk dat dergelijke modellen voor specifieke taken betere prestaties leveren dan grotere server-side modellen. Analyseer uw specifieke toepassing om te bepalen welke oplossing het beste bij u past.

Ingebouwde AI

Met ingebouwde AI maakt uw website via browser-API's verbinding met de lokale processor. Het ingebouwde browsermodel stuurt een reactie, die de API vervolgens terugstuurt naar uw website.

Ingebouwde AI is een vorm van client-side AI, waarbij de kleinere modellen in de browser zijn ingebouwd. Voor Chrome omvat dit bijvoorbeeld Gemini Nano en expertmodellen. Zodra deze modellen zijn gedownload, kunnen alle websites en webapplicaties die gebruikmaken van ingebouwde AI de downloadtijd overslaan en direct overgaan tot het uitvoeren van functionaliteiten en lokale inferentie.

De ingebouwde AI-API's zijn ontworpen om inferentie uit te voeren met het juiste type model voor de betreffende taak. De Prompt API voert bijvoorbeeld inferentie uit met een taalmodel, terwijl de Translator API inferentie uitvoert met een ingebouwd expertmodel.

Server-side AI

Server-side AI omvat cloudgebaseerde AI-services. Denk bijvoorbeeld aan Gemini 1.5 Pro dat in de cloud draait. Deze modellen zijn doorgaans veel groter en krachtiger. Dit geldt met name voor grote taalmodellen .

Hybride AI

Hybride AI verwijst naar elke oplossing die zowel een client- als een servercomponent bevat. Bijvoorbeeld:

  • Client-side modellen met een fallback naar server-side modellen, ontworpen voor taken die niet effectief op het apparaat kunnen worden uitgevoerd.
    • Het apparaat beschikt mogelijk niet over voldoende resources.
    • Het model of de API is alleen beschikbaar in bepaalde omgevingen.
  • Een model dat voor de veiligheid is opgesplitst tussen client en server.
    • Je zou bijvoorbeeld een model kunnen opsplitsen, zodat 75% van de uitvoering aan de clientzijde plaatsvindt en de resterende 25% op een server. Dit biedt voordelen aan de clientzijde , terwijl een deel van het model zich buiten het apparaat bevindt en dus privé blijft.

Als je de Prompt API gebruikt, kun je een hybride architectuur opzetten met Firebase AI Logic .

Generatieve AI

Generatieve AI is een vorm van machinaal leren waarmee gebruikers content kunnen creëren die vertrouwd aanvoelt en lijkt op menselijke creaties. Generatieve AI gebruikt taalmodellen om data te ordenen en tekst, afbeeldingen, video en audio te creëren of aan te passen op basis van de aangeleverde context. Generatieve AI gaat verder dan patroonherkenning en voorspellingen.

Een groot taalmodel (LLM) heeft talloze (tot wel miljarden) parameters die je kunt gebruiken om een ​​breed scala aan taken uit te voeren, zoals het genereren, classificeren of samenvatten van tekst of afbeeldingen.

Een klein taalmodel (SLM) heeft aanzienlijk minder parameters om vergelijkbare taken uit te voeren en kan aan de clientzijde worden gebruikt.

Natuurlijke taalverwerking (NLP)

Natuurlijke taalverwerking is een onderdeel van machine learning dat zich richt op het helpen van computers bij het begrijpen van menselijke taal, van de regels van een bepaalde taal tot de eigenaardigheden, dialecten en slang die door individuen worden gebruikt.

Agent of AI-agent

Een agent is software die autonoom een ​​reeks acties plant en uitvoert om een ​​taak namens een gebruiker te voltooien, terwijl deze zich aanpast aan veranderingen in de omgeving. Acties kunnen bestaan ​​uit API-functies of databasequery's, uitgevoerd op een webpagina of via een applicatie van derden, zoals Project Mariner .

Een chatbot is niet per se een agent. Terwijl een chatbot reageert op een boodschapper (menselijk of anderszins) en gebruikmaakt van een model om content te genereren, zoals antwoorden op vragen, interacteert een agent met tools of een database om een ​​taak te voltooien.

Invoer en uitvoer

De invoer en uitvoer van een model kunnen verschillende modaliteiten hebben, waaronder tekst, afbeeldingen, audio en video. Een model kan slechts één modaliteit accepteren of meerdere ( multimodale modellen ). Het is belangrijk om te bepalen welke modaliteiten u nodig hebt voordat u een model kiest.

Invoer en uitvoer kunnen in streamingblokken of op aanvraag worden verzonden en ontvangen.

Streaming

Streaming verdeelt de bron die je verzendt of ontvangt in kleinere stukken, waardoor de resultaten in realtime beschikbaar zijn. De output past zich continu aan naarmate er input wordt toegevoegd en aangepast.

Dit is een veelgebruikte techniek in browsers voor het ontvangen van mediabestanden, zoals het bufferen van video's of het gedeeltelijk laden van afbeeldingen.

Op verzoek gebaseerde uitvoer

Bij uitvoer op basis van een verzoek (of "niet-streaming") wacht het model tot de volledige invoer is gegenereerd, verwerkt deze invoer in zijn geheel en produceert vervolgens de uitvoer.

In een chatvenster bijvoorbeeld, wacht het model niet met het genereren van een reactie terwijl de gebruiker typt, maar wacht het tot de gebruiker op een verzendknop klikt. Zodra het bericht is verzonden, houdt het model rekening met alle invoer en geeft het vervolgens een reactie.

Aanvullende bronnen

Als je nog niet bekend bent met AI op het web, bekijk dan onze verzameling AI-bronnen van web.dev .