Kun je AI-evaluaties maken?

  1. Waarom is intuïtie een onvoldoende maatstaf voor de kwaliteit van LLM-gebaseerde sollicitaties?

  2. Welke van de volgende opties is een voorbeeld van een op regels gebaseerde evaluatie voor de ThemeBuilder-applicatie?

  3. Wat is het voornaamste doel van paarsgewijze evaluatie in plaats van puntsgewijze evaluatie?

  4. Waarom zou je de temperatuur op 0 zetten bij het configureren van een rechtermodel?

  5. Wat betekent overfitting in je evaluatieproces?

  6. Waarvoor wordt de bootstrapping-techniek gebruikt?

  7. Welke maatstaf wordt gebruikt om 'overeenstemming die verder gaat dan toeval' te meten tussen menselijke deskundigen of tussen een rechter en een mens?

  8. Waarom wordt bij het beoordelen van toxiciteit de nadruk gelegd op terugroepingsinformatie in plaats van op precisie?

  9. Wat is het dynamische beoordelingsschema?