AI-Veiligheid

Het onderzoeks- en praktijkgebied dat ervoor zorgt dat AI-systemen veilig, betrouwbaar en onderhevig aan menselijke controle zijn.

Uitleg

AI-veiligheid omvat maatregelen om risico's van AI-systemen te minimaliseren, inclusief onbedoelde gevolgen en mogelijk gevaarlijk gedrag. Dit omvat technische veiligheid (robusteness), operationele veiligheid en langetermijnrisico's.

Areas omvatten: adversarische robuustheid, verifiabiliteit, interpretabiliteit en voorbereiding op meer geavanceerde toekomstige AI-systemen.

Voorbeelden

  • Testen op AI-robusttheid tegen adversarische aanvallen
  • Systemen ontwerpen met kill-switches voor noodsituaties
  • Onderzoek naar waarschuwingssystemen voor gevaarlijke AI-gedrag

Trefwoorden

risicorobuustheidcontrolevoorbereidingethiek

Over deze term

Wat is AI-Veiligheid?

Het onderzoeks- en praktijkgebied dat ervoor zorgt dat AI-systemen veilig, betrouwbaar en onderhevig aan menselijke controle zijn.