Le Glossaire AiTestLabs

Mieux comprendre l’intelligence artificielle

Définitions et explications des modèles, benchmarks, plateformes, applications et notions clés de l’intelligence artificielle.

Note : sauf mention contraire, les sources citées sont en anglais.

**A · B · C · D · E · F · G · H · I · J · K · L · M · N · O · P · Q · R · S · T · U · V · W · X · Y · Z**

A

AIME (American Invitational Mathematics Examination)

Benchmark basé sur des problèmes mathématiques de haut niveau issus du concours mathématique américain AIME, utilisé pour tester les capacités de raisonnement numérique avancé des modèles d'IA.

Lien : Wikipédia

Alignement

Correspondance entre les réponses du modèle et les attentes humaines en termes d'utilité, de sécurité et d'intention. L'alignement est un enjeu majeur pour s'assurer que les systèmes d'IA agissent conformément aux valeurs humaines.

Lien : Anthropic Research

Anthropic API

Interface de programmation permettant d'accéder aux modèles Claude (Haiku, Sonnet, Opus) via des applications tierces, offrant des capacités de génération de texte sécurisées et alignées.

Lien : Documentation officielle

ARC (AI2 Reasoning Challenge)

Benchmark comprenant 7 787 questions à choix multiples de niveau scolaire, testant le raisonnement scientifique élémentaire. Divisé en ARC-Easy (questions simples) et ARC-Challenge (questions complexes). GPT-4 atteint actuellement 96,4% en few-shot sur ce benchmark.

Lien : Site officiel | Wikipédia