Définitions et explications des modèles, benchmarks, plateformes, applications et notions clés de l’intelligence artificielle.
Note : sauf mention contraire, les sources citées sont en anglais.
**A · B · C · D · E · F · G · H · I · J · K · L · M · N · O · P · Q · R · S · T · U · V · W · X · Y · Z**
Benchmark basé sur des problèmes mathématiques de haut niveau issus du concours mathématique américain AIME, utilisé pour tester les capacités de raisonnement numérique avancé des modèles d'IA.
Lien : Wikipédia
Correspondance entre les réponses du modèle et les attentes humaines en termes d'utilité, de sécurité et d'intention. L'alignement est un enjeu majeur pour s'assurer que les systèmes d'IA agissent conformément aux valeurs humaines.
Lien : Anthropic Research
Interface de programmation permettant d'accéder aux modèles Claude (Haiku, Sonnet, Opus) via des applications tierces, offrant des capacités de génération de texte sécurisées et alignées.
Lien : Documentation officielle
Benchmark comprenant 7 787 questions à choix multiples de niveau scolaire, testant le raisonnement scientifique élémentaire. Divisé en ARC-Easy (questions simples) et ARC-Challenge (questions complexes). GPT-4 atteint actuellement 96,4% en few-shot sur ce benchmark.
Lien : Site officiel | Wikipédia