Etikett: mechanistic interpretability
-
I huvudet på Claude 3
Att förstå hur AI-modeller kommer fram till olika beslut är en viktig del i att skapa AI som vi kan lita på – och därmed dra nytta av på riktigt. I slutet av maj presenterade Anthropic, ett av de ledande AI-bolagen, forskning som visar delar av hur en stor språkmodell fungerar inuti. Ingen kan förutsäga…