Etikett: mechanistic interpretability

  • I huvudet på Claude 3

    Att förstå hur AI-modeller kommer fram till olika beslut är en viktig del i att skapa AI som vi kan lita på – och därmed dra nytta av på riktigt. I slutet av maj presenterade Anthropic, ett av de ledande AI-bolagen, forskning som visar delar av hur en stor språkmodell fungerar inuti. Ingen kan förutsäga…