LLMはどう知識を記憶しているか | Chapter 7, 深層学習
この動画で学べること
事実の居場所はどこ?
既存研究の知見を踏まえ、LLMの“事実”は主にMLPブロック側にエンコードされている、という高レベル結論を紹介。3Blue1Brown「方向としての知識」直感
例として「Michael Jordan はバスケットボール選手」のような事実を特徴方向として表し、入力表現→注意→MLP→出力ロジットの流れで、その方向がどのように活性化・増幅されて次語確率に反映されるかを図解。スーパーポジション(多義性)
1つのニューロン/方向が複数の概念を兼ねるスーパーポジションの現象と、その背景にある高次元空間の都合、関連するAnthropicの解説ポストへの導線。高次元幾何の一幕
直感補助としてJohnson–Lindenstraussの補題に触れ、情報をほぼ保ったまま次元削減できるという“高次元は気持ちいい”感覚を獲得。Zenn未解明と現在地
完全な機構解明は道半ばだが、MLPに事実が宿るという骨子と、その周辺の部分的理解が整理される。3Blue1Brown
前へ
OpenAI gpt-oss評価で発覚した驚愕の逆スケーリング現象とは?(2508.12461)【論文解説シリーズ】
次へ