On a Thread of the Web: LLM-Wiki

2026年5月23日土曜日

LLM-Wiki

図：LLM-Wikiのぱっとしないイメージ（ChatGPTによる）

シンギュラリティ・サロンで，保田さんが，アンドレイ・カーパシーのLLM-Wikiの記事を紹介していた。さっそく，Claudeに話を聞いてみた。Geminiはあんまりよくわかっていなかった。ChatGPTは分かりすぎていて，自分の現在のFisica Wikiをめぐる作業に密接しながらたいへん詳しく説明してくれたので，逆に紹介しにくい。

Ｑ（koshix）：
LLM-Wikiとは何ですか。

Ａ（Claude）：
LLM-Wikiとは、Andrej Karpathy（OpenAI共同創業者、元Tesla AI責任者）が2026年4月頃に提唱した、個人知識ベース構築のための設計パターンおよびその思想的枠組みです。

基本的な考え方
従来のRAG（Retrieval-Augmented Generation）は「検索」に最適化されています。クエリのたびに文書を再読し、関連チャンクを取得して回答を生成する——つまり毎回ゼロから再導出する構造です。LLM-Wikiはこれとは根本的に異なります。「知識をコンパイルする」という発想です。
Karpathy自身の言葉でこの哲学を一文に要約すれば、「ObsidianはIDE、LLMはプログラマー、WikiはCodebase」ということになります。

三層アーキテクチャ
構造は明確に分離されています。第一層はRaw Sources（不変の一次資料）—　論文、記事、メモ。LLMはここを読むが書き換えない。第二層はWiki—　LLMが生成・維持するMarkdownファイル群。エンティティページ、概念ページ、相互リンク。人間が読み、LLMが書く。第三層はSchema—　LLMにWikiの構造や規約を指示する設定ファイル（CLAUDE.mdやAGENTS.md）。

RAGとの本質的な違い
新しい文書を追加するたびに、LLMはそれをインデックスするだけでなく、内容を読んで重要情報を抽出し、既存ページを更新し、要約を改訂し、矛盾を記録し、相互リンクを強化します。知識は一度コンパイルされ、その後も更新され続ける——クエリのたびに再導出されることはありません。これがwikiを「永続的・複利的なアーティファクト」たらしめる核心です。

なぜこれが機能するか
人間がwikiを放棄するのは、維持コストが価値の増加より速く膨らむからです。LLMは飽きない。相互参照の更新を忘れない。一回のパスで15ファイルを更新できます。維持コストがほぼゼロであるため、wikiは生きつづけます。

koshixさんが進めておられるFisica Wiki（MediaWikiベースの物理学記事の日本語化プロジェクト：後述）は、このLLM-Wikiの思想と構造的に非常に近いところにあります。ソース（英語Wikipedia記事）を不変の原典とし、翻訳・構造化されたwikiページを「コンパイル済み知識」として蓄積し、相互リンクと体系化を施す——方法論的な共鳴は大きいと思います。