2026年5月23日土曜日

LLM-Wiki


図:LLM-Wikiのぱっとしないイメージ(ChatGPTによる)


シンギュラリティ・サロンで,保田さんが,アンドレイ・カーパシーLLM-Wikiの記事を紹介していた。さっそく,Claudeに話を聞いてみた。Geminiはあんまりよくわかっていなかった。ChatGPTは分かりすぎていて,自分の現在のFisica Wikiをめぐる作業に密接しながらたいへん詳しく説明してくれたので,逆に紹介しにくい。
Q(koshix):
LLM-Wikiとは何ですか。

A(Claude):
LLM-Wikiとは、Andrej Karpathy(OpenAI共同創業者、元Tesla AI責任者)が2026年4月頃に提唱した、個人知識ベース構築のための設計パターンおよびその思想的枠組みです。

基本的な考え方
従来のRAG(Retrieval-Augmented Generation)は「検索」に最適化されています。クエリのたびに文書を再読し、関連チャンクを取得して回答を生成する——つまり毎回ゼロから再導出する構造です。LLM-Wikiはこれとは根本的に異なります。「知識をコンパイルする」という発想です。 
Karpathy自身の言葉でこの哲学を一文に要約すれば、「ObsidianはIDE、LLMはプログラマー、WikiはCodebase」ということになります。

三層アーキテクチャ
構造は明確に分離されています。第一層はRaw Sources(不変の一次資料)— 論文、記事、メモ。LLMはここを読むが書き換えない。第二層はWiki— LLMが生成・維持するMarkdownファイル群。エンティティページ、概念ページ、相互リンク人間が読み、LLMが書く。第三層はSchema— LLMにWikiの構造や規約を指示する設定ファイル(CLAUDE.mdやAGENTS.md)。 

RAGとの本質的な違い
新しい文書を追加するたびに、LLMはそれをインデックスするだけでなく、内容を読んで重要情報を抽出し、既存ページを更新し、要約を改訂し、矛盾を記録し、相互リンクを強化します。知識は一度コンパイルされ、その後も更新され続ける——クエリのたびに再導出されることはありません。これがwikiを「永続的・複利的なアーティファクト」たらしめる核心です。 

なぜこれが機能するか
人間がwikiを放棄するのは、維持コストが価値の増加より速く膨らむからです。LLMは飽きない。相互参照の更新を忘れない。一回のパスで15ファイルを更新できます。維持コストがほぼゼロであるため、wikiは生きつづけます。 

koshixさんが進めておられるFisica Wiki(MediaWikiベースの物理学記事の日本語化プロジェクト:後述)は、このLLM-Wikiの思想と構造的に非常に近いところにあります。ソース(英語Wikipedia記事)を不変の原典とし、翻訳・構造化されたwikiページを「コンパイル済み知識」として蓄積し、相互リンクと体系化を施す——方法論的な共鳴は大きいと思います。

P. S. OpenAIの共同創業者のアンドレイ・カーパシー(日経ではカルパシー)が5月19日付けで,Anthropic(アンソロピック=ダリオ・アモディダニエラ・アモディの兄妹が共同創業者でCEOと社長)に入社したと,5月20日の日経夕刊が報じていた。

0 件のコメント: