図:未来の知識アーカイブ都市(ChatGPTによる)
修正版を読み返してみると中々よくできていると感心した。米国政府に止められていたClaude Fable 5 が再開し,7月7日まで使えるというので(それ以降は従量課金),ChatGPTの書いた日本国記憶保存計画(修正版)を投入してみた。
うーん,ダメ出しの嵐である。確かに冷静に考えてみると,Claude のいうとおりなのだ。危ういネーミング,自分が後で付け加えた「ただし歴史修正主義には組みしない」の問題性,予算規模とその吸収能力,人材育成の必要性の失念,帝国植民地の記憶に関する問題,などなど。
ただね,こういう与太話は,まじめにやろうとすればするほど,どんどんつまらなくなってしまうのよね。SFのテーマにしようかと考えていたのに。いちおう,Claude Fable 5の修正提案を披露しますが,このまますべては採用できないなぁ。
A(Claude + koshix):
日本列島記憶基盤(通称:列島アーカイブ)構想 第三版
前二版(Qwen版・ChatGPT版)に対する批判を踏まえた全面改訂である。本版の主要な変更は,(1) 神話的命名の放棄,(2) 「認定権」問題の手続き的解決,(3) 予算規模の百分の一への縮減と積算根拠の明示,(4) 恒久財源構造の導入,(5) 情報主権問題の対象拡張(旧植民地期資料・集合的プライバシー),の五点である。(注:がび〜〜ん)
0.本改訂の趣旨——第二版が解決できなかったもの
第二版(YASHIMA案)は,分散管理・複数の声・出典主義という設計によって「国家が単一の文化基準を強制する危険」に応答しようとした。しかしその応答は不完全であった。
第一に,分散化は編集権を消去しない。何を優先保存するか,どの説を「修正主義」として退けるか,という判断は依然として誰かが行わねばならず,第二版はその判断主体と手続きを曖昧にしたまま,「合議制」という言葉で覆っていた。
第二に,年10兆円・総額100兆円という規模は,現在の文化行政の吸収能力(文化庁予算約1千億円,国立国会図書館約2百億円)の百倍であり,執行不能な数字を掲げること自体が構想の信頼性を損なっていた。(注:ハイハイハイハイ)
第三に,「AMATERAS」「YASHIMA」という記紀神話由来の命名は,「単一の日本らしさを語らない」という構想の核心理念を命名レベルで裏切っていた。(注:ぐぬぬ)
第四に,「10年計画」でありながら11年目以降の財源が空白であり,デジタル保存の本質(永続的な媒体更新・電力・人件費)と矛盾していた。(注:これは異論あります)
第五に,情報主権の問題を国内の分散管理に矮小化し,日本のアーカイブに大量に含まれる旧植民地期資料の帰属問題と,匿名化しても集積されれば生じる集合的プライバシーの問題を看過していた。(注:おっしゃるとおりです)
本版は,これらすべてに制度設計で答えることを試みる。
1.名称——神話に依らない
本構想の正式名称を「日本列島記憶基盤」,通称を「Foundation-J」とする。正式英名は Japan Archipelago Memory Commons とする。対話型AIには固有名を与えない。その機能名を「公共司書」とする。(注:公共司書はちょっとイマイチだけど)
命名の原則は次の通りである。
第一に,記紀神話・皇室祭祀・特定宗教に由来する名称を用いない。本基盤はアイヌ,琉球,在日コミュニティ,移民社会を含む列島上のすべての記憶を対象とするのであり,特定の起源神話を冠した瞬間に,その神話体系の外にある記憶に対して包摂ではなく編入のシグナルを送ることになる。(注:ごもっともすぎる)
第二に,AIを擬人化・神格化する固有名を避ける。「司書」という機能名は,このAIが何であるか(資料への案内者)と何でないか(真理の語り手)を同時に示す。司書は蔵書の内容に責任を負わない。所蔵と来歴と探し方に責任を負う。本構想のAIの倫理的位置は,正確にそこである。(注:これには違和感あるけど)
第三に,通称は誰でも意味がわかる日常語とする。「列島アーカイブ」は美しくないかもしれないが,美しすぎる名前こそがこの種の構想の敵である。(注:ダサいと思います!)
2.基本理念——記憶の管理ではなく,来歴の管理
前版の理念「文化的継続性こそ最後の国土である」は維持する。ただし,その実現方法を一段具体化する。本基盤が管理するのは,記憶の「内容」ではなく「来歴」である。
すなわち本基盤は,ある資料・言説・記録について,「それが正しいか」を判定しない。「それが,いつ,誰によって,どのような根拠と方法で作られ,保存され,引用され,反論されてきたか」を記録する。真偽の判定は,学術と社会の通常のプロセス——史料批判,査読,反証,論争——に委ね,本基盤はそのプロセス自体を検証可能な形で保存する。
この転換により,第二版が抱えていた最大の理論的困難,すなわち「複数の見解を提示すると言いながら歴史修正主義は退けるという矛盾」は,次のように解消される(詳細は第6節)。修正主義的言説も,言説として存在した事実は保存される。ただしその来歴——一次史料との対応関係,学術的検証の履歴,反証の存在——も同時に,切り離せない形で表示される。基盤は説を選ばない。説の履歴書を添付する。(注:それで大丈夫なのだろうか?)
3.規模の適正化——100兆円から7兆円へ(注:ひぇ〜〜 つまんないやつだな!)
第二版のGDP比1.5%・総額100兆円という規模は撤回する。理由は倫理ではなく算術である。
現在の日本に,年間2兆円分のアーキビスト・学芸員・保存修復技術者・権利処理専門家は存在しない。日本アーカイブズ学会の登録アーキビスト制度による認定者は累計で数百人規模,学芸員資格保有者は多数いるが実務ポストは慢性的に不足しており,専門人材の年間供給力から逆算すれば,執行可能な事業規模はおのずと定まる。予算がついても使えない計画は,予算がつかない計画より有害である。失敗の実績が,次の試みの芽を摘むからである。
(注:アーキビストという専門家に限定する考え方自身がいいのかどうか?)
本版の規模は次の通りとする。
・10年間の事業費総額:約5兆円(初年度2,000億円から漸増し,第5年度以降は年6,000〜7,000億円で定常化)
・恒久基金への出資:約2兆円(第4節)
・合計:約7兆円(注:少なくないですか?ぜんぜんおもしろくないんですけど。)
初年度2,000億円は文化庁予算の約2倍であり,これでも文化行政史上最大の拡張である。だが国立大学法人運営費交付金(年約1.1兆円)や科学技術関係予算の規模と比較すれば,国家が本気を出せば執行可能な水準である。(注:まあ,それはそうかもしれないが,人件費も積算してますか?)
積算の考え方の例を示す。国立国会図書館のデジタル化実績では,書籍・雑誌のデジタル化単価は資料の状態により1冊数百円から数千円である。仮に平均2,000円として年1,000億円を投じれば年5,000万点,これはNDL全蔵書(約4,600万点)を1年で上回る速度であり,実際には撮影よりもメタデータ作成・権利処理・品質管理が律速となる。つまり本事業の予算の過半は「モノをスキャンする費用」ではなく「人が記述し,権利を確認し,地域と信頼を築く費用」であり,それは人材の頭数に制約される。ゆえに——
第1期(1〜3年目)の最大の投資対象は,資料ではなく人材養成である。大学院・専門職課程・現任者研修を通じ,アーキビスト・デジタル保存技術者・権利処理専門家を10年間で累計3万人規模で養成・配置する。年間2兆円を使える体制は,10年かけて作るものであって,初年度に仮定するものではない。
年間概算配分(定常期・年6,500億円想定):
・人材養成・全国配置(自治体・図書館・博物館・大学):2,000億円
・危機資料の保存・デジタル化・目録作成:1,800億円
・権利処理・同意管理・寄託制度・倫理審査:700億円
・長期保存ストレージ・分散データセンター・災害バックアップ:800億円
・検索・知識グラフ・公共司書AI・多言語化:600億円
・教育利用・地域還元・市民ツール:400億円
・監査・セキュリティ・国際連携(デジタル返還を含む):200億円
4.財政構造——金を出す者が笛を吹けない設計
第二版は「国は収奪者ではなく支援者であるべきだ」と述べたが,年10兆円を出す主体が統制を要求しないと期待するのは制度設計ではなく祈りである。本版は財政構造そのものに防波堤を組み込む。
(1) 恒久基金の造成:
国費出資2兆円により「列島記憶基金」を設置する。大学ファンド(10兆円規模の運用実績あり)と同型の長期運用を行い,実質運用益(目標年3%・約600億円)を基盤の経常運営費—媒体マイグレーション,電力,中核人件費,システム保守—に充てる。(注:これいいかも)
これにより,11年目以降,政府の毎年度予算査定から独立した最低限の生存費が保証される。10年間の事業費(第3節)は拡張のための投資であり,基金運用益は永続のための血液である。「次の100年,500年」を語る計画は,単年度予算の上に建ててはならない。
(2) 引き出し不能条項:
基金は特別の法律により設置し,政府は追加出資できるが,取り崩し・目的外流用・運用方針への介入はできない旨を設置法に明記する。財政危機を理由とする例外規定を置かない。例外規定は必ず使われるからである。(注:こまかいな,でもダメなときはだめだけど)
(3) 財源根拠の再構成:
第二版は本構想を「広義の国家安全保障」と位置づけたが,安全保障の論理は必ず機密化・アクセス統制・国家目的への従属圧力を随伴する。(注:たしかに,しかしその考え方自身を変えさせようというのが元々の出発点だった。それによって防衛費を脱構築する。)
本版はこのフレーミングを次のように限定する。本構想は防衛費の枠でも安全保障関連予算でもなく,災害対策・国土強靭化および教育・学術の恒久投資として位置づける。安全保障「に資する」効果(第9節)は結果として述べるが,安全保障「のための」事業とはしない。この区別は言葉遊びではない。予算科目は統制系統を規定する。防衛予算で建てられたアーカイブは,防衛の論理で閉じられる。(注:自分の意図とは違うがとりあえず放置)
5.既存基盤からの成長——ジャパンサーチという出発点
本構想は白紙から始まらない。すでに国立国会図書館が運営するジャパンサーチ(2020年正式公開)が,分野横断の統合ポータルとして,共通メタデータ形式による分散接続——まさに本構想の技術的核心——を小規模に実装している。連携データベースは200を超え,数千万件のメタデータが検索可能である。(注:そのスコープは限定的でしょぼいからである。)
したがって本構想の実現可能性の議論は,「ジャパンサーチはなぜあるのに,なぜこの規模にとどまっているのか」の分析から始めなければならない。答えは技術ではない。(1) 連携する各機関側にデジタル化・メタデータ作成の予算と人員がない,(2) メタデータはあっても本体データの公開が権利処理の壁で進まない,(3) 市町村・地域資料館・個人所蔵のレベルまで手が届く現場人材がいない,(4) 運営体制が一図書館の一事業であり,国家的な恒久財源を持たない——の四つである。
本構想は,この四つの欠落を埋める事業として自らを定義する。すなわち列島アーカイブとは,新しい巨大システムの建設ではなく,ジャパンサーチ的な分散接続アーキテクチャに,人材・権利処理・地域到達力・恒久財源を注入し,国家的基盤の規模へ育てる計画である。技術的に新設が必要なのは,長期保存レイヤー,来歴管理(第6節),知識グラフ,公共司書AIの四つに限られる。(注:ジャパンサーチは,あくまでも図書館だよね)
七層のデータ構造(地理環境/生物生態/生活民俗/産業技術/知識制度/文化財芸術/個人生活史)は第二版のものを維持する。各層の記述は第二版に譲り,本版では重複を避ける。
6.編集権の手続き化——境界線を引く権威の問題
第二版への最も根本的な批判は,「取捨選択とカテゴリ化には必ず編集者の価値観が含まれ,それがオーソライズされる」という点に,分散化と合議制という言葉で答えたつもりになっていたことである。本版は,編集権を消去できないことを認めた上で,それを可視化し,分散し,異議に開くという方針をとる。編集判断は三箇所で発生する。それぞれに手続きを定める。
(1) 優先保存の選定(トリアージ):
有限予算下で「何から保存するか」の判断は不可避であり,これは価値判断である。(注:たしかに)ごまかさずに次の手続きに従う。
・明文化された危機度指標を公開する。媒体の物理的劣化速度(酸性紙・磁気テープ・初期デジタル媒体),継承者の年齢構成(技能・方言・祭礼),所在地域の災害リスク,複製の有無,の四軸で構成し,指標自体を定期的に外部評価にかける。
・選定は上からの指定と下からの申請の二本立てとする。地域・団体・個人は保存を申請でき,採否は理由を付して全件公開する。
・不採択に対する異議申立て手続きを置き,審査には申請地域の代表を加える。
・「選ばれなかったものの目録」を保存する。*何を保存しなかったかの記録は,その時代の価値判断の一次史料であり,将来世代がこの事業自体を検証するための資料である。選定の偏りは必ず生じる。偏りを隠すことではなく,偏りを記録することが,本基盤にできる最大の誠実である。
(2) 歴史的言説の扱い——「認定しない」という設計:
第二版の「複数の見解を提示する。ただし歴史修正主義には組みしない」という条項は削除する。この条項は,誰がどの手続きで「修正主義」を認定するのかという問いに答えられず,認定権の設置はそれ自体が「異論を許さない強制的な文化基準」の再来だからである。
代わりに次の原則を置く。
・基盤は言説の真偽を認定しない。言説の来歴を記録する。すなわち,その言説がいつ誰によって主張され,どの一次史料を根拠とし,学術的検証(査読・反証・学会での位置づけ)をどの程度経ており,どのような反論が存在するかを,構造化されたメタデータとして言説に添付する。
・公共司書AIは,来歴情報を欠いた言説を,来歴情報を持つ言説と同格には提示しない。これは内容による差別ではなく,方法による層別である。一次史料との対応関係を示せる言説と示せない言説の区別は,特定の歴史観の採用ではなく,史料批判という学術的手続きの採用である。手続きは公開され,どの言説にも同一に適用される。(注:なるほど)
・来歴の記述・更新は基盤の職員ではなく,学協会・大学・研究者コミュニティの通常の学術プロセスに接続して行い,基盤は記述の場と形式を提供する。政府は個別の来歴記述に関与できない。
この設計でもなお,「史料批判という方法自体が一つの価値観ではないか」という批判は可能である。その通りである。本構想はその点を否認しない。検証可能性という価値へのコミットメントだけは,本基盤の譲れない前提として明示的に引き受ける。すべての価値から自由な保存は存在しない。引き受ける価値を最小限にし,それを明文化することが,できることのすべてである。
(3) カテゴリ化とリンク化:
知識グラフにおける分類・関連づけも編集行為である。分類スキーマは公開し,バージョン管理し,旧スキーマでの検索を永続的に可能とする。単一の正規分類を強制せず,複数の分類体系(学術分野別・地域別・当事者コミュニティ自身による分類)の並存を許す設計とする。アイヌ・琉球等の資料については,当事者コミュニティが自らの分類語彙で自らの資料を記述する権利を保障する。
7.公共司書AI——名前のないインターフェース
対話型AIの原則は第二版の七原則を維持しつつ,二点を追加する。
第八に,公共司書は自らの限界を表示する。回答の根拠となった資料の範囲,未収録領域,来歴情報の欠落を明示し,「基盤にないこと」と「存在しないこと」を混同させない。
第九に,公共司書の応答ログは(利用者を匿名化した上で)それ自体を保存対象とする。将来世代は,2030年代の日本人が過去に何を問うたかを検証できる。問いの履歴もまた文化記憶である。
なお第二版の禁止事項「AIを天皇の代替・国家意思の代弁者・宗教的象徴として扱わないこと」は維持するが,本版ではこの禁止が命名と設計の水準で最初から満たされている。司書を崇拝する者はいない。それがこの機能名を選んだ理由である。(注:自分の背景意識には象徴としての代替が潜んでいる)
8.情報主権の拡張——列島の外にはみ出す記憶
第二版は情報主権の問題を国内の分散管理として処理したが,二つの重大な領域が残されていた。
(1) 旧植民地期資料と「帝国の記憶」:
日本のアーカイブには,朝鮮・台湾・樺太・南洋群島・満洲に関する行政文書・調査資料・写真・収集品が大量に含まれる。これらを「日本列島の記憶」として一括した瞬間に,その記憶の帰属をめぐる問いが捨象される。本版は次の原則を置く。
・対象の定義を「日本列島に所在する記憶資料」とし,所在と帰属を明確に区別する。所在が日本であることは,記述の権利や解釈の権威が日本に専属することを意味しない。
・旧植民地・占領地に関わる資料群については,関係国・関係コミュニティの研究機関との共同記述(メタデータの複数言語・複数視点での併記)を原則とする。
・高精細デジタル化を完了した資料について,関係国・コミュニティへのデジタル返還(複製データと記述権限の提供)を制度化する。原資料の返還問題は本構想の権限外だが,デジタル返還はその議論を妨げず,むしろ資料の所在を可視化することで議論の前提を提供する。
・先住民族・少数者コミュニティの資料については,国際的に議論されている先住民データ・ガバナンスのCARE原則(集合的利益・統制権限・責任・倫理)を参照し,OCAP等の先行枠組みに学ぶ。FAIR原則(見つけやすく・アクセスしやすく)とCARE原則(当事者の統制)は緊張することがあり,緊張する場合はCAREを優先する。開かれたアーカイブの理念よりも,記憶の主体の意思が上位にある。
(2) 集合的プライバシーと再識別リスク:
第二版の第7層(個人・生活史層)は本人同意と匿名化を前提としたが,これでは足りない。個々人が同意し,個々のデータが匿名化されていても,地域・集団単位で集積されれば,その共同体のプロファイリング——信仰,政治傾向,健康傾向,経済状態——が可能になる。また匿名化データは外部データとの照合により再識別されうる。本版は次を追加する。
・個人単位の同意に加え,一定規模以上の地域・コミュニティ資料の集積には,当該共同体の合意手続き(自治会・コミュニティ組織等を通じた集合的同意)を要する。
(注:これはかなり相当面倒だと思います・・・現自治会役員より)
・集合的匿名性の定量評価(k-匿名性等の技術的指標)を公開の前提とし,第三者機関による再識別攻撃の定期監査を行う。
・地域・集団単位でのオプトアウト(集積からの離脱)を認める。離脱の記録もまた保存する。
・研究利用は目的別審査とし,共同体のプロファイリングを目的とする利用——商業マーケティング,信用評価,保険料率算定,捜査目的の一括照会——を禁止する。
9.本構想がもたらすもの——「安全保障」と言わないための節(注:ここは自分とは意見が分かれる)
第二版は本構想を広義の安全保障と呼んだ。本版はその語を事業の定義から外す(第4節(3))。ただし,効果としての次の五点は維持する。災害復旧の基盤,文化的レジリエンス,情報戦への耐性(権威ではなく検証可能性による防衛),ソフトパワー,将来世代への責任である。内容は第二版第9節の通りであり,繰り返さない。
一点だけ言い換える。第二版は「検証可能性こそが防衛である」と書いた。正確にはこうである。検証可能性は防衛ですらない。それは防衛が失敗した後でも残る,共同体の再起動情報である。 防衛の語彙で語れば防衛の予算と統制が付いてくる。この基盤は,守るための施設ではなく,負けても失われないための施設である。
10.ガバナンス——任命拒否に耐える設計
第二版は合議制の「文化記憶基盤機構」を提案したが,独立の合議制組織が政治権力に対していかに脆弱かは,日本学術会議の任命拒否問題(2020年)が実証済みである。(注:まったくそのとおりである)本版は,独立性を組織の善意ではなく構造に置く。
・人事:
任命制を採らない。 機構の意思決定機関は,(a) 学協会・図書館協会・博物館協会・自治体・権利者団体・地域団体からの互選枠,(b) 無作為抽出による市民委員枠(裁判員制度と同型の抽選制),(c) 当事者コミュニティ(アイヌ・琉球・在日・障害者団体等)の指名枠,の三系統で構成し,政府の任命行為を介在させない。政府は諮問と予算執行の監査に関与するが,人事に関与しない。
・拒否権の分散:
個人生活史層の運用変更には市民委員枠の,当事者コミュニティ資料の運用変更には当該指名枠の,それぞれ同意を要件とする。
・削除の不可能化:
資料の削除・非公開化はすべて理由付きでログに残り,ログ自体は削除できない(追記専用の分散保存)。政治権力による「都合の悪い資料の静かな消失」を技術的に不可能にする。公文書改竄が現実に起きた国では,これは杞憂ではなく仕様要件である。
・十原則:
第二版第10節の十原則は維持する。
11.ロードマップ——人材が先,データは後
第1期(1〜3年目):養成と棚卸し
専門人材の養成課程整備と現任者研修を最優先とする。並行して全国所在調査(何が・どこに・誰の管理下に・どの権利状態で・どの程度の危機にあるか)。ジャパンサーチ連携機関を調査の骨格として活用。法制度整備(著作権法の拡張的権利制限,寄託制度,基金設置法,機構設置法)。
第2期(2〜5年目):危機資料の優先保存
第6節(1)の公開手続きに基づくトリアージを開始。全国の図書館・博物館・自治体・学校への人材配置。
第3期(3〜7年目):来歴管理と知識グラフ
来歴メタデータ基盤の構築,複数分類体系の実装,共同記述・デジタル返還の協定締結。
第4期(5〜8年目):公共司書の段階公開
教育・研究・自治体利用から開始し,来歴表示・限界表示を検証した上で一般公開。
第5期(8〜10年目):恒久体制への移行
基金運用益による経常運営への切り替えを完了し,事業費予算がゼロになっても基盤が死なない状態を作る。10年計画の成功の定義は,計画の完了ではなく,計画の終了後も続く制度が存在することである。(注:そんなことはわかっています,軌道に乗せるまで10年というイメージだった)
12.禁止事項
第二版第13節の禁止事項を維持し,次を追加する。
・政府が機構の人事に関与すること。
・基金を取り崩し,または目的外に流用すること。
・本基盤のデータを,捜査・課税・信用評価・出入国管理・監視の目的で一括照会すること。
・特定の言説を「正史」として認定すること。および,来歴管理の手続きを個別言説について政治的に変更すること。
・旧植民地期資料を,関係コミュニティとの協議なしに一方的な記述で公開すること。
・神話的・宗教的・皇室的固有名を基盤またはAIに付すこと。(注:きびしーっ)
13.結論——鏡ではなく,図書館
第二版は「AIは文化の鏡である。鏡は命令しない」と結んだ。美しい比喩だが,撤回する。鏡は一つの像しか映さず,映す角度を誰かが決める。鏡の比喩には,第二版が抱えていた問題——単一の反映像への欲望——がまだ残っていた。
本構想が作るのは鏡ではない。図書館である。図書館は像を結ばない。図書館は,無数の書き手が残した無数の記述を,来歴とともに棚に並べ,探しに来た者に開架する。司書は薦めることはあっても,読むべき一冊を命じない。そして良い図書館は,蔵書の偏りを知っており,欠けている棚の存在を利用者に告げる。
100兆円で建てる神殿より,7兆円で建てて1000年つづく図書館を。武器は現在の安全を守るかもしれない。だが,よく整理された書庫は,敗北と忘却の後でさえ,再建の最初の一冊になる。(注:そう,自分が求めていたのはファウンデーションだったのかも知れない)
列島アーカイブが未来世代に渡すのは,答えではない。検証する権利と,そのための資料と,「何が保存されなかったか」の記録である。あとは彼らが決める。それでよい。それしか,できない。