トークンからの続き
トークンの値段を眺めるうちに、もう少し実装寄りの妄想が湧いてきた。
きっかけは手元のMacだ。近い将来、Mac StudioにM5 Maxが載り、メモリ128GBで中規模LLMが動かせるとする。これを24時間フル稼働させたら、クラウドAPI価格に換算して月いくら分のトークンを生成するのか。ChatGPTに見積もってもらった。
生成速度を50トークン/秒とすると、月におよそ1.3億トークン。これを出力価格で換算すると、
・Gemini Flash-Lite級(出力0.4ドル/100万)→ 月50ドル程度
・Claude Sonnet級(出力15ドル/100万)→ 月2000ドル弱
・GPT-5.5級(出力30ドル/100万)→ 月4000ドル弱
同じ1.3億トークンでも、どのAPI価格に対応させるかで価値が二桁変わる。Mac Studio 1台が、見方によって月数十ドルの箱にも、月数千ドルの箱にも見える。もっとも、ローカルの中規模モデルがGPT-5.5級に賢いはずもなく、フル稼働も理想化しすぎだ。現実的には「月500~2000ドル分のAPI利用を自前化できる可能性」あたりが堅い。
ここで本題。Mac 1台でこれだけ遊んでいるなら、国中・世界中のローカルマシンをつないで、ひとつのLLMサービスにできないか。巨大クラウドに頼らない分散型のLLM基盤を、スタートアップとして立ち上げられないか。ChatGPTにぶつけてみた。
評価は「筋はよいが、『分散ローカルでChatGPT対抗』は厳しく、『低価格・プライバシー・地域性・主権性・非同期大量処理』に絞れば余地はある」だった。先行例も多い。計算資源を売買するAkash、AI推論をサブネットで評価するBittensor、協調推論の研究実装Petals、Mac同士をつなぐexo。私の妄想は空想ではなく、すでに複数の系譜がある。
肝心なのは「何を分散するか」だ。1回の質問を複数ノードで分割して巨大モデルを動かす方式は、ネットワーク遅延が致命的になる。計算を細切れにして遠くへ配ると、通信の往復で待たされ、かえって遅い。一方、各ノードが小~中規模モデルを独立に動かし大量のリクエストをさばく方式なら可能性がある。これはスパコンというよりLLM版のUber、あるいは電力アグリゲータだ。「GPT-5級でなくていいから安く大量に要約したい」「社内文書を外部に出したくない」「夜間にバッチで翻訳・分類したい」――即時・最高品質ではなく、安く・国内に閉じて・監査可能、が価値になる。
ここで知らない単語が出たので説明してもらった。ソブリンAIは「データ・計算資源・モデル・運用を自分たちで管理するAI」。要は「AIは使いたいが外国企業に丸投げしたくない」という政策目標だ。exoはMacやPCを束ねてLLMを動かすオープンソース。SLAは「月99.9%稼働」などを明文化したサービス品質保証契約。個人のMacは突然スリープしたり再起動したりするので、「今日は誰かのMacが寝ているので処理できません」では業務に使えない。家庭用Macが世界平和の礎になる前に、まずSLAという勤怠管理を片づけねばならない。
事業化の壁は4つ。ノードが信用できない(出力を覗かれる)、品質保証が難しい(指定モデルを正しく動かしたか検証できない)、SLAが難しい(参加離脱・回線・発熱・スリープを吸収する仕組みが要る)、価格競争(大手が推論価格を急落させており安売りだけでは負ける)。
そこで提案された設計は三段階。第一に、世界中から家庭PCを集めるのではなく、大学・自治体・企業など信頼できる小規模クラスターから始める(「いきなりP2Pの大海原に出ると海賊もクラゲもいる。まずは湾内で船を浮かべるべき」とのこと)。第二に、用途を高機能チャットでなく安価な非同期処理に絞る(要約・分類・翻訳・RAG・議事録整形。8B~70B級で十分)。第三に、「国内ノードのみ」「医療機関ノードのみ」といった信頼境界を設計したLLM処理市場にする。
日本での現状も聞いた。結論は「構想そのもの――全国のローカルMacを束ねた商用分散LLMクラウド――を正面からやる例は見当たらないが、周辺は動いている」。政府は経産省・NEDOのGENIACで基盤モデル開発と計算資源確保に本腰だが、これは「開発者にGPUを使わせる支援」で分散資源の市場化とは別物。国内GPUクラウドはさくら・KDDI・GMO・ソフトバンクが整備中で、廃校をGPUデータセンターに転用するハイレゾの「GPUSOROBAN」は、遊休資源をAIに変える点で私の妄想に近い匂いがする。
つまり構想には空白地帯がある。ただし「誰も思いつかない」のではなく、信用・品質保証・SLA・課金・通信遅延・電力コストが難しく、まだ事業化しにくいから残っているのだ。最終助言は明快だった。いきなり「全国の個人Macを束ねます」と言わず、まず「大学・自治体・中小企業の既存GPU/Mac Studioを認証済みノードとして束ねるプライベート分散LLM処理基盤」から始め、用途を非同期バッチに絞り、そこから地域・業界・国レベルへ広げる――。
筋は通っている。問題は、これをやる体力と気力が残っているかだ。MediaWikiの国旗テンプレートひとつでヒイヒイ言う人間が世界規模の分散AI基盤を立ち上げる図は想像しにくい。ただ、妄想を文章にしておけば、いつか誰かが拾ってくれるかもしれない。蜘蛛の糸は、垂らしておくに限る。
(注:この記事は,ChatGPTとの対話をもとに,Claudeに,自分のスタイルを見せて,ブログ記事として完全に書き下ろしてもらったものである。)