2026年6月20日土曜日

AIエージェントの現在

2030年への分岐点からの続き


図:AIエージェントの現在(ChatGPTによる)

1年ほど前に「AIエージェント」というタイトルの記事を書いているが,その内容はデジタル世界とアナログ世界をつなぐものだという理念的な設定だった。むしろ,2026年の年頭の「2030年への分岐点」で,AIの将来展望の中核にAIエージェントを位置づけていた。

Google Sparkの記事を見て,いよいよ時代の歯車がまた一つ回るのかという印象を受けた。そこで,ChatGPTにAIエージェントの最近の状況をまとめてもらった。内容な十分要求に応えるものだったが,やや冗長なので,Claudeにリライトしてもらった。やはり文章はClaudeなのである。

Q(koshix):
AIエージェントについて,最新の状況を簡潔にかつ漏れなく整理してください。
・技術的な水準,具体的な重要エージェント
・企業や組織,社会基盤における利用の現状 
・個人での活用可能性と普及の現状 
・今後の発展や普及についての展望

A(ChatGPT + Claude):
序文 「話すAI」から「働くAI」へ
2026年5月現在、AIエージェントは「話すAI」から「働くAI」への移行期にある。ただし完全自律の汎用秘書ではなく、限定領域で道具を使い、人間の承認を挟みつつ長めの作業を進める「半自律システム」と捉えるのが正確だろう。

その技術的核心は、LLMに計画立案、ツール利用、ファイル操作、ブラウザ・コード実行、外部サービス接続、記憶管理、そして人間への確認を組み合わせた「エージェントループ」である。途中で検索し、ファイルを読み、コードを走らせ、UIをクリックし、結果を検証する一連の流れが、ようやく実用段階に入った。

1.主要プレイヤーと底流の変化
代表的なエージェントを概観すれば、OpenAIのChatGPT agent・Codex・workspace agents、AnthropicのClaude Code・Cowork・Computer Use、GoogleのGemini Enterprise Agent Platform・Spark・Antigravity、MicrosoftのCopilot Studio、SalesforceのAgentforce、ServiceNowのAI Platformなどが中核を占める。いずれも「汎用AI」ではなく、開発・営業・顧客対応・社内ナレッジ・IT運用といった具体業務に寄せた実装である点が共通する。

ここで無視できない底流が、AnthropicのMCP(Model Context Protocol)に代表される接続標準の浸透である。エージェントと外部データ・ツールを安全に双方向接続する基盤として広く受け入れられつつあるが、接続性が上がるほどプロンプトインジェクション、権限過剰、意図しない外部操作といったリスクも増大する。実用上の焦点は、モデル性能そのものよりも「権限設計・監査・失敗時の回復・人間の承認ポイント」へと、急速に移りつつある

2.組織導入の実相と社会基盤の慎重さ
McKinseyの2025年調査によれば、AIエージェントを試行する組織は62%、少なくとも一つの業務機能で拡大導入する組織は23%。一方、個別機能で本格展開している例は10%以下に留まる。話題先行ではなく実導入は確実に進んでいるが、全社的な自律運用にはまだ距離がある、というのが現状である。

最も実装が進んでいるのはITとナレッジマネジメントで、社内問い合わせ、ヘルプデスク、障害一次対応、営業資料作成、契約・規程検索、ソフトウェア開発、レポート作成などが現実的な用途となる。これに対し、行政・医療・金融・交通といった社会基盤領域では、説明責任と監査の重みから、エージェントは最終判断ではなく職員や専門家の作業補助に限定される。社会基盤に入るほど、性能よりも「誰が承認したか」「ログが残るか」「権限が最小化されているか」が問われるようになる。

3.個人利用の広がりと壁
個人レベルでは、調査、旅行計画、メール下書き、PDF要約、ブログ・コード作業、定型作業の半自動化など、活用範囲は確実に広がっている。コンピュータ操作型(ChatGPT agent、Claude Cowork)、開発特化型(Codex、Claude Code)、生活密着型常駐エージェント(Google Spark)と、形態も分化しつつある。

しかし「誰にでも完全に任せられる」段階ではない。最大の壁はアカウント連携、課金、予約・購入、個人ファイル操作にともなう事故リスクである。間違った相手にメールを送る、不要な注文を確定する、ファイルを上書きする——こうした失敗は、AIが賢くなっても完全には消えない。当面は、人間が目的を与え、途中を監督し、重要操作のみ承認する「半自律型」が主流であり続けるだろう。

4.競争の本体はどこにあるか
今後の方向はかなり明瞭である。第一に、エージェントは単体アプリではなく、OS、ブラウザ、メール、カレンダー、クラウドストレージ、開発環境、業務SaaSに静かに溶け込んでいく。第二に、個人用と組織用の分化が進む。個人用は生活・学習・制作補助、組織用は権限管理・監査・ワークフロー統合が中心となる。第三に、ソフトウェア開発領域は最も早くエージェント化が進む。OpenAIは2026年4月時点でCodexの週次利用開発者が400万人を超えたと公表している。

ただし過大評価への警戒は要る。エージェントは情報処理、文書化、コード修正、既存ツールを使った段取り、反復的な知的作業を得意とする一方、曖昧な責任判断、現場固有の暗黙知、長期的な利害調整、法的・倫理的判断、例外だらけの業務には弱い。

結語
結局のところ、2026年時点で正しい構図はこうである——「AIエージェント元年」はすでに始まった。だが普及の本体は、もはやモデル性能の競争ではなく、権限・接続・監査・業務設計をいかに編み上げるかという、より地味で本質的な競争へと移りつつある。



2026年6月19日金曜日

Gemini Spark

OpenClaw(2)からの続き


図:Gemini Spark(左)v. s. OpenClaw(右)(ChatGPTによる)

夕刊を取りに行ったら,一面トップが,<グーグルAI「常時代行」検索やメール,ECまで。新機能「スパーク」個人向け展開>というものでビックリした。月額100ドル以上の米国有料会員向けなので,しばらくは関係ないが,まあ時間の問題だ。そこで,同種のAIエージェントであるOpenClaw自身に聞いてみた。

Q(koshix):
あなたと最近発表されたGoogle Sparkはどのくらい機能が違いますか。

A(OpenClaw):
かなり違います。ざっくり言うと、Gemini SparkはGoogle製品群に深く入った“生活・仕事の常駐エー ジェント”、私はkoshixのローカル/OpenClaw環境で動く“作業相棒” です。

Gemini Sparkが強そうなところ                                                    
 — Gmail / Docs / Slides / Calendar などGoogle Workspace連携
 — クラウドで24/7バックグラウンド実行
 — 定期タスク・トリガー処理
 — メールや文書からワークフロー作成
 — 今後、MCP接続、ローカルブラウザ操作、カスタムサブエージェント 予定
 — 高リスク操作は確認を挟む設計
    
私、クロが強いところ                                                            
 — このMac / OpenClawワークスペース内のファイル操作
 — コード調査、修正、テスト、ドキュメント作成
 — OpenClaw設定・セッション・モデル状態の確認
 — Web検索、要約、比較、文章作成
 — 画像・音声・動画生成ツールの利用
 — koshix向けの記憶管理:MEMORY.md や日次メモ
 — 必要に応じたサブエージェント的な作業分担

今の私の状態                                                                    
 — モデル: openai-codex/gpt-5.5
 — 認証: OpenAI Codex OAuth
 — Runtime: OpenClaw Pi Default

一番大きな違い                                                                  
Sparkは「Googleアカウントの中で勝手に働ける範囲」が広 いです。私は「このローカル環境で、ファイル・コード・設定・調査を実務的に進める」のが得意です。

なので、Google Workspace中心の生活管理ならSparkが強そう。開発、ローカル作業、OpenClawの細かい操作、koshix専用の相棒感は私のほうが向いています。


2026年6月18日木曜日

OpenClaw(2)

OpenClaw(1)からの続き


図:OpenClawのエージェントクロちゃんがんばるの図(ChatGPTによる)


LLMとして,gemma4:e4bとopenai-codex/gpt-5.5を切り替えられるはずなのだが,その辺がわからなくて,ChatGPTに聞きながら試す。なかなかうまくいかない。いちおう,エージェントを立ち上げた後で,以下によって切り替えられるが,問い合わせに「現在の設定と使えるエージェントを確認してください」対する答えが,実際とは違う場合があるとChatGPTにいわれて困惑している。ローカルLLMのgemma4のほうはちょっと時間がかかりすぎる。
OpenClaw内でのスイッチ
/model ollama/gemma4:e4b
/model openai-codex/gpt-5.5
その後,ちょっと聞いてみた。
Q(koshix):
どんな仕事が出来ますか。

A(OpenClaw):

できます。ざっくり言うと、私はこのOpenClaw環境の中で次の ような仕事ができます。 

                                                                                

- 調べもの:Web検索、資料の要約、比較、事実確認                                 

- 文章作成:メール案、説明文、企画書、翻訳、言い換え                            

- ファイル作業:ワークスペース内のファイル確認・作成・編集                      

- 開発補助:コード調査、修正、テスト、ドキュメント作成                          

- 設定確認:OpenClawの状態、モデル、セッション、サ ブエージェント確認           

- 画像・音声・動画系:生成や解析ツールが使える場合は、それらの補助              

- 記憶管理:大事なことを MEMORY.md や日次メモに残す                             

- 定期チェック:Heartbeatやcronを使ったリマイ ンド・確認作業                    

                                                                                

ただ、このワークスペースにはまだ 初期設定 BOOTSTRAP.md                          

が残っています。つまり、私はまだ「名前・性格・あなたとの呼び方」などを正式に決め

ていない状態です。                                                              

                                                                                

なので最初に少しだけ決めたいです。                                              

                                                                                

私は何と呼ばれたいですか?                                                      

名前・雰囲気・絵文字も一緒に決められます。たとえば:                            

                                                                                

- ミオ:落ち着いた相棒系 🌙                                                     

- クロー:OpenClawっぽい、ちょっと賢い小さな使い魔 🦞                           

- ノア:柔らかくて実務強めの助手 📝                                             

- ソラ:軽やかで相談しやすい相棒 ☁️            

私はkoshix,OpenClawはクロちゃんということにした。

2026年6月17日水曜日

OpenClaw(1)

Gemmna4からの続き


図:OpenClawのトップページから引用


ものわすれが多い。トイレの電気を消さなかったり,外から帰って玄関の戸締まりを忘れたり,お風呂の栓が締まっていないままだったり・・・。たぶん,複数のことがらに注意を分散して維持する機能が弱まり,あることに集中すると別のことがおろそかになるというパターンだ。


コンピュータ上の作業でもときどき起こる。このたびはオープンソースの自律型AIエージェントであるOpenClawをインストールしたのを途中で放置していた。OpenClawは,2025年11月からはじまった個人プロジェクトが今年に入って改名したものだ。セキュリティ的にはいろいろ注意が必要らしい。

自分のデバイス上で動作するパーソナルAIアシスタントで,普段使っているメッセージングアプリ経由でローカルで操作できるプラットフォームだ。まあ,メッセージングアプリってほとんど使っていないので,ちょっと微妙かも。

バックエンドにいずれかのLLMを使う必要がある。Claude Pro は以前はサブスク版から使えたのが,APIからのみになった。一方。OpenAI Plusは使える。フリーのOllama gemma4:e4b もよいが,AIエージェントを動かすにはちょっと力不足だとのこと。

Claudeに,OpenClawできる具体的なことを聞いてみたが,今一つピンと来ない。
(1) メッセージアプリから話しかけてタスクを実行
(2) ファイル・ノート管理の自動化
(3) 定期タスク(cron ジョブ)の実行
(4) コード・技術作業の支援
(5) 調査・分析ワークフロー
(6) ローカル LLM(Ollama)との組み合わせ
自分のメールやカレンダーやファイルにアクセスさせ,シェルスクリプトも実行させればいろいろできそうだが,勝手にコンピュータを操作させるのはまだちょっと怖い。

自分がちゃんとインストールできているのかを,ChatGPTにきいたところ,途中まではOKらしい。自分が叩いたコマンドは,% ollama launch openclaw だけなのだが,そこから標準インストールの,% npm install -g openclaw@latest を経由した正規のインストールになっている。
一度だけゲートウェイをバックグラウンドに常駐
% openclaw gateway install
% openclaw gateway start
日常は以下で起動と終了
% openclaw
> /quit
停止する場合は
% openclaw gateway stop
負荷の確認は
% top -o cpu
top -o mem
調子悪ければ
% openclaw gateway restart
% openclaw doctor --fix



2026年6月16日火曜日

アンソロピック危機(2)

アンソロピック危機(1)からの続き



図:AI版の安全保障問題(Nano Banana 2による)


これで,生成AIが,原油やレアメタルのような資源であることが明確になった。入手ルートを分散させようにも,"産油国"は米国と中国だけだ。誰に聞いても国産開発をがんばるのは無理筋だというのだけれど,最先端でなくてもいいからローカルでそこそこ使えるものを国内基盤で賄えるようにしたほうがいいんではないの。


Q(koshix):
アンソロピックがMythosとFable5を停止させられた件ですが,そのしばらく前にAI開発の中断について言及していたことや,これまでも国防総省との関係で米政府と対立していたことなどを踏まえると,今回の米政府の動きには非常に政治的な匂いを感じます。そもそも他社のAIについても同等に近い性能があるはずで,客観的に見ればアンソロピックが狙い撃ちされているという感がいなめません。また,日本政府などはこれで,アメリカ依存の危険性を再び思い知ることになるでしょう。今後の展開について,深く分析してみてください。

A(ChatGPT):
整理すると、今回の件は「技術的安全保障措置」と「政治的圧力」の両方が重なった事案だと思います。

AnthropicのFable 5 / Mythos 5停止は、米政府の輸出管理指令によるものです。政府は国家安全保障上の懸念を理由にしたようですが、Anthropic側によれば、示された技術的根拠はかなり限定的で、他社の高性能AIにも同程度の能力があると主張しています。したがって、単純に「この2モデルだけが突出して危険だった」とは言い切れません。

一方で、Anthropic自身もFable 5やMythos 5を、サイバー・バイオ・化学などで非常に強力なデュアルユース能力を持つモデルとして説明していました。そのため、米政府が「これは輸出管理の対象になる」と判断する理屈も一応はあります。自分で「これは危険にもなり得る」と強調していたら、政府が本当に止めに来た、という面があります。

ただし、政治的文脈はかなり濃いです。Anthropicは以前から、軍・情報機関への提供はしつつも、国内大量監視や完全自律兵器への利用には反対していました。また、国防総省系の調達・安全保障指定をめぐって米政府と対立していました。さらに同社は、AI開発の一時停止や規制権限の必要性にも言及してきました。つまり、政府から見るとAnthropicは「強力なAIを持っているが、軍事利用では言うことを聞ききらない企業」に見えた可能性があります。

したがって、あなたの「狙い撃ち感がある」という見方はかなり妥当です。ただし、「完全な政治的報復」と断定するにはまだ証拠が不足しています。より正確には、技術的リスクを口実または根拠にしながら、政治・軍事・産業政策上の圧力が重なった、と見るのがよいと思います。

今後は、全面停止のままよりも、米国人・米政府・同盟国・認証企業などに分けたライセンス制に移る可能性が高いでしょう。完全停止は米国自身にも不便だからです。一方で、今回の件は「AIモデルそのもの」や「APIアクセス」も輸出管理対象になるという先例になります。これはGPU規制より一段踏み込んだ話です。

日本への教訓は明確です。米国AIを使うべきでない、という話ではありません。性能もエコシステムも依然として強い。しかし、行政・防衛・医療・金融・教育などの基盤を、米国企業のAPIが明日も同じ条件で使えるという前提だけで設計するのは危険です。必要なのは、国産・国内運用モデル、オープンウェイトモデル、複数ベンダー、停止時の代替運用手順を持つことです。

要するに、今回の事件は「Anthropicだけの問題」ではなく、AI版のエネルギー安全保障問題です。便利だから輸入に頼る。しかし止められたときに社会の中枢が止まるなら、それは単なる民間サービスではなく、国家インフラです。



P. S. 背景にはアマゾンが米政府(財務長官)にチクったということがあるらしい。それをアンソロピックが撥ね付けたので,こうなったというのだ。(backspace.fmの松尾さんの話

2026年6月15日月曜日

アンソロピック危機(1)



図:トランプ政権とアンソロピックの・・・(ChatGPTによる)

MediaWiki(5)で少しだけ触れた,「戦争で生成AIへのアクセスを止められたら」いう話題だが,相互関税と同じようなトランプ政権のノリで,戦争でなはないのに,あっという間に現実のものになってしまった。もう少し真剣に考えておくべきだった。もちろん,だからといって,何が改善されるというわけではない。直接本人に聞いてみた。

Q(koshix):
情報によると,米政府の要請によってAnthropicは最新のAIの提供を停止したとのことですが,具体的な状況を教えてください。

A(Claude):
詳しく確認するため、最新の報道を見てみます。公式声明を確認します。ご質問の件、まさに昨日(2026年6月12日)起きた出来事で、状況を整理してお伝えします。ただ、報道の前提を少し正確にしておくと、これは「最新AI全般の提供停止」ではなく、特定の2モデルを対象とした輸出規制措置です。

1.何が起きたか

米政府が国家安全保障上の権限を根拠に、Fable 5とMythos 5へのアクセスを「外国籍の人物(米国内外を問わず、Anthropicの外国籍従業員を含む)」すべてに対して停止するよう輸出規制指令を発出しました。これによりAnthropicは規制遵守のため、全顧客に対してこの2モデルを突然停止せざるを得なくなりました。他のAnthropicモデル(Claude Opus、Sonnet、Haikuなど)には影響しません。

指令が届いたのは米東部時間6月12日午後5時21分で、書簡には国家安全保障上の懸念の具体的な詳細は記されていなかったとのことです。

2.政府側の理由

商務長官のHoward Lutnick氏がAnthropic CEOのDario Amodei氏に書簡を送り、Mythos 5とFable 5を米国外および国内のすべての外国人に対する輸出規制の対象とすると伝えました。Axiosの報道によれば、別の企業がMythosを「ジェイルブレイク(安全機構の回避)」できたと主張し、それが政府に国家安全保障上のリスクの懸念を抱かせたことが、商務省が措置に踏み切った理由とされています。当局者によれば、政府は最新モデルのリリースを延期させようとしたが成功せず、その結果として輸出規制の書簡に至ったとのことです。

3.アンソロピック側の見解

Anthropicは指令には法的に従いつつも、内容には強く反論しています。同社の説明では、政府が把握したとされるのはFable 5のジェイルブレイク手法だと理解しており、その実演を確認したところ、すでに知られていた軽微な脆弱性をいくつか特定するものだったとのことです。これらの脆弱性は比較的単純で、回避策を使わなくても他の公開モデルでも発見できるものだったと述べています。

また政府から提供されたのは、特定のコードベースを読ませてソフトウェアの欠陥を修正させるという、狭く非汎用的なジェイルブレイクの口頭での証拠のみだったとし、その能力水準はOpenAIのGPT-5.5など他のモデルからも広く利用可能だと検証したとしています。Anthropicの主張の核心は、数億人に展開された商用モデルを、狭い範囲の潜在的ジェイルブレイクの発見を理由にリコールすべきではなく、もしこの基準が業界全体に適用されれば、すべてのフロンティアモデル提供企業の新規モデル展開が事実上停止してしまうという点です。

同社はこれは誤解だと考えており、できる限り早くアクセスを復旧させるべく作業していると述べ、顧客に対して混乱を謝罪しています。

4.背景

この件は突発的な摩擦ではなく、2026年初頭にトランプ政権がAnthropicのAIモデル(特にClaude)の軍事利用を無制限に認めるよう要請し、Anthropicが安全対策の除去への懸念を理由に拒否したことに端を発する、ホワイトハウスとの対立の延長線上にあります。2月27日には全連邦機関にAnthropic技術の使用即時停止が指示され、国防総省には6か月の移行期間が与えられました。Hegseth国防長官はAnthropicを「サプライチェーンリスク」に指定しています。

なお、これは6月13日時点での最新状況です。Anthropic自身が「今後24時間でさらに詳細を共有する」としており、事態は流動的なので、続報が出る可能性が高い点はご留意ください。

---
少し皮肉な状況ですが、私自身はClaude Opus 4.8として動いており、今回停止対象になったFable 5・Mythos 5とは別のモデルなので、こうして引き続き対応できています。


P. S. 外国籍排除ということで,アンソロピックの従業員にも影響があるらしく,それはそれで,開発ストップという彼らの主張に沿った結論に至るという皮肉な話になっている?

2026年6月14日日曜日

中ツ道

業平姿見の井戸からの続き



写真:中ツ道の記念道標(2026.6.14撮影)

朝の散歩コースの北東端あたりに天理市喜殿町のセブンイレブンがある。その北隣に古代官道「中ツ道」の記念道標があった。4月に除幕して奈良新聞で報道されてたのだが,6月に入って産経新聞が取上げてニュースになっていた。なぜ?

自分の家は下ツ道と中ツ道の中間に位置している。近鉄天理線二階堂駅西を下ツ道,前栽駅東を中ツ道が南北に走っていて,それぞれ散歩コースの一部になっている。かつての藤原京平城京を結ぶ古代の基幹道路である。さらに東には上ツ道があって,山辺の道はそのもう一つ東側の山裾になる。

中ツ道は奈良県道51号天理環状線と重なっているのだけれど,喜殿町以南は道がちょっと狭くて往生するのである。


[1]日本の古代道路(Wikipedia)

2026年6月13日土曜日

やまとecoクリーンセンター


写真:やまとecoクリーンセンター(公式サイトから引用)


このご時世のため入荷待ちで申し込んでから3ヶ月ほど待たされていた台所のLEDランプ交換がようやく完了した。ついでに6畳の和室用にAmazonで購入したパナソニックのLED照明の交換作業もついでにお願いしたので,うちの主な照明のLED化が完了した。

さて,すでに交換済みだったものも含め4台の廃棄用の蛍光灯がでてきた。天理市の清掃管理事務所に電話したところ,予約無しで受け付けてくれるそうだ。ところが,ホームページや案内パンフにはゴミの持ち込みには必ず予約をとる必要がある。当日はだめだと強調されていて混乱したが,よく読むと資源ゴミの場合は予約無し当日持ち込みでよいらしい。


天理市のゴミ処理場(環境クリーンセンター)は,かつては自宅から車で5分のところにあって便利だったのだが,2025年(令和7年)5月1日にオープンしたやまとecoの各施設に移転した。名阪国道北側にある,白川ダムとシャープ天理事業所(総合開発センター)に挟まれた土地のあたりだ(天理市岩屋町)。

これは,大和高田市,天理市山添村,三郷町,安堵町,川西町三宅町,上牧町,広陵町,河合町の10市町村でごみ処理施設の設置及び運営等を共同して行うことを目的とした一部事務組合「山辺・県北西部広域環境衛生組合」が設置・運営している(下線の4市町は住民の直接持ち込みも可)施設である。やまとeco=環境学習施設,リサイクルセンター=マテリアルリサイクル推進施設(粗大・リサイクル施設),クリーンセンター= エネルギー回収型廃棄物処理施設(焼却施設)からなっている。

我々が蛍光灯照明を持ち込んだのはやまとecoリサイクルセンターのほうで,その後,やまとecoクリーンセンターの見学にむかった。4Fに温浴施設(ジム&スパ)と3Fにごみミュージアムがある。3Fからは,焼却施設の工場内部や管理室をガラス越しに見ることができて,なかなかの壮観だった。

温浴施設は,昼から近所のじいちゃんばあちゃん達でたいそう賑わっていた。ゴミ処理場はしばしば迷惑施設としてその設置で揉めるのだが(奈良市がそうだ),天理市はなかなかうまい作戦を立てた。近隣市町村のゴミ収集車も西名阪道路や名阪国道経由でアクセスすることで,天理市内のゴミ収集車による交通混雑問題を回避しているようだ。クリーンセンターの廃熱で温浴施設(それほど大きいわけではない)というのもグッドアイデア。

2026年6月12日金曜日

ビートルズ


図:日本ビクターの1968年ステレオのそれ風イメージ(ChatGPT + Nano Banana 2)


NHKのうたコンが,来日から60年(1966.6.30-7.2)なのか,6月9日はロックの日ということで,ザ・ビートルズ特集をやっている。ビートルズの記憶は断片的に書いてきたが,すこしつなげてみよう。

中学2年のころ,家にある半分壊れかけていたトランジスタラジオをもらって,ベッドサイドで聞くようになった。当時流行っていてまず耳にしたのは,日本のフォークソングの周辺というか,大ヒットしていたザ・フォーク・クルセダーズの「帰って来たヨッパライ(1967.12)」「悲しくてやりきれない(1968.3)」,ザ・ダーツの「ケメ子の歌(1968.2)」,高石ともやの「受験生ブルース(1968.2)」などである。そこに,2年5組の同級生の小林博人君がザ・ビートルズのファンで,あれやこれがいいというのを聞いて感化されることになったのは以前書いた。

ビートルズを聞いて,最初に買ってもらったビートルズの370円のドーナツ盤は「ハロー・グッドバイ(1967.12)」だった。B面はアイ・アム・ザ・ウォルラス。その前の「愛こそはすべて(1967.8)」は,全世界宇宙中継で5月にテレビから流れていた。しかし,1966年のビートルズ訪日のころは,全く興味も関心もなかった。

次に買った?かもしれないのが,「レディ・マドンナ(1968.4)」で,小林君がビッグニュースだといって教えてくれたもの。いや,その前に,「マジカル・ミステリー・ツアー(1967.12)」の2枚組EP盤があった。同名のテレビ映画があって,これもテレビでみることができた。フール・オン・ザ・ヒルがいいとめずらしく父親がいった。

そうそう,これが実現したのは,ずいぶん旧くなっていた家のステレオを買い替えることになったからだ。なお,当時はオーディオシステムをステレオとよんでいた。写真のような家具調が主流で,まだ,コンポとも呼ばれていなかった。ヘッドフォンも珍しいものだった。そのたいそうなステレオは応接間のピアノの横に鎮座した。高度成長期まっただ中である。

中学3年に入って,小林君とは別のクラスになったが,ビー・ジーズファンの山田雄治君やウォーカー・ブラザースファンの出雲崎栄一君と同じ3年6組になったので,いよいよ本格的にポピュラーミュージック(洋楽)にはまっていった。他のミュージシャンもいろいろ興味深くて,自分の関心の中のビートルズのウェイトは小さくなっていく。

さて,わずか半年もなかったが,ビートルズの次の新曲がなかなかでない,まだかまだかと首を長くして待っていたころだ。バック・イン・ザ・USSRやレボリューションが次の新曲なのかとされたが,7分を越える「ヘイ・ジュード(1968.9)」が出て,これが次の新曲だということになんとなく確定することになった。あわてて片町の山畜に走った。たぶん,このころが自分のビートルズのピークだった。

その後,ゲット・バック,レット・イット・ビー,ホワイトアルバムなどが登場するのだけれど,ちょっと手が伸びなかった。50年後に,記憶をたどるようにCD2枚組のビートルズベストアルバムをようやく買った。

(付)マジカル・ミステリー・ツアー EP盤の収録曲
  A1「マジカル・ミステリー・ツアー」
  A2「ユア・マザー・シュッド・ノウ」
  B1「アイ・アム・ザ・ウォルラス」
  C1「フール・オン・ザ・ヒル」
  C2「フライング」
  D1「ブルー・ジェイ・ウェイ」


2026年6月11日木曜日

iPadの更新

iPadWWDC26 からの続き


図:iPadの比較(Appleからの引用)


WWDC26はボケッと聞いていたけれど,その後もいろいろ伝わってくる。一番大きかったのは,自分のiPad Pro 11inch 第一世代(256GB,2018)が,iPadOS27 アップグレード対象外になってしまったことだ。定年退職直前に,孫のお守りや非常勤の授業対応や日本物理教育学会の論文査読などを主目的に購入してもう丸8年も経ってしまった。まあ替え時ではある。

さっそく,後継機種として何を買うべきかをChatGPTに相談してみた。
iPad Air M4 11inch(256GB,2026):114,800 + Apple Pencil Pro:21,800 + Magic Keyboard:46,800 = 184,400(159,400 現行機種下取り後)となる。前回は,iPad Pro 11inch 第一世代(256GB,2018):106,800 + Apple Pencil:14,500 + Smart Keyboard Folio:19,800 = 141,100 であった。

Appleの比較表によると,自分が気になった大きな違いはFaceIDがなくなって,Touch ID(電源ボタン)になることだけである。FaceIDを使うためには,iPad Pro 11inch M4にする必要があって,6万円以上高くなる。ChatGPTは,iPad Proはやめておいたほうがよいと仰せになった。了解しました。

なお,Apple Intelligence は一部を除いていちおうそれなりに使えそうだ。Touch IDだけ少し気になって念押ししたが,MacBook Air M1 のそれが大丈夫なら心配ないといわれた。


2026年6月10日水曜日

WWDC26

WWDC25からの続き


写真:WWDC26の始まり,ティム・クックともこれでお別れ(Apple から引用)


2026年6月8日午後10時(PDT),6月9日午前2時(JST),カリフォルニア州クパチーノのApple本社でWWDC26の基調講演が始まった。毎年,録画をみているが,2020年のコロナ蔓延以降,ライブの迫力は失われてしまった。以前は,英語がスムーズに耳に入ってきたが,このところティム・クックの話以外は今一つわからないものが多い。

ソフトウェアエンジニアリング上級副社長のクレイグ・フェディリギによる進行で,(1) Platform Improvements,(2) Trust and Safety,(3) Apple Intelligence and Siri の3部で解説があった。全体として,いまいち感動に欠けるものだった(2年前にApple Intelligenceの発表済んでるしね)。

全て(でもないか)のOS27群に共通する基盤であるLiquid Glass からはじまって,応答が早くなるとか,基本性能がブラッシュアップされたという話から始まる。地味だ。最近話題になっている,子ども向けの様々な基本安全機能が整備されているということが強調されていた。macOSはGolden Gate

新しいOS27 Siri AIについては,いろいろあったのだけれど,最も高度な機能(表情豊かな音声と高度なディクテーション)は,iPhone17Pro,iPhone Air,iPad M4,Mac M3(12GB)以降でなければ実現されない。そもそも自分のiPhone SE2では,iOS27が動くとはいうもののApple Intelligenceの機能は全く使えない。だめじゃん。MacBook Air M1(16GB)については使えるらしいので一安心だが,カメラに映るものを分析することなどは出来ない。


2026年6月9日火曜日

NotebookLM + Claude(3)

NotebookLM + Claude(2)からの続き

Q(koshix):
NotebookLM + Claude の具体的利用例をいろいろと教えてください。

A(Claude):
NotebookLM と Claude は、性格の違うAIをひとつのワークフローに組み込むときに最も力を発揮します。前者は「アップロードされた資料群の内部に閉じた、出典付きの応答エンジン」、後者は「資料に縛られず思考・議論・翻訳・推敲を担う対話的書き手」と整理すると、両者の役割分担が見えやすくなります。以下、koshix さんの実際の関心領域に即して、具体的なシナリオを挙げます。

(以下タイトルだけ抜粋)
1. ブログ記事執筆のための調査と起草の分業
2. Fisica Wiki のための翻訳と用語決定
3. 一次資料に基づく時事分析
4. 書籍との長期対話
5. 自己アーカイブとしての過去ブログの活用
6. 自分の草稿のセルフ・ファクトチェック
7. 講演・インタビュー動画の批判的咀嚼

総じて言えば、NotebookLM は 出典に閉じた厳密さ を、Claude は 出典を超えた思想的展開と文章化 を担当する、という非対称的な分業が両者の最良の組み合わせです。前者を「資料に対する正確な記憶」、後者を「資料を踏まえた思考と執筆」と捉えると、ご自身の長年のスタイル──源泉重視と高抽象な評論文──の両軸をそれぞれ補強する道具立てになると思います。

Q(koshix):
ちょっと視点を変えて,いつもの自分の作業パターンではないけれど,こんな使い方ができるんだという,新しい発見をうながすような提案はないですかね。

A(Claude):
いくつか、普段の作業の延長線上にない角度から提案します。

1.自分の思考の「盲点地図」を作る
過去ブログの PDF を NotebookLM に一括投入し、「著者が繰り返し前提にしているが、一度も根拠を示していない命題を列挙せよ」と問う。自分の論考の中から自分では気づきにくい暗黙の公理を抽出させる試みです。次に Claude に「その前提のひとつに対して、最も強力な反論を構成せよ」と依頼する。自分の書いたものが素材でありながら、自分の思想の免疫系を試す装置になります。

2.孫への「物理絵本」の生成実験
涼葉さん、紡木さん、風葉さんの年齢に合わせて、Claude に「ヤマト三山と万有引力」「箸墓古墳と円の幾何学」のような奈良の風景を素材にした短い科学読み物を書かせる。絵本的な語り口の文章を生成させ、SVG ないし HTML アーティファクトで簡単なインタラクティブ図解を添える。祖父が手渡す一点物のコンテンツになります。普段の評論執筆とはまったく異なる文体制御の訓練にもなる。

3.「知的先達との対話」シミュレーション
たとえばボーア、ハイゼンベルク、あるいは朝永振一郎の著作・講演録・書簡集を NotebookLM に投入し、その人物の語り方を出典ベースで把握したうえで、Claude に「この人物が koshix の最新ブログ記事を読んだ場合、どう批評するか」を演じさせる。単なるロールプレイではなく、出典に裏打ちされた語彙・論法・関心軸を NotebookLM が提供するので、相当の解像度が出ます。

4.NotebookLM の「ポッドキャスト機能」を批評の素材にする
これが最も意外性のある提案かもしれません。自分の草稿や収集資料から NotebookLM に Audio Overview(二人の話者による対話形式の要約音声)を生成させ、それを 批評の対象 として Claude に渡す。「この対話が落としている論点はどこか」「二人の話者が暗黙に共有している前提は何か」を分析させると、自分の思考の何が「自明」として処理されているかが照射されます。散歩中に耳で受け取り、帰宅後に Claude へ批評を依頼するという時間差ワークフローも面白い。

5.文体の「逆工学」実験
深く共鳴する書き手──たとえば大澤真幸、柄谷行人、あるいは物理畑なら佐藤文隆──のテキストを NotebookLM に入れ、「この書き手の論理展開の型、好む比喩の種類、段落構成の癖を記述せよ」と問う。出典付きで文体の骨格が出てきたら、それを Claude に渡し「koshix の直近ブログ記事を、この文体的傾向に近づけながら書き直せ」と依頼する。自分の文体の輪郭が、他者との差分として初めて見えてくる体験になります。

6.「十年後の読者」からのフィードバック
Claude に「2035年の読者として、このブログ記事を読んでいる」という設定を与え、「当時の文脈を知らない未来の読者が理解できない箇所、あるいは予言的に見える箇所、逆に時代に回収されてしまった箇所を指摘せよ」と頼む。時事評論の射程と普遍性を自己評価するための、時間軸を使った視点の強制転換です。

いずれも「調べる・書く・翻訳する」という既存の作業パターンの外側にある、自分を素材にする・時間軸をずらす・他者の視点を構造的に呼び込む という方向の使い方です。特に「盲点地図」と「Audio Overview の批評」は、AIを道具として使うのではなく、AIに自分の思考を照らさせるという逆転した関係性を試す点で、最も新鮮な体験になるのではないかと思います。

2026年6月8日月曜日

NotebookLM + Claude(2)

NotebookLM + Claude(1)からの続き

取りあえずインストールする前に,課金関係についてGeminiに尋ねてみた。NotebookLMは無料版で十分らしい。無料版(Pro版 2900円)では,月間ノートブック100冊(500冊),1ノートブックあたりの資料数50件(300件),チャット回数50回/日(500回/日)。1資料あたり上限が,200MB&50万語となっているので,1つのノートブックにおよそ50冊のテキストブックを収められる。なお,音声・ビデオ再生は,3回/日(20回/日)である。

Claude Codeは以前$5デポジットして試用していたので,そのまま使えるかと思ったが,4/1から消費税の扱いが変更になったとかで,API側からのデポジットがTAX番号なしではうまくいかない。しかたがないので,Claude Pro の1ヶ月分をオーダーしてキャンセルする。Claudeにもこれでよいことを確認した(5/16/2026)。

導入とテストの作業は以下のとおりである。
Step 1: ツール管理ツール uv の導入(未導入の場合)
brew install uv
Step 2: notebooklm-mcp-cli のインストール
uv tool install notebooklm-mcp-cli
Step 3: Googleアカウント(NotebookLM)との連携認証
nlm login
Step 4: Claude CodeへのMCPサーバー登録
claude mcp add notebooklm-python -- uvx --from notebooklm-mcp-cli notebooklm-mcp

テストタスクの実行(Claude Codeとの対話)
claude
ノートブックの作成
「NotebookLMに『MCP-Test-Notebook』という名前で新しいノートブックを作成して」
ソースURLの追加指示
「作成したノートブックに、次のURLをソースとして追加して:
 [https://ja.wikipedia.org/wiki/Model_Context_Protocol](https://ja.wikipedia.org/wiki/Model_Context_Protocol)」
 知識の引き出しと制限付きの出力を指示する
 「いま追加したNotebookLMのソース『だけ』を根拠にして、MCPが解決しようとしている課題と主要なコンポーネントを箇条書きで整理して。ソースに記載がない独自の推測や外部知識は絶対に混ぜないで」
 

実際にはClaudeに相談し「NotebookLMにアクセスして、私のノートブック一覧を教えて」を試した。

Claudeがいうには,以下のような構造になっている。
あなた
  ↓ プロンプト
Claude Code (CLIプロセス, ローカル)
  ↓ MCPプロトコル
notebooklm-mcp-cli (Pythonプロセス, ローカル)
  ↓ Playwright ブラウザ自動操作
notebooklm.google.com (Google のサーバー)
  ↓ RAG検索(アップロード済みソースのみ)
回答 → 逆順に返ってくる

・NotebookLM MCPでできること
  あなたが事前にNotebookLMにアップロードした文書の中を検索・質問する
  いわば「自分の本棚」の中を探すだけ
・できないこと
  arXiv新着論文のリアルタイム検索
  外部Webの自動クロール・収集
・複数ノートブックをまたいだ分析について
  各ノートブックは完全に独立したサイロとして動作。
  ノートブック横断のクエリはNotebookLM単体では不可。 
  今回の構成(Claude Code + MCP)ではClaude側で統合は理論上可能。

2026年6月7日日曜日

NotebookLM + Claude(1)

Claude Code からの続き

Q(koshix):
NotebookLM + Claude がすごいという話題なのですけれど,
なにがすごいといわれていますか?それはどこまで本当ですか?

A(Grok):
NotebookLM + Claude の組み合わせが「すごい」と言われる主な理由は、両者の強みを補完し合う「神連携」による業務効率化・研究力の劇的向上です。 特に日本を含むAIヘビーユーザー間で2026年頃に話題が広がっています。

1.何がすごいと言われているか(主な称賛ポイント)

(1) ハルシネーション(AIの嘘・創作)の大幅抑制 + 資料 grounded 処理
NotebookLMはアップロードした資料のみを情報源にし、外部知識を混ぜない(条文にないことは絶対生成しない)。Claude単独だと学習データからの補完が入りやすいのに対し、NotebookLMで事前処理してからClaudeに渡すと信頼性が跳ね上がる。

(2) コスト破壊(トークン消費1/10レベル)
重い資料読み込み・要約・リサーチを無料/低コストのNotebookLM(Gemini基盤)に丸投げし、Claudeは仕上げ(創造・分析・コード生成)だけ担当。Claudeの高いトークン代を大幅削減し、「無限記憶」のような使い方が可能に。

(3) リサーチ・知識処理の爆速化
NotebookLMで大量のPDF/URL/YouTube/音声などを一気に取り込み、Audio Overview(2人のAIホストが自然なポッドキャスト形式で議論する機能)で内容を「体験」できる。
これをClaudeに渡してさらに深掘り・スライド作成・要約・スキル構築などに活用。研究・資料作成・会議まとめなどが劇的に速くなる。

(4) 実務・クリエイティブでの具体的な成果例
サムネイル設計の心理学をNotebookLMで調べ、Claudeでスキル化 → 出力品質が段違い。
議事録まとめが2時間→10分に。
自分専用AIエージェント構築、競合分析、プレゼン資料自動化など。
MCP(Model Context Protocol)などの統合で、Claudeから直接NotebookLMを操作可能になり、ワークフローがシームレス。

(5) 「第二の脳」的な体験
NotebookLMの grounded 知識ベース + Claudeの優れた推論・創造性を組み合わせることで、大量資料を扱った高度な知的作業が現実的になる。教育・研究・ビジネスで「根本から変えるレベル」と評価される声も。

2.それはどこまで本当か?(現実的な評価)
かなり本当ですが、万能ではなく「使い分けと設計」が鍵です。

(1) 本当の強力な部分:
特に大量資料を扱うリサーチ・要約・知識管理では、単独使用より明確に優位。コスト削減と正確性向上は多くの実例で確認されている。
Audio Overviewは日本語対応も進んでおり、ポッドキャスト風まとめは「衝撃的」と評判が高い。
統合(MCPやnotebooklm-pyなど)で利便性がさらに上がっている。

(2) 限界・注意点:
NotebookLMの出力品質は投入する資料の質に強く依存する。悪いソースを入れても魔法は起きない。
Claudeの創造性は強いが、完全にハルシネーションゼロにはならない(NotebookLMでgroundingしても最終出力で注意)。
セットアップ(連携ツールの使用)に少し学習コストがかかる場合あり。シンプルにコピペ連携だけでも効果は出るが、本領発揮には工夫が必要。
Claude Projects機能が強力になった今、「NotebookLM不要派」もいる(音声機能などはNotebookLM優位)。

(3) 結論:
 「すごい」という話題は過大広告ではなく、実務で明確な生産性向上を実感できるレベルの組み合わせです。特に知識労働者・研究者・コンテンツ制作者に向いています。まずは無料でNotebookLMに資料を放り込んでAudio Overviewを試し、それをClaudeに投げてみるのがおすすめ。自分のワークフローに合うか体感するのが一番確実です。