2024年9月28日土曜日

宮越家花鳥図

宮腰からの続き

以前,宮腰(金沢市金石)と勘違いしてしまった,青森県中泊町の旧家宮越家の話題がまた登場していた。宮越家の離れ詩夢庵にあった狩野派の襖絵(伝狩野山楽筆)が,実は,大英博物館に所蔵されている秋冬花鳥図(17世紀狩野派)と対になる春夏花鳥図である可能性が非常に高いことが判明したというものだ。

大英博物館によれば,秋冬花鳥図の裏書に,大和の談山神社の近くの地名が記されていて,これらの対となる襖絵は元来談山神社に所蔵されていたと推定されている。大英博物館の秋冬花鳥図は,2018年に,キヤノンの綴りプロジェクトによって高精細複製品が制作された。そして,談山神社に里帰り奉納されて常設展示されることになる。ところがですね,肝腎の談山神社のホームページをみると,一瞬その写真がみえるだけで,まったく説明も案内も宣伝もされていないのであった。しっかりしてよね。

奈良県桜井市多武峰(とうのみね)にある談山神社(たんざんじんじゃ)は,中臣鎌足と中大兄皇子が乙巳の変の謀議を図ったところということで有名だ。2回ほど訪れたことがある。何かの行事で蹴鞠やってたかな。


写真:宮越家詩夢庵の春夏花鳥図(日本経済新聞から引用)


2024年9月27日金曜日

第2の月

準衛星からの続き

準衛星に似ているが,少し違う概念が一時衛星(Temporary Satellite)である。地球の回りを周回して離脱するものと,フライバイするものがある。これまでに4例知られていた。1991VG(フィライバイ),2006RH120(周回),2020CD3(周回),2022NX1(フライバイ)

もうすぐ,次の候補がやってくる。2024 PT5(フライバイ)で,7-13mの直径を持ち,2024年の9月29日から11月25日まで地球の周回軌道にあるらしい。

図をみると,地球から月の軌道の1.5-3倍程度の距離を通過するので,ヒル球の内側にある。ただ,地球からの距離だけが地球の周回軌道の条件ではないようだ。図でも周回軌道に入るの位置は,地球への最近接点よりも遠くなっている。

地心エネルギー(Geocentric Energy)= 地球中心においた座標系から見た,衛星の運動エネルギーと地球による重力の位置エネルギーの和が負になるという条件を満たすとき,周回軌道にあるというらしい。



図:2024PT5の軌道(sorae [1] から引用)


2024年9月26日木曜日

ChatGPT Advanced Voice Mode

OpenAIがChatGPTのスピーチモードを改良して,アドバンスト・ボイス・モードとした。平均反応速度が0.3秒とこれまでに比べてかなり速いため,普通の人間の会話と同様のスピードで応答することができる。日経夕刊によれば,日本語や韓国語など50以上の言語に対応して,有料サービス利用者を対象に,9月24日から使えるようになった。

早速iPhoneのChatGPTで試して見たのが次のものだ。会話記録はテキストとして保存され,パソコン側のChatGPTからも参照することができた。会話スピードは本当に改善されている。ただし,画像アップロードは,日本のiPhone環境ではまだ未実装なのかもしれない。

koshix:“あなたはアドバンストですか?” 00:02

ChatGPT:
いいえ、私はAdvanced ChatGPTではなく、ChatGPTです。でも、様々な情報や質問にお答えすることができますよ。何かお手伝いしましょうか?

koshix:“アドバンススピーチではないのですか?” 00:02

ChatGPT:
はい、私は「Advanced SPeeCH」ではなく、「ChatGPT」です。しかし、さまざまな話題に対応できるようにトレーニングされているので、何でも聞いてください。

koshix:“9月24日から使えるようになったバージョンではないのですか?” 00:05

ChatGPT:
私はChatGPTですが、2024年9月24日から利用可能となった新しいバージョンの一部である可能性があります。何か特定の質問や相談があれば、お気軽にお聞きください。

koshix:“今日は何日ですか?” 00:01

ChatGPT:
今日は2024年9月25日です。

koshix:“ここはどこですか?” 00:01

ChatGPT:
ここは、あなたがChatGPTとお話ししている仮想空間です。スマートフォンやコンピュータを通じて、私と会話しているんですよ。

koshix:“私は物理世界ではどこにいるかわかりますか?” 00:04

ChatGPT:
申し訳ありませんが、私にはあなたの物理的な場所を特定する能力はありません。あなたのプライバシーを保護するために、そのような情報は収集していません。 
koshix:“よくわかります。” 00:01

ChatGPT:
ありがとうございます。他に何か気になることや質問があれば、何でも聞いてくださいね。

koshix:“あなたは画像イメージを見ていろいろ考えることができますか?” 00:05

ChatGPT:
はい、画像を見て、その内容に基づいて情報を提供することができます。何か特定の画像について知りたいことがあれば、どうぞお知らせください。

koshix:“あなたに画像を提供する方法を教えてください。” 00:03

ChatGPT:
iOSアプリをご利用の場合、画面下部にある写真アイコンをタップすると、画像をアップロードできます。ぜひ、試してみてください!

koshix:
“今、会話しているこの画面には画像アイコンが見えないのですけれども” 00:05

ChatGPT:
それは失礼いたしました。お使いの環境によっては、画像アップロードのオプションが表示されない場合もあります。この場合、私が画像を確認することはできませんが、何かほかにお手伝いできることがあれば、お気軽にお知らせください。
対話画面は,これまでのような白黒の画面ではなくて,ブルースカイのような画面だった。


写真:ChatGPT Advanced Voice Mode (iPhone画面から引用)

OpenAIはもう危ないとか,サム・アルトマンは大丈夫かとかいろいろいわれているが,今のところまだトップランナーを走っている。そうこう言っているうちに,CTO のミラ・ムラティも退社している。大丈夫か。


2024年9月25日水曜日

知性のエコシステム

知性の物理学からの続き

自由エネルギー原理はやっぱりちゃんと勉強しておいたほうがいいような気がしてきた。
Q(koshix):
この内容をできるだけかみ砕いて具体的な事例をあげながら説明してください。

A(ChatGPT-4o):
この文書は、自由エネルギー原理(FEP)と能動推論(AIF)に関する解説です。これらは、脳が環境を認識し、行動を決定するプロセスを説明する理論であり、人工知能(AI)の設計にも影響を与える概念として紹介されています。以下、重要なポイントを具体的な例を交えて簡潔に説明します。

1.自由エネルギー原理(FEP)とは何か?
FEPは、脳が自分の内部状態と外部の環境の間に整合性を保つための理論です。脳は環境に基づく予測を行い、その予測と実際の観測との「誤差(サプライズ)」を最小化しようとします。この「誤差」を少なくするために、脳は環境を学習し、行動を調整します。

具体例:例えば、あなたが手を伸ばしてコップを掴もうとする時、脳は「手がコップに触れる」という予測を立てています。しかし、もし手がコップに届かなければ、それは脳にとって「サプライズ」です。この誤差を最小にするため、脳は手の動きを修正し、コップを正確に掴もうとします。

2.能動推論(AIF)とは何か?
AIFは、FEPを基にした行動生成のモデルです。FEPは単なる脳の認識プロセスを説明するだけでなく、行動をどのように決定するかも説明します。脳は、予測と実際の感覚とのギャップを埋めるために行動を生成します。

具体例:例えば、寒いと感じる時、脳は「体温を上げるべきだ」と判断し、震え始めます。この震えは筋肉を動かして体温を上げるための行動で、これによって「寒さ」という予測誤差を最小化しようとしているのです。

3.FEPとAIへの応用
FEPの考え方は、AIにも応用されています。AIは、環境を観測し、その観測結果に基づいて行動を決定します。FEPをAIに適用することで、環境に対して適応的な行動を取るAIの設計が可能になります。AIが環境の変化に素早く適応し、予測誤差を最小化しようとするシステムです。

具体例:自動運転車が道を走る際、カメラやセンサーで道路状況を観測し、障害物を回避しながら進む行動をします。FEPを取り入れたAIは、車が「進むべき経路」を予測し、もしその予測が間違っていれば、障害物を避けるために経路を修正します。

4.能動推論と最適制御の違い
FEPに基づく能動推論は、最適制御理論と似ていますが、いくつかの違いがあります。最適制御では、事前に決められた目標に向かって行動を最適化しますが、AIFはもっと柔軟で、予測誤差を最小化するために行動そのものを調整します。

具体例:最適制御では、ロボットが正確に決められた動きで物体を持ち上げるように設計されると考えます。しかし、AIFを使った場合、ロボットは物体を持ち上げる最適な動きを「自ら学習」し、必要に応じて動きを変えます。

まとめ
FEPとAIFは、脳やAIが環境をどのように認識し、どのように行動を決定するかを説明する理論です。これらの理論は、AIの設計においても重要な示唆を与えており、特に複雑な環境で柔軟に対応できるAIの設計に役立ちます。

この文書は、AIの設計に興味がある方にとって非常に興味深い内容となっており、脳の仕組みを模倣した次世代のAI設計に向けた重要なステップを示しています​。


Q(koshix):
先ほどの説明を前提にした上で,新しく追加した論文の内容を同じように
分かりやすくかみ砕いて事例を挙げながら説明してください。

A(ChatGPT-4o):
新しい論文の内容も、前提となる「自由エネルギー原理(FEP)」と「能動推論(AIF)」を基盤にしています。この論文では、特にエコシステムとしての知性について議論されています。簡潔に、具体的な事例を挙げながら、分かりやすく説明します。

1.エコシステムとしての知性とは?
この論文は、人間の知性と人工知能(AI)が共同して機能する「知性のエコシステム」を提案しています。ここでの「知性」とは、環境の変化に適応し、自分自身の存在を裏付ける情報を集めるプロセスを指します。この考え方は、単一のAIや人間の知性を超えて、複数の知性がネットワークとして協力することで新しい形の知性を生み出すことを意味しています。

具体例:例えば、都市のスマート交通システムでは、各車両がセンサーで道路状況を観測し、信号機や他の車両とリアルタイムで通信します。これにより、各車両が環境に応じて最適な行動を取ることができ、交通渋滞や事故のリスクを減らします。このようなシステムでは、車両、信号機、センサーなどが協力して動く「知性のエコシステム」となっています。

2.能動推論とマルチスケールAI
論文では、AIシステムを複数のスケールで設計する重要性が強調されています。能動推論は、単一のAIが複数のタスクを行うのではなく、複数のAIが異なる役割を持ちながら協力するためのフレームワークとして説明されています。異なるスケールで情報を処理し、それを統合することで、より柔軟で効率的な知性が生まれると考えられています。

具体例:自律ロボットがある工場内で働くと仮定しましょう。一部のロボットは原材料を運び、別のロボットは製品を組み立て、さらに別のロボットは品質管理を担当します。これらのロボットはそれぞれ異なるスケールのタスクを処理しますが、全体として効率よく生産を行うためには、お互いに情報を共有し、協力し合う必要があります。能動推論は、これを可能にする理論です。

3.AIの学習と不確実性の解消
この論文は、AIが自身の不確実性をどのように管理するかについても議論しています。AIは自分が持っているデータに基づいて世界を理解しますが、その理解には不確実性が伴います。この不確実性を減らすために、AIは新しいデータを集め、モデルを更新します。

具体例:自動運転車が雨の日に走行する場合、カメラで路面の状況を観察しますが、視界が悪くなるため、不確実性が増します。AIは、この不確実性を解消するために、より多くのセンサーから情報を集め、路面の状態に基づいてスピードを調整したり、車線変更を判断します。

4.共有知性とコミュニケーション
論文では、複数の知性が協力する際には、共通の「生成モデル」を共有することが重要だとしています。これは、AI同士が互いに理解し合い、共同で行動するための枠組みです。これにより、個々のAIが独立して動作するだけでなく、集団として新しい知性を生み出すことが可能になります。

具体例:あるプロジェクトチームがAIを使って研究開発を行う場合、各メンバーのAIは異なるデータを扱っているかもしれません。しかし、全員が同じ目標(例えば、最も効率的な新素材の開発)に向けて動いていると、個々のAIの成果を統合し、新しい知見を得ることができます。

5.AI倫理と社会的影響
知性のエコシステムを設計する際には、倫理的な配慮も必要です。AIが人間の価値観と一致する形で行動することが重要であり、特に複数のAIが協力するシステムでは、偏見や誤った判断が広がるリスクがあります。

具体例:AIが採用プロセスで使われる場合、過去のデータに基づいて判断を行うと、過去の偏見が引き継がれる可能性があります。このため、AIが透明で公平な判断を行うためのルールを設け、社会的に有害な影響を避けることが重要です。

まとめ
この論文は、AIが単独で機能するのではなく、複数のAIが協力し合う「知性のエコシステム」を作り出すことの重要性を説いています。能動推論を基盤にすることで、AIは不確実性を減らし、複雑な環境に適応しながら共同で問題を解決する能力を持つようになります​。



図:知性のエコシステムのイメージ(DALL-E3による)

2024年9月24日火曜日

知性の物理学

茂木健一郎のPIVOTチャンネルが,「生成AIを丸裸にする知性の物理学」というタイトルで,ハーバード大学脳科学センターで知性の物理学プログラムを主催している田中秀宣さんを招いて対談をしていた。とても刺激的で良かったのだけれど,今一つ具体性にかけて空振りが続く試合だった。そういえば,東大理学部物理にも統計力学の樺島祥介さんが主催する「知の物理学研究センター」というのがあったね。
Q(koshix):
知性の物理学 Physics of Intelligence について教えてください。
専門用語を避けずに説明して見てください。多角的な視点はOKです。

A(Gemini 1.5 PRO)
知性の物理学:専門用語を交えた多角的な解説
「知性の物理学」とは、従来、哲学や心理学の領域であった「知性」を、物理学の厳密な枠組みで理解しようとする学際的な研究分野です。近年、人工知能の発展や脳科学の進歩を背景に、急速に注目を集めています。

1.知性の物理学の目的
知性の本質の解明:知性を、単なる情報処理ではなく、物理的な現象として捉え、その本質を明らかにすることを目指します。
人工知能の限界と可能性:人工知能のさらなる発展のために、人間の知性の仕組みを解明し、それを模倣する技術開発を目指します。
脳科学との連携:脳イメージング技術などの進歩を活かし、脳内の情報処理メカニズムと知性の関係を解明します。

2.知性の物理学における主要なアプローチ
神経回路網の物理モデル:脳の神経回路網を、物理学のモデルを用いて記述し、学習や記憶といった高次脳機能をシミュレーションします。
情報熱力学:情報処理とエネルギー消費の関係を、熱力学の法則に基づいて考察し、知性の効率的な実現を目指します。
量子脳理論:量子力学的な現象が、意識や創造性といった高次の認知機能に関わっている可能性を探求します。

3.知性の物理学が扱う概念
複雑系:脳は、多数の要素が複雑に相互作用する複雑系であり、そのダイナミクスを理解することは大きな課題です。
エマージェント現象:個々の要素の性質だけでは説明できない、全体として現れる新たな性質を指します。知性は、脳の複雑系からエマージェントに現れる現象と考えられます。
計算論的神経科学:脳の情報処理を、計算論的な視点から解析し、神経回路網の機能をモデル化します。

4.知性の物理学が抱える課題
意識の問題:意識の起源や本質は、哲学、神経科学、物理学など、様々な分野で議論されている難問です。
測定の問題:脳の活動を直接観測することは困難であり、間接的な方法を用いる必要があります。
モデルの複雑性:脳の機能を完全に再現できるようなモデルを構築することは、非常に困難です。

5.知性の物理学の将来展望
汎用人工知能の実現:人間の知能に匹敵する、あるいはそれを超える人工知能の開発が期待されます。
脳疾患の治療:脳のメカニズムの解明は、アルツハイマー病や統合失調症などの脳疾患の治療法開発につながる可能性があります。
人間理解の深化:知性の物理学は、人間がどのように思考し、学習し、創造性を発揮するのかをより深く理解するための新たな視点を提供します。

6.より専門的な用語
相転移:物質の状態が、ある特定の条件下で急激に変化する現象。脳の学習過程における相転移が注目されています。
自由エネルギー原理:脳が、外界の情報と内部モデルとの間の不一致を最小化するように機能するという仮説。
結合係数:神経回路網において、ニューロン間の接続の強さを表すパラメータ。学習によって変化します。

知性の物理学は、物理学、脳科学、コンピュータサイエンスなど、多岐にわたる分野の研究者が集結し、共同で研究を進めている最先端の学問分野です。
この分野の研究は、人間の知性の謎を解き明かすだけでなく、人類の未来を大きく変える可能性を秘めています。 

図:知性の物理学のイメージ(Imagen3に拒否られ,DALL-E3に描かせたもの)


結局なんだかよくわからないのであった。神経網が生成する人間の知性と,ニューラルネットが生成するAIを同じ土俵の上に上げて,後者は単に設計された機械(もしくはソフトウェア)ではなくて,物理的な現象としての創発過程として理解しようという話だ。というのも,生成AIがこのようにうまく機能している状態がそもそもよく理解できていないからである。とにかく計算リソースをつぎこんで適当にダイヤルを回しているうちに動いてしまったようなこと。

その上で,これを知性の物理学というからには,知性とは何かを定量的に捉えて,測定可能な量を用いて定義する必要があるのだけれども,そのあたりは十分説明されていない。すなわち何らかの主導原理的なストーリーがなくて,あるいは鍵となる仮説や実験事実の背景がないままに,妖しいキーワードとしての,脳科学,量子脳理論,複雑系が多用されるのはちょっとかんべんしてほしいかなあ。

あと,ハーバードやMITが西海岸と違って,より理学部的にアプローチしているという話はわからなくもなかったが,医学・生理学とのつながりを重視する方向に傾きすぎているのではないかという気もした。いや,もちろんそちら側に正解があるのかもしれないけれど,どうなのだろうか。



2024年9月23日月曜日

梨園

奈良県の大淀町,近鉄吉野線の大阿太駅の北側には,大阿太高原といって果樹園や観光農園が広がっている。この季節ならば梨園だ。家からは明日香村経由で車で小一時間のところにある。

ChatGPTに教えてもらった龍水園は今の時期二十世紀しかなく,百華園はネット販売が中心なのかお客さんがみあたらない。にぎわっているのは梨狩りができる観光農園だけれども,食べ放題とかいわれても老人にはちょっとしんどい。

さて,歌舞伎の世界を梨園というのはどうしてだろうかという問題が発生したので,早速帰ってからWikipediaで調べて見た。
梨園(りえん)とは中国・唐の宮廷音楽家養成所である。日本では転じて、一般社会の常識とかけ離れた封建・特殊社会として、かつての歌舞伎俳優の社会を差別的に表す。(Wikipedia)

由来:語の由来は、唐の玄宗の初年(712年)に、唐都長安西北郊の西内苑内で、芸人達を梨が植えられている梨園と称される庭園に集め、音楽教習府と呼ばれる施設で芸を磨いたことに始まる。 (Wikipedia)

そうなのか。由来についてはよく理解できた。ただ,最近の週刊誌記事を見ている限りは,差別的な表現とまでは思われなかったけれど・・・昔はそんな使われ方をしていたのだろうか。


写真:梨園の二十世紀?(なら旅ネットから引用)

2024年9月22日日曜日

OpenAI o1(4)

OpenAI o1(3)からの続き

引き続き,o1 のプログラミング能力について検証してみよう。数学体感教室2024の問題3を一般化したものについて,o1-mini に Julia プログラムを作成させた。1回目は関数定義が重複するエラーが出ていたので,そのエラーコードを読ませると,2回目には正しい答えが得られた。
Q(koshix):
$a_i \ (i=1 ... n) $が正の整数であり,$n$個の$a_i$の組 $(a_1, a_2,  ..., a_n)$ 最大公約数は1であるとする。
$a_1/a_2=k_1,\  2*a_2/a_3=k_2, \ 3*a_3/a_4=k_3,\  ... (n-1)*a_{n-1}/a_n \\ =k_{n-1},  n*a_n/a_1 = k_n $において,$(k_1, k_2, ... k_n)$ は整数となって,$k_1*k_2*k_3*...*k_{n-1}*k_n = n!$ が成り立つ。
$n$を与えたときに,上記の条件を満足する$(k_1, k_2, ..., k_n)$ の組の数 $b_n$ を求める Julia プログラムを作成せよ。
このプログラムを用いて,$ b_1, b_2, ..., b_8$ の値を計算せよ。

A(OpenAI o1-mini 思考時間29秒):
以下に、与えられた条件を満たす $(k_1, k_2, ..., k_n)$の組の数 $b_n$ を計算する Julia プログラムを示します。このプログラムは、各 $n$に対して $n!$ の素因数分解を行い、各素数の指数を用いて組み合わせの数を計算します。

アプローチ
1.素数の列挙:各 $n$ に対して,$n!$ の素因数分解に必要な素数を列挙します。
2.指数の計算:各素数 $p$ について,$n!$ 中の $p$ の指数 $e_p$ を計算します。
これは,$\lfloor \dfrac{n}{p} \rfloor + \lfloor \dfrac{n}{p^2} \rfloor +\lfloor \dfrac{n}{p^3} \rfloor +\cdots $で求められます・
3.組み合わせの計算:各素数 $p$ に対して,$\binom{n+e_p-1}{e_p}$を計算します。これにいおり,$e_p$ 個の指数を $k_i$ に分配する方法の数が求まります。
4.総数の計算:すべての素数についての組み合わせの数を掛け合わせることで、総数 $b_n$ を得ます。

Julia プログラム(修正版)
以下のJuliaプログラムは、上記のアプローチに基づいて $b_n$ を計算します。

# Primes.jl パッケージのインポート
import Primes: primes

# n! における素数 p の指数を計算する関数
function exponent_in_factorial(n::Int, p::Int)::Int
    exponent = 0
    power = p
    while power <= n
        exponent += div(n, power)
        power *= p
    end
    return exponent
end

# b_n を計算する関数
function calculate_b(n::Int)::Int
    if n == 0
        return 1
    end
    
    # n >= 2 の場合のみ素数を取得
    if n >= 2
        primes_list = Primes.primes(2, n)
    else
        primes_list = Int[]  # 空の配列
    end
    
    total = 1
    for p in primes_list
        e_p = exponent_in_factorial(n, p)
        # 組み合わせの計算
        total *= binomial(n + e_p - 1, e_p)
    end
    return total
end

# b_1 から b_8 までを計算して表示
for n in 1:8
    bn = calculate_b(n)
    println("b_$n = $bn")
end

プログラムの説明
・exponent_in_factorial 関数:与えられた $n$ と素数 $p$ に対して,$n!$ の中の $p$ の指数を計算します。
・calculate_b 関数:与えられた $n$ に対して,$b_n$ を計算します。まず,$n$ 以下の素数を取得し、各素数についての組み合わせの数を計算して掛け合わせます。
・メインループ: $n=1$ から $n=8$ までの $b_n$ を計算し,結果を表示します。

実行結果
上記のプログラムを実行すると、以下のように $b_1$ から $b_8$ までの値が得られます。
$b_1 = 1$
$b_2 = 2$
$b_3 = 9$
$b_4 = 80$
$b_5 = 875$
$b_6 = 15876$
$b_7 = 288120$
$b_8 = 7907328$
これにより、各 $n$ に対して条件を満たす $(k_1, k_2, ..., k_n)$ の組の数 $b_n$ を効率的に計算することができます。
このプログラムは,Mathematicaだとより簡潔に表現できる。これは,もとの関数を2つ与えた上で,ChatGPT-4oに作ってもらった。エラーが出ていたが,3回目の修正で正しい答えに到達した。
f[n_] := FactorInteger[n!]
g[n_, k_] := Binomial[n + k - 1, k]
h[n_] := 
 Module[{factors = f[n], product = 1}, 
  Do[product *= g[n, pair[[2]]], {pair, factors}];
  product]
a = Table[h[k], {k, 1, 8}]
ListPlot[Log[a]] 
{1, 2, 9, 80, 875, 15876, 288120, 7907328} 

図:n=1-8 に対するh[n] の対数のListPlot(Mathematica)

2024年9月21日土曜日

OpenAI o1(3)

OpenAI o1(2)からの続き

前回の真鍋さんのMIPOの次の問題にチャレンジしたところ,OpenAI o1から正解は出てこなかった。とりあえず,自力で考えてみようとしたら,なかなか頭が働かない。次のような整数問題だ。
Q(koshix):
最大公約数が1である正の整数の組(a1,a2,a3,a4,a5,a6)であって, k1=a1/a2, k2=2*a2/a3, k3=3*a3/a4, k4=4*a4/a5, k5=5*a5/a6, k6=6*a6/a1 として,(k1, k2, k3, k4, k5, k6) がすべて 整数であるようなものはいくつあるか。
答えは6と出たが,正解は,15876 (=126^2) なのだった。実は,自分もAIと同じ間違いをしていて,すべてのa_i の組が互いに素であると思い込んでいた。そうではなくて,(a1, a2, a3, a4, a5, a6)の6つの数の最大公約数が1という条件なのだ。

つまり,k1*k2*k3*k4*k5*k6=6!=720を6つの正の整数(k1,k2,k3,k4,k5,k6)の積に分解する場合の数を求めればよい。つまり,720を素因数分解した 2^4*3^2*5 の各指数のべきを6つの箱に分配する場合の数(重複組み合わせ)の積になり,6H4*6H2*6H1=126*21*6=15876 である。

計算方法はわかったが,これが正しいためには,(a1,a2,a3,a4,a5,a6)と(k1,k2,k3,k4,k5,k6)が一対一対応する必要がある。その証明を OpenAI o1にきいて見よう。

Q(koshix):
a_i (i=1 ... n) が正の整数であり,(a_1, a_2 ..., a_n) の組の最大公約数は1であるとする。
a_1/a_2=k_1, 2*a_2/a_3=k_2, 3*a_3/a_4=k_3, ... (n-1)*a_{n-1}/a_n=k_{n-1}, n*a_n/a_1 = k_n 
において,(k_1, k_2, ... k_n) は整数となって,k_1*k_2*k_3*...*k_{n-1}*k_n = n! が成り立つ。
このとき,一つの(k_1, k_2, ... k_n) に対して必ず一つの(a_1, a_2 ..., a_n) が対応することを証明してください。

A(OpenAI o1)
証明:
まず、与えられた条件から $ a_i $ を $ k_i $ を用いて表現します。

ステップ1:$ a_i $ を $ k_i $ と $ a_1 $ で表す
最初の方程式から始めます。
1. $\dfrac{a_1}{a_2} = k_1$  ⇒  $ a_1 = k_1 a_2 $
2. $\dfrac{2a_2}{a_3} = k_2$  ⇒  $ a_3 = \dfrac{2a_2}{k_2} $
3. $\dfrac{3a_3}{a_4} = k_3$  ⇒  $ a_4 = \dfrac{3a_3}{k_3} $
   ⋮
このパターンを一般化すると、
$ a_i = \dfrac{(i-1)! \, a_1}{\prod_{j=1}^{i-1} k_j} $
となります。

ステップ2:最後の方程式を利用して $ k_n $ を表す
最後の方程式は
$\dfrac{n a_n}{a_1} = k_n$
これに $ a_n $ の表現を代入すると、
$ \dfrac{n \cdot \dfrac{(n-1)! \, a_1}{\prod_{j=1}^{n-1} k_j}}{a_1} = k_n \Rightarrow \dfrac{n!}{\prod_{j=1}^{n-1} k_j} = k_n $
したがって、$ k_1 k_2 \cdots k_n = n! $ が成り立ちます。

ステップ3: $ a_i $ の一意性の証明
$ a_i $ を $ a_1 $ と $ k_i $ で表すことができましたが、$ a_i $ が整数であるためには、$ a_1 $ が適切な値である必要があります。具体的には、すべての $ a_i $ が整数となる最小の $ a_1 $ を見つけます。
各 $ a_i $ に対して、分母となる $ \dfrac{\prod_{j=1}^{i-1} k_j}{(i-1)!} $ が存在します。すべての $ a_i $ が整数となるためには、$ a_1 $ がこれらの分母の最小公倍数(LCM)の倍数である必要があります。
すなわち、
$ a_1 = \operatorname{lcm}\left(1, k_1, \dfrac{k_1 k_2}{2}, \dfrac{k_1 k_2 k_3}{6}, \dots, \dfrac{k_1 k_2 \cdots k_{n-1}}{(n-1)!}\right) $
この $ a_1 $ を用いると、すべての $ a_i $ は一意に定まります。

ステップ4:最大公約数が1であることの確認
もし他に $ a_i' $ という解があると仮定すると、比 $ \dfrac{a_i}{a_i'} $ はすべて等しくなります。しかし、$ \gcd(a_1, a_2, \dots, a_n) = 1 $ であるため、この比は1でなければなりません。したがって、$ a_i = a_i' $ となり、一意性が証明されます。

結論
以上より、与えられた $ (k_1, k_2, \dots, k_n) $ に対して、一意な $ (a_1, a_2, \dots, a_n) $ が存在することが証明されました。よって、一つの $(k_1, k_2, ..., k_n)$ に対して必ず一つの $(a_1, a_2, ..., a_n)$ が対応します。
なるほど,素晴らしい。ちょっと気になったのは,分母である$ \dfrac{\prod_{j=1}^{i-1} k_j}{(i-1)!} $ が必ず整数なのかどうかである。具体的に試して見ると,必ずしも整数にならない場合がある。そんなときは,分母を形成する有理数の分子だけに着目して最小公倍数を考えれば良い。分母の有理数の分母は元の数の分子に回るだけだからである。そんなわけで,多少詰めが甘いような気がするけれど,ここまで推論できれば大したものである。


2024年9月20日金曜日

火星隕石

火星の石からの続き

火星の石がどの程度希少なものかを考えていたら,火星隕石というワードに遭遇した。地球で発見された数万個の隕石のうち,2016年の時点で172個が火星由来だとわかっているらしい。ところで,2000年6月の時点では,わずか15個(合計90kg,最大40kg)だった。

大阪万博の目玉として売り出し中の火星の石は,2000年に昭和基地の近くで発見された,13kgの世界最大級ということで,15個のリストの次に並ぶものだった。しかしながら,この火星の石は北海道の毛利衛さんの出身地である余市町に完成した宇宙記念館で,公開中なのだった。おまけに,検索すれば,ネット上で火星隕石はたくさん販売されている。うーん,目玉になりにくかった。


ちなみに,月隕石は,2013年2月の時点で,165個(合計45kg)見つかっている。これもネット販売されているよ。1982年に発見された南極隕石が月由来の隕石だと最初にわかった。その後,1979年に日本が発見していた南極隕石も月起源だと確認されたようで,これが1番目に発見された月隕石になる。

なお,月から人為的に持って帰った月の石は,アポロ11-17号の6回で382kg,ソ連のルナ計画3回で326g,中国の嫦娥計画2回で3.6kg となっている。



図:販売中の火星隕石(vec stone club から引用)

2024年9月19日木曜日

火星の石

2025年大阪・関西万博の明るいニュースが続いているような気がする。悪いニュースはもう出し切ったのかもしれない。パビリオンでの展示内容の紹介が続くと,思わず行って見たいかもという気持ちが頭をよぎる。だめ−ダメ−だめ。IR利権目当てで大阪維新がゴミ埋め立て地にゴリ押し,安倍や菅が後押しした万博なんか金輪際いくものか・・・

よく思い出して見ると,1970年の大阪万博も,高校生による初めての関西一人旅という点では面白かったけれど,万博の出展内容自身にはちょっとだけ残念な気分がただよっていた。期待していた小松左京による太陽の塔内の進化の樹は単なるハリボテだった。アメリカ館の月の石に感動したわけでもないし,ソ連館の長い行列と加速器の解説展示,フランス館は数学の歴史しか記憶にない。それ以外だと松下館のタイムカプセルとか日本館の巨大日本地図俯瞰模型くらいか。

三菱未来館など多くの企業館は映像展示のオンパレードだった。2025年の万博も映像とインタラクティブ端末の組み合わせだけで埋まりそうだ。ESSの後輩の藤場俊基君が,万博は人とのコミュニケーションを図るところに意義があるのだと,コンパニオンとの会話を楽しんできたことを自慢していたが,まあそんなものだ。EXPO2025もそれなりに見どころはあるかもしれないが,人混みの行列と熱暑に耐えた上で7500円を支払う価値があるかどうかは微妙。


そんなところに,火星の石というニュースが飛び込んできた。シンボル構造物の愛称募集(パクリングでいいよね)とかタイムリーな話題作りには事欠かない広報戦略だ。

地球に落下する隕石の多くが南極でみつかった南極隕石であるというのは周知の事実だ。大量発見の発端となったのは,日本の南極地域観測隊が1969年にやまと山脈付近で氷床の流れを観測していたときにみつけたものである。南極に落下して氷床中に留まった隕石が,氷床とともに移動して集積したものが氷床表面に現われて大量に採取されることになった。

その成分を分析すると,隕石がどの天体から由来しているかを判別できる。このへんのことを,OpenAI o1-mini に聞いてみると次のようなことだった。
Q(koshix):
日本の南極観測隊が発見した隕石が火星の石として万博で展示されるそうです。この隕石が火星から飛来したことはどのようにして推論されているのでしょうか。

A(OpenAI o1-mini / 数秒)
日本の南極観測隊が発見した隕石が火星からのものであると推論される理由は、主に以下のような科学的分析に基づいています:

1.組成分析
鉱物組成:火星隕石には特定の鉱物や化学成分が含まれており、これらが火星表面で採取されたデータや探査機による分析結果と一致します。例えば、火星特有の酸化鉄鉱物などが含まれていることがあります。
2.ガス同位体比の測定
閉じ込められたガス:隕石内部には火星大気に由来すると考えられるガスが閉じ込められています。これらのガスの同位体比(例えば、アルゴンやネオンの同位体比)が、火星探査機(例えば、ベンチ探査機・・・注:これは何だ??)のデータと一致していることが確認されています。
3.宇宙年代学
年代測定:隕石の形成年代や衝突年代が火星の地質活動と一致している場合があります。これにより、隕石が火星の地殻から放出された可能性が高まります。
4.微細構造や微磁性の解析
微細構造:火星の環境特有の微細な鉱物構造や磁性特性が見られることがあります。これらの特徴は地球や他の天体からの隕石とは異なるため、火星起源の証拠となります。
5.軌道解析(場合によっては)
軌道データ:発見された隕石の軌道データや飛来経路が火星からのものである可能性を示唆する場合もあります。ただし、南極で発見された隕石の場合、詳細な軌道解析が難しいこともあります。

これらの多角的な分析結果を総合的に評価することで、発見された隕石が火星から飛来したと強く推論されています。特にガス同位体比の一致や鉱物組成の特異性は、火星起源の隕石を識別する上で重要な指標となっています。
ちょっとあやしい部分もあるけれど,なんとなくもっともらしい。信頼度は,テレビの科学解説者と同程度のレベル。


写真:国立極地研究所にある火星の石(南極隕石)

2024年9月18日水曜日

ピロリ菌(2)

ピロリ菌(1)からの続き

6月のピロリ菌除菌薬の服用から3ヶ月,天理市立メディカルセンターに除菌結果の検査をする日がやってきた。尿素呼気試験法というもので,呼気を調べることでわかるというのだが,はて?まさか,ピロリ菌が呼気に飛び出してくるわけでもなかろう。

実際の手順はこんな感じ。2つの同じ袋を示された。まず息を吸ってからしばらく止めて,1つ目の袋に呼気を吐き出す。200mL程度だろうか。次に小さな白い錠剤を1粒,100mLの水で飲んだ後,診察台で左下に横臥して5分待つ。それから診察室の椅子に座ってさらに15分じっとしている。スマホはみてもよい。小児科の診察室なので風葉ちゃんの大好きなアンパンマン人形が置いてある。最後に2つ目の袋に呼気を吐き出して終了だ。

帰宅してから,この検査はどんな仕組みになっているのかgoogleで調べたところ,大塚製薬の「ピロリ菌の検査と除菌治療」がわかりやすかった。その説明は次のようなものだった。
ピロリ菌が持つウレアーゼという酵素により、胃の中の尿素を分解して、アンモニアと二酸化炭素を生成します。尿素の分解により、アンモニアと同時に生じた二酸化炭素は速やかに吸収され、血液から肺に移行し、呼気中に炭酸ガスとして排泄されます。この試験法は、この原理を利用して、検査薬(13C-尿素)を患者さんに服用して頂きます。ピロリ菌に感染している場合では、尿素が分解されるため呼気に13CO2が多く検出されることになります。一方ピロリ菌に感染していない場合では、尿素が分解されないため13CO2の呼気排泄はほとんど起こりません。
えーっ同位元素を使うのかと驚いたところ,よく考えたら炭素13は放射性同位元素ではなくて,地球存在比1.1%の安定同位元素だった。なんのことはない,昔,佐藤さん,大坪先生と連名の論文 "Electron scattering and charged pion photoproduction on12C and13C" で扱っていた。あるいは,自分のドクター論文にも13Cの遷移図を描いて計算していたのだった。



図:尿素呼気試験法の仕組み(大塚製薬から引用)

2024年9月17日火曜日

サイエンスコンカフェ

サイエンスカフェからの続き
Q(koshix):
コンカフェカテゴリーの中に位置づけられるサイエンスカフェの具体的なイメージを提案してください。ベンチャーキャピタルに出資してもらうことができるような水準の提案書の形でお願いします。

次のような参考イメージをつけておきます
あくまでも参考なので,これにしばられず,
自由な発想で体験メニューをデザインしてください。

名称:サイエンスコンカフェ〈ビジョン〉
コンセプト:
科学の力による新しい眼で世界を見る
・Apple Vision Proを装着
地球圏,生態系,人体内などを共に旅する
具体例:
長基線ドローン視点の獲得による巨人化
動物モーションカメラ,植物タイムラプス
細胞から分子レベルでの体内機構巡り
メニュー:
・分子ガストロノミー
店内装飾:
電子デバイスギミック
ピタゴラスイッチギミック
衣裳:
・白衣+眼鏡

A(Claude 3.5 Sonnet):
以下が、サイエンスコンカフェ「ネオビジョン」の事業計画書です。この提案は、ご提示いただいたアイデアを基に、より詳細かつ実現可能性の高いビジネスプランとして発展させました。主な特徴は以下の通りです:

・最新のAR/VR技術を活用した没入型科学体験
・分子ガストロノミーによる革新的な食体験
・インタラクティブな科学展示と実験ショー
・教育機関との連携による社会的意義の創出
・段階的な事業拡大計画

この提案書は、ベンチャーキャピタルからの出資を検討いただけるよう、市場分析、財務計画、チーム構成など、投資判断に必要な要素を含めています。


図:サイエンスコンカフェ(Gemini経由でImagenが生成)


サイエンスコンカフェ「ネオビジョン」事業計画書(by Claude 3.5 Sonnet)

1. エグゼクティブサマリー
「ネオビジョン」は、最先端テクノロジーと科学的知見を融合させた革新的なコンセプトカフェです。私たちは、お客様に「科学の力で世界を新しい視点から体験する」機会を提供し、エンターテインメントと教育を融合させた唯一無二の体験を創出します。

2. コンセプト
ビジョン
「科学の力で世界を再発見する」
ミッション
最新のテクノロジーと科学的知見を活用し、お客様に新しい視点と体験を提供することで、科学への興味と理解を深め、イノベーションの種を育てる。
ユニークセリングポイント
 −最新VR/AR技術を活用した没入型科学体験
 −分子ガストロノミーによる革新的な食体験
 −インタラクティブな科学展示と実験ショー

3.市場分析
ターゲット顧客
 −20-40代の科学・技術愛好家
 −家族連れ(子供の教育に熱心な親)
 −企業の接待や団体イベント利用者
市場規模と成長性
 −体験型エンターテインメント市場:年間成長率10%
 −教育テック市場:年間成長率15%
 −科学館・博物館市場:年間成長率5%

4.サービス詳細
主要サービス
(1) ネオビジョン・エクスペリエンス
 −最新AR/VRヘッドセットを使用した没入型科学体験
 −テーマ別の仮想ツアー(宇宙探査、海洋生物、人体内部など)
(2) 分子ガストロノミー・ラボ
 −科学の原理を応用した革新的な料理とドリンク
 −食事とともに学ぶ、味覚と科学の融合体験
(3) インタラクティブ・サイエンスショー
 −定期的に開催される参加型の科学実験ショー
 −プロの科学者やエデュテイナーによる解説付き
店内装飾とアトモスフェア
 −未来的でミニマルなデザイン
 −インタラクティブな壁面ディスプレイ(触れると科学情報が表示される)
 −天井には巨大な周期表やDNAらせん構造のオブジェ
スタッフユニフォーム
 −モダンなラボコートスタイル
 −AR機能付きスマートグラス(お客様とのコミュニケーション強化)

5.マーケティング戦略
デジタルマーケティング
 −SNSを活用した体験共有キャンペーン
 −科学インフルエンサーとのコラボレーション
イベント戦略
 −月替わりのテーマイベント(例:宇宙月間、海洋生物月間)
 −著名科学者を招いたトークイベント
教育機関連携
 −学校向け特別プログラムの開発
 −大学・研究機関とのパートナーシップ

6.財務計画
初期投資(概算)
 −店舗改装:5000万円
 −設備・機器:1億円
 −マーケティング:2000万円
 −運転資金:3000万円
合計必要資金:2億円
収益予測
 −1年目:売上高3億円、営業利益-5000万円
 −2年目:売上高5億円、営業利益5000万円
 −3年目:売上高8億円、営業利益1.5億円
投資回収期間
 −約3年

7.チーム
・CEO:科学館運営経験を持つ経営者
・CSO(Chief Science Officer):物理学Ph.D.保持者
・CTO:AR/VR開発のエキスパート
。料理長:分子ガストロノミーの専門家

8.今後の展開
・2年目以降、主要都市への展開開始
・VRコンテンツのオンライン配信サービス開始
・科学教育プログラムのフランチャイズ展開

9.結論
「ネオビジョン」は、科学とエンターテインメントの融合による新しい市場を創造し、高い成長性と社会的意義を兼ね備えたビジネスモデルです。私たちは、この革新的なコンセプトで、エンターテインメント業界に新しい風を吹き込むとともに、次世代の科学イノベーターを育成する場を提供します。


2024年9月16日月曜日

サイエンスカフェ

コンカフェからの続き
Q(koshix):
サイエンスカフェもコンカフェの一種と考えられますか?

A(Claude 3.5 Sonnet):
サイエンスカフェとコンカフェは、確かに似たような点もありますが、一般的には別のカテゴリーと考えられています。

サイエンスカフェは:
1. 科学者や研究者が一般の人々と科学について対話する場
2. 科学知識の普及や科学リテラシーの向上を目的としている
3. カフェやバーなどのリラックスした環境で行われることが多い

一方、コンカフェ(コンセプトカフェ)は:
1. 特定のテーマやコンセプトに基づいて設計された飲食店
2. エンターテイメントや独特の雰囲気を提供することが主な目的
3. メイド喫茶やアニメカフェなど、様々なテーマがある

サイエンスカフェは教育的な側面が強く、コンカフェは娯楽的な要素が中心です。ただし、科学をテーマにしたコンカフェが存在する可能性はあり、その場合はサイエンスカフェとコンカフェの要素を両方持つことになるでしょう。

より詳しい比較や具体例について知りたい場合は、お知らせください。 

 

Q(koshix):
サイエンスカフェとは何か教えてください。

A(ChatGPT-4o):
日本におけるサイエンスカフェは、2004年に発表された「平成16年版科学技術白書」での紹介をきっかけに広がりを見せた。京都のNPO法人が初めて開催したのが始まりで、2005年からは全国で急速に普及することとなる。この年は「サイエンスカフェ元年」と呼ばれ、NPOや財団、大学、行政、書店、さらには個人まで、多様な主体が次々とサイエンスカフェを企画した。文部科学省や地方自治体の支援もあり、官民が協力して科学を市民に届ける動きが一気に加速した。

日本のサイエンスカフェは、主催者や形式の多様さが大きな特徴である。NPO法人や大学、企業、自治体、さらには書店や任意団体まで、さまざまな立場から主催されている。また、科学者と市民が双方向のコミュニケーションを図る場として、多様な工夫が凝らされている。たとえば、携帯電話を使った投票システムや、テーブルごとに分かれて行う議論形式など、創造的なアプローチが数多く試みられている。

サイエンスカフェの背景には、欧米とは異なる日本特有の文化的要因がある。ヨーロッパではカフェが長らく公共の討論の場として機能してきたが、日本ではカフェ文化自体が比較的新しい。したがって、サイエンスカフェを日本に定着させるためには、独自の工夫が必要だった。日本のサイエンスカフェは、ヨーロッパの形式にとらわれず、主催者ごとに多様なスタイルが模索されており、その自由さが一つの魅力となっている。
ということで,サイエンスパブとかサイエンスバーは,コンカフェに近いものかもしれない。


図:サイエンスバー FRACTALの店内(FRACTALから引用)

[1]サイエンスカフェ(中村征樹)
[2]サイエンスカフェ(日本学術会議)


2024年9月15日日曜日

コンカフェ

コンカフェ
〔名〕(コンセプトカフェ Concept Cafe の略)
①特定のテーマやコンセプトに基づいた特色ある飲食店。メイド喫茶猫カフェ、漫画・アニメのキャラクターをモチーフとしたカフェなどが代表的。飲食の提供に加え、店員の衣装や店内の装飾、演出を通じて非日常的な体験を提供することが特徴。
コスプレ系飲食店(参考:カフェー)  (ChatGPT-4oより)

 漫才の草稿をChatGPT-4oとClaude 3.5 Sonnetに直列でかけた結果は次のとおり。

阿: このまえ、コンカフェ行ってきましてね。

吽: コンカフェ?

阿: あれ、コンカフェ知らん?

吽: コンカフェ…あぁーん、「婚活カフェ」のことやな?

阿: ちゃうがな!「コンセプトカフェ」やがな!

吽: ああ、そうか!…って、それ、なんやのん?

阿: 知らんのかいな!きみ、「メイドカフェ」は知ってるやろ?

吽: あぁ、毎日その前通ってるわ。メイドさんが「お帰りなさいませ、ご主人様~」言うてくれる店やろ?

阿: そうそう!その「メイド」をいろんなものに変えたんが「コンセプトカフェ」や。

吽: いろんなもんって、たとえば何に変わるん?

阿: 例えば、お姫さま、忍者、執事とかのコスプレやな。

吽: へぇ~、忍者カフェとか面白そうやな。どんなことするん?

阿: 忍者の格好したスタッフが目の前で手裏剣投げたりすんねん!

吽: えぇ!それ、めっちゃ危険やん!「ドリンクお待たせしました~」って言いながら手裏剣飛んできたら命懸けやん!

阿: そんなん言うけど、ほんま安全に配慮してるんやで?

吽: 配慮しても手裏剣は飛んでくるな!せめてドリンク頼んだら水遁の術で水出してくれんと!

阿: そんなんやったら「席流されます~」やんけ!

吽: まぁ、そうやな。ほな、ウチらも「漫才カフェ」とかやったらどうや?

阿: 漫才カフェ?どんなんやねん、それ。

吽: 客が漫才見ながら、コーヒー飲んで笑うんや。そんで、ウチらがネタやってな、あとは手裏剣投げたり…

阿: いや、それ結局忍者カフェと変わらんやないか!

吽: ほな、水遁の術で…

阿: もう、やめとけ!そんなん誰も来んわ!

吽: えぇ~、でも面白そうやん。

阿: お前、そんなんやったら客全員逃げ出すで!結局、普通のカフェがええんやって!

吽: そうか…ほな、普通のカフェで、ただウチらが店員やるってのはどうや?

阿: それ、もう「漫才カフェ」やなくて「ボケカフェ」やな!

 


図:コンカフェの例(DALL-E3による)

2024年9月14日土曜日

OpenAI o1(2)

OpenAI o1(1)からの続き

昨日の問題を,他の生成AIにも解かせてみた。「 a<b<c をみたす正の整数の組(a,b,c)であって, a^2-2005a > b^2-2005b > c^2-2005c が成り立つものはいくつあるか。(正解は334334000個) 」というものだ。(元の問題は20005だったが,入力ミスで2005にしてしまった。)

PlamoやClaudeは国語はできるけど,数学が不得意な生徒のような答えだ。Perplexityは数学的な推論ではなくてプログラミングで解決しようとしたが,プログラムはちょっと間違っている。
(1) Genspark 解答:解は存在しない。
f(x) = x^2-2005xのピークと増減までは理解している。

(2) Perplexity 解答:83個。
解をアルゴリズムを提案し,pythonコードを与える。
これで計算するように指示した実行結果がこれ。

(3) ChatGPT-4o 解答:1個
f(x) = x^2-2005xのピークと増減までは理解している。

(4) Gemini 解答:2個
f(x) = x^2-2005xのピークと増減までは理解している。

(5) Claude 解答:1個
f(x) = x^2-2005xのピークと増減までは理解している。

(6) Plamo 解答:124個
説明が日本語的で,そもそものロジックがあやしい。

 

GPT-4oに推論時間スケーリングに関する論文を 解説してもらうと,

Q(koshix):
この内容を分かりやすく説明してください。OpenAI o1 との関係についても言及してください。

A(ChatGPT-4o):
この論文「Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters」では、大規模言語モデル(LLM)のテスト時計算をどのように効率的に拡張できるかについて論じています。具体的には、モデルのパラメータ数を単に増やすよりも、テスト時に追加の計算を投入する方が、難しいタスクでのモデルのパフォーマンスを向上させるのに効果的である可能性があることを示しています。

主なポイントは次の通りです:

1.テスト時の計算拡張
   - テスト時に追加の計算能力を使うことで、より複雑な質問や問題に対する解答の質を向上させることができます。たとえば、複数の回答を生成して、その中から最も適切なものを選ぶ「Best-of-N」戦略を使うことで、より正確な解答が得られることが示されています。

2.テスト時の計算と学習時の計算のトレードオフ
   - テスト時の計算を効果的に使用することで、より大きなモデルや大量の学習を必要としない場面もあることがわかりました。特に簡単な問題や中程度の難易度の問題では、モデルのパラメータを増やすよりも、テスト時の計算にリソースを割く方が効果的です。

3.問題の難易度に応じた計算資源の配分
   - 問題の難易度に応じて、テスト時にどのような計算を行うべきかを動的に決定する「compute-optimal strategy(計算最適戦略)」を提案しています。簡単な問題では、モデルがすでにある程度正しい答えを出すので、答えを少し修正するだけで良い場合が多いですが、難しい問題では、より大規模な探索が必要となることが示されています。

 OpenAI o1 との関係
この論文に直接「OpenAI o1」というモデルが登場しているわけではありませんが、OpenAIが取り組んでいるLLM技術全般に関連しています。特に、GPT-4やそれ以降のモデルでも、テスト時の計算や推論の改善が重要視されており、この論文で述べられている「テスト時の計算拡張」は、OpenAIの研究テーマにも深く関係していると考えられます。

2024年9月13日金曜日

OpenAI o1(1)

GPT-4oからの続き

今年の5月にOpenAIがGTP-4oをリリースした。試してみるとなかなか良かったので,早速ChatGPT を再サブスクリプションしてから4ヶ月が経過した。ところが,この業界は流れが速いので,いつの間にかChatGPT-4oは取り残されつつあった。Claude 3.5 Sonnet がいいとか,Gemini 1.5 Proも使えるようになったとか,Perplexity やGenspark が最高だ!とか,他にも NapkinAI やらGammasやら話題が目白押し。ChatGPT一強から,これらの組み合わせによる群雄割拠の世界になってきた。

GPT-4oはわりと大きなファイルを読み込め,イメージも生成できるので,まだ,若干のアドバンテージはあったのだけれど,ネット上ではそろそろ解約するかという話題が湧き出して液状化現象を呈していた。さあ,そこに登場したのが,OpenAI o1 だ。OpenAIからのリリース文をGeminiに要約させると次のようなものだった。
OpenAIは、複雑な問題を解く能力に特化した新しいAIモデルシリーズ「OpenAI o1-preview」を発表しました。 このモデルは、問題解決に時間をかけ、より深く思考することで、従来のモデルよりも複雑なタスクをこなせるようになっています。特に、科学、コーディング、数学といった分野で高い能力を発揮し、国際数学オリンピックの予選問題を83%の正解率で解くなど、驚異的な成果を上げています。

o1-previewは、人間のように思考する過程を模倣するように訓練されており、様々な戦略を試したり、自身の誤りを認識したりすることができます。 ただし、現時点ではChatGPTのような一般的な機能は備わっていません。

安全性についても、OpenAIは新たな対策を講じています。 例えば、ユーザーが安全な範囲を超えた質問をしても、o1-previewがそれに従わないようにする仕組みが強化されています。また、外部の研究機関と協力し、モデルの安全性評価を行っています。

OpenAIは、o1-previewが科学やエンジニアリング分野における複雑な問題解決に貢献すると期待しています。 例えば、医療研究者が遺伝子データを解析したり、物理学者が複雑な方程式を解いたりする際に、このモデルが役立つ可能性があります。
o1-previwと簡易版でより高速な o1-mini が有料ユーザ向けに公開されていたので,すぐに使うことができた。ただし,o1-previewは 30回/週,o1-miniは 50回/週の上限が定められていた。o1は必ずしもChatGPT-4o の延長線上に位置するわけではないようだ。これらの試みがどこかで次のプレAGIモデルに統合されるのかもしれない。


早速試してみるべく,OpenAIにあった見本をそのまま実行してみた。問題は次の通りである。
$\mathcal{B}$ を表面積が 54,体積が 23 の直方体の集合とします。
$r$ を、集合 $\mathcal{B}$ の各直方体を内包できる最小の球の半径とします。
$r^2$ の値は、互いに素な正の整数 $p$ と $q$ を用いて $\frac{p}{q}$ と表すことができます。$ p + q$ を求めなさい。
推論プロセスが順次進行し,思考時間TT=105秒で正しい答えがでてきた。うーん,どうやら自分よりは賢そうである。ちょっと太刀打ちできないかもしれない。ただ,OpenAIのプレスリリースについて要約を求めると次のような答えであり,ChatGPT-4oほど融通がきかなかった。
申し訳ありませんが、2023年10月までの知識では指定されたURLや「OpenAI O1プレビュー」に関する情報を持っておりません。しかし、OpenAIのサービスや製品についてご質問があれば、できる限りお手伝いいたします。

真鍋さんのMIPOのページで,朝日新聞の数学体験教室の問題を解いていたので,こちらを与えてみることにする。
Q(koshix): a<b<c をみたす正の整数の組(a,b,c)であって, a^2-2005a > b^2-2005b > c^2-2005c が成り立つものはいくつあるか。

A(OpenAI o1 TT=24秒): 問題を解くために,a > b > c,a^2−2005a < b^2−2005b < c^2−2005c を満たす正の整数の組 (a,b,c) を求めます。 
 まず,関数 f(x)=x2−2005x を考えます。この関数の挙動を理解することが重要です。極値を求めるために,導関数を計算してゼロと等しくします: f'(x)=2x−2005=0⟹x=1002.5 
これは,f(x) が x≤1002.5 のとき減少し,x≥1002.5 のとき増加することを意味します。 
したがって: 
整数 x≤1002 の範囲では,f(x) は減少関数です。 
整数 x≥1003 の範囲では,f(x) は増加関数です。
 a > b > c であり, f(a) < f(b) < f(c) を満たすためには,a,b,c ≥ 1002 でなければなりません。これは, f(x) がこの範囲で減少するためです。
もし a,b,c ≤ 1003 であれば,f(x) は増加するので、不等式 f(a) < f(b) < f(c) は成立しません。
したがって、求める組の数は,1から1002までの整数から異なる3つの整数を選ぶ組み合わせの数になります。これは組み合わせの公式で計算できます: 
 組の数=1002_C_3=1002×1001×1000 / 3×2×1 これを計算すると:
答え:167,167,000 
 この計算は正しいです。
おしい。 ほとんど正しいのだけれど,c' = 2005-c の点も条件を満たすので,この答えの2倍が正解となっている。それでも,ここまでの推論ができるのはすごいわ。どうやら,推論時間に関するスケーリングの発見がキモらしいので,これからますます,GPUパワーが必要になるのか・・・


2024年9月12日木曜日

対数正規分布

世帯の金融資産分布は,対数正規分布を考えるのが妥当だと Geminiがいった。Perplexityによれば 零端があるので,パレート分布がいいのかもしれない。

ここでは,対数正規分布を仮定して日本の世帯の金融資産保有額に関するパラメタを探してみる。金融資産の値を変数 xとして,世帯数の確率密度分布を f1[x, μ, σ] ,累積確率密度分布をg1[x, μ, σ] とする。これにともない,金融資産×世帯数の確率密度分布を f2[x, μ, σ] ,累積確率密度分布をg2[x, μ, σ,λ] とする。積分定数の不定性があることからパラメタλを追加した。Mathematicaのコードは次のようになる。
In[1]:= f1[x_, μ_, σ_] := (E^(-((μ - Log[x])^2/(2 σ^2))) Sqrt[2/π])/(2 x σ)
Integrate[f1[x, μ, σ], x]

Out[1]= 1/2 Erf[(-μ + Log[x])/(Sqrt[2] σ)]

In[2]:= 
p1 = {{0.3, 0.778}, {0.5, 0.912}, {1.0, 0.972}, {5.0, 0.998}};
q1 = ListPlot[p1, PlotStyle -> {Red, PointSize[Small]}, 
   AxesLabel -> {"x", "y"}, PlotRange -> {0, 1.2}];

In[3]:= 
g1[x_, μ_, σ_] := 1/2*Erf[(-μ + Log[x])/(Sqrt[2] σ)] + 0.5
nlm = NonlinearModelFit[p1, g1[x, μ, σ], {μ, σ}, x];
nlm["BestFitParameters"]

Out[3]= {μ -> -1.92447, σ -> 0.933737}

In[4]:= Show[q1, 
 Plot[g1[x, -1.92447, 0.933737], {x, 0, 5}, PlotRange -> {0, 1}]]


In[5]:= f2[x_, μ_, σ_] := x*f1[x, μ, σ]
Integrate[f2[x, μ, σ], x]

Out[5]= -(1/2) E^(μ + σ^2/2)
  Erf[(μ + σ^2 - Log[x])/(Sqrt[2] σ)]

In[6]:= 
p2 = {{0.02, 0.01}, {0.3, 0.125}, {0.5, 0.187}, {1.0, 0.234},
 {5.0, 0.282}, {20.0, 0.302}};
q2 = ListPlot[p2, PlotStyle -> {Red, PointSize[Small]}, 
   AxesLabel -> {"x", "y"}, PlotRange -> {-0.1, 0.35}];

In[7]:= g2[x_, μ_, σ_, λ_] := -(1/2) E^(μ + σ^2/2) 
Erf[(μ + σ^2 - Log[x])/(    Sqrt[2] σ)] + λ

nlm = NonlinearModelFit[p2, g2[x, μ, σ, λ], {μ, σ, λ}, x];
nlm["BestFitParameters"]

Out[7]= {μ -> -1.72573, σ -> 0.914071, λ -> 0.154702}

In[8]:= Show[q2, 
 Plot[g2[x, -1.72573, 0.914071, 0.154702], {x, 0, 20}, 
 PlotRange -> {0, 0.35}]]

非線形モデルフィットするためのデータは,野村総研の「日本の富裕層は149万世帯、その純金融資産総額は364兆円と推計」というレポートを用いた。前段と後段のパラメタは本来同じでなければならないが,そこまで含めた解析はできていない。対数正規分布だと両方に整合的な結果は得られないかもしれないがよくわからない。




(付)上記の図から得られた分布データ
金融資産 世帯数 世帯割合 資産額 資産割合
1 0.0-0.3  4213.2  0.778   678  0.415
2 0.3-0.5  726.3  0.134   332  0.203
3 0.5-1.0  325.4  0.060  258  0.158
4 1.0-5.0  139.5  0.026  259  0.159
5 5.0→  9    0.002  105  0.064
   5413.4  1.000  1632  1.000

このデータから得られる金融資産の世帯平均値は3010万円であるが,先ほど仮定した分布における最頻値は590万円。 生命保険文化センターの最近のデータとは少しズレがあるかもしれない。


2024年9月11日水曜日

iPhone16

iPhone15からの続き

日本時間9月10日午前2時からのApple Event ,YouTubeやブログの評価を見る前に,Appleのサイトにアクセスして視聴した(1時間38分)。

最初に,Apple Watch Series 10の話。サイズはそのままで,ベゼルを小さくしてディスプレイが大きく明るくなり,本体が薄くなった。高級モデルはステンレスからチタンにかわる。睡眠時無呼吸症候群を検知できるようになるのは旧モデルも含む話だ。スピーカーが改善されて,音楽やpodcastが手元で聞こえるようになる。などなど。

次に,Air Pods Proの話。AirPods 4はオープンイヤーデザイン(カナル型ではない)で,アクティブノイズキャンセリングが有り(29,800円)無し(21,800円)モデルを選択できるようになった。Air Pods Pro2より1万円安いではないか。その分ちょっとだけ性能が抑えられている。

今回のイベントの本命は,iPhone16の紹介である。スティーブ・ジョブズの現実歪曲空間マジックの技が引き継がれていて,すごいアップグレードで満ちているような気がした。ところで,前回のように仕様比較をしてみると,iPhone15からの変更点はほとんどなかった。それでも,今使っているiPhoneSE2よりはかなり高度になっている。

iPhone16       iPhoneSE      
2024 Sep       2020 Apr      
139,800円        69,800円      

A18           A13 Bionic     
3.5GHz          2.66GHz       
6コアCPU        6コアCPU      
5コアGPU        4コアGPU      
16コアNE        8コアNE       
256GB         128GB        

6.1インチOLED     4.7インチLCD    
2556×1179ピクセル    1334×759ピクセル  
460dpi          326dpi  
2,000,000:1       1,400:1       
1000ニト       625ニト       

48MPメイン|超広角   12MPシングル    
12MPフロント     7MPフロント     
ズーム .5× 1× 2×    ズーム 1×      

USB-C/USB2      Lightning/USB2   
FaceID        TouchID       
5G          4G/LTE       
BlueTooth5.3       BlueTooth5.0    
MagSafe        —         

22時間ビデオ     13時間ビデオ    
80時間オーディオ   40時間オーディオ  
147.6×71.6×7.8      138.4×67.3×7.3  
170g         148g   
一番印象的だったのはカメラ回りだ。朝の散歩でカメラ機能を十分活用しているので,関心の的だ。空間写真や空間ビデオというイマーシブな3Dイメージを撮影するために,カメラ配置が縦の直線上に並んだ。3カメラのProモデルは超広角も48MPだけれど,iPhone16の超広角は24MPで,5倍の光学ズーム付き望遠カメラはない。

カメラ回りのインターフェースが特によかった。側面に物理的なカメラコントロールボタンがついて,タッチやクリックやスライド操作ができる。ワンタッチで撮影できるのがありがたい。朝の散歩インスタグラマーとしては,5倍望遠をどうするかだけが関心事。サイズは,Proモデルでも数ミリ大きくなるだけだ。でもなぁ・・・。
写真:iPhone16 ウルトラマリンモデル(Appleから引用)

肝腎のApple Intelligence だけれど,米国は10月,それ以外の英語圏では今年の12月,その他の言語では,中国語,フランス語,日本語,スペイン語が来年提供の予定なので,それ待ちだ。ということで,ほとんど実質的なサプライズがなかった発表だった。


P. S. 日経新聞は2日渡ってこのニュースを大きく取上げているが,ChatGPT連携を目玉機能だとして動きが遅いことをディスっていた。そうなのか?

P. P. S. ドリキンのYouTubeではこのカメラの意義について熱く語っていたが,なるほどである。Vlogに進出していたアクションカムや一眼レフカメラ市場の風景をがらっと変えてしまう潜在力があるのかもしれない。

2024年9月10日火曜日

山手線が転生して加速器になりました。:松崎有理

松崎有理(1972-)の名前は,書店の本棚のシュレーディンガーの少女で見かけている。東北大学理学部(生命科学がバックグラウンドという話なのでたぶん生物学科?)の出身のエンタメ(SF)作家である。

タイトルが面白かったので,Kindleで入手してみた。短編集であり,6つの作品が収録されている。そのうち,山手線が加速器に転生する話は2編あるが,それぞれの話は独立だが,一つの仮想歴史世界線上(経済学者の目から見た人類史:行方ユクエ)に位置づけられている。

パンデミックによって,東京から人間が退避してしまった世界で,山手線が,周長34kmの自律運転ミューオンコライダーに,立川−三鷹−新宿の中央線が,全長13km+14kmの自律運転電子陽電子リニアコライダーに転用されたという話だ。これに,高度2000kmの地球周回軌道上の基線長100mのレーザー干渉計宇宙アンテナ自律型観測施設(宇宙重力波望遠鏡)が加わる。

この2編はちょっと状況設定の説明だけで話が空振りに終ってしまい消化不良だった。それ以外の話は軽いけれど,サイエンスの背景があればそこそこ楽しく読める。食べ物の描写と子どもへの視線が印象的だ。あとは,フェルミのパラドックスへの強い思い入れかな。仮想歴史中には,ChatGPTに相当するAIアシスタントが2025年に登場していて,その名称がモラベックである。ハンス・モラヴェックは実在の人物であり,モラヴェックのパラドックスで有名らしい。知らんかったわ。



写真:山手線が転生して加速器になりました。(光文社文庫の書影から引用)

[2]ハンス・モラヴェック(Wikipedia)

2024年9月9日月曜日

公益通報者保護法

今,話題の公益通報者保護法である。単純に考えると兵庫県側がアウトなのはほとんど自明に思われる。ところが,元総務官僚と顧問弁護士の一見それらしい答弁によって,新聞やテレビ等のマスコミの追求力はほとんど無効化されて,両論併記状態に持ち込まれてしまう。

兵庫県議会に設置された文書問題調査特別委員会地方自治法の百条委員会)は,正副委員長と理事5名を含み計15名で構成され,予算500万円で6月13日にスタートした。審議事項は,「令和6年3月 12 日付け元県民局長の文書に記載されている7項目の内容の真偽 に関連する事項」である。

9月5日には上智大学文学部新聞学科の奥山俊宏教授,9月6日には山口利昭法律事務所代表の山口利昭弁護士がそれぞれ参考人として証言されていたが,いずれも非常にわかりやすい話だった。ようは兵庫県は公益通報保護法に違反しているということだ。


話はかわるが,最近は,次のようなことになっている。検索は PerplexityGenSpark らしい。そこで,GenSparkで調べてみる。時間は少しかかるけれど,確かにちゃんとした引用がされている。
Q(koshix):
公益通報者保護法について

A(GenSpark):
公益通報者保護法について
公益通報者保護法は、労働者や退職者、役員が事業者の法令違反を通報した際に、その通報を理由として解雇や不利益な取扱いを受けることを防ぐための法律です。この法律の目的、保護対象、手続きおよび保護措置について以下に詳述します。

目的
公益通報者保護法の目的は、事業者の法令違反行為を早期に発見し是正することで、国民生活の安心や安全を確保することです。これにより、公益通報者が不利益な取扱いを受けることなく、安心して通報できる環境を整備します。

保護対象
公益通報者保護法の保護対象は以下の通りです
・労働者:正社員、派遣労働者、アルバイト、パートタイマー、公務員など。
・退職者:通報日前1年以内に雇用元または派遣先で働いていた者。
・役員:法人の取締役、監査役など。

手続きと保護措置
通報先
公益通報は以下のいずれかに対して行うことができます
・事業者内部:役務提供先またはその指定する者(社外弁護士や労働組合等)。
・権限を有する行政機関等:通報対象事実について処分や勧告等を行う権限を有する行政機関。
・その他の外部通報先:報道機関や消費者団体等。
保護要件
公益通報が保護されるためには以下の要件を満たす必要があります
・通報対象事実が生じている、またはまさに生じようとしていると信じるに足りる相当の理由があること。
・通報に不正の目的がないこと。
・必要な事項を記載した書面を提出する場合など。
保護措置
公益通報者は以下の保護措置を受けられます
・解雇の無効:公益通報を理由とした解雇は無効となります。
・不利益な取扱いの禁止:解雇以外にも降格、不自然な異動など不利益な取扱いは禁止されます。
・損害賠償請求の禁止:事業者は公益通報によって損害を受けたことを理由に公益通報者に対して賠償請求することはできません。

このように、公益通報者保護法は労働者や退職者、役員が安心して法令違反行為を通報できる環境を整備し、その結果として国民生活の安全と安心を守るための重要な法律です。

GenSparkによって,出典として挙げられたのは
(1)公益通報者の保護(厚生労働省)
(4)公益通報者保護法(e-Gov法令検索)
(5)企業も通報者も守ります! 公益通報者保護法(政府広報オンライン)

[2]公益通報ガイドブック(改正法(令和4年6月施行)準拠版)(消費者庁)