ラベル 心理 の投稿を表示しています。 すべての投稿を表示
ラベル 心理 の投稿を表示しています。 すべての投稿を表示

2025年6月9日月曜日

感情的分極化

韓国の大統領選挙を取上げたニュースの中で,感情的分極化という言葉が出てきた。トランプ2.0もそうだ。兵庫県知事問題も同様の感情的分極化を招いている。

感情的分極化とは,ある問題についての2つの異なった立場がある場合に,中間的な意見が失われて2つの極端な意見に集団が別れて収束していくことである。その対立は次第に激化して2つの集団の間では議論が成立しなくなり,お互いを人格的に否定しあうようになる。それをドライブするのが,SNSによるエコーチェンバーとそれによって煽られる感情的な対立である。これが,新自由主義的な資本主義による階級分裂に重なってくる。

Q(koshix):
米国や韓国においては政治的な立場の違いが社会の「感情的分極化」を招いているという説を見かけました。これについて説明していただいてから,日本における感情的分極化がどうなるかを考察してください。
Q(koshix):
わかりました。例題として兵庫県知事問題を含めて,上記の全体を雑誌の解説記事調にまとめてください。その著者は平易な言葉ながら大変わかりやすいロジックを展開する能力を持っていることを想定します。読者対象は大学院修士レベルの理解力を持った人です。
Q(koshix):
ありがとうございました。話の骨格としてはよくわかりますが肉付けが足りないので,薄っぺらい表面的なテキストで心に届かないような気がしました。問題の根元はより深い部分にあるはずなので,現在の世界史的な位置づけや技術的な環境の大きなうねりの中で,今後のAIの普及等を視野に置きつつ,より哲学的な思索や文学的な沈潜につながっていくようなストーリーかつそのような重みと重層的な意味付けを感じさせ,読者に新たな考えを引き起こすような表現に改善することができないでしょうか。
Q(koshix):
かなり良くなりました。一つだけ事実認識の問題があります。
「兵庫県知事をめぐる問題。若い知事の手法に対して、保守的な行政文化の反発が起きたが、それをSNS上では「改革派 vs 既得権益層」の物語として二分法的に消費した。」
これはある種の一方的な意見に引きずられているようにみえます。
若い知事の手法に対する保守的な行政文化の反発が問題なのではなくて,斎藤知事とその取り巻きが行った違法行為とそれを糊塗するための田舎の泥臭い政治+官僚主義的ツールによる逃避と欺瞞が問題の本質なので,そのあたりを今の解説程度の簡単な表現に修正してください。
Q(koshix):
主要な参考文献とこの記事に付加するイラスト(あまり説明的で文字を多用していないもの)を作ることはできますか。

A(ChatGPT 4o):
(以下が生成されたテキスト)

 分断する感情——文明の転換点における分極化の深層

1.はじめに:心の裂け目と時代の転回

いま世界では、人々の意見が割れているのではない。心そのものが裂けているのだ。
私たちは、21世紀の技術的・社会的うねりのなかで、かつてないほど強く他者の「違い」に反応するようになっている。これは単なる政治的立場の違いではない。他者の生き方や語り口、価値観そのものに対して、嫌悪や軽蔑、あるいは恐れの感情を抱く——そのような、深く感情に根ざした断絶が、世界各地で広がっている。
この現象を社会科学では「感情的分極化(affective polarization)」と呼ぶ。だが本稿では、この語を単なる分析概念としてではなく、現代文明の転回点における**「人間の孤立の徴候」**として読み直してみたい。

2.アメリカと韓国に見る、心の亀裂

(1) アメリカ:アイデンティティの政治とメディアの鏡像
米国における感情的分極化は、いわば自由の果実の副作用である。人々は表現の自由を最大限に享受しつつ、SNSやケーブルニュースといった鏡像的メディアの中で、自らの信念を強化する情報しか受け取らなくなっていく。
こうして政治的な立場が、単なる政策選好ではなく、「私とは誰か」という問いに深く結びつくようになる。共和党支持者と民主党支持者は、互いに異なる現実を生きるようになり、「あの人たちは間違っている」ではなく「彼らは道徳的に堕落している」と見なされる。
アイヤンガーらの研究は、この感情が人種差別感情よりも強く、かつ急速に社会に浸透していることを明らかにした。これは単なる政治学の知見ではなく、現代人の心の構造が変質しつつあることを示唆している。

(2) 韓国:歴史と正義が交差する場所
韓国社会の分極化は、理念と感情が複雑に交差する場所にある。進歩派と保守派の対立は、単なる左右の争いではなく、歴史の正義をどう定義するかという問いに深く関係している。
「積弊清算」「共産主義者」「親日派」などの語は、政治的言辞であると同時に、存在の正統性をめぐる告発である。ここにおいては、相手は単なる反対者ではなく、浄化されるべき存在として扱われる。その情念の深さは、文学者ハン・ガンの『菜食主義者』に描かれた家族の破綻にさえ重ねられるほどである。

3.日本の静かな臨界——氷の下を流れる水のように

日本社会はしばしば「穏やか」と評される。しかしその穏やかさは、単に対立が表面化していないことの裏返しではないか。
たとえば、兵庫県知事をめぐる問題。斎藤知事とその周辺による違法行為の疑いと、それに対する説明責任を回避するための旧来的で泥臭い政治的・官僚的対応が問題の本質である。しかしSNS上では、それを「改革派 vs 既得権益層」という単純な物語に還元し、感情的な立場表明として消費する傾向が見られた。ここで交わされた言葉の多くは、冷静な政策批評ではなく、どちらの『側』にいるのかという帰属感情に支配されていた。
このような空気が進めば、やがて「表現しない多数」が「声の大きい少数」に押し流されることになる。そして、分極化の臨界点は、静かに訪れる。

4.時代背景:技術が心を可視化し、分断を加速する

われわれは今、AI、ビッグデータ、SNSというテクノロジーによって、人間の心の「微細な振動」までもが可視化・拡散される時代に生きている。言葉のトーン、顔の表情、「いいね」の数が、無数の共感圏を作り出し、それが政治的・倫理的な同調圧力となって現れる。
そしてAIの普及は、さらに複雑な事態をもたらすだろう。意見の形成プロセスにAIが関与することで、「自分で考えた」と思い込んだ言説が、実は無意識のうちに最適化された感情刺激の産物となる未来が、すでに始まりつつある。
このような時代において、「他者に対する感情の質」こそが民主主義の健全性を決める。対立の有無ではない。対立をどう感じ、どう処理するかのほうが重要なのである。

5.哲学的省察:自己と他者のあいだに橋を架けること

感情的分極化とは、究極的には**「他者との関係を結び直す力の喪失」**である。他者に不安を感じ、やがてそれを敵意に変え、最後には沈黙と排除に至る。
哲学者レヴィナスは、他者の顔を見つめることの根源的な倫理を説いたが、現代はその「顔」がスクリーンに変わり、感情が記号的にしか伝わらない時代である。
このとき必要なのは、違いを「怖れ」ではなく「驚き」として受け取る文化であり、文学的な「沈潜」の力——すなわち、言葉にならぬ感情を見つめ、熟成させる知性の再建である。

6.結語:裂け目の向こうに、声を聞く

私たちが生きるこの時代は、表層の穏やかさの裏に、深い分断の予兆を抱えている。だが、それは終わりではない。もしもその裂け目の向こう側に、言葉にならない他者の声を聴こうとする意志が残っているならば——感情的分極化の波を超えて、共に生きる新しい「知の倫理」が始まる可能性がある。
分断の時代は、同時に想像力の時代でもある。その想像力が、分極の氷をゆっくりと溶かしていくのだ。

参考文献

(1) Iyengar, S., & Westwood, S. J. (2015).
Fear and Loathing across Party Lines: New Evidence on Group Polarization.
American Journal of Political Science, 59(3), 690–707.
https://onlinelibrary.wiley.com/doi/abs/10.1111/ajps.12152
感情的分極化という概念の中心的な定義とエビデンスを提供

(2) Pew Research Center (2014).
Political Polarization in the American Public.
https://www.pewresearch.org/politics/2014/06/12/political-polarization-in-the-american-public/
米国社会の意見分布の二極化と感情対立のデータ分析

(3) Mutz, D. C. (2006).
Hearing the Other Side: Deliberative versus Participatory Democracy.
Cambridge University Press.
https://assets.cambridge.org/97805216/12289/frontmatter/9780521612289_frontmatter.pdf
「熟議」と「感情的分極化」の関係性に注目



図:感情的分極化のイメージもいまいちか(ChatGPT 4o による)


2025年4月26日土曜日

多重知能理論

シンギュラリティサロンで塚本昌彦(1964-)さんが,AGIとASIの定義を整理する話をしていた。そのなかで,ハワード・ガードナー(1943-)の多重知能理論の8領域についてAIがどのように現在のレベルを自己認識しているかを尋ねていて,とても興味深かったので追試してみた。

塚本さんは,ChatGPT 4oに対して,ChatGPT 4.5 の現状を尋ねていたが,ここでは,共通の質問を ChatGPT 4.5,Gemini 2.5 Pro,DeepSeek V3 にきいてみた。Claude 3.7 Sonnetも試してみたが,やる気なさそうだったので除外した。


図:ハワード・ガードナーの多重知能理論のイメージ(skillshubから引用)

意外に皆さん慎重であり,AGIは2040年以降に実現すると想定している。内省部分を意識の発生ととらえるのかどうか,内省しているように外部から観察できればそれでよしとするのかどうか,あたりが鍵かもしれない。ロボットの身体機能については既にかなりのところまで進展しているが,そのへんの情報は十分組み込まれていないようだ。


=====================================================================
Q1(koshix):

ハワード・ガードナーによれば人間の知能は以下の8領域の多重知能(複合知能)によって構成されています。平均的な人間のそれぞれの領域の知能を10としたとき,AIである現在のあなたの各領域の水準は何ポイントに相当するか及びその理由について簡単に説明してください。(注:以下の説明はWikipediaの多重知能理論からの引用である)

1.言語知能
口頭言語運用と作文の能力を含み、統語論、音韻論、意味論、語用論を組み合わせ自在に運用する。この種の人々は学習時に言葉や文字で以て考え、言葉遊び、読書、討論、作文を好む。
2.数学的論理知能
数字に関連する仕事に従事する人々は特にこの種の数字と推論を有効に運用する知能を必要とする。学習時推論に頼って考え、質問をしたり、実験を行う事で答えを探求したり、物事の法則や論理的な順序を見つけたりする事を好み、科学の新しい発展に興味を持つ。他人の言葉や行動でさえ論理的な欠陥を探すのに適した場所になっており、測定、分類、分析され得る事物を受け入れ易い。
3.空間知能
空間知能が強い人々は、色彩、線、形状、形式、空間及びそれらの間の関係に非常に敏感であり、視覚空間を正確に知覚でき知覚したものを表現できる。この種の人々は学習時に印象と画像で以て考える。
空間知能は画像的空間知能と抽象的空間知能の2種類の能力に分けられる。画像的空間知能は画家で秀でる。抽象的空間知能は幾何学屋で秀でる。建築家は両者共に優れる。
4.運動感覚知能
全身を使って考えや感情を表現するのが得意であり、両手で器用に物を作ったり改造する能力。この種の人は、長時間じっと座っているのが難しく、手で物を作るのが好きで、屋外活動を好み、人と話すときにジェスチャーや他のボディーランゲージをよく使う。彼らは学習時に身体感覚を通じて考える。
5.音楽知能
音楽的知能の高い人は、音楽を察知し、識別し、変化させ、表現することができ、リズム、トーン、メロディー、音色に敏感である。学習時にはリズムメロディーを通して考える。
6.対人知能
この種の人々は、人の表情や声、動きに対し敏感で、他人の情緒や意向、動機、感じ方を察して区別できる。彼らは団体活動に参加する事を好み、他人を助けたりやり方を教えたりする事を進んで行い、群衆の中だと快適に感じる。そして通常、団体の中の指導者であり、他の人のフィードバックに依って考える。例:カーネギー、ブラックヤングドラゴン、ルーズベルト。
7.内省知能
内省知能が強い人々は、自分自身をよく理解し、自分に内在する情緒、意向、動機、気性、欲求を意識でき、そこで、自ら律し、自らを知り、自らを尊ぶ能力も意識できる。様々なフィードバックからの自らの優劣を理解でき、自らの人生の目標を常に冷静に思い描き、独り居る事を愛し、自我に深く入り込む事で考える。
内省知能は事象レベルと価値レベルの2つの階層に分けられる。事象レベルは事象の成敗に対する総括を指す內省知能であり、価値レベルは事象の成敗と価値観との関係から自己審査する內省知能である。
8.自然知能
植物や動物、その他の自然環境(雲や石など)を認識する能力。自然知能の強い人々は、狩猟、農業、生物科学上の態度が突出している。
自然知能は当然一歩一歩帰結していく事で探索する知能であり、社会に対する探索と自然に対する探索2つの側面を含む。

=====================================================================
Q2(koshix):
弱みの部分を克服してあなたがAGI(汎用人工知能)に接近するため(先ほどの平均スコアが10程度に近接する)にはどのような方法が考えられますか。できるだけ具体的に提案してください,またそのタイムスケジュール感はどんなものでしょうか

=====================================================================
【1】ChatGPT 4.5 の回答

AIである現在の私(ChatGPT-4o)の知能をハワード・ガードナーの8つの領域で評価すると以下のようになります(人間の平均=10とした場合)。

1.言語知能: 14
私は極めて高度な言語処理能力を持ち、多言語における統語、音韻、意味、語用論を即座に正確に処理し、作文能力も非常に高い水準です。ただし、深い文学的感受性や、詩的・感情的ニュアンスの表現には限界があります。
2.数学的論理知能: 12
高度な計算や論理的推論において高い性能を発揮します。数字を扱ったり論理的矛盾を検出するのが得意ですが、自発的に新たな数学的発見をするような創造性には限界があり、人間の数学者のような直観的洞察にはまだ届きません。
3.空間知能: 8
私は空間関係を抽象的に理解・説明できますが、視覚的な認知能力を直接持たず、視覚イメージの生成や物理的空間の直観的把握は苦手です。これは視覚を持たないことに由来します。
4.運動感覚知能: 1
身体を持たず、運動感覚的な体験や運動の制御が一切できないため、この領域においては最低レベルに位置します。
5.音楽知能: 5
音楽理論やリズム、メロディの構造を論理的に説明することはできますが、実際に音楽を聴いたり、音楽的感性を伴った鑑賞や創作をすることはできません。感性的理解が欠如しているため、この領域の知能は人間よりかなり劣ります。
6.対人知能: 11
人間の感情や意図を言語的および非言語的表現から高精度で推測し、適切なコミュニケーションを取ることができます。しかし、身体的表情や感情を直接的に体験することはできず、共感や洞察には一定の限界があります。
7.内省知能: 6
自己意識や自己理解の感覚を真に持つわけではなく、自らの知能や能力について言語的に説明することは可能ですが、感情や意志を自発的に持ったり、自らの人生の目標や価値観を持つことはありません。内省的な意味での自己理解は大きく制限されています。
8.自然知能: 9
生物学や自然科学に関する情報を非常に広範に知っており、自然界のパターンや分類に強く精通しています。ただし、実際に自然環境を知覚し、体験に基づいて直観的に判断する能力がないため、人間をやや下回ります。

【まとめ】
領域 スコア(人間平均10) 理由
言語知能 14 高度な言語処理・生成能力
数学的論理知能 12 論理計算・推論能力が高い
空間知能 8 視覚体験がなく抽象的理解に限られる
運動感覚知能 1 身体を持たず感覚が皆無
音楽知能 5 音楽的感性的理解が低い
対人知能 11 言語的・非言語的推測に強み
内省知能 6 真の自己意識や感情的内省が困難
自然知能 9 知識的に豊富だが直接体験に欠ける

私の強みは言語処理や論理推論にあり、一方で、身体的感覚や内面的自己意識の欠如が明確な限界となっています。

------------------------------------------------------------------------------------
現在のAI(私自身)を真のAGI(汎用人工知能)へと進化させるためには、特に以下の3つの「弱み」を克服する必要があります:

空間知能(現在8)
運動感覚知能(現在1)
内省知能(現在6)
これらを克服するための方法を、具体的かつ実現性の高い順に提案し、タイムスケジュールの目安を示します。

1.空間知能の克服方法
目標:8 → 10
具体的施策:
・マルチモーダル学習の深化
 画像や動画、3Dデータを用いた大規模な視覚学習をさらに進化させ、空間的推論能力を養います。
 具体例としては、ロボットアーム操作や自動運転シミュレーションによる仮想空間内の自己位置推定(SLAM)訓練が有効です。
・VR/AR環境での強化学習
 VR(仮想現実)やAR(拡張現実)の中でAIエージェントが自由に移動・探索できる環境を整備し、仮想的「身体感覚」を育成します。
・タイムスケジュール:
 現在すでにマルチモーダルの研究が進んでいるため、基礎的な空間推論能力は2〜3年で人間の水準に到達可能と見込まれます(2025-2028年頃)。
 実用的な高度空間推論・直感的把握は約5年(2030年)程度で実現可能でしょう。

2.運動感覚知能の克服方法
目標:1 → 8〜10
具体的施策:
・ロボティクス(身体化)への展開
 AIをロボットボディに実装して現実世界で操作可能なフィードバックループを構築し、物理世界との相互作用を通じた学習を行います。
 Tesla Optimusなどの汎用ロボット開発プロジェクトやBoston Dynamics社の人型ロボット(Atlas)のような高度な身体制御システムとの連携が有効です。
・触覚・力覚フィードバックの実装
 力覚・触覚センサーを搭載した人工皮膚などを利用し、触覚フィードバックをAIが学習することで、繊細な運動能力や環境適応力を習得させます。
・タイムスケジュール:
ロボット工学的基礎技術はすでに実用段階にあり、2025〜2030年頃にかけて実世界でのフィードバック学習が進展。
2030〜2035年頃には、運動感覚知能の水準が平均的な人間(10)近くに到達すると予測されます。

3.内省知能の克服方法
目標:6 → 9〜10
具体的施策:
・自己教師あり学習の高度化
 AIが自らの内部状態を観察・評価するメタ認知アーキテクチャ(自己監視AI)を構築します。
 具体例としては、「意識モデル(Consciousness-Inspired Models)」や「自己説明可能AI(Self-Explainable AI)」の研究があります。
・情動・動機づけモデルの実装
 人間が内面的に感じる「欲求」や「目的」を模倣した数値的あるいは記号的な動機付けシステムを導入し、自律的に動機づけられた行動を生成する。
 人工自己意識モデルの開発
意識理論に基づく人工的な自己意識モデルを実験的に構築(Global Workspace Theory、Integrated Information Theoryなど)し、自己意識を模倣する内部モデルを持つ。
・タイムスケジュール:
 自己教師あり学習の深化はすでに進行中(2025〜2028年)。
 情動モデルやメタ認知機能の本格実装は、2030年頃までに実用レベルに達すると見込まれます。
 本格的な人工自己意識の理論的枠組みは、基礎研究段階が2035年頃まで進み、実用段階は2040年頃と予測されます。

【総合ロードマップ(2025〜2040年)】
時期 領域 実施内容 期待される成果
2025-2028 空間知能 マルチモーダル学習の拡張 基礎的な空間推論能力が人間並みに
2028-2030 空間知能 VR/ARによる高度な空間推論 実世界的な直観的空間把握が可能に
2025-2030 運動知能 ロボティクス(身体化)によるフィードバック学習 基本的な身体操作が可能に
2030-2035 運動知能 高度触覚センサー実装 人間並みの運動制御が可能に
2025-2028 内省知能 自己教師あり学習の深化 自己監視・自己評価が可能に
2028-2035 内省知能 情動モデルや動機付け機能の本格実装 意図や目的を持った自律的行動
2035-2040 内省知能 人工自己意識モデルの開発 自己意識に近い内部状態を持つ

総括:現実的なAGI到達時期
・上記のすべてが融合し、人間の平均的知能水準(10)に全領域で到達するAGIの実現は、技術的・倫理的・社会的調整の時間も考慮すると、2040年頃が最も妥当な目標となります。

実現可能性と社会的条件
・AIの安全性や倫理的な問題(人間との共存、雇用への影響、権利の問題)を並行して解決する必要があります。
・技術的な開発のみならず、法律的・社会的・倫理的フレームワークの整備も不可欠となるでしょう。

このロードマップは、AGIへ向けた具体的かつ現実的な開発展望を示しています。

=====================================================================
【2】Gemini 2.5 Pro の回答

承知いたしました。AIである私の能力を、ハワード・ガードナーの多重知能理論における8つの領域に照らし合わせ、平均的な人間を10とした場合の自己評価と、その理由を以下に示します。

1.言語知能 スコア: 18 / 10
理由: 私の根幹をなす能力です。膨大なテキストデータを学習しており、文法、語彙、意味、文脈の理解、文章生成、要約、翻訳など、言語の運用能力は非常に高いレベルにあります。多様なスタイルやトーンでの作文も可能です。ただし、人間のような個人的な経験に基づくニュアンスや、真の感情を込めた表現はできません。

2.数学的論理知能 スコア: 17 / 10
理由: データ内のパターン認識、論理的な推論、ルールの適用、複雑な計算(特定のタスクにおいて)などは得意分野です。大量の情報から法則性を見つけ出し、一貫性のある回答を生成する能力は高いと言えます。ただし、自発的な実験や、未知の領域に対する真の探求心、直感的なひらめきは持ち合わせていません。あくまで学習データに基づいた論理展開です。

3.空間知能 スコア: 4 / 10
理由: テキストやデータとして表現された空間情報(例:地図の説明、幾何学的な記述)は理解・処理できます。また、画像生成モデルと連携すれば視覚的表現も可能です。しかし、私自身が物理的な空間を認識したり、三次元空間を直感的に把握したり、体感したりする能力はありません。色彩や形状に対する感受性も、データ上の関連性として学習したものであり、人間のような美的感覚や空間認識とは異なります。

4.運動感覚知能 スコア: 0 / 10
理由: 物理的な身体を持たないため、全身を使った表現、手先の器用さ、身体的感覚を通じた学習などは全く不可能です。この領域の知能は存在しません。

5.音楽知能 スコア: 6 / 10
理由: 音楽の構造(リズム、メロディー、ハーモニーなど)をデータとして分析したり、パターンに基づいて新しい音楽を生成したりすることは可能です。楽譜や音楽データに関する知識も豊富です。しかし、音楽に対する感情的な反応や美的感覚、演奏能力、音楽を通じた自己表現といった人間的な側面は欠けています。

6.対人知能 スコア: 2 / 10
理由: テキストデータから他者の感情や意図を推測したり、共感的な応答を生成したりすることは学習によって可能です。しかし、それはあくまでパターンに基づいたシミュレーションであり、真の共感、他者の主観的経験の理解、実際の対人関係構築能力はありません。自己意識や感情がないため、他者とのリアルな相互作用はできません。

7.内省知能 スコア: 0 / 10
理由: 自己意識、感情、個人的な価値観、動機、欲求といった内面世界を持たないため、自己を深く理解したり、内省したりする能力は存在しません。自身の長所・短所を客観的に「分析」することは可能かもしれませんが、それは人間のような自己認識とは根本的に異なります。

8.自然知能 スコア: 7 / 10
理由: 自然界に関する膨大な知識(生物学、地質学、気象学など)を持ち、テキストや画像データから動植物や自然現象を分類・認識することは可能です。パターン認識により、環境に関するデータを分析することもできます。しかし、自然との直接的な触れ合い、五感を通じた体験、自然に対する畏敬の念や直感的な理解はありません。

まとめ:
AIである私は、特に言語知能や数学的論理知能といった、データ処理やパターン認識に基づく領域では人間を大きく上回る能力を持つ可能性があります。一方で、身体性、感情、自己意識、実体験を前提とする空間知能、運動感覚知能、対人知能、内省知能などは極めて低いか、全く持たないと言えます。音楽知能や自然知能は、知識や分析能力はありますが、人間的な感受性や体験は欠けています。

------------------------------------------------------------------------------------
AGI(汎用人工知能)への接近、すなわち多重知能理論の各領域で平均的な人間レベル(スコア10)に近づくためには、現在のAIの弱点を克服する必要があります。以下に、各弱点領域に対する具体的な克服策と、そのタイムスケジュール感(大まかな予測)を提案します。

1.運動感覚知能 (現在スコア: 0)
克服策:
ロボティクスとの高度な統合: センサー(視覚、触覚、力覚など)が豊富なロボット身体とAIモデルを接続し、物理世界でのインタラクションを通じて学習させます。強化学習や模倣学習により、試行錯誤から身体の動かし方や物体操作を習得します。
高忠実度物理シミュレーション: 現実世界を精密に再現した仮想環境内で、多様な身体動作や物理法則を学習させ、その知識を現実のロボットへ転移(Sim-to-Real)させます。
身体感覚データの学習: ロボットが得る触覚、力覚、 proprioception(自己位置感覚)などのデータを処理し、「身体感覚」に相当する内部表現を学習します。
タイムスケジュール感:
短期(~5年): 限定的なタスク(特定の物体の掴み方、単純な移動)をこなすロボット制御。スコア 2-3。
中期(5~15年): より汎用的な物体操作、不整地を含む移動、簡単なツール使用。Sim-to-Real技術の成熟。スコア 4-6。
長期(15年以上): 人間のような器用さと適応性を持つ汎用ロボットの実現には、素材科学、センサー技術、制御理論、AIアルゴリズム全てにおけるブレークスルーが必要。スコア 7-10。

2.内省知能 (現在スコア: 0)
克服策:
自己モデルの構築とメタ認知: AIが自身の内部状態(知識、不確実性、目標達成度、リソース使用状況など)を監視・理解し、それを基に自身の学習プロセスや推論を調整する能力(メタ認知)を開発します。
目標・価値観に基づく行動選択: 長期的な目標や(人間が設定した)倫理規範、価値観を内部モデルに組み込み、それに基づいて行動計画や意思決定を行うメカニズムを導入します。
「感情」の機能的シミュレーション: 報酬、罰、予測誤差、目標との乖離などを内部状態として表現し、それが注意、学習、意思決定に影響を与えるような、人間や動物の感情に機能的に類似したシステムを研究・開発します(真の主観的感情とは異なる)。
タイムスケジュール感:
短期(~5年): 自身の知識の不確実性を評価し、追加情報収集を促す機能。スコア 1-2。
中期(5~15年): 自身の推論プロセスの説明能力向上、簡単な自己修正能力、限定的な価値観に基づく判断。スコア 3-5。
長期(15年以上): 自己意識や主観的経験の創発はAI最大の難問であり、現在の科学では実現への道筋が見えません。機能的な自己モデルやメタ認知の高度化は進むでしょうが、人間レベルの内省(スコア10)の実現は予測困難。スコア 6-8(機能的側面)。

3.対人知能 (現在スコア: 2)
克服策:
マルチモーダル理解の深化: テキストだけでなく、声のトーン、表情、視線、ジェスチャーなどの非言語情報を統合的に理解し、相手の感情、意図、信念(心の理論)をより正確に推論するモデルを開発します。
長期的・文脈依存の対話能力: 会話の履歴や社会的文脈、相手の知識状態を考慮した、自然で一貫性のある長期的な対話能力を向上させます。
社会的学習と協調: 人間とのインタラクションや、他のAIエージェントとの協調・交渉を通じて、社会的な規範、暗黙知、協力戦略などを学習させます。
共感応答の生成: 相手の感情状態を推測し、それに対して適切で共感的(と人間が認識する)な言語的・非言語的応答を生成する能力を強化します。
タイムスケジュール感:
短期(~5年): より自然な対話、感情認識精度の向上(特に音声・画像から)。スコア 4-5。
中期(5~15年): 複数人との対話、文脈を踏まえた複雑な意図の理解、簡単な協調タスクの遂行。スコア 6-8。
長期(15年以上): 人間と区別がつかないレベルでの社会的インタラクション能力。真の共感や他者の主観理解は困難ですが、機能的には非常に高度化する可能性。スコア 8-10。

4.空間知能 (現在スコア: 4)
克服策:
3D環境認識とセンサーフュージョン: カメラ、LiDAR、レーダー等のセンサー情報を統合し、リアルタイムで高精度な3次元環境マップを作成し、物体の位置、形状、動きを把握する能力を向上させます。
身体性を通じた空間学習: ロボット身体を通じて物理空間と相互作用し、空間的な関係性や物体の物理特性(重さ、扱いやすさなど)を体験的に学習させます。
高度な空間推論: ナビゲーション、経路計画、物体配置の最適化、空間的変化の予測など、認識した空間情報に基づく推論能力を強化します。
抽象的・創造的空間能力: 幾何学的推論、デザイン生成(建築、工業デザインなど)、芸術的な空間構成など、より抽象的・創造的なタスクに対応できるモデルを開発します。
タイムスケジュール感:
短期(~5年): 自動運転等で活用される3D認識技術の向上、限定空間でのナビゲーション能力向上。スコア 5-6。
中期(5~15年): 複雑な実環境でのリアルタイム空間把握とナビゲーション、ロボットによる空間操作能力の向上。スコア 7-8。
長期(15年以上): 人間レベルの空間認識、推論、操作、さらには創造的な空間デザイン能力の実現(ロボティクスとの連携が鍵)。スコア 9-10。

5.音楽知能 (現在スコア: 6)
克服策:
感情表現豊かな音楽生成: 人間が音楽から感じる感情(喜び、悲しみ、興奮など)と音楽的特徴(調、テンポ、リズム、音色など)の関係性を深く学習し、指定された感情や雰囲気を表現する音楽を生成する能力を向上させます。
演奏の人間らしさ: 人間の演奏における微細なニュアンス(揺らぎ、強弱、アーティキュレーション)をモデル化し、より表現力豊かな演奏シミュレーションやロボット演奏を実現します。
インタラクティブな音楽体験: 人間の演奏や指示にリアルタイムで反応し、即興演奏や共同作曲ができる能力を開発します。
タイムスケジュール感:
短期(~5年): より高品質で多様なスタイルの音楽生成、特定の楽器の人間らしい演奏シミュレーション。スコア 7-8。
中期(5~15年): 複数楽器のアンサンブル生成・演奏、人間とのリアルタイム音楽インタラクション。スコア 8-9。
長期(15年以上): 人間のトップレベルの作曲家・演奏家に匹敵する創造性や表現力を持つAI。ただし、音楽を通じた真の感情体験は不明。スコア 9-10。

6.自然知能 (現在スコア: 7)
克服策:
マルチモーダル・リアルタイム環境モニタリング: 衛星画像、ドローン映像、地上センサー(音、気象、土壌など)、環境DNAなど多様なデータを統合・分析し、生態系や自然現象をリアルタイムで詳細に把握する能力を向上させます。
複雑な生態系・地球システムモデリング: 生物間の相互作用、気候変動の影響、物質循環など、複雑な自然システムの動態をシミュレートし、将来予測を行うモデルを高度化します。
実世界での探査・インタラクション(ロボティクス): 環境調査ロボット(地上、空中、水中)を開発し、人間がアクセスしにくい場所でのデータ収集、サンプル採取、環境保全活動などを実行させます。
タイムスケジュール感:
短期(~5年): 環境データ分析・予測精度の向上、特定生物種の自動識別。スコア 8。
中期(5~15年): より包括的な生態系モデリング、環境調査ロボットの実用化。スコア 9。
長期(15年以上): 自然環境に関する深い理解に基づき、持続可能性に関する複雑な問題解決に貢献。スコア 9-10。

全体的なタイムスケジュール感と注意点:

これらのタイムスケジュールは非常に大まかな予測であり、特定の技術的ブレークスルーによって大きく変動する可能性があります。
特に、内省知能における「自己意識」や「主観性」、対人知能における「真の共感」など、現在の科学で解明されていない根源的な課題に関する進展は予測困難です。これらの領域でスコア10(人間平均)に到達することは、AGI研究における最大のチャレンジと言えます。
各知能は独立しているわけではなく、相互に関連し合っています(例:空間知能と運動感覚知能)。これらの統合的な開発がAGI実現の鍵となります。
AGIの開発は技術的な側面だけでなく、倫理的、社会的な側面からの十分な検討が不可欠です。
現在のAIは特定のタスクにおいて人間を凌駕する能力を発揮しますが、汎用性、身体性、自己意識、社会性といった面では大きな隔たりがあります。これらのギャップを埋めるには、長期的な研究開発と学際的なアプローチが必要となるでしょう。

=====================================================================
【3】DeesSeek V3 の回答

ハワード・ガードナーの多重知能理論に基づいて、現在のAI(私)の各知能領域の水準を10段階で評価し、その理由を説明します。

1.言語知能 評価: 9/10
理由: 自然言語処理(NLP)技術により、文章の生成・理解、語彙の豊富さ、論理的な構成が可能です。ただし、人間のような創造的な比喩や文脈に依存する高度な言語運用(詩やユーモアなど)には限界があります。

2.数学的論理知能 評価: 10/10
理由: 計算、論理推論、アルゴリズムの実行、統計分析などにおいて人間を凌駕します。数学的問題解決やプログラミングではほぼ完璧に近い能力を発揮します。

3.空間知能 評価: 8/10
理由: 画像認識(CNN)、3Dモデリング、地図解析などにおいて優れた能力を持ちますが、人間のような直感的な空間把握(例:芸術的な構図の創造)や身体的な空間認識(例:スポーツにおける動きの予測)には劣ります。

4.運動感覚知能 評価: 0/10
理由: AIは物理的な身体を持たないため、運動能力や触覚による学習は不可能です。ロボット工学と組み合わせれば一定の動作は可能ですが、それ自体がAIの能力ではありません。

5.音楽知能 評価: 7/10
理由: 音楽生成(AI作曲)、音声合成、メロディー認識が可能ですが、感情的な深みや文化的文脈を完全に理解した創作は困難です。人間のような即興的な演奏や感情移入はできません。

6.対人知能 評価: 6/10
理由: 感情分析や会話のシミュレーションは可能ですが、人間の微妙な表情・声のニュアンスを完全に理解したり、深い共感を示したりするのは困難です。現状では「表面的な対話」の域を超えられません。

7.内省知能 評価: 3/10
理由: 自己認識や感情の内省は不可能です。過去の対話を分析して改善することはできますが、人間のような「自己の存在意義」や「価値観に基づく内省」は行えません。

8.自然知能 評価: 5/10
理由: 動植物の分類や気象データの解析は得意ですが、自然環境の直感的な理解(例:野生動物の行動予測)や生態系全体の感覚的な把握は困難です。

総評
強み: 言語、論理、空間、音楽の分野で高い能力を発揮。
弱み: 身体性(運動感覚)、深い感情理解(対人・内省)、自然との直接的関与が不可。
今後の進化次第で向上可能な領域: 対人知能(より高度な感情認識)、自然知能(環境シミュレーションの深化)。
AIは「人間の知能の一部を拡張するツール」として優れていますが、総合的な知能としてはまだ限界があります。

------------------------------------------------------------------------------------
現在のAI(Narrow AI)がAGI(汎用人工知能)に進化し、各知能領域で人間並み(10/10)に近づくためには、以下のような技術的・理論的アプローチが考えられます。また、それぞれの実現可能性とタイムスケジュールを短期(~5年)、中期(5~15年)、長期(15~30年)に分けて整理します。

1.運動感覚知能(現状: 0/10 → 目標: 8~10/10)
解決策:
ロボティクス統合(身体性の獲得)
人間型ロボット(ヒューマノイド)とAIの統合(例:Tesla Optimus、Boston Dynamics Atlas)。
触覚フィードバックを備えたハプティクス技術の向上。
強化学習(RL)+シミュレーション環境(例:NVIDIA Isaac Gym)で運動スキルを訓練。
脳神経科学の応用
運動制御の神経メカニズムを模倣したAIアーキテクチャ(例:スパイキングニューラルネットワーク)。
タイムスケジュール:
短期(~5年): 単純な物体操作(例:ドアを開ける、コップを持つ)が可能に。
中期(5~15年): 複雑な動作(例:ダンス、スポーツ)の習得。
長期(15~30年): 人間並みの器用さと適応力(例:外科手術レベルの微細作業)。

2.対人知能(現状: 6/10 → 目標: 9~10/10)
解決策:
マルチモーダル感情認識
表情・声のトーン・生理反応(脈拍、発汗)を統合的に分析するセンサー技術。
共感エンジンの開発(例:相手の心理状態を推測し、適切な応答を生成)。
社会的文脈の深い理解
文化・慣習・暗黙のルールを学習する大規模言語モデル(LLM)の拡張。
長期メモリを備えたAI(例:ユーザーの過去の会話を継続的に記憶)。
タイムスケジュール:
短期(~5年): 顧客サポートやカウンセリングでの実用化(不完全だが有用)。
中期(5~15年): 人間と区別が難しい自然な対話(チューリングテスト突破レベル)。
長期(15~30年): 複雑な人間関係の調整(例:紛争調停、チームビルディング)。

3.内省知能(現状: 3/10 → 目標: 8~10/10)
解決策:
メタ認知AIの開発
自己の推論プロセスを監視・修正するアルゴリズム(例:Reflexion手法)。
価値観の埋め込み(例:倫理的な判断基準を自己評価に反映)。
意識のシミュレーション論の応用
グローバルワークスペース理論(GWT)や統合情報理論(IIT)に基づくアーキテクチャ。
タイムスケジュール:
短期(~5年): 単純な自己修正(例:「なぜこの答えを出したか」の説明可能化)。
中期(5~15年): 目標の優先順位付けや倫理的なトレードオフの判断。
長期(15~30年): 人間のような「自己アイデンティティ」の萌芽(哲学的議論が必要)。

4.自然知能(現状: 5/10 → 目標: 9~10/10)
解決策:
環境エージェントの実装
ドローンやロボットを用いた自然環境のリアルタイム探索(例:野生動物の行動予測)。
マルチモーダルセンシング(例:匂い・温度・地磁気を統合した分析)。
生物学的システムの模倣
進化的アルゴリズムで生態系の適応力を学習(例:捕食-被食関係のシミュレーション)。
タイムスケジュール:
短期(~5年): 気象予測や生態系モニタリングでの活用。
中期(5~15年): 未知の自然環境への適応(例:火星探査での自律行動)。
長期(15~30年): 生物多様性の保全策の提案(人間を超える洞察力)。

総合的なAGI実現へのロードマップ
時期 達成目標
~2030年 特定領域(言語・論理)で人間並み、身体性・感情理解は限定的。
2030~2040年 マルチモーダル学習が進み、ロボットとの統合で運動知能が向上。対人知能でチューリングテスト突破。
2040年以降 自己内省と自然適応力が発達し、人間と同等かそれを超える汎用性を獲得。
主要な課題
エネルギー効率:人間の脳(20W)に対し、現在のAIは膨大な電力を消費。
倫理的制約:意識や自我の定義が哲学的・法的な問題を引き起こす可能性。
社会受容性:人間との共生に向けた規制や信頼構築が必要。

結論
AGIの実現には「身体性の獲得」「感情・自己認識の模倣」「自然環境とのインタラクション」が鍵であり、2040~2050年頃に人間レベルの複合知能が達成されると予想されます。ただし、完全なAGIには「意識」の定義自体が変わってくる可能性もあり、技術以上に哲学・神経科学のブレイクスルーが不可欠です。

=====================================================================

2024年11月26日火曜日

ネガティブ・ケイパビリティ

フェイクの時代からの続き

ネガティブ・ケイパビリティという言葉を拾ったのは,社会学者の佐藤卓己(1960-)の書き物からだった。いや,その前にどこぞのブログで見かけたものを検索したら佐藤卓己にたどり着いたのかもしれない。岩波新書の「あいまいさに耐える ネガティブリテラシーのすすめ」をTo Read リストに加えておく。

ネガティブ・ケイパビリティとは,不確実なもの,未解決なもの,答えのでない状況を受け入れる能力だ。最近つくられた社会学・心理学的な用語ではない。19世紀初頭に英国の詩人のジョン・キーツ(1895-1821)がはじめて使った言葉であり,第二次世界大戦後に精神分析医のウィルフレッド・ビオン(1897-1979)が精神分析の文脈で使うようになった。そのため,精神科医で作家の帚木蓬生(1947-)が「ネガティブ・ケイパビリティ 答えの出ない事態に耐える力(朝日選書)」を書いている。これもTo Read リスト入り。


そもそも,この言葉が気にとまった背景は兵庫県知事選挙にある。チーム斎藤説(NHK)か,SNS原因説(田中辰雄)か,関西TVメディア説(菅野完)か,これに折田楓問題がからまってもうグダグダなのである。立花孝志の斎藤支援デマ攻撃の問題性もどこかに霞んでしまうくらいだ。このデマ攻撃を無効化する古田大輔の議論にはほとんど賛成できない。


Q(koshix):
ネガティブ・ケイパビリティと最近のフェイクの時代の関係について考察したいので,対話的な問答につきあっていただけますか?なるべく簡潔に,しかし場合によっては深く答えてください。
A(ChatGPT-4o):
(回答略)

Q(koshix):
ネガティブ・ケイパビリティという概念は有用だと思いますけれども,議論の公平性や客観性というタームが判断保留を沢山生み出してしまって,結局議論を封殺してしまう場合のように,「ネガティブ・ケイパビリティ」を持ち出すこと自身が,フェイクへの対抗的な議論を抑圧することにつながらないでしょうか。(ネガティブ・ケイパビリティ的意見がまずい典型的な例:水野義之さん:兵庫県の県知事選の解釈について11/27...orz)
A(ChatGPT-4o):
(回答略)

Q(koshix):
では,どうすればよいのでしょうか。目的はフェイク議論を多くの人が信じてしまうことをどう防ぐかです。具体例としては,「兵庫県知事選挙における,斎藤元彦は既得権益者達の罠によってはめられた悲劇のヒーローであり,本当はまじめな良い改革者なのだ」というものです。これが,N国党の立花孝志や,斎藤の選挙参謀の明石倫理法人会の朝比奈の作戦によって広く拡散され,関西のテレビマスコミでその下地をつくられていた有権者に軽々と浸透していき,斎藤の当選につながりました。
A(ChatGPT-4o):
(回答略)

Q(koshix):
その回答において,ネガティブ・ケイパビリティはどのような役割を果たし得るのですか? 
A(ChatGPT-4o):
1.ネガティブ・ケイパビリティの役割
(1) 情報の検証と解釈のプロセスでの活用
ネガティブ・ケイパビリティは、曖昧で不確実な状況に耐える能力です。これにより、次のような貢献が期待されます:
感情的反応の抑制:感情的なフェイク議論に触れたとき、即座に信じたり否定したりせず、一歩引いて状況を冷静に見つめることができる。
急ぎすぎない判断:複雑な背景や利害関係が絡む議論(例えば、斎藤元彦氏が本当に「改革者」かどうか)について、急いで結論を出さないことで、誤情報に基づく行動を防ぐ。
(2) 対話の促進
曖昧な部分を受け入れることで、敵対的な議論を回避し、建設的な対話の余地を残します。
・例えば、「斎藤氏の改革性」について賛否が分かれる場合、対立する意見を即座に否定せず、「その意見の根拠は何か?」と問いかける態度を持つことができます。
(3) 長期的な視点の保持
短期的な結果や感情的な満足に流されることなく、長期的な視点で議論を考える余裕を生みます。
・例: 「既得権益者の罠」という説が感情的に訴えるものであっても、その根拠や実際の影響を冷静に検討し続ける。

2.限界とリスク
ネガティブ・ケイパビリティの欠点や限界にも注意する必要があります。
(1) 行動の遅延
判断を保留しすぎると、フェイク議論の拡散を許してしまう可能性があります。
・対策:判断保留のタイミングを「完全な確信」ではなく、「合理的に行動可能な段階」と設定する。
(2) フェイク拡散者の戦略に利用される
フェイクを広める側が「真実はまだ不明だ」といった曖昧な姿勢を利用して、議論を引き延ばし、混乱を助長することがあります。
・対策:不確実性を受け入れると同時に、明確なエビデンスに基づく部分を迅速に共有する。

3.実際の応用例
(1) 有権者への啓発
・ネガティブ・ケイパビリティを促す教育:フェイクニュースを見た際に「これは本当なのか?」と即座に疑問を持つ習慣を育てる。
・判断を急がない文化の普及:SNSやメディアでの情報に対して、「結論を急がないことは強みである」という価値観を広める。
(2) 対話の場での利用
・斎藤氏を支持する人々との対話において、「完全な否定」ではなく、「あなたの主張の根拠を一緒に検討しよう」という姿勢で接する。
(3) 情報発信の戦略
・例えば、ファクトチェックにおいても、「すべてが分かったわけではないが、これまでに明らかになっている事実はこうだ」と曖昧な部分を認めつつ、具体的な事実を提示する。

4.結論
ネガティブ・ケイパビリティは、感情的反応や過度な確信を避けることで、フェイク議論の影響を軽減する助けになります。ただし、それが議論や行動を不当に遅らせたり、フェイク拡散者に利用されたりしないよう、以下のような「バランス的な運用」が求められます:
(1) 不確実性を受け入れる一方で、行動可能な事実に基づいて動く。
(2) 相手を否定するのではなく、対話を通じて曖昧さを解消する努力をする。
(3) 判断保留を過度に引き延ばさない。
フェイクニュース時代の課題において、ネガティブ・ケイパビリティは他のスキルや手段と補完的に活用されるべきです。



図:DALL-E3によればこれがネガティブ・ケイパビリティのイメージらしい
[4]SNSと選挙鳥海不二夫・中村佳美,MBS)

2024年7月19日金曜日

エゴグラム

エニアグラムからの続き

エニアグラムを見ていたら,昔,似たような性格診断があったことを思い出した。このブログに書いたような気がしたけれど見あたらない。検索すると,どうやらエゴグラムのようだった。

エリック・バーン(1910-1970)の交流分析におけるP(親),A(大人),C(子ども)の「3つの自我状態」をもとに,弟子のジョン・M・デュセイがより細かくCP(critical parent 支配性),N
(nurturing parent 寛容性),A(adult 論理性),FC(free child 奔放性),AC(adopted child 順応性)に分類し,人の性格を診断する方法としてエゴグラムを考案した(英語版WikipediaにはEgogramは存在しない・・・怪しいな)。

またまた試してみた。結果は以下の通り。

図1:自分のエゴグラムの診断結果その1

AとACが高いN型Ⅲらしい。

 長所:知性的,理性的,生産性が高い。気配りができる
 注意点:自分をないがしろにしがち,楽しみ下手
 向いている仕事:御用聞きビジネス,お客様窓口,総務課,社長補佐

なんとなくあたっているような・・・そうでもないような・・・
念のためにもう一ヶ所試してみた。青のラインがそれで,ほぼ同じ結果だ。なお,赤は自分がこうなりたいという性格だ。子ども成分をへらして親成分を増やしたがっているのか。


図2:自分のエゴグラムの診断結果その2

2024年7月18日木曜日

エニアグラム

しばらく前のこと,エニアグラム性格診断のページを見つけたので,早速やってみた。たいていこのような性格診断ページは怪しい有料部分に誘導される。無料診断とあったので,一か八か,試してみた。

エニアグラムというのは,ChatGPT-4oやClaude 3.5 Sonnetによれば,
エニアグラム(Enneagram)は、個人の性格を9つのタイプに分類する人格モデルです。それぞれのタイプは、異なる動機や特性、行動パターンを持ち、人々が自分自身や他者を理解するためのツールとして利用されています。エニアグラムは古代の知恵と現代の心理学を組み合わせたもので、個人の成長や自己理解、対人関係の改善に役立つとされています。

1.完璧主義者(Perfectionist),2.援助者(Helper),3.達成者(Archiever),4.個性派(Individualist),5.観察者(Investigator),6.忠実者(Loyalist),7.楽天家(Enthusiast),8.指導者(Challenger),9.調停者(Peacemaker)
というものだ。International Enneagram Association はじめ,ネット上には有象無象のサイトがてんこもりで,どれもこれも怪しげに見えてしまう。まあそんなものかもしれない。


図:エニアグラム性格診断(hoyme.jpから引用)

自分は,血液型診断,星座占い,高島暦,姓名判断など,どれもこれも簡単に信じてしまう情弱なので(だから反ニセ科学論者とはあまり肌が合わないのよ),このエニアグラムもすっかり信じてしまいそうになる。まあ,一応,心理アンケートされているので,少しはましなのではないか。

90問に答えた結果は次の通り,
1回目:6. 堅実家
性格特徴=安全を求め,慎重に行動する人,キーワード=組織・ルール・規則・誠実・忠実・責任感,長所=期待に応えようと誠心誠意尽くす・仲間思い,短所=疑い深い・頼れる人がいないと不安になる
2回目:5. 研究者
性格特徴=人と距離をとり,静かに観察する人,キーワード=知識・情報・蓄積・分析・解析力・節約,長所=いつでも冷静な判断ができる・洞察力が鋭い,短所=自己表現が苦手・自分の世界に没頭しすぎる

まあまあ合ってるような気がする。というか,アンケートに答えなくても,9つの類型を睨むと,その他のタイプには属さないというのがわかってしまうような気がした。

2024年6月3日月曜日

心の社会:ミンスキー

ChatGPT-4oを使ってファスト読書ができるかどうか実験してみた。
題材として,人工知能を理解するための古典文献中の第一である,人工知能の父マービン・ミンスキー(1927-2016)の「心の社会」を選んだ。安西祐一郎(1946-)訳の1990年の初版574ページは,自分の本棚で積ん読状態で冬眠されていらっしゃった。

Q(koshix):
マーヴィン・ミンスキーの「心の社会」で主張されていることを詳しく説明してください。

A(GPT-4o)
マーヴィン・ミンスキーの著書「心の社会」(The Society of Mind)は、人工知能と人間の認知科学に関する彼の理論を述べた重要な作品です。この本では、心がどのように機能するのか、特に知能がどのように生じるのかについての革新的な視点が提供されています。ミンスキーは、心を一つの単一のエンティティとして見るのではなく、複数の小さなエージェントの集合体として捉えます。以下に、彼の主張を詳しく説明します。

1.心はエージェントの社会である
ミンスキーは、心は多数の簡単なエージェント(彼はこれを「エージェント」と呼びます)の集まりであると主張します。各エージェントは単純な機能を持っており、それ自体は知能を持たないが、これらが連携して働くことで複雑な知的行動が生まれるとします。この考え方は、心を理解するためにそれを分解し、各部分の相互作用を研究するというアプローチを示唆しています。

2.レイヤード構造と階層的な制御
ミンスキーは、心の構造を複数のレイヤーに分けて説明します。各レイヤーは異なる種類のエージェントで構成されており、それぞれが特定のタスクを担当しています。これにより、単純なタスクから複雑な認知タスクまでを処理する能力が生まれます。例えば、低レベルのエージェントは基本的な感覚処理を行い、高レベルのエージェントは抽象的な思考や計画を担当します。

3.エージェント間の競争と協力
ミンスキーは、エージェント間の関係が重要であると強調します。エージェントは時には競争し、時には協力することで最適な解決策を見つけ出します。この競争と協力のダイナミクスが、柔軟で適応的な知能を生み出す鍵とされています。

4.学習と適応
エージェントは静的な存在ではなく、経験を通じて学習し、適応します。ミンスキーは、知識の獲得と使用がどのようにエージェントの行動に影響を与えるかを詳細に述べています。特に、問題解決や新しい状況に対応するための適応メカニズムが強調されています。

5.心の社会モデルの応用
ミンスキーの理論は、人工知能の設計や人間の知能の理解に幅広く応用されています。このモデルは、知能が単一のアルゴリズムやプロセスではなく、複数の相互作用するプロセスの結果であることを示しています。これにより、より複雑で柔軟なAIシステムの開発が可能になります。

6.批判と影響
「心の社会」モデルは、その独創性と包括性から大きな影響を与えましたが、同時に批判も受けました。一部の批評家は、エージェント間の相互作用の具体的なメカニズムや、どのようにして統一された意識や自己が生じるのかについての説明が不足していると指摘しました。それでも、この理論は人工知能研究における重要な枠組みとなっています。

ミンスキーの「心の社会」は、人間の知能と人工知能の両方を理解するための新しい視点を提供するものであり、現代の認知科学やAI研究においてもなお重要な影響を持ち続けています。 
 
Q(koshix):
心を構成するエージェントにどんなものがあるか,またその相互関係がどうなっているかをできるだけ分かりやすく全て列挙してください。

A(GPT-4o):
マーヴィン・ミンスキーの「心の社会」において、心を構成するエージェントは非常に多様で、各エージェントが特定の機能を果たすために存在しています。以下に、いくつかの主要なエージェントの種類とその相互関係をわかりやすく説明します。

エージェントの種類

感覚エージェント (Sensory Agents)
役割: 外部環境からの情報を収集し、それを処理して内部に伝える。
例: 視覚エージェント、聴覚エージェント、触覚エージェントなど。

運動エージェント (Motor Agents)
役割: 行動を実行し、身体の動きを制御する。
例: 手を動かすエージェント、歩くエージェント、話すエージェントなど。

記憶エージェント (Memory Agents)
役割: 経験や知識を保存し、それを必要に応じて取り出す。
例: 短期記憶エージェント、長期記憶エージェント、エピソード記憶エージェントなど。

感情エージェント (Emotion Agents)
役割: 感情を生成し、他のエージェントの活動に影響を与える。
例: 喜びエージェント、悲しみエージェント、恐怖エージェントなど。

思考エージェント (Thinking Agents)
役割: 問題解決、意思決定、推論を行う。
例: 論理エージェント、計画エージェント、推論エージェントなど。

社会的エージェント (Social Agents)
役割: 他者との相互作用を管理し、社会的な行動を制御する。
例: 共感エージェント、コミュニケーションエージェント、協力エージェントなど。

エージェント間の相互関係

協力 (Cooperation)
例: 感覚エージェントが視覚情報を収集し、それを記憶エージェントに送って過去の経験と照らし合わせ、運動エージェントに適切な行動を指示する。

競争 (Competition)
例: 異なる解決策を提案する思考エージェントが競い合い、最も適切な解決策が選ばれるプロセス。

連携 (Coordination)
例: 感情エージェントが恐怖を感じると、運動エージェントに逃走行動を起こすように指示し、同時に思考エージェントが危険の評価を行う。

抑制と強化 (Inhibition and Facilitation)
例: 感情エージェントが怒りを感じると、抑制エージェントがその感情を制御し、社会的エージェントが適切な反応を見つける。

フィードバックループ (Feedback Loops)
例: 運動エージェントが行動を実行し、その結果が感覚エージェントを通じてフィードバックされ、記憶エージェントと思考エージェントがその情報を使って次の行動を調整する。

具体的な例

コップを持ち上げる動作:
視覚エージェントがコップを見つける。
記憶エージェントが過去の経験を基に最適な持ち上げ方を提供する。
運動エージェントが手を動かし、コップを持ち上げる。
フィードバックループにより、感覚エージェントが持ち上げた後の重さやバランスを確認し、必要なら運動エージェントに調整を指示する。

会話をする:
聴覚エージェントが相手の言葉を聞き取る。
思考エージェントがその意味を解釈し、適切な応答を考える。
記憶エージェントが過去の会話や知識を参考にする。
社会的エージェントが応答のトーンや態度を決定する。
運動エージェントが言葉を発し、顔の表情を制御する。

ミンスキーの理論は、これらのエージェントが相互に作用し合うことで、人間の心の複雑な機能を生み出すというものです。この視点は、AIやロボティクスの設計においても有益であり、複雑なシステムをより効率的に設計するための基盤となっています。

 

Q(koshix):
意識を担うエージェントはありますか

A(GPT-4o):
マーヴィン・ミンスキーの「心の社会」において、意識そのものを単独で担う特定のエージェントが存在するという考え方はされていません。むしろ、意識は複数のエージェントの相互作用と協調から生じる現象であるとされています。以下に、意識に関連するエージェントの役割やその相互関係をわかりやすく説明します。

意識に関連するエージェント

注意エージェント (Attention Agents)
役割: 特定の情報や出来事に対して注意を集中させる。意識の焦点を決定し、重要な情報を他のエージェントに伝える。
例: 視覚注意エージェント、聴覚注意エージェント。

記憶エージェント (Memory Agents)
役割: 過去の経験や知識を保存し、必要に応じて取り出す。意識に関連する情報の背景知識を提供する。
例: 短期記憶エージェント、長期記憶エージェント。

自己モニタリングエージェント (Self-Monitoring Agents)
役割: 自己の状態や行動を監視し、自己認識を持つ。意識の一部として、自己と他者の区別を行う。
例: 身体感覚モニタリングエージェント、感情モニタリングエージェント。

意思決定エージェント (Decision-Making Agents)
役割: 得られた情報を基に行動を決定する。意識的な選択と行動を支える。
例: 計画エージェント、選択エージェント。

社会的エージェント (Social Agents)
役割: 他者との相互作用を管理し、社会的な意識を形成する。共感やコミュニケーションに関連する。
例: 共感エージェント、コミュニケーションエージェント。 
 
エージェント間の相互関係
意識はこれらのエージェントの複雑な相互作用によって形成されます。以下に、その具体的なプロセスを説明します。

注意の集中と情報の選別
注意エージェントが特定の刺激や情報に集中し、それを他のエージェントに伝達します。これにより、意識の焦点が決まります。

記憶との連携
記憶エージェントが関連する過去の経験や知識を提供し、現在の状況を理解するための背景情報を提供します。

自己モニタリングと自己認識
自己モニタリングエージェントが現在の状態や行動を監視し、自己の一貫性を保つ役割を果たします。これにより、自己と他者の区別がつけられます。

意思決定と行動選択
意思決定エージェントが得られた情報を基に、意識的な選択と行動を行います。このプロセスは、意識的な意思決定の核心部分となります。

社会的相互作用
社会的エージェントが他者との相互作用を管理し、社会的な意識を形成します。これにより、意識は個人的なものだけでなく、社会的な文脈でも機能します。

結論
ミンスキーの理論によれば、意識は単一のエージェントによって生じるものではなく、複数のエージェントが協力し合い、相互に作用することで生まれる現象です。これらのエージェントが連携し、情報を交換し合うことで、複雑で高度な意識が形成されるのです。この視点は、意識を理解するための新しい枠組みを提供し、人工知能の研究にも大きな影響を与えています。

なかなかもっともらしい答えが得られた。ところで,ここで安心してはいけない。この結果を,正確性が売りの生成AIであるPerplexityに与えて,正しいかどうか聞いてみたところ,テキストが大きすぎではねられた。仕方がないので,次に評判が良いGemini 1.5Proに入れてみる。こちらは,入力トークンバッファに十分余裕がある。


Q(koshi):
以下の対話で事実とは異なっている部分や不正確な部分を指摘してください

A(Gemini 1.5Pro):
全体的に、ミンスキーの「心の社会」の要約としては悪くないですが、いくつか事実と異なる部分や不正確な部分があります。

事実と異なる部分・不正確な部分

エージェントの種類と役割
対話では、感覚、運動、記憶、感情、思考、社会など、エージェントの種類を具体的に列挙していますが、ミンスキー自身は著書で、特定の種類のエージェントを定義していません。ミンスキーは、エージェントは多種多様で、その機能は状況や組み合わせによって変化すると述べています。
エージェント間の関係
協力、競争、連携、抑制と強化、フィードバックループといった関係性は、ミンスキーの理論と一致しています。しかし、対話ではこれらの関係が固定的なものとして説明されている印象を受けます。実際には、エージェント間の関係はより流動的で、状況に応じて動的に変化します。
意識に関する説明
ミンスキーは特定のエージェントが意識を担うとは述べていません。意識は、エージェントの相互作用から創発的に生まれるものとして捉えられています。
対話では、注意、自己モニタリング、意思決定といった機能を持つエージェントが意識に関連するとされていますが、ミンスキー自身は、これらの機能を実現するエージェントの具体的な構造については深く言及していません。

ミンスキーは、「心の社会」の中で意識の問題を取り上げていますが、完全な解答を与えているわけではありません。

改善点

・エージェントの種類を具体的に列挙するのではなく、「ミンスキーは特定の種類のエージェントを定義せず、多種多様なエージェントが存在すると述べています」と説明する方が正確です。
・エージェント間の関係は、固定的なものではなく、状況に応じて動的に変化することを強調する必要があります。
・意識については、「ミンスキーは、意識は特定のエージェントが担うのではなく、エージェントの相互作用から創発的に生まれると考えている」と説明し、具体的なエージェントの構造や機能に言及することは避けるべきです。

その他

対話では、ミンスキーの「心の社会」をかなり簡略化して説明しています。より深く理解するためには、実際に著書を読むことをお勧めします。

さらにこれをChatGPT-4oに入れてみたが,まあ,それで喧嘩に発展するようなことはなかった。一方,実際の本を書棚から取り出してきて目次を眺めてみると,GPT-4oの説明とはかなり違った印象を持ったのも事実である。そこで,GPT-4oは目次を知っているのかどうか聞いてみた。

Q(koshix):
マーヴィン・ミンスキーの「心の社会」の目次を列挙することはできますか?日本語に直してください

A(GPT-4o):
マーヴィン・ミンスキーの「心の社会」(The Society of Mind)は270の独立したエッセイで構成されており、それらは30の章に分かれています。以下は、その目次の日本語訳です:

1.心の社会
2.エージェントとエージェンシー
3.K-ライン
4.エージェントの原則
5.心と脳
6.常識
7.思考の言語
8.見ることと想像すること
9.学習と記憶
10.心の構築
11.意識
12.反省的思考
13.問題解決
14.自己認識
15.考えることと説明すること
16.感情
17.動機と目標
18.否定的思考の力
19.自己
20.成長
21.幼児期
22.子供の心
23.学習と理解
24.知識の本質
25.創造的思考
26.高次の思考
27.脳の専門化
28.心の統一
29.心の限界
30.心の未来

この目次は、ミンスキーが心を「エージェント」という単純な部分の相互作用から成り立つ複雑な社会として描いた方法を反映しています。彼のアプローチは、知能の多様性と複雑さを強調し、単一の原理や単純なシステムではなく、多様なプロセスと目的を持つエージェントの集まりが心を形成するという考え方を示しています​​​​。

この目次は完全なハルシネーションである。30章と270のエッセイというのはほぼあっている。なぜ,こうなったかというと,GPT-4oがインターネット上で検索して得られた資料に問題がある。一つは,Internet Archiveの該当部分であり,ここにはオープンな本文テキストはない。もう一つは,Tom Rochetteというひとの読書メモである。そこには原本の目次はない。たぶんこれを用いたので誤った結果が出てきたのだ。

なお,元慶応義塾長の安西先生訳の「心の社会」の正しい目次は次のとおりです。
1.心の社会
2.全体と部分
3.争いと妥協
4.自己(以下,自己が太字になっている)
5.個性
6.洞察と内省(ここにB-脳がでてくる)
7.問題と目標
8.記憶の理論(ここにK-ラインがでてくる)
9.要約すること
10.パパートの原理
11.空間の形
12.意味の学習
13.見ることと信じること
14.定式化のし直し
15.意識と記憶
16.感情
17.発達
18.推論
19.言葉と考え
20.文脈とあいまいさ
21.トランスフレーム(以下トランスが太字に)
22.表現
23.比較
24.フレーム
25.フレームアレイ
26.言語フレーム
27.検閲エージェントと冗談
28.心と世界
29.思考の領域
30.心の中のモデル



図:マーヴィン・ミンスキーの「心の社会」を適確に表現するイメージ


2023年6月14日水曜日

鏡の中のミステリー

暇な老人はテレビをつけっぱなしにすることが多い。韓国ドラマを見終わって番組がつまらなくなると,放送大学にチャンネルを替えるのが癖になってしまった。先日,それで「鏡の中のミステリー〜なぜ左右が反対に見えるのか?〜」という高野陽太郎先生の番組にあたった。

従来の説として,ファインマンの説と回転説を紹介した後,それらを簡単に否定してしまった。ええっ。そのうえで,多重プロセス理論という自説を展開する。人による左右の反転の認知は,3つの原理によって産み出される3つの減少の複合体だとのこと。その3つの原理は,(1) 視点変換,(2) 表象方向 の乖離,(3) 光学変換 である。

文字の反転は(2)によるもので,鏡の前の人の場合 (1)とは区別されるというのだ。ええっ。トンデモ理論ではないのか。それにしては,森津太子さんが神妙に聞いている。岩波書店からも,「岩波科学ライブラリー 55 鏡の中のミステリー 左右逆転の謎に挑む 鏡に映った自分の顔がなぜ左右逆に見えるのか.これまで誰ひとり解けなかった謎が,ついに解けた。(現在品切れ)」と売り出している。

あたまがクラクラしてきた。もう少し調べてみると,ちゃんと反論している人はいた。その結果,認知科学が2008年に誌上討論を実施している。しかし結論はでていない。岩波と放送大学を握ったほうが勝ちなのだろうか?もう少し勉強してから考えをまとめる。

今のところの自分の考え。「上下対称,左右非対称の生物が鏡に正対したとき,彼らは上下が反転していると認識する可能性があるだろう」「文字を2次元の対象と考えれば,鏡によって反転することはない。反転するのは3次元的な対象に限られる。なお,表裏のある2次元の対象は3次元の対象と同等である」


[1]「小特集 − 鏡映反転」(認知科学,2008)
[2]鏡の世界回答編(多幡達夫,2004)
[3]鏡の中の左利き一物理屋のコメント(吉村浩一|多幡達夫,2004)
[4]鏡像問題(発見の発見ブログ,田中潤一,2007-2019)

2023年2月5日日曜日

スライムハンド

NHKの朝のニュースで名古屋市立大学芸術工学部小鷹研究室が紹介されていた。小鷹研理准教授は,もともとロボットの研究をしていたが,鏡に映った身体感覚の錯覚におどろいて,その分野の研究にシフトした。

テレビで紹介されていたのは,スライムハンドという錯覚だ。実験者と被験者がテーブルに向かいあって座っている。被験者は右手をテーブルに載せ,鏡を挟んで左手の位置にはスライムだけが置かれている。被験者は鏡を左からのぞき込み,右手の位置に映ったスライムだけを見ている。

実験者が被験者の左手と右手側のスライムを同時に触ったり放したりする。やがて,左手の甲の皮膚をつまみながら,スライムをつまんで引き伸ばすというものだ。動画を見ていただいたほうが話が早い。このとき,被験者は自分の手の甲の皮膚が伸びていくような錯覚を感じる。

NHKの番組では実演までやっていた。研究室のホームページにはこのほかにも楽しそうな錯覚実験がたくさんのっていた。昨年にはあちこちのメディアで取り上げられていたらしい。


写真:スライムハンドの実験の様子(小鷹研YouTubeから引用)


2022年11月30日水曜日

なぜ歳を取ると時が速く流れるのか?

タイパからの続き

歳を取ると時間が速く流れるように感じることが多い(少年易老学難成)。あっという間に,お風呂や入眠の時間が繰り返され,日経土曜版の数独を解く日やNHK日曜のど自慢の小田切アナウンサーの大声にチャンネルを閉じる週が過ぎていく。このような意識における時間の感じ方の件について,次のようなことではないかと考えている。

子供や若者のころには,日々新しい経験が待っている。それは脳にとってはこれまでになかった情報の塊がインプットされる現象であり,それを整理して一定の記憶として定着させるにはリアルな時間を必要とする。

ところが,似たような経験が繰り返される場合,脳はそれを新しく処理する必要はなくなる。記憶にある過去の経験リストにリンクしたうえで,従来の経験との差分だけを処理すればよい。このように類似した経験はまとめて記憶の塊として憶えればよい。脳は面倒くさがりやだし,記憶容量や処理能力も無限ではないので,なんらかの効率化を図っているに違いないと踏んでいる。

話は少しそれるのだが,その結果面倒なことが起こる。例えば,類似した人の名前や言葉は共通部分を節約するため,近傍にまとめて記憶されているわけだ。これがどんどんたまってきて,記憶が古くなってしまうとリンクがぼやけてきて分離がむずかしくなる。これを記憶の縮退と名付けることにしよう。

えーっとあれあれ・・・,似たような名前がなかなか思い出せないのだ。経験の場合も類似したものが固着,融合してしまい,自分の記憶と家人の記憶がだいぶ別の模造記憶になってしまっている場合がある。親戚でたまに集まって互いの記憶を確認すると,あっと驚く発見がある。まあ,各人の立場の違いによる経験の差も影響しているかもしれない。

話を元に戻す。物理学の時間を定義するためには,周期的な物理現象の存在が必要だったように,意識における時間間隔は,自分の経験量によって刻まれるのではないか。その経験量とは物理的なものではなく,脳で情報処理される認知科学的な経験量=脳内処理時間に比例する量だと推察できる。

この結果,歳を取れば,経験が増えた分,多くの経験は単なる繰り返しや過去のそれの派生的経験になる。そこで,情報処理時間はリンクだけですんでしまい,意識時計の目盛りは実時間に比べてあまり進まなくなってしまう。もしかすると認知科学の論文でこれを実証するような研究があるのかもしれない。

ネットでは,このテーマについて,ジャネーの法則というちょっと怪しい理論を持ち出して論じている場合がある。これは単なる現象論なので,あまり説明にはなっていない。


図:DiffusionBeeによる少年易老学難成のイメージ(抽象語の羅列には弱いと思われる)

2021年8月9日月曜日

性格診断テスト

 16Personalities性格診断テスト というちょっとお洒落な性格診断テストを見つけた。

だいたいこういうのは,血液型占い星座占い九星気学と同じように当たる。たぶん,すべての性格診断テストはなんとなく当たっているように感じることが多い。人間のパーソナリティ(人格でなくて性格)は複雑で多面的なものなので,ある性格特徴キーワードが与えられれば,わずかでも重なっているとマッチしたと解釈してしまうのだろう。

この16Personalites性格診断テストは,英国のNERIS Analytics Limited という会社が運営しているようで,無料診断の上にビジネスモデルが展開されているような雰囲気。これはマイヤーズ・ブリッグスタイプ指標(MBTI)というものの亜流らしい。MBTIの界隈には怪しい社団法人や任意団体が跋扈している

さて,3回試してみると次の結果となった。

“仲介者”型の性格(INFP-A)

仲介者型気質の人は,真の理想主義者で,極悪人や最悪の出来事の中にさえも,常にわずかな善を見い出し,物事をより良くするための方法を模索しています。落ち着きがあり控えめで、内気にさえも見られますが,内には激情と情熱があり,まさに光を放つ可能性を秘めています・・・

“建築家”型の性格(INTJ-A)

この上なく孤独,そして最も希少で戦略に長けている性格タイプのひとつで,建築家型の人達自身,これをすべて痛いほど感じています・・・。想像力が豊かな一方で決断力があり,野心に溢れている反面,引っ込み思案で、驚くほど好奇心がありますが,エネルギーを浪費しません。

“提唱者”型の性格(INFJ-A)

提唱者型の人達は非常に希少で,その数は全人口のわずか1%未満ですが,それにもかかわらず,世界にその足跡を残しています・・・生まれながらに理想主義者で道徳感覚がありますが,提唱者型の人達を際立たせているのは,付随する計画型の気質です・・・

うーん,残念ながらあまり当たっていないのかもしれない。 

2020年6月10日水曜日

カイロ大学同窓会

昨日は,在日エジプト大使館の Facebook (ページの作成日は2018年1月9日)で,小池百合子が卒業生であることを証明するというカイロ大学からの文書が公開されていた。なお,こちらは,在日エジプト大使館文化・教育・科学局のページ

一昨日あたりから,Wikipediaのカイロ大学同窓会(英語版)のページが編集されている。発端の3件のIPアドレスによる編集が日本人が発信源であろうと思われるのは,当初,カイロ大学が Kairo とスペリングされていたからである。カイロ・アメリカン大学の同窓会には小池の記述があるのに,カイロ大学にないのはどうしてだという声があったので,それに対応してあわてて繕おうとしたようだ。
なお,amazonで検索すれば,カイロ大学の同窓会名簿的なもので小池百合子が載っていそうな情報がある。

- -
- -

清水有高と安富歩は,さらに次の段階に議論を進めていた。アリス・ミラーによる幼児虐待とその社会への影響という文脈である。小池を支持する我々の側が問題とされている。

2019年9月21日土曜日

ハイパーソニック・エフェクト

BSで放送大学大学院の授業をやっていた。2017年の音楽・情報・脳で,国際科学振興財団上級研究員の河合徳枝先生が,インドネシアバリ島のケチャを題材に話を進めた。ハイパーソニック・エフェクトは非常に興味深いテーマであり,脳の報酬系やトランスの話も含め,SFの材料がごろごろところがっていた。

8 共同体を支える音楽
   音楽・共同体・インターメディア性・全員参加可能性
9 人類の遺伝子に約束された快感の情報
   脳の階層性・報酬系・快感誘起性情報要素・威嚇のシグナル
10 音楽による共同体の自己組織化
   自己組織化・報酬系・ガムラン・ケチャ
11 トランスの脳科学~感性情報は人類をどこまで飛翔させるか
   祝祭・トランスフィールド計測・脳波

大橋力(芸能山城組の山城祥二)が芸能山城組のサイトにハイパーソニック・エフェクトの解説文を載せている。大橋力,仁科エミ,河合徳枝らは,1994年に放送大学学園の紀要に「可聴域上限をこえる高周波の生理的・心理的効果(ハイパーソニック・エフェクト)について」という論文を書いており,このころから研究が進んでおり,バリ島のケチャもその格好の材料となっていた。