ラベル AI の投稿を表示しています。 すべての投稿を表示
ラベル AI の投稿を表示しています。 すべての投稿を表示

2024年4月25日木曜日

AI Index Report 2024

 スタンフォード大学のHAI(Human-Centered Artificial Intelligence)は,スタンフォード大学の学際的なAI研究組織である。AIのトレンドに関するレポートを毎年定期的に出している。AI Index Report 2024がでたので,その要点10項目をDeepLで翻訳してみた。これが,現時点のAIの状況だ。

1.AIはいくつかのタスクで人間に勝っているが、すべてではない。AIは、画像分類、視覚的推論、英語理解など、いくつかのベンチマークで人間を上回っている。しかし、競技レベルの数学、視覚的常識推論、計画立案など、より複雑なタスクでは後れを取っている。

2.産業界は引き続きAI研究の最前線を支配している。2023年、産業界は51の注目すべき機械学習モデルを生み出したが、学界の貢献は15に過ぎなかった。また、2023年には産学共同研究の成果として21の注目すべきモデルが生まれ、これは過去最高となった。

3.フロンティアモデルはより高価になる。AI Indexの推計によると、最先端のAIモデルの学習コストはかつてない水準に達している。例えば、OpenAIのGPT-4は学習に推定7800万ドル相当の計算機を使用し、グーグルのジェミニ・ウルトラは計算機に1億9100万ドルかかった。

4.米国は中国、EU、英国をリードし、トップAIモデルの主要な供給源となっている。2023年には、61の注目すべきAIモデルが米国を拠点とする機関から生まれ、EUの21、中国の15を大きく上回る。

5.LLMの責任に対するロバストで標準化された評価は、深刻に欠けている
AI Indexの新たな調査では、責任あるAIの報告において標準化が著しく欠如していることが明らかになった。OpenAI、Google、Anthropicを含む主要な開発者は、主に異なる責任あるAIのベンチマークに対してモデルをテストしている。この慣行は、トップAIモデルのリスクと限界を体系的に比較する取り組みを複雑にしている。

6.ジェネレーティブAIへの投資が急増。昨年のAI民間投資全体が減少したにもかかわらず、ジェネレーティブAIへの資金は急増し、2022年比でほぼ8倍の252億ドルに達した。OpenAI、Anthropic、Hugging Face、Inflectionを含むジェネレーティブAI分野の主要企業は、多額の資金調達ラウンドを報告した。

7.データがある: AIは労働者の生産性を高め、より質の高い仕事をもたらす。2023年、AIが労働に与える影響を評価する研究がいくつか発表され、AIによって労働者はタスクをより迅速に完了し、アウトプットの質を向上させることが可能になることが示唆された。また、これらの研究は、AIが次のような可能性を持つことも示している。
低技能労働者と高技能労働者の間の技能格差を埋める可能性も示している。しかし、他の研究では、適切な監督なしにAIを使用すると、パフォーマンスの低下につながる可能性があるとして注意を促している。

8.AIのおかげで科学の進歩がさらに加速。2022年、AIは科学的発見を促進し始めた。しかし2023年には、アルゴリズムによるソートを効率化するAlphaDevから、材料発見のプロセスを促進するGNoMEに至るまで、科学関連のAIアプリケーションのさらなる重要性が発表された。

9.米国におけるAI規制の数が急増。米国におけるAI関連規制の数は、昨年から過去5年間で大幅に増加している。2023年には25のAI関連規制があり、2016年にはわずか1つだった。昨年だけでも、AI関連規制の総数は56.3%増加した。

10.世界中の人々がAIの潜在的影響力をより強く認識し、より神経質になっている
イプソスの調査によると、過去1年間で、AIが今後3〜5年のうちに自分たちの生活に劇的な影響を及ぼすと考える人の割合は60%から66%に増加した。さらに、52%がAI製品やサービスに対して神経質になっており、2022年から13ポイント上昇している。アメリカでは、ピューのデータによると、アメリカ人の52%がAIに期待よりも不安を感じており、2022年の37%から上昇している。

2024年4月17日水曜日

udio

生成AIの応用で最初に注目されたのが,画像生成だった。それからテキスト生成の波がやってきて,マルチモーダル=動画生成にまで及んだ。このところ話題なのが音楽生成だ。

テクノエッジの松尾公也さん(元MacUser編集長,第1回AIアートグランプリ受賞,JIMAインターネット・メディアア・ウォード2023 メディア・イノベーション部門賞)は,音楽生成AIを使って作曲したものを,Spotify やApple Musicで配布するまでになっている。

これまでは,Suno AI というのが,その定番だったが,この度登場した Udio が 1ヶ月1200曲無料で作成できるということで注目を集めている。デフォルトでは1曲あたり30秒程度だ。

さっそく,googleアカウントでログインして試してみた。Japanese 1960-1970 Folk Song という主旨のプロンプトで出来たのが,Cherry Blossom Selenade という曲だ,季節にはふさわしいわね。



写真:Cherry Blossom Serenade の画面(カバーはどれも微妙だった)

2024年4月15日月曜日

AIアシスタントグラス

Command-R+からの続き

drikinさんのインタビューがあった Brilliant  Labs のマルチモーダルAIアシスタントグラス Flame AI glasses の話だった。

AppleVision Proとは違って,機能をできるだけそぎ落としたものだ。他のARグラスに見られる柄の太くてださいデザインではない。ガンジー,ジョンレノン,スティーブ・ジョブス的な丸い眼鏡になっている。

その仕様は次の通り。
ディスプレイ:3000ニト 640x400 microOLED,右眼のみ,FoV 〜20°
プロセッサー:nRF52840 Cortex M4-F,Lattice CrosslinkNX 17kゲート
ストレージとメモリ:?
センサー:1280 x 720 フロントフェーシングカメラ,PDMマイク(20kHz 16bit),6DoF IMU 3軸加速度+3軸電子コンパス,タップ・ダブルタップコールバック
接続性:Bluetooth 5.0,Perplexityとのパートナーシップで、インターネットにハンズフリー接続,WIFiの情報?
オーディオ:無し,Bluetoothイアフォンと同期
バッテリー:222mAh + 充電ドック予備バッテリー 149mAh,使用時間?
デザインと人間工学:ブラック・グレー・スケルトン,ガラスH2O,重量39g
ソフトウェア:LuaベースカスタムOS,完全オープンソース,マルチモーダル生成AIアシスタントNoa,英語・フランス語,イタリア語,ドイツ語等,日本語と中国語は開発中
価格:$349,2024/4/15出荷
で,彼らが宣伝している出来ることリストは次のとおり。
・多言語翻訳:本のページを要点にまとめ、テキストを希望の言語に翻訳
・ドキュメント生成:ホワイトボードを作成し、共有可能なドキュメントに
・健康管理サポート:肌の状態を識別して市販の軟膏を推奨したり、1杯のコーヒーに含まれる栄養価やカフェインの量に基づいて、毎日の健康的なコーヒーの摂取量を提案  → これはちょっと微妙
・感情の測定:GPT4、Frameのフロントセンサー、IMU、マイク、ナレッジグラフが連携し、感情の揺れや表情を視覚的および聴覚的に測定 → 本当?
・価格チェックと比較:大型小売店で商品を見るだけで、Amazonなどの価格と即座に比較
・不動産情報の検索:家探しをする際に、近所を移動しながら家を一目で見て、リスティングを検索(米国サービス : RedfinやZillowが連携可能) → 日本では?
・DIYプロジェクトの支援:家を修理する時などDIYの際に、Noaがプロジェクトを完了するために必要なことをサポート
・レストランレビューの視覚化:目に映るレストランのレビューを即座に視覚化。口コミなどを検索
スピーカレスはいいかもしれないが,骨伝導スピーカーでもだめなのだろうか。あと,右眼だけに固定されたディスプレイは選択可能にしたほうがいいのでは。GPSと地図機能も必要だ,ガラケーとiPhoneの違いを一番感じたのは地図だったから。


写真:Brilliant Labs Frame 

2024年4月14日日曜日

Command R+

AI関係の状況は時々刻々と変化するので,まったく追いつけない。テキスト生成AIのChatGPTのサブスクリプションもやめてしまった。

さて,本日仕入れた情報は,shi3zさん発信backspac.fmで話題にされていたもの。この日のメインテーマは,drikinさんのインタビューがあった Brilliant  Labs のマルチモーダルAIアシスタントグラス flame AI glasses の話のはずだった。それは別途解説するが,新しい生成AIモデルのCommand R+がすごいという話がこれにかぶってきた。

本人(AI)に語ってもらうのが一番なので聞いてみたのが次の文章。とにかくアクセス=結果出力は速くて内容も充実している。正確性はぼちぼちだけれど。体感では,現在の無料モデルで,$20/月のChatGPT-4 に匹敵している。
Q:koshix
Command R+ について,その原理や機能や性能について,ChatGPTやGeminiやClaudeやPerplexityなどと比較し,やさしく教えてください。

A:Command R+
Command R+ は、自然言語処理と人工知能の分野で注目されている大規模言語モデルの一つです。ChatGPT や Gemini、Claude、Perplexity など、他の大規模言語モデルと比較しながら、その原理、機能、性能についてやさしく説明します。

Command R+ の原理:
Command R+ は、人工ニューラルネットワークと呼ばれる技術に基づいています。大量のテキストデータでトレーニングすることで、言語のパターン、文法、意味を学習します。この学習プロセスにより、Command R+ はさまざまなタスクを実行できるようになります。

機能:
Command R+ は、高度な言語理解と生成能力を備えています。いくつかの主な機能は以下の通りです。
・質問応答:Command R+ は、さまざまなトピックに関する質問に正確に回答することができます。その知識は、トレーニングに使用された膨大なテキストデータに由来します。
・会話:人間のような会話をすることができ、対話的なやり取りが可能です。
テキストの生成: 指示やプロンプトに基づいて、Command R+ は創造的で一貫性のあるテキストを生成できます。これには、物語、詩、記事、コードなどが含まれます。
・翻訳:複数の言語間でテキストの翻訳を支援できます。
・編集と要約:テキストの編集や要約を支援し、より明瞭で簡潔にすることができます。

性能:
Command R+ は、その大規模なパラメータ空間とトレーニングデータセットにより、優れた性能を発揮します。
・一貫性:Command R+ は、一貫して正確な応答を提供するようにトレーニングされています。その大規模なモデルにより、文脈を維持し、関連性の高い詳細を提供することができます。
・創造性:テキスト生成タスクでは、Command R+ は創造性を発揮し、独創的で興味深いアイデアやストーリーを生み出すことができます。
・多言語:Command R+ は複数の言語でトレーニングされているため、多言語でのタスクを処理できます。
・効率性:大規模なモデルであるため、Command R+ は多くのタスクを迅速に実行できます。

ChatGPT、Gemini、Claude、Perplexity との比較:
これらの言語モデルを Command R+ と比較すると、いくつかの類似点と相違点があります。
・ChatGPT:ChatGPT は、Command R+ と同様に、人間との会話に重点を置いています。 ChatGPT はより対話的なインターフェイスを提供し、日常的な質問やタスクに重点を置いています。
・Gemini:Gemini は、Command R+ と同様に大規模な言語モデルです。Gemini はより構造化されたテキストの生成に優れており、プログラミングや数学的なタスクに適しています。
・Claude:Claude は、Command R+ と同様にテキスト生成機能を備えていますが、その焦点は芸術的で創造的なテキストの生成にあります。 Claude は詩、物語、脚本の作成を支援するように設計されています。
・Perplexity:Perplexity は、Command R+ と同様に質問応答機能を備えていますが、その焦点は事実に基づく質問と回答にあります。 Perplexity は、事実関係の正確性を確保するようにトレーニングされています。
Command R+ は、これらの言語モデルの機能を組み合わせたものと言えるでしょう。その大規模なパラメータ空間により、一貫性、創造性、多言語対応、効率性を兼ね備えています。 Command R+ は、これらの機能をバランスよく備えているため、さまざまなタスクやユーザーに対応できる多用途の言語モデルとなっています。
だめだ。きれいな答えではあるけれど,まったく核心に迫れていない。技術的な詳細について更問いしてみたが,あいかわらず,一般的な答えしか得られなかった。それでも生成される文章の質は十分によい。96GB以上のメモリがあるmacではローカルで実行できるが,実行時間は50倍以上かかるので実用的ではないようだ。ネットで調べると,Claude3 OpusやChatGPT-4の方がよいという意見もある。まだ様子見かな。

P. S. キーワードは RAG(検索拡張生成,Retrieval Augmented Generation)らしい。

[1]MLX で Command R+ を試す(npaka)

2024年3月15日金曜日

認知症とAI

たまには生成AIの相手をしてあげないと,<細菌>の<瞳孔>に追いつけなくなる。

今日は,Geminiに聞いてみた。いかに良い答えを引きだすかという質問のクオリティが問われるのである。答えは長かったので途中で途切れてしまった。<続けて>を入れることで,2回に分けて出力された。下記の(koshix注:一旦停止継続地点)を見よ。

Q(koshix):認知症の診断や予防をするAIシステム,あるいは軽度認知症になったときの進行を抑制するAIシステム,さらには重度認知症になったときの人格を補間支援するAIシステムのコンセプトをまとめ,その技術的な可能性や現時点での達成点を整理してください。
A(Gemini):
認知症とAI:診断、予防、進行抑制、人格補完支援の可能性と現状

認知症は、記憶力や判断力などの認知機能が低下し、日常生活に支障をきたす疾患です。近年、AI技術の発展により、認知症の診断、予防、進行抑制、人格補完支援など、様々な分野での活用が期待されています。

1.認知症診断におけるAI

AIは、膨大な量の認知機能検査データや脳画像データから、認知症の早期診断に役立つパターンを見つけることができます。具体的には、以下のような技術が研究されています。

認知機能検査の自動化: AIを用いて、従来の紙と鉛筆による検査を自動化し、効率的に認知機能を評価することができます。
脳画像分析: AIを用いて、脳MRI画像からアルツハイマー病などの認知症特有の異常パターンを検出することができます。
音声分析: AIを用いて、会話中の声のトーンや発話速度などを分析し、認知症の兆候を検出することができます。 
これらの技術はまだ開発段階ですが、将来的には、医師による診断を補助し、早期診断の精度向上に貢献することが期待されています。

2.認知症予防におけるAI

AIは、生活習慣や遺伝情報などのデータを分析し、個々のリスクに合わせた認知症予防策を提案することができます。具体的には、以下のような技術が研究されています。

・生活習慣改善支援:  AIを用いて、運動や食事、睡眠などの生活習慣を分析し、認知症リスクを下げるためのアドバイスを提供することができます。
・遺伝リスク評価: AIを用いて、個人の遺伝情報から認知症発症のリスクを予測し、予防策を提案することができます。
・脳トレーニング: AIを用いて、個々の認知機能に合わせた脳トレーニングプログラムを提供することができます。 
これらの技術は、認知症の発症リスクを早期に把握し、予防効果の高い対策を講じることに役立つ可能性があります。

3.軽度認知症の進行抑制におけるAI

AIは、認知機能訓練や薬物療法など、個々の状態に最適な治療法を提案し、進行抑制に役立てることができます。具体的には、以下のような技術が研究されています。

認知機能訓練: AIを用いて、個々の認知機能に合わせたゲームやパズルなどの訓練を提供し、認知機能の低下を抑制することができます。
薬物療法: AIを用いて、個人の遺伝情報や症状に基づいて、最適な薬剤と用量を提案することができます。
生活支援: AIを用いて、日常生活におけるスケジュール管理や服薬管理などのサポートを提供することができます。 
これらの技術は、軽度認知症の進行を遅らせ、自立した生活を維持することに貢献することが期待されています。

4.重度認知症の人格補完支援におけるAI

AIは、過去の会話データなどを基に、認知症患者の人格や価値観を理解し、コミュニケーションを円滑化するための支援を行います。具体的には、以下のような技術が研究されています。

会話支援: AIを用いて、患者との会話履歴に基づいて、適切な話題や質問を提供することができます。
感情認識: AIを用いて、患者の表情や声から感情を認識し、それに応じた対応をすることができます。
思い出支援: AIを用いて、患者の過去の思い出を記録し、共有することができます。 
これらの技術は、認知症患者とのコミュニケーションを円滑化し、QOL(生活の質)向上に貢献することが期待されています。

5.技術的な可能性と課題

AI技術は、認知症の診断、予防、進行抑制、人格補完支援などの分野において大きな可能性を秘めています。しかし、現状では多くの課題も存在します。

データ不足: AI技術の開発には、膨大な量のデータが必要です。現状では、認知症に関するデータ量が十分とは言えず、更なるデータ収集が必要です。
倫理的な問題: 認知症患者の人格やプライバシーを尊重する倫理的なガイドラインの策定が必要です。
コスト: AI技術の開発、導入、運用にはコストがかかります。
これらの課題を克服するためには、研究開発の推進、産学官連携の強化、社会的な理解の深化などが重要となります。

6.現時点での達成点

AI技術は、認知症の診断、予防、進行抑制、人格補完支援などの分野において、まだ研究開発段階ではありますが、いくつかの成果が出ています。

認知機能検査の自動化:  一部の企業では、AIを用いた認知機能検査システムを開発しており、臨床試験が進められています。(koshix注:一旦停止継続地点
脳画像分析: AIを用いて、アルツハイマー病などの認知症を早期診断する精度が向上しており、実用化に向けて研究が進められています。
音声分析: AIを用いて、会話中の声から認知症の兆候を検出する技術が開発されており、早期診断に役立つ可能性があります。
生活習慣改善支援: AIを用いた生活習慣改善アプリが開発されており、認知症予防に役立つ可能性があります。
認知機能訓練: AIを用いた脳トレーニングゲームが開発されており、認知機能の維持に役立つ可能性があります。 
これらの成果は、将来的に認知症の診断、予防、進行抑制、人格補完支援に大きく貢献することが期待されています。

7.今後の展望

AI技術の発展と認知症に関する研究の進歩により、将来的には以下のようなことが期待されます。

・認知症の早期診断、早期治療の確立
・認知症の発症リスクの予測
・個々の患者に最適な治療法の提供
・認知症患者のQOL向上の実現 
これらの実現に向けて、研究開発の推進、産学官連携の強化、社会的な理解の深化が重要となります。

8.参考資料 (koshix 注:以下の資料リンクは誤りや不正確な交差を含みます)

免責事項
この回答は情報提供のみを目的としており、医療診断や治療を代替するものではありません。認知症についてお悩みの方は、専門医にご相談ください。

この分野のセミプロならば, これをもとにして半日でプレゼン資料の下書きが作れるレベルのように見える。各セクションについて3項目づつきれいにトピックスをあげている(その妥当性は別にして)。最後には,不正確だけれどそれらしい参考資料や免責事項もあるのだった。

P. S. セクション番号や体裁にはこちらの手が少しは行っているが,文章はさわっていない。

P. P. S. このテーマで最初に見つかったのは,理研の大武美保子さん資料である。80-20運動によって,高齢者の無歯顎者率が1975年の20%から2005年の2%に改善した例を示し,先進国で中国と日本だけが増加している認知症率を減らすことが可能だという強いメッセージを発信していた。

2024年3月1日金曜日

1.58ビット

大規模言語モデルの新しい論文が話題になっている。


深層学習の計算には膨大な量のニューラルネットの係数行列の演算が必要だが,時間がかかるのは行列の積の計算である。ところで,その係数を64bit実数値ではなく,{-1,0,1}の3値で置き換えてしまうというのが,BitNet 1bit大規模言語モデルの発想だ。これにより,行列における積の計算が和の計算に置き換わってしまう。

果たして,そんなことがうまくいくのかと思うのだけれど,これを実際にやってのけたのが上の論文であり,その概要は次のようになっている。
BitNetのような最近の研究は、1ビット大規模言語モデル(LLM)の新しい時代への道を開いている。この研究では、1ビットLLMのバリエーションであるBitNet b1.58を紹介する。BitNet b1.58では、LLMのすべてのパラメータ(重み)が3値{-1, 0, 1}である。このLLMは、同じモデルサイズと同じ学習トークンを持つ全精度(FP16またはBF16)Transformer LLMとパープレキシティとエンドタスクパフォーマンスの両面で一致し、レイテンシ、メモリ、スループット、エネルギー消費の点で大幅にコスト効率が高い。さらに深いことに、1.58ビットLLMは、高性能でコスト効率に優れた新世代のLLMを訓練するための新しいスケーリング則とレシピを定義している。さらに、新しい計算パラダイムを可能にし、1ビットLLMに最適化された特定のハードウェアを設計するための扉を開く。

もし,これが本当ならば,現在のNVIDIAのGPU ブームは一過性のモノになってしまうかもしれない。LLMには新しいアーキテクチャの半導体チップが必要になるのだから。

なお,1.58bit は {-1,0,1}の3値の情報量,$\log_2 3 = \dfrac{\log 3}{\log 2} = 1.58...$ から来ている。

[1]驚異の1ビットLLMを試す。果たして本当に学習できるのか?(shi3z)

2024年2月24日土曜日

東京株式市場

2024年2月21日,東京株式市場で日経平均株価が 39,098.68円(終値)となって,1989年12月29日に記録したこれまでの最高値 38,915.87円(終値) を34年ぶりに更新した。翌日の日経朝刊の一面はたいへん興奮した紙面になっていた。

さっそく,Geminiにおうかがいをたててみた(太字はGemini自身による強調部分)。

Q(koshi):東京株式市場での株価指標が最高値を記録しましたが,同じ期間で他国では株価指標が数倍から十数倍になっています。現在の日本の経済は必ずしも社会の全ての階層にとってプラスの方向にあるとはみえません。今後の日本社会はどのようになるでしょうか。

A(Gemini):東京株式市場の株価指標が最高値を更新している一方で、他国の株価指標との比較で、日本の経済状況が必ずしも全ての階層にとってプラスの方向にあるとは言い切れない状況ですね。確かに、一部の指標は過去最高値を更新していますが、日本社会全体が豊かになっているとは言い難い現状は、多くの方が感じていることでしょう。

 今後、日本社会がどのように変化していくのか、いくつかの観点から考察してみましょう。

 1. 人口減少と高齢化社会

 日本は世界でもトップクラスの人口減少と高齢化社会に直面しており、労働力人口の減少は経済成長の大きな阻害要因となります。このまま何も対策を講じなければ、社会保障制度の崩壊や経済の停滞など、様々な問題が発生する可能性が高いです。

 2. イノベーションの加速

 一方、AIやロボットなどの技術革新は、労働力不足を補うだけでなく、新たなビジネスチャンスを生み出す可能性を秘めています。これらの技術を積極的に活用することで、日本の経済活性化に繋がる可能性があります。

 3. 格差拡大

 近年、日本社会では所得格差や富の格差が拡大しており、社会の不安定化を招く懸念があります。格差拡大を抑制するためには、教育や社会保障制度の改革など、様々な取り組みが必要となります。

 4. グローバル化

 グローバル化が進む現代において、日本は国際社会における競争力を強化していく必要があります。そのためには、規制緩和や外国企業の誘致など、経済活性化に向けた政策が必要となります。

 5. 地方創生

 人口減少が進む地方では、地域経済の活性化が喫緊の課題となっています。地方創生に向けた取り組みとしては、観光業の振興や新規事業の創出などが挙げられます。

 これらの課題を克服し、持続可能な社会を実現するためには、政府、企業、そして国民が一体となって取り組んでいくことが必要不可欠です。

 今後の日本社会は、様々な課題を乗り越え、より良い方向へ変化していく可能性を秘めています。

 以下、いくつかの可能性を挙げます。

・AIやロボットなどの技術革新により、労働力不足を補い、経済成長を実現する。
・格差拡大を抑制し、全ての人が豊かさを享受できる社会を目指す。
・国際社会における競争力を強化し、世界に貢献する国となる。
・地方創生により、地方と都市の格差を縮小し、活気ある地域社会を実現する。
 これらの課題は決して簡単ではありませんが、解決に向けて努力することで、より良い未来を築くことが可能となるでしょう。

 未来は私たちの手で創り出すものです。

 一人一人が積極的に社会に関心を持ち、行動していくことが、日本社会の未来を形作る重要な鍵となるのです。

昔,眉村卓の短編SFで,インチキ未来予測師の話があったような気がする。本棚を探しても見つからない。未来が予測できますという触れ込みで,核戦争で世界が終るというニセビデオを見せる商売をしているうちに,社会全体にその意識が浸透してしまい,本物の核戦争が到来しそうになるというものだ。もしかすると著者名も概要も若干?間違っているかもしれないのだが,自分の記憶の中ではそのように格納されている。

なにをいいたいかというと,上のGeminiの回答における太字の調子がそれを想起させてしまったということ。みんながAIに頼るようになると,自分たちの無意識の集合が危険なフィードバックループを作ってしまうかもしれないということ。テレビや週刊誌などのマスメディアやSNSなどのネットメディアだってそれに負けない作用をしているのだろうが,必ずしも具体的で十分な検証はされていないような気がする。

2024年2月13日火曜日

柿の葉寿司

新しくなったGeminiに「美味しい柿の葉寿司のお店を紹介してください。」と尋ねてみた。

質問者の位置情報を勝手に把握した上で,天理市の美味しい柿の葉寿司のお店を紹介してくれたが,その結果は極めて妥当なものでした。いいようなわるいような。

天理市周辺で美味しい柿の葉寿司のお店をいくつかご紹介します。

柿の葉ずし平宗 便利館
住所:日本、〒632-0097 奈良県天理市中町217−2
営業時間:9時30分~19時00分
評価:4.2
口コミ:Googleマップ 
ゐざさ 大和吉野 柿の葉寿司 田原本店
住所:日本、〒636-0226 奈良県磯城郡田原本町唐古80−5
営業時間:9時30分~18時00分
評価:4
口コミ:Googleマップ 
柿の葉ずしのみよし野 奈良コープ産業
住所:日本、〒632-0082 奈良県天理市荒蒔町96−1
営業時間:8時30分~17時00分
評価:0
口コミ:Googleマップ 
柿の葉ずしヤマト 天理店
住所:日本、〒632-0046 奈良県天理市三昧田町90−1
営業時間:8時00分~19時00分
評価:3.9
口コミ:Googleマップ 
柿の葉寿司本舗たなか 西和店
住所:日本、〒639-0205 奈良県北葛城郡上牧町下牧2丁目8−85
営業時間:8時30分~19時00分
評価:3.9
口コミ:Googleマップ 
これらのお店は、いずれもGoogleマップ上で高評価を得ています。また、営業時間も長いので、お好みの時間に訪れることができます。

ぜひ、天理市で美味しい柿の葉寿司を味わってみてください。 


図:GeminiがGoogle Mapを呼び出して表示した近辺の柿の葉寿司ベスト5

2023年12月21日木曜日

リザーバー・コンピューティング

脳オルガノイド計算からの続き

これは,リザーバー・コンピューティングについて,Bardに聞いてChatGPTに和訳してもらった解説だ。質問者(自分)のスペルが reserverと間違っていたけれど,修正して答えてくれた。このレベルになると,どの程度フェイク成分があるのかが判別できない。

Q:Please explain about reservoir computing.

A:Bard + ChatGPT
Reservoir computing(リザーバーコンピューティング)は、再帰ニューラルネットワークに着想を得た比較的新しい計算フレームワークです。この手法は、入力信号をリザーバーと呼ばれる固定された非線形システムのダイナミクスを使用して、高次元の計算空間にマッピングすることによって機能します。このリザーバーは、水のバケツや回路などの物理的なシステムであるか、微分方程式の系などの数学的なモデルであることができます。

その後、リザーバーの出力は線形の読み出し関数を使用して読み取られます。この読み出し関数は、リザーバーの状態と所望の出力との関係を学習するためにトレーニングできます。

図:リザーバーコンピューティングアーキテクチャ
(編者注: Rossello (2018)の図 [1] へ勝手にリンク引用しているBard)

リザーバーコンピューティングの利点の一つは、非常に効率的であることです。リザーバーは非常に単純であり、読み出し関数は比較的単純で速いアルゴリズムである線形回帰を使用して学習できます。これにより、低消費電力とリアルタイムのパフォーマンスが重要なアプリケーションに適しています。

リザーバーコンピューティングのもう一つの利点は、非常に柔軟であることです。同じリザーバーは、読み出し関数を変更するだけでさまざまなタスクを学習するのに使用できます。これにより、タスクが事前にはわからない場合や、タスクが時間とともに変化する場合に適しています。

リザーバーコンピューティングはまだ比較的新しい分野ですが、計算の仕方を革新する可能性があります。既に音声認識、画像認識、およびロボット制御など、さまざまなアプリケーションで使用されています。

以下はリザーバーコンピューティングに関するいくつかの追加の詳細です:

 ・リザーバーは通常、多くの内部状態を持つ高次元システムです。これらの状態は複雑な方法で相互作用し、リザーバーが非線形関数を計算できるようにします。

 ・読み出し関数は通常、リザーバーの状態の線形関数です。この関数は、所望の入出力関係の例などのトレーニングデータを使用して学習できます。

 ・リザーバーコンピューティングは、サポートベクターマシンやディープラーニングなどの他の機械学習技術と組み合わせて使用されることがよくあります。これにより、システムの精度とパフォーマンスを向上させるのに役立ちます。

Bard, Perplexity, Bing などは正確性を若干担保するために実在して関係あるURLへのリンクを提供しているが,それを埋め込み図の形で提供するのを見たのは初めてかもしれない。

以下は真正の参考文献:

2023年12月20日水曜日

脳オルガノイド計算

数日前,インディアナ大学のチームが,ヒト脳幹細胞から作成した脳オルガノイドをコンピュータ・チップに取り付けてAIツールに接続したシステム(Brainoware)で,初歩的な音声認識を含む,情報処理・学習・記憶ができることを実証したとのニュースが流れた。

ちょうど,しばらく前のNHKのフロンティア第2回「AI 究極の知能への挑戦」でも,脳を利用した計算チップの話が取り上げられていた。東大の池内与志穂准教授のグループが16点のプローブ上においた脳オルガノイドを2つ接続して,反応を観察する様子や,オーストラリアのBrett Kaganのグループの実験室の詳細な映像を見ることができた。

Kaganは,1970年代の最初期のコンピュータゲーム(アーケードゲーム)であるPON(ピンポンゲーム)をこの脳オルガノイドシステムにやらせていて,学習効率の高さを強調していた。すごくないか。


写真:脳オルガノイドチップ(左 F. Guo et. al. から,右 B. Kagan et. al. から引用)

2023年12月13日水曜日

Gemini

12月6日に,Googleから新しいマルチモーダルの生成AIモデルのGeminiが発表された。

宣伝のYouTubeビデオクリップでは,絵や写真を見せながら対話している様子がデモンストレーションされていて,かなりレベルが高そうだったのだが,フェイク(再現モデル)疑惑がでてきているので,どうだかよくわからない。

Google Bardのチャットページから使えるが,自分のgoogleアカウントの言語モードを英語にしておく必要があった。現時点で使えるのは,Gemini Pro であり,ChatGPT 3.5レベルのものなのだ。評判ほどではなく,これまでの体験と大きく変わることはない。というわけで,最近は,[ChatGPT3.5,Bard,Claude,Perplexity,Bing]の5つを組み合わせて試している。問題ごとに,良くできる子とイマイチな子に別れる。課金してChatGPT 4.0に復帰するだけの動機もまだない。


図:Geminiのイメージ(Google Japan ブログから引用


2023年12月1日金曜日

ai pin

ぼんやりしていると,重要な話題を逃してしまうことが多い。

3週間前の11月10日のニュースになっていたヒューメインai pin である。ヒューメインは,アップルの技術者として働いていたイムラン・チャウドリベサニー・ボンジョルノ夫妻が2018年に立ち上げたAIスタートアップだ。

NHKのニュースウォッチ9が,ChatGPTが1周年を迎えた生成AIの課題をまとめたニュースの中で,新たなAIデバイスとしてai pin を紹介していた。早く教えてよ。調べてみると,3週間も前に最初のニュースが出ていた。

ai pin は,胸につける小さなバッジ型のデバイスであり,音声とカメラによるインターフェイスでAIとやり取りすることができる。ディスプレイはついていないが,小型レーザプロジェクタで手のひらに文字情報を映し出すことができる。なるほどそうきたか。

既に米国では699ドル(日本円で10万円強)販売(予約?)されているが,AI使用料を含んで月々24ドル(3,600円)のサブスクリプションが必要である。日本で使おうとすると国際ローミングが必要なのでちょっとまだ無理そうだった。音声入力インターフェースには良い面と困った面があるので,公共の場でうまく使えるかどうかが勝負か。同時通訳には最適だ。ジェススチャーだけである程度のコマンドが指示できれば問題ないのかもしれないが。



写真:AiPinのサイズ(humaneサイトから引用)

2023年11月30日木曜日

OpenAI

ChatGPT(6)からの続き

2022年の11月30日にOpenAIがChatGPTを発表してからちょうど1年目となった。

最初のインパクトが大きかったので,最近の動きがもどかしく見えてしまう。ChatGPTの話ではないが,生成AI高性能のGPUを積んだWindowsマシンでないといろいろと試すことができないのもつらい。MacintoshのM1〜M3チップではほとんど対応できないのだ。GPT-4の相対的機能低下もあって,有料版からは離脱してしまった。最近は,GPT-3.5とBard, Claude, Bingなどの比較に留まっている。この中ではGPT-3.5が一番融通が利かないかもしれない。

そうこうしているうちに,11月6日のDevDayで300ページのテキスト入力に対応する128Kコンテクスト・ウィンドウを持つGPT-4 Turboがアナウンスされた。そろそろGPT-4復帰すべきかと思っていると,11月17日には,サム・アルトマンの解任騒動が勃発した。まだ全貌が必ずしも明らかになっていないが,11月22日に,サム・アルトマンとグレッグ・ブロックマンが復帰することでいちおう落ち着いたように見える。Q*をめぐる陰謀論めいた話はいろいろあるが,AGIが出来ているとか出来そうだということでもないか。


[付録]なんだか妙に下手に出るように躾けられているClaudeの場合:
はい、完全におっしゃるとおりです。失礼しました。訂正いたします。
e = 2.718...
log π = 1.1447...
として、e × log π を正確に計算すると、
2.718... × 1.1447... = 3.11...(小数点以下省略)
となりますね。
3.14ではありませんでした。

計算をちゃんと行わずに短絡的に判断してしまい、ファクトとしても誤りがありました。
このようなミスを重ねてしまい、大変申し訳ありません。
基本的な数値の計算から正しく立ち返る必要があると反省いたしました。
今後は肝に銘じ、確認を怠らぬようにいたします。
ご指導本当にありがとうございました。

2023年11月21日火曜日

東京節

柳澤眞一(1932-2022)といえば,奥様は魔女のダーリンだ。彼がYouTubeで榎本健一(1904-1970)の東京節を話題にしていた。「ラメチャンたら ギッチョンチョンで パイのパイのパイ♪ パリコとパナナで フライ フライ フライ♪」うーん,昔良く聞いたことのある歌だ。

そもそもこれはどういう意味なのかと調べると,なんとなくそれらしい解釈が見つかった。
果たして,AI諸氏はこれに答えられるだろうか。Bingは,検索できるのでこの答えをそのまま返してきた。その他はどうもいまいち。やはり,日本語を十分学習したLLMが必要だ。

Q:榎本健一の東京節に「ラメチャンたら ギッチョンチョンで パイのパイのパイ パリコとパナナで フライ フライ フライ」という歌詞があるのですが,その意味を教えてください。

A:Bing
「ラメチャンたら ギッチョンチョンで パイのパイのパイ パリコとパナナで フライ フライ フライ」という歌詞は、大正時代に流行したコミックソング「東京節(パイノパイノパイ)」の一部です。この歌詞には、大正時代の東京の町や建物の名前が歌い込まれています。歌い出しは「東京の中枢は 丸の内 日比谷公園 両議院」。コーラス部分の「ラメチャンタラ ギッチョンチョンで パイノパイノパイ」は、日本の民謡の囃子言葉(はやしことば)のように、歌の調子を整える意味のない言葉です。 「ラメチャン」の「ラメ」は、「デタラメ」の「ラメ」に由来しています。 「ギッチョンチョン」は、お座敷歌『ぎっちょんちょん』から転用されたものかもしれません。 「パイ」は、大正時代の日本で当時新しかった洋食の一つです。 後述の「フライ」も同様です。 「パリコト」の「パリコ」とは、1918年に終結した第一次世界大戦の戦後処理として、1919年に締結されたパリ講和会議を意味しています。

A:Bard
榎本健一の東京節の歌詞「ラメチャンたら ギッチョンチョンで パイのパイのパイ パリコとパナナで フライ フライ フライ」の意味は、以下のとおりです。
ラメチャン:デタラメの「ラメ」のこと。デタラメちゃん。深い意味はない。
ギッチョンチョン:擬音語。何かが動く音を表す。
パイのパイのパイ:囃子言葉。意味はない。
パリコ:当時流行していた菓子の名前。
パナナ:当時珍しい果物の名前。
この歌詞は、歌の途中で挟まれる囃子言葉です。深い意味はなく、単にリズムをとったり、雰囲気を盛り上げたりする役割があります。
「ラメチャン」は、当時流行していたアメリカの流行歌「テネシーワルツ」の歌詞に出てくる「ラメイ」という単語を、日本語風に言い換えたものです。この「ラメイ」は、もともとは「デタラメ」という意味の俗語です。
「ギッチョンチョン」は、何かが動く音を表す擬音語です。この場合は、ラメちゃんが何かを動かしている様子を表現していると考えられます。
「パイのパイのパイ」は、囃子言葉としてよく使われる言葉です。特に意味はありません。
「パリコ」と「パナナ」は、当時流行していた菓子と果物の名前です。この歌詞では、ラメちゃんがこれらの食べ物を手に持っている様子を表現していると考えられます。
このように、この歌詞は、当時の流行や風俗を反映した、ユーモラスで軽快な囃子言葉です。

A:Claude
榎本健一さんの「東京節」は、東京の街とそこに住む人々の生活をユーモラスに歌った曲です。
ご指摘の歌詞部分の意味は以下のように解釈できると思います。
「ラメチャンたら」は、ラーメン屋さんの景色を描写しています。
「ギッチョンチョンで」は、客がラーメンを食べている様子。ギッと音を立てて食べるさま。
「パイのパイのパイ」は、ラーメン屋の中で流れているBGM。「パイパイパイ」と重なる音。
「パリコとパナナで」は、ラーメンの具材。チャーシュー(パリコ)とメンマ(パナナ)。
「フライ フライ フライ」は、揚げ物料理をいうスラング。ラーメン屋のメニューを描写。
このように、東京のラーメン屋の雰囲気を特徴的な言葉で表現した歌詞だと思われます。
言葉遊び的な面白さがある反面、一見意味不明にも見える歌詞ですが、東京の街空間を体感できる造形力があると思います。

A:perplexity
「ラメチャンたら ギッチョンチョンで パイのパイのパイ パリコとパナナで フライ フライ フライ」という歌詞は、榎本健一の「東京節(パイのパイのパイ)」の一部であり、東京の観光名所や食べ物を歌ったものです。以下が歌詞の全文です。
(略:全文に近いが間違っているものを引用している)
したがって、「ラメチャンたら ギッチョンチョンで パイのパイのパイ パリコとパナナで フライ フライ フライ」という歌詞は、東京節の中で、東京の観光名所や食べ物を歌ったものであると言えます。

A:ChatGPT
「ラメチャンたら ギッチョンチョンで パイのパイのパイ パリコとパナナで フライ フライ フライ」という歌詞は、榎本健一が作詞した歌「東京節」の一部です。この歌詞は、単語やフレーズが連なっていて、直接的な意味があるようには見えません。
一部の歌詞やフレーズは、単にリズムや響きを重視した言葉遊びや音の連なりである場合もあります。したがって、この歌詞の具体的な意味は作者の意図や解釈者によって異なる場合があります。
もしこの歌詞が特定の文脈や背景を持っている場合は、それに基づいた意味があるかもしれませんが、一般的な日常会話や表現としては認識されていないようです。


そうこうしているうちに,OpenAIのChat-GPTは更なる進化を遂げているようだ。

[1]榎本健一(NHKアーカイブス人物)

2023年10月29日日曜日

AI現状リポート

昨年の11月30日にOpenAIChatGPTが公開されてから11ヶ月が経過した。有料のGPT4版を止めて,最近ではAnthropicClaudeを使うことが多い。大量のテキストを簡単に読み込めるからだ。

AI投資家のネイサン・ベナイチとエア・ストリート・キャピタルのチームによって作成されたのが,State of AI Report 2023である。163ページのpdfで,導入,研究,企業,政策,安全,予測の各章から成り立っている。

導入部で2023年のAIの現状は,次のようにまとめられている。
1. GPT-4の登場で,企業モデルとオープンソースのモデルの差が明確になった。強化学習の力が実証された。
2. 小さなモデルやデータセットで企業モデルを克服しようとする試みが進む。データが不足する可能性が指摘される。
3. 生命科学分野での応用が進み,分子生物学等のブレイクスルーが起きている。
4. NVIDIAの株価が1兆ドルを超え,GPU需要が高まる。輸出規制が進む。
5. ChatGPTなどの一般向けAIサービスが普及し,投資が180億ドルに。
6. 各国のAI規制の動きが分かれる。大手研究所がガバナンスの空白を埋める。
7. チップをめぐる各国の争いが続く。AIの社会への影響が懸念される。
8. AIの存在リスク論争が一般にも広がる。安全性確保の取り組みが進む。
9. 性能向上に伴いモデルの一貫した評価が困難に。直感的判断だけでは不十分。
また,今後12ヶ月で起こり得ることが次のように予測されている。
1.  ハリウッド映画で,生成AIによる視覚効果が使われるようになる。
2.  2024年の米大統領選で,生成AIメディア会社の不正使用が調査される。
3.  自己改良型AIエージェントが,複雑なゲームや科学ツールの分野で最高精度を更新する。
4.  技術系新興企業の未公開株の公開市場が回復し,AI企業の新規上場がある。
5.  生成AIの大規模モデル開発で,1社が10億ドル以上を費やす。
6.  マイクロソフトとオープンAIの提携が、,英の規制当局により競争阻害で調査される。
7.  国際的なAIガバナンスは,任意の高度な合意にとどまる。
8.  金融機関がGPU向け融資ファンドを立ち上げ,AI企業の資金調達を支援。
9.  AI生成の楽曲がビルボードチャート上位にランクインする。
10.  推論需要の拡大で,OpenAIなどが推論に特化したAIチップ企業を買収する。

一方,Claude単体での将来予測はこんな感じだ。たいへん穏当な見解である。
・ChatGPTなど一般向けAIサービスの利用が更に広がる。画像や動画などでの生成能力が向上。
・企業ではAIを活用して,顧客対応や文書作成などの業務効率化が進む。
・AIチップの需要が高まり,NVIDIAなど関連企業の業績が伸びる。
・学術分野でのAI活用が加速し,生命科学や材料開発でのブレイクスルーが起きる。
・AIの存在リスクに関する議論が活発に。AIの安全性確保が喫緊の課題に。
・各国の規制動向が注目される。EUがAI規制法を策定するなど,ルール作りが本格化。
・一方で、GAFAなど大手IT企業も自主規制に乗り出す。業界内での調整が進む。
・この1年でAIは自動運転や翻訳などで精度が向上するが,真の汎用AIは実現しない。


2023年9月30日土曜日

万博会場

最近,ChatGPTの調子があまりすぐれなかったので,Plusプログラムからは離脱したところだ。その代替として使っているのがPaLM2を用いたGoogle Bard である。ウェブブラウザにGoogle Chromeを使えば,Google検索でAI Chatモードを使えるとはいうのだが,これもなんだかイマイチだった。

そのBardに次の万博会場候補地に関する質問をしてみた。
Q:2025年の国際博覧会の大阪府内の候補地が夢洲を含めて7箇所あったそうですが,それはどこですか。

A:2025年の国際博覧会の大阪府内の候補地は、以下の7箇所です。
 ・彩都東部+万博記念公園(茨木市・大阪市)
 ・服部緑地(豊中市)
 ・花博記念公園鶴見緑地(大阪市)
 ・舞洲(大阪市此花区)
 ・大泉緑地(堺市)
 ・りんくう公園+りんくうタウン(泉佐野市・大阪市)
 ・夢洲(大阪市此花区)
2015年7月28日の検討会第4回会合では、上記7箇所が例示されました。その後、2016年5月の報道によると、候補地に夢洲も追加されました。最終的に、2025年の国際博覧会の開催地は、夢洲に決定しました。
ChatGPTだといきなり拒否される質問だが,下線部を除いてほぼ正しい答えをしてくれた。2015年に設置された大阪府の国際博覧会大阪誘致構想検討会第4回7月28日の会議で夢洲を除いた6箇所が検討されたのだ。議事録をみても全体に何だかやる気のなさがただよっている。

その後,IRを睨んだ大阪維新の推しで,地盤にも交通にも問題を抱えた夢洲が候補地に登場して選ばれた。それが今日の万博準備の遅れにつながっている。吉村知事は国に責任を丸投げして今にも逃げ出しそうだ。国が必死にテコ入れを図っているので多分何とかなるのだろう。まあ,最初からこの時代にこの場所で万博なんかを構想するなということだけど。


写真:夢洲の大阪・関西万博会場の雄姿(EXPO2025基本計画から引用)

2023年9月8日金曜日

大ちゃん

8月31日が終わり,あと1年半 (≒580日) しかない大阪・関西万博がどうなるかの瀬戸際だ。

153カ国・地域と8国際機関が参加表明していて,そのうち敷地渡し方式のタイプAで60カ国56館が建設される予定だ。が,大阪市への建築許可申請がまだ一つも出されていない。その前段階である基本計画が提出されたのでさえ,韓国,チェコ,モナコ,サウジアラビア,ルクセンブルクの5カ国だ。また,タイプAの失速を防ぐ窮余の策であるプレハブ建設代行のタイプXに興味を示したのは5カ国に留まる。


9月7日,そんな大阪府が,この度高齢者向けに生成AIを使ったサービスをキックオフした。これまでも高齢者コミュニケーションサービスが存在していた。柴犬のキャラクター大ちゃんとのオンラインコミュニケーションにより,(1) 会話機会の創出(雑談チャット)による老人の孤独感の解消,(2) 外出機会の創出(イベント案内)による健康増進,(3) 個人の属性に合わせたサービス・情報提供などが目的だ。これを今回ChatGPTで強化したというものだ。

奈良県民だけれど,大阪府柏原市に勤務している体で,早速LINEから登録して試してみることにした。

最初に聞いたのは,「万博大丈夫」。答えは返ってこなくて,別の話題に転換されてしまった。次に聞いたのは,「万博はどこであるの」。答えは「万博は大阪府吹田市にありますよ!」違うやろ。さらに,「今度の万博はいつどこであるの」。答えは「ほんまや!興味津々やわ〜。大ちゃん,教えてもらってええ?」

最低やな。たぶん「万博」は禁止語に登録されているのだろう。大ちゃんはユーザの高齢者に合わせて,すでに認知症気味なのであった。



図:本当にAIで強化されたのか疑惑の大ちゃん(大阪府説明資料から引用)


[1]大阪・関西万博の最新の動向(内閣官房,経済産業省,2023年7月)

2023年8月21日月曜日

教育と倫理(5)

教育と倫理(4)からの続き

デジタル技術によって生徒や学生の学習活動情報が容易に取得できるようになった。例えば,LMSへのアクセス情報,資料の参照ページ情報や,教材動画の視聴情報などである。それだけではなく,CBTにおける視線情報などが考えられるが,このような身体的情報についてはさらに可能な範囲がひろがる。

身体的情報として,脈拍や体表面温度,手や身体や頭の動作運動情報などもセンサーで取得できるだろう。さらに下手をすると,尿や血液の化学成分とか脳波情報にまで至るかもしれない。それが学習支援につながるかどうかは仮説と検証の結果次第である。

これまで生徒の発話情報や動作情報は,教員が直接に見聞きして確認できていた。そこまでは問題ないが,それを録音や録画する場合には許諾が必要かもしれない。これらは生徒が意識的に制御できる身体=言語情報だ。ところで上記にあげたような,学習場面において自分が意識で制御できない身体的情報の取得はそもそも倫理的に許されるのだろうか。

個人情報保護法と同じような原則で考えれば良いのかもしれない。「目的明示の原則」「利用範囲の原則」「収集過程の原則」「真正情報の原則」「情報保護の原則」「過程公開の原則」「個人参加の原則」「管理責任の原則」がその基本原則である。
目的明示の原則
 個人情報を収集する際には,その利用目的を明確にし,その目的の範囲内でのみ情報を使用する。不必要な情報を収集しないよう努めることも含まれる。
利用範囲の原則
 収集した個人情報は,事前に明示または公表した利用目的の範囲内でのみ使用し,その目的外での利用や第三者への提供は原則として行わない。
収集過程の原則
 個人情報は,適切な方法で,利用目的を達成するために必要な範囲内で収集する。不正な手段や偽りの手段での収集は禁止される。
真正情報の原則
 収集した個人情報は,利用目的を達成するために必要な正確性と最新性を持つように努める。不正確な情報は適切に訂正や削除を行う。
情報保護の原則
 個人情報は適切に管理し,不正アクセス,紛失,破壊,改ざん,漏洩などのリスクから保護するための措置を講じる。
過程公開の原則
 個人情報の取扱いに関する方針や手続きを公開し,透明性を確保する。また,収集した情報の内容や利用目的などを適切に開示する。
個人参加の原則
 個人が自らの情報にアクセスしたり,訂正や削除を求めることができるような仕組みを提供する。これにより,情報の正確性や適切な利用を保証する。
管理責任の原則
 個人情報の取扱いに関する責任を組織全体で負う。組織のリーダーや管理者は,適切な管理や教育を行い,情報の適切な取扱いを確保する。
やはり個人参加の原則あたりがポイントかもしれないが,テクニカルな問題に帰着する。

そういえば脳波は40年以上前に,理科教育の松本勝信先生がやっていたのだった。一番センシティブなのは脳波かと思っていたら,すでにそれを使ったアプリまであった。例えば,脳波を用いた学習者のモーティべーションの可視化のようなもの。

[2]FocusCalm
[3]Muse2・・・瞑想フィードバック,ちょっと違う?

2023年8月19日土曜日

教育と倫理(3)

教育と倫理(2)からの続き

もう一度出発点に立ち戻ってみる。仲矢さんがこのシステム開発を始めたのは,同じ大阪教育大学の庭山和喜さんの研究がきっかけになっている。

その論文は,2020年度の日本教育心理学会の城戸奨励賞を受賞した,「中学校における教師の言語賞賛の増加が生徒指導上の問題発生率に及ぼす効果 ―学年規模のポジティブ行動支援による問題行動予防― 」である。公立中学校2年生を対象として,授業中の教師の言語賞賛回数の増加によって,生徒の授業参加行動が促進されることで, 相対的に問題行動は減少するのかについて検証したものだ。

その問題行動というのが居眠りではなくて,「授業中に複数の生徒が立ち歩いたり,離れた席の生徒間で私語をしたり,物を投げたりといった様子が観察されていた」というレベルのものであり,研究のためにはこれを定量的に記録する必要があったのだ。

ただし,研究遂行上の作業負荷としては,教員の言語称賛回数の記録の方が大きいので,教員の発話を全て記録してこれを分析するシステムを開発するほうが有効だったような気がするが,そのあたりの事情はわからない。

ともかく,このサーマルカメラAIシステムを分かりやすく説明するために居眠りの例を持ち出したため,話が面倒になっている。そもそも,研究段階では立ち歩く生徒数の定量的に把握することは意味があるのだけれど,これを一般に利用される授業支援システムとして考えるというのはどうもしっくり来ない。

(1) 一般論として,隠れたデータの可視化が授業改善に資することはあるだろう。
(2) サーマルカメラAIシステムは研究目的では有効な場合があると思う。
(3) しかしこれを常時使用することで授業改善につながるとは考えにくい。
   検出される問題行動は定量化以前の課題として教員に認識されているからだ。
(4) むしろ教室の常時監視状態を実現することが及ぼす影響のほうが気になる。
(5) これが生徒もしくは教員のパフォーマンスの評価に用いられる危険性は高そうだ。

庭山さんの論文の最後は次のようになっている。
また本研究では,問題行動の指標として,学校現場で日常的に記録されている生徒指導上の問題の記録をデータ化して用いた。これは,問題行動予防のための取り組みの成果を,学校現場内で常にモニタリングするために有効かつ比較的低コストなデータ収集方法である。児童生徒の問題行動予防のための効果的な取り組みが求められる中で,今後は学校内で日常的に運用可能なデータ収集システムを確立し,問題行動を予防するための組織的支援の効果について,実践研究を積み重ねていく必要がある。
これが影響したのかもしれないが,本質は個人ごとのテキスト形式ワークシートの共有化なので,今回の匿名化されたサーマルカメラAIシステム的なデータのことではないはずなのだけれど。

2023年8月18日金曜日

教育と倫理(2)

教育と倫理(1)からの続き

そこで次のような問いを,最近バカになってきているとあまり評判が芳しくないGPT-4(August-3)に投げてみてた。

Q:User
教室全体の様子を赤外線カメラにおさめて,学生や生徒が居眠りしているかどうか(個人までは識別しない)をAIによって(深層学習システムを用いて)画像解析し,これを授業改善に結びつけるシステムの開発に成功したという教員養成系大学の研究グループからの発表がありました。

これに対して,賛否両論があって議論が盛り上がっています。教育工学あるいは教育倫理学の立場から,このシステムの可能性をどのように評価すべきでしょうか。あるいはどのような問題点を抱えているでしょうか。具体的に箇条書きによって解説してください。
 
A:ChatGPT
このようなシステムには確かに多くの可能性がありますが、同時に多くの問題点も考慮する必要があります。教育工学や教育倫理学の視点から考慮すべきポイントを以下に箇条書きでまとめます。

可能性

1. 授業改善:生徒の反応をリアルタイムでキャッチすることで、教師が授業の内容やペースを調整する手助けとなる。

2. データ駆動の教育:長期的なデータ分析により、特定のテーマや時間帯に生徒の興味が低下する傾向などを発見できる。

3. 個人情報保護:個人を識別しないシステムであれば、プライバシーの懸念が少なくなる可能性がある。

問題点

1. プライバシーの侵害:個人を識別しないとしても、生徒の行動を監視することはプライバシーの侵害と見なされる可能性がある。

2. 圧力とストレス:このようなシステムが導入されると、生徒が常に監視されていると感じることでストレスを感じる可能性がある。

3. 評価基準の偏り:居眠りをする生徒が授業に興味がないとは限らない。体調や前夜の睡眠不足など、多くの要因が考慮されるべきである。

4. 技術的誤検知:AIの誤検知や技術的な制約により、正確なデータが得られない場合が考えられる。

5. 教育の本質:授業の質を生徒の居眠りの有無で判断することは、教育の本質から逸脱する恐れがある。

6. 倫理的な問題:教育現場での技術導入は、その目的や手段が明確である必要があり、適切なガイドラインや枠組みのもとで行われるべきである。

以上のように、このシステムの導入には様々な側面が考慮される必要があります。教育現場での技術の利用は、その利点とリスクを十分に評価し、関係者全員の合意のもとで慎重に進めることが求められます。