2024年4月25日木曜日

AI Index Report 2024

 スタンフォード大学のHAI(Human-Centered Artificial Intelligence)は,スタンフォード大学の学際的なAI研究組織である。AIのトレンドに関するレポートを毎年定期的に出している。AI Index Report 2024がでたので,その要点10項目をDeepLで翻訳してみた。これが,現時点のAIの状況だ。

1.AIはいくつかのタスクで人間に勝っているが、すべてではない。AIは、画像分類、視覚的推論、英語理解など、いくつかのベンチマークで人間を上回っている。しかし、競技レベルの数学、視覚的常識推論、計画立案など、より複雑なタスクでは後れを取っている。

2.産業界は引き続きAI研究の最前線を支配している。2023年、産業界は51の注目すべき機械学習モデルを生み出したが、学界の貢献は15に過ぎなかった。また、2023年には産学共同研究の成果として21の注目すべきモデルが生まれ、これは過去最高となった。

3.フロンティアモデルはより高価になる。AI Indexの推計によると、最先端のAIモデルの学習コストはかつてない水準に達している。例えば、OpenAIのGPT-4は学習に推定7800万ドル相当の計算機を使用し、グーグルのジェミニ・ウルトラは計算機に1億9100万ドルかかった。

4.米国は中国、EU、英国をリードし、トップAIモデルの主要な供給源となっている。2023年には、61の注目すべきAIモデルが米国を拠点とする機関から生まれ、EUの21、中国の15を大きく上回る。

5.LLMの責任に対するロバストで標準化された評価は、深刻に欠けている
AI Indexの新たな調査では、責任あるAIの報告において標準化が著しく欠如していることが明らかになった。OpenAI、Google、Anthropicを含む主要な開発者は、主に異なる責任あるAIのベンチマークに対してモデルをテストしている。この慣行は、トップAIモデルのリスクと限界を体系的に比較する取り組みを複雑にしている。

6.ジェネレーティブAIへの投資が急増。昨年のAI民間投資全体が減少したにもかかわらず、ジェネレーティブAIへの資金は急増し、2022年比でほぼ8倍の252億ドルに達した。OpenAI、Anthropic、Hugging Face、Inflectionを含むジェネレーティブAI分野の主要企業は、多額の資金調達ラウンドを報告した。

7.データがある: AIは労働者の生産性を高め、より質の高い仕事をもたらす。2023年、AIが労働に与える影響を評価する研究がいくつか発表され、AIによって労働者はタスクをより迅速に完了し、アウトプットの質を向上させることが可能になることが示唆された。また、これらの研究は、AIが次のような可能性を持つことも示している。
低技能労働者と高技能労働者の間の技能格差を埋める可能性も示している。しかし、他の研究では、適切な監督なしにAIを使用すると、パフォーマンスの低下につながる可能性があるとして注意を促している。

8.AIのおかげで科学の進歩がさらに加速。2022年、AIは科学的発見を促進し始めた。しかし2023年には、アルゴリズムによるソートを効率化するAlphaDevから、材料発見のプロセスを促進するGNoMEに至るまで、科学関連のAIアプリケーションのさらなる重要性が発表された。

9.米国におけるAI規制の数が急増。米国におけるAI関連規制の数は、昨年から過去5年間で大幅に増加している。2023年には25のAI関連規制があり、2016年にはわずか1つだった。昨年だけでも、AI関連規制の総数は56.3%増加した。

10.世界中の人々がAIの潜在的影響力をより強く認識し、より神経質になっている
イプソスの調査によると、過去1年間で、AIが今後3〜5年のうちに自分たちの生活に劇的な影響を及ぼすと考える人の割合は60%から66%に増加した。さらに、52%がAI製品やサービスに対して神経質になっており、2022年から13ポイント上昇している。アメリカでは、ピューのデータによると、アメリカ人の52%がAIに期待よりも不安を感じており、2022年の37%から上昇している。

2024年4月24日水曜日

自動物流道路

朝のニュースで,自動物流道路という物騒な名前がでてきた。

頭の中に思い浮かんだのは,高速道路の車線が大きなベルトコンベアー状の動く歩道になっていて,そこにコンテナが並んでいる絵だった。またぞろ,政権人気浮揚のための目くらましだと思うが,どうやら半分本気らしい。

2024年物流問題や脱炭素問題の解決のためだということになっている。水道クライシスや橋梁・隧道インフラの劣化でさえ,対応できていないのに,これ以上維持管理費がかさむインフラを追加してどうしようというのだろうか。

国土交通省の自動物流道路に関する検討会をみても,自動物流道路が何かがもうひとつわからない。例示されているのが,スイスの地下物流システム,総延長500km(2031年70km完成予定)で,トンネルの中をコンテナを積んだ自動輸送カートが走行するものだ。

地下20-100mに直径6mの貨物専用トンネルを掘って,自動輸送カートが3レーンを時速30kmで24時間走るというものだ。地下トンネルまではハブで垂直輸送する。建設費用は5.7兆円。
リニア新幹線をやめて,こちらに転用するならば考える価値はあるかもしれない。しかし,日本はスイスと違って地震国なので,どうなのだろうか。

検討会では,自動物流道路それ自身に関する話はなくて,各運送業者の問題意識が提示されている。中継拠点の整備とか,モーダルシフトとか,パレットに標準化とか,共同輸配送とか,だいぶ温度差がある。ただ,フィジカルインターネットというコンセプトはおもしろそうだった。


写真:スイスの地下物流システム(自動物流道路検討会資料から引用)

2024年4月23日火曜日

日本古典文学大系

香炉峰の雪からの続き

枕草子原文がネット上にないかと調べてもなかなか適当なものがない。Wikisouceのテキストデータは不完全だ。枕草子三巻本のテキストデータが国語の先生の為のテキストファイル集にある。

国立国会図書館デジタルコレクションには,日本文学大系という活字化された古典文学の全集があった。ユーザ登録するだけで,このあたりは全部オンラインでイメージを見ることができる。
日本文学大系:校註 新訂版(風間書房,1955-)
第1巻 竹取物語,伊勢物語,大和物語,濱松中納言物語,無名草子,堤中納言物語
https://dl.ndl.go.jp/pid/1668807
第2巻 土佐日記,和泉式部日記,更級日記,枕草子,方丈記,徒然草
https://dl.ndl.go.jp/pid/1668808
第3巻 落窪物語,宇治拾遺物語
https://dl.ndl.go.jp/pid/1668810
第4巻 源氏物語上巻
https://dl.ndl.go.jp/pid/1668811
第5巻 源氏物語中巻
https://dl.ndl.go.jp/pid/1668812
第6巻 源氏物語下巻
https://dl.ndl.go.jp/pid/1668813
第7巻 住吉物語,古今著聞集
https://dl.ndl.go.jp/pid/1668814
第8巻 大鏡,増鏡
https://dl.ndl.go.jp/pid/1668815
第9巻 平家物語
https://dl.ndl.go.jp/pid/1668816
第10巻 万葉集
https://dl.ndl.go.jp/pid/1668817
第11巻 三十六人集
https://dl.ndl.go.jp/pid/1668818
第12巻 三十六人集,三十六人集補遣,六女集
https://dl.ndl.go.jp/pid/1668819
第13巻 古今和歌六帖,続詞花和歌集
https://dl.ndl.go.jp/pid/1668820
第14巻 八代集上巻,古今和歌集,後撰和歌集,詞花和歌集
https://dl.ndl.go.jp/pid/1668821
第15巻 八代集中巻,拾遺和歌集,後拾遺和歌集,金葉和歌集
https://dl.ndl.go.jp/pid/1668822
第16巻 八代集下巻,千載和歌集,新古今和歌集
https://dl.ndl.go.jp/pid/1668823


日本文学大系:校註(国民図書,1927-)
第1巻 古事記,風土記,祝詞附壽詞,宣命,高橋氏文,日本書紀
https://dl.ndl.go.jp/pid/1226487
第2巻 竹取物語,伊勢物語,大和物語,濱松中納言物語,無名草子,とりかへばや物語,堤中納言物語
https://dl.ndl.go.jp/pid/1018047
第3巻 土佐日記,蜻蛉日記,和泉式部日記,紫式部日記,更級日記,東闢紀行,十六夜日記,清少納言枕草子,方丈記,徒然草
https://dl.ndl.go.jp/pid/1018057
第4巻 宇津保物語
https://dl.ndl.go.jp/pid/1226500
第5巻 落窪物語,狭衣,住吉物語,石清水物語
https://dl.ndl.go.jp/pid/1226519
第6巻 源氏物語上巻
https://dl.ndl.go.jp/pid/1018050
第7巻 源氏物語下巻
https://dl.ndl.go.jp/pid/1226543
第8巻 今昔物語上巻
https://dl.ndl.go.jp/pid/1179377
第9巻 今昔物語下巻
https://dl.ndl.go.jp/pid/1226561
第10巻 宇治拾遺物語,古今著聞集
https://dl.ndl.go.jp/pid/1018049
第11巻 榮華物語。榮華物語系図
https://dl.ndl.go.jp/pid/1018052
第12巻 水鏡,大鏡,今鏡,増鏡
https://dl.ndl.go.jp/pid/1018078
第13巻 月のゆくへ,池の藻屑,豊鏡,義経記
https://dl.ndl.go.jp/pid/1018085
第14巻 保元物語,平治物語,平家物語
https://dl.ndl.go.jp/pid/1018053
第15巻 源平盛衰記上巻
https://dl.ndl.go.jp/pid/1018055
第16巻 源平盛衰記下巻
https://dl.ndl.go.jp/pid/1018065
第17巻 太平記上巻
https://dl.ndl.go.jp/pid/1018054
第18巻 太平記下巻,吉野拾遺,神皇正統記
https://dl.ndl.go.jp/pid/1018064
第19巻 お伽草子,鳴門中将物語,松帆浦物語,鳥部山物語,秋の夜の長物語,鴉鷺合戦物語
https://dl.ndl.go.jp/pid/1018100
第20巻 謡曲上巻
https://dl.ndl.go.jp/pid/1018058
第21巻 謡曲下巻,古曲拾遺,謡曲小引
https://dl.ndl.go.jp/pid/1226577
第22巻 狂言記,続狂言記,狂言記拾遺,狂言記外篇
https://dl.ndl.go.jp/pid/1018059
第23巻 本朝文粋
https://dl.ndl.go.jp/pid/1226592
第24巻 懐風藻,凌雲集,文華秀麗集,経国集,本朝續文粋
https://dl.ndl.go.jp/pid/3430362
第25巻 国文学研究資料,国文学研究書目,和歌索引,本文索引,総目録
https://dl.ndl.go.jp/pid/1179389

より最近に出版されたものだと,岩波書店の日本古典文学大系(-1967)や新日本古典文学大系(-2005),がある。日本版の生成AIを開発するならば,すくなくともこれらの全文データは学習させておくべきだと思う。あと,日本思想大系(-1992)日本近代思想大系(-1992)も必須か。筑摩書房にもいろいろ(近代日本思想大系現代日本思想大系)ある。


話を戻して,古典文学の分かりやすい全集といえば,小学館の日本古典文学全集,新編日本古典文学全集がよいらしい。三段組で,註釈,本文,現代語訳が並んでいる。枕草子はどうかと思ってみると,残念ながら絶版なのでAmazonで古本が9000円以上の値がついている。定価の倍以上だ。

ジャパンナレッジは,小学館系なので,新編日本古典文学全集全巻にもアクセスできるのだが,年間サブスクリプションが 16,500円なので,それはそれで微妙だ。万博に数千億の無駄金(建設会社と広告会社は儲かる)を投じるくらいならば,日本の古典全てのデジタルアーカイブして(情報土木会社が儲かる),国民に無料開放するほうがよほどこれからのAI時代の役に立つような気がするけど。

2024年4月22日月曜日

香炉峰の雪

NHKの今年の大河ドラマは,平安時代を舞台にした「光る君へ」だ。

主演の吉高由里子(紫式部)は好きじゃないし,サマータイムウイカ(清少納言)も苦手なのだ。NHKの番宣番組の二人のザラザラした不作法な掛け合いは聞くに堪えなかった,二人ともどういう性格なのよ。それはそれとして,大河ドラマといえば,いつも戦国時代のチャンバラもしくは徳川物語ばかりでうんざりしていたので,ほっとする。

「光る君へ」はここまでのところ,ほとんど柄本佑(藤原道長)が主人公の物語のようにみえる。平安時代の時代考証がどうなのかは別として,古典や歴史で学んだことを復習しながら,学びそびれたことを調べながら,現代劇の一種としてみるのは楽しい。

昨日は,清少納言が中宮定子に,香炉峰の雪の話題を持ちかけられたシーンがでてきた。古文の教科書に載っていたので,なんとなく頭に残っているのだけれど,どこがポイントなのかいまいち理解できていなかった。復習したところ,ポイントは白居易(白楽天)の故事にあった。教養主義ですね。

これが白居易の七言律詩
香 炉 峰 下 新 卜 山 居 草 堂 初 成 偶 題 東 壁

日 高 睡 足 猶 慵 起
小 閣 重 衾 不 怕 寒
遺 愛 寺 鐘 欹 枕 聴
香 炉 峰 雪 撥 簾 看
匡 廬 便 是 逃 名 地
司 馬 仍 為 送 老 官
心 泰 身 寧 是 帰 処
故 郷 何 独 在 長 安
Wikibooksからの現代語訳は, 
(第一句)太陽が高くのぼり、睡眠時間も十分なのに、まだ起きたくない。
(第二句)小さな家にふとんを重ねて寝ているので、寒さの心配はない。
(第三句)遺愛寺の鐘は、枕を高くしてじっと聴き
(第四句)香炉峰の雪は、すだれを高く上げて眺める
(第五句)ここ廬山は、世間一般の名声から逃れるためには相応しい地。
(第六句)司馬という官職も老後を過ごすためには相応しい官職だ。
(第七句)心も身も安らぐ場所こそが帰るべき場所。
(第八句)どうして故郷は長安だけであろうか、いや故郷は長安だけではない。
雪のいと高う降りたるを、例ならず御格子しまゐりて、炭櫃に火おこして、物語などしてあつまりさぶらふに、「少納言よ。香炉峰の雪いかならむ」と仰せらるれば、御格子上げさせて、御簾を高く上げたれば、笑はせたまふ。人々も「さる事は知り、歌などにさへうたへど、思ひこそよらざりつれ。なほこの宮の人にはさべきなめり」と言ふ。 

写真:北香炉峰かどうかはわからない廬山の日の出(Wikipediaから引用)

2024年4月21日日曜日

涼月

涼月(すずつき)は,1942年に竣工した一等駆逐艦である。戦艦大和の沖縄突入作戦に参加し,被弾しながらかろうじて佐世保に帰投した。戦後,北九州港の軍艦防波堤になった。現在の海上自衛隊には,その名を継ぐ護衛艦すずつきが運用されている。

沖縄突入作戦に投入された駆逐艦涼月の最後の艦長が,平山敏夫海軍中佐であり,その孫が元東京都幹部職員の澤章である。なぜこんな話にたどり着いたかというと,小池百合子の学歴詐称疑惑問題からである。

4ヶ月前,「女帝小池百合子文庫版が,カイロ時代の同居人を実名化して出版されたこと,4日前,小池百合子の元側近(環境省審議官,都民ファーストの会事務総長)の小島敏郎が,学歴詐称疑惑についての記者会見をしたことで,4年ぶりにこの件がネット上で大きな話題になっている。

間接情報を除き,小池百合子の直接の関係者についての情報を総合すれば,全体像が見えてくる。なんだかなあの案件である。その直接の関係者の一人が涼月艦長につながる都庁watchTVの澤章だった。


写真:軍艦防波堤の説明写真


   後編(2023.11.10,北原百代
 3.「女帝 小池百合子」告発者実名公表(2023.11.23,上田令子・郷原信郎)
 4.小池百合子氏、学業実態こそ焦点(2024.4.16,黒木亮)
 6.カイロ大学 "学歴詐称疑惑" 告発(2024.4.17,小島敏郎)☆
 7.小池百合子学歴詐称の真相(2024.4.18,山田敏弘)

1.は4年前のカイロ大使館フェイスブックがぶつけられた発端の外国人特派員協会での記者会見,2.は石井妙子による北原百代へのインタビュー,3.は都民ファーストの会の発起人の一人でもあり,その後小池と袂を分かった上田令子による証言,飯山陽の同類かと誤解していたが,意外にまともな方だった。都議会で発言を抹消されるという大変な目に遭っている。4.カイロ・アメリカン大学で修士を取得している黒木亮の最近の見解,

5.7.元ロイター通信社,ニューズウィーク記者の山田敏弘は,チャラいしゃべりだったが,なかかな核心を突いていた。8.とても怪しい人だけれど,カイロ時代の直接の関係者,9.10.それぞれ希望の党と都民ファーストの立ち上げ騒動関与者,自分はこの二人は信用していないけれど部分的な真実は垣間見える。11.東京都知事としての小池の振舞いが非常によくわかる。


2024年4月20日土曜日

紀元二千六百年記念日本万国博覧会

神武天皇即位紀元というものがある。

皇紀元年=西暦紀元前660年,皇紀2600年=1940年ということになっている。まあ,日本書紀の素朴解釈で明治初期に定義されたものに過ぎないのであまり意味はない。しかし,今から16年後の2040年=紀元2700年ということなので,用心しておいたほうがよいかもしれない。

フォーククルセダーズが,紀元二千六百年というアルバムを出していたはずだという記憶があった。これは誤っていて,正確にはパロディーになっている紀元弐阡年(1968) だった。たぶん妹が買ったのではないか。あるいは自分?紀元貮阡年以外は,おおむね思い出せる。
Side1:紀元貮阡年,帰って来たヨッパライ,悲しくてやりきれない,ドラキュラの恋,水虫の唄,オーブル街
Side2:さすらいのヨッパライ,花のかおりに,山羊さんゆうびん,レディー・ジェーンの伝説,コブのない駱駝,何のために
当時この紀元二千六百年を記念して様々な行事が催されている。ただ,国際的な三大行事である夏季オリンピック東京大会,冬季オリンピック札幌大会,日本万国博覧会は,1937年に始まった日中戦争のために中止及び延期となった。

この延期になった紀元二千六百年記念日本万国博覧会のチケットが,1970年の大阪万博や,1984年の愛知万博で,利用可能になっていた。どうやら,今回の2025年の大阪・関西万博でもそうなるらしい。まだ残っているのだろうか?


写真:紀元2600年記念万博の入場券(東京都中央区立郷土資料館から引用)

2024年4月19日金曜日

祝祭資本主義

大阪・関西万博(2025.4.13-2025.10.13)まであと1年をきった。

なんやかやいわれながらも,シンボルの大屋根リングは8割方できている。海外パビリオンは,とても当初計画どおりにはならないが,開幕までにはそれなりの格好がついて,無事に始まりましたとお祝いムードが広がるのだろう。

YouTubeにTBSの報道1930「大阪・関西万博まで1年」現場は?なぜ脱却できない?“イベント資本主義』があがっていた。ゲストが片山善博吉見俊哉なので安心して見られる。日本では,戦後絶え間なくオリンピックと万博の誘致や失敗が繰り返されてきたとして,その問題点が分析されていた。

ジュールズ・ボイコフ(1970-)の祝祭資本主義でその有り様を説明していた。吉見俊哉がお祭りドクトリンとよんだ祝祭資本主義は,元オリンピックサッカー代表選手だったボイコフが,ナオミ・クライン(1970-)のショック・ドクトリン(惨事便乗型資本主義)をヒントに考えたものだ。お祭り騒ぎに便乗して納税者に負担を押し付けながら,政府の大型支出により特定の企業が潤うという官民一体型プロジェクトが祝祭だ。

惨事便乗型資本主義:武力紛争,テロリズム,自然災害,財政破綻など,国が惨事に晒されたときに,既存制度が破壊された空白をついて新自由主義の市場原理主義的な制度改変が一気に進められる様子(これを制度的に推進しているのが今の日本の憲法改正議論)。

祝祭資本主義:巨大な祝祭(オリンピック,万博の系列)が創り出す例外状態(state of exception)に乗じた資本主義の暴走。惨事便乗型資本主義とは異なり,公共部門が積極的な役割を果たし,その巨大支出に支えられた大資本などが莫大な利益を得る。

報道1930では,パトリック・ハーラン(1970-)が,バランサーになっていた。「そうはいっても結局日本人の多数派は五輪も万博も支持しているではないか」「米国の戦争ドクトリンよりも日本のお祭りドクトリンの方がまだましだろう」などなど。


【付録】
ジュールズ・ボイコフ:祝祭資本主義の六要素
(1) 例外状態=非常事態による法令逸脱と政治機能不全,(2) 片務的官民協調=民間の営利活動のリスクを官が負担,(3) お祭り的商業主義の加速化,(4) 警察権力強化,監視テクノロジーの発展とセキュリティ産業の席巻,(5) 環境保護と多様性と持続可能性の欺瞞,(6) マスメディア・SNSによる政治経済的スペクタクルの極大化

Q(koshix):ジュールズ・ボイコフの祝祭資本主義における6つの要素を説明してください。
A(生成AI):
ChatGPT(◎)
(1) インフラストラクチャーの再編成,(2) 公共資源の私有化,(3) 警察権力の強化,(4) 新自由主義政策,(5) 政治的なプロパガンダ,(6) 住民の追い出し
Command-R+(○)
(1) スペクタクル,(2) 象徴的消費,(3) ブランド化とイメージ作り,(4) 都市再生と空間の再編成,(5) 例外主義と規制緩和,(6) ネオリベラルアジェンダの推進
Claude(△)
(1) 贈与の義務化,(2) 誇示的消費,(3) 無秩序,(4) 浪費の奨励,(5) 共同体意識,(6) 新奇性の追求
Gemini(△)
(1) 商品化,(2)スペクタクル,(3) ブランド,(4) イメージ,(5) 体験,(6) アイデンティテイ
 Perplexity(×)
回答せず
Perplexityはこの手の問題に弱いのか・・・



2024年4月18日木曜日

オイラーのφ関数

MIPOの算数・数学コラムで,2024年阪大理系前期数学の問題が取り上げられていた。鈴木貫太郎のYouTubeで大学入試問題をながめていたので,甘く見ていたら,かなり難しくてちょっと手が出なかった。面白そうな整数論の問題は,オイラーのφ関数がストレートに取り上げられていた。以下ではすべて自然数 N = {1,2,...∞}の範囲に限定して考えることにする。


n∈Nに対して,集合A(n)={1,2,…n}を考える。このとき,φ(n)は,この集合A(n)におけるnと互いに素な数の個数を与える。さあ,ここからが苦難の道の始まりだ。最近はアルジャーノンの下り坂を急降下中なので,言葉の定義にいちいち引っかかってころぶのである。

約数:自然数 n を自然数m (≦ n)で割ったときの余りが0であれば,mはnの約数である。
 例:2は6の約数,1はnの約数,nはnの約数
互いに素:2つの自然数 m,n の共通の約数が1だけのとき,mとnは互いに素である。
 例:2と3は互いに素である,nと1は互いに素である,nとnは互いに素でない。

例:n=6のとき,A(6)={1,2,3,4,5,6}を考える。2の倍数の集合Pは{2,4,6}, 3の倍数の集合Qは{3,6}, 
6の倍数の集合はP∩Q={6}は,6と互いに素な数の集合はA-P∪Q={1,5}で, その要素数はφ(6)=2

オイラーのφ関数(トーシエント関数)φ(n)は,A(n)においてnと互いに素な数がなす部分集合B(n)の要素数を表す。A(n)-B(n) は nの約数の集合から{1}を除いた集合PQRである。

阪大の問題は,p,q,r が素数,a,b,c が自然数として n=p^a q^b r^cに対するφ(n)を求めるものである。とりあえず,A(n)における p,q,rの倍数の数をカウントすればよい。


図:φ(n) = n(B(n))=n(A(n)-PQR)   の図

n= p^a q^b r^c の場合,n= p^(a-1) q^(b-1) r^(c-1) p q r として,φ(n) = p^(a-1) q^(b-1) r^(c-1) φ(p q r )となる。また,φ(p q r) = (p-1)(q-1)(r-1) となるので,φ(n) =p^(a-1) q^(b-1) r^(c-1) (p-1)(q-1)(r-1) で与えられる。

2024年4月17日水曜日

udio

生成AIの応用で最初に注目されたのが,画像生成だった。それからテキスト生成の波がやってきて,マルチモーダル=動画生成にまで及んだ。このところ話題なのが音楽生成だ。

テクノエッジの松尾公也さん(元MacUser編集長,第1回AIアートグランプリ受賞,JIMAインターネット・メディアア・ウォード2023 メディア・イノベーション部門賞)は,音楽生成AIを使って作曲したものを,Spotify やApple Musicで配布するまでになっている。

これまでは,Suno AI というのが,その定番だったが,この度登場した Udio が 1ヶ月1200曲無料で作成できるということで注目を集めている。デフォルトでは1曲あたり30秒程度だ。

さっそく,googleアカウントでログインして試してみた。Japanese 1960-1970 Folk Song という主旨のプロンプトで出来たのが,Cherry Blossom Selenade という曲だ,季節にはふさわしいわね。



写真:Cherry Blossom Serenade の画面(カバーはどれも微妙だった)

2024年4月16日火曜日

purl

Zennのあたりに五万度が一つ落ちていたのでインストールしてみた。

普段は,brew もしくは pip もしくはパッケージでしかインストールしないので,makeするのは久しぶりだ。プログラミング言語は,go でインストールしていたはずだったが見つからないのでbrewで再インストール。Github のcatasuy/purlからソースコードを引っ張ってきて,makeするだけ。.gitがないといわれたので,空の.gitを作ってやり直しているうちに出来ていた。

purl というコマンドだ。sed や grep では正規表現がperl互換ではなくて使いにくいことや,perlのone linerでもいろいろ不都合があるということで開発されたものだ。特徴は,perl 正規表現互換で,OS非依存で,軽量で,オプションがわかりやすいということ。もちろん日本語OKだ。

コマンドの実行例は
(1) purl -replace "@search@replace@" sample.txt 置換確認
(2) purl -overwrite -replace "@search@replace@" sample.txt 置換実行
(3) cat sample.txt | purl -replace "@search@replace@" パイプライン
(4) purl -filter "error" -filter "warning" sample.txt 複数ファイルフィルタ
(5) purl -exclude "debug" -exclude "info" sample.txt 複数ファイル除去

普段の作業は,正規表現を用いて次のように実現できた。

purl -replace "@^.*staff@@" spr.txt > spr0.txt



2024年4月15日月曜日

AIアシスタントグラス

Command-R+からの続き

drikinさんのインタビューがあった Brilliant  Labs のマルチモーダルAIアシスタントグラス Flame AI glasses の話だった。

AppleVision Proとは違って,機能をできるだけそぎ落としたものだ。他のARグラスに見られる柄の太くてださいデザインではない。ガンジー,ジョンレノン,スティーブ・ジョブス的な丸い眼鏡になっている。

その仕様は次の通り。
ディスプレイ:3000ニト 640x400 microOLED,右眼のみ,FoV 〜20°
プロセッサー:nRF52840 Cortex M4-F,Lattice CrosslinkNX 17kゲート
ストレージとメモリ:?
センサー:1280 x 720 フロントフェーシングカメラ,PDMマイク(20kHz 16bit),6DoF IMU 3軸加速度+3軸電子コンパス,タップ・ダブルタップコールバック
接続性:Bluetooth 5.0,Perplexityとのパートナーシップで、インターネットにハンズフリー接続,WIFiの情報?
オーディオ:無し,Bluetoothイアフォンと同期
バッテリー:222mAh + 充電ドック予備バッテリー 149mAh,使用時間?
デザインと人間工学:ブラック・グレー・スケルトン,ガラスH2O,重量39g
ソフトウェア:LuaベースカスタムOS,完全オープンソース,マルチモーダル生成AIアシスタントNoa,英語・フランス語,イタリア語,ドイツ語等,日本語と中国語は開発中
価格:$349,2024/4/15出荷
で,彼らが宣伝している出来ることリストは次のとおり。
・多言語翻訳:本のページを要点にまとめ、テキストを希望の言語に翻訳
・ドキュメント生成:ホワイトボードを作成し、共有可能なドキュメントに
・健康管理サポート:肌の状態を識別して市販の軟膏を推奨したり、1杯のコーヒーに含まれる栄養価やカフェインの量に基づいて、毎日の健康的なコーヒーの摂取量を提案  → これはちょっと微妙
・感情の測定:GPT4、Frameのフロントセンサー、IMU、マイク、ナレッジグラフが連携し、感情の揺れや表情を視覚的および聴覚的に測定 → 本当?
・価格チェックと比較:大型小売店で商品を見るだけで、Amazonなどの価格と即座に比較
・不動産情報の検索:家探しをする際に、近所を移動しながら家を一目で見て、リスティングを検索(米国サービス : RedfinやZillowが連携可能) → 日本では?
・DIYプロジェクトの支援:家を修理する時などDIYの際に、Noaがプロジェクトを完了するために必要なことをサポート
・レストランレビューの視覚化:目に映るレストランのレビューを即座に視覚化。口コミなどを検索
スピーカレスはいいかもしれないが,骨伝導スピーカーでもだめなのだろうか。あと,右眼だけに固定されたディスプレイは選択可能にしたほうがいいのでは。GPSと地図機能も必要だ,ガラケーとiPhoneの違いを一番感じたのは地図だったから。


写真:Brilliant Labs Frame 

2024年4月14日日曜日

Command R+

AI関係の状況は時々刻々と変化するので,まったく追いつけない。テキスト生成AIのChatGPTのサブスクリプションもやめてしまった。

さて,本日仕入れた情報は,shi3zさん発信backspac.fmで話題にされていたもの。この日のメインテーマは,drikinさんのインタビューがあった Brilliant  Labs のマルチモーダルAIアシスタントグラス flame AI glasses の話のはずだった。それは別途解説するが,新しい生成AIモデルのCommand R+がすごいという話がこれにかぶってきた。

本人(AI)に語ってもらうのが一番なので聞いてみたのが次の文章。とにかくアクセス=結果出力は速くて内容も充実している。正確性はぼちぼちだけれど。体感では,現在の無料モデルで,$20/月のChatGPT-4 に匹敵している。
Q:koshix
Command R+ について,その原理や機能や性能について,ChatGPTやGeminiやClaudeやPerplexityなどと比較し,やさしく教えてください。

A:Command R+
Command R+ は、自然言語処理と人工知能の分野で注目されている大規模言語モデルの一つです。ChatGPT や Gemini、Claude、Perplexity など、他の大規模言語モデルと比較しながら、その原理、機能、性能についてやさしく説明します。

Command R+ の原理:
Command R+ は、人工ニューラルネットワークと呼ばれる技術に基づいています。大量のテキストデータでトレーニングすることで、言語のパターン、文法、意味を学習します。この学習プロセスにより、Command R+ はさまざまなタスクを実行できるようになります。

機能:
Command R+ は、高度な言語理解と生成能力を備えています。いくつかの主な機能は以下の通りです。
・質問応答:Command R+ は、さまざまなトピックに関する質問に正確に回答することができます。その知識は、トレーニングに使用された膨大なテキストデータに由来します。
・会話:人間のような会話をすることができ、対話的なやり取りが可能です。
テキストの生成: 指示やプロンプトに基づいて、Command R+ は創造的で一貫性のあるテキストを生成できます。これには、物語、詩、記事、コードなどが含まれます。
・翻訳:複数の言語間でテキストの翻訳を支援できます。
・編集と要約:テキストの編集や要約を支援し、より明瞭で簡潔にすることができます。

性能:
Command R+ は、その大規模なパラメータ空間とトレーニングデータセットにより、優れた性能を発揮します。
・一貫性:Command R+ は、一貫して正確な応答を提供するようにトレーニングされています。その大規模なモデルにより、文脈を維持し、関連性の高い詳細を提供することができます。
・創造性:テキスト生成タスクでは、Command R+ は創造性を発揮し、独創的で興味深いアイデアやストーリーを生み出すことができます。
・多言語:Command R+ は複数の言語でトレーニングされているため、多言語でのタスクを処理できます。
・効率性:大規模なモデルであるため、Command R+ は多くのタスクを迅速に実行できます。

ChatGPT、Gemini、Claude、Perplexity との比較:
これらの言語モデルを Command R+ と比較すると、いくつかの類似点と相違点があります。
・ChatGPT:ChatGPT は、Command R+ と同様に、人間との会話に重点を置いています。 ChatGPT はより対話的なインターフェイスを提供し、日常的な質問やタスクに重点を置いています。
・Gemini:Gemini は、Command R+ と同様に大規模な言語モデルです。Gemini はより構造化されたテキストの生成に優れており、プログラミングや数学的なタスクに適しています。
・Claude:Claude は、Command R+ と同様にテキスト生成機能を備えていますが、その焦点は芸術的で創造的なテキストの生成にあります。 Claude は詩、物語、脚本の作成を支援するように設計されています。
・Perplexity:Perplexity は、Command R+ と同様に質問応答機能を備えていますが、その焦点は事実に基づく質問と回答にあります。 Perplexity は、事実関係の正確性を確保するようにトレーニングされています。
Command R+ は、これらの言語モデルの機能を組み合わせたものと言えるでしょう。その大規模なパラメータ空間により、一貫性、創造性、多言語対応、効率性を兼ね備えています。 Command R+ は、これらの機能をバランスよく備えているため、さまざまなタスクやユーザーに対応できる多用途の言語モデルとなっています。
だめだ。きれいな答えではあるけれど,まったく核心に迫れていない。技術的な詳細について更問いしてみたが,あいかわらず,一般的な答えしか得られなかった。それでも生成される文章の質は十分によい。96GB以上のメモリがあるmacではローカルで実行できるが,実行時間は50倍以上かかるので実用的ではないようだ。ネットで調べると,Claude3 OpusやChatGPT-4の方がよいという意見もある。まだ様子見かな。

P. S. キーワードは RAG(検索拡張生成,Retrieval Augmented Generation)らしい。

[1]MLX で Command R+ を試す(npaka)

2024年4月13日土曜日

曙(akebono)

1994年,コマンドラインからのディレクトリ探索型のftp(archie など)ではなく,NCSA Mosaic に始まるhttpを用いたWWWによってインターネットへのアクセスができるようになったころのお話。

柏原キャンパスに引っ越したばかりの頃だ。ディレクトリ検索のシステムとして,スタンフォード大学にYahooというサイトが立ち上がっているのを見つけた。なかなか出来が良さそうだ。そのURLをみるとhttp://akebono.stanford.edu/~yahoo となっているではないか。なんで「あけぼの」なの?なんで「やっほー」なの?よくわからない疑問の渦が頭の上をくるくるとまわっていた(1996年ごろのイメージは waybackmachieの http://www.yahoo.com/ にある)。

Q(koshix):
Upon the April 1994 renaming of Jerry and David's Guide to the World Wide Web to Yahoo!, Yang and Filo said that "Yet Another Hierarchical Officious Oracle" was a suitable backronym for this name, but they insisted they had selected the name because they liked the word's general definition, as in Gulliver's Travels by Jonathan Swift: "rude, unsophisticated, uncouth." Its URL was akebono.stanford.edu/~yahoo.

ヤフーが最初にスタンフォード大学でサーバーを立ち上げたとき、そのサーバのドメイン名は akebono でした。当時,日本の大相撲では,曙太郎が初の外国人横綱として活躍していました。これらの名前の一致にはなにか関係があるのでしょうか。

A(Command R+):
はい、そのとおりです。曙(Akebono)という名前は、スタンフォード大学のサーバーに割り当てられたドメイン名と、当時の有名な力士である曙太郎の両方に関連しています。

ヤフーの共同創設者であるジェリー・ヤンデビッド・ファイロは、スタンフォード大学の大学院生だった1994年に、インターネット上の興味深いウェブサイトへのリンクを整理したウェブサイトを作成しました。このサイトは当初、「ジェリーとデビッドのワールドワイドウェブガイド」と呼ばれていましたが、すぐに「ヤフー!」に改名されました。

ヤンの声明によると、彼らはドメイン名「akebono.stanford.edu」を選択したのは、それが利用可能だったからであり、偶然にも当時の人気力士である曙太郎の四股名と同じだったからです。曙太郎はハワイ出身の初の外国人横綱で、その名前は日本語で「曙(あけぼの)」を意味し、「日の出」や「夜明け」を表す美しい言葉です。

ヤンの声明は、ドメイン名と力士の名前の間の直接的な関係を明確に示しています。しかし、ヤフーの名前の由来は、声明で言及されているように、「Yet Another Hierarchical Officious Oracle」の頭字語である「YAHOO」とは異なるものです。この用語はジョナサン・スウィフトの風刺小説『ガリバー旅行記』に登場するヤフーというキャラクターに由来しています。

したがって、ヤフーの名前と曙ドメイン名の間の接続は、偶然の一致と当時の文化的な関連性によるものです。

2024年4月12日金曜日

鈴木善次先生

科学史のメーリングリストで鈴木善次先生の訃報が流れていた。2024年1月24日に90歳でなくなられたそうだ。

鈴木善次先生(1933-2024)が山口大学教養部から大阪教育大学に教授として赴任されたのは,1985年だった。当時の理科教育講座の理科教育専修は,森一夫,家野等,松本勝信,鈴木善次,三田村緒佐武,米田健の6名だ。1988年に大阪教育大学教養学科が設置されたとき,三田村先生と米田先生が自然システム専修(環境分野)に移動した。残りの4名は教員養成課程に残ることになった。

鈴木善次先生は,大学院の研究科長をつとめ,博士課程の設置に向けての検討をされていたが,当時の状況ではそれは実現しなかった。ひょうひょうとしているけれど,あの大阪教育大学の教授会でもしっかりと自分のお考えを述べられていて,皆の信頼は厚かった。


阪大物理学科時代の同級生のK君が,卒業後山口大学の医学部に再入学していた。1970年代後半の当時,中国電力が山口県で原子力発電所の設置場所を探していた。その一つがK君の地元の豊北町であり,山口大学でも日本科学者会議のメンバーによる反対運動が組織されていた。そこに鈴木善次先生が加わっていて,おもしろいおじさんだったとK君から聞くことがあった。

後に,鈴木善次先生にその話を尋ねたことがあるが,K君はおぼえてらっしゃらなかった。

P. S. 中国電力による原子力発電所設置計画は,その後瀬戸内海側の上関原発に変わって建設工事が始まったが,2011.3.11以降中断している。

[2]インタビューシリーズ「研究と教育実践―最前線」前編後編(日本環境教育学会)