2023年12月31日日曜日

(冬休み 6)

本・ノート・鉛筆・消しゴム
책(chaek)・노트(noteu)・연필(yeonpil)・지우개(jiugae)

2023年12月30日土曜日

(冬休み 5)

学校・教室・先生・生徒
학교(hakgyo)・교실(kyosil)・선생님(seonsaengnim)・학생(haksen)

2023年12月29日金曜日

(冬休み 4)

机・いす・ベッド・食卓
책상(chaeksang)・의자(uija)・침대(chimdae)・식탁(sigtag)

2023年12月28日木曜日

(冬休み 3)

リンゴ・いちご・バナナ・ぶどう
사과(sagwa)・딸기(talgi)・바나나(banana)・포도(podo)

2023年12月27日水曜日

(冬休み 2)

ピアノ・ギター・太鼓・笛
피아노(piano)・기타(gita)・북(bug)・피리(pili)

2023年12月26日火曜日

2023年12月25日月曜日

M-1グランプリ2023

M-1グランプリやってるよという連絡を受けて,久しぶりにTVのチャンネルを回した。

笑い飯がタイトルを取る頃まではよく見ていたが,最近はちょっと足が遠のいていた。審査員のコメントや評価もなんだかしっくりこなくて,最近の笑いのスタイルにうまく波長が合わなくなっていた。

今回,久々に見ようという気になったのは,NHKのあさイチで博多大吉が「審査するのがちょっと憂鬱だ」というような話をしていたからだ。NHKが大阪維新とグルになっている吉本興業とベタベタの関係になっているのはちょっとどうかと思うが,朝のひとときを博多華丸・大吉の無難な笑いで過ごすのは精神衛生上よいかもしれない。

M-1グランプリを令和ロマンの次あたりからみた。さや香の評価が高かったけれどちょっとうるさすぎて,ピンと来なかった。ヤーレンズの笑いが一番自分の壺にはまって終始ニヤニヤしていた。今回はそれぞれ,審査員のコメントもみな納得できるものでよかった。最後の3組を残したあたりで,古典芸能への招待の録画が始まり,チャンネルは自動的にあまり好きでない市川團十郎に切り替わってしまった。

その後,クリスマスイブにネットで確認すると,令和ロマンが2023のチャンピオンになっていた。さっそくYouTubeで探してみたが,まあまあという感じかな。ヤーレンズの方が自分には合っていた。

P. S. さらに次の日クリスマスの夜にネットで確認するため,最終決戦三組のネタをあらためてみた。令和ロマン(クッキー工場)<ヤーレンズ(ラーメン屋)<さや香(見せ算)だった。「見せ算」圧倒的に面白かったやんか。ただ審査員から票は入っていなかった。

P. P. S. さや香の新山は大阪教育大学卒業だった。どおりで自分と波長が合うネタだったわけだ。

[1]大吉ポッドキャスト,いったんここにいます! M−1グランプリの採点振り返りです。

2023年12月24日日曜日

6文字のDNA

DNAというと,55年前に高等学校の生物の時間に学んだところで知識が留まっている。4つの塩基が対になって並ぶことで,DNAの複製で情報が保たれるということ。3つの塩基情報が1つのアミノ酸に対応すること。くらいだ。

米島君はこの遺伝情報の伝達のところが一番重要なポイントだといっていたが,自分は,むしろ進化のところに興味があった。結局それもDNAによる遺伝情報の伝達に帰着したのかもしれないが,当時の高校の生物教科書ではそこまで深入りできるわけでもない。

1970年万博の太陽の塔の中を小松左京がデザインした生命の進化の樹ができるというので,すごく期待していたのだけれど,残念ながら,乃村工藝社が作ったような(そうかどうかは知らない)期待外れのモックアップが並んでいた。

DNAの塩基の種類が4でないとどうなるか,これまで考えたこともなかった。「4文字のDNAを6文字に拡張してセントラルドグマを騙す研究」という怪しい記事に出会った(が真面目な論文[1]だった)。そうか,その手があったのか。

論文のアブストラクトをDeepLで訳して,Bardで要約すると前半は次のようなことだった。
人工的に拡張された遺伝情報システム(AEGIS)は、DNAに新たな塩基対を追加したものです。この新たな塩基対は、天然の塩基対と異なる水素結合パターンを持っています。そのため、RNAポリメラーゼによって認識され、処理されるかどうかは不明でした。

 この論文では、大腸菌のRNAポリメラーゼが、6文字に拡張された遺伝システムにおいて、非天然型核酸塩基を選択的に認識することを示しました。高分解能低温電子顕微鏡構造から、AEGISと天然塩基対の認識の背後にある共通の原理が明らかになりました。
このとき,ATGCにBSが追加されることになる。この主の研究は古くからあって,いくつかの可能な塩基ペアが見つかっているらしい。DNAとして機能するためには,複製,転写,翻訳の3つの機能が実現されル必要がある。新しい塩基を含む3塩基組に対応する転写RNAとアミノ酸があって,これまでになかった高機能なタンパク質が生成されるという段階には達していない。

もし,DNAに6塩基対を持って自己増殖できるあらたな生命体系が創造されたらどうなるだろうか。AGIがそのような新しい生命の創造神となるのだろうか。


図:DNAからタンパク質合成へ(KEK物質構造科学研究所から引用)


[1]A unified Watson-Crick geometry drives transcription of six-letter expanded DNA alphabets by E. coli RNA polymerase(Nature)

2023年12月23日土曜日

わが街,道頓堀

諸般の事情から,一人で松竹座の芝居にいく。

久しぶりの大阪市内だが,晴れていてなんとか寒さもしのげた。いつのまにか,角のはり重のビフカツサンドが2980円になっていた。10年ほど前に,最初に手にしたときは1500円くらいだった。いつのまにか倍になってしまった。ちょっともう食べられないか。

観劇したのはわかぎゑふの「わが街,道頓堀」という現代劇で,1970年の万博直前の大阪の雰囲気を描いたものだ。お客さんは若い女性が中心で,松竹座の2階のトイレがすべて女性用に設定されていた。松竹座開場100周年記念ということで,道頓堀あたりの商店や名物が実名でたくさん登場している。おだやかな芝居だったがなかなかおもしろかった。小松左京の名前が出たのは,わかぎゑふが関西のSF界と関係が深かったということ?

劇中で落語家の役をしていたのが笑福亭銀瓶だったというのは,終演後にパンフレットを見てからやっとわかった。売店で自著が販売されていますと宣伝していたところで,誰かなと思った。現実の2025万博前の状況は,当時1970万博前に比べるとよくもわるくも生ぬるいことになっている。大阪の行政を皮肉りつつも,当時の反対論を未熟な学生さんの反抗だけで描写しているのは,ちょっといただけないが,まあ,こんなものか。

描かれていた大阪は,自分が阪大への進学を機に暮らすようになった時代や場所そのものである。天牛書店などの古書店を巡って,頻繁に道頓堀に通っていた頃なので,当時の空気が懐かしい。


さて,すーちゃん,むぎちゃんと,かざちゃんのプレゼントを探して,デパートや新しくなったHANDSや書店などを何箇所も回ったけれど,どうにもこうにもピンと来ないので挫折してしまった。前回の万博から55年経った大阪の街には,モノと情報はあふれているのだけれど,なんだかまったく楽しくないのだった。いや,それとこれは話が違うのだけれど・・・,どうやらお母さん達に直接希望を聞いたほうがよさそうである。

2023年12月22日金曜日

astropy

Pythonで太陽系の天体位置を描画してみる」というのを見つけた。python上の天文学統合データ処理環境であるastropyというライブラリを使うものだ。

jupyter lab を起動して,さっそく試してみると,いきなりmatplotlibが見つからないというところでつまづいた。以前に試したpythonのコードでは,matplotlibを読み込んでちゃんと作図がでてている。その古いコードでもエラーがでてきた。

macbook air の環境は,基本的にはhomebrew で更新しているので安心できるのだが,問題は,python環境である。python は3.9〜3.12までの複数のバージョンが同居することになっている。これは基幹ソフトなので,下手に古いものを消してしまうとややこしいのだ。そこで,一般には,python環境を指定するpyenvとかvenvで仮想環境を設定した上で,様々なライブラリを加えていくことになる。

が,ですね,それはそれで面倒なので,アドホックにバージョンアップを繰り返しながら,pip install ホゲホゲをつづけているために,わけわかめ状態になっている今日この頃なのだ。jupyterlabもバージョンが上がるたびに,見えなくなってしまうので,毎回 brew link jupyterlabを繰り返す始末だ。70歳になると,自分の体の中のDNA情報システムだけでなく,外の電子情報システムまで老化が進んでくるということだ。

まあ,macOSの場合は,機種更新の際に新規インストールすればそれなりに,なんとかなるかもしれないけれど,複雑な記録や認証情報を引き継ぐのは厄介だ。特に,iOSでは,指紋認証を含め,現金が動く認証アプリがウヨウヨいるので,次期機種更新のことを考えただけで気が遠くなりそうだ。


話を戻して,astropyについて。jupyter環境でpython kernelを立ち上げているところから,!エスケープで!pip listをやってみると,matplotlibは存在している。!pip install matplotlib でも致命的エラーはでない。ChatGPTに相談してみると,カーネルがどうなっているか確認せよとのこと。
 jupyter kernelspec list
  python3              /opt/homebrew/Cellar/jupyterlab/4.0.9_2/libexec/lib/python3.12/site-packages/ipykernel/resources
  julia-1.9            /Users/koshi/Library/Jupyter/kernels/julia-1.9
  maxima               /Users/koshi/Library/Jupyter/kernels/maxima
  wolframlanguage12    /Users/koshi/Library/Jupyter/kernels/wolframlanguage12
はいはい,表に見えていたのは python3.11.6だったけれど,実は,python.12.1が使われており,ここにはmatplotlibが入っていませんでした。さっそく,このポイントで,matplotlibとかscipyとかastropyとかpytest-astropyとかをpipでインストールした。別の参考資料に指示があった,astropyが正しく導入できているかどうかのテストも,試行錯誤の後にOKとなった。

   cd /opt/homebrew/Cellar/jupyterlab/4.0.9_2/libexec/bin

   ./pip install astropy

   ./pip install ephem

import astropy as ap
>>> ap.test()
platform darwin -- Python 3.12.1, pytest-7.4.3, pluggy-1.3.0

Running tests with Astropy version 6.0.0.
Running tests in lib/python3.12/site-packages/astropy.

Date: 2023-12-19T22:26:53
Platform: macOS-14.2-arm64-arm-64bit
Executable: /opt/homebrew/Cellar/jupyterlab/4.0.9_2/libexec/bin/python
Full Python Version: 
3.12.1 (main, Dec  7 2023, 20:45:44) [Clang 15.0.0 (clang-1500.0.40.1)]
encodings: sys: utf-8, locale: UTF-8, filesystem: utf-8
byteorder: little
float info: dig: 15, mant_dig: 15

Package versions: 
Numpy: 1.26.2
Scipy: 1.11.4
Matplotlib: 3.8.2
h5py: not available
Pandas: not available
PyERFA: 2.0.1.1
Cython: not available
Scikit-image: not available
asdf-astropy: not available

Using Astropy options: remote_data: none.

rootdir: /opt/homebrew/Cellar/jupyterlab/4.0.9_2/libexec
plugins: astropy-0.11.0, remotedata-0.4.1, hypothesis-6.92.1, cov-4.1.0, filter-subpackage-0.1.2, astropy-header-0.2.2, anyio-4.1.0, mock-3.12.0, doctestplus-1.1.0, arraydiff-0.6.1
collected 28085 items / 5 skipped  

-- Docs: https://docs.pytest.org/en/stable/how-to/capture-warnings.html
========== 27425 passed, 425 skipped, 240 xfailed, 80 warnings in 184.56s (0:03:04) ===========
<ExitCode.OK: 0>
ところが,やっぱりもとの太陽系の天体位置描画が動かない。最後に,Animation関数中のblit=False をblit=Trueにしてようやく何か表示されてほっとしたが,そこまでで内部にエラーがあるとのメッセージが出て異常終了してしまった。チーン。


図:ここまでは出たけれどアニメーションにはなっていなかった残念な図

astropyはイメージ処理やデータ処理を本業とした,プロ用の本格的なシステムだった。

2023年12月21日木曜日

リザーバー・コンピューティング

脳オルガノイド計算からの続き

これは,リザーバー・コンピューティングについて,Bardに聞いてChatGPTに和訳してもらった解説だ。質問者(自分)のスペルが reserverと間違っていたけれど,修正して答えてくれた。このレベルになると,どの程度フェイク成分があるのかが判別できない。

Q:Please explain about reservoir computing.

A:Bard + ChatGPT
Reservoir computing(リザーバーコンピューティング)は、再帰ニューラルネットワークに着想を得た比較的新しい計算フレームワークです。この手法は、入力信号をリザーバーと呼ばれる固定された非線形システムのダイナミクスを使用して、高次元の計算空間にマッピングすることによって機能します。このリザーバーは、水のバケツや回路などの物理的なシステムであるか、微分方程式の系などの数学的なモデルであることができます。

その後、リザーバーの出力は線形の読み出し関数を使用して読み取られます。この読み出し関数は、リザーバーの状態と所望の出力との関係を学習するためにトレーニングできます。

図:リザーバーコンピューティングアーキテクチャ
(編者注: Rossello (2018)の図 [1] へ勝手にリンク引用しているBard)

リザーバーコンピューティングの利点の一つは、非常に効率的であることです。リザーバーは非常に単純であり、読み出し関数は比較的単純で速いアルゴリズムである線形回帰を使用して学習できます。これにより、低消費電力とリアルタイムのパフォーマンスが重要なアプリケーションに適しています。

リザーバーコンピューティングのもう一つの利点は、非常に柔軟であることです。同じリザーバーは、読み出し関数を変更するだけでさまざまなタスクを学習するのに使用できます。これにより、タスクが事前にはわからない場合や、タスクが時間とともに変化する場合に適しています。

リザーバーコンピューティングはまだ比較的新しい分野ですが、計算の仕方を革新する可能性があります。既に音声認識、画像認識、およびロボット制御など、さまざまなアプリケーションで使用されています。

以下はリザーバーコンピューティングに関するいくつかの追加の詳細です:

 ・リザーバーは通常、多くの内部状態を持つ高次元システムです。これらの状態は複雑な方法で相互作用し、リザーバーが非線形関数を計算できるようにします。

 ・読み出し関数は通常、リザーバーの状態の線形関数です。この関数は、所望の入出力関係の例などのトレーニングデータを使用して学習できます。

 ・リザーバーコンピューティングは、サポートベクターマシンやディープラーニングなどの他の機械学習技術と組み合わせて使用されることがよくあります。これにより、システムの精度とパフォーマンスを向上させるのに役立ちます。

Bard, Perplexity, Bing などは正確性を若干担保するために実在して関係あるURLへのリンクを提供しているが,それを埋め込み図の形で提供するのを見たのは初めてかもしれない。

以下は真正の参考文献:

2023年12月20日水曜日

脳オルガノイド計算

数日前,インディアナ大学のチームが,ヒト脳幹細胞から作成した脳オルガノイドをコンピュータ・チップに取り付けてAIツールに接続したシステム(Brainoware)で,初歩的な音声認識を含む,情報処理・学習・記憶ができることを実証したとのニュースが流れた。

ちょうど,しばらく前のNHKのフロンティア第2回「AI 究極の知能への挑戦」でも,脳を利用した計算チップの話が取り上げられていた。東大の池内与志穂准教授のグループが16点のプローブ上においた脳オルガノイドを2つ接続して,反応を観察する様子や,オーストラリアのBrett Kaganのグループの実験室の詳細な映像を見ることができた。

Kaganは,1970年代の最初期のコンピュータゲーム(アーケードゲーム)であるPON(ピンポンゲーム)をこの脳オルガノイドシステムにやらせていて,学習効率の高さを強調していた。すごくないか。


写真:脳オルガノイドチップ(左 F. Guo et. al. から,右 B. Kagan et. al. から引用)

2023年12月19日火曜日

モキュメンタリー

WOWOWで放映していた「ザ・モキュメンタリーズ 〜カメラが捉えた架空世界」を録画していたので,一気見した。

フェイクニュースが蔓延する昨今,「この番組では、現実の私たちと同じように、架空の世界で社会の変化に翻弄される人々を追い、現代社会で実際に起こっている出来事や社会の矛盾を、モキュメンタリーという手法をもって描くことで、真実に迫る。」とあるが,これぞ純正で良質なSFビデオ作品である。
ザ・モキュメンタリーズ ~カメラがとらえた架空世界~(各編30分)
 (編者注:丸括弧内はこちらで付加したキーワード)
#1 「インビジブル・ブルース」(透明人間皮膚移植・マイノリティー)
#2 「(株)わたし」(個人の公開株化「株式人間」・人間の価値)
#3 「WORD HUNTER」(言語省・言語取締官・不正日本語取締法)
#4 「マイナースポーツ・未来の星」(スルーイング・東西日本国)
#5 「ドローン・クライシス」(脱法人工知能搭載野良ドローンとマタギ)
#6 「ハラハラ♥ハラスメント」(ハラスメントバッチ・自由恋愛タブー)
#7 「冷凍睡眠ビジネスの闇」(家庭用冷凍睡眠カプセル)
#8 「仮想俳優A」(フルCGの俳優・最明寺アキラブーム)

本物のドキュメンタリーのような形式で製作されているうえ,非常にていねいなシュミレーションがされているため,うっかりしていると現実と混線してしまいそうになる。放送時間の関係で星新一のショートショートレベルの掘り下げとなり,問題をそこまで深刻に描いているわけではないけれど,ドキュメンタリーの力がこれらにリアリティをもたらす効果は大きい。

各編に出てくる日付が2020年のオーダーだったので調べてみると,最初に放送されたのは2021年の3月・4月だったようだ。なお,モキュメンタリーという言葉は普通名詞だった。


写真:ザ・モキュメンタリーシリーズのタイトルバック(WOWOWから引用)

この延長線上になる「PORTAL-X 〜ドアの向こうの観察記録〜」が2024年1月から8回放送されるそうで,こちらも楽しみ。

2023年12月18日月曜日

モーリーの定理

真鍋さんのウェブサイトMIPOのブログには,算数・数学コラムというのがあって,おもしろい算額の問題などがしばしば取り上げられている。

で,先日モーリーの定理という,三角形の内角の三等分線がつくる図形が正三角形になるという問題を証明していた。なるほど。図形の問題は苦手なので,解析幾何学の手法でできないか考えてみた。

1辺と両端の2角を与えれば三角形は定まる。現れるすべての座標はその辺の長さに比例するので,辺の長さAB=1とする。∠A=$3\alpha$,∠B=$3\beta$,∠C=$3\gamma$とすると,$\gamma = \frac{\pi}{3}-\alpha-\beta$で定まる。結局全ての量が2つの角度$\alpha,\beta$で表される。

これは実は問題の対称性を損ねるので,標準解答と比較しても良策ではないのだけれど,乗り掛った舟なのでやってみる。


図:モーリーの定理の証明

まず三角形ABCの頂点Aを原点(0,0)とし,頂点Bを(1,0)とする。このとき頂点C$(p,q)$は,$y=\tan 3\alpha$と$y=-\tan 3\beta (x-1)$の交点として求まり,$(p,q) =\Bigl( \dfrac{\tan3\beta}{\tan3\alpha+\tan3\beta},\dfrac{\tan3\alpha \tan3\beta}{\tan3\alpha + \tan3\beta} \Bigr)$となる。

同様にして,∠の三等分線の交点として(P,Q,R)の3点求めればよい。

(1) ABからの三等分線の交点P
$y=\tan \alpha\ x \ \&\  y = -\tan \beta\ (x-1)\ $の交点は,
$(p_1,q_1) =\Bigl( \dfrac{\tan\beta}{\tan\alpha+\tan\beta},\dfrac{\tan\alpha \tan\beta}{\tan\alpha + \tan\beta} \Bigr)$

(2) ACからの三等分線の交点Q
$y=\tan 2\alpha\ x \ \&\  y = -\tan (3\beta+2\gamma)(x-p)+q\ $の交点は,
$(p_2,q_2) =\Bigl(\dfrac{p \tan(3\beta+2\gamma) + q}{\tan2\alpha+\tan(3\beta+2\gamma)},\dfrac{\tan2\alpha \{p \tan(3\beta+2\gamma)+q\}}{\tan2\alpha + \tan(3\beta+2\gamma)}\Bigr)$

(3) BCからの三等分線の交点R
$y=-\tan 2\beta\ (x-1) \ \&\  y = -\tan (3\beta+\gamma)(x-p)+q\ $の交点は,
$(p_2,q_2) =\Bigl( \dfrac{p \tan(3\beta+\gamma) -\tan2\beta + q}{\tan(3\beta+\gamma)-\tan2\beta}, -\dfrac{\tan2\beta\{(p-1) \tan(3\beta+\gamma)  +q\}}{ \tan(3\beta+\gamma) -\tan2\beta } \Bigr)$

これから3点の距離を計算すれば良いのだけれど,ちょっと人間の手には負えなかった。
Mathematicaで計算すると,なんとか確認することができた。

In[1]:= c[a_, b_] := Pi/3 - a - b

In[2]:= p[a_, b_] := Tan[3 b]/(Tan[3 a] + Tan[3 b])
q[a_, b_] := Tan[3 a] Tan[3 b]/(Tan[3 a] + Tan[3 b])

In[3]:= p1[a_, b_] := Tan[b]/(Tan[a] + Tan[b])
q1[a_, b_] := Tan[a] Tan[b]/(Tan[a] + Tan[b])

In[4]:= 
p2[a_, b_] := (p[a, b] Tan[3 b + 2 c[a, b]] + q[a, b])/(Tan[2 a] + Tan[3 b + 2 c[a, b]])
q2[a_, b_] := 
 Tan[2 a] (p[a, b] Tan[3 b + 2 c[a, b]] + q[a, b])/(Tan[2 a] + Tan[3 b + 2 c[a, b]])

In[5]:= 
p3[a_, b_] := (p[a, b] Tan[3 b + c[a, b]] - Tan[2 b] + 
    q[a, b])/(Tan[3 b + c[a, b]] - Tan[2 b])
q3[a_, b_] := -Tan[
    2 b] (((p[a, b] - 1) Tan[3 b + c[a, b]] + 
      q[a, b])/(Tan[3 b + c[a, b]] - Tan[2 b]))

In[6]:= (p1[a, b] - p2[a, b])^2 + (q1[a, b] - 
     q2[a, b])^2 - (p2[a, b] - p3[a, b])^2 - (q2[a, b] - 
     q3[a, b])^2 // Simplify

Out[7]= 0

In[8]:= (p2[a, b] - p3[a, b])^2 + (q2[a, b] - 
     q3[a, b])^2 - (p3[a, b] - p1[a, b])^2 - (q3[a, b] - 
     q1[a, b])^2 // Simplify

Out[9]= 0


[1]三角形の外角の三等分線の場合(時岡郁夫さん)

2023年12月17日日曜日

情報伝達活動の構造(2)

情報伝達活動の構造(1)からの続き

そもそも,年齢によって,職種によって,個人の生活スタイルによって,まったく異なるものを平均しようというのに無理がある。


図:一日の時間と情報伝達活動のモデル

会話行動に関する調査からは,平均会話時間が6時間と出てくる。ただ,会話密度が変われば,発話・受話量はまったく変わってしまうことになるが,図ではその値を書き込んだ。

TVとネットの視聴時間がそれぞれ3時間で計6時間という「情報通信メディアの利用時間と情報行動に関する調査報告書」の結果も反映しているが,ネットでのアウトプットを2時間分加えてみた。これも他の作業と並行・重複していたりで,集中度によってその内容は大きく影響される。

身体活動を中心とした労働の場面では,会話やネットでやりとりされる情報密度はずっと少ないかもしれないし,オフィスワークや対人活動が主となる仕事ならば,逆にさらに情報密度が高まるかもしれない。

これを解決するには,典型的なモデルを複数設定して,そこでの平均を提示することだ。実証的な研究に繋げるためには,GoProのようなアクションカムを24-8時間装着して,その活動を記録して分析すればよいことになる。ありそうだけれで適当な論文は探しきれていない。

総務省の情報通信政策研究所の情報流通インデックス研究会の報告書では,流通するメディア情報については客観的な指標が設定されている。問題は,これを各個人レベルに落とし込んだときの,有効な吸収率や反射率がどうなるかということ。




2023年12月16日土曜日

情報伝達活動の構造(1)

からの続き

りんちゃんの「棒」は「—」や「|」の問題だった。そうすると答えが変わってくる。
頻度の高い漢字の平均画数が7画程度で,これを棒の数とします。児童・生徒・学生の間は1日100字書いたとして(PCなど除く)10年間≒3000日では,〜30万字程度漢字をかくことになるので,〜200万画くらいかな。
1画5mmだとすれば,200万画は1000kmである。鉛筆1本で 50kmかけるらしいので,鉛筆20本あれば十分だ。ホントか,削りながらの場合は1000本くらいになりそうだ。ジェットストリームのSXR-07では替え芯1本で700mということだから,1400本なのか。


で,あらためて自分が行う情報活動の入出力量について,どの程度になるのか気になった。
のシリーズで半年前に少し考えていたことだけれど,再度見直してみる。

まず,定量的なデータについて考察する前に,個人の情報伝達活動を整理してみた。

図:情報伝達活動の構造

一番下の意識主体が,一人の人だとする。一般化できるように意識主体としている。これが,情報をやり取りするのだけれど,その情報伝達の様態を,(A)入力,(B)出力,(C)対話に分類する。(A)と(B)だけでも十分かもしれないが,あえて独立に(C)という連続的な入出力モード=対話を考えてみる。

また,その情報伝達の対象は,(イ)個体(これも個人=一人の人でもよいが,少し一般化した),(ロ)集団(組織でも社会でもよい),これまたあえて独立に(ハ)AI,を設定した。やりとりされる伝達情報の形態は,(1)静的データ(テキストや図画像),(2)動的データ(音声・音楽,動画),(3)実世界(対面による物理的化学的な接触を含む)とする。(1)と(2)ではメディアを媒介する視聴覚情報だけにフィルタされている。

都合,3×3×3=27通りのパターンに分類できる。技術的な問題を考える場合には,情報伝達の形態を図の右囲みのようにさらに7項目に細分化して考えることもできる。

(例)会話=(イ・ロ,C,3),手紙=(イ,A・B,1),電話=(イ,C,2),
ラジオ・テレビ・映画=(ロ,A,2),SNS=(ロ,A・B,1),VLOG=(ロ,B,2),演劇・音楽=(ロ,A,3),演説・講演=(ロ,B,3),生成AIチャット=(ハ,C,1)

2023年12月15日金曜日

Duolingo

今年の春に始めた iPhoneアプリDuolingoでの韓国学習である。

最近は,朝起きて新聞とテレビのニュースをチェックした後に,Duolingoで韓国語のレッスンをするのが日課になっている。iPhoneの先週のアクセスログをみると,一日平均3時間のうち,Facebookが45分,Duplingoを30分,Pikmin Bloomが20分,GoogleとLineが15分ということになっている。

単語の表記と発音と意味,韓国語の和訳あてはめ,韓国語読み上げのハングルあてはめ,日本語の韓国語訳ハングルあてはめ,など15問ほどで1セットである。単語ごとにヒントを確認できるので,覚えていないあるいは理解できていなくても,勘だけで何となく答えられてしまう。いいようなわるいような。

ヒント頼りなので,ほとんど実力がつかない。ハチマン,毎日繰り返していると記憶に残る単語も少しはあるので,韓国ドラマを見ていても,以前よりは意識に引っかかる会話が増えてきた。


図:今年11月30日時点のDuolingoの成績(実はソコまで出来ていない)

2023年12月14日木曜日

フェイスブックで,芳賀さんが息子のりんちゃんから受けた質問について書いていた。

人生でどのくらい,文字の「」を書かないといけないか」という趣旨のものだ。なぜその質問がでてきたのかはよくわからない。なぜ「棒」なのかな。書くのが面倒だからなのかな。そういう話ではないのかな。犬も歩けば棒にあたったのかな。

準備のための一般論
 モノゴコロついてから惚けるまで,およそ75年≒900ヶ月≒3900週≒2万7千日≒66万時間≒3900万分≒24億秒あるとする。このとき,人生におけるある事象の頻度と総数はおよそ次のように対応する。
 10年に 1回 〜 10回
   3年に 1回 〜 30回
   1年に 1回 〜 100回
  年に 4回 〜 300回
  月に 1回 〜 1000回
  週に 1回 〜 4000回
   3日に 1回 〜 1万回
   1日に 1回 〜 3万回
   1日に 3回 〜 10万回
名前との比較
 一生の間に自分の名前はどのくらい書くだろうか。宅配のサインも含めて週に1回よりは多いような気がするので,多分1万回のオーダーになる。「棒」はこれよりは2桁以上少ないのではないか。100回ほどか

ブログの計量
 自分のブログであるOn a Thread of the Webの5年分のデータを全文検索してみると,「棒」は16回ヒットした。つまり,最近は年平均に3回ということになる。75年をかけると,生涯では 200回 程度書くことになるのではないか。

生成AIの考え
Q(私):日本人が一日に書く漢字の数は400字程度です。一生には,1000万字程度の漢字を書くことになるでしょう。このうち,「棒」という漢字を書く回数は何回程度だと推定されますか?
A(Claude):
はい、ご指摘の通り、日本人が一生のうちに書く漢字はおよそ1000万字とされています。このうち、「棒」という漢字が何回含まれるかを推定するため、次のように考えます。日本語の漢字使用頻度データによると、「棒」の出現頻度は0.0026%,1000万字の0.0026%は2600字。したがって、一生のうちに書く漢字1000万字のなかで、「棒」という漢字が含まれる頻度はおよそ2600回と推定されます。
なお,Copilotが4690回,Perplexityが4800回,Bardは200万回,ChatGPTは10億回と答えた。(注)上記の仮定である1日に400字というのは,手書きだけではなくて,SNSなどでのスマホやPCにおけるデジタル入力も含めたつもりだけれど,どうだろうか。

漢字出現頻度
 ClaudeやPerplexityは,漢字の出現頻度という量を持ち出してきた。Perplexityでは,0.0048%とされた。そんなデータがあるのかと検索してみた。令和1年に文化庁の漢字出現度数調査というレポートがある。出現確率ではなく,出現順位が与えられている。棒は1200位あたりで,結構高頻度で出現する文字だった。もう少し調べてみると,mwSoft Blog[1]というサイトが見つかった。2012年6月Wikipediaデータにおける出現漢字をまとめたものだ。このデータを拝借すると,「棒」は1375位で38,285回/528,530,037回(上位3000字の総計)=0.00724%=724回という結果が得られた。

結論
 平均的な人が「書く」漢字の「棒」は,100回〜1000回程度じゃないでしょうか。

参考(学校で棒が出てくる場面)
 棒読み。棒暗記。棒立ち。棒グラフ。棒磁石。乳棒。制御棒。溶接棒。指揮棒。鉄棒。棒高跳び。段違い平行棒。棒球(だま)。綿棒。編み棒。棒針。相棒。泥棒。片棒。棒ダラ。アメン棒。お先棒。棒切れ。火かき棒。金棒。警棒。用心棒。こん棒。ゲバ棒。点棒。

P. S. このページだけで12年分くらいの「棒」を書いてしまった。


写真:画像生成AIがイメージしている「棒」(Diffusion Beeより引用)


2023年12月13日水曜日

Gemini

12月6日に,Googleから新しいマルチモーダルの生成AIモデルのGeminiが発表された。

宣伝のYouTubeビデオクリップでは,絵や写真を見せながら対話している様子がデモンストレーションされていて,かなりレベルが高そうだったのだが,フェイク(再現モデル)疑惑がでてきているので,どうだかよくわからない。

Google Bardのチャットページから使えるが,自分のgoogleアカウントの言語モードを英語にしておく必要があった。現時点で使えるのは,Gemini Pro であり,ChatGPT 3.5レベルのものなのだ。評判ほどではなく,これまでの体験と大きく変わることはない。というわけで,最近は,[ChatGPT3.5,Bard,Claude,Perplexity,Bing]の5つを組み合わせて試している。問題ごとに,良くできる子とイマイチな子に別れる。課金してChatGPT 4.0に復帰するだけの動機もまだない。


図:Geminiのイメージ(Google Japan ブログから引用


2023年12月12日火曜日

四角形

三角形(3)からの続き

小学生の問題から離れられない。

長方形($a \times b$)があって,その1つの角が小さな長方形($p \times q$)の形に欠けている。この図形の面積を2等分する直線を求めよというものだ。問題では辺の長さの情報が与えられていない。どうするのかと思って解答をみた。それは,与えられたL型の図形を2つの長方形の組み合わせとみなし,それぞれの長方形の中心点を結ぶ直線を引けばよいというものだ。なるほど,小学生でも理解できる。この直線の図形内の中点を中心に,図形の角を越えない範囲で直線を回転させればそれらも解になる。

ところで,その欠けた部分が大きくなると,この方法ではうまくいかない。というのも直線で分割される角の欠けた側の領域が連結領域ではなくなり,バラバラになってしまうからだ。これを避けるためには,欠けた側と反対側の角を通る直線で,面積が等しくなるものを探せば良い。中学生レベルの問題になる。


図:直線APによる四角形の面積の二等分($\frac{a}{b}>\frac{p}{q}$の場合)

直線ACは四角形ABCDの面積をS1(△)とS2(△)に2等分するが,左図形から引き去る部分は台形CEFR,右図形では三角形CGRなので,S1(左) <  S2(右)となる。そこで,分割線をAPにずらせば,S(左)=S(右)となる点が見つかるはずだ。

ずらす距離PC=$x$とおいて立式すると,$2S_1 = b(a-x)-q\bigl\{ 2(p-x)+\dfrac{q(x-a)}{b}\bigr\}$,$2S_2 = (b-q)\bigl\{ a+\dfrac{x(b-q)+aq}{b}\bigr\}$となる。これを等しいとして$x$を求めると,$x=\dfrac{q(a q- b p)}{(b-q)^2}$と求まった。

めでたしめでたしというところだ。ところで,$\frac{a}{b}=\frac{p}{q}$でもとの四角形と切り欠きの四角形が相似となる。このため,最初の対角線が2等分線となって$x=0$になる。ということは,$x<0$の場合が出てくるということか。おかしいのでしばらく悩んだ。

良く考えると,この場合は,欠けた図形の角が対角線より右側になるので,P点はCG上に持ってきてCP=$y$と置く必要がある。すなわち,この場合は,$a$と$b$,$p$と$q$を入れ替えて同じ式を解くことになるので,$y=\dfrac{p(b p- a q)}{(a-p)^2}$とすればよいことになる。