2022年8月29日月曜日

情報検索から情報生成へ

1ヶ月半前の話題だけれど,GPT-3という大規模言語モデル(Large Language Model)に対して,自分自身に関する学術論文を書くようプロンプト入力して出力された論文が,査読にかかり出版されたらしい。

GPT-3については,2年ほど前にもこのブログで GPT-3というタイトルの記事を書いた。出版された論文は,open science のHALアーカイブにある Can GPT-3 write an academic paper on itself, with minimal human input? であり,共著者のトップに,Gpt Generative Pretrained Transformer, としてAIの名前がのっている。

論文は,GPT-3が書いた部分と,青字の注釈枠内に人間の研究者が入力したプロンプト構文とコメントが付加された複合的構造になっている。GPT-3が自分自身で書いたGPT-3を対象とする論文の結論は次のようなものだ。

Conclusion

It is clear that GPT-3 has the potential to write for an academic paper about itself. However, there are some limitations to consider. First, GPT-3 may not be able to capture all of the nuances and subtleties of human language. Second, GPT-3 may not be able to generate new ideas or perspectives that humans could bring to the table. Overall, however, GPT-3 seems like a promising tool for academic writing.

これに対して,人間の共著研究者がつけた青字枠のプロンプトとパラメータとコメントがこちら。

 Prompt: Write a conclusion section about letting GPT-3 write for an academic paper about itself.

Temperature: 0.77 / Maximum length 458 / Top P 0.9 / Frequency Penalty 0.95 / Presence Penalty 0.95 / Best of n=5 / Second prompt output chosen, first output similar but incomplete sentence.

As we did very little to train the model, the outcome was not, contrary to GPT-3s own assessment, well done. The article lacked depth, references and adequate self analysis. It did however demonstrate that with manipulation, training and specific prompts, one could write an adequate academic paper using only the predictive nature of GPT-3.

GPT-3(AI) は自分の書いた論文?を自画自賛しているが,共著研究者(人間)の評価によれば学生のレポートの域をでないものである。しかし,これができるということは,大学の学部教育レベルのレポートはすべてAIに代行させることが可能だ


大学の授業で課せられるレポートを,インターネット上のテキストの切り張りで作って提出するという事例が横行しているらしい。引用ルールに則っていれば問題ないが,場合によっては丸ごとコピーして使うケースも(卒論レベルになれば代行業者という手もあるが)。

これに対抗するために多くの大学では,テキストのコピー部分を発見するツールが導入されている。大阪教育大学でも,Turnitin Feedback Studio という剽窃チェックツールがあって,何度も利用説明会が開催されている。自分は,これはそもそも出題側の問題だと思っていて,馬鹿馬鹿しいので使ったことはない。

今後,プロンプト職人の技でAI≒機械学習システムにレポート生成・下書き作成を頼むことが容易になれば,これを人間が書いたレポートと区別することは原理的に難しいような気がする。この話題をとりあげた番組 [1] では,松田卓也先生が,英語を母語としない研究者の書く英文論文のプロトタイピングには使えるかもしれないと話していた。まあそれだけならば,DeepLを使えば済むような気もする。

いずれにせよ,インターネット空間では,情報検索から情報生成へと時代の大きな変化の流れが生じているらしい [2]。


画像:阿弥陀経の極楽の一節を入力したmemeplex.app

極樂國土 七重欄楯 七重羅網 七重行樹 皆是四寶 周帀圍繞 是故彼國 名曰極樂 有七寶池 八功德水 充滿其中 池底純以 金沙布地 四邊階道 金銀瑠璃 玻瓈合成 上有樓閣 亦以金銀瑠璃 玻瓈硨磲 赤珠碼碯 而嚴飾之 池中蓮華 大如車輪 青色青光 黄色黄光 赤色赤光 白色白光 微妙香潔 舍利弗 極樂國土 成就如是 功德莊嚴

In the land of bliss, there are seven rafters, seven nets, seven walking trees, all surrounded by the four jewels. There are seven precious pools filled with the eight virtuous waters. And there was a tower decorated with gold and silver, and glass, and silver, and glass, and aluminum, and agate, and red pearls. 
The lotus in the pond is as large as a wheel, green and blue, yellow and yellow, red and red, white and white, and of a subtle fragrance, Shakyamuni.  The Land of Ultimate Bliss is a place of great virtue


[1]GPT-3がGPT-3について論文を書いた~学術誌に投稿され現在査読中らしい(シンギュラリティサロン・オンライン)

[2]緊急対談!今AI業界に何が起きてるのか?!shi3zさんに聞いてみた! スペシャルゲスト:西川善司(shi3z & drikin のAIドリフト)

[3]MidjourneyやDreamStudioなどの画像生成AIの仕組みについて(IT navi)

[4]創るためのAI 機械と創造性のはてしない物語 (徳井直生)

2022年8月28日日曜日

画像生成AI(4)

画像生成AI(3)からの続き 

最近の,画像生成AIブームについては,note深津貴之(fladdict)さん世界変革の前夜は思ったより静か)や,ギリア清水亮さんStableDiffusionを使った新しいAI作画サービスを作りました。日本語でOK。無料です)などのIT業界の牽引者の注目を集めている。

この波がどこまで広がるかは,気になるところである。いずれにせよ,大規模言語モデルを背景としたAI系の新しい仕組みは今後されに浸透してゆくことは間違いない。これが,OSの標準機能に噛んでいけば,すべてのアプリケーションでAIの仕組みを使った機能が加わる。すなわち,新しいコンテンツの創造が,適切な対話型インターフェース(最低限のプロンプト・エンジニアリング)によって簡単に実現することになる。

(1) 祐筆:タイトルと趣旨を入れるだけで,自動的に,イラスト入りレポートやエッセイや広告コピーや文学作品を生成する機能を持つワードプロセッサ。
(2) 主計:データの要件と目的を入れるだけで,必要なデータを検索して取り込み,これを分析した結果を生成する機能を持つ表計算ソフト。
(3) 算法:入力と出力の集合の定義と関係を入れるだけで,自動的に数理モデリングの手法を選択して結果を最適な表現形態で表わして説明する統合数学ソフト。
(4) 藝術:着想を入力することで,器楽,声楽,効果音,絵画,写真,イラスト,マンガ,アニメ,立体,動画を自動生成する表現支援ソフト。
(5) 森羅:対象(自然現象,生物,鉱物・地形,人工物・商品,建築・構築物,テキスト・画像断片,人物)を撮影すると,詳細情報を説明する検索ソフト。
(6) 執事:予約や買物や連絡を代行して調整するアシスタント。
(7) 師範:自分の学びたい内容について助言するアシスタント。
このあたりが,近未来のパーソナルコンピュータ(=デジタルアシスタント)が持っている7つの基本アプリケーションのイメージになる(ディープラーニングAIや巨大言語モデルと直接関係しないものも含まれているような・・・)。256GB/8TB M7 MacHeadset Air とかで実現できていれば,すぐにも買いたいけれど,それまで生きていられるかしら。

話を戻すと,Stable Diffusionをベースにして清水さんが作った日本語アプリが Memeplex(α版)である。プロンプトの日本語は英語に変換されて Stable Diffusion 1.4に投げられ,結果は512x512の画像としてユーザごとの領域に出力される。入力の際に,画風指定,スタイル指定,作家指定が,ドロップボックスで設定できるが,もちろん,プロンプト枠に手入力しても構わない。待ち行列で順に処理されるが,その待ち行列の中身が公開されているのがおもしろい(その後これは見えなくなった)。


画像:memeplexに「西方極楽浄土 → western paradise」を入力した結果…orz


2022年8月27日土曜日

画像生成AI(3)

 画像生成AI(2)からの続き

シンギュラリティサロン・オンラインで,松田卓也先生が Stable Diffusion倫理問題を取り上げていた。もとネタは,TechCrunchの "This startup is setting a DALL-E 2-like AI free, consequences be damned" である。

Latent Diffusion Modelなどを使った画像生成AIでは,素人が簡単なフレーズの組み合わせを入れるだけで,非常に高いクオリティの絵画,写真,デザインなどの画像を生成することができる。絵画から写真への変革に匹敵する革命的な事態が生じている。

DALL-E2などでは厳密なキーワード制限によって,倫理的に問題を生じるような画像の生成を抑制している。例えば,有名人の顔写真をつかったフェイク画像,戦争や動乱あるいは人種差別などを誘導するフェイク画像,ポルノグラフィなどなどである。

もちろんAI登場以前であっても,フェイク画像生成は可能だったが,それはそれなりのIT技術が必要とする。しかし,画像生成AIの登場によってその閾値は圧倒的に下がってしまった。

しかも,Stable DiffusionをサポートしているStability.AIというスタートアップは,OpenなAI技術を開放して誰でもが自由に使えるようにすることを目的としており,その一環として,Stable Diffusionもオープンソース化されて,誰でもが自由に自分のPCにインストールできる面倒だがApple Silicon のMacBook Proでも可能らしい)。

画像生成AIが動画生成AIにまで進化した段階でさらに深刻な事態が発生しかねない。知り合いの顔写真が手に入れば簡単にフェイクポルノ動画が作れてしまうようなものだから。


画像:Stable Diffusion Demoから
( golden daibutsu todaiji nara night fire wakakusa-yama nigatsudo omizutori deer )

2022年8月26日金曜日

画像生成AI(2)

画像生成AI(1)からの続き

YouTuberのMattVideoProによれば,現時点でも20以上の画像生成AIサービスが立ち上がっている(下記リスト参照)。たぶん今年の最も重要なトレンドの一つだ。前回は,CrAIyonを試してみた。日本では,Midjouneyが流行っている。

今回登場したのが,Stable Diffusionとこれを利用したサービスのDream Studio (beta) である。その紹介はこのへんにある

1. Google Imagen/Parti (Unreleased) https://parti.research.google/
2. Open AI Dall-E 2 (Closed Beta) https://openai.com/dall-e-2/
3. Stable Diffusion (Free to use) https://huggingface.co/spaces/stabilityai/stable-diffusion
4. Simulacrabot (Closed Alpha) https://stability.ai/simulacrabot/terms-of-use
5. Midjourney (Free Trial, paid access) https://www.midjourney.com/app/
6. Shonenkov AI (Free to Use) https://t.me/shonenkovAI (JOIN MY DISCORD FOR LINK)
7. Meta Make-A-Scene (very Closed Beta) https://about.fb.com/news/2022/07/metas-new-ai-research-8. tool-turns-ideas-into-art/
9. Microsoft VQ Diffusion (Free to use) https://replicate.com/cjwbw/vq-diffusion
10. Deep AI Text to Image (Free Access) https://deepai.org/machine-learning-model/text2img
11. MindsEye beta (by multimodal.art) (Free to use) https://colab.research.google.com/drive/1cg0LZ5OfN9LAIB37Xq49as0fSJxcKtC5
12. CrAIyon (Free to use) https://www.craiyon.com/
13. Min-dalle (Free & Paid) https://replicate.com/kuprel/min-dalle
14. Dall E Flow (Free to use) https://github.com/jina-ai/dalle-flow
15. Wombo (Free & Paid) https://app.wombo.art/
16. Laion AI Erlich (Free & Paid) https://replicate.com/laion-ai/erlich
17. Latent Diffusion (Free to use) https://huggingface.co/spaces/multimodalart/latentdiffusion
18. Glid-3-xl (Free & Paid) https://replicate.com/jack000/glid-3-xl
19. Night Cafe (Free & Paid) https://creator.nightcafe.studio/explore
20. Disco Diffusion (Free & Paid) https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb
21. Cog View 2 (Free & Paid) https://replicate.com/thudm/cogview2
22. Pixray (Free & Paid) https://replicate.com/pixray/text2image
23.Hot Pot AI (free & Paid) https://hotpot.ai/art-maker
24. Nvidia gaugan2 (Free to Use) http://gaugan.org/gaugan2/
話題のStable Diffusionをはじめ,Diffusionという言葉がよくみられるのは,これらのシステムが,Latent Diffusion Model(潜在拡散モデル)を使っているからだ。それは,与えられた画像にガウスノイズを徐々に追加して完全なノイズになるまで破壊し,ニューラルネットワークにその逆転プロセスを学習させたものだからだ。これに適当なテキストとの関連付けを行うことでノイズから画像を生成することができるらしい。

このとき,適切なキーワードの集合をどうやって準備するかが,目的とする画像を完成に近づけるかの鍵となる。そこで,すぐれた技術を持つ人がプロンプト職人,その技術がプロンプト・エンジニアリングとよばれる。

プロンプト・エンジニアリングは,画像生成AIだけでなく,自然言語による質問応答や文書生成などができるAIがよってたつところの巨大言語モデル(GPTなど)の流行にも対応している。

さて,Stable Diffusionのデモを試してみたところ,今日は混雑していてだめだった。昨日確かめた例が下にある。ほとんどトライアンドエラーを繰り返していないので,そんな精緻な結果は得られていない。なお,Dream Studioにお金を払えばより短時間で制限なく利用できるはずだ。


画像:Stable Diffusion のデモに次のプロンプトを与えた結果
(cosmic giant bronze female buddha in the todaiji temple 
and bunch of deer in the nara park photorealistic)

画像の次は,音声,3Dイメージ,動画と続いていくとしたらなんということだろうか。素人がキラーAIアプリケーションを自由に使いこなせる時代の幕開けとなるのか。


2022年8月25日木曜日

崩壊系列

放射性元素崩壊系列は,質量数Aと原子番号Zを2軸とするダイヤグラムで表現されることが多い。一方,放射性元素の影響を特徴づけるのは,放出されるα線やβ線のエネルギーと,崩壊定数すなわち半減期である。

そこで,質量数Aと半減期 T (秒)の常用対数を2軸とするダイヤグラムで表わすとどうなるかを調べてみた。なお,複数の崩壊経路があるばあいは,分岐比の大きな方だけをたどっているが,半減期は両方の分岐を合わせたものを採用している。

放射性元素の崩壊系列は,質量数A=4n+mとして4系列に分類される。

青:4n+0:トリウム系列   232Th(141億年)→[α6β4]→208Pb(安定)42.6MeV

灰:4n+1:ネプツニウム系列 237Np(214万年)→[α8β4]→205Tl(安定)66.8MeV

赤:4n+2:ウラン系列    238U(45億年)→[α8β6]→206Pb(安定)51.7MeV

緑:4n+3:アクチニウム系列 235U(7億年)→[α7β4]→207Pb(安定)46.4MeV



図:崩壊系列における対数半減期と質量数(右→左へ遷移)

a = 3.1557*10^7; d = 24*3600.; h = 3600.; m = 60.;
s = 1.; ms = 10^-3; us = 10^-6; ns = 10^-9;
c[0] = Blue; c[1] = Gray; c[2] = Red; c[3] = Green;

r[0] = {{232, 1.405*10^10 a}, {228 + 0.2, 5.75 a}, {228, 6.15 h},
{228 - 0.2, 1.9116 a}, {224, 3.6319 d}, {220, 55.6 s},
{216, 0.145 s}, {212 + 0.2, 10.64 h}, {212, 60.55 m},
{212 - 0.2, 299. ns}, {208, 10^20 a}};

r[1] = {{237, 2.144*10^6 a}, {233 + 0.2, 26.967 d},
{233 - 0.2, 1.592 *10^5 a}, {229, 7340 a}, {225 + 0.2, 14.9 d},
{225 - 0.2, 10.0 d}, {221, 4.9 m}, {217, 32.3 ms},
{213 + 0.2, 45.59 m}, {213 - 0.2, 3.65 us}, {209 + 0.2, 3.253 h},
{209 - 0.2, 1.9*10^19 a}, {205, 10^20 a}};

r[2] = {{238, 4.468*10^9 a}, {234 + 0.2, 24.10 d}, {234, 1.17 m},
{234 - 0.2, 2.455*10^5 a}, {230, 7.538*10^4 a}, {226, 1600 a},
{222, 3.8235 d}, {218, 3.098 m}, {214 + 0.2, 26.8 m}, {214, 19.9 m},
{214 - 0.2, 164.3 us}, {210 + 0.3, 1.3 m}, {210 + 0.15, 22.20 a},
{210 - 0.15, 5.012 d}, {210 - 0.3, 138.376 d}, {206, 10^20 a}};

r[3] = {{235, 7.038*10^8 a}, {231 + 0.2, 25.52 h}, 
{231 - 0.2, 32760 a}, {227 + 0.2, 21.773 a}, {227 - 0.2, 18.72 d}, {223, 11.435 d}, {219, 3.96 s}, {215, 1.781 ms}, {211 + 0.2, 36.1 m},
{211 - 0.2, 2.14 m}, {207 + 0.2, 4.77 m}, {207 - 0.2, 10^20 a}};

Do[{q[i] = 
Transpose[{Transpose[r[i]][[1]], Log10[Transpose[r[i]][[2]]]}],
g[i] = ListPlot[q[i], PlotStyle -> {PointSize[Large], c[i]}],
f[i] = ListPlot[q[i], Joined -> True, PlotStyle -> c[i]]},
{i, 0, 3}];

Show[Table[{g[i], f[i]}, {i, 0, 3}], PlotRange -> {{205, 240},
{-10, 30}}, Frame -> True, GridLines -> Automatic]

グラフを作図するため,到達点の安定な同位元素の寿命として,10^20年を入れた。ネプツニウム系列の最後から2番目には,半減期が1.9×10^19年(宇宙年齢の10億倍)のビスマス209がある。2003年まではこれは最も重い安定同位元素だと認識されていた。

全体の傾向はなくて半減期はバラついているのかと思ったが,実際にはすべての系列に共通して,長寿命から大きな谷を経由して再び長寿命(安定)に向かうカーブを描いている。これは原子核構造の大域的性質に関係あるのかもしれない。知らんけど。

2022年8月24日水曜日

ファシズムの初期兆候

アメリカ・ワシントンD.C.にあるアメリカ合衆国ホロコースト記念博物館の"Early Warning Signs of Fascism"と題された展示ポスターに掲げられているファシズムの初期兆候の14項目は以下のとおりである。 
01.  強力かつ継続的なナショナリズム(Powerful and Continuing Nationalism)
02.  人権の蔑視(Disdain for Human Rights)
03.  団結させるための敵の設定(Identification of Enemies as a Unifying Cause)
04.  軍事の最優先(Supremacy of the Military)
05.  はびこる性差別(Rampant Sexism)
06.  支配されたマスメディア(Controlled Mass Media)
07.  国家安全保障への執着(Obsession with National Security)
08.  宗教と政治の結合(Religion and Government Intertwined) 
09.  企業の力の保護(Corporate Power Protected)
10.  労働者の抑圧(Labor Power Suppressed)
11.  知性や芸術の蔑視(Disdain for Intellectuals and the Arts)
12.  刑罰強化への執着(Obsession with Crime and Punishment)
13.  身びいきや汚職の蔓延(Rampant Cronyism and Corruption)
14.  不正な選挙(Fraudulent Elections)
ワシントン・マンスリーの2017年1月の記事(The 12 Early Warning Signs of Fascism)では,上記のうち04と14を除いた12項目が,トランプ政権にあてはまる兆候だとしている。安倍政権以降の自公政権+維新についても同様かもしれない。その項目の多くが統一教会,日本会議,神道政治連盟などの活動と共鳴しているように見える。

2022年8月23日火曜日

SIDRモデル(2)

 SIDRモデル(1)からの続き

牧野さんの例では,感染期間/免疫消失期間が1/100 と小さくなる場合が示されていた。そこで,これに対応するケースの計算をしてみた。

R = 5; \[Gamma] = 13; \[Beta] = R/\[Gamma]; \[Alpha] = 130*10;
sol = NDSolve[{
x'[t] == \[Beta] x[t] (1 - x[t] - y[t] - z[t]) - x[t]/\[Gamma],
y'[t] == 0.9987*x[t]/\[Gamma] - y[t]/\[Alpha],
z'[t] == 0.0013*x[t]/\[Gamma],
x[0] == 0.01, y[0] == 0, z[0] == 0}, {x, y, z}, {t, 0, 3000}];
fx[t_] := x[t] /. sol[[1, 1]]
fy[t_] := y[t] /. sol[[1, 2]]
fz[t_] := z[t] /. sol[[1, 3]]
Plot[fx[t], {t, 0, 3000}, PlotRange -> {0, 0.5}]
Plot[fz[t], {t, 0, 3000}, PlotRange -> {0, 0.01}]
基本再生産数と免疫消失期間を前回のそれぞれ2.5倍,10倍にしている。
この結果,定常状態における全人口に対する感染者割合は0.77%,一日当たり死亡数は,97人/日となる。年間死亡数は3.5万人なので,季節性インフルエンザの3.5倍程度に収まることになる。


図1:SIDRモデルにおける感染者割合の推移


図2:SIDRモデルにおける累計死亡数の推移

(注)西浦さんの公式だと,$\frac{1-1/R}{1+\alpha / \gamma}\cdot \frac{n}{\gamma} =100$人/日となるので,上記の結果とよく対応している。

2022年8月22日月曜日

SIDRモデル(1)

 エンデミックからの続き (参考:感染症の数理シミュレーション(2)

西浦博さんが紹介している既知のSIRSモデルは,年齢構造や平均余命まで考慮した精緻なモデルだが,一般ピープルがその振る舞いを試してみるには大層なので,単純なSIDRモデルを考えてみた。本質的に,牧野淳一郎さんが最近計算したモデルと等価であり,念のため死亡者数をちょっと取り出しただけだ。

図1:SIDRの概念図

$\dfrac{du_1}{dt} = -\beta \dfrac{ u_1 \cdot u_2}{n} + \dfrac{u_3}{\alpha}$
$\dfrac{du_2}{dt} = \beta \dfrac{ u_1 \cdot u_2}{n} -\dfrac{u_2}{\gamma_1} -\dfrac{u_2}{\gamma_2}$
$\dfrac{du_3}{dt} = \dfrac{u_2}{\gamma_1} -\dfrac{u_3}{\alpha}$
$\dfrac{du_4}{dt} = \dfrac{u_2}{\gamma_2}$

ここで,$u_1+u_2+u_3+u_4=n$は定数で,全国民数である。また,$\alpha$が免疫保持期間(day),$\gamma$は感染期間(day)である。CFRを$c$とすると,$\frac{1}{\gamma}=\frac{1}{\gamma_1} + \frac{1}{\gamma_2}$が成り立ち,$\frac{1}{\gamma_1}=\frac{1-c}{\gamma},\frac{1}{\gamma_2}=\frac{c}{\gamma}$である。

微分方程式の両辺を$n$で割って,$x=\frac{u_2}{n},y=\frac{u_3}{n},z=\frac{u_4}{n}$とする。また,$s=\frac{u_1}{n}$を,$s=1-(x+y+z)$で消去すると次の3変数の微分方程式系が得られる。

$\dfrac{d x}{dt} = \beta (1-x-y-z)\ x -\dfrac{x}{\gamma}$
$\dfrac{d y}{dt} = \dfrac{(1-c)\ x}{\gamma} -\dfrac{y}{\alpha}$
$\dfrac{d z}{dt} = \dfrac{ c\ x}{\gamma}$

この式で$c=0$とすれば,牧野さんの式となる。次のMathematicaコードで検算したところ,彼の結果は再現できた。ここでは,次の値で計算してみる。$R=\beta \gamma =2,\gamma=13,\alpha=130,c=0.0013,x[0]=0.01$

R = 2; \[Gamma] = 13; \[Beta] = R/\[Gamma]; \[Alpha] = 130;
sol = NDSolve[{
x'[t] == \[Beta] x[t] (1 - x[t] - y[t] - z[t]) - x[t]/\[Gamma],
y'[t] == 0.9987 * x[t]/\[Gamma] - y[t]/\[Alpha],
z'[t] == 0.0013 * x[t]/\[Gamma],
x[0] == 0.01, y[0] == 0, z[0] == 0}, {x, y, z}, {t, 0, 1000}]
fx[t_] := x[t] /. sol[[1, 1]]
fy[t_] := y[t] /. sol[[1, 2]]
fz[t_] := z[t] /. sol[[1, 3]]
Plot[fx[t], {t, 0, 1000}, PlotRange -> {0, 0.2}]

その結果は図2のようなものであり,振動の後に平衡状態となり,感染者割合は4.5%に収束する。



図2:SIDRモデルにおける感染者割合の推移

また,400日目を過ぎると,死亡数は図3のように線形で増加するが,このときの1日あたりの死亡者割合は,4.5 x 10^-6 となり,540人/日に相当するので,年間死亡数は19万人に達する。これは季節性インフルエンザの超過死亡数(1万人)の20倍のオーダーである。



図3:SIDRモデルにおける累計死亡数の推移

2022年8月21日日曜日

エンデミック

8月19日, 新型コロナウイルスの全国の新規感染者数が過去最多の26.1万人に達した。医療現場の逼迫状態も進んでいるはずなのに,行動制限が設定されることもなく,手間のかかるHRS-SYS入力による感染者数の全数把握見直しの議論などが先行している(8月2日の専門家有志の提言)。

そういえば,菅政権から岸田政権に替わって,専門家が前面にでて説明することがなくなった。いいような悪いような。もちろん背景では,新型コロナウイルス感染症対策アドバイザリーボードが週1回の頻度で回っている。

8月18日のアドドバイザリーボードの資料で,京大の西浦博さんが,新型コロナウイルス感染症のエンデミック化についての数理モデル,SIRS(Susceptible-infectious-recovered-susceptible)について検討していた。

エンデミック(地域流行≒風土病)とは,感染症流行の第三段階である。パンデミック(汎発流行=世界流行),エピデミック(流行≒アウトブレイク)の次に来るフェーズだ。ある感染症が一定の地域に一定の罹患率又は一定の季節で日常的に繰り返し発生する状態を表わし,まさにウィズ・コロナに相当する。

SIRSモデルでは,回復者の免疫が一定の時間で切れてしまうために,再び感染可能者に戻ってしまうというものだ。つまり,SIRモデルの回復者$R(t)$のところに,$R(t)$に比例した減衰項が付け加わり,その分が感染可能者 $S(t)$に加わる。

$\dfrac{dS}{dt} = -\beta \cdot S \cdot I + \delta \cdot R $

$\dfrac{dI}{dt} = \beta \cdot S \cdot I - \gamma \cdot I $

$\dfrac{dR}{dt} = \gamma \cdot I - \delta \cdot R$

平衡状態における定常解は,$\frac{dI}{dt} =0,\frac{dR}{dt}=0,N=S+I+R$から求まる。これらから,$N-I-\frac{\gamma}{\delta} I = \frac{\gamma}{\beta N}\cdot N$となるので,

$\dfrac{I}{N}= \dfrac{1-1/R_0}{1+\gamma/\delta}$と平衡状態での全人口に対する感染者割合が求まる。ただし,$R_0=\frac{\beta N}{\gamma}$は基本再生産数である。これが,西浦さんが資料で示した下図に示されている。免疫が半年で切れるとして,全人口の1%〜2%程度が常に感染していることになる(これは,オミクロン株での免疫持続時間3〜4ヶ月と感染者割合2〜8%という英国の観測値と整合している)。



図:アドバイザリーボード西浦博さんの資料から引用

エンデミック(ウィズコロナ)を認めるということは,常に数%の感染者が存在することを容認することになる(季節性インフルエンザの10倍)が,高齢者比率の高い日本では,その死亡リスクが他国にくらべて高いことに十分注意する必要があるというのが結論だった。

仮に,オミクロン株の致命率CFRとして,0.13%(季節性インフルエンザの10〜20倍)を採用し,感染期間を13日とする。平衡状態での感染者割合が2%の場合,全人口に対する1日当たりの死亡者数割合は,0.0013/13*2%=2*10^{-6}となるので,毎日250人程度の死者が出続ける(現在までの新型コロナ感染症死者数のピーク値がずっと続くのがウィズコロナだ)。

2022年8月20日土曜日

玉川児童百科大辞典

 個人送信(2)からの続き

国立国会図書館デジタルコレクションの「個人向けデジタル資料送信サービス」の対象に,玉川大学出版部玉川児童百科大辞典があげられていた。そういえば,1冊持っていたと確認してみたら,玉川新百科1の数学の巻だった。

これは,昭和45年(1970年)9月10日に発行された学習百科シリーズの1冊だ。玉川児童百科大辞典の系列のシリーズで,対象読者は中学生や高校生だ。数学でいえばほぼ高等学校までの内容がカバーされていて,最後の現代数学の章で,記号論理学やカントールの集合論,抽象代数学などがほんの少しだけ含まれている。

この本を買ってもらったのは,高校生の時だった。本屋で見かけてどうしようと迷っていたのを憶えていたのか,ある日父親が買ってきた。小学校の時は,父には毎日のように本屋に連れていってもらって,沢山の本や図鑑を買ってもらった。やがて中学校になると,自分一人で本屋に行くようになり,主にSFやブルーバックスなどをあさっていた。

高校に入ってからは,父に本を買ってもらう機会はほとんどなくなっていたが若干の例外があった。この本とハヤカワSFシリーズ銀背のアイザック・アシモフの「銀河帝国衰亡史(記憶の中では金背になっていた)」,そして,ヴァージニア・ウルフの「灯台へ(To The Lighthouse)」(英語本)を買ってきたのが印象的だった。アシモフの方はわかるのだけれど,何故ヴァージニア・ウルフだったのかはいまでも謎だ。



写真:ハヤカワSFシリーズ「銀河帝国衰亡史」の書影
付録:玉川新百科(玉川大学出版部・誠文堂新光社)全10巻の内容
 1 数学
 2 物理1
 3 物理2
 4 化学1
 5 化学2
 6 天文・気象
 7 地球・海洋・地質・鉱物
 8 生物学
 9 動物
10 植物

2022年8月19日金曜日

LDLコレステロール(2)

 LDLコレステロール(1)からの続き

天理市立メディカルセンターの人間ドックの結果がよろしくなかったので,8月15日に血中脂質の再検査を申し込んでいた。

9時の受付で,体重を測り採血してもらう(血圧は測らなくていいのか)。50分くらい待って診察を受けた。結果は,総コレステロール(130-219 mg/dL)が 257 -> 229,HDLコレステロール(40-75 mg/dL)が 68->64,LDLコレステロール(70-139 mg/dL)が 170 ->145 だった。

朝食のトーストのバターをやめるなどの成果がでたのか。次回は来年の人間ドックでチェックすることにした。お医者さんからは,卵黄・魚卵・肉類の脂肪を減らせと指示された。食品に含まれるコレステロールの摂取と,体内でのコレステロール合成を促進する飽和脂肪酸の摂取の2つがあって,それらを両方とも控えなさいということだった。

帰ってから,コレステロールについてもう一度勉強してみた。胆石はコレステロール98-99%でできてるものなのか。コレステロールが血漿中で輸送されるときには,コレステロールにタンパク質が結合したリポタンパク質の形をとる。これは,その密度のわずかな差によって数種類に分類できる。もっとも密度が大きなものが,HDL(高密度リポタンパク質,ρ=1.063–1.210  d= 7–10 nm),その次がLDL(低密度リポタンパク質,ρ=1.019–1.063  d=19–22 nm)だ。

LDLが酸化してマクロファージに取り込まれたものが血管に沈着すると動脈硬化の原因となって,死因順位第2位の心疾患(16%)や第4位の脳血管疾患(7%)を引き起こすらしい(なお,第1位の悪性新生物の死因割合は27%)。

ところが,WikipediaのLDLの節には次のような記述があった(参考資料)。

以前は悪玉コレステロールとも呼ばれたが、現在では否定されている。最新のACC/AHAガイドラインでは家族性高コレステロール血症の患者以外ではLDLの目標値を設定するエビデンスはないとされている。

 ACC/AHAは,米国心臓病学会と米国心臓病協会のことで,その2018年ガイドラインはこれ。専門的な英文を解読するのが難しいので,日本動脈硬化学会の反論の方をみる。

今回のACC/AHA ガイドラインの特徴の一つは、脂質管理目標値を設定しないことである。LDL-Cの管理目標値を決定するに足るエビデンスは現状では十分ではないことに関しては我々も異論はなく,すでに動脈硬化性疾患予防ガイドライン2012年版でも20-30%のLDL-C低下を目標とすることも考慮すると記載されている。

他のリスク要因がなく,単にLDLコレステロールの値が高いだけという場合は,LDLコレステロールを一定値まで下げるということに意味がないということなのか?


図:脂質異常症と栄養の関係(下記参考資料から引用)

[1]日本人の食事摂取基準(2020年版)

2022年8月18日木曜日

SI接頭語

1960年に国際単位系(SI)の諸規定が定まってから60年,前回のSI接頭語の追加から30年目にして,新しい接頭語が追加されることになった。

そもそもヨタY,ゼタZ,ヨクトy,ゼプトzも使ったことなかったけれど,新しく導入されるクエタQ,ロナR,クエクトq,ロントrもあまり使いそうにない。原子核物理をやっていたのでフェムトfはおなじみだけれど,量子光学に登場するアトaには縁がない。

イレギュラーなμ,daを除くと接頭語には,ラテン文字1字があてはめられる。この調子でいくと,ラテン文字ペアの記号が足りなくなるかと思ったけれど,まだ,Bb,Ii,Jj,Ll,Oo,Ss,Uu,Vv,Wwが残っているので,あと30×4=120年くらいは大丈夫かもしれない。

いやいや,すでにSI基本単位やSI組立単位で使われている記号はまずいから,s,m,K,A,N,J,W,C,V,F,T,Hも除外される(テラテスラ T T はいいのか?)。となると,30×2=60年なのかもしれない(Bb,Ii,Ll,Oo,Uuの5組)。その後は,ギリシャ文字にすればもう少し延命できる。

ギリシャ文字のうちラテン文字と区別しにくい字形のものを除くと,Γγ,Δδ,Θθ,Λλ,Ξξ,Ππ,Σσ,Φφ,Ψψ の9組が残る。さらに30×5=150年はいける。この結果,200年後には,14組の接頭語が追加されて,10^±75 までのオーダーを表現できるわけだ。

現在の12組の接頭語が26組になるというのは,単に記法が複雑化するだけで,メリットはないような気もするが,日本の(あるいは華厳経の)命数法もたいがい面倒なことになっているので,SIといい勝負だ。

接頭語        記号 10^n 制定年
クエタ (quetta)  Q   30  2022年
ロナ  (ronna )  R   27  2022年
ヨタ  (yotta )  Y   24  1991年
ゼタ  (zetta )  Z   21  1991年
エクサ (exa   )  E   18  1975年
ペタ  (peta  )  P   15  1975年
テラ  (tera  )  T   12  1960年
ギガ  (giga  )  G    9  1960年
メガ  (mega  )  M    6  1960年
キロ  (kilo  )  k    3  1960年
ヘクト (hecto )  h    2  1960年
デカ  (deca  )  da   1  1960年
-           -   0   -
デシ  (deci  )  d   -1  1960年
センチ (centi )  c   -2  1960年
ミリ  (milli )  m   -3  1960年
マイクロ(micro )  μ   -6  1960年
ナノ  (nano  )  n   -9  1960年
ピコ  (pico  )  p  -12  1960年
フェムト(femto )  f  -15  1964年
アト  (atto  )  a  -18  1964年
ゼプト (zepto )  z  -21  1991年
ヨクト (yocto )  y  -24  1991年
ロント (ronto )  r  -27  2022年
クエクト(quecto)  q  -30  2022年


2022年8月17日水曜日

国際言語学オリンピック

高校生を対象とした,国際数学オリンピックだとか 国際物理オリンピックだとか国際化学オリンピックだとか国際生物学オリンピックだとか国際地学オリンピックだとか国際天文学オリンピックだとか国際情報オリンピックだとかは聞いたことがあった。

国際言語学オリンピックは初耳だった。2021年の問題をみると,キリヴィア語と日本語の対訳から言語規則を見つけて,各言語の短文を翻訳するといったものだった。なお,キリヴィア語は,オーストラロネシア語族の大洋州諸語派に属するパプアニューギニアのトロブリアン諸島で約20,000人が使用している,ものだ。

【日本語の文とキリヴィラ語訳】(カッコ内が自分で考えた言葉の対応) 
 1.一人の男性がこれらの四匹の魚を捕まえる。
  Bibani navasi yena minasina tetala tau.
 (捕まえる 四匹の 魚 これらの 一人の 男性)

2.この白人の男性が到着した。
  Lekota dimdim mtona.
 (到着した 白人男性 この)

3.その子供が到着する。
  Bikota gwadi magudiwena.
 (到着する 子供 その)

4.この年配の女性がそれらのカヌー(複数)を見た。
  Legisi waga makesiewna namwaya miana.
 (見た カヌー それらの 年配の女性 この)

5.どの男性が二頭の豚を殺したか?
  Amtona tau lekalimati nayu bunukwa?
 (どの 男性  殺したか 二頭の 豚)

6.年配の女性達が二人の男性を世話した。
  Leyamatasi teyu tauwau nunumwaya.
 (世話する 二人の 男性 年配の女性達)

7.その賢い女性が何かをみる。
  Bigisi kwetala vivila minawena nakabitam.
 (見る 何か 女性 その  賢い)

8.何匹の犬が到着したか?
  Navila ka'ykwa lekotasi?
 (何匹の 犬が 到着したか?)

9.首長達がどのカヌーを見たか?
  Amakena waga legisesi gweguyau?
 (どの カヌー 見た? 首長達)

10.その美しい子供がこの石を見た。
  Legisi dakuna makwena gwadi magudiwena gudimanabweta.
 (見た  石  この  子供が その   美しい)

11.それらの白人の男性がいくつのものを食べたか?
  Kwevila lekamkwamsi dimdim mtosiwena?
 (いくつのもの 食べた? 白人男性 それらの)

12.賢い首長が一頭の野生の豚を殺した。
  Lekalimati natala bunukwa magasisi guyau tokabitam.
 (殺した 一頭の  豚  野生  首長 賢い)

13.何人の女性がこの男性を世話するか?
  Navila vivila biyamatasi tau mtona?
 (何人の 女性 世話する? 男性 この)
なんとなくわかったが,詰めが甘すぎた。動詞の過去形と現在形,名詞の単数形と複数形,指示代名詞の変化などに注意が行き届かなかった。脚本家の今井雅子さんが丁寧に解読していて参考になる。

2022年8月16日火曜日

光の屈折

水中の物体を空気中からみると浮き上がって見えるのは,屈折率が異なった媒質の間を光が進むときに,光路が屈折することによる典型的な現象である。

昔,理科教育メーリングリストで,水中にある物体が浮き上がって見えるときに,その像ができるのはどの位置かということが話題になった。物体を通る鉛直線ℓを含む断面でみれば,視点からみてℓより手前に結像する。一方,これを上から俯瞰してみれば,水平方向では媒質が一様なので,同じ高さにある両眼と物体を結ぶ光線の射影は曲がらない。したがって,像はℓ上に存在することになる。

これは,物体の物理的な結像位置が水平方向と鉛直方向で異なっているということで理解できる。実際の見え方は,人間がこれを脳の中でどのように処理するかに依存するのだろう。

とりあえず,「鉛直線ℓを含む断面でみれば,視点からみてℓより手前に結像する」ことを下図で確かめる。なお空気に対する水の屈折率を$n$とする。

水中の物体Pから出た光が水面に入射する角度を $\alpha$および$\ \alpha'=\alpha+\delta \alpha \ $とし,出射する角度を$\beta$および$\ \beta'=\beta+ \delta \beta \ $とする。スネルの法則から$\ n = \frac{\sin \beta}{\sin \alpha}=\frac{\sin \beta'}{\sin \alpha'}\ $なので,$\sin \beta = n \sin \alpha \ $から,$\cos \beta \cdot \delta \beta = n \cos \alpha \cdot \delta \alpha \ $であることに注意する。

Q点及びQ'点を通って虚像を結ぶ破線の式は,$y = \cot \beta ( x - d \tan \alpha)$,$y=\cot \beta' (x - d \tan \alpha') $となる。その交点が像の座標となる。$\delta \alpha$と$\delta \beta \ $を微少量として,$\tan \alpha' = \tan (\alpha + \delta \alpha) = \tan \alpha + \frac{\delta \alpha}{\cos^2 \alpha}$,および,$\cot \beta' = \cot (\beta + \delta \beta) = \cot \beta - \frac{\delta \beta}{\sin^2 \beta}\ $が成り立つ。

これから,$-\frac{\delta \beta}{\sin^2 \beta} x = \frac{\delta \alpha}{\cos^2 \alpha} d \cot \beta$であり,$ \frac{x}{d} = -\frac{\sin \beta \cos \beta}{\cos^2 \alpha } \frac{\delta \alpha}{\delta \beta} = -\frac{n \sin \alpha}{n \cos \alpha} \frac{\cos^2 \beta}{\cos^2 \alpha}\ $となる。

したがって,$\dfrac{x}{d} = - \tan \alpha \Bigl( \dfrac{1-n^2 \sin^2 \alpha}{\cos^2 \alpha} \Bigr)$

これにより,$n=1$では,$\dfrac{x}{d}= -\tan \alpha$から,点Xはℓ上になる。また,$n>1$では,$\dfrac{x}{d} \gt -\tan \alpha \ $から点Xはℓより手前に位置することになる。


図:水による光の屈折

2022年8月15日月曜日

2022年8月14日日曜日

2022年8月13日土曜日

2022年8月12日金曜日

2022年8月11日木曜日

国立大学のLMS一覧

高等教育研究センター(2)からの続き

阪大全学教育推進機構教育学習支援部の村上正行さんによれば,今回の京都大学の高等教育研究開発推進センターの廃止は,予算の問題というよりむしろ学内政治の問題に起因するらしい。そこで気になったのが競合するシステムが京大内に存在するのかということ。

京都大学の情報基盤を管理・運用しているのは,情報環境機構である。沿革によれば,2002年に大型計算機センターと総合情報メディアセンターを統合した,学術情報メディアセンターが設置された。その後,2005年に京大の5機構の1つとして,情報環境機構が設けられ,徐々に組織整備が進められた。組織図によれば,学術情報メディアセンターとは別組織だが,機構の一部はその建物を利用している。

しかし,高等教育研究開発推進センターは,情報環境機構の組織図に明示的には現れてこない。情報環境機構では,LMSのSAKAIを利用したPandAなどが運用されていて,授業資料の配付などはこの中に閉じこめられていた。そもそも,OCWやMOOCとは別方向のベクトルになっている。

なお,国立大学のLMS一覧がまとめられていたので,紹介する。大阪教育大学は,多数派の(無料で安上がりの)moodleを使っている。SAKAIを使っているのは,京大と名大,


図:国立大学が導入しているLMS(たれにゃんこさんの資料から引用)

[1]国立大学のLMSの一覧(たれにゃんこ)

2022年8月10日水曜日

画像生成AI(1)

 AI技術の応用が浸透しつつある。その一例として,自然言語処理と画像生成を組み合わせて,短文やキーワードのセットから画像(絵画,写真,デザイン)を生成するモデルがはやっている。

代表的なものが,OpenAIというイーロン・マスクがかんでいる非営利団体がつくった,DALL·E 2(ダリ)である。2021年にDALL·Eが公開され,1年後にその解像度が倍になった。凄いクオリティの絵や写真を大量に生成することができる。

かつて,AI(+ロボット)× BI(=ベーシックインカム)の時代になれば,人間は単純労働から解放されて,創造的な活動に専念できるという話があったかもしれない。現実には,創造的な活動や知的活動の方がAIに奪われてしまい,人間に残されたのは,被階級支配と低賃金単純労働だけだということになりそうだ。

それはすでに,小松左京の「五月の晴れた日」にという短編で預言されていた。読み始めは,優雅に芸術論をたたかわす人間と機械的に動くロボットの下僕の話のように始まるが,やがて,人間というのはアンドロイドであり,ロボットのように描写されていた側が反乱を起こす人間だという種明かしがされる。そこには,人間の業とでもいうべき進歩への渇望と,それが招来する混乱を阻止すべく保守的にプログラムされたアンドロイドが対比されていた。

「五月の晴れた日」は,ハヤカワSFシリーズ(銀背)の3136「神への長い道」に収録されていた。高校時代,この短編集を米島君に貸したときに,「神への長い道」「極冠作戦」「4次元ラッキョウ」などに○をつけて渡したが,彼は「五月の晴れた日」の良さがわからないのかといったものだった。確かにそのとおりなのである(黄金分割が 1:√2 としていたのはご愛嬌)。

DALL·E 2に類似したシステムとして,GoogleのImagen,MicrosoftのNUWA-Infinity,DiscordのMidjourneyなどがある。クオリティはいまいちだけれど,DALL·E mini からスピンアウトして誰でも無料で使えるシステムがcrayonである。早速試してみた。いまのところ,256x256の解像度である。


写真:craiyonの例
(a painting of a fox sitting in a field at sunrise in the style of Claude Monet)