2023年1月31日火曜日

形態素解析

コンピュータによる自然言語処理のアルゴリズムで第一に取り上げられるのが形態素解析である。品詞情報がならんだ辞書をもちいて,原文を形態素(品詞情報付き)に分解できる。

これを実現するソフトウェアとしては,大学等で開発されたいくつかのフリーソフトが有名だった。Juman / Juman++ChaSenKAKASIMeCab(工藤拓),SudachiKuromoji(atilica),janome(打田智子)などである。MeCabがポピュラーなのだけれど今となっては少し古いのかもしれない。これまで,MeCabになじんできたので,Juman++出力形式はやや違和感がある。

さて,しばらく前に,mecab-neologdというMeCabの最新辞書を導入した。それでもたりない場合は,ユーザ辞書を定義して使うことになるのでチャレンジしてみる。その前に,システム辞書をipadicからipadic-neologdに変更してみた。
vi /opt/homebrew/etc/mecabrc
configuration file の dicdir の修正:
; dicdir =  /opt/homebrew/lib/mecab/dic/ipadic
dicdir = /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd
次に,「ユーザ辞書登録をやり直す」にしたがって,ユーザ辞書を使えるようにしてみた。
cd /opt/homebrew/lib/mecab/dic
vi userdic.csv
cat userdic.csv

行政組織,,,1000,名詞,一般,*,*,*,*,行政組織,ギョウセイソシキ,ギョウセイソシキ

出発点,,,5000,名詞,一般,*,*,*,*,出発点,シュッパツテン,シュッパツテン

95%信頼区間,,,5000,名詞,一般,*,*,*,*,95%信頼区間,キュウジュウゴパーセントシンライクカン,キュージューゴパーセントシンライクカン

/opt/homebrew/Cellar/mecab/0.996/libexec/mecab/mecab-dict-index -d /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd -u userdic.dic -f utf-8 -t utf-8 userdic.csv
mecab -u /opt/homebrew/lib/mecab/dic/userdic.dic

これで使えるようになる。ユーザ辞書のcsvファイルの構造は次のようになっている。
表層形,左文脈ID,右文脈ID,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用型,活用形,原形,読み,発音
左右の文脈IDは空欄でよいらしい。またコスト値を推定する方法についてはもう少し調べる必要がある。

2023年1月30日月曜日

京大OCW

高等教育研究センター(2)からの続き

騒動になってから半年たち,京都大学からオープンコースウェアを継続することが発表された。現行OCWコンテンツを維持とし,新しいOCW2.0(仮称)や検索システムKU-Search(仮称)を構築するとのこと。そのために,コンテンツ企画・支援室(仮称)を設けるらしいが,京都大学情報環境機構の情報環境支援センターに位置づけられるのかな。

この機会に他大学のOCWはどうなったかをgoogleにOCW +site:ac.jpを入れて検索した。

  (338通常講義,477公開講義,81最終講義,95国際会議,90その他)
  (5078講義ノート,40動画音声)
  (150学部講義,50大学院講義,170公開講座)
  (48テレビ講義,43ラジオ講義,131テレビC,152ラジオC)
  (269コンテンツ)
  (92学部講義,48大学院講義,264公開講座)
  (136コンテンツ)
  (352授業,251最終講義,)

googleで見つかるのものは,京大,東工大,東大がほとんどを占めていた。阪大と東北大がOCWで引っかからない。なぜなら彼らはMOOCの名前を使って,阪大はedX,東北大はJMOOCにアウトソーシングしているからだった。

それでは,OCWとMOOCの違いはなんなのだろうか。JOCW(日本オープンラーニングコンソーシアム)が解消発展したOEジャパンに定義があった。
OCW(Open Course Ware):大学や大学院などの高等教育機関で正規に提供された教材を,インターネット上に無償で公開する活動

MOOC (Massive Open Online Course):インターネットにアクセスできれば誰でも無償もしくは安価に利用できるオンライン講義

OE(Open Education):世界中のすべての人が質の高い教育経験と資源にアクセスできるようにすることで,人類の発展に貢献しようとする教育ムーブメント


OER(Open Education Resource):教材の作成者が利用者に対し,その教材の修正や改変の許可を与えてる学習資料,クリエイティブ・コモンズ・ライセンスなどにより著作権の一部もしくは全てを放棄することで,他の人々は自由にアクセス・再利用・翻訳・修正できる。
インターネットがブレイクして10年後,今から20年前にOCWは一時流行しかけていたけれど,やがて下火になって現在に至っている。GIGAスクール(一人一端末)の時代に,OERの重要性はますます高まっているはずなのだが・・・


図:MOOCのイメージ(Wikipediaから引用)




2023年1月29日日曜日

茶道

NHKの近畿のニュースで小学生の茶道教室の話題があった。アナウンサーが茶道(ちゃどう)と発音して紹介している。NHKは最近よく間違えるわと思ってみていると,2回目も「ちゃどう」と。あれ,もしかして「さどう」だと思っていた自分のほうがおかしいのか?

さっそく,物書堂の精選版日本国語大辞典で確かめてみると・・・
ちゃ-どう【茶道】〘名〙
①茶の湯を催すことによって静寂閑雅の境地にはいり,礼儀作法を修める道。…。さどう。

さ-どう【茶道・茶頭・茶堂】〘名〙
①(茶頭・茶堂)茶事をつかさどるかしら。…。
②(茶道)茶の湯。…。
[補注]茶の湯の道のことを「さどう」というのは江戸時代まではまれであり,また,茶頭との混同をさけるために「ちゃどう」というのが普通であった。
お〜い,早く教えてくれ〜。70年近く生きているのに知らなかった。たぶんそんなことが他にも沢山在るわけで,まあそれはそれでいいのかもしれないけれど・・・。なお,大辞林でも「ちゃどう」がメインで「さどう」がサブの扱いだった。

ということは,これまでも「ちゃどう」という言葉がしばしば聞こえてきてもおかしくなかったのだけれど,思い込みフィルターで完全に無視していたに違いない。高校の時は茶道部(さどうぶ)とよんでいたはずなのだが。

[参考]
(1) 裏千家,表千家の英語ページでは,Sadoはでてこない。Chanoyu だ。
(2) 日本政府観光局サイトでは,"These practices developed into sado, the art of the Japanese tea ceremony."とある。
(3) Googleでは,sado "Tea ceremony" 78,800件,chado "Tea ceremony" 65,300件
(4) Wikipedia(英語)では,The Japanese tea ceremony (known as sadō/chadō (茶道, 'The Way of Tea') or chanoyu (茶の湯)) 
(5) ChatGPTでは,Q:How do you pronaunce Japanese Tea ceremony as Japanese word.
A:The Japanese word for "tea ceremony" is "chado" or "sado" (茶道) which is pronounced "cha-doh" or "sah-doh" respectively.

一般的には,互角というところなのかもしれない。


図:The kanji characters for chadō, the 'Way of Tea' (Wikipediaから引用)

2023年1月28日土曜日

テキストマイニング

施政方針演説(2)からの続き

テキストの分析は,テキストマイニングという名前でかつて流行っていた。検索エンジンの技術が話題になってビッグデータが流行り始めていたころだ。基礎知識に欠けた自分は,形態素解析で単語の出現頻度を調べて比較する先の議論には進むことができず終いだった。当時買った本がないかと本棚を確かめてみたけれど,それらしいものも見あたらない。

さて,施政方針演説テキストの抽出までを行うことにしよう。こういう目的のためにはシェルスクリプトが有難い。pythonやperlでまとまったプログラムを書くより,複数の簡単なコマンドを組み合わせるほうが楽だと思える素人プログラマーなのだった。

(1) ウィキソースにあった,内閣総理大臣施政方針演説のpdfファイルをダウンロードする。
(2) pdftotextによってpdfファイルをテキストに変換して一時保存する。
(3) tr -d で不要な改行コード,改ページコード,記号,数字,アルファベット等を取り除く(本文中の数字は全角のアラビア数字又は漢数字が使われている)。
(4) sed で句点「。」を「。+改行」に置き換えて一時保存する。
(5) sed でキーワードから本文前後の行を取り除き,これを最終のテキストファイルとする。
(6) 全体をシェルスクリプトにまとめ,コマンドライン引数で国会の開催回と総理の姓を入力して,該当するファイルを取り出せるようにした。

#!/bin/zsh

# Speech of Prime Minister in the Diet

# https://ja.wikisource.org/wiki/カテゴリ:内閣総理大臣施政方針演説

# 1/28/2023 K. Koshigiri

# usage: jpol.sh 204 菅

# output 204.txt


lynx -dump https://ws-export.wmcloud.org/\?format=pdf\&lang=ja\&page=第\$1回国会における\$2内閣総理大臣施政方針演説 > \$1.pdf

pdftotext \$1.pdf \$1-x.txt

cat \$1-x.txt | tr -d "\n\f[0-9][A-z] .,-(→/←);:'~Ö↑í" | sed "s/。/。\n/g" > \$1-y.txt

sed -e '/ウィキソース/d' -e '/作者:/d' -e '/この著作物/d' -e '/この作品/d' -e '/本作品/d' -e '/ 二次的著作物/d' -e '/許諾者/d' -e '/クレジット/d' -e '/あなたの/d' -e '/再構成/d' -e '/クリエイティブ・コモンズ/d' -e '/閲覧/d' \$1-y.txt > \$1.txt

rm $1-?.txt

perlまで必要ない場合は,小刀のような sed が使いやすいことがわかった。sedでキーワードによる行削除をするのだが,並列に記述できるということを学ぶ。


2023年1月27日金曜日

エアポケット(2)

エアポケット(1)からの続き

引き続きタイムワープの状態にある。今は,2023年12月31日23時30ごろ

今年の締めくくりのニュースは,松本人志の話題だった。菅野完が,いまごろ,ダウンタウンの漫才は面白くなかったというのはおかしいと強調していた。それはそれで評価されるべきだという主張なのだけれど,自分にとっては彼らが面白い漫才だと印象に残ることはなかった。島田紳助・松本竜介や,ツービート,爆笑問題なども同様にそこまで共鳴できなかったチームだ。

面白かったのは,鶴瓶=たかじん(11PMの出し物),Wヤング(初代),海原千里・万里くらいかな。最近だと,さや香の一部の出し物,南海キャンディーズ,笑い飯。

いや,そんなことはどうでもいい。知恩院の除夜の鐘が鳴り出したので,お休みなさい。

2023年1月26日木曜日

エアポケット(1)

タイムワープしている。今は2023年12月31日の午後11時頃である。

冬休み中のブログはお休みだ。年越しだと思って過去ログをパラパラ見返していたら,今年のブログが363回しかないことに気づいた。探してみると,2023年1月の26日と27日の分が抜けていた。まあ,そんなこともある。11ヶ月遅れだけれど,仕方がないので,適当な雑感で埋めておく。

大晦日の夕食はみんな集まるので,スキヤキになることが多い。

今年の豆腐はちょっと柔らかすぎる絹ごし豆腐だった。これがもやる。焼き豆腐がいいのだけれど,主導権がないのでしかたがない。ここぞと奮発して肉が多すぎるのもなんとなく落ち着かない。心がざわつく。相対的にネギが少なくなってしまう。自分が子供のころは笋も必須だったけれど,これは我慢できる。そんなこんなでぶつぶついいながら,鍋奉行を始めたが,途中でクレームが多く出されて解任されてしまった。

まあ,美味しかったし,明日のおかずに少しあまっただけだからいいことにしよう。


図:無料のAIでプロンプトを工夫しない場合に出てくるスキヤキのイメージ(違うよ)



2023年1月25日水曜日

施政方針演説(2)

施政方針演説(1)からの続き

毎年1月の通常国会冒頭に行われる内閣総理大臣の施政方針演説は,時の政権が官僚技術の粋を集めて作成しているものだから,それなりに分析する価値があるような気がしてきた。そこで,首相官邸のホームページで過去の施政方針演説を一覧しようと考えた。だめだった。データは不完全でありかつゴミに埋もれていて過去の施政方針演説が簡単には見つからない。国民の検索活動を妨げようとしているに違いない。

どうして,政府のデジタル活用力はこんなに低いのだろう。あるいは,情報公開の姿勢がまったく見当たらない。担当が変われば以前のURLは簡単に変えられてしまい探し出すのが困難になる。あるいは,存在していた情報はデザイン変更に伴っていとも簡単に廃棄される。国立公文書館のデジタルアーカイブの精神は全く根付いていない。デジタル庁が始めるべきなのは,設計に失敗しているマイナンバーなどではなく全省庁における情報公開とアーカイブの徹底に違いない。

探してみると,ウィキソース内閣総理大臣施政方針演説というのがあって,1965年の第48回国会における佐藤栄作から昨年の2022年の第208回国会の岸田文雄までがアーカイブされていた。その元になっていたのは,東京大学東洋文化研究所政策研究大学院大学によるデータベース「世界と日本」の中の帝国議会・国会内の総理大臣演説だ。ここには,第1回の帝国議会やそれ以前からの内閣総理大臣の演説がほぼ網羅されている。

これを利用して,テキストの形態素解析を行えば,どんなメッセージがそれぞれの施政方針演説に込められているかを分析することができるのではないか。これによって,検証したいのは教育政策との関係であり,失われた30年をもたらした原因がこれらの演説の中に潜んでいないかというアバウトな直感だ。

2月,3月は暇なのでちょっとどうするか考えてみる。

2023年1月24日火曜日

施政方針演説(1)

NHKは国会中継をしないという文句を垂れながら,国会中継の時間になるとチャンネルを変えてしまう不良老人である。NHKテレビが14:00から国会中継を始めたので,いつものように消そうかと思ったが,気の迷いでそのまま岸田首相の施政方針演説を見始めた。

日本では議会のことを英語でいうとき,なぜparliament(こちらが普通)ではなくDiet(ラテン語源)というのか,という面白い話からはじまった。なぜだかはわからなかった。話し方は穏当で聞きやすかったのだが半分ほどで脱落してしまった。そこで,演説全文を再度確かめてみることにする(首相官邸のウェブデザインやりなおしてほしい問題・・・orz)。

第211回国会における岸田内閣総理大臣施政方針演説の全文は約12,200字であり時間は44分かかる(275文字/分=4.58文字/秒)。昨年の第208回国会の場合は約12,100字なので,ほぼ一定になっているのかもしれない。項目のリストは次の通り。

第211国会における岸田内閣総理大臣施政方針演説(12,200)R5.1.23
一 はじめに(509)
二 歴史の転換点(747・・・明治維新・終戦につぐ分岐点)
三 防衛力の抜本的強化(751)
四 新しい資本主義(3907)
(一)総論(446)
(二)物価高対策(119・・・やらない)
(三)構造的な賃上げ(828→リスキリング:279)
(四)投資と改革(2501)
  (GX)(740→原発:90・・・隠している)
  (DX)(577→マイナンバーカード:379)
  (イノベーション)(481 →教育:111・・・教育は経済政策のごく一部)
  (スタートアップ)(382)
  (資産所得倍増プラン)(252)
五 こども・子育て政策(980)
六 包摂的な経済社会づくり(1492)
  (女性)(282)
  (若者)(166)
  (孤独・孤立対策)(71)
  (地方創生)(799→交通・通信:111)
七 災害対応・復興支援(522)
八 新型コロナ(548・・・もうやめる)
九 外交・安全保障(1961=日米など:315,日中:195,日韓:99,日露:77,北朝鮮:232)
十 憲法改正(116・・・あまりやる気ない=野党分断の手段としてのみ必要)
十一 政治の信頼(259)
十二 おわりに(325)

第208国会における岸田内閣総理大臣施政方針演説(12,100)R4.1.17
一 はじめに(652)
二 新型コロナ対応(2443)
三 新しい資本主義(3678)
四 気候変動問題への対応(851)
五 全ての人が生きがいを感じられる社会へ(524)
六 地域活性化(463)
七 災害対策(645)
八 外交・安全保障(2136)
九 憲法改正(183)
十 おわりに(513)
この一年で世界は変わってしまった。簡単に防衛費倍増が実現され,自衛隊が米軍の指揮系統下に組み込まれた。つまり,憲法改正で狙う必要があるのはいよいよ24条まわりと緊急事態条項だけになってしまうということだ。立憲民主党が日本維新の会とつるんで翼賛体制が確立し,日本共産党やれいわ新選組も前後左右から叩かれている状況では,それらの改正すら必要がないかもしれない。

2023年1月23日月曜日

級数の因数分解

鈴木寛太郎の今日の問題を一般化してみると次のような問題になる。
$\displaystyle f(n,x) = \Sigma_{k=0}^{n-1} x^k = 1 + x + x^2 + x^3 + \cdots x^{n-1}$は因数分解できるかというものだ。結論は,$n$が素数の場合は因数分解できないが,それ以外なら因数分解できる。

$g(n,x)=(1-x)f(n,x)=1-x^n$とする。$n$が素数でなければ$\ n=a\,b\ $などのように自然数$a$と$b$の積で表わすことができる。つまり,$g(n,x)=1-x^{a\,b}\ $であるから,$X=x^a\ $とおいて,$g(n,x) = 1- X^b = (1-X)(1+X+X^2+\cdots+X^{b-1}) $
$= (1-x) (1+x+x^2+\cdots +x^{a-1}) (1+X+X^2+\cdots+X^{b-1}) $

となる。つまり与式は,$f(n,x)=\frac{g(n,x)}{1-x} = (1+x+x^2+\cdots +x^{a-1}) (1+X+X^2+\cdots+X^{b-1}) $と因数分解できる。

問題は,$n$が素数の場合であって,これはどうしたものかと調べてみると,アイゼンシュタインの既約判定定理というものがあった。その内容は以下の通り。

  $P(x)=a_n x^n + a_{n-1} x^{n-1} + \cdots a_1 x + a_0$を整数係数の多項式とする。

  ある素数 $p$が存在して,次の条件が満たされるとする。
   ・$i \neq n$の場合,$a_i$は$p$で割り切れる。
   ・$a_n$は$p$で割り切れない。
   ・$a_0$は$p^2$で割り切れない。

  このとき,$P(x)$は係数が有理数の範囲でこれ以上因数分解できない。

例えば,$P(x)=x^4+x^3+x^2+x+1=\frac{x^5-1}{x-1}$の既約性は,$P(x+1)$の既約性とおなじであり,$P(x+1)=\frac{(x+1)^5-1}{x}=1 \cdot x^4 + 5 x^3 + 10 x^2 + 10 x^1 + 5 $を判定すればよい。この式は素数$p=5$に対して上の条件を満たしているので,因数分解できないことになる。

全ての係数 $a_i=1$で$n=p-1$($p$は素数)という多項式,$P(x)=x^{p-1} + x^{p-2} + \cdots x + 1 = \frac{x^p-1}{x-1}$を考える。そこでは,$P(x+1) = _pC_p x^{p-1} + _p C_{p-1} x^{p-2} + \cdots _p C_2 x + _p C_1 $となる。$a_n=a_{p-1} = _p C_p = 1$ は$p$で割り切れない。$a_i = _p C_i \ (i = 1 \cdots n-1 )$は$p$で割り切れる(*)。$a_0=_p C_1 =p $は$p^2$で割り切れないので,因数分解はできない。

(*) $a_{n-1}=_pC_{p-1}=p$,$a_{n-2}=_pC_{p-2}=\frac{p(p-1)}{2!}$,$a_{n-3}=_pC_{p-3}=\frac{p(p-1)(p-2)}{3!}$,・・・である。 $p$は素数なので,$\mathrm{mod}(p-1,2)=0$,$\mathrm{mod}((p-1)(p-2),3)=0$などから,$\frac{1}{p}\ _pC_i$は整数となり,$a_i = _p C_i \ (i = 1 \cdots n-1 )$は$p$で割り切れる。

[1]アイゼンシュタインの定理(高校数学の美しい物語)

2023年1月22日日曜日

対話と検索の狭間

対話の時代からの続き

ChatGPTの影響はまだ続いている。ChatGPTに対抗・関連・代替するシステムが多数出現中だ。ChatGPTは,学術的な問いに正確な回答はできない。引用文献も出鱈目である。こういう場合に推奨されているのが次のシステムだ。

(1) ElicitはOughtという非営利研究機関により,2022年4月に運用が始まった大規模言語モデル(GPT-3)を用いる研究支援ツールだ。質問をすると,1億7千5百万本の論文に基づいて関連する数編の論文と重要な情報の要約を表示する。

(2) Perplexityは,米国のAI開発企業 Perlpexity AIが開発した,世界最初の対話型検索エンジンを謳ったシステムだ。大規模な言語モデルと検索エンジンを用いて複雑な質問に対して正確な回答と根拠となる参考文献を5件及び関連情報を提供するアンサーエンジンである。

(3) これは噂だけなのだが,Claudeは,AnthropicというOpenAIの元社員によるAIスタートアップ企業が開発中の対話型AIである。ChatGPTとの比較記事が出されている。OpenAIの「ChatGPT」と元OpenAIエンジニアが開発した「Claude」の性能を比較した実験結果。ChatGPTと比べ一長一短であり,計算力が特別優れているわけでもない。

"what are the effects of general relativity on the formation of planetary system"という質問で(1)(2)を比べてみた。参考のため,(4) Google Scholarも試した。質問の趣旨は,惑星系の形成過程で一般相対論的な効果はどのように影響するかというものだ。

(1) Elicitはそれらしい論文を示してくれた。最初の3本は妥当だけれど,次の4本は微妙だったり,pdfファイルがないものだった。(2) Perplexityは一般相対論に関する一般的な話を回答してきた。参考文献もWikipediaだったり,Open Sourceの教科書だったり,あまり専門的なものではない。(4) Google Scholarは,検索結果の参考文献を並べただけなのだが,ブラックホールの話や重力のScalar Tensor理論の話や,細胞核の話題など,ポイントがそれており問題を十分把握できていない。

Perplexityのようなインターフェースと表現で,Elicitレベルかそれ以上の答えが出てくればよいのだけれど,今のところ,自分で普通のgoogle検索を重ねるのが最も正解に近づきやすいという結果だ。


2023年1月21日土曜日

DeepL Wirte

DeepL翻訳からの続き

ニューラル機械翻訳ツールのDeepL翻訳にはずいぶんお世話になっている。無料版だと5000字までの英文は一括で翻訳できるので,ちょっとした記事はたいていDeepLにかけている。DeepLがダウンロードを奨めてきたので,最近は,ダウンロードしたmacOS版のアプリケーションを立ち上げるようにした。

重要な文書の場合は,確認しないとときどき抜けやエラーがあるとはいえ,昔のgoogle翻訳などに比べれば圧倒的に自然な訳文がでてくる。難をいえば,29言語に対応しながら韓国語が含まれていないことだ(*)。そんなときは,これも優秀なPapago(Naver)を使えばよい。

本ブログのイントロを英訳してみたけれど,3年前より大分良くなったような気がする。

It has been 100 years since Ryunosuke Akutagawa published "The Spider's Thread. In the fall festival of my senior year of high school, the theme of our class costume parade was "The Spider's Thread. I cut out a piece of bamboo from the neighborhood for the Buddha's Paradise Tower and painted a picture of the flames and smoke of hell. It was the time when I was a hell wraith following Kandata and swarming around the spider's thread (the red rope of the mountain climbing club).


さて,そのDeepLが最近,DeepL Writeという文章校正(改善)ツールを出して話題になっている。今のところ,英語(イギリス),英語(アメリカ),ドイツ語のみの対応だ。これも早速試してみよう。

大阪教育大学のホームページの英語版の冒頭の紹介文を例にとってみた。

原文:
Osaka Kyoiku University (OKU), which was founded in May 1874 as a teacher training school, boasts over 140 years history and tradition. The current number of undergraduate and graduate students totals approximately 4,400, with another over 5,000 students matriculated in affiliated schools. Among Japanese universities, OKU is a one of the leading producers of qualified teachers and a leading large-scale college of education.

 The main campus of OKU was established in the Kongo Ikoma Kisen National Park, in Kashiwara City, Osaka. This campus is approximately 670,000 square meters in area. In addition, OKU also has a campus in Tennoji, in central Osaka.

 The university’s programs are designed to meet the high educational standards of a comprehensive teacher training university. OKU is made up 11 affiliated schools, including primary, secondary, and special needs education that are located in three areas of metropolitan Osaka: Tennoji, Hirano, and Ikeda city.

DeepL Writeによる改善:英語(アメリカ)
Osaka Kyoiku University (OKU), founded in May 1874 as a teacher training college, has over 140 years of history and tradition. The current number of undergraduate and graduate students is approximately 4,400, with more than 5,000 students enrolled in affiliated schools. Among Japanese universities, OKU is one of the leading producers of qualified teachers and a leading large-scale college of education.

 OKU's main campus was established in the Kongo Ikoma Kisen National Park in Kashiwara City, Osaka. This campus covers an area of approximately 670,000 square meters. OKU also has a campus in Tennoji, in the center of Osaka.

 The university's programs are designed to meet the high educational standards of a comprehensive teacher training university. OKU consists of 11 affiliated schools, including elementary, secondary, and special education, located in three areas of the Osaka metropolitan area: Tennoji, Hirano, and Ikeda City.


(1) 1行目のteacher training school は師範学校のことなので,colledgeでなくてもよい。

(2) 附属学校の収容定員が5000人が,matriculateになっていたが,これはenrolledが妥当か。

(3) 大阪の中央部が,in central Osaka から in the center of Osakaに。

(4) primary school がelementary schoolに。

(5) 大阪都市圏が,metropolitan Osaka から the Osaka metropolitan area に。

図:DeepLのロゴ(DeepLから引用)

*注:1/27/2023 DeepLは韓国語に対応した。31言語とはどれのことかな?(イタリア語,インドネシア語,ウクライナ語,エストニア語,オランダ語,ギリシャ語,スウェーデン語,スペイン語,スロバキア語,スロベニア語,チェコ語,デンマーク語,ドイツ語,トルコ語,ノルウェー語,ハンガリー語,フィンランド語,フランス語,ブルガリア語,ポーランド語,ポルトガル語,ラトビア語,リトアニア語,ルーマニア語,ロシア語,英語,韓国語,中国語,日本語)


2023年1月20日金曜日

博物館の定義(2)

博物館の定義(1)からの続き

日本の博物館法における博物館の定義を示したところだったけれど,実はその法律が改正されていた。博物館法の一部を改正する法律(令和4年)による新しい博物館法は令和5年4月1日から施行される。

そこでは第2条の博物館の定義が次のように変更された。
博物館法(昭和二十六年/令和四年)
(定義)
第二条 この法律において「博物館」とは、歴史、芸術、民俗、産業、自然科学等に関する資料を収集し、保管(育成を含む。以下同じ。)し、展示して教育的配慮の下に一般公衆の利用に供し、その教養、調査研究、レクリエーション等に資するために必要な事業を行い、併せてこれらの資料に関する調査研究をすることを目的とする機関(社会教育法による公民館及び図書館法(昭和二十五年法律第百十八号)による図書館を除く。)のうち、地方公共団体、一般社団法人若しくは一般財団法人、宗教法人又は政令で定めるその他の法人(独立行政法人(独立行政法人通則法(平成十一年法律第百三号)第二条第一項に規定する独立行政法人をいう。第二十九条において同じ。)を除く。)が設置するもので次章の規定による登録を受けたものをいう。
文化庁の博物館総合サイト(永く維持されますように・・・)に,博物館法改正の趣旨が書かれている。
(1)博物館設置主体と設置基準の変更:地方公共団体と各種法人という縛りがはずれた。ただし,国の独立行政法人による博物館は含まれない。このため私立博物館という概念はなくなった。設置基準は単純で外形的なものから微妙に恣意的なものに変わってしまった。利権と縁故の塊を引き寄せるかのような表現だ
(登録の審査)
第十三条
都道府県の教育委員会は,登録の申請に係る博物館が次の各号のいずれもに該当すると認める時は,当該博物館の登録をしなければならない。
一 当該申請に係る博物館の設置者が次のイ又はロに掲げる法人のいずれかに該当すること。
イ 地方公共団体又は地方独立行政法人
ロ 次に掲げる要件のいずれにも該当する法人(略)
(1) 博物館を運営するために必要な経済的基礎を有すること
(2) 当該申請に係る博物館の運営を担当する役員が博物館を運営するために必要な知識または経験を有すること
(3) 当該申請に係る博物館の運営を担当する役員が社会的信望を有すること
二〜六 (以下略)
(2)デジタルアーカイブの作成と公開,学芸員等の人材の養成・研修,博物館と地域の各主体・他の博物館・博物館相当施設等の連携:これらはOKかな・・・?

ようは,博物館を文化・観光・街作りのツールとして経済振興に活用できるようにすることが主目的のようだった(博物館法よおまえもか)。それがすべて悪いというわけではないけれど。建前は,文化芸術基本法に対応するためということで,実質は,文化観光振興法に対応するもののようだ(文化観光)。



2023年1月19日木曜日

博物館の定義(1)

博物館の定義が,国際博物館会議ICOM)の2022年8月の大会で定められ,その日本語訳が最近公表された。

博物館は英語ではMuseumなので,美術館を含んでいることがすぐにわかるのだけれど,日本語だと,博物館と美術館は頭の中で区別されてしまうので,ちょっと面倒である。

博物館法はあるが,美術館法はない。日本では博物館法の定義の中に美術館や動物園や水族館や植物園も包摂されている(日本の博物館の数現状)(注1)。
博物館法(昭和二十六年)
(定義)
第二条 この法律において「博物館」とは、歴史、芸術、民俗、産業、自然科学等に関する資料を収集し、保管育成を含む。以下同じ。)し、展示して教育的配慮の下に一般公衆の利用に供し、その教養、調査研究、レクリエーション等に資するために必要な事業を行い、あわせてこれらの資料に関する調査研究をすることを目的とする機関(社会教育法による公民館及び図書館法(昭和二十五年法律第百十八号)による図書館を除く。)のうち、地方公共団体、一般社団法人若しくは一般財団法人、宗教法人又は政令で定めるその他の法人(独立行政法人(独立行政法人通則法(平成十一年法律第百三号)第二条第一項に規定する独立行政法人をいう。第二十九条において同じ。)を除く。)が設置するもので次章の規定による登録を受けたものをいう。
そもそも教育基本法(昭和二十二年)→社会教育法(昭和二十三年)→{図書館法(昭和二十五年)・博物館法(昭和二十六年)}という構造で作られているらしい。
教育基本法(昭和二十二年/平成十八年)
(社会教育)
第十二条 個人の要望や社会の要請にこたえ、社会において行われる教育は、国及び地方公共団体によって奨励されなければならない。
2 国及び地方公共団体は、図書館、博物館、公民館その他の社会教育施設の設置、学校の施設の利用、学習の機会及び情報の提供その他の適当な方法によって社会教育の振興に努めなければならない。

社会教育法(昭和二十四年)
(図書館及び博物館)
第九条 図書館及び博物館は、社会教育のための機関とする
2 図書館及び博物館に関し必要な事項は、別に法律をもつて定める。

図書館法(昭和二十五年)
(定義)
第二条 この法律において「図書館」とは、図書、記録その他必要な資料を収集し、整理し、保存して、一般公衆の利用に供し、その教養、調査研究、レクリエーシヨン等に資することを目的とする施設で、地方公共団体、日本赤十字社又は一般社団法人若しくは一般財団法人が設置するもの(学校に附属する図書館又は図書室を除く。)をいう。
新しい博物館の定義の日本語訳は次のようなものだ。
博物館の定義
“博物館は、有形及び無形の遺産を研究、収集、保存、解釈、展示する、社会のための非営利の常設機関である。博物館は一般に公開され、誰もが利用でき、包摂的であって、多様性と持続可能性を育む。倫理的かつ専門性をもってコミュニケーションを図り、コミュニティの参加とともに博物館は活動し、教育、愉しみ、省察と知識共有のための様々な経験を提供する。”
なお,原文はつぎのとおり。
Museum Definition
“A museum is a not-for-profit, permanent institution in the service of society that researches, collects, conserves, interprets and exhibits tangible and intangible heritage. Open to the public, accessible and inclusive, museums foster diversity and sustainability. They operate and communicate ethically, professionally and with the participation of communities, offering varied experiences for education, enjoyment, reflection and knowledge sharing.”

注1:平成十三年に制定された文化芸術基本法の内容は大変すばらしいものだ。その中に,次のような施設の充実に関する項目がある。
(劇場、音楽堂等の充実)
第二十五条 国は、劇場、音楽堂等の充実を図るため、これらの施設に関し、自らの設置等に係る施設の整備、公演等への支援、芸術家等の配置等への支援、情報の提供その他の必要な施策を講ずるものとする。
(美術館、博物館、図書館等の充実)
第二十六条 国は、美術館博物館、図書館等の充実を図るため、これらの施設に関し、自らの設置等に係る施設の整備、展示等への支援、芸術家等の配置等への支援、文化芸術に関する作品等の記録及び保存への支援その他の必要な施策を講ずるものとする。
ここに現れる劇場,音楽堂,美術館は別の法律で定義されていた。
美術品の美術館における公開の促進に関する法律(平成十年)
(定義)
第二条 この法律において、次の各号に掲げる用語の意義は、当該各号に定めるところによる。
二 美術館 博物館法(昭和二十六年法律第二百八十五号)第二条第一項に規定する博物館又は同法第二十九条の規定により博物館に相当する施設として指定された施設のうち、美術品の公開及び保管を行うものをいう。

劇場、音楽堂等の活性化に関する法律(平成二十四年)
(定義)
第二条 この法律において「劇場、音楽堂等」とは、文化芸術に関する活動を行うための施設及びその施設の運営に係る人的体制により構成されるもののうち、その有する創意と知見をもって実演芸術の公演を企画し、又は行うこと等により、これを一般公衆に鑑賞させることを目的とするもの(他の施設と一体的に設置されている場合を含み、風俗営業等の規制及び業務の適正化等に関する法律(昭和二十三年法律第百二十二号)第二条第一項に規定する風俗営業又は同条第五項に規定する性風俗関連特殊営業を行うものを除く。)をいう。

2023年1月18日水曜日

ボイス キャンセリング マイク

ノイズキャンセリングイヤフォンというものがある。

環境音の中で音楽や会話を聞くとき,そのノイズを減らす機能を持つイヤフォンだ。このイヤフォンに内蔵されたマイクがひろう環境音が逆位相に変換され,干渉によってノイズを消す仕組みだ。

在宅ワークやオンライン授業で,イヤフォンをはめ続けるのもつらい。最近では,骨伝導イヤフォンオープンイヤースピーカーなど,耳に負担をかけない製品も使われている。その進化系として,オープンイヤースピーカーの音漏れを防ぐために逆位相の音を外向けに放出する仕組みをNTTの子会社nwmが開発しクラウドファンディングを募っている


時代は,GUI(Graphical User Interface)からVUI(Voice User Interface)に変わり始めているようなそうでもないような微妙なところで揺れている。XRヘッドセットを使って作業するのが当たり前になれば,キーボードもスマートフォンのタッチパネルも邪魔になる。そこで必要なユーザインターフェースは,音声や手話・身振りになるはずだ。

AlexaやSiriなどが登場したときは,声で機器を操作して音楽や動画を視聴する時代が到来したかと思ったものだ。ところが,一人暮らしでない家ではそうは問屋が卸さなかった。お互いに干渉せずにスマホやPCを使うにはいまでも,静かな指にたよらざるを得ない。

そこで思いついたのが,ボイス キャンセリング マイクだ。情報入力のためにマイクに届けたい声と逆位相の音をマイクの外側に発生して,他人からは自分の声がほとんど聞こえなくなる仕組みだ。誰か同じことを考えていないかと調べてみたら・・・ありました。Voice Canceller というコンセプトが2015年に提案されていた。残念。


XRヘッドセットを持っていない自分の場合,音声入力のニーズは入力の高速化からきている。最近は,macOSの音声入力の精度も上がっているので,かなりの速度で文字に変換することができるのだ。その観点からすれば,音声入力でなくともキーボードやフリック入力より速ければなんでもよいのだけれど。

ボイスキャンセリングマイクの実現が技術的に難しい場合は,筋電入力マイクかと思ったが,顔や首まわりにセンサーを装着するのは余計面倒だ。XRヘッドセットがデフォルトでないならば脳波でも同様にややこしそうだ。


図:nwmのオープンイヤー ノイズキャンセリング技術

[3]音の技術(ムーンショット・エフェクト − NTT 研究所の技術レガシー)

2023年1月17日火曜日

Pythonのタートルグラフィックス

Π角形からの続き

Pythonで同じようなタートルグラフィックスが使えないかと調べると,turtleという呼ばれるライブラリがあらかじめ用意されており,楽勝かと思われた。

お絵書きでPythonを学ぶというページにしたがって,コマンドラインで実行してみると,画像が出ない。どうやら,pythonからtcl-tkへのつなぎが必要らしい。brew install python-tk とごそごそやっていたらすぐ動くようになった。

落とし穴があった。インタラクティブな実行ではなく,プログラムファイルを作って一括処理を試みたときだ。見本のファイル名をturtle.pyとしたのがまずくて,循環参照のエラーが出てしまった。その原因がわからなくて踠いていたが,こういうときはエラーメッセージで検索するのが一番である。ファイル名をkame.pyとして事無きを得た。

次により大きな罠が控えていた。jupyter環境でpythonを実行させるほうが便利だろうと,kame.pyのコードをjupyter lab で実行させたところ,_tkinterが見つからないエラーで一歩も進めない。ネットの記事にはpyenvコマンドを駆使して,pythonを一回アンインストールしてからtcl-tkをインストールした上で,再度pythonをインストールすればよいとある。

その手順通りのままには進めずに四苦八苦したものの,指示通りにコマンドラインからtcl-tkを使ったライブラリが正しくインストールできたようには見えた(これは最初の段階と本質的には変わっていない)。それでもjupyterでは同じエラーが出てだめなのだ。どうやら,jupyterのpythonではturtleが使えないということになっているらしい(未確認)。

ProcessingのプログラムをPythonに移植したものを次に示す。

#!/opt/homebrew/bin/python3

# usage ./kame.py m n 

import turtle

import sys


m = float(sys.argv[1])

n = float(sys.argv[2])

r = 0

g = 0

b = 0

turtle.colormode(255)


turtle.begin_fill()

for i in range(255):

    r = (r+3) % 25

    g = (g+5) % 255

    b = (b+7) % 255

    turtle.pencolor(r,g,b)

    turtle.forward(200)

    turtle.left(360/m*n)

turtle.end_fill()


turtle.done()

pythonのトレーニングをしたと思うことにする。コマンドラインでm,nは入力しているが,簡単な有理数でないものを入れたい場合は,m=3.1415926 n=1 を代入すればよい。

図:pythonのΠ角形タートルグラフィックスの途中

2023年1月16日月曜日

Π角形

YouTubeでm/n角形という話題を見かけた。

これは,タートルグラフィックスの定番らしい。Processingでプログラムを作ってみることにする。久々のProcessingはロゴも変わりバージョンは4.1.1になっている。

タートルグラフィックスの見本コードがサンプルの中にあったので,それを参考にしてみる。クリックするとタートルが進むとして,k角形の形は,一辺の長さを進むタートルの進行方向(方向単位ベクトル)の方位角が,進むたびに360度/kづつ増加するものと定義する。

float turtleX;
float turtleY;
float turtleT;
float k;

void setup() {
  size(512, 512);
  turtleX = width/2;
  turtleY = height/2;
  turtleT = 0;
  k=3.1415926;
  background(255);
}

void forward(float go) {
  float newX = turtleX + go*cos(turtleT);
  float newY = turtleY + go*sin(turtleT);
  line(turtleX, turtleY, newX, newY);
  turtleX = newX;
  turtleY = newY;
}

void rotate(float rot) {
  turtleT = turtleT - radians(rot);
}

void mousePressed() {
  strokeWeight(2);
  stroke(mouseX/2,mouseY/2,random(0,255));
  forward(128);
  rotate(360/k);
}

ここではm/nとして簡単な有理数ではなくて,円周率の近似値(有効数字8桁)を与えてみた。つまり,Π角形の作図になる。マウスクリックでタートルが進むようにした上で,線の色はクリック位置と乱数の組み合わせで選ぶことにする。


図:Π角形作図の途中段階のイメージ

2023年1月15日日曜日

壇浦兜軍記

傾城恋飛脚からの続き

初春文楽公演第三部の後半は,壇浦兜軍記阿古屋琴責の段以前にも見ているが,勘十郎の指捌きが楽しみだ。阿古屋=呂勢太夫,重忠=織太夫,岩水=靖太夫,榛沢=小住太夫など6名の太夫が並んでいる。三味線は,清治が休演で藤蔵,これに寛太郎(ツレ)と清公(三曲)が加わる。清公は琴と三味線と胡弓の3つの楽器を弾くのでたいへんだろう。

人形は,勘十郎(阿古屋),玉志(重忠),玉佳(岩永),玉翔(榛沢)という配役。阿古屋は主遣いだけでなく左の簑紫郎,足の勘昇も顔を出すという珍しい三人出遣いだった。しかも黒子は1〜2名ついているというすごい布陣。あの豪華な衣裳で3つの楽器を操り,その度に右手は変えるなど手間がかかっている。

実際の音色と人形の手はやはり非常にうまくシンクロしているように見えた。今回気がついたのは,左遣いの簑志郎にもかなりの技術が要求されるということだ。また,琴や胡弓は清公が弾くのだが,三味線が音を重ねることで,人形との同期がよりわかりやすく表現されている。三味線のバチのアクセントがないと,かなり微妙に難しいことになりそうだ。

胡弓は三味線より一回り小さく,ヒザに挟んで押さえながら演奏していた。バイオリンやチェロなどの西洋弦楽器とは違い,弓捌きのときに楽器を回して弦を選択している。この部分とか開放弦のしぐさは,人形の左遣いの責任なのだけれども,さらに工夫の余地ありかもしれない。それでもすごいことはすごいのだ。

なお,歌舞伎で阿古屋ができるのは,玉三郎しかいないということで,YouTubeでその映像を探してみた。人間が舞台で三つの楽器を弾き分けながら演技もするという高度な技が求められていた。岩永は五代目勘九郎人形振りで演じていた。セリフはすべて太夫が出し,後ろにはダミーの黒子が二人ついていた。

勘十郎の姉の三林京子さんが観劇にきていて,舞台が跳ねると弟子の勘昇が手配したタクシーで一同は早々に引き上げて行かれた。

詳細な感想は,TOKYO巡礼歌 唐獅子牡丹に任せるけれど,このサイトも大変参考になる。


写真:国立文楽劇場の阿古屋人形(2023.1.12撮影)


2023年1月14日土曜日

傾城恋飛脚

国立文楽劇場の初春文楽公演,第一部は良弁杉由来,第二部は義経千本桜だった。

これらをスキップして,第三部の傾城恋飛脚(新ノ口村の段)と壇浦兜軍記(阿古屋琴責の段)を観てきた。そういえば,第一部は東大寺,第二部は吉野,第三部前半は新ノ口村と奈良県特集なのだ。さらに四月公演は,文楽協会六十周年記念の妹背山婦女庭訓の通し狂言が続くがこれも舞台は大和だ。なお,妹背山の四段目(道行恋苧環や金殿の段など)はなくて代わりに,近松門左衛門三百回忌として曾根崎心中が入っている。

近松の冥途の飛脚菅専助らが改作したものが傾城恋飛脚だ。その舞台である,新ノ口駅(奈良県の運転免許試験場の最寄り駅)は,近鉄橿原線の大和八木駅の隣にあり,駅前には梅川忠兵衛の記念碑も立っている。近くに住む県民にとしては,新ノ口村の段はなじみ深いのだけれど,最近の大和平野は舞台設定のように雪に包まれることもない。

は二階の御簾内の太夫と三味線から始まり,これは亘太夫かなと睦太夫の顔を想像しながら聴いていた。当たってないです。は藤太夫と清志郎で,女房お福のちゃり場風のあたりから,父孫右衛門が登場するまでを担当した。は,錣太夫と宗助。忠兵衛の養子先の養父への義理と自分の息子への愛情の葛藤というのが父孫右衛門のこころだ。しかしながら,封印切で得たお金のうちの40両(500万円)を20日で消費した忠兵衛の気持ちにはなかなか感情移入できない。

藤大夫は傾城(けいせん)と発音し,錣太夫は傾城(けいせい)だったので,ちょっと違和感があった。音曲の司にある床本だとどうやらそれが正しい。最後に,字幕の善知鳥が読めず聞き取れなかったが,これはウトウだった。臙脂色は濃い赤茶だし(大阪教育大学のシンボルカラーではないか),この歳にして世界は知らないことであふれている。


写真:新ノ口駅前にある梅川忠兵衛の碑(tetsudaブログから引用)

2023年1月13日金曜日

量子ピタゴラスイッチ

ビーだま・ビーすけ おどろきの秘密 大公開スペシャル!」のビデオに引き込まれてしまい,おもわず家を出発する時間が遅れてしまう老夫婦(注)。←体言止め

ピタゴラスイッチは,4-6歳児の考え方を育てる番組らしいが,2歳の孫からじじばばまで十分通用することが実証された。これをコンピュータの中で再現できたら(それほどおもしろくないけれど)便利かなと考えたが,案の定すでにアプリが存在していた。モノイズピタゴランがそれだ。試してみるとなかなかよく作られている。きかんしゃトーマスせんろをつくろうというのもある。グリコードに加えて手持ちのおもちゃが増えた。

さて,ピタゴラスイッチは古典物理学の決定論的因果連鎖によって成立する装置だけれど,これが量子物理学の確率論的因果連鎖になればどうなるだろう。なんのことはない,量子コンピュータというのは量子ピタゴラスイッチの一種に他ならない。ただ,一つのデバイス内の話では,電子回路はみんなピタゴラスイッチだと主張しているようなもので,有難みはない。

世の中に量子ピタゴラスイッチへの言及がないかどうか確かめてみると一件だけ見つかった。東大工学研究科物理工学専攻中村研に在籍していた宇佐見康二さんだ(現日亜化学工業?)。光-マグノン-マイクロ波-超伝導量子ビットのリンクあるいは量子ピタゴラスイッチというレポートがあったが,イマイチどのようにピタゴラスイッチなのかがわからなかった。


図:ピタゴラスイッチの「ピ」(ユーフラテスから引用)

(注)赤いビー玉(=大きさは無視しない小球)はピーすけだとばかり思っていたが,ビーすけなのね。ちなみに緑色はビータ,黄色はビーゴローらしい。

[1]748時間かけたピタゴラ装置  京都芸術大学(やぎみっくシステム ピタゴラスイッチ)

2023年1月12日木曜日

量子の冬 

いつものことだけれど,日経は美味しいトピックが見つかると,正月からぶっ込んでくる。今回のそれは,量子コンピュータだ。

1月3日のルイ・ビトン=草間彌生につつまれた日経朝刊の第一面トップ記事が,量子計算機と「富岳」連携 理研実用化25年に前倒し だった。スーパーコンピュータ富岳と理研の量子コンピュータのハイブリッドシステムを和光市の理化学研究所キャンパスに設置するらしい。「ハイブリッド型量子計算機」は世界の潮流になっていると煽っている。

arxivで調べても,hybrid quantum computing をタイトルに持つ論文は16編(全フィールドでも42編)しか見つからないんですけど・・・。富士通の2022年11月のプレスリリースを読んでみた。単に量子化学計算の所与の問題からHPC向けアルゴリズムと量子アルゴリズムのプログラムを生成して,適当に振り分けて使うだけのシステムに過ぎないように見える。8086に8087を付加して数値計算の高速化を図るというようなイメージでまったくない。

量子コンピュータの研究が中国や米国や欧州などで,日本を大きくしのぐ水準で進められているのは確かだとしても,追いつけ追い越せのためにありもしない幻想を振りまいて煽るのは道かと思う。もちろん,これは日経新聞などメディアだけの責任ではなく,怪しげな旗を振っている経済産業省や文部科学省にも問題があると思う。

こうなると,逆張りする人々も現れる。2022年12月に,CNET Japannでは,量子コンピューティングの今--「量子の冬」への警戒と実用化に向けた着実な進化という記事が出ていた。最もここで取り上げていたのは,YouTubeでお馴染の物理学者,あのSabine Hossenfelder なので,これはこれで適当に割り引いて見ておく必要がある。どっちもどっちでなんだかなぁ案件。


図:Image of Quantum Winter by DiffusionBee

[1]The Quantum Hype Bubble is About to Burst(Sabine Hossenfelder)

2023年1月11日水曜日

科学の未来

ChatGPTに科学の未来をきいてみた。

I want you to act as a futurist. I will provide you with the theme in parenthesis { } and you give me 5 topics on this issue that is important in the near future. You should use your mathematics, physics, astrophysics, computer science, AI technology knowledge to specify, explain and forecast on my theme. Using intelligent and professional language for expert people in your answers will be helpful. Please avoid any general, boring and common comments on this theme. My first problem is “on pure mathematics”

各分野に対してChatGPTが選んだ5つのトピックスを並べることにする。

純粋数学:(1) リーマン予想,(2) 連続体仮説,(3) コラッツの問題,(4) ホッジ予想,(5) P-NP問題・・・コラッツの問題はかなり微妙。(1)(4)(5)はミレニアム懸賞問題なので妥当だ。

現代科学:(1) 量子計算,(2) 地球外生命探索,(3) 気候変動と持続性,(4) ヒッグスボソンと標準理論,(5) 脳と神経工学・・・まあまあなのかもしれない。

現代物理学:(1) ダークマターとダークエネルギー,(2) 万有理論の探索,(3) 量子重力,(4) 新粒子探索,(5) ブラックホール・・・微妙に重複感と偏りが感じられる。

量子科学:(1) 量子計算,(2) 量子通信,(3) 量子計測,(4) 量子シミュレーション,(5) 量子力学の基礎・・・(4) はどうなのだろうか。

現代熱力学:(1) 量子熱力学,(2) 非平衡熱力学,(3) ナノ熱力学,(4) 情報熱力学,(5) 生命の熱力学・・・いいのかもしれない。

現代統計力学:(1) 相転移,(2) 確率過程,(3) 非平衡統計力学,(4) 乱れた系,(5) 臨界現象・・・微妙な気がする。

現代核物理学:(1) 核構造と核反応,(2) 核エネルギー,(3) 核兵器,(4) 医療用同位元素,(5) 天体核物理学・・・だいぶ微妙な気がする。

宇宙物理学:(1) ダークマターとダークエネルギー,(2) 宇宙論,(3) 太陽系外惑星,(4) 天体物理学,(5) 宇宙素粒子物理学・・・これでいいのかなあ?

コンピュータ科学:(1) 人工知能,(2) 機械学習,(3) サイバーセキュリティ,(4) データ科学,(5) モノのインターネット・・・微妙な気がする。

人工知能:(1) 深層学習,(2) 自然言語処理,(3) ロボティックス,(4) コンピュータビジョン,(5) AI倫理・・・こんなものなのか。

深層学習:(1) ニューラルネットワーク構築,(2) 転移学習,(3) 敵対学習,(4) 強化学習,(5) 説明可能AI・・・そうなのかもしれない。

全体にまあ無難だけれども専門家からするとドウヨという感じになっているのでは。


2023年1月10日火曜日

登録チャンネル(2)

登録チャンネル (1)からの続き

前回の確認から2年ほど経ったので,現在の状況をまとめておく。日本語でユーチュラに登録されているチャンネル数の合計は55,000ほどである。このうち自分が登録しているのは440チャンネル(0.5%のオーダー)だ。

よく見るチャンネル:
鈴木貫太郎,散財小説ドリキン,瀬戸弘司,シンギュラリティサロン,街録Ch,
ジョーブログ,バイオリンはじめちゃんねる,哲学系ゆーちゅーばーじゅんちゃん
たまに見るチャンネル:
うどんそば大阪奈良,小飼弾の論弾,一月万冊,ほんタメ,
ポリタスTV,菅野完,Nezumi,ワタナベカズマサ,カズチャンネル,
予備校のノリで学ぶ「大学の数学・物理」,吉田製作所,見守あらた,
コジコジのオタク文化情報局,イチケン,よめ子,ちゅんちゅんTV

これらのチャンネルの登録者数や再生回数は,ユーチュラのサイトで調べることができる。登録者数5000位(約15万人レベル)までにランクインしたのは次の通り(中田敦彦のYouTube大学*は参考値)。

26 中田敦彦のYouTube大学*
people 501万人, play_circle_filled 12億6472万3228回, videocam 869本
195 ジョーブログ【CRAZY CHALLENGER】
people 188万人, play_circle_filled 6億4883万5468回, videocam 604本
198 カズチャンネル/Kazu Channel
people 186万人, play_circle_filled 10億1321万3347回, videocam 2863本
252 瀬戸弘司 / Koji Seto
people 167万人, play_circle_filled 9億6055万6499回, videocam 2164本
508 吉田製作所
people 108万人, play_circle_filled 5億2620万5708回, videocam 507本
528 街録ch〜あなたの人生、教えて下さい〜
people 104万人, play_circle_filled 4億6366万5759回, videocam 968本
590 予備校のノリで学ぶ「大学の数学・物理」
people 95万9000人, play_circle_filled 2億1987万1703回, videocam 776本
1045 うどんそば 大阪 奈良 Udonsoba
people 62万9000人, play_circle_filled 1億9410万3175回, videocam 113本
1061 よめ子
people 61万9000人, play_circle_filled 6879万1176回, videocam 72本
2301 イチケン / ICHIKEN
people 33万人, play_circle_filled 4448万6016回, videocam 144本
2561 ワタナベカズマサ
people 29万7000人, play_circle_filled 1億1261万9616回, videocam 1721本
3141 一月万冊
people 25万人, play_circle_filled 2億380万9963回, videocam 3942本

2年前と比べて,よく見るようになったのが街録chである。後者はフリーディレクターの三谷三四郎(1987-)が2020年3月からはじめた街頭インタビューチャンネルだ。最初のころは,危険なタイトルのアングラチャンネルといった雰囲気だったが,登録者1万人を越え東野幸治にインタビューしたあたりから,メジャーなタレントも出演するようになり登録者数も100万人を超えた。

そこでは,インタビューイの思わぬ素顔に接することがある。最近では茂木健一郎だ。SONY CSLの脳科学者ということで,マスコミによく顔を出しているが,脳科学者というタイトルで売り出している人はほとんど怪しいことが多い。さらに,SNSでの権力寄りの発言がめだつころからなんだかなぁと見ていた。

しかし,茂木健一郎は東大の物理から理論生物物理で博士号をとっていて,自分の立ち位置についても十分客観的に把握していた。彼のクオリアの理論はよくわからないが,最近までの人工知能の動向についても十分専門家としての知識を持っている人だった。

なお,YouTubeに関する統計情報はこのサイトで見られる

2023年1月9日月曜日

国語の教科書

今年の成人の日は1月9日である。いつのまにか成人年齢の定義がかわり,成人の日も1月15日ではなくなってしまった。社会もこれに適応できていないので,成人の日の式典は20歳が対象になっているところが多い。これまたなんだかなぁ案件だ。

劇作家の鴻上尚史(1958-)が時事通信から「成人の日によせて」という原稿を依頼された。ところが,書いた文章に「体言止めが美しい*」といった理由で20ヶ所以上の直しが入ったので,編集者と決裂したらしい。

そこで,彼はTwitterにこの原文を公開して,若者に届けてようとしている。主旨は「自分で考えるな」といわれてきた高校生に,これからは「自分の頭で考えよ」というメッセージを送るものだった。

Twitterでは多くの人がその内容に賛同を表明していた。ただ,書評家で文学賞メッタ斬り豊崎由美(1961-)が一点だけコメントしていた。
〈僕達は、国語の授業でずっと「退屈な本ほど価値がある」と思い込まされてきました〉。僕はそうかもしれませんが、〈僕達〉と括るのはやめてほしい。わたしは国語の教科書で素晴らしい作家と大勢出会ってきました。
それは確かにそうだ。現代国語の教科書でいまでも記憶に残っているものはいくつかある。舞姫,山月記,こころなどの定番に加えて,一番真剣に授業に集中していたのは,志賀直哉の城の崎にてかもしれない。あと,中学生の教科書にあった平頭銛の話平田森三の発明)も印象的だった。

詩歌では次のとおり。国語の授業がすべて退屈だったわけではなかった。
与謝蕪村
 春の海ひねむすのたりのたりかな
 菜の花や月は東に日は西に
安西冬衛
 てふてふが一匹韃靼海峡を渡って行った
三好達治
 太郎を眠らせ,太郎の屋根に雪ふりつむ
 次郎を眠らせ,次郎の屋根に雪ふりつむ
*注:外岡秀俊の「伝わる文章が書ける」作文の技術 名文記者が教える65のコツ によれば,25 体言止めは使わない,なのだけれど。文字数制限の厳しい環境で生息してきた編集者にとっては,鴻上のていねいな口語表現がいやだったのだろう。それにしても言葉のプロにこれほどの直しを求めるとは如何にという意見も多数あり。

2023年1月8日日曜日

MacのOCR

だいぶ以前,MacでOCRを使いたいと思ったことがあった。散々探し回ったけれどなかなか適当なアプリケーションがなくてそのままになっていた。

ふと気がつくとMacでOCRできるコマンドがころがっていた。Tesseractというものだ。homebrewでインストールしてみると,すでに導入済みだ。あれ?いつ入れたっけ。覚えていないので再インストールし,ついでに日本語セットもインストールした。

brew install tesseract
brew install tesseract-lang
tesseract --list-langs | grep jpn
jpn
jpn_vert
tesseract test.png test.txt -l jpn+jpn_vert


tesseractでOCRを体験しようにあるような例を一通り試してみたところうまくいっている。横書きと縦書きの混合文も大丈夫だけれど,日本語と英語が混じっている場合,わずかに狂いが生じる場合もありそうだ。また,手書き文字はやはりうまくいかない。これが実用的かどうかはちょっと未知数。

しかし,そもそも何をOCRしようと思っていたのかを忘れてしまっている老人だった。

あっ,思い出した(というかblogを検索して見つけた,こういうときのために毎日ログをとっているわけだ)。WHOのCOVID関係のデータがpdfになっていて,そこからテキストデータを取り出したかったのだ。しかし,これは,pdftotextで解決済みだった(久々のPerl 2020.3.18)。


2023年1月7日土曜日

はぐれ惑星

NHKのコズミック フロントで,はぐれ惑星(自由浮遊惑星)を取り上げていた。

番組は阪大の住貴宏さんによる重力マイクロレンズ法の説明からから始まる。太陽系の外に存在している太陽系外惑星探索方法としては,次のようなものがある。(1) パルサータイミング法:パルサーの回りを枠背卯が回ることによるパルサー周期の変化による。(2) 視線速度法:ドップラー効果による恒星=惑星系の重心の回りをまわる恒星の視線方向の波長の変化による。(3) トランジット法:恒星の前を横切る惑星による恒星の光度変化による。(4) 重力マイクロレンズ法:遠方の天体(銀河・銀河団)の前を横切る恒星=惑星系の重力レンズ効果による天体の光度変化の微細構造による。(5) 直接撮像法:惑星が恒星から遠くにあって熱放射する場合。

もっともよく用いられるトランジット法は,惑星が大きく,恒星に近い場合にに有効であるが,重力マイクロレンズ法は,恒星から比較的遠くて小さな惑星について用いられる。現在までに,5300個ほどの系外惑星が発見されている。

重力マイクロレンズ法の結果から,惑星が恒星よりも存在している比率がはるかに高く,銀河系の恒星1個につき,恒星から0.5~10au離れた位置に平均で惑星を1.6個持つ事が推定された(Wikipedia 惑星系)。天の川銀河には2000-4000億の恒星があるので,恒星の回りを公転する惑星の数は数千億個ということになる。

さらに,惑星系の誕生期や恒星の終焉期にはじき飛ばされる惑星が,自由浮遊惑星として銀河系内を公転することになる。その浮遊惑星の数は恒星の数の2倍程度と評価されているらしく,これも数千個程度存在する。これは,住さんを含む国際共同チームが重力マイクロレンズ法を用いて最初のはぐれ惑星(Rogue Planet)を発見したことからきている。

さて,これについて,ChatGPTの見解を尋ねてみた。
Q:天の川銀河系にある恒星の総数,惑星の総数,自由浮遊惑星(はぐれ惑星)の総数を教えてください。

A:天の川銀河系には、恒星の総数が約100億個、惑星の総数が数百億個と言われています。また、自由浮遊惑星(はぐれ惑星)の総数は、まだ正確には分かっていませんが、数十億個と推定されています。

天の川銀河系は、銀河系の1つで、地球が属する銀河系です。銀河系は、恒星、惑星、小惑星、彗星、星雲などが含まれる天体系で、その大きさは広大です。天の川銀河系は、その中でも比較的小さい銀河系であり、銀河系全体に比べると、恒星や惑星の数が少なめです。
ChatGPTの天文学の知識もどうやら十分ではなかったようだ。しかし,平均的な人間に比べればまともな回答だ。その辺の高校生や大学生に聞いてもこうは答えられない。


図:Wikipedia Rogue Planet の説明を入力したときの DiffusionBee の出力


2023年1月6日金曜日

新聞も消える

本屋が消えるからの続き

本屋の話題では,比較のため新聞発行部数のグラフを示した。12月に日本新聞協会が最新データを出したことでこれがまた記事になっていた。例えば,「1年で200万部減「新聞離れ」は止まらず 「一般紙」は15年後に消える勢い」などだ。

外岡秀俊(1953-2021)は同じ1953年生まれだ。札幌南高校から東大法学部に進み朝日新聞に入社した。在学中に書いた北帰行は石川啄木をテーマとした小説で文藝賞を受賞した。出版早々に読了して強い印象を受けた小説だ。てっきり彼は作家の道へ進むのものと思ったところ,朝日新聞に入社して編集局長までなったことに二度驚いたものだ。

彼が残した最後の論考が,「敗因」から探る新聞の未来,縮小か大胆なDXで再生か(Journalism 2022年1月号)だ。そこで指摘されていたのは日本の新聞社の敗因だ。それは,成功体験からの脱却ができなかったということにつきる。2000年に入ってからのDXに転換する最後のチャンス(当時はDXというキーワードはなかった)をみすみすと逃してしまった。

新聞やテレビの報道機能が縮小していくとして(すでにジャーナリズムの崩壊は進んでいる),外岡秀俊が最後に述べていたメディアの機能は誰がどのようにして維持していくのだろうか。あるいは民主主義が既存メディアと一蓮托生で終焉を迎えるのかもしれない。
SNSの時代が,この先どう変容するか,予見することはできない。だが,埋もれた事実を果断・公正に報道し,誤りがあればお詫(わ)びと訂正を出して品質を担保し,分断の時代に広い言論のフォーラムを提供するというこれまでのメディアの機能と役割は,どのような時代でも,欠かせない民主主義のインフラであり続けるだろう。


図:日本新聞協会のデータから(亀松太郎氏の作図を引用)


2023年1月5日木曜日

小鍛冶 

正月に孫の世話をするのはたいへんだ。

バーバもカーカもお節料理の準備で手一杯なので,ジージにもその順が回ってくる。そんなときは,NHKの教育テレビ(Eテレ)が神様だ。普段はおかあさんといっしょとかピタゴラスイッチを見せている。元旦のEテレは,新春能狂言 能「小鍛冶 白頭」をやっていたので,5歳と2歳はテレビにかじりついて見ていた。

謡曲「小鍛冶五番目物)」のストーリーは次のとおり(精選版日本国語大辞典から引用)。
三条の小鍛冶宗近は剣を打てとの勅命を受けるが相鎚あいづちの者がいないので当惑し,稲荷明神に祈誓に行く。すると童子が現われ,力を貸し与えようといって消える。宗近が用意を整えると,稲荷明神が現われて相鎚をつとめ,名剣小狐丸ができあがる。

稲荷明神が頭に狐の型をつけていた。何も知らないジージは,頭にネコがいるというと,すーちゃんは違うよと。イヌだ。うぅうん。キツネかなというと,そうだよとやっとOKが出た。すーちゃんは何でキツネだとわかったのだろう。


図:小鍛冶のシテの頭のキツネ(銕仙会から引用)

小鍛冶のワキの三条宗近は,平安時代の刀工である。京都の三条通りに住んでいたことからその名がついているが,現在では若草山の麓に三條小鎩治宗近の店がある。

追伸:ChatGPTにクイズを出してみたところ,正解したのだが,後半の説明はウソだった。

Q:能の小鍛冶のシテの頭についている動物は次のどれでしょう。(1) イヌ,(2) ウサギ,(3) キツネ,(4) ネコ の中から選んでください

A:(3) キツネが正解です。能の小鍛冶のシテの頭には、キツネの形をした帽子がついています。能の小鍛冶は、日本の伝統的な芸能の一つで、演者が鎧を着て、剣や槍などの武器を使いながら、模擬戦や舞踏を演じるものです。能の小鍛冶のシテは、その中でも特に重要な役割を担う演者で、能の小鍛冶を指導する役割を担っています

2023年1月1日日曜日

(冬休み 7)

「春の兆しを素手で掬う*」 (ChatGPT 2022)

*ChatGPTが生成した俳句,新年を指定したもの。もうひといきか。