ラベル 言語 の投稿を表示しています。 すべての投稿を表示
ラベル 言語 の投稿を表示しています。 すべての投稿を表示

2024年3月3日日曜日

「自分の考え」(あるいは課題発見力の重要性)

デジタル化と「考える力」の喪失からの続き

MacBookAirのメモ大掃除シリーズ第2段である。これは2014年6月24日の夜のメモ。

「自分の考え」(あるいは課題発見力の重要性)
というのは「問いと答えのセット」のことであり,いかに適切な問いを立てそれに答えるか,が「自分の考え」の実体である。「自分の考え」は,問いにおいて,あるいは,答えにおいて,同じ世界を生きる他者のそれらと共通する部分を持っているだろう。人々に共通する問いに対して十分に納得のできる答えを用意すること,あるいは,人々が潜在的に感じていて言語化できなかった問いを発掘して磨き上げ,それに対して十分に推敲された適切な解答を提示しようとする態度が,人々の信頼や関心を集めることになる。

「会話」は,このような潜在的な問いと答え,あるいは,顕在的な問いと答えが編み込まれたストリームとして存在する。繰り返される問いと答えに感情の絵の具が塗られたタペストリーとしての会話。「自分が考える」ということは「問いと答えのセット」の往還を持続することであり,その適応範囲を拡げながら問いや答えの質を高めるためにも,他者との「問いと答えの交換」は不可欠なものである。

常に問いを準備せよ,常に答えを準備せよ,それは対話の中で次のステップへと歩みを進めることを可能にする。大学の将来像については,それを巡る問いと答えの膨大な集積の中に解決を探るしかない。しかし,自然現象とは異なり,社会的な制度として,人為的な境界条件の制約を課されていることから,問いは問いたりえず,答えは答えたりえない場合も少なからず存在している。あらかじめ答えが限定された問いを自らに強制され,あたかも自発的にその答えを発見したかのように擬制されるケースは列挙に事欠かない。

「問いと答えのセット」を既存の知識と論理の中で延長し拡大しようというのが哲学
「問いと答えのセット」を対象操作的な実験や観測により発見しようというのが科学
「問いと答えのセット」を主体と環境との相互作用の中で現しようというのが芸術
言語化されない「自分の考え」=「問いと答えのセット」も世界には存在している

言語で表現された「問いと答え」からは捨象されて見えるかもしれないが,すべての問いと答えには,その問いや答えが発せられた時空(世界)における,時間(歴史)と空間(構造)と情報(主体)のラベルが貼られているのであって,それによって問いの意味も文脈も相互作用もすべてが規定されてくることになる。

従来であればマスコミや知的権威などの,あるいは最近であればインターネットメディアで増幅された「他者」によって発せられる仮想の問いと仮想の答えに毎日さらされている私たちは自らの問いと答えを作り出す力が衰えている。「他者」の問いに「他者」が答えることを学ぶ(まねする)。
一箇所修正した。芸術の定義は,「実現」となっていたが「表現」の方が適切だ。最後は尻切れトンボで終っている。課題発見力というのが問いを立てる力だということかな。

2024年3月2日土曜日

デジタル化と「考える力」の喪失

MacBookAirのメモを整理し始めた。もっと暖かくなったら,本の整理も始めよう。

この過程で,古くなったテキスト断片を貼り付けてみる。以下は2013年5月5日のもの。

手書き(アナログ)かタイプ(デジタル)かというのは本質ではない。
一方で,思考過程における身体性の意味を押さえる必要がある。
「身体化された心の人類学的解明」

ウェブやスマホのSNSに没入して,他者の言葉の断片とその連鎖の中を漂うとき,自分は他者の言葉で考えている。それらをなぞることで,疑似的に「自分」の考えを紡いでいる。いや,「自分で考える」ということも,本質的にはこれと替わらないのかもしれない。既存の言葉と概念を材料として,自分で積み木を組み上げる作業が「考える」ということ。DNAプールから長い年月をかけて「試行」を繰返し,その環境や相互作用の中で最適化を進めるプロセスと類似している「思考」の過程。言葉と概念の並び替えと繋ぎ替えが,考えることの本質だとするとき,デジタル化は何を奪うことになるのだろうか。言葉と概念のストックを自分の脳の中から,インターネット空間に拡大し,リンクの作業を既存のリンクで代替する。「本を読む」ことや「論文を読む」ことは,他人の思考過程を追試することであった。それは「自分で考える」ための練習でもあったわけだが,そのような完成した思考過程の成果の学習ではなく,思考のためのトレーニングあるいは非トレーニングがデジタル化された情報空間で展開される。アナログ情報空間とデジタル情報空間の差異は何か。我々はどの空間に生息しているのか。重なり合う2つの宇宙の狭間で,乗り移りを図る知性体のありようは,小松左京のSF短編で示された,宇宙からの脱出の実体を表現しているのかもしれない

言葉を紡ぐ,音を紡ぐ,色と形を紡ぐ,論理を紡ぐ,身体運動を紡ぐ,すべてが考えるということであり,そこに,身体性が・・・
まだ,孫の紡木くんが生まれる前だ。多分,引用されている「身体化された心の人類学的解明」にインスパイアされて考えたことをメモしたもの。もちろん生成AI登場以前だ。表題についての考えはこれっぽっちも進んでいないのだ。

2023年12月15日金曜日

Duolingo

今年の春に始めた iPhoneアプリDuolingoでの韓国学習である。

最近は,朝起きて新聞とテレビのニュースをチェックした後に,Duolingoで韓国語のレッスンをするのが日課になっている。iPhoneの先週のアクセスログをみると,一日平均3時間のうち,Facebookが45分,Duplingoを30分,Pikmin Bloomが20分,GoogleとLineが15分ということになっている。

単語の表記と発音と意味,韓国語の和訳あてはめ,韓国語読み上げのハングルあてはめ,日本語の韓国語訳ハングルあてはめ,など15問ほどで1セットである。単語ごとにヒントを確認できるので,覚えていないあるいは理解できていなくても,勘だけで何となく答えられてしまう。いいようなわるいような。

ヒント頼りなので,ほとんど実力がつかない。ハチマン,毎日繰り返していると記憶に残る単語も少しはあるので,韓国ドラマを見ていても,以前よりは意識に引っかかる会話が増えてきた。


図:今年11月30日時点のDuolingoの成績(実はソコまで出来ていない)

2023年12月14日木曜日

フェイスブックで,芳賀さんが息子のりんちゃんから受けた質問について書いていた。

人生でどのくらい,文字の「」を書かないといけないか」という趣旨のものだ。なぜその質問がでてきたのかはよくわからない。なぜ「棒」なのかな。書くのが面倒だからなのかな。そういう話ではないのかな。犬も歩けば棒にあたったのかな。

準備のための一般論
 モノゴコロついてから惚けるまで,およそ75年≒900ヶ月≒3900週≒2万7千日≒66万時間≒3900万分≒24億秒あるとする。このとき,人生におけるある事象の頻度と総数はおよそ次のように対応する。
 10年に 1回 〜 10回
   3年に 1回 〜 30回
   1年に 1回 〜 100回
  年に 4回 〜 300回
  月に 1回 〜 1000回
  週に 1回 〜 4000回
   3日に 1回 〜 1万回
   1日に 1回 〜 3万回
   1日に 3回 〜 10万回
名前との比較
 一生の間に自分の名前はどのくらい書くだろうか。宅配のサインも含めて週に1回よりは多いような気がするので,多分1万回のオーダーになる。「棒」はこれよりは2桁以上少ないのではないか。100回ほどか

ブログの計量
 自分のブログであるOn a Thread of the Webの5年分のデータを全文検索してみると,「棒」は16回ヒットした。つまり,最近は年平均に3回ということになる。75年をかけると,生涯では 200回 程度書くことになるのではないか。

生成AIの考え
Q(私):日本人が一日に書く漢字の数は400字程度です。一生には,1000万字程度の漢字を書くことになるでしょう。このうち,「棒」という漢字を書く回数は何回程度だと推定されますか?
A(Claude):
はい、ご指摘の通り、日本人が一生のうちに書く漢字はおよそ1000万字とされています。このうち、「棒」という漢字が何回含まれるかを推定するため、次のように考えます。日本語の漢字使用頻度データによると、「棒」の出現頻度は0.0026%,1000万字の0.0026%は2600字。したがって、一生のうちに書く漢字1000万字のなかで、「棒」という漢字が含まれる頻度はおよそ2600回と推定されます。
なお,Copilotが4690回,Perplexityが4800回,Bardは200万回,ChatGPTは10億回と答えた。(注)上記の仮定である1日に400字というのは,手書きだけではなくて,SNSなどでのスマホやPCにおけるデジタル入力も含めたつもりだけれど,どうだろうか。

漢字出現頻度
 ClaudeやPerplexityは,漢字の出現頻度という量を持ち出してきた。Perplexityでは,0.0048%とされた。そんなデータがあるのかと検索してみた。令和1年に文化庁の漢字出現度数調査というレポートがある。出現確率ではなく,出現順位が与えられている。棒は1200位あたりで,結構高頻度で出現する文字だった。もう少し調べてみると,mwSoft Blog[1]というサイトが見つかった。2012年6月Wikipediaデータにおける出現漢字をまとめたものだ。このデータを拝借すると,「棒」は1375位で38,285回/528,530,037回(上位3000字の総計)=0.00724%=724回という結果が得られた。

結論
 平均的な人が「書く」漢字の「棒」は,100回〜1000回程度じゃないでしょうか。

参考(学校で棒が出てくる場面)
 棒読み。棒暗記。棒立ち。棒グラフ。棒磁石。乳棒。制御棒。溶接棒。指揮棒。鉄棒。棒高跳び。段違い平行棒。棒球(だま)。綿棒。編み棒。棒針。相棒。泥棒。片棒。棒ダラ。アメン棒。お先棒。棒切れ。火かき棒。金棒。警棒。用心棒。こん棒。ゲバ棒。点棒。

P. S. このページだけで12年分くらいの「棒」を書いてしまった。


写真:画像生成AIがイメージしている「棒」(Diffusion Beeより引用)


2023年6月8日木曜日

会話行動に関する調査


シンセティック・メディアについて考えるための,人の情報環境について考えていた。情報通新メディアの利用時間のデータは見つかったので,対面コミュニケーションの時間のデータがないか探してみた。国立国語研究所日常会話コーパスプロジェクトの中に,「一日の会話行動に関する調査報告(2017)」が見つかった。

243人の調査対象に平日2日,休日1日のすべての会話を記録してもらった結果,1日平均の会話数 12.7回,会話時間長 6.2時間,1回の会話時間 29分という結果になった。会話時間の約6時間というのは,情報通信メディアの利用時間約6時間とほぼ同じであった。


図:一日の平均会話の特徴

会話相手の人数がN人の時,自分の発話割合は,1/(N+1)である仮定する。上記の相手人数の割合の加重平均をとれば,(38.3/2+17.9/3+12.5/4+6.6/5+4.3/6+3.2/7+1.9/8+1.5/9+1.1/10+12.7/20)%=32%となる。
したがって,一日の平均会話時間の1/3の2時間は自分が話し,残りの4時間は相手の話を聞いているということになる。

2023年3月23日木曜日

「これは個人的な意見ですが…」

金沢に一泊して用事をすませてきた。ChatGPTはやはり話題に登場した。帰ってきて,物理教育学会誌が届いたが,その編集後記もChatGPTの話題で持ちきりだった。新聞でもネットでも毎日のように生成型AIを巡るニュースが飛び交っていて,すべてをフォローするのは困難だ。

GPT-4に俳句について聞いてみた。GPT-3.5より多少マシだったが,これはまだ普通の水準に達していなかった。数学的な計算も同様で,プロンプト工学ではカバーできそうにない。それでも着実に能力は高まっている。以下は,わりとまともな答えが帰ってきた例である。
Q:組織における制度化された会議の場で,あるいは打ち合わせ等での意見交換の場で,「これは個人的な意見ですが・・・」と前置きされる発言がでることがしばしばあります。この表現は何を意味していて,どういう機能を果たしているのか,いくつかの類型に分けて整理しながらの説明をお願いします。

A:この「これは個人的な意見ですが・・・」という表現は、主に以下の機能を果たしていると考えられます。様々な類型に分けて整理してみました。

1.責任の回避
この表現を使うことで、発言者は自分の意見が組織やチームの意見として捉えられることを避けることができます。これにより、意見が受け入れられなかった場合や問題が生じた場合でも、発言者個人への責任を最小限に抑えることができるでしょう。

2.柔らかい意見の表現
この表現を使うことで、発言者は自分の意見を他者に押し付けることなく、柔らかく提案できます。これは、対立や摩擦を避けるために役立ちますし、他者が意見に対してオープンである可能性を高めるでしょう。

3.オープンな議論の促進
「これは個人的な意見ですが」は、発言者が自分の意見に対して完全に自信がないことを示唆する場合もあります。この表現を使うことで、他者に対して意見についてのフィードバックや異なる視点を提供する機会を与えることができます。

4.エキスパートでない立場からの意見提供
発言者がその分野の専門家ではない場合や、十分な情報を持っていない場合に、この表現を使うことがあります。この場合、発言者は意見を提供しつつも、自分がエキスパートでないことを明示し、他者からの補足や訂正を歓迎する態度を示すことができます。

5.異なる意見や視点の提示
組織内で既存の意見や方針に対して異なる視点を持っている場合、発言者は「これは個人的な意見ですが」と前置きすることで、新たなアイデアや視点を提案しやすくなります。これにより、組織全体の意見や方針の多様性を促進することができるでしょう。

総じて、「これは個人的な意見ですが」という表現は、意見交換の場において多様な意見を尊重し、

続けて

オープンな議論を促進するための有用な表現です。この表現を使用することで、以下のような効果も期待できます。

6.階層を超えた意見の提案
組織内で階層が存在する場合、「これは個人的な意見ですが」という表現を使うことで、上層部に対して意見を提案しやすくなることがあります。この表現は、自分の意見が組織全体に適用されるべきだと主張しているわけではないことを示しているため、上層部に対して敬意を払いつつ、意見の提案が可能になります。

7.時間をかけて意見を検討する余地の提供
「これは個人的な意見ですが」という表現を用いることで、他者に対して即座に意見を評価し、決定を下すことを求めない空気を醸成できます。これにより、意見がじっくりと検討される可能性が高まるでしょう。

8.チームのコミュニケーションを円滑にする
この表現は、チーム内での意見の対立を和らげ、より建設的なコミュニケーションを促す役割を果たします。相手に対して敬意を示し、意見の違いを受け入れやすくすることで、チーム全体の関係を強化する効果があります。

これらの類型に分けられる機能を通じて、「これは個人的な意見ですが」という表現は、組織内での意見交換や会議の場をより有意義で生産的なものにする助けとなります。発言者はこの表現を用いることで、自分の意見を適切な形で伝えることができ、他者とのコミュニケーションを円滑に進めることができるでしょう。
そこで,更問いしてみた。
Q:このような表現は日本以外の国でも見られるのでしょうか。

A:「これは個人的な意見ですが」という表現に相当するものは、日本以外の国でも見られます。異なる言語や文化においても、同様の表現が使われることがあります。以下にいくつかの例を挙げます。

英語圏:「In my opinion...」(私の意見では…)、「I personally think...」(個人的には思うんですが…)、「Just my two cents...」(たった2セントの価値しかないかもしれませんが…)などの表現が使われます。

スペイン語圏:「En mi opinión...」(私の意見では…)、「Personalmente pienso que...」(個人的には思いますが…)などの表現が使われます。

中国語圏:「我个人认为...」(私個人としては思いますが…)、「在我看来...」(私の見解では…)などの表現が使われます。

ドイツ語圏:「Meiner Meinung nach...」(私の意見では…)、「Ich persönlich denke, dass...」(個人的には思うんですが…)などの表現が使われます。

これらの表現は、日本語での「これは個人的な意見ですが」と同様に、意見交換や会議の場において、発言者が自分の意見を柔らかく提案し、他者との対立を避けることを目的として使用されます。ただし、国や文化によっては、このような表現が一般的であったり、逆にあまり使われなかったりすることもあるため、異文化間でのコミュニケーションの際には注意が必要です。

勉強になるわ。これがどこまで正しいか分からないけれど,普通に人間同士の会話でもこの程度のもっともらしいが正確かどうかわからない情報は飛び交っている。また,デマゴーグになれば,SNS上であるいは国会で出鱈目を言いまくっているので,まあ,なんともいえないところである。


2023年3月12日日曜日

幽霊漢字

 今日,第1回AIアートグランプリ発表があった。主催がドスパラ(サードウェーブ)で事務局が清水亮さんのMEMEPLEXだ。

279件の応募作品から,17作品が第一次選考を通過した。そのうち12作品が佳作であり,第2次選考を通過した5作品から,グランプリ1作品と準グランプリ4作品が選ばれた。なんと,グランプリは,backspace.fmでお馴染の松尾公也さんの「Desperado by 妻音源とりちゃん[AI]」だ。

これまでも亡くなった妻のとりちゃんの音源を作ってきたが,AIによって画像イメージも生成した上に,自分の歌声をとりちゃんの声に変換できるようになった。さらに3次元化にもチャレンジしているらしい。自分の声やテキストもAI化して残る未来を想定している。

最近,テクノエッジを運営するテクノコアに入社した松尾さんは,MacUserの初代編集長で,有料メールマガジンMacWIREも立ち上げている。ドリキン,西川善治と3人で毎週流しているbackspace.fmの話が面白い。

さて,AIアートグランプリで印象に残ったのは,カラス=ヨーロッパ中世の防疫マスクで登場した機能美Pさんの作品だ。急遽作られた審査員特別賞も受書した。AIグランプリなのにAIは2%しか使っていないというメタコンセプトの「そんな話を彁は喰った」がその作品だ。そのタイトルに登場する漢字「彁(か・せい)」は幽霊漢字とよばれている。

1978年に通商産業省が制定したJIS C 6226(後のJIS X 0208)では,いわゆるJIS第1・第2水準漢字として6349字が規定された。このとき典拠は次の4つの漢字表だ。
 1. 標準コード用漢字表(試案): 情報処理学会漢字コード委員会(1971年)
 2. 国土行政区画総覧: 国土地理協会(1972年)
 3. 日本生命収容人名漢字: 日本生命(1973年、現存せず)
 4. 行政情報処理用基本漢字: 行政管理庁(1975年)
この中に,音義・使用例の不明な文字があることが指摘され,辞書類に収録されながら実用例のない単語を意味する「幽霊語」をもじって「幽霊文字」と呼ばれるようになった(WIkipedia 幽霊文字から抜粋引用)。

また知らなかった事実に出会うことになる。犬も歩けば棒に当たる。

図:幽霊漢字の例(

P. S. AIアートグランプリはNHKニュースでも取り上げられて,松尾さんがインタビューに答えていた。


[1]「松尾PはなぜAIアートグランプリで優勝できたのか?!」(第1965話 shi3z & drikinの#AIドリフト)
[2]第一回AIアートグランプリを受賞したので自分の作品解説とファイナリスト作品への感想。そしてその先(CloseBox)(松尾公也)
[3]第1回 AI Art GrandPrix が素晴らしかった件(白井暁彦)

2023年2月25日土曜日

한글(ハングル)

韓国ドラマを見るのが習慣化しているので,ハングルや韓国・朝鮮語の勉強をしておく必要がある。doulingoで毎日少しづつ学んでいるが,なかなかおもしろい。

ハングルは,1443年に李氏朝鮮第4代国王の世宗大王が,訓民正音(朝: 훈민정음,略称: 正音)の名で公布した表音文字だ。日本の表音文字のカタカナやひらがなと異なり,陰陽五行思想の創成原理に基づいたものであり,理論的で美しいし学びやすい。macOSのHangulローマ字入力(HNC)を使うと,簡単に入力することもできる。

韓国ドラマでは漢字はほとんど出てこない。漢字復活論があると耳にしたので,Bing Chatに聞いてみると次のようなことだった。知らんけど。

漢字の利用を進めるようにという意見や、韓国政府の施策についてですね。漢字復活論は、保守新聞や学術界、保護者などが主導しています12。彼らは、漢字は文化や歴史の伝承に重要であり、また外国語学習や知的活動にも有益だと主張しています13。一方で、漢字廃止論は、ハングルだけで十分であり、漢字は民族主義や反日感情に基づいて排除されるべきだと言っています3。

韓国政府はこの問題に対して消極的な姿勢をとっており、「教えろとも教えるなとも言わない」という態度を示しています4。しかし、2019年から小学校の教材に漢字を一部復活させる方針を打ち出しました52。これは、多くの韓国人が漢字の必要性を認識し始めたことや、中国との経済関係の強化などが背景にあると考えられます56。

基本子音(14)うち激音(4)

ㄱ (g), ㄴ (n), ㄷ (d), ㄹ (r, l), ㅁ (m), ㅂ (b), ㅅ (s), 

ㅇ (ng: x), ㅈ (j), ㅊ (ch: c), ㅋ (k), ㅌ (t), ㅍ (p), ㅎ (h)

重子音=濃音(5):

ㅋ (kk: G), ㄸ (dd: D), ㅃ (pp:B), ㅆ (ss: S), ㅉ (jj: J)

基本母音(10):

 ㅣ (yi: i),  ㅏ (a),  ㅑ (ya, ia),  ㅗ (o),  ㅛ (yo, io),

ㅡ (eu: w),  ㅓ (eo: e), ㅕ (yeo: ye, yie),  ㅜ (u),  ㅠ (yu), 

重母音(11):

ㅐ (ae: ay, ai), ㅒ (yae: iai, iay, yai, yay)

ㅔ (e: ei, ey), ㅖ (ye: yei, yey) , ㅢ (wi: wi)

ㅘ (wa: oa), ㅙ (wae: oai, oay), ㅚ (oe: oi, oy)

ㅝ (wo: ue), ㅞ (we: uei, uey), ㅟ (ui: ui, uy)

終声パッチムの音価(7):

앙 (ang); 안 (an); 암 (am); 알 (ar); 악 앜 앆 (ag)

앋 앝 앗 았 앚 앛 앟 (ad); 압 앞 (ab) 


2023年2月2日木曜日

ChatGPTの近況(2)

ChatGPTの近況(1)からの続き

そうこうしている内に,OpenAIは,ある文章がChatGPTのようなAIによって作られたものか,人間が書いたものかを判別するツールをオープンした。AI Text Classifier である。どうやら教育・学習の場で ChatGPTが使われることに対する批判への一つのエクスキューズのような雰囲気だ。なお,Educator considerations for ChatGPT にOpen AI側からの詳細なコメントがある。

AI Text Classifierには,現在のところ次のような制限事項がある。
・最低1,000文字(約150~250ワード)が必要である。
・分類器は必ずしも正確ではなく,AIが生成したテキストと人間が書いたテキストの両方を誤って分類することがある。
・AIが生成したテキストは,分類器を回避するために簡単に編集できる。
・分類器は,主に大人が書いた英語のコンテンツで学習したため,子供が書いたテキストや英語でないテキストでは間違う可能性が高い。(つまり日本語には対応していない)
一方の,ChatGPTの方には,数学的な扱いが少し賢くなったようなメッセージが見えた。早速,二次方程式の問題に挑戦する。x^2-5x+6=0 である。これは簡単に因数分解できるのだけれど,解の公式を当てはめて答えの3と2を導いている。しかし,2x^2+3x-2=0 の場合は,x=(-3 ± 5)/4 までは正しいのだが,最後の答えが 2と-1なのだ。なんでやねん。

次に,ChatGPTに,"please explain the general method so solve quadratic equation, for junior high school students" と入力して得られた1150文字の回答をAI Text Classifierにいれると,確かに,AIが作った文章だと判定された。まだ様子見の段階。

2023年1月31日火曜日

形態素解析

コンピュータによる自然言語処理のアルゴリズムで第一に取り上げられるのが形態素解析である。品詞情報がならんだ辞書をもちいて,原文を形態素(品詞情報付き)に分解できる。

これを実現するソフトウェアとしては,大学等で開発されたいくつかのフリーソフトが有名だった。Juman / Juman++ChaSenKAKASIMeCab(工藤拓),SudachiKuromoji(atilica),janome(打田智子)などである。MeCabがポピュラーなのだけれど今となっては少し古いのかもしれない。これまで,MeCabになじんできたので,Juman++出力形式はやや違和感がある。

さて,しばらく前に,mecab-neologdというMeCabの最新辞書を導入した。それでもたりない場合は,ユーザ辞書を定義して使うことになるのでチャレンジしてみる。その前に,システム辞書をipadicからipadic-neologdに変更してみた。
vi /opt/homebrew/etc/mecabrc
configuration file の dicdir の修正:
; dicdir =  /opt/homebrew/lib/mecab/dic/ipadic
dicdir = /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd
次に,「ユーザ辞書登録をやり直す」にしたがって,ユーザ辞書を使えるようにしてみた。
cd /opt/homebrew/lib/mecab/dic
vi userdic.csv
cat userdic.csv

行政組織,,,1000,名詞,一般,*,*,*,*,行政組織,ギョウセイソシキ,ギョウセイソシキ

出発点,,,5000,名詞,一般,*,*,*,*,出発点,シュッパツテン,シュッパツテン

95%信頼区間,,,5000,名詞,一般,*,*,*,*,95%信頼区間,キュウジュウゴパーセントシンライクカン,キュージューゴパーセントシンライクカン

/opt/homebrew/Cellar/mecab/0.996/libexec/mecab/mecab-dict-index -d /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd -u userdic.dic -f utf-8 -t utf-8 userdic.csv
mecab -u /opt/homebrew/lib/mecab/dic/userdic.dic

これで使えるようになる。ユーザ辞書のcsvファイルの構造は次のようになっている。
表層形,左文脈ID,右文脈ID,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用型,活用形,原形,読み,発音
左右の文脈IDは空欄でよいらしい。またコスト値を推定する方法についてはもう少し調べる必要がある。

2023年1月29日日曜日

茶道

NHKの近畿のニュースで小学生の茶道教室の話題があった。アナウンサーが茶道(ちゃどう)と発音して紹介している。NHKは最近よく間違えるわと思ってみていると,2回目も「ちゃどう」と。あれ,もしかして「さどう」だと思っていた自分のほうがおかしいのか?

さっそく,物書堂の精選版日本国語大辞典で確かめてみると・・・
ちゃ-どう【茶道】〘名〙
①茶の湯を催すことによって静寂閑雅の境地にはいり,礼儀作法を修める道。…。さどう。

さ-どう【茶道・茶頭・茶堂】〘名〙
①(茶頭・茶堂)茶事をつかさどるかしら。…。
②(茶道)茶の湯。…。
[補注]茶の湯の道のことを「さどう」というのは江戸時代まではまれであり,また,茶頭との混同をさけるために「ちゃどう」というのが普通であった。
お〜い,早く教えてくれ〜。70年近く生きているのに知らなかった。たぶんそんなことが他にも沢山在るわけで,まあそれはそれでいいのかもしれないけれど・・・。なお,大辞林でも「ちゃどう」がメインで「さどう」がサブの扱いだった。

ということは,これまでも「ちゃどう」という言葉がしばしば聞こえてきてもおかしくなかったのだけれど,思い込みフィルターで完全に無視していたに違いない。高校の時は茶道部(さどうぶ)とよんでいたはずなのだが。

[参考]
(1) 裏千家,表千家の英語ページでは,Sadoはでてこない。Chanoyu だ。
(2) 日本政府観光局サイトでは,"These practices developed into sado, the art of the Japanese tea ceremony."とある。
(3) Googleでは,sado "Tea ceremony" 78,800件,chado "Tea ceremony" 65,300件
(4) Wikipedia(英語)では,The Japanese tea ceremony (known as sadō/chadō (茶道, 'The Way of Tea') or chanoyu (茶の湯)) 
(5) ChatGPTでは,Q:How do you pronaunce Japanese Tea ceremony as Japanese word.
A:The Japanese word for "tea ceremony" is "chado" or "sado" (茶道) which is pronounced "cha-doh" or "sah-doh" respectively.

一般的には,互角というところなのかもしれない。


図:The kanji characters for chadō, the 'Way of Tea' (Wikipediaから引用)

2023年1月28日土曜日

テキストマイニング

施政方針演説(2)からの続き

テキストの分析は,テキストマイニングという名前でかつて流行っていた。検索エンジンの技術が話題になってビッグデータが流行り始めていたころだ。基礎知識に欠けた自分は,形態素解析で単語の出現頻度を調べて比較する先の議論には進むことができず終いだった。当時買った本がないかと本棚を確かめてみたけれど,それらしいものも見あたらない。

さて,施政方針演説テキストの抽出までを行うことにしよう。こういう目的のためにはシェルスクリプトが有難い。pythonやperlでまとまったプログラムを書くより,複数の簡単なコマンドを組み合わせるほうが楽だと思える素人プログラマーなのだった。

(1) ウィキソースにあった,内閣総理大臣施政方針演説のpdfファイルをダウンロードする。
(2) pdftotextによってpdfファイルをテキストに変換して一時保存する。
(3) tr -d で不要な改行コード,改ページコード,記号,数字,アルファベット等を取り除く(本文中の数字は全角のアラビア数字又は漢数字が使われている)。
(4) sed で句点「。」を「。+改行」に置き換えて一時保存する。
(5) sed でキーワードから本文前後の行を取り除き,これを最終のテキストファイルとする。
(6) 全体をシェルスクリプトにまとめ,コマンドライン引数で国会の開催回と総理の姓を入力して,該当するファイルを取り出せるようにした。

#!/bin/zsh

# Speech of Prime Minister in the Diet

# https://ja.wikisource.org/wiki/カテゴリ:内閣総理大臣施政方針演説

# 1/28/2023 K. Koshigiri

# usage: jpol.sh 204 菅

# output 204.txt


lynx -dump https://ws-export.wmcloud.org/\?format=pdf\&lang=ja\&page=第\$1回国会における\$2内閣総理大臣施政方針演説 > \$1.pdf

pdftotext \$1.pdf \$1-x.txt

cat \$1-x.txt | tr -d "\n\f[0-9][A-z] .,-(→/←);:'~Ö↑í" | sed "s/。/。\n/g" > \$1-y.txt

sed -e '/ウィキソース/d' -e '/作者:/d' -e '/この著作物/d' -e '/この作品/d' -e '/本作品/d' -e '/ 二次的著作物/d' -e '/許諾者/d' -e '/クレジット/d' -e '/あなたの/d' -e '/再構成/d' -e '/クリエイティブ・コモンズ/d' -e '/閲覧/d' \$1-y.txt > \$1.txt

rm $1-?.txt

perlまで必要ない場合は,小刀のような sed が使いやすいことがわかった。sedでキーワードによる行削除をするのだが,並列に記述できるということを学ぶ。


2023年1月21日土曜日

DeepL Wirte

DeepL翻訳からの続き

ニューラル機械翻訳ツールのDeepL翻訳にはずいぶんお世話になっている。無料版だと5000字までの英文は一括で翻訳できるので,ちょっとした記事はたいていDeepLにかけている。DeepLがダウンロードを奨めてきたので,最近は,ダウンロードしたmacOS版のアプリケーションを立ち上げるようにした。

重要な文書の場合は,確認しないとときどき抜けやエラーがあるとはいえ,昔のgoogle翻訳などに比べれば圧倒的に自然な訳文がでてくる。難をいえば,29言語に対応しながら韓国語が含まれていないことだ(*)。そんなときは,これも優秀なPapago(Naver)を使えばよい。

本ブログのイントロを英訳してみたけれど,3年前より大分良くなったような気がする。

It has been 100 years since Ryunosuke Akutagawa published "The Spider's Thread. In the fall festival of my senior year of high school, the theme of our class costume parade was "The Spider's Thread. I cut out a piece of bamboo from the neighborhood for the Buddha's Paradise Tower and painted a picture of the flames and smoke of hell. It was the time when I was a hell wraith following Kandata and swarming around the spider's thread (the red rope of the mountain climbing club).


さて,そのDeepLが最近,DeepL Writeという文章校正(改善)ツールを出して話題になっている。今のところ,英語(イギリス),英語(アメリカ),ドイツ語のみの対応だ。これも早速試してみよう。

大阪教育大学のホームページの英語版の冒頭の紹介文を例にとってみた。

原文:
Osaka Kyoiku University (OKU), which was founded in May 1874 as a teacher training school, boasts over 140 years history and tradition. The current number of undergraduate and graduate students totals approximately 4,400, with another over 5,000 students matriculated in affiliated schools. Among Japanese universities, OKU is a one of the leading producers of qualified teachers and a leading large-scale college of education.

 The main campus of OKU was established in the Kongo Ikoma Kisen National Park, in Kashiwara City, Osaka. This campus is approximately 670,000 square meters in area. In addition, OKU also has a campus in Tennoji, in central Osaka.

 The university’s programs are designed to meet the high educational standards of a comprehensive teacher training university. OKU is made up 11 affiliated schools, including primary, secondary, and special needs education that are located in three areas of metropolitan Osaka: Tennoji, Hirano, and Ikeda city.

DeepL Writeによる改善:英語(アメリカ)
Osaka Kyoiku University (OKU), founded in May 1874 as a teacher training college, has over 140 years of history and tradition. The current number of undergraduate and graduate students is approximately 4,400, with more than 5,000 students enrolled in affiliated schools. Among Japanese universities, OKU is one of the leading producers of qualified teachers and a leading large-scale college of education.

 OKU's main campus was established in the Kongo Ikoma Kisen National Park in Kashiwara City, Osaka. This campus covers an area of approximately 670,000 square meters. OKU also has a campus in Tennoji, in the center of Osaka.

 The university's programs are designed to meet the high educational standards of a comprehensive teacher training university. OKU consists of 11 affiliated schools, including elementary, secondary, and special education, located in three areas of the Osaka metropolitan area: Tennoji, Hirano, and Ikeda City.


(1) 1行目のteacher training school は師範学校のことなので,colledgeでなくてもよい。

(2) 附属学校の収容定員が5000人が,matriculateになっていたが,これはenrolledが妥当か。

(3) 大阪の中央部が,in central Osaka から in the center of Osakaに。

(4) primary school がelementary schoolに。

(5) 大阪都市圏が,metropolitan Osaka から the Osaka metropolitan area に。

図:DeepLのロゴ(DeepLから引用)

*注:1/27/2023 DeepLは韓国語に対応した。31言語とはどれのことかな?(イタリア語,インドネシア語,ウクライナ語,エストニア語,オランダ語,ギリシャ語,スウェーデン語,スペイン語,スロバキア語,スロベニア語,チェコ語,デンマーク語,ドイツ語,トルコ語,ノルウェー語,ハンガリー語,フィンランド語,フランス語,ブルガリア語,ポーランド語,ポルトガル語,ラトビア語,リトアニア語,ルーマニア語,ロシア語,英語,韓国語,中国語,日本語)


2023年1月9日月曜日

国語の教科書

今年の成人の日は1月9日である。いつのまにか成人年齢の定義がかわり,成人の日も1月15日ではなくなってしまった。社会もこれに適応できていないので,成人の日の式典は20歳が対象になっているところが多い。これまたなんだかなぁ案件だ。

劇作家の鴻上尚史(1958-)が時事通信から「成人の日によせて」という原稿を依頼された。ところが,書いた文章に「体言止めが美しい*」といった理由で20ヶ所以上の直しが入ったので,編集者と決裂したらしい。

そこで,彼はTwitterにこの原文を公開して,若者に届けてようとしている。主旨は「自分で考えるな」といわれてきた高校生に,これからは「自分の頭で考えよ」というメッセージを送るものだった。

Twitterでは多くの人がその内容に賛同を表明していた。ただ,書評家で文学賞メッタ斬り豊崎由美(1961-)が一点だけコメントしていた。
〈僕達は、国語の授業でずっと「退屈な本ほど価値がある」と思い込まされてきました〉。僕はそうかもしれませんが、〈僕達〉と括るのはやめてほしい。わたしは国語の教科書で素晴らしい作家と大勢出会ってきました。
それは確かにそうだ。現代国語の教科書でいまでも記憶に残っているものはいくつかある。舞姫,山月記,こころなどの定番に加えて,一番真剣に授業に集中していたのは,志賀直哉の城の崎にてかもしれない。あと,中学生の教科書にあった平頭銛の話平田森三の発明)も印象的だった。

詩歌では次のとおり。国語の授業がすべて退屈だったわけではなかった。
与謝蕪村
 春の海ひねむすのたりのたりかな
 菜の花や月は東に日は西に
安西冬衛
 てふてふが一匹韃靼海峡を渡って行った
三好達治
 太郎を眠らせ,太郎の屋根に雪ふりつむ
 次郎を眠らせ,次郎の屋根に雪ふりつむ
*注:外岡秀俊の「伝わる文章が書ける」作文の技術 名文記者が教える65のコツ によれば,25 体言止めは使わない,なのだけれど。文字数制限の厳しい環境で生息してきた編集者にとっては,鴻上のていねいな口語表現がいやだったのだろう。それにしても言葉のプロにこれほどの直しを求めるとは如何にという意見も多数あり。

2022年12月20日火曜日

mecab-neologd(3)

mecab-neologd(2)からの続き

とりあえず,最新単語を含む形態素解析のmecab-ipadic-neologdが使えるようになった。次の課題は,これをpython プログラムの中から使えるようにすることだ。これは事例がたくさんころがっていたので,そのまま写経してみた。

2018年,Qiitaにsudo5in5kさんが書いた,mecab + NEologd + python3 で形態素解析という記事があるのでそのまま使える。import MeCab のCが小文字のtypoになっているところでつまづいた。その後,辞書ディレクトリを自分の環境に合わせて指定したところ,青空文庫の人間失格のテキストファイルをとってきて,無事に形態素分解した結果が出力された。

そこで,入出力ファイルをコマンドラインで指定し,任意のテキストファイルを変換できるように数行だけ修正したのが以下のコードである(ほぼsudo5in5kさんのもの)。

#!/opt/homebrew/bin/python3


# usage: aozora.py infile outfile

# infile is taken from https://www.aozora.gr.jp -> txt download


import MeCab

import re

import sys


infile = sys.argv[1]

outfile = sys.argv[2]


bindata = open(infile, 'rb').read()

textdata = bindata.decode('shift_jis')


# 青空文庫のための固有処理

textdata = re.split(r'\-{5,}', textdata)[2]

textdata = re.split(r'底本:', textdata)[0]

textdata = textdata.strip()


# 人によっては以下のパスは異なるので確認してね

mecab = MeCab.Tagger('-d /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd')

mecab.parse('')  # バグ対処

results = []

lines = textdata.split("\r\n")

for line in lines:

    r = []

    # 学習に使わない表現の削除処理

    s = line

    s = s.replace("|", "")

    s = re.sub(r'《.+?》', "", s)

    s = re.sub(r'[.+?]', '', s)

    # Mecab

    node = mecab.parseToNode(s)

    while node:

        # 単語を取得

        if node.feature.split(",")[6] == '*':

            word = node.surface

        else:

            word = node.feature.split(",")[6]


        # 品詞を取得

        part = node.feature.split(",")[0]


        if part in ["名詞", "形容詞", "動詞", "記号"]:

            r.append(word)

        node = node.next

    rl = (" ".join(r)).strip()

    results.append(rl)


# write to a file

with open(outfile, 'w', encoding='utf-8') as wf:

    wf.write("\n".join(results))

2022年12月19日月曜日

mecab-neologd(2)

mecab-neologd(1)からの続き

朝起きてから気を取り直して再開。エラーメッセージに /usr/local でのインストールが前提だという説明があったこと,/Users/koshi/src にあった install というrubyスクリプトを実行していたことが気になっていた。

そこで,installをinstall-old に変えて参照しないようにした上で,/usr/local にgitから引っ張ってきたファイルを置き,ルート権限でインストールしてみたらエラーが消えていた。

cd /usr/local
sudo git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
cd mecab-ipadic-neologd
sudo ./bin/install-mecab-ipadic-neologd -n -a
yes

[install-mecab-ipadic-NEologd] : OK. Let's install mecab-ipadic-NEologd.

[install-mecab-ipadic-NEologd] : Start..

[install-mecab-ipadic-NEologd] : /opt/homebrew/lib/mecab/dic isn't current user's directory

[install-mecab-ipadic-NEologd] : Sudo make install to /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd

make[1]: Nothing to be done for `install-exec-am'.

/bin/sh ./mkinstalldirs /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd

 /usr/bin/install -c -m 644 ./matrix.bin /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd/matrix.bin

 /usr/bin/install -c -m 644 ./char.bin /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd/char.bin

 /usr/bin/install -c -m 644 ./sys.dic /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd/sys.dic

 /usr/bin/install -c -m 644 ./unk.dic /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd/unk.dic

 /usr/bin/install -c -m 644 ./left-id.def /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd/left-id.def

 /usr/bin/install -c -m 644 ./right-id.def /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd/right-id.def

 /usr/bin/install -c -m 644 ./rewrite.def /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd/rewrite.def

 /usr/bin/install -c -m 644 ./pos-id.def /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd/pos-id.def

 /usr/bin/install -c -m 644 ./dicrc /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd/dicrc


[install-mecab-ipadic-NEologd] : Install completed.

[install-mecab-ipadic-NEologd] : When you use MeCab, you can set '/opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd' as a value of '-d' option of MeCab.

[install-mecab-ipadic-NEologd] : Usage of mecab-ipadic-NEologd is here.

Usage:

    $ mecab -d /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd ...


[install-mecab-ipadic-NEologd] : Finish..

[install-mecab-ipadic-NEologd] : Finish..


実行するには,辞書を上記下線部のように指定すればよかった。

最新辞書(ipadic-neologd)を使った場合:
koshi@mba2020 mecab-ipadic-neologd % mecab -d /opt/homebrew/lib/mecab/dic/mecab-ipadic-neologd
『鬼滅の刃』は、吾峠呼世晴による日本の漫画作品。『週刊少年ジャンプ』にて2016年11号から2020年24号まで連載
記号,括弧開,*,*,*,*,『,『,『
鬼滅の刃 名詞,固有名詞,一般,*,*,*,鬼滅の刃,キメツノヤイバ,キメツノヤイバ
記号,括弧閉,*,*,*,*,』,』,』
助詞,係助詞,*,*,*,*,は,ハ,ワ
記号,読点,*,*,*,*,、,、,、
吾峠呼世晴 名詞,固有名詞,一般,*,*,*,吾峠呼世晴,ゴトウゲコヨハル,ゴトーゲコヨハル
による 助詞,格助詞,連語,*,*,*,による,ニヨル,ニヨル
日本の漫画 名詞,固有名詞,一般,*,*,*,日本の漫画,ニホンノマンガ,ニホンノマンガ
作品 名詞,一般,*,*,*,*,作品,サクヒン,サクヒン
記号,句点,*,*,*,*,。,。,。
記号,括弧開,*,*,*,*,『,『,『
週刊少年ジャンプ 名詞,固有名詞,一般,*,*,*,週刊少年ジャンプ,シュウカンショウネンジャンプ,シューカンショーネンジャンプ
記号,括弧閉,*,*,*,*,』,』,』
にて 助詞,格助詞,一般,*,*,*,にて,ニテ,ニテ
2016年 名詞,固有名詞,一般,*,*,*,2016年,ニセンジュウロクネン,ニセンジュウロクネン
11号 名詞,固有名詞,地域,一般,*,*,11号,ジュウイチゴウ,ジュウイチゴー
から 助詞,格助詞,一般,*,*,*,から,カラ,カラ
2020年 名詞,固有名詞,一般,*,*,*,2020年,ニセンニジュウネン,ニセンニジュウネン
24号 名詞,固有名詞,地域,一般,*,*,24号,ニジュウヨンゴウ,ニジュウヨンゴー
まで 助詞,副助詞,*,*,*,*,まで,マデ,マデ
連載 名詞,サ変接続,*,*,*,*,連載,レンサイ,レンサイ
EOS
旧辞書(ipa-dic)を使った場合
koshi@mba2020 mecab-ipadic-neologd % mecab
『鬼滅の刃』は、吾峠呼世晴による日本の漫画作品。『週刊少年ジャンプ』にて2016年11号から2020年24号まで連載
記号,括弧開,*,*,*,*,『,『,『
名詞,一般,*,*,*,*,鬼,オニ,オニ
名詞,一般,*,*,*,*,滅,メツ,メツ
助詞,連体化,*,*,*,*,の,ノ,ノ
名詞,一般,*,*,*,*,刃,ハ,ハ
記号,括弧閉,*,*,*,*,』,』,』
助詞,係助詞,*,*,*,*,は,ハ,ワ
記号,読点,*,*,*,*,、,、,、
名詞,一般,*,*,*,*,吾,ワレ,ワレ
名詞,接尾,一般,*,*,*,峠,トウゲ,トーゲ
名詞,一般,*,*,*,*,呼,コ,コ
名詞,一般,*,*,*,*,世,ヨ,ヨ
名詞,一般,*,*,*,*,晴,ハレ,ハレ
による 助詞,格助詞,連語,*,*,*,による,ニヨル,ニヨル
日本 名詞,固有名詞,地域,国,*,*,日本,ニッポン,ニッポン
助詞,連体化,*,*,*,*,の,ノ,ノ
漫画 名詞,一般,*,*,*,*,漫画,マンガ,マンガ
作品 名詞,一般,*,*,*,*,作品,サクヒン,サクヒン
記号,句点,*,*,*,*,。,。,。
記号,括弧開,*,*,*,*,『,『,『
週刊 名詞,一般,*,*,*,*,週刊,シュウカン,シューカン
少年ジャンプ 名詞,固有名詞,一般,*,*,*,少年ジャンプ,ショウネンジャンプ,ショーネンジャンプ
記号,括弧閉,*,*,*,*,』,』,』
にて 助詞,格助詞,一般,*,*,*,にて,ニテ,ニテ
2016 名詞,数,*,*,*,*,*
名詞,接尾,助数詞,*,*,*,年,ネン,ネン
11 名詞,数,*,*,*,*,*
名詞,接尾,一般,*,*,*,号,ゴウ,ゴー
から 助詞,格助詞,一般,*,*,*,から,カラ,カラ
2020 名詞,数,*,*,*,*,*
名詞,接尾,助数詞,*,*,*,年,ネン,ネン
24 名詞,数,*,*,*,*,*
名詞,接尾,一般,*,*,*,号,ゴウ,ゴー
まで 助詞,副助詞,*,*,*,*,まで,マデ,マデ
連載 名詞,サ変接続,*,*,*,*,連載,レンサイ,レンサイ
EOS

2022年11月25日金曜日

タイパ


アインシュタインの特殊相対性理論では,異なった座標系(慣性系)の観測者は,それぞれの時間軸を持っていて,時間の進み方が必ずしも共通とはならない。しかし,我々の日常生活の世界では,相対速度が光の速度に近い観測者はいないから,時間の進み方は共通のはずだった。

NHKの朝のニュースでタイパ(タイム・パフォーマンス)を取り上げていた。具体的には,動画を2倍速でみるような視聴形態が若者には普通に見られるが,年寄りではそうでもないことを結論づける文脈だった。

コスパ(コスト・パフォーマンス)という言葉は,費用対効果という意味で完全に社会に定着し,企業だけでなく行政や公共分野でもあたりまえに使われている。タイパもコスパと結びつけばそうなるだろう。なんといっても時は金なりという,E = m c^2に匹敵するゴールデンルールで結ばれるのだから。

教育系YouTubeでいえば,ヨビノリ(1993-)では,板書を時間短縮する動画編集があたりまえのように導入されていたが,鈴木貫太郎(1966-)の場合は,リアルタイムだけれど,できるだけ高速な論理展開がなされている。コロナ禍で全国的に導入されたオンライン授業の非同期型コンテンツは,学習者が視聴速度を自由にコントロールできる。若者にとっては速度可変視聴があたりまえの光景なのだろう。

ビデオテープの時代だと,早送りはできるとはいってもそれほど便利ではなかった。スマートフォンの中でデジタル動画が自由に操作編集できる時代には,時間の制御はとても簡単になった。その結果,意識や思考における時間の進み方は個人ごとに相対的であるという相対論の世界が実現する。

いや,もともとそうだったのかもしれない。子供の時間と若者の時間と大人の時間と老人の時間は,そもそもズレていたのだ。あるいは,個々人によって理解の速さも表現の速さも異なっている。そのズレをコミュニケーションで同期しながら社会は回ってきた。

新しいテクノロジーは,そのギャップ(=時間の進み方のズレ)を埋める方に作用するのか,あるいは拡大する方向を推し進めるのか。

一例をあげてみる。大学在職時代に,聴覚障害を持った学生のためのノートテイク支援というボランティアによる活動があった。板書の間に教員が話す説明を聞き取ることができないため,補助者がそれをパソコンで文字起しして,当該学生のノートパソコンに伝えるというものだった。今では,補助者なしのAI音声認識がその水準に達している。これによって,時間のズレは解消されそうだ。

もう一例。放送大学の松井哲男さんの授業で,「初歩からの物理学」や「物理の世界」という講義をときどき聞くことがある。彼は昔からそうだったけれど,頭の回転がはやくて早口で適確に圧縮された説明をする。確かに,教科書の内容はカバーできているしエピソードもふんだんに加えられているのだけれど,分かりやすいかというと,なぜか微妙に未消化感が残ってしまう。講師と受講生に流れる時間のズレのせいではないかと想像している。これはテクノロジーとは関係なかった。

物理的な時間と意識の時間を混同しながら議論してきたのであたまはぐるぐる回って話はまとまらない。いずれにせよ気になっている問題なので,忘れないようにしよう。


図:stopwatch time performance fine style of dali , sketch(DiffusionBeeによる)


2022年9月12日月曜日

謹啓−?

公用文(2)タテ型コンテンツからの続き

各種世論調査の平均で反対が賛成を15ポイントあまり上回っているところに持ってきて,エリザベス女王の本物の国葬が8日前にブッキングされてしまったインケツな(by 菅野完)安倍晋三の国葬儀の参加者の方はなかなかうまらなくて,内閣府はあわててあちこちに岸田文雄名義の案内状を速達で締切日の上に手書き修正シールを貼って追加発送しているらしい。

国葬,速達で検索したら出てくるTwitterで話題の文面は「謹 啓/ 故 安 倍 晋 三 国葬儀を左記により挙行いたし/ ますので御案内申し上げます/   敬 具」というものだった。日時は令和四年九月二十七日(火)午後二時,場所は日本武道館,差出人名義は故 安 倍 晋 三 国葬儀委員長/内閣総理大臣  岸 田 文 雄,となっている。

話題の焦点は,書簡の挨拶の頭語(謹啓)と結語(敬具)の対応関係はこれでよかったのかというものだ。前略−草々,拝啓−敬具,謹啓−謹白 が普通なのではないかと喧しい。念のために調べてみると,(1) 公用文作成の要領には見当たらない。(2) 日本郵便だとどちらでもよいようだ。(3) 佐伯市の公文書作成の手引きでは,前略・冠省−早々・草々・不一,拝啓−敬具・敬白,謹啓・恭啓−謹言・謹白,となっていた。

実際の用例を,googleで数えてみると次のようなことなので,慣例的にもあながち間違いとはいえなかった。

前略 草々 +site:go.jp +filetype:pdf 320 hits
拝啓 敬具 +site:go.jp +filetype:pdf 3740 hits
謹啓 謹白 +site:go.jp +filetype:pdf 1270 hits
謹啓 敬具 +site:go.jp +filetype:pdf 362 hits
謹啓 敬白 +site:go.jp +filetype:pdf 247 hits
謹啓 謹言 +site:go.jp +filetype:pdf 39 hits
まあ,自分も生まれてこのかた,前略-草々と拝啓-敬具をあわせても両手で数えるほどしか使ったことがないので,あまり大きなことはいえないのだけれど,あちらこちらで構造・制度疲労が進んでいるわが国のことだから何が起こっていても不思議ではない気がしたのだった。

P. S. ロンドンのウエストミンスター寺院でのエリザベス女王の国葬は9月19日,ニューヨークでの第77回国連総会一般討論は9月21日〜27日,東京の日本武道館での安倍元総理大臣国葬儀は9月27日となっている。

2022年8月17日水曜日

国際言語学オリンピック

高校生を対象とした,国際数学オリンピックだとか 国際物理オリンピックだとか国際化学オリンピックだとか国際生物学オリンピックだとか国際地学オリンピックだとか国際天文学オリンピックだとか国際情報オリンピックだとかは聞いたことがあった。

国際言語学オリンピックは初耳だった。2021年の問題をみると,キリヴィア語と日本語の対訳から言語規則を見つけて,各言語の短文を翻訳するといったものだった。なお,キリヴィア語は,オーストラロネシア語族の大洋州諸語派に属するパプアニューギニアのトロブリアン諸島で約20,000人が使用している,ものだ。

【日本語の文とキリヴィラ語訳】(カッコ内が自分で考えた言葉の対応) 
 1.一人の男性がこれらの四匹の魚を捕まえる。
  Bibani navasi yena minasina tetala tau.
 (捕まえる 四匹の 魚 これらの 一人の 男性)

2.この白人の男性が到着した。
  Lekota dimdim mtona.
 (到着した 白人男性 この)

3.その子供が到着する。
  Bikota gwadi magudiwena.
 (到着する 子供 その)

4.この年配の女性がそれらのカヌー(複数)を見た。
  Legisi waga makesiewna namwaya miana.
 (見た カヌー それらの 年配の女性 この)

5.どの男性が二頭の豚を殺したか?
  Amtona tau lekalimati nayu bunukwa?
 (どの 男性  殺したか 二頭の 豚)

6.年配の女性達が二人の男性を世話した。
  Leyamatasi teyu tauwau nunumwaya.
 (世話する 二人の 男性 年配の女性達)

7.その賢い女性が何かをみる。
  Bigisi kwetala vivila minawena nakabitam.
 (見る 何か 女性 その  賢い)

8.何匹の犬が到着したか?
  Navila ka'ykwa lekotasi?
 (何匹の 犬が 到着したか?)

9.首長達がどのカヌーを見たか?
  Amakena waga legisesi gweguyau?
 (どの カヌー 見た? 首長達)

10.その美しい子供がこの石を見た。
  Legisi dakuna makwena gwadi magudiwena gudimanabweta.
 (見た  石  この  子供が その   美しい)

11.それらの白人の男性がいくつのものを食べたか?
  Kwevila lekamkwamsi dimdim mtosiwena?
 (いくつのもの 食べた? 白人男性 それらの)

12.賢い首長が一頭の野生の豚を殺した。
  Lekalimati natala bunukwa magasisi guyau tokabitam.
 (殺した 一頭の  豚  野生  首長 賢い)

13.何人の女性がこの男性を世話するか?
  Navila vivila biyamatasi tau mtona?
 (何人の 女性 世話する? 男性 この)
なんとなくわかったが,詰めが甘すぎた。動詞の過去形と現在形,名詞の単数形と複数形,指示代名詞の変化などに注意が行き届かなかった。脚本家の今井雅子さんが丁寧に解読していて参考になる。

2022年8月1日月曜日

変体仮名

変体仮名をmacOSで表示させるべくあれこれ調べたがうまくいかなかった。もちろんiPadOSではだめだ。

調べてみると,Unicode変体仮名フォントをインストールするだけでよいとある。Unicode10.0で規格化された変体仮名を収録したフォントが UniHentaiKana であり,IPAmj明朝フォント(Ver.004.01)の変体仮名グリフのみを取り出してUnicodeのコードポイントを与えたものだ。

UniHentaiKana-Regular.otfをインストールした結果,フォントリストには現れ,Chrome,JeditΩ,TextEdit,Memo,Pages,KeyNote,egword Universal2 などでは表示できたが,Safari,MS Word,PowerPointではうまくいかない。Safariでは,.cssファイルを,* { font-family: UniHentaiKana; },としてこれを指定したがそれでもだめだった。

というわけで,以下のテーブルはうまく表示されないかもしれない。

あ=安: 安𛀂 愛𛀃 阿𛀄 惡𛀅

い=以: 以𛀆 伊𛀇 意𛀈 移𛀉

う=宇: 宇𛀊𛀋 憂𛀌 有𛀍 雲𛀎

え=衣: 衣𛀑𛀒 江𛀁 盈𛀏 縁𛀐 要𛀓

お=於: 於𛀔𛀕 隠𛀖


か=加: 加𛀘 佳𛀗 可𛀙𛀚 嘉𛀛 我𛀜 歟𛀝 賀𛀞 閑𛀟 香𛀠 駕𛀡 家𛀢

き=幾: 幾𛀤𛀥 喜𛀣 支𛀦 木𛀧 祈𛀨 貴𛀩 起𛀪 期𛀻

く=久: 久𛀫𛀬 九𛀭 供𛀮 倶𛀯 具𛀰 救𛀱

け=計: 介𛀲𛀳 希𛀴 氣𛀵 計𛀶 遣𛀷 家𛀢

こ=己: 古𛀸 故𛀹 許𛀺 期𛀻 子𛂘


さ=左: 乍𛀼 佐𛀽𛀾 左𛀿 差𛁀 散𛁁 斜𛁂 沙𛁃

し=之: 之𛁄𛁅 事𛁆 四𛁇 志𛁈 新𛁉

す=寸: 受𛁊 壽𛁋 數𛁌𛁍 春𛁎𛁏 須𛁐𛁑

せ=世: 世𛁒𛁓𛁔 勢𛁕 聲𛁖

そ=曽: 所𛁗𛁘 曽𛁙𛁚 楚𛁛 蘇𛁜 處𛁝


た=太: 堂𛁞 多𛁟𛁠 當𛁡

ち=知: 千𛁢 地𛁣 智𛁤 知𛁥𛁦 致𛁧 遅𛁨

つ=州: 州𛁩𛁪 津𛁫 都𛁬 徒𛁭

て=天: 亭𛁮 低𛁯 傳𛁰 天𛁱𛁲𛁳 帝𛁴 弖𛁵 轉𛁶 而𛂎

と=止: 土𛁷 度𛁸 東𛁹 登𛁺𛁻 砥𛁼 等𛁽 徒𛁭


な=奈: 南𛁾 名𛁿 奈𛂀𛂁𛂂 菜𛂃 那𛂄𛂅 難𛂆

に=仁: 丹𛂇 二𛂈 仁𛂉 兒𛂊 爾尓𛂋𛂌 耳𛂍 而𛂎

ぬ=奴: 努𛂏 奴𛂐 怒𛂑

ね=祢: 年𛂒𛂓𛂔 根𛂕 熱𛂖 禰祢𛂗 子𛂘

の=乃: 乃𛂙 濃𛂚 能𛂛𛂜 農𛂝


は=波: 八𛂞 半𛂟 婆𛂠 波𛂡 盤𛂢𛂣 破𛂤 者𛂥𛂦 葉𛂧 頗𛂨

ひ=比: 悲𛂩 日𛂪 比𛂫 避𛂬 非𛂭 飛𛂮𛂯

ふ=不: 不𛂰 婦𛂱 布𛂲

へ=部: 倍𛂳 弊𛂴𛂵 遍𛂶 邊𛂷 邊辺𛂸 部𛂹

ほ=保: 保𛂺𛂻 報𛂼 奉𛂽 寶𛂾 本𛂿𛃀 豊𛃁


ま=末: 万𛃂 末𛃃𛃄 満𛃅𛃆 萬𛃇 麻𛃈 馬𛃖

み=美: 三𛃉 微𛃊 美𛃋𛃌𛃍 見𛃎 身𛃏

む=武: 武𛃐 無𛃑 牟𛃒 舞𛃓 无𛄝𛄞

め=女: 免𛃔 面𛃕 馬𛃖

も=毛: 母𛃗 毛𛃘𛃙𛃚 茂𛃛 裳𛃜 无𛄝𛄞


や=也: 也𛃝𛃞 屋𛃟 耶𛃠𛃡 夜𛃢

ゆ=由: 游𛃣 由𛃤𛃥 遊𛃦

よ=与: 代𛃧 余𛃨 與与𛃩𛃪𛃫 餘𛃬 夜𛃢


ら=良: 羅𛃭 良𛃮𛃯𛃰 等𛁽

り=利: 利𛃱𛃲 李𛃳 梨𛃴 理𛃵 里𛃶 離𛃷

る=留: 流𛃸 留𛃹𛃺𛃻 累𛃼 類𛃽

れ=礼: 禮𛃾𛃿 連𛄀 麗𛄁

ろ=呂: 呂𛄂𛄃 婁𛄄 樓楼𛄅 路𛄆 露𛄇


わ=和: 倭𛄈 和𛄉𛄊 王𛄋𛄌

ゐ=為: 井𛄍𛄎 居𛄏 為𛄐 遺𛄑

ゑ=恵: 恵𛄒 衞衛𛄓𛄔𛄕

を=遠: 乎𛄖𛄗 尾𛄘 越𛄚 遠𛄛𛄜 惡𛀅

ん=无: 无𛄝𛄞

より:ゟ


図:macOS上のJeditΩにおける変体仮名の表示例