2022年4月30日土曜日

1次元周期ポテンシャル

 月曜日の予習シリーズ。

1次元の周期ポテンシャル中を運動する粒子の問題を考える。

(1) 並進演算子:$\psi(x+\delta x) \approx \psi(x) + \delta x \cdot \frac{d}{dx} \psi(x)  = (1 + i \ \delta x \cdot p_x / \hbar ) \psi(x)$から,運動量演算子は微小並進操作と関係している。そこで,ユニタリ演算子,$U(a) = \exp( i\ a \cdot p_x / \hbar )$が,有限の並進操作を行う演算子となる。つまり,$U(a) \psi (x) = \sum_{k=0}^\infty \frac{1}{k!} (\frac{i\ a \cdot p_x}{\hbar})^k \psi(x) =  \sum_{k=0}^\infty \frac{a^k}{k!} (\frac{d}{dx})^k \psi(x) = \psi(x+a)$

(2) 1次元周期ポテンシャル:1次元のポテンシャル$V(x)$中を運動する質量$m$の粒子に対する定常状態のシュレーディンガー方程式は,$H \psi(x) = \{ -\frac{\hbar^2}{2m}\frac{d^2}{dx^2}+V(x) \}\psi(x)  = E \psi(x)$ である。このポテンシャルが周期$a$を持つとき,すなわち,$V(x+a)=V(x)$のとき,$U(a)V(x)\psi(x)=V(x+a)\psi(x+a)=V(x) U(a)\psi(x)$なので,$[U(a), V(x)]=0$,また,$U(a)$は演算子$p$から構成されるので,$[U(a),\frac{p^2}{2m}]=0$である。

(3) 固有関数の並進対称性:したがって,$[U(a),H]=$であり,$H$の固有関数は,$U(a)$との同時固有関数(絶対値1の複素固有値)になるから,$U(a) \psi(x)  = \exp(ika)\psi(x)$とかける。つまり,$\psi(x+a) = \exp(ika) \psi(x)$であり,$\psi(x)=\exp(ikx) \phi(x)$とすると,$\phi(x+a)=\phi(x)$を満足することになる。すなわち,ブロッホの定理「周期ポテンシャルの固有関数は同じ周期性を持つ関数と平面波の積となる」が成り立つ。

うーん,ここからクローニッヒ=ペニーモデルに持ち込むにはちょっと覚悟が必要だということがわかったので,宿題にする。


2022年4月29日金曜日

フェルミ分布

月曜の授業の予習シリーズ。

位相空間($\mu$空間)の細胞に含まれる状態数は,プランク定数を$h$として,$dn=\frac{1}{h^3} dx dy dz dp_x dp_y dp_z$である。電子のようなスピン1/2のフェルミ粒子を考えると,位相空間の各状態にスピンアップとダウンの2状態がともなう。そこで,単位体積をとって,運動量空間細胞に含まれる状態数は $dn' = \frac{2}{V_0} \int_V dn = \frac{2}{h^3}dp_x dp_y dp_z  = \frac{8 \pi}{h^3} p^2 dp$となる。ただし,$p^2=p_x^2+p_y^2+p_z^2$。粒子の質量を$m$,エネルギーを$w=\frac{p^2}{2m},\ p=\sqrt{2mw}$とすると,$dw=\frac{p}{m}dp\ $より,$dn'=\frac{8 \pi}{h^3} \sqrt{2m^3 w}\ dw\ $となる。

この系のフェルミ分布関数は,$f(w_i)=[\exp(\frac{w_i - w_F}{kT}) + 1]^{-1}$である。ただし,$k$はボルツマン定数,$T$は系の絶対温度,$w_F$はフェルミ準位を表わす。これから,エネルギーの分布関数は,$N(w)dw= \frac{8 \pi}{h^3} \sqrt{2m^3 w} [\exp(\frac{w - w_F}{kT}) + 1]^{-1} dw$となる。これを速度空間の表式にひきもどして,$v_x,v_y$で積分すると$\ v_z$の分布関数が得られる。

そこで,次の関係式に留意する。$\int_{-\infty}^{\infty}dv_x\int_{-\infty}^{\infty}dv_y\int_{-\infty}^{\infty}dv_z f(v_x,v_y,v_z) = 4\pi \int_{0}^{\infty} f(v^2)\ v^2 dv $

$w=\frac{m}{2}v^2$,$dw = m v\ dv$なので

$4\pi \int_{0}^{\infty}f(v^2)  v^2 dv = 4\pi \int_{0}^{\infty} f(v^2)  \frac{v}{m} dw =  \int_{0}^{\infty} 4\pi f(v^2)  \sqrt{\frac{2w}{m^3}} dw$

そこで,$N(w)dw =  4\pi f(v^2)  \sqrt{\frac{2w}{m^3}} dw\ $とおけば,$f(v^2)=N(w) \frac{1}{4\pi} \sqrt{\frac{m^3}{2w}}\ $となるので,$\ v_z$の分布関数 $N(v_z) dv_z$は次式で与えられる。

$N(v_z) dv_z = \int_{-\infty}^{\infty}dv_x\int_{-\infty}^{\infty}dv_y f(v_x,v_y,v_z) dv_z =  \int_{-\infty}^{\infty}dv_x\int_{-\infty}^{\infty}dv_y N(w) \frac{1}{4\pi} \sqrt{\frac{m^3}{2w}} dv_z$

$= \int_{-\infty}^{\infty}dv_x\int_{-\infty}^{\infty}dv_y \frac{2m^3}{h^3} [\exp(\frac{w - w_F}{kT}) + 1]^{-1} dv_z$

$v_x, v_y$平面での積分を2次元の極座標によって実行するため,$u^2=v_x^2+v_y^2$とおいて,$dv_x dv_y = 2\pi u du$となる。

$\therefore \quad N(v_z) dv_z = \frac{4\pi m^3}{h^3} \int_0^\infty du u  [\exp(\frac{\frac{m}{2}(u^2+v_z^2) - w_F}{kT}) + 1]^{-1} dv_z$

$= \frac{4\pi m^3}{h^3} \int_0^\infty \frac{1}{2} dt  [\exp(\frac{\frac{m}{2}(t+v_z^2) - w_F}{kT}) + 1]^{-1} dv_z$

ここで,$a=\exp(\frac{\frac{m}{2}v_z^2 - w_F}{kT})$,$b=\frac{m}{2kT}$とおけば,必要な積分は$\int_0^\infty \frac{1}{a \exp(bt) + 1}dt$となり,その値は$\ \frac{1}{b}\log(1+1/a)\ $である。これより,$N(v_z) dv_z = \frac{4\pi m^2 kT}{h^3} \log (1 + \exp(\frac{w_F - \frac{m}{2}v_z^2}{kT})) dv_z$

これらの分布関数をMathematicaでプロットすると次のようになる。

f[w_, kT_] := Sqrt[w]/(Exp[(w - 1)/kT] + 1)
Plot[Table[f[w, 0.01*k], {k, 1, 10, 2}], {w, 0, 2},PlotRange -> {0, 1}]
g[v_, kT_] := kT/2 Log[(Exp[(1 - .5*v^2)/kT] + 1)]
Plot[Table[g[v, 0.01*k], {k, 1, 10, 2}], {v, 0, 2},PlotRange -> {0, 0.5}]


図1:エネルギー分布関数 N(w)

図2:速度分布関数 N(v_z)


2022年4月28日木曜日

モル比熱

かつて 中学校で熱について学んだとき,もっとも重要な基本法則は熱量と温度と比熱の関係だった。これが重要であることは,大学の熱力学でもそうなのだけれど,あくまでも熱力学第一法則と第二法則の脇役であって,電磁気学のオームの法則のようなものだ。

物質量が$\ n\ $モルの体系に熱量$\ d'Q\ $を与えたときに,温度が$\ dT\ $だけ増えたとする。系の温度を1K上げるために必要な熱量である熱容量$\ {\rm [J/K]}\ $は,$\frac{d'Q}{dT} $で与えられる。このとき,系の体積を一定にするならば定積熱容量 $C_V$,系の圧力を一定にするならば定圧熱容量 $C_p$ とよぶ。これらは物質量に比例する示量変数である。

熱力学の第一法則より $\ d'Q = dU + pdV = dU + d(pV)-V dp\ $が成り立つ。したがって,$C_V = \frac{dU}{dT}$,$C_p=\frac{dU}{dT} + \frac{d(pV)}{dT}$となる。ここで,理想気体を考えると,状態方程式 $\ pV = n R T\ $が成り立ち,$C_p=C_V + n R$と表わされる。

単位質量あるいは単位物質量あたりの熱容量が比熱容量比熱となる。定積モル比熱は$c_V=\frac{1}{n}C_V$,定圧モル比熱は$c_p=\frac{1}{n} C_p$と小文字の$c$で表わすことになるが,教科書を眺めると,そのあたりの定義や記号の使い方は必ずしもそろっているわけではなかった。

2022年4月27日水曜日

カルノーサイクル

熱力学の復習シリーズ,カルノーサイクルの練習をする。

 熱力学第一法則: $dU = d'Q + d'W = d'Q - p dV$

 理想気体の状態方程式: $pV=nRT$

 理想気体のポアソンの法則: $pV^\gamma = const,\quad T V^{\gamma-1} = const'$

 エントロピー: $dU = TdS -p dV,\quad dS = \frac{dU + pdV}{T}$

 内部エネルギー: $U = nC_{V}T$

■過程 A $\rightarrow$ B($p_{\rm A}V_{\rm A}=p_{\rm B}V_{\rm B}$)

理想気体が高温熱源$T_{\rm H}$と接触を保ちつつ,一定の温度$T_{\rm H}$の状態を保ちつつ,熱量$Q_{\rm H}$をもらって膨張し,外へ仕事$W_{\rm AB}$をする。理想気体の温度は一定なので,内部エネルギーは$U_{\rm B}=U_{\rm A}$であり,熱力学第一法則より$W_{\rm AB}=Q_{\rm H}$である。

外部にした仕事は,$W_{\rm AB}=\int_{V_{\rm A}}^{V_{\rm B}}p dV = \int_{V_{\rm A}}^{V_{\rm B}}\frac{nRT_{\rm H}}{V} dV=nRT_{\rm H}\log \frac{V_{\rm B}}{V_{\rm A}} = Q_{\rm H}$

エントロピー変化は,$S_{\rm AB}= \int_{\rm A}^{\rm B} dS = \int_{V_{\rm A}}^{V_{\rm B}} \frac{p}{T} dV = \int_{V_{\rm A}}^{V_{\rm B}} \frac{nR}{V} dV = nR \log \frac{V_{\rm B}}{V_{\rm A}} = \frac{Q_{\rm H}}{T_{\rm H}}$

■過程 B $\rightarrow$ C($p_{\rm B}V_{\rm B}^\gamma=p_{\rm C}V_{\rm C}^\gamma \quad T_{\rm H} V_{\rm B}^{\gamma-1} = T_{\rm L} V_{\rm C}^{\gamma-1}$)

断熱壁と接触する理想気体が,熱の流入なしに断熱的に膨張して外に仕事$W_{\rm BC}$をする。熱力学第一法則によって,理想気体の内部エネルギーは$U_{\rm B}$から$U_{\rm C}$まで減少し,温度は$T_{\rm L}$まで下がる。熱の出入りがないのでエントロピーは変化しない。

外部にした仕事は,$W_{\rm BC}=\int_{V_{\rm B}}^{V_{\rm C}}p dV = \int_{\rm B}^{\rm C} -dU = U_{\rm B}-U_{\rm C} = U(T_{\rm H}) - U(T_{\rm L})= n C_V (T_{\rm H}-T_{\rm L})$

■過程 C $\rightarrow$ D($p_{\rm C}V_{\rm C}=p_{\rm D}V_{\rm D}$)

理想気体が低温熱源$T_{\rm L}$と接触を保ちつつ,一定の温度$T_{\rm L}$の状態を保ちつつ,熱量$Q_{\rm L}$を放出して収縮し,外から仕事$W_{\rm CD}$がなされる。理想気体の温度は一定なので,内部エネルギーは$U_{\rm D}=U_{\rm C}$であり,熱力学第一法則より$W_{\rm CD}=Q_{\rm L}$である。

外部からされる仕事は,$W_{\rm CD}=\int_{V_{\rm C}}^{V_{\rm D}}-p dV = \int_{V_{\rm C}}^{V_{\rm D}}-\frac{nRT_{\rm L}}{V} dV=nRT_{\rm L}\log \frac{V_{\rm C}}{V_{\rm D}} = Q_{\rm L}$

エントロピー変化は,$S_{\rm CD}= \int_{\rm C}^{\rm D} dS = \int_{V_{\rm C}}^{V_{\rm D}} \frac{p}{T} dV = \int_{V_{\rm C}}^{V_{\rm D}} \frac{nR}{V} dV = nR \log \frac{V_{\rm D}}{V_{\rm C}} = - \frac{Q_{\rm L}}{T_{\rm L}}$

■過程 D $\rightarrow$ A($p_{\rm D}V_{\rm D}^\gamma=p_{\rm A}V_{\rm A}^\gamma \quad T_{\rm L} V_{\rm D}^{\gamma-1} = T_{\rm H} V_{\rm A}^{\gamma-1}$)

断熱壁と接触する理想気体を,熱の流入なしに断熱的に圧縮して外から仕事$W_{\rm BC}$がされる。熱力学第一法則によって,理想気体の内部エネルギーは$U_{\rm C}$から$U_{\rm D}$まで増加し,温度は$T_{\rm H}$まで上がる。熱の出入りがないのでエントロピーは変化しない。

外部からされる仕事は,$W_{\rm DA}=\int_{V_{\rm D}}^{V_{\rm A}}- p dV = \int_{\rm D}^{\rm A} dU = U_{\rm A}-U_{\rm D} = U(T_{\rm H}) - U(T_{\rm L})= n C_V (T_{\rm H}-T_{\rm L})$

■カルノーサイクルの効率

1サイクルの過程${\rm A \rightarrow B \rightarrow C \rightarrow D \rightarrow A}$において,理想気体(作業物質)が外部にする正味の仕事は,$W = W_{\rm AB} + W_{\rm BC} - W_{\rm CD} -W_{\rm DA} = W_{\rm AB} - W_{\rm CD}$

$= nRT_{\rm H}\log \frac{V_{\rm B}}{V_{\rm A}} - nRT_{\rm L} \log \frac{V_{\rm C}}{V_{\rm D}} = Q_{\rm H}-Q_{\rm L}$

このカルノーサイクルの効率は $\eta = \frac{W}{Q_{\rm H}} = \frac{Q_{\rm H}-Q_{\rm L}}{Q_{\rm H}} = 1 - \frac{Q_{\rm L}}{Q_{\rm H}}$で与えられる。

ところで,ポアソンの法則の温度と体積の関係式を組み合わせると,

$\frac{T_{\rm H}}{T_{\rm L}}=\Bigl( \frac{V_{\rm C}}{V_{\rm B}}\Bigr)^{\gamma-1}=\Bigl(\frac{V_{\rm D}}{V_{\rm A}}\Bigr)^{\gamma-1}$,

したがって,$\frac{V_{\rm C}}{V_{\rm B}}=\frac{V_{\rm D}}{V_{\rm A}} \quad \frac{V_{\rm A}}{V_{\rm B}}=\frac{V_{\rm D}}{V_{\rm C}} $

$\therefore \frac{Q_{\rm L}}{Q_{\rm H}}=\frac{nRT_{\rm L}\log \frac{V_{\rm C}}{V_{\rm D}}}{nRT_{\rm H}\log \frac{V_{\rm B}}{V_{\rm A}}}=\frac{T_{\rm L}}{T_{\rm H}}, \quad \eta = 1 - \frac{T_{\rm L}}{T_{\rm H}}$

■カルノーサイクルのエントロピー

$S = S_{\rm AB} + S_{\rm BC} +S_{\rm CD} +S_{\rm DA} = \frac{Q_{\rm H}}{T_{\rm H}} -  \frac{Q_{\rm L}}{T_{\rm L}} = nR \log \frac{V_{\rm B}}{V_{\rm A}} + nR \log \frac{V_{\rm D}}{V_{\rm C}} = 0 $

カルノーサイクルでは,${\rm A} \rightarrow {\rm B}$の等温膨張過程で熱を吸収するとともに,理想気体のエントロピーが増加し,${\rm C} \rightarrow {\rm D}$の等温圧縮過程で熱を放出するとともに,理想気体のエントロピーが減少する。その結果,1サイクルが終了後にはエントロピーの増減はなくなり,エントロピーが状態量であることが保証されている。


図:カルノーサイクルのp-V図


2022年4月25日月曜日

ミクロカノニカル分布

 ミクロカノニカル分布について。

小正準集団(ミクロカノニカルアンサンブル)とは,外界から孤立した系の熱平衡状態を記述するための統計集団。考えている孤立系と粒子数($N$),体積($V$)が等しく,エネルギー($E$)がある幅($\delta E$)の範囲で等しい系(コピー)の集団である。その数は,下記で定義される微視的な状態数$W$に等しい。

考えている$\ N\ $粒子系の位相空間($\Gamma\ $空間)とする。1粒子の位相空間($\mu\ $空間)の体積が$h^f$で表わされるとき,$\Gamma\ $空間の細胞$\ d\Gamma\ $における微視的な状態数を$\ dW = \frac{1}{h^{Nf}} d\Gamma = \frac{1}{h^{Nf}} dq_1 \cdots dq_N\ dp_1 \cdots dp_N$とする。これから,$W= \frac{1}{h^{Nf}} \int_{E}^{E+\delta E} dq_1 \cdots dq_N\ dp_1 \cdots dp_N$

等重率の原理は,巨視的に観測される全エネルギーが$E$である小正準集団がすべておなじ重みで確率的な平均操作に寄与するというものである。この確率分布を小正準分布(ミクロカノニカル分布)とよぶ。このとき,ある物理量$A(q_1 \cdots q_N, p_1 \cdots p_N)$において,これを小正準分布を用いてその観測される期待値を求めると次式のようになる。

$\langle A \rangle = \int_{E}^{E+\delta E} A(q_1 \cdots q_N, p_1 \cdots p_N) dq_1 \cdots dq_N\ dp_1 \cdots dp_N / \int_{E}^{E+\delta E} dq_1 \cdots dq_N\ dp_1 \cdots dp_N$

等重率の原理を用いて,$N$粒子系の全位相空間の点を同じ確率で扱う根拠として,かつては,エルゴート定理をその根拠とする教科書が多かった。ところが,田崎晴明さんの統計力学の教科書(2008)でこれを否定してからは,こうした教科書は少なくなった。もっとも,高橋康さんの統計力学入門(1984)には,そのあたりはていねいに書いてあったのだった。


愛の設計図

松竹座で5月から始まる「藤山寛美三十三回忌追善喜劇特別公演」に関連したイベントがなんばパークスシネマで開催された。応募ハガキが当選したので授業前の時間を利用して大阪まで出る。

藤山寛美による1983年の松竹新喜劇公演の「愛の設計図」がDVD化されていて,これを上映したあとに,渋谷天外と藤山扇次郎のトークショウがあった。DVDの音源を利用しているからか,劇場の音響がちょっときつすぎて閉口した。

曽我廼家文童が情報処理プログラマーの試験に受かるところからはじまって,建設会社の現場監督と設計士を巡るドラマが進んでいく。アドリブも沢山入っているらしい藤山寛美のセリフは必ずしも全編に渡って流ちょうというわけでもないのだけれど,要所要所で観客の心をつかむ技はさすがである。


2022年4月24日日曜日

ラザフォード

 月曜日の授業の課題を考えていた。

先週のオリエンテーションの後,ゴールデンウィーク明けまでは,現代物理学の歴史の概論を講義する予定なので,現代物理学の基礎を築いた物理学者について調べてもらうことにする。で,Wikipediaの日本語版と英語版の記述量がかなり違うことを知ってもらうというのを目的として,英語版にはあって日本語版にない情報を選んで簡単に紹介してもらうという趣旨にした。

そのため,物理学者の一覧を作るべく調べていると,ノーベル物理学賞の受賞者にラザフォードの名前がない。原子の構造にたどり着いた一番肝腎な人物なのに,いったいどうしたことでしょう。というわけで,トイレからでて落ち着いてノーベル化学賞の方に,ソディデバイなどとともに無事にリストされていた。

ちなみに,宿題に出したのは60名のリストからさらに精選した以下の24名とした。


ヴィルヘルム・レントゲン W. C. Rontogen (1845-1923)
アルバート・マイケルソン A. A. Michelson (1852-1931)
アンリ・ベクレル A. H. Becquerel (1853-1908)
ジョゼフ・ジョン・トムソン J. J. Thomson (1856-1940)
マックス・プランク M. Planck (1858-1947)
ピエール・キュリー P. Curie (1859-1906)
ヘンリー・ブラッグ W. H. Bragg (1862-1942)
フィリップ・レーナルト P. Lenard (1862-1947)
ビーター・ゼーマン P. Zeeman (1865-1943)
マリ・キュリー M. Curie (1867-1934)
ロバート・ミリカン R. A. Millikan (1868-1953)
ジャン・ペラン J. B. Perrin (1870-1942)
アーネスト・ラザフォード E. Rutherford (1871-1937)
フレデリック・ソディ F. Soddy (1877-1956)
マックス・フォン・ラウエ M. von Laue (1879-1960)
ジェイムス・フランク J. Franck (1882-1964)
マックス・ボルン M. Born (1882-1970)
ピーター・デバイ P. Debye (1884-1996)
ニールス・ボーア N. Bohr (1885-1962)
エルヴィン・シュレーディンガー E. Schrodinger (1887-1961)
アーサー・コンプトン A. Compton (1892-1962)
ルイ・ド・ブロイ L. V. de Broglie (1892-1987)
ヴォルフガング・パウリ W. E. Pauli (1900-1958)
ボール・ディラック P. A. M. Dirac (1902-1984)

2022年4月23日土曜日

原子の寿命

現代物理学の導入部分で, 古典物理学(ニュートン力学+マクスウェル電磁気学)では原子の安定性が説明できないことがひとつの鍵になる。このためには,加速度運動する電子が電磁波を放出することを示す必要がある。ところが,加速荷電粒子からの電磁波の放出は,電磁気学で学ぶ最終コーナーであり,そこまで到達しない場合が多い。

お茶の水女子大学の理学部3年次編入試験では,この部分が次元解析で説明されていた。最初に,陽子($+e$)の周りを円運動している電子($-e$)の位置エネルギー$V(r)$を無限遠点を基準として求める。ただし,$r$は陽子から電子までの距離。クーロン定数は$k=\frac{1}{4\pi\varepsilon_0}$とするので,$V(r) = - k \frac{e^2}{r}$。

次に,この非相対論的な運動をしている電子(速度$\ v$,質量$\ m_e$)の全エネルギー$\ E\ $を求めると$\ E=\frac{1}{2}m v^2 - k \frac{e^2}{r}$。なお,円運動の向心力=クーロン力から,$m_e \frac{v^2}{r} = k \frac{e^2}{r^2}\ $を用いると,$E = -\frac{k}{2} \frac{e^2}{r}\ $であり,加速度は$\ a = \frac{v^2}{r} = \frac{k e^2}{m_e r^2}\ $。

加速度運動する電子から単位時間に放出される電磁波のエネルギー $S\ {\rm [kg \cdot m^2 \cdot s^{-3}]}$を,次元解析によって表わす。電子の加速度$\ a\ {\rm [m \cdot s^{-2}]}$,微細構造定数$\ \alpha\ $を使って$\ e^2\ k=\alpha \hbar c\ {\rm [kg \cdot m^3 \cdot s^{-2} ]}$ ,光速度$\ c\ {\rm [m \cdot s^{-1}]} \ $を用いると,$S \sim \alpha \hbar c \frac{a^2}{c^3}$ となる。以下では数係数を1とする。

円運動する電子が単位時間に失うエネルギーは,$-\frac{d E}{d t} = \frac{k e^2}{2} \frac{-\dot{r}}{r^2}=  \frac{\alpha \hbar c}{2} \frac{-\dot{r}}{r^2}$。これが上記の$S$と等しいことから,$\frac{\alpha \hbar c}{2} \frac{-\dot{r}}{r^2} = \alpha \hbar c \frac{a^2}{c^3} $,つまり,$\dot{r} = - 2 r^2 \frac{a^2}{c^3}$

ここで,$\frac{a}{c} = \frac{\alpha \hbar c}{m_e c r^2}\ $なので,$r^2 \dot{r} = - 2  \bigl( \frac{\alpha \hbar c}{m_e c^2} \bigr)^2 c\ $

初期状態で半径$r_0$の原子が電磁波を放出して半径0になるまでの時間を$\tau$とすると,

$\int_{r_0}^0 r^2 dr = \int_0^\tau - 2  \bigl( \frac{\alpha \hbar c}{m_e c^2} \bigr)^2 c\ dt\ $から,

$-\frac{r_0^3}{3} = - 2  \bigl( \frac{\alpha \hbar c}{m_e c^2} \bigr)^2 c \tau $

$\therefore \tau = \frac{r_0^3}{6 c} \bigl( \frac{m_e c^2}{\alpha \hbar c} \bigr)^2 $

$r_0=10^{-10} {\rm [m]}$,$\alpha = \frac{1}{137}$,$ \hbar c = 197 \times 10^{-15}{\rm [MeV \cdot m]}$,$m_e c^2 = 0.5 {\rm [MeV]}$,$c=3 \times 10^8 {\rm [m \cdot s^{-1}]}$ を代入すると,$\tau = 6.7 \times 10^{-11} {\rm [s]}$となる。

2022年4月22日金曜日

ファン・デル・ワールスの状態方程式

統計物理学の授業がはじまった。専門科目にしては受講者が多かったので,講義室は共通講義棟の1Fに割り当てられていた。授業の第1法則:受講者数は時間とともに指数関数的に減少する。授業の第2法則:受講者数の空間密度分布は教卓からの距離の逆数に比例して減少する。

最後にファン・デル・ワールスの状態方程式を紹介して授業を終えたところ,早速質問があった。理想気体では,$pV=n\ R\ T\ $だった状態方程式が,実在気体の場合$\bigl( p + \frac{a}{V^2} \bigl) (V - b) = R\ T\ $と書いてあるけれど,右辺にモル数の$\ n\ $が抜けているのかというものだ。

「あ,ごめんごめん,忘れてたわ」と返事して終ったものの,帰り道に380段の階段を下りながら考えてみると何だかおかしい。圧力の補正項$\ \frac{a}{V^2}\ $は分子間力によるものであり,気体密度の二乗に比例する項だと説明した。ところが,圧力は示強変数なのに,補正項の分母は示量変数の二乗になっている。つまり,$a\ $は定数ではなく示量変数の二乗に比例しなければならない。

演習課題の参考にしていた「熱学入門」(藤原邦男・兵頭俊夫)の式も同様の問題点を含んだままだった。そこで,いくつかの本などでファン・デル・ワールス方程式を調べてみると,気体のモル数を1モルに限定していたり,体積として$\ V\ $ではなく,モル当たり体積$\ V_m\ $を用いている。

ということで,正しくは,$n$モルの実在気体に対しては,$\bigl( p + \frac{a n^2}{V^2} \bigl) (V - n b) = n\ R\ T\ $としなければならない。$a, b\ $の値もこれまで考えたこともなかったが,お茶の水女子大学の理学部編入試験問題にも採用されているくらいであり,水(H2O)の場合,$a=5.54\times 10^{-1} {\rm [Pa \cdot m^6 \cdot mol^{-2}]}$,$b=3.05 \times 10^{-5} {\rm [m^3 \cdot mol^{-1}]}\ $だった。

これを使ってMathematicaで状態図をプロットしてみる。



図:水蒸気のファン・デル・ワールス状態図

a = 0.554; b = 3.05*10^-5; R = 8.314; 8 a/(27 R b)
647.331 ・・・ (臨界温度)

p[V_, T_] := R T /(V - b) - a/(V^2)
q[V_, T_] := Abs[R T /(V - b) - a/(V^2)]

LogLogPlot[{q[V, 673], q[V, 647.33], q[V, 573], q[V, 473], q[V, 373], 
  q[V, 273]}, {V, 3*10^-5, 3*10^-4}, PlotRange -> {10^5, 10^9}]
Plot[{p[V, 673], p[V, 647.33], p[V, 573], p[V, 473], p[V, 373], 
  p[V, 273]}, {V, 3*10^-5, 3*10^-4}, PlotRange -> {-10^8, 10^8}]

2022年4月21日木曜日

渦 妹背山婦女庭訓 魂結び:大島真寿美

 最近,読書のスピードが極めて遅くなっている。本日,ようやく大島真寿美の「渦 妹背山婦女庭訓 魂結び」を読了した。2019年の第161回直木賞受賞作品だ。

もうすこし,重くて硬い作品かと予想して読みはじめると,意外に軽い文章だったので,始めのうちは少し慣れなかった。やがて,近松半二の物語についていくことができるようになった。この作品は操り浄瑠璃の竹本座の座付作者である近松半二(1725-1783)をテーマに選んだところが鍵だったと思う。

物語としては,やや物足りなかった。250年前に近松半二は,日高川入相花王(1759),奥州安達原(1762),本朝廿四孝(1766),傾城阿波の鳴門(1768),近江源氏先陣館(1769),妹背山婦女庭訓(1771),新版歌祭文(1780),伊賀越道中双六(1783)と,現在でも頻繁に上演されている,三大名作と近松の世話物以外の主要な浄瑠璃を次々と産み出した。それにも関わらず,操り浄瑠璃が歌舞伎に破れていくところが最も印象に残ったところだ。

もう一つは,妹背山婦女庭訓の主要登場人物のお三輪をふくめて,登場する女性陣がしなやかな強さをもっているところか。半二の妻はお佐久で,娘はおきみなのだが,これがどのようにして伊賀越道中双六の作者として名を連ねた近松加作につながっていくのかいかないのかは,次作の「結 妹背山婦女庭訓 波模様」を待たなければならないのか。

岡本綺堂の戯曲「近松半二の死」は青空文庫でも読める小編だが,そこでは祇園町の娘お作が加作につながることが暗示されている。


写真:大島真寿美の渦の書影(amazonnより引用)


2022年4月20日水曜日

abc予想(4)

 abc予想(3)からの続き

abc予想が正しければ,ただちにフェルマーの定理が簡単に証明されるとのことだが,事情は若干ややこしい。正確には,abc予想の(2)の表現において$\varepsilon = 1 $として,このときに,$K(\varepsilon)=1$が満たされればという条件がついてくる。ウェブ上ではこれを強いabc予想と書いているものもあるが,その表現がよいのかどうかはあまりはっきりしない。

(強いabc予想?) $c < K(\varepsilon=1)  {\rm rad}(abc)^{1+(\varepsilon=1)} = 1 \cdot {\rm rad}(abc)^2 $ 

これからフェルマーの定理を導くのは次のようになる。

自然数$a,\ b,\ c\ $が互いに素であり,自然数$n > 6\ $に対して,$a^n,\ b^n,\ c^n\ $が abcトリプレットをなすとする。すなわち,$a^n + b^n = c^n\ $であって,$a^n < b^n$かつ$a^n,\ b^n\ $は互いに素。このとき,$c^n < {\rm rad}(a^n b^n c^n)^2 = {\rm rad}(a b c)^2 < (a b c)^2 < c^6\ $が成り立つ。

つまり,$n \ge 6\ $に対して,$a^n + b^n = c^n\ $は偽であることから,フェルマーの定理が $n \ge 6\ $に対して成り立つ。$n= 3, 4, 5\ $については別途成り立つことを示す必要があるが,これらはすでに証明されている。

これを少し詳しく見た様子は,黒川信重・小山信也による「ABC予想入門」に記述されている。


2022年4月19日火曜日

abc予想(3)

abc予想(2)からの続き

$c > rad(abc)\ $が成り立つabcトリプルを例外的abcトリプルとよぶことにする。そうはいっても前回は,これが無限個存在することも示している。例外的トリプルの個数を計算してみると,$c<1,000\ $で31個(全トリプル151,895個),$c<10,000\ $で120個(全トリプル個15,196,785),$c<100,000\ $で418個(全トリプル1,519,805,376)となる(最大10^15のオーダーまでの数の素因数分解を10億回しなければならないので,めちゃ時間かかった)。

これを計算したMathematicaコードは次の通り。

Rad[n_] := Times @@ (First /@ FactorInteger[n]);
f[n_] := {k = 0; Do[If[Rad[a*b*(a + b)] < a + b && GCD[a, b, a + b] == 1, k = k + 1], {a, 1, n/2 - 1}, {b, a + 1, n - a - 1}]; Print[k]};
g[n_] := {k = 0; Do[If[GCD[a, b, a + b] == 1, k = k + 1], {a, 1, n/2 - 1}, {b, a + 1, n - a - 1}]; Print[k]};
f[1000]
31
g[1000]
151 895
そこで,少しだけ条件を変更することで,例外的トリプルが有限個になるようにできないかを考えたところ,次のような予想が立てられた。(1)と(2)は同等であり,これがabc予想といわれるものである。

(1) 任意の$\varepsilon > 0$ に対して $c > {\rm rad}(abc)^{1+\varepsilon}\ $を満足するabcトリプルは高々有限個しか存在しない。

(2) 任意の$\varepsilon > 0$ に対してある $K(ε) > 0$ が存在し、全ての abcトリプルについて$c < K(\varepsilon) {\rm rad}(abc)^{1+\varepsilon}\ $が成り立つ。


2022年4月18日月曜日

abc予想(2)

 abc予想(1)からの続き

肝腎のabc予想である。準備のために,自然数 $n$ の根基(radical)を定義する。素数を$\{ p_i \}$として,$n = p_1^{k_1} \cdot p_2^{k_2} \cdot \cdots \ $と素因数分解できるとき,$n$ の根基が次のように定義される。${\rm rad}(n) \equiv p_1 \cdot p_2 \cdots \ $ 。例えば,${\rm rad}(120)={\rm rad}(2^2  \cdot 3^2 \cdot 5) = 2 \cdot 3 \cdot 5 = 30$ 。

3つの自然数の組,$(a, b, c)$ において,$a+b=c\ $であり,$ a < b\ $が互いに素であるものを,abc-トリプルとよぶ。普通は,$c < {\rm rad}(a b c)$ であるが,$c > {\rm rad}(a b c)$も無限に存在しうる。そこで,ある形のabc-トリプルで後者の条件を満たすものが無限個あることを示す。

素数 $p>2$,自然数 $n>1$として,$a=1, b=2^{p(p-1)n}-1, c=2^{p(p-1)n}$というabc-トリプルを考える。このとき,${\rm rad}(a b c) = {\rm rad}(a) {\rm rad}(b) {\rm rad}(c) = 1 \cdot {\rm rad}(b)  \cdot 2 = 2\ {\rm rad}(2^{p(p-1)n}-1) $となる。

ところで,$b = 2^{p(p-1)n} - 1 = \bigl( 2^{p(p-1)} \bigr)^n - 1 = \bigl( 2^{p(p-1)}-1 \bigr) \bigl( \cdots  \bigr) = p^2 \cdot \bigl( \cdot \  \cdots  \bigr)$ とかけるので(*),$\frac{b}{p^2}$は自然数である。そこで,${\rm rad}(a b c) = 2 \cdot {\rm rad} (p^2 \cdot \frac{b}{p^2}) \le 2 \cdot p \cdot  \frac{b}{p^2} = 2 \cdot \frac{b}{p} \lt \frac{2}{p} c$ 。ただし,$ {\rm rad}(m) \le m$ を用いた。

(*) フェルマーの小定理により,$2^{p-1}\ \equiv 1 \ ({\rm mod}\ p)$,すなわち,$2^{p-1} = k\ p + 1\ $なので,$2^{p(p-1)} = (k\ p + 1)^p = \Sigma_{r=0}^{p-1} C_r^p\ (k\ p)^{p-r} 1^r +1\ $。このため,$2^{p(p-1)}-1=(k\ p + 1)^p - 1\ $を展開した $k p$の最低次の項は,$C_{p-1}^p \cdot (k\ p) = k\ p^2$であり,全体は$p^2$を因子として持つ。

つまり,このabc-トリプルは任意の$n$に対して,$c > \frac{2}{p} c > {\rm rad}(abc)$ となるので,無限個存在する。

2022年4月17日日曜日

abc予想(1)

 NHKスペシャルの「数学者は宇宙をつなげるか?abc予想証明を巡る数奇な物語」の完全版(90分)が放映された。60分版にエピソードをいくつか加えて丁寧に編集していた。60分版を見た水野義之さんによれば,「素因数という言葉もさけて人間ドラマに仕立てた大失敗作だ」ということだが,そうでもないと思うけど。

Wikipediaのabc予想の記載は,現状をほぼ客観的に説明している。英語版のほうが淡白(冷淡)で,日本語版はややていねいに経緯を示している。NHKスペシャルでは,望月新一さん本人は取材を断っており,加藤文元さん,プリンストンでの望月の指導教官のファルティングス,批判派のピータ・ウォイトなどの話が中心となった。

番組でタイトルだけ紹介されたのが望月さんのブログからのキーワード「ノーと言える人間」であり,その説明はなかった。調べてみると,新一の「こころの一票」というブログの2017年11月21日に「心壁論」と,論理構造の解明・組合せ論的整理術を「心の基軸」 とすることの本質的重要性という記事があった。

abc予想を証明することができる宇宙際タイヒミュラー理論は,京大数理解析研究所のPRIMSで査読が完了して出版されたものの,世界の数学者の大勢は,その証明を認めていない。そんなこともあって,望月さんのこころの内がブログには表出されている。

望月さんは,5歳で日本を離れてからほぼ米国で生活し,16歳でプリンストンに入学し,23歳でPh. Dをとっている。そんな彼が欧米の大学のポストではなく日本の京大に職を得たことに理由に相当する,英語圏での生活における強い違和感が詳しく述べられている。

許容される表現のイメージ全体に一つの固定された「座標系」を敷き、表現のイメージ全体を通して 同一の「座標系」=「視点」=「声」=「神」=「心の基軸」しか認めないという姿勢を徹底することにはどうしても強い違和感を覚える

「ノーと言える人間」 というのは,例の盛田昭夫と石原慎太郎の1989年の著書「NO」と言える日本―新日米関係の方策」からきている。これが,欧米のメインストリームの数学者を権威主義的に敬う空気への強烈な拒否感として現れたものにほかならない。

P. S. 新一の「こころの一票」にNHKスペシャルについての評価に関する記事が掲載された。なかなかおもしろい(2022.5.3)。

2022年4月16日土曜日

にほんごであそぼ

 4月のNHKの番組改編では例年より大幅なものとなった。その中でも,Eテレのにほんごであそぼの評判が極めて悪かったので,録画を飛ばし飛ばしちょっとだけチェックしてみた。

うーん,頭にポットをつけたお姉さんが,百発百中の説明というかゲームに無駄な時間を費やすだけで時間が過ぎてゆく。部分的に以前のフレーバーが残っているものの,伝統芸能のかけらもなく,貴重だった織太夫,清介,勘十郎の文楽のコーナーも見当たらなかった。

1979年に福音館書店から出版された「にほんご」は,安野光雅,大岡信, 谷川俊太郎,松居直によって,小学校低学年の国語の教科書に代わるものとしてデザインされた労作だった。子供が小学校にあがるまで,ふとんの中でよく読んだものだ。そのフレーバーやコンセプトがふんだんに盛り込まれたのが,NHKの「にほんごであそぼ」だったが,番組改編で大変残念なことにそれが失われてしまった。

NHKはニュース系がひどくても,Eテレがあるからと我慢していた。この調子だと本当に全部がダメになりそうで怖い。まあ,あの優等生的で擬似中立主義的な総体による隠れた洗脳が問題だというのであれば,Eテレの優良番組だってどうなのよということかもしれないが。


写真:福音館のにほんごの書影(福音館書店から引用)

2022年4月15日金曜日

Wボソンの質量

4月7日付のScienceに,CERMのCDF実験によるWボソン質量の精密測定の結果が報告された。アブストラクトを訳すと次のようになる。

素粒子間の弱い力の媒介となるWボソンの質量は,素粒子物理学の標準模型の対称性によって厳しい制約を受けている。ヒッグス粒子は,この標準模型の最後の欠落部分であった。ヒッグス粒子が観測された後,Wボソンの質量を測定することで,標準模型を厳密に検証することができる。

私たちは,フェルミ国立研究所テバトロン加速器のCDFII検出器を用いて,重心エネルギー1.96 TeVの陽子・反陽子衝突で収集した8.8 /fb の積分光度に相当するデータを用いてWボゾンの質量M_Wを測定した。約400万個のWボゾン候補のサンプルを用いて,M_W = 80,433.5 ± 6.4 stat ± 6.9 syst = 80,433.5 ± 9.4 MeV/c^2 を求め,その精度はこれまでのすべての測定値を合わせたものを超える。この測定は、標準模型の予想と大きく異なる(注:標準理論では,M_W = 80,357 ± 6 MeV/c^2,7σの食い違い)。

標準理論の綻びは,ミューオンの異常磁気能率 のところにも現れていたので,いよいよ新しい物理が見えそうな期待感が高まる。ただ,野尻さんは論文のアペンディックスを見て懐疑的な感想を述べているので,まだどうなるかわからない。Wボソンの質量とニューオンの異常磁気能率の組み合わせが,標準理論の矛盾を大きくする方向に働いているようだ。

早速,様々な理論が話題になっているけれど,レプトクォークよりヒッグス粒子のダブレットの方が無難なのかもしれない。

 


写真:CDF 検出器(FNALから引用)

2022年4月14日木曜日

うさみ亭マツバや

大阪のきつねうどんの起源には諸説あるが,うさみ亭マツバやが元祖だというのがなんとなく有力らしい。一度行こうと思っていたので,午後の文楽のついでによってみた。

心斎橋筋を北に向かい,ちょっと右に折れると間口の狭いこじんまりした店があった。11:00開店で,11:30ごろについたが,既にお客さんがかなり入っている。早速きつねうどんとミニ親子丼のセットを注文した。

感想:味は普通。麺はやや太めでもっちゃりする。うどんの断面が丸くて箸から滑りました。油揚げも普通だ。これならば自宅で食べるスーパーの30円の生麺(断面は四角)+市販の味付け油揚げと大差ない。ただ,ミニ親子丼は昔ながらの玉子とじ状態でおいしかった。

食べているうちにも次々にお客さんが入ってきて,2階の席にも案内されている。隣の席ではおじさんが大阪弁で商売の話をしつつ「僕はしっぽくうどんにするわ」。お二人さんは,しっぽくうどんときつねとじうどんであり,なかなか味のある会話が流れてくる。

そういえば,金沢にいたころは,甘く炊いた大判の揚げのきつねうどんは存在しておらず,刻んだ揚げがのったいなりうどんだった。近所のうどん屋お多福の出前で,土曜の午後に天ぷらうどんとセットで食べていた。夏休みには泉丘高校のESSの部室に集まって勉強していたが,高橋君らと向かいのうどんやで大盛りのいなりうどんとかき氷を食べるのが日課だった。

入るときは気づかなかったが,大将がレジに座ってお会計をしていた。


写真:うさみ亭マツバや(撮影 2022.4.11)

2022年4月13日水曜日

摂州合邦辻

国立文楽劇場の四月文楽公演には,豊竹咲太夫文化功労者顕彰記念・文楽座命名150年のタイトルがついていた。第一部が義経千本桜,第二部が摂州合邦辻,第三部が嬢景清八嶋日記と契情倭荘子だ。コロナ流行が始まってからは,以前のような三部通しの観劇がしんどいので,今回は第二部を見ることに。

住吉大社万代池や天王寺界隈が舞台である摂州合邦辻。その万代池の段は,三輪太夫,希太夫,南都太夫,津國太夫,咲寿太夫,清友が並ぶ。公演記録の録画カメラが入っていたので,皆さん気合が入っていたようだ。最後に,吉田玉也の合邦道心によって,高安次郎丸の鬼若が,万代池に投げ込まれるのだが,池から可愛らしい顔を覗かせながら幕となる。

合邦住家の段は,中:睦太夫・清馗,前:呂勢太夫・清治,切:呂太夫・清介だった。今日は睦太夫が良かったと,家人と意見が一致した。声もはっきりと大きく変な癖がない。呂勢太夫と清治のコンビはうまいのだろうが,どうも自分にはピンとこない。一番良かったのは,呂太夫と清介だった。三味線の迫力やテクニックもすごくて(三の糸が切れた?),呂太夫も清介も熱演だった。

後半の玉手御前と浅香姫の激しいバトルでのキックには思わず笑ってしまった。この段は何度か見ているはずだけれど,百万遍の大数珠のイメージはすっかり消えていた。奴入平の吉田玉勢が,玉手御前の肝を取り出すのをビビって拒む当たりも面白い。

物語では,寅年,寅の月,寅の日,寅の刻に生まれた女の生肝の血が俊徳丸の毒を消すための薬になるという設定になっている。今年は寅年である。寅の月は旧暦の正月であり,2022年では,2月4日から3月4日までだ。寅の日は,12日ごとに巡ってきて,この度では,2月6日(日),2月18日(金),3月2日(水)。寅の刻は,24時間を12で割った3番目なので,午前3時から5時となる。


写真:浪速区下寺西方寺にある合邦辻閻魔堂(Wikipediaより引用)

2022年4月12日火曜日

真木悠介

 4月10日の夜7:00のNHKニュースで,見田宗介(1937-2022)の訃報が流れた。そういえば昔よく読んだものだと本棚を探したけれど見あたらなかった。何度か本の断捨離をしたときに,寄付に回してしまったようだ。

テレビでは,「現代社会の理論 −情報化・消費化社会の現在と未来−」を見田の代表作の一つとしてあげていた。調べてみたらこれは1995年の岩波新書であり,そのころには読む気がしなくなっていたので買わなかった・・・たぶん。大学1,2年の頃に,筑摩書房の箱入りのシリーズで,真木悠介名義の「人間解放の理論のために」とか,見田宗介名義の「現代日本の心情と論理」を買って愛読していた。いずれも,1971年の出版である。

当時は,ディヴィッド・リースマンの「孤独な群衆」から始まって,社会学の本を何冊か読んでいた。大学の教養の人文科学・社会科学では,哲学,倫理学,心理学,政治学,経済学は履修したが,社会学は取らなかったので,その埋め合わせもあり,「社会学のすすめ」から始まって色々と読みあさった・・・たぶん。

社会学といえば,1972年に阪大教養部の助教授だった井上俊(1938-)の「死にがいの喪失(1973)」はまだ本棚で生き延びていた。当時は真木悠介の本の方が良いと思っていたはずなのだけれど。

2022年4月11日月曜日

Wordle(8)

Wordle(7)からの続き

Wordle支援プログラム word.py を改良して,出現しない文字を含む単語をとり除く処理を1行加えた。第3引数に出現しない文字を連結して並べたものを与える。

# usage: warp.py w.txt a.b.c def

import sys
import re

f = open(sys.argv[1], 'r')
datalist = f.readlines()
arg1 = sys.argv[2]
arg2 = sys.argv[3]

for data in datalist:
  if(re.search(r'\d* '+arg1, data) != None):
    if(re.search('['+arg2+']', data) == None):
      print(data, end="")

f.close()

2022年4月10日日曜日

Wordle(7)

Wordle(6)からの続き

wiki-5.txtは,WIkipediaデータセットのWikiText-103 word から5文字単語を取り出したものだった。これに対して,n-gramの出現頻度を,1-gram, 2-gram, 3-gramに対して求めるpythonプログラム ngrm.py を作る。1-gramはアルファベット1文字,2-gramは連続するアルファベット2文字,3-gramは連続するアルファベット3文字を表している。

ngrm.pyの出力結果は , を区切り文字として,出現回数とn-gramパターンの組なので,sort で区切り文字を , 数値として解釈した逆順をリダイレクトして適当なファイルに格納すると,1-gramから3-gramまで混ぜた出現頻度順のファイルが出来上がる。
# usage: ngrm.py wiki-5.txt | sort -n -r -t , >! alphabet 
import sys

a=[0 for i in range(26)]
b=[[0 for i in range(26)] for j in range(26)]
c=[[[0 for i in range(26)] for j in range(26)] for k in range(26)]

def n_gram(target, n):
  return [ target[idx:idx + n] for idx in range(len(target) -n + 1) ]

f = open(sys.argv[1], 'r')
datalist = f.readlines()

for data in datalist:
  for l in range(5):
    x = data[l]
    i = ord(x) - 97
    a[i] = a[i] + 1
    if l in range(4):
      y = data[l+1]
      j = ord(y) - 97
      b[i][j] = b[i][j] + 1
      if l in range(3):
        z = data[l+2]
        k = ord(z) -97
        c[i][j][k] = c[i][j][k] + 1

for i in range(26):
  if a[i] > 49:
    print(a[i],",",chr(i + 97))

for l in range(26*26):
  i = l // 26
  j = l % 26
  if b[i][j] > 49:
    print(b[i][j],",",chr(i+97)+chr(j+97))

for l in range(26*26*26):
  i = l // (26*26)
  j = (l // 26) % 26
  k = l % 26
  if c[i][j][k] > 49:
    print(c[i][j][k],",",chr(i+97)+chr(j+97)+chr(k+97))

f.close()
wiki-5.txtにおけるベスト50は次のとおりであった(数字は出現数)。

5730707 , e

4092848 , r

3965317 , a

3759319 , t

3424032 , s

3108801 , o

3068296 , i

2603632 , h

2600893 , l

2398537 , n

1734820 , d

1574948 , c

1501211 , u

1291809 , w

1195832 , m

1086248 , g

1076779 , er

964115 , f

962898 , th

882193 , b

801081 , p

746024 , te

729576 , y

674447 , he

651813 , ou

636278 , st

604734 , ar

563176 , hi

559096 , re

556926 , v

556020 , or

533535 , in

521374 , k

521197 , es

519713 , ch

518219 , ir

514744 , al

514410 , wh

493762 , the

473288 , ea

427832 , le

417701 , ic

412433 , whi

412193 , an

409812 , il

384013 , la

372098 , at

369592 , se

364056 , ed

362684 , ter


2022年4月9日土曜日

Wordle(6)

 Wordle(5)からの続き   

Wordleを解くための支援プログラムを次のようなものとする。「5文字単語のデータベースを用意して,ワイルドカードを含む与えられた候補にマッチする単語を全て選び出して表示する」。perlでプログラムを組みたいところだったが,pythonの練習をすることにした。

5文字単語データベースとしては,前回示した WikiText-103 word Level からwords.shで処理したものを用いる。その後は,久々の python プログラミングなので,よちよち歩きながら試行錯誤する。

(1) コマンドラインの引数は,sysモジュールをimportすれば,sys.argv[n]でアクセスできる。sys.argv[0]はpythonスクリプト名,sys.argv[1] 以下で複数の引数を受け渡す。
(2) ファイルのオープンとクローズの方法は記載の通り。第1引数は先に求めてある5文字単語データファイル名である。
(3) テキストファイルを1行づつ分割して読み込むには,datalist=f.readlines() などとするとその結果のリストが 得られる。
(4) perlのようにdatalistから1行づつ取り出して処理をするのが,for data in datalist: である。
(5) 正規表現によるマッチングには,re モジュールをimportしたうえで,re.search(r'正規表現' , 原データ) という形式による。これが Noneでなければマッチしていることになる。
(6) 第2引数で入力する5文字のワイルドカードをピリオド(. )にしておけばそのまま正規表現として使えてるので便利である。
(7) データファイルは,wc -l で生成しているので,頭に頻度を表した数桁の数字が空白を区切りに付加されているため,'\d* '+arg としている。文字列の結合には,プラス(+)演算子を用いる。
(8) print文で余分の改行を削除するには,end="" をつければよい。
# usage: word.py w.txt a.b.c
import sys
import re

f = open(sys.argv[1], 'r')
datalist = f.readlines()
arg = sys.argv[2]

for data in datalist:
# print(arg, data, re.search(r'\d* '+arg, data))
  if(re.search(r'\d* '+arg, data) != None):
    print(data, end="")

f.close()

2022年4月8日金曜日

Wordle(5)

Wordle(4)からの続き

前回の復習:英文のテキストデータセットと単語の文字数 n が与えられたとする。文字数がnの単語を1行とした一時ファイルを作る。大文字は小文字に変換している。次に,wc -l によって一時ファイルの行数=n文字単語数を出力したものを並べたファイルを作る。また,上記の wc -l の前にsort | uniq フィルターをかけてユニークな n文字単語数についても同様のファイルを作る。これが,前回のwords.shプログラムのアルゴリズムだった。

具体例として,最初は手元にある数冊の英書の数千ページ(80MB)のpdfファイルからユニークにソートされた5文字単語(3万4千語)を抽出したものでテストした。もう少し大きなデータがないかと,オープンコーパスを色々探してみたが,なかなか適当なものがない。

最終的に,Wikipediaの記事を使ったデータセットにたどり着いた。多言語のWIki-40Bが前処理済で良さげだったが,TensorFlowを使えという指示が面倒であり,英語データで340万ページ2GBは大きすぎる。WikiText-103 Word Levelの方は,圧縮後181MBでそのままダウンロードできそうなので,こちらを使うことにした。

WikiText-103 Word Levelの解凍後のテキストデータは539MBあった。これをwords.shにかけると,1-20文字の単語(うちユニークな語)が約8300万語(約21万語),このうち5文字の単語(うちユニークな語)が約960万語(約2万4千語)であった。

WikiText-103 Word Level における,n文字単語(うちユニークな語)の出現頻度を下図に示す(オレンジが総語数の出現頻度,ブルーがユニーク語数の出現頻度)。n文字単語の出現ピークはn=3にあって約20%,ユニークなn文字単語の出現ピークはn=7にあって,約16%となった。5文字単語の場合は,ともに約11%となっている。


図:WikiText-103 Word Levelにおける単語出現頻度(横軸は文字数)

2022年4月7日木曜日

2022年4月6日水曜日

2022年4月5日火曜日

2022年4月4日月曜日

2022年4月3日日曜日

2022年4月2日土曜日

2022年4月1日金曜日