2022年4月1日金曜日

2022年3月31日木曜日

2022年3月30日水曜日

Wordle(4)

Wordle(3)からの続き

Wordleをやっていると,そもそも英語の文章で出てくる単語のうち5文字である確率はどんなものか,また,最もよく出現するのは何文字の単語なのか,などなどが気になるようになった。

これを調べるために,与えられたテキストファイルやpdfファイルから単語を切り出して,その文字数の分布を調べるためのシェルスクリプトを作ってみた。

case \$3 in
"txt")
echo "txt";
;;
"pdf")
echo "pdf";
pdftotext \$2.pdf;
;;
*)
echo "undefined";
;;
esac

for ((i=1 ; i<=\$1 ; i++))
do
perl -nse 'while (/\b[a-z]{\$num}\b/ig) {print "\$&\n";}' -- -num=\$i \$2.txt | tr A-Z a-z > tmp.txt
cat tmp.txt | wc -l >> \$2-\s1.txt;
cat tmp.txt | sort | uniq | wc -l >> \$2-\s2.txt;
rm tmp.txt
done
昨日のスクリプトを少しだけ修正すればよかったが,ポイントは,シェルスクリプト中の反復の記述法である。繰り返し変数は$をつけて,perlのワンライナーに受け渡すことができた。あとはこれを使って実験してみれば良いのだが,それはまた次回のお楽しみ。

2022年3月29日火曜日

Wordle(3)

Wordle(2) からの続き

Wordleは英語の勉強になる。簡単な5文字の英単語でも知らないものがたくさんあって,自分の語彙力はやはり10歳並みだということが確かめられる。そのため,辞書の助けがないと5-6回で答えに辿り着くことは出来ない。

巷には,Wordle Word Finderなどというツールも登場しているが,これでは英語学習の役には立たない。それでも,5文字の英単語のリストを収集したいという目的のために,次のようなツールを作った。与えられたテキストファイルあるいはpdfやhtmlファイルをテキストに変換したものから,perlのワンライナーで n 文字の単語を切り出すものだ。

pandocは汎用の文書型変換ツールだけれど,pdfやhtmlからテキストを取り出すという想定がない。あくまでも整形された文書変換ツールだからだ。そこでテキストファイルの取り出しには,pdftotextやtextutilなどのコマンドに任せることにした。また,シェルスクリプトの引数はperlのワンライナーにそのまま送れないので, -- -perl_var=\$shell_varとして,perlの中で\$perl_varによって引用することになる。
#! /bin/zsh
# usage: word.sh 5 sample pdf (tst, txt, pdf, html)
# output sample-5.txt

case \$3 in
"tst")
pwd;
ls -al \$1.txt;
ls -al \$2.*;
;;
"txt")
echo "txt";
perl -nse 'while (/\b[a-z]{\$num}\b/ig) {print "\$&\n";}' -- -num=\$1 \$2.txt | tr A-Z a-z > \$2-\$1.txt;
;;
"pdf")
echo "pdf";
pdftotext \$2.pdf;
perl -nse 'while (/\b[a-z]{\$num}\b/ig) {print "\$&\n";}' -- -num=\$1 \$2.txt | tr A-Z a-z > \$2-\$1.txt;
;;
"html")
echo "html";
textutil -convert txt \$2.html;
perl -nse 'while (/\b[a-z]{\$num}\b/ig) {print "\$&\n";}' -- -num=\$1 \$2.txt | tr A-Z a-z > \$2-\$1.txt;
;;
*)
echo "undefined"
;;
esac

2022年3月28日月曜日

ロフテッド軌道(3)

 ロフテッド軌道(2)からの続き

初速度を第1宇宙速度$v=\sqrt{\frac{GM}{R}}$に固定した場合,Mathematicaによるプロットを試みる。このとき,$u(\varphi)=A(\theta) \cos \varphi + B(\theta) \sin \varphi +\frac{GM}{h^2}$,$A(\theta)= - \frac{1}{R \tan^2 \theta }$,$B(\theta) = -\frac{1}{R \tan \theta}$,$\frac{GM}{h^2}=\frac{1}{R \sin^2 \theta}$ であり,Mathematicaのコードは以下のとおり。

In[1]:= {G, R, M} = {6.67*10^-11, 6.37*10^6, 5.97*10^24}
Out[1]= {6.67*10^-11, 6.37*10^6, 5.97*10^24}
In[2]:= {g, v} = {G M /R^2, Sqrt[G M/R]}
Out[2]= {9.81344, 7906.43}

In[3]:= A[t_] := 1/R*(1 - 1/Sin[t]^2)
In[4]:= B[t_] := -1/(R*Tan[t])
In[5]:= GM[t_] := 1/(R Sin[t]^2)
In[6]:= r[s_, t_] := 1/(A[t] Cos[s] + B[t] Sin[s] + GM[t])
In[7]:=
Table[f1[i] = Plot[{r[s, i]/R, 1}, {s, 0, Pi},
GridLines -> Automatic, PlotRange -> {0, 2.0}];, {i, 0.1, 1.5, 0.2}];
In[8]:= Show[Table[f1[i], {i, 0.1, 1.5, 0.2}]]
In[9]:=
Table[f2[i] = PolarPlot[{r[s, i]/R, 1}, {s, 0, Pi},
GridLines -> Automatic, PlotRange -> {0, 2.0}];, {i, 0.05, 1.5, 0.2}];
In[10]:= Show[Table[f2[i], {i, 0.05, 1.5, 0.2}]]

In[11]:= f[t_] :=
NIntegrate[ 1/Sqrt[G M R Sin[t]^2] *1/(A[t] Cos[s] + B[t] Sin[s] + GM[t])^2, {s, 0.001, Pi/30}]
In[12]:= Plot[f[t], {t, 0, Pi/8}]



図1:ロフテッド軌道(横軸$\varphi$ラジアン,縦軸$r/R$)


図2:ロフテッド軌道(上記と同じものを極座標表示)

この近似のもとでは,6500kmの高度に達する弾道ミサイルはほぼ地球を半周するところまで到達できるので,北朝鮮から米国本土全体が射程に入ることになる。鉛直上方から60度の角度で射出すれば,地球を1/4周するので1万kmまで到達できる。

実際には,空気抵抗があることや,初速度はロケットエンジンによる一定時間の加速によって獲得されることなどから,もう少し真面目な計算をする必要がある。

[1]ロケットの運動と人工衛星の打ち上げ(冨田信之)

2022年3月27日日曜日

ロフテッド軌道(2)

ロフテッド軌道(1)からの続き

重力場中の質点に対する2次元極座標系$(r(t), \varphi(t))$でのニュートンの運動方程式は次のとおり。

$ \quad \quad m \bigl( \ddot{r} -r \dot{\varphi}^2 \bigr) = F_r = \frac{G M m}{r^2}$

$ \quad \quad  m \frac{d}{dt} \bigl( r^2 \dot{\varphi} \bigr)  = F_\varphi = 0$

第2式は角運動量保存則に対応しており,$r^2 \dot{\varphi} = h$ (一定) が成り立つ。

これを第1式に代入して,$ \dot{\varphi}$ を消去すると,$  \ddot{r} -\frac{h^2}{r^3}  =\frac{G M}{r^2} $となる。そこで,$u(\varphi) =\frac{1}{r(\varphi)}$と置き,$\dot{\varphi} =h u^2$に注意して,運動方程式を,軌道の形を定める$\varphi$に関する微分方程式に書き換える。

$\dot{r} = \frac{d}{d\varphi} \bigl( \frac{1}{u} \bigr ) \dot{\varphi}= -\frac{1}{u^2} \frac{du}{d\varphi} \ h u^2 =  -h \frac{du}{d \varphi}$

$\ddot{r} = \frac{d}{d\varphi} \bigl( -h \frac{du}{d \varphi} \bigr ) \dot{\varphi}= - h \frac{d^2 u}{d\varphi^2}  \ h u^2 =  -h^2 u^2 \frac{d^2 u}{d \varphi ^2}$

$\dot{\varphi}$を消去した運動方程式に代入すると, $-h^2 u^2 \frac{d^2 u}{d \varphi ^2} -h^2 u^3 = -GM u^2$,つまり,$\dfrac{d^2 u}{d \varphi^2} + u = \dfrac{GM}{h^2}$であり,一般解は,$u = A \cos \varphi + B \sin \varphi + \frac{GM}{h^2}$ である。

初期条件から$A,\ B$を定めるには,$\dot{r} = -h \frac{du}{d \varphi}$の表式が必要となる。一般解を右辺に代入すると,$\dot{r} = h (A \sin \varphi - B \cos \varphi )$

半径$R$の地球の中心Oを原点にとった座標系において,$(x,y)=(R,0); (r,\varphi)=(R,0)$から鉛直上方($x$軸正方向)となす角度$\theta$の方向に,初速度$v$で質量$m$の質点を投射する。このとき $r(0)=R$,$\dot{r}(0)=v_r=v \cos \theta$,$h = r(0)^2 \dot{\varphi}(0) = R v_\theta = R v \sin \theta$である。

これらから,$\frac{1}{R} = A+ \frac{g}{(v \sin \theta ) ^2}$,$v \cos \theta = - B R v \sin \theta$であり,$A=\frac{1}{R} - \frac{g}{(v \sin \theta ) ^2}$,$B = -\frac{1}{R \tan \theta}$となる。

なお,到達時間のオーダーは,$\frac{R \Delta \varphi}{v \sin \theta}= 800 \frac{ \Delta \varphi}{\sin \theta} $[s]となる。

図:ロフテッド軌道の例


2022年3月26日土曜日

ロフテッド軌道(1)

北朝鮮の火星17号弾道ミサイル実験でのロフテッド軌道は,高度6250kmで水平飛距離 1090km 飛行時間 67分というものだったと北朝鮮の労働新聞が報じたことをNHKが伝えている。地球の半径が6370kmだから,国際宇宙ステーション軌道の15倍以上の宇宙空間まで達している。

これを初速度 $v$を与えた鉛直投射によって地球半径$R$の高度まで達したと近似する。エネルギー保存則から,$\frac{1}{2}m v^2 - \frac{GMm}{R} = 0 -  \frac{GMm}{2R} $より,$v=\sqrt{\frac{GM}{R}}$ となる(第1宇宙速度 7.9 km/s に一致するのか)。

地球半径のオーダの高度では,投射体に働く万有引力は地表の1/4まで減少するが,これを無視した$g=\frac{GM}{R^2}$の一様重力場とした。空気抵抗も無視して地球を平面と見なす。このとき,初速度が第1宇宙速度$ v $のミサイルを45度で斜方投射すると,最高度までの到達時間が $t=\frac{v}{\sqrt{2}g}$であり,水平到達距離$d$は,$d = 2 \frac{v}{\sqrt{2}} t = \frac{v^2}{g} = \frac{GM}{R} \frac{R^2}{GM} = R$ = 6400 km となる。飛行時間は,$2 t = \frac{\sqrt{2}v}{g} = 10^3\ {\rm s}$ = 17分。

この近似では,平壌からワシントンまでの11000 km には足りないのだった。もう少し真面目な計算をする必要がある。

2022年3月25日金曜日

Jxiv

国立研究開発法人科学技術振興機構(JST)が,3月24日から日本発のプレプリントアーカイブサービス,Jxivの運用を始めた。コーネル大学が運用している arxiv の二番煎じだけれど,何もないよりはマシかもしれない。なお,arxivでも一応日本語の投稿はできるのをみたことがあるし,論文の定義も比較的緩く感じる。

Jxivには,研究者IDである,ORCIDまたはresearchmapのアカウントがあれば登録できる。ただ,researchmapは微妙に面倒なことになっている。そもそもユーザ名が自分では指定できない記号数字の組み合わせだ。所属機関からも登録できるようにするためには仕方ないのかもしれない。

まだ,どの分野の論文も登録されていない。投稿規定やガイドラインを見ると,なんとなく面倒臭そうな雰囲気が満ちているのであった。日本のお役所仕事はどうしてこんなにガードが固くなるのだろうか。そうでなければ利権まみれとかグダグダとかになってしまうのだ。

図:Jxivのトップ画面

2022年3月24日木曜日

pandoc(3)

pandoc(2)からの続き

引き続き,markdown ファイル の活用例として,プレゼンテーション用のスライド作成に取り掛かる。見本(英文)は簡単に見つかって実行できたものの,日本語対応が面倒だと書いてある。あれこれ探してみても,出発点が RStudioの R Markdownというものが多いのだ。結局,日本語Markdownからスライド資料を作成する(Rcmdnk's Blog 2015)とBeamerスライドをMarkdownで簡単に作成(Tomokazu NOMURA's Web Page)を参考にした。

% kpsewhich beamerthemeSingapore.sty

% /usr/local/texlive/2021/texmf-dist/tex/latex/beamer/beamerthemeSingapore.sty

beamerのテーマファイルを上記のkpsewhichコマンド探し,これを編集して末尾に, \usepackage{luatexja} を加えることで日本語対応するということだった。設定ファイルに直接手を入れるのは気が進まないが,元のmarkdownファイルの1ページ目の yaml ヘッダで定義すれば十分であり,styファイルの修正は不要だった。その結果,次のコマンドで memo.md から memo.pdf というbeamerによるプレゼンテーションスライドが生成される。

pandoc -t beamer -o memo.pdf memo.md --pdf-engine=lualatex

memo.mdの1ページ目の yaml ヘッダは次のとおりであり,スライドの改ページは --- である。

---
title: "MarkdownからBeamer"
subtitle: "Pandocで変換"
author: "大阪教育大学 越桐國雄"
date: 2022/03/24
output:
beamer_presentation:
keep_tex: yes
latex_engine: lualatex
header-includes:
- \usepackage{bookmark}
- \usepackage{luatexja}
- \usetheme{Singapore}
---


図:mdファイルから生成したbeamerスライド

2022年3月23日水曜日

pandoc(2)

pandoc(1)からの続き

とりあえず,markdown ファイルから pdf ファイルが生成できるようになった。tex ファイルや html ファイルも生成できるので,その手順をまとめてみる。

(1) tex ファイルの場合

pandoc -s test.md -o test.tex

このtexファイルに対して,ドキュメントクラスを日本語対応に変更する。すなわち,\documentclass[]{article} → \documentclass[]{ltjarticle}として,コマンドラインから,lualatex test.tex とすれば,test.pdf が得られる。

置き換えを perl のワンライナーで実行すれば,シェルスクリプトに落とし込むことができる。

perl -pi -e 's/{article}/{ltjarticle}/' test.tex

(2) htmlファイルの場合

pandoc -s test.md -o test.html --mathml

pandoc -s test.md -o test.html --mathjax

どちらでもよいのだが,数式のまわりのhtmlは,mathjaxの方が少しだけスッキリしているかもしれない。

そこで,これらを zsh のスクリプトとしてまとめたものが次である。md.sh input option とすればよい。optionには{pdf, tex, html}のいずれかが入る。入力ファイルは input.md であり,拡張子より前の部分を引数に取ればよい。以下は md.sh の内容である。

#! /bin/zsh
case \$2 in
  "pdf")
    echo "pdf";
    iconv -f UTF-8-MAC -t UTF-8 \$1.md | pandoc -f markdown -o \$1.pdf -V documentclass=ltjarticle --pdf-engine=lualatex
  ;;
  "tex")
    echo "tex";
    pandoc -s \$1.md -o \$1.tex;
    perl -pi -e 's/{article}/{ltjarticle}/' \$1.tex
  ;;
  "html")
    echo "html";
    pandoc -s \$1.md -o \$1.html --mathjax
  ;;
*)
  echo "undefined"
  ;;
esac

2022年3月22日火曜日

pandoc(1)

マークダウン(2)からの続き

マークダウンの使い方をみていると,コマンドラインベースで各種のドキュメントを相互に変換することができる,pandocとの相性が良いらしい。ということで,pandoc をインストールしようとしたら,すでに homebrew で導入済みだった。念のために,brew reinstall pandocで,pandoc 2.17.1.1が入った。

変換できるファイルの種類のカテゴリーは,次のように多岐に渡る。Lightweight markup (.md),HTML (.html),Ebooks (.epub),Documentation,Roff,TeX (.tex),XML,Outline,Word processor (.docx), Interactive notebook (.ipynb),Page layout,Wiki markup (MediaWiki),Slide show (beamer),Data (.csv),Custom,PDF (.pdf)

厄介なことにマークダウンに関しては微妙に異なった方言が存在するのでなんだか意図した結果が出てこないと思っていたが,記法のミスだった。(1) 見出し,(2) 箇条書き,(3) 番号付き箇条書き,(4) 書体,(5) コード,(6) 数式,(7) 表,(8) 画像,(9) リンク,(10) 脚注 などが概ね機能している。見出しのレベルがまだはっきりわからない。番号付きリストの半角空白は3個にした。

iconv -f UTF-8-MAC -t UTF-8 test.md | pandoc -f markdown -o test.pdf -V documentclass=ltjarticle --pdf-engine=lualatex

上記が,macOS での pandoc の使用例である。入力ファイルは test.md,出力ファイルは test.pdf である。pdf 出力のためには lualatex を通す必要があることと,ファイルは標準の(macOS標準ではなく)UTF-8 形式にしておく必要があるのでiconvで漢字変換したものをpandocに食わせている(pdfファイルで濁点が分離してしまうのを防ぐらしい)。

.zshrcにパスを通して,md2pdf.sh という実行可能なシェルスクリプトを作ったので,引数を1つ指定すると,md2pdf.sh test1 のようにmdファイルからpdfファイルが生成できるようになった。

以下が,マークダウンファイル,test1.md の内容である。

# 見出し1(Title)
ここが段落の文章になる改行しても無視される 
空行があるためこの文章は第二段落となる

## 見出し2(Chapter)
これでは
あれでは

### 見出し3(Section)

#### 見出し4(Subsection)

- リストA
- リストB
  - 子リストB-a
    - 孫リストB-a-a
- リストC

- リストの文章1です。

  行の頭に半角スペースが二つあるので,
  リストの内部要素です。

- リストの文章2です。

行の頭に半角スペースがないので新しい段落です。

1. 番号付きリスト A
   1. 番号付き子リスト A-a
   1. 番号付き子リスト A-b
      1. 番号付き孫リスト A-b-α
      1. 番号付き孫リスト A-b-β
      1. 番号付き孫リスト A-b-γ
   1. 番号付き子リスト A-c
1. 番号付きリスト B

*italic* **bold** ***italic+bold***

\`inline_code\`

\`\`\`
display style code block
function test(a,b) {
return a+b;
}
\`\`\`
\$\int_{-\infty}^\infty e^{-\alpha x^2}dx = \sqrt{\frac{\pi}{\alpha}}\$

\$\$
\int_{-\infty}^\infty e^{-\alpha x^2}dx = \sqrt{\frac{\pi}{\alpha}}
\$\$

|項目1|項目2|項目3|
|---|---|---|
|りんご| 10円| 3個|
|みかん| 50円|10個|
|いちご| |売り切れ|
|バナナ|100円| 2本|

[リンク先 https://pandoc.org/ をクリック](https://pandoc.org/)

画像![ALT これはアイコンです](sample.png)も表示させられます。

Markdown エディタ NowType は Ito によって作られ た。 [^1]

NowTypeにおいては、次のような入力支援を行います。

[^1]: Atsushi M. Ito, プラズマ・核融合学会誌, vol. X, No. Y, 2020.

2022年3月21日月曜日

知の対価のデフレ

 東北大学の堀田昌寛さんがTwitterで「知の対価のデフレ」について発言したことが波紋を広げている。

インターネット上に無償の(物理や数学などの)専門知識コンテンツが溢れていることによって知の対価がデフレになっているとして,無償で学術コンテンツを公開している研究者やアマチュアに対して苦言を呈している。その趣旨は2つある。

(1)知識はタダで手に入るものという誤った考えが浸透することになり,知識生産(科学研究とその成果の解説や普及)やそれに携わる人たちの努力が報われなくなってしまう。これは,最終的に知的生産活動を毀損する方向に働くだろう。現に,専門書の市場がかなり縮小してしまい,売れなくなったとのことだ。

(2)人気のある無償コンテンツによって,量子力学の解問題などで典型的にみられる間違った知識が広がってしまう。なお,堀田さん自身のコペンハーゲン解釈の理解と解釈は正しいと主張している。無償コンテンツの流通が情報の質を低下させることに問題がある。

まあ,著作権法の精神がかなりビジネスサイドに歪められている状況で,著作権管理団体が主張している方向性に親和性のある発言である。彼自身が,投げ銭システムを使おうが,有償コミュニティを作ろうがそれはよろしいのだけれど,問題はこれまで無償で良質なコンテンツを公開してきた人に批判の矢を向けていることだ。実際,批難された人たちが様々なリアクションをしている。

堀田さんの量子力学の新しいタイプの教科書「入門 現代の量子力学 量子情報・量子測定を中心として」は,Twitterでの宣伝も功を奏してとても評判になったし,自分も購入している。それ以前の「量子情報と時空の物理」も買っており,量子力学の認識論的解釈という言葉に目を開かれる思いだった。

インターネットの黎明期から始まった知識情報やソフトウェア・データの民主化と公開化の流れや精神に自分は基本的に賛成であり,それらに非常に大きな恩恵を受けている。また,その結果として新しいビジネスモデルが展開されて,お金が動き始めることには全く問題はないと思う。しかし,原点である情報のオープン化に障害となるような発言を繰り返されるのは,影響力の大きな人だけに気になってしまう。なんだかなあ。

P. S. 1 Twitterでの堀田さんの発言はずっとウォッチしてきているが,微妙に道徳・宗教的なところや,変な理由で谷村省吾さんがサイエンス社のサイトで補足情報を出したことに噛み付いたりと,あまり良い印象のない部分がある。

P. S. 2 arxivやWikipediaやWeb Archiveにもお世話になっていて,わずかながら寄附したことはあるので,全くただノリをしているつもりはない。また,YouTubeには収益化機構があるので,これもOKだろう。

P. S. 3 堀田さん自身もお世話になっているはずの,オープンソースソフトウェアについて,彼はどう考えているのだろう。

2022年3月20日日曜日

マークダウン(2)

 マークダウン(1)からの続き

markdownを使うためのエディタとして何がいいのかを調べてみた。【2022年版】Markdown(マークダウン)エディタ厳選まとめなど色々ある。

一つは,Visual Code StudioAtom などの高機能プログラム開発用ソースコードエディタである。元々日常的に使っているのであればこれで良いのだけれど,このためだけに大掛かりな道具立てを持ってくるのは,ちょっと本末転倒な感じがして,markdown の簡素さと相容れない。

そうなると,ウェブアプリとかローカルアプリになる。Boostnote,Joplin,Bear,Quiverなどを眺めてみたけれど,どれも面倒な印象だ。その中では,有償ではあるが Typoraがデザインもすっきりしていて相対的にマシなように感じた。$14.99なのでそれほど高額ではない。とりあえず,3週間は無料でお試しできるので導入してみた。

一通りのことはできるが,inlineの数式ができない。調べてみると,環境設定に1つチェックをすればOKなので,これでほぼ目的は達成できそうだ。使い込んではいないので,もう少し様子を見ることに。

そうこうしていたら,なんのことはない,Jupyter notebookに Code モードとMarkdown モードがあることがわかった。モードを切り替えてみれば,簡単な数式入力は問題なかった。これでいいのだ。最も,その先のことや pdf 出力のことを考えると,Typoraの方が良いかもしれない。


図:Typoraの購入画面 (3端末で使えるよ)

2022年3月19日土曜日

マークダウン(1)

湯川諭さんの 統計力学の本を読んでいたら,カノニカル集団の章で,ラプラス逆変換の式が重要なポイントとして出てきた。フーリエ変換は教えているけれど,ラプラス変換の方は長い間ご無沙汰だったので,復習することにした。

YouTubeで探してみると,量子アニーリングで有名な大関真之さんの授業動画が見つかった。これについての紹介は別にするとして,その中でマークダウン(markdown)への言及があり,数式も使えるよということだった。

Githubを見ていると,コードのドキュメントは必ずmarkdownで書かれたファイル(readme.mdなど)だったので,存在は知っていたが,数式が扱えることまでは知らなかった。そこで,ちょっと試してみるべく色々探してみた。なんだかどこかで見たような・・・うーん・・・なかなか思い出せなかったが,Wikiにおけるマークアップ構文と同じ類ではないか。

昔,本家のMediaWikiはデータベースが必要で重すぎたので,PukiWiki(PHPベース)やFSWiki(Perlベース)などの軽量Wikiを自分のサーバにインストールしてあれこれ試用していた時代があった。特にFSWikiが軽くてよかった。


図:なつかしのFSWikiのトップ(右上)画面

[1]日本Markdownユーザ会

[2]新入生のためのMD(マークダウン)入門(矢根真二)

2022年3月18日金曜日

pdfファイルの結合

(以下はMac環境でのお話)

作業していると,複数のpdfファイルを結合する必要が生ずることが多い。例えば,プレビューを使って左側にサムネールを表示させると,任意のポイントに別のpdfファイルをドラッグ&ドロップして1つのファイルに結合することができる。この方法では,ファイル数が増えページ数が多くなると面倒だし上手くいかないことも多い。

そこで,これまでは,Autometerが内部で使っているpythonスクリプトである join.py をコマンドラインに引っ張り出して使ってきた。 "/System/Library/Automator/Combine PDF Pages.action/Contents/Resources/join.py"により,~/join.py -o x.pdf ~/Downloads/y-*.pdf などとしていた。

これが,この度のOSアップグレードで使えなくなってしまった。python2.7系列が存在しない。python3になっている。スクリプトのヘッダを#! /usr/bin/python3とするだけでいけるかと思ったが,そんな甘くはなくて,エラーだらけになってしまう。

そこで,別解を探してみたが,これがなかなか面倒だった。

(1) ImageMagickのconvertを用いると良いという話があった。ImageMagickをhomebrewで再インストールすると,convertが使えるようになった。試してみると直ぐに結果が出たので,これで解決と思ったら,結合前のpdfファイルに比べ,結合後のものは画像が荒すぎる。確かに上の参考リンク先にもこのことが書いてある。そこで,dpiを400とか300にして試したところ,処理時間やファイルサイズが10倍以上になってしまって使えない。

(2) pdf 結合 コマンドラインで探してみると,popplerというpdfレンダリングライブラリに,pdfファイルを複数結合するコマンドである,pdfuniteというのがあるということだ。これも早速インストールして実行してみると,エラーが出て進めない。

(3) さらに他のものをということで検索すると,pdftkというコマンドが見つかった。brew install pdftkではヒットしないので,brew search pdftkとすると,pdftk-javaが出てきたので,これをインストールしたところ,pdftkコマンドが使えるようになった。使い方の例は次の通り。pdftk input?.pdf cat output out.pdf である。outputという指示を加えることを忘れないようにしよう。ファイルサイズも問題なしだ。これでとりあえず問題は解決か。

2022年3月17日木曜日

メディア・ポートフォリオ(4)

 メディア・ポートフォリオ(3)からの続き

話を元に戻して,昨今の世界情勢や社会情勢を理解するためのメディア選択における自分の現下の偏ったメディア・ポートフォリオについて振り返りながら反省する。

(1)旧メディアの新聞・テレビ:日本経済新聞はほぼ惰性で購読しているけれど,政治欄はあまり信用しない。NHKのニュースや報道番組は眉に唾をつけながら見続けているが,キッチリ洗脳されている。民放には,報道特集とサンデーモーニングくらいしかないが,後者はかなり微妙でおかしい場合も多い。

(2)YouTubeチャンネル:外国特派員協会(*)・日本記者クラブ(話を聞いてみたい人がときどきでてくる),一月万冊(同じネタを同じメロディーで繰り返しているので最近見なくなりつつある),菅野完(かなりバイアスがかかっているが,ときどき必要な視点を提供してくれる),じゅんちゃん(菅野完のパクリ的要素が見られるが,専門家に果敢にアクセスしている),横川圭希(DELIさんの番組で話がきける),町山智弘(バークレー在住,ほぼ納得できる)。

(3)Twitter,ブログ:コロラド先生(情報分析はまじめにやっている),なすこ(話題になる事象を的確にとらえて表現している),外山恒一(まともなことを話している場合が多い),小田嶋隆(文章の技術はすごいかも),孫崎享(外務省OBで金沢大学附属高出身)。

問題ごとに最適化された専門家を探して,プッシュ型で更新情報を取り入れる仕組みができればいいが,それを自動化するのは難しそうだ。本来はそれがマスメディアの機能なのだが,日本では壊滅状態かもしれない。ニュース番組は,自力での取材能力が欠如して思いの外ネット情報に依存してしまっている。だから怪しい専門家も平気で登場させている。となると,BBCやCNNなどの記事リストが一番ということになるのだろうか。

そういう意味で,ソーシャルニュースサイトのRedditには関心があるが,日本語コミュニティが形成されているのかどうか。いずれにせよ,インターネットの情報チャンネルは英米圏に極端に偏ってしまうのが難点だ。

P. S.  3月17日11:00-12:00,ウクライナでの核使用可能性(Ukraine and the Scourge of Nuclear Weapons)に関して,元広島市長の秋葉忠利(1942-)さんが,外国特派員協会に招かれて非常に流暢な英語で質疑応答に対応していた。MITの大学院で数学を学び,アメリカの大学で20年近く教鞭をとっていたのか。

2022年3月16日水曜日

メディア・ポートフォリオ(3)

 メディア・ポートフォリオ(2)からの続き

メディア・ポートフォリオと他のポートフォリオを比較して,共通にある基本概念を簡単にスケッチしてみた。まだ,十分に考えを練っているわけではないので,あくまでも議論の端緒に過ぎないことに注意する。

図:各ポートフォリオの概念スケッチ

ポートフォリオを作成して保持する主体として,個人や法人がある。それらが一定の目的でポートフォリオを作成すると,これらが重みづけられたチャンネルとなって外界(世界,顧客,教師,雇主など)との相互作用(情報,マネー,製品・商品の移動)が生ずる。それによって,主体の価値評価関数の最適化を図るように,ポートフォリオのスペクトルを時系列や空間=対象集合の変化に応じて決定することになる。

図では相互作用によるマネーや情報などの流れを一意的に示しているが,これはまだ十分に吟味できているわけではない。ポートフォリオの実体はアルゴリズムやデータの場合もあるし,マネーの契約物の場合もあるし,実際の制作物や商品や学習成果などを示す場合もある。

2022年3月15日火曜日

メディア・ポートフォリオ(2)

 メディア・ポートフォリオ(1)からの続き

こんなことは誰でも思いつくことだし,現に,FeedlyなどのRSSリーダーはそれに近いコンセプトだろう。そこで,ネットで「メディア・ポートフォリオ」を検索してみると,面倒なことに異なった意味で使われる場合がほとんどだった。

(1)ビジネス分野におけるマーケティング用語:例えば,リード・ジェネレーション(見込み顧客)を獲得するための広報活動では,どのようなメディアを組み合わせて用いるのが有効かという考え方だ。ここでは,ターゲットのボリュームや心理に応じたメディアの選択などが例示されている。

(2)教育分野におけるポートフォリオ評価用語:ポートフォリオ+ルーブリック評価は,このところの流行であったが,動画や音声などのマルチメディアをどうやってうまくこれに組み込むかという論文が出ていた(保健体育教育の人なのか)。マルチメディア・ポートフォリオとして使われることが多い。

ポートフォリオを直訳すると「紙挟み」「書類いれ」であり,本来は,アート・デザイン・建築などの創作分野で,クリエイターが自分の作品を常に準備していて,新しい仕事の獲得のために自分の力量を示すものという意味で使われていた。それが,教育分野に転用された際に,クリエイターは児童・生徒に置き換わり,教師によって評価される対象としての学習記録総体を表わすこととなる。一方で,企業や個人の資産・投資分野では,リスクヘッジのために複数の金融商品や資産などを組み合わせて保持・運用することを意味している。

あ,忌まわしい,そして今はなき,Japan e-Portfolioを思い出してしまった。左記リンク先のコメントを書いた半年後の2020年8月に,野党の批判などを受けた文部科学省が「利用する大学が少なく,債務超過に陥り,今後の事業運営に必要な資産がない。プライバシーマークなど運営要件を満たす資格を取得していない」などの理由によって,Japan -Portfolioは運営の許可が取り消されている

2022年3月14日月曜日

メディア・ポートフォリオ(1)

 ウクライナのニュースを見ていて,「メディア・ポートフォリオ」という言葉が頭に浮かんだ。

民放の情報番組(ニュースバラエティ)では,過激なお笑いタレントや芸能事務所所属のご意見番が,勝手な妄想を垂れ流しているらしい。というのも,そんな番組を見る気力がないので,Twitterなどの間接情報で聞き及んでいるだけだから。NHKやTBSの報道系番組でも問題によってはひどく偏った情報やプロパガンダで満ちている。

どうすればよりましな専門家や専門的知識を理解したジャーナリストの発信する情報を選択的に得ることができるのか。それについての一つの答えを,あまり信用できない佐々木俊尚が語っていた。それは,少数のこれはという専門家から出発して,その発信情報からのリンクをたどって,良質な情報発信者の集団を求めるというものだった。

佐々木がそこで例示している3人をみると,1人は東京大学先端科学技術研究センター専任講師の小泉悠であった。日本記者クラブでの3月9日のウクライナに関する会見を見たが,確かに話を聞く価値はある。ところが後の2人は佐々木の好きそうな怪しい雰囲気が満載であり,これではだめだ。結局自分のバイアスは必ず入らざるを得ない。

結局,社会的な問題について相対的に適切な情報を得るためには,問題に応じて信頼度の高い複数のメディアの集合を用意してそれらの比較からよりましな真実に近づく必要があるという考えに至った。これは,メディア・ポートフォリオと呼べるものではないか。日本記者クラブもその一つだし,BBCやCNNなどもこれを構成する要素になるだろうが,すべてのニュースに目を通しているわけにも行かない。一月万冊の平田悠貴による海外ニュースダイジェストは少し近いかもしれない。

2022年3月13日日曜日

ペントハウス

WOWOWの朝の韓国ドラマである。ペントハウス(21話)・ペントハウス2(13話)・ペントハウス3(14話)が終って,オッケー!グァン姉妹(50話)がはじまった。それぞれ 1話がコマーシャル無しで75分程度あるので日本でいえば90分ドラマ,大河ドラマの2話分に相当する。

韓国ドラマの現代物で最近見たものは,誰も知らない(16話),VIP(16話),夫婦の世界(16話),一度行ってきました(50話)など,どれもおもしろかったが,ペントハウスもなかなかインパクトが大きかった。

伏線のはり方や,手品のように視聴者を騙すトリックや,とんでもない設定や,激しい登場人物など,フラフラになりながら見ていた。第3シリーズの最終回までくると,さすがに制作側も疲れてきたのか,なんとなくハッピーエンド?風に終ってしまった。日本のドラマ(といってもほとんど見ていないが)のチマチマした作りと比べるとお金の掛け方が違うような気もする。