芥川龍之介が「蜘蛛の糸」を発表して百年。高二の秋の文化祭,クラスの仮装行列のテーマが 蜘蛛の糸だった。お釈迦様の極楽タワーの竹を近所から切り出し,地獄の焔と煙の絵を描いた。犍陀多に続いて蜘蛛の糸(登山部の赤いザイル)に群がる地獄の亡者だったころ。
2023年7月24日月曜日
最小二乗法(4)
2023年7月23日日曜日
最小二乗法(3)
2023年7月22日土曜日
最小二乗法(2)
2023年7月21日金曜日
最小二乗法(1)
2023年6月8日木曜日
会話行動に関する調査
2023年6月7日水曜日
社会生活基本調査
社会生活基本調査は,統計法に基づく基幹統計調査として,生活時間の配分や余暇時間における主な活動(学習・自己啓発・訓練,ボランティア活動,スポーツ,趣味・娯楽及び旅行・行楽)を調査し,国民の社会生活の実態を明らかにするための基礎資料を得ることを目的として5年ごとに実施しています。
というもので,直近は令和3年(2021年)版だ。詳細行動分類による生活時間に関する結果が昨年の12月に公表されている。ここにスマートフォン・パソコンの使用時間があった。使用者率が65%,平均使用時間(使用者についての)が4.29時間である。この調査は,10歳から75歳以上を対象としているため,情報通信メディアの利用時間(6時間)に比べれば,値が小さくなるのはしかたがない。14歳以下や65歳以上をのぞけば,使用者率78.9%,平均使用時間4.89時間程度にはなるので,6時間にはとどかないがまあ同じオーダにはなっている。
使用者率が78.9%というのは低すぎるような気がするのだけれど・・・。
2023年6月6日火曜日
情報通信メディアの利用時間
シンセティック・メディア(2)からの続き
視聴覚メディアからの影響と実体験や対面コミュニケーションによる影響を考えるための基本情報は何かと考えた。とりあえず,視聴覚メディアに接している時間ならばデータがあるかもしれないと思って,調べたところ,総務省の「情報通信メディアの利用時間と情報行動に関する調査報告書」というのが見つかった。
とりあえず分かったことは次の通り。2023年6月3日土曜日
合計特殊出生率
# X = read.table(pipe("pbpaste"), header=TRUE) (奥村先生のテクニック for macOS)X <- read.table('/Users/koshi/Desktop/birth.txt', header =TRUE)par(family = "HiraKakuProN-W3")plot(X$年, X\$合計特殊出生率, type="o", pch=16, xlab="", ylab="")t = c(range(X\$合計特殊出生率), X$合計特殊出生率[length(X[,1])])axis(4, t, t)title("合計特殊出生率", line=0.5)# x軸とy軸のメモリの位置を手動で指定x_ticks <- pretty(X\$年, 11) # 11個のメモリを生成y_ticks <- pretty(X\$合計特殊出生率, 9) # 9個のメモリを生成# x軸に対してグリッド線を描画for (i in x_ticks) {abline(v = i, col = "lightgray", lty = "dotted")}# y軸に対してグリッド線を描画for (i in y_ticks) {abline(h = i, col = "lightgray", lty = "dotted")}
2022年9月16日金曜日
ファクターX
2年半前の2020年春,新型コロナ ウイルス感染症の蔓延が始まったころ,欧米諸国に比べて日本の感染者数や死亡数は圧倒的に少なかった。その原因は何かということで,あれやこれやの説があったが決定的な証拠がなくて,当初はファクターX(あるいはなぞなぞ効果 by コロラド先生)とよばれていた。
その後,優等生だったニュージーランドや韓国や台湾でも感染が急拡大してしまい,日本を含む東アジア太平洋地域の特殊性というのは,いつのまにか話題にならなくなった。
2022年夏の第7波のピークを過ぎた頃から,感染者数が過去に比べてかなり大きいにも関わらず,重症化率や致命率がそれほどでもないという理由で,様々な規制が緩和されようとしている。WHOも,コロナの終わりが視野に入ってきたと口走るようになった。
データアナリスト(マーケティングリサーチャー)の萩原雅之さんが,Our World in Dataから,日本の人口当たりの新規感染者数を世界と比較していたので,死亡数や致命率もあわせて確かめてみることにする。やはり,第6波以降の報告値は大きく変わってしまった。なんでだろう。
第1波から第4波の致命率は2〜5%もあって,行動制限も当然という状況だった。第5波には1%前後まで収まり,第6,7波にかけては0.1%のオーダーまで下がっている(たぶんそれでもインフルエンザよりは高い)。これがこのまま続くのかどうかは変異株の性質次第かもしれない。
2022年8月30日火曜日
遠山プランから20年
自由民主党清和政策研究会の,森政権(2000-2001)と小泉政権(2001-2006)によって日本は転落への道をたどりはじめたといえるのかもしれない。安倍政権(2006-2007, 2012-2020)からの事態はこれにとどめを刺している。
遠山敦子は,小泉政権の文部科学大臣であり,初等中等教育ではゆとり教育からの脱却,高等教育ではいわゆる遠山プラン(2001)という新自由主義的大学改革プランを打ち出した。
そこでは,(1) 国立大学の再編・統合を大胆に進める。(2) 国立大学に民間的発想の経営手法を導入する。(3) 大学に第三者評価による競争原理を導入する。の三原則が示された。これによって,教員養成単科大学はおおいに振り回されて右往左往することになる。2004年には国立大学が法人化され,さらに混乱に拍車がかかった。現在もこの方向性での「改革」が継続強化されている。
この結果,日本の国立大学は疲弊の一途をたどることになる。その証拠の一例として学術論文のTop 10% 引用数の世界ランキングがある。文部科学省の科学技術・政策研究所(NISTEP)が最近まとめた科学技術指標2022では,日本がランキングの12位にまで落ち込んだことが示された。
2年ごとに報告されている科学研究のベンチマーキング2021では,2018年までの移動平均値が示されている。2003年以降,学術論文のTop 10% 引用数は着実に順位を下げ続け,今回さらにワンランクダウンしたということになる。
2022年7月14日木曜日
世界人口デー
人類減少からの続き
7月11日は国連が定めた世界人口デーだ。日経の夕刊と朝刊に渡って世界人口の記事が掲載されていた。ひとつは,今年の11月に世界人口が80億人に達するということ。もうひとつは,世界人口の増加率が1%を割り込んで(中国も2022年に人口減に転じている)おり,2086年には,ピークの104億人になってその後は減少に転ずるということだった。
1970年代に世界の人口爆発が問題だとされたときに,様々な刷り込みを受けた世代なので,感慨も一入だ。最近の世界人口の変化は,10億人(1804),20億人(1927),30億人(1960),40億人(1974),50億人(1987),60億人(1999),70億人(2011),80億人(2022),90億人(2040),104億人(2086* peak),となっている。自分が生まれてから死ぬまでに世界人口が約3倍になっているということか。
東アジアの人口増加が終って,南アジア(インド)が主役になる時代がきた。そして,その次にはアフリカが待っている。
[1]World Populaton Clock[2]World Population by Year
2022年6月30日木曜日
全国ハザードマップ
NHK全国ハザードマップが公開されている。
洪水や土砂災害の危険性が全国の市町村の地図上に表現されているものだ。天理市のハザードマップも印刷物として配布されていたが,それに相当する。自宅の周りは,洪水による浸水の恐れはなさそうだけれど,数百メートル先には危険地帯が迫っている。
NHKのハザードマップは,全国の市町村ごとのデータを統合して,任意の場所について一つのインターフェースでリスクを調べることを可能にしたものだ。これがなかなか大変な作業だったということが,34テラバイトのデータと格闘して「全国ハザードマップ」を公開した理由という記事になっている。
なぜ34TBも必要なのと普通は考える。例えば,面積が60 ㎢ の天理市のハザードマップのpdfファイルは7枚,15MBある。37万㎢の日本全体にスケールするには6000倍すればよく,必要なファイルサイズは90GBだ。34TB/90GB =300倍ほど過大になっている(様々な情報を格納するためのベクターデータなら1桁余分に必要かもしれないが,2桁ではないだろう)。
災害に遭遇するのは,自分が住んでいる市町村に居る場合とは限らないから,いつでも,どこでも,誰でもが簡単に全国のハザード情報を検索できるシステムの必要性や重要性は言を待たない。実際,国土交通省には重ねるハザードマップというシステムは存在している。しかし,掲載されている河川数が水防法で規定されている2200河川の43%にすぎない(これに限らず,憲法改正によって危険な緊急事態条項の導入に血道を上げる前にやるべきことが山積している日本なのだった)。
そこで,NHKががんばって,1800の地方自治体に電話をかけてデータを集めたところ,外注した成果物がpdfファイルのみで元のデジタルデータがないとか,データの格納ファイルが整理されていないとか,関係ないデータが山のように混入しているとか,そもそもデータ形式が統一されていないとか。それが34TBのデータであり,これから散々苦労して必要な情報を蒸留して作り上げたのがNHK全国ハザードマップだった。この涙なくして語れない的な読み物を一読することをお薦めする。
デジタル庁がやるべきなのは,あるいは,災害出動に価値のある自衛隊の防衛予算をまわすべきなのは,こんなところからだと思われる。
P. S. NHK全国ハザードマップは期間限定の試験的デジタルコンテンツとある。もったいないので,国土交通省で引き継いだらいいのに。
[1]ハザードマップポータルサイト(国土交通省)
2022年6月14日火曜日
SDGs
京阪奈三教育大学の連携が追求されていた10年前,奈良教育大学の特徴的な活動として,ESD(Education for Sustainable Development:持続可能な開発のための教育)という言葉を聞いたのが,SDGs(Sustainable Development Goals:持続可能な開発目標)への最初の接触だった。
その当時は,まったくピンと来なくて,この人達は何を目指しているのだろうか?状態だった。いまでも奈良教育大学の活動は続いている。2022年4月1日から,奈良教育大学ESD・SDGsセンターが設置され,6月26日には設立記念シンポジウムが開催される。
その後,SDGsという言葉をしばしば耳にするようになったがまじめに調べてはいなかった。3-4年前の日本経済新聞の正月版別刷にSDGsの17の目標が詳しく説明されているのを読んで,初めて得心が行った。なんだかいいこと書いてあるじゃないのというわけだ。
ところがその後,SDGsの旗ががあちらでもこちらでも振られるのに,微妙な違和感を感じるようになった。結局,資本主義の延命策を国連の名のもとで宣伝しているだけではないのか。その証拠に,投資会社が率先して,SDGsの双子の兄弟であるESG(Environmental, Social, and Corporate Governance)を売り込んでいる。
このSDGsの流行は実は日本固有の現象ではないのかと,萩原雅之さんが数日前にFacebookで指摘していた。Google Trendsを使って,あるキーワードの検索数を国別・年度別に傾向分析することができる。その結果,SDGsというキーワードは日本で突出して多く調べられていることがわかった。アフリカ諸国がそれに次ぐのだが,欧米ではかなり少ないのだった。
2022年2月3日木曜日
機械判読可能データ
令和2年12月なのでデジタル庁ができる前のこと。統計表における機械判読可能なデータの表記方法の統一ルールが策定されていた。この積み重ねがデジタル化された社会を作るわけだが,そもそもデータを改竄することになんのためらいもない政府だとどうなのか。
総務省が,政府統計の総合窓口(e-Stat)に掲載する各省庁の統計表における機械判読可能なデータの表記方法の統一ルールを策定した。e-Statは,日本の政府統計関係情報のワンストップサービスを実現するため2008年から本運用を開始した政府統計のポータルサイトだ。総務省統計局が整備し,独立行政法人統計センターが運用管理している。
「統計表における機械判読可能なデータ 作成に関する表記方法」として,Excel形式のデータ表の場合について,作成ガイドラインが示されている。
1-1 ファイル形式はExcelかCSVとなっているか
1-2 1セル1データとなっているか
1-3 数値データは数値属性とし,文字列を含まないこと
1-4 セルの結合をしていないか
1-5 スペースや改行等で体裁を整えていないか
1-6 項目名等を省略していないか
1-7 数式を使用している場合は,数値データに修正しているか
1-8 オブジェクトを使用していないか
1-9 データの単位を記載しているか
1-10 機種依存文字を使用していないか
1-11 e-Stat の時間軸コードの表記,⻄暦表記又は和暦に⻄暦の併記が されているか
1-12 地域コード又は地域名称が表記されているか
1-13 数値データの同一列内に特殊記号(秘匿等)が含まれる場合
2-1 データが分断されていないか
2-2 1シートに複数の表が掲載されていないか
2021年12月19日日曜日
メタバース(2)
メタバース(1)からの続き
1992年にスノウ・クラッシュで誕生し,2003年にSecond Lifeとして実体化し,2007年ごろに第1次ブームを迎えて消え去ったメタバースである。2021年に第2次ブームが立ち上がるかどうかの時期に差し掛かっている。コロナ禍とそれにともなう在宅勤務が追い風になっていることは間違いない。
この様子を,論文について調べてみた。1つは日本語の論文であり,これはCiNiiのキーワード検索(メタバース OR metaverse)による。もう1つは英語の科学系の論文であり,これはarXivのキーワード検索による。後者では13本しか見つからなかった。案外少ないので学術用語としては十分定着していないのかもしれない。
2007 2これは前者のCiNiiでヒットした文献の数(合計66件)である。2008年から2009年にピークがあり,2021年に再び増大している。なお,括弧内はタイトルに(メタバース OR metaverse)を含むもの。
2008 10 (1)
2009 15 (6)
2010 9 (2)
2011 8 (5)
2012 7 (5)
2013 0
2014 0
2015 1
2016 0
2017 2
2018 1
2019 1 (1)
2020 2
2021 8 (2)
2021年10月7日木曜日
名字マップ
名字マップというのがあった。
この日本の名字マップは,電話帳や住宅地図の表札名の約4千万件のデータを,都道府県ごとに集計し,地図化したものです。表示方法としては絶対数と特化係数が選べます。また,2画面で異なる名字を地図化したり,絶対数と特化係数の地図を比較したりできます。
特化係数:当該の名字が各都道府県でどの程度特化しているかを示したもので、最大値が100であれば、全国的に均等に分布していることになります。
早速試してみたが,マイナーな名字ではあまり有り難みがないのだった。越桐だと,石川2,東京2,福井1,千葉1,奈良1,兵庫1の計8件である。特化係数は石川と福井で2500程度,ついで奈良の1000ということだった。ちょっとこの係数のイメージが掴めない。
2021年9月4日土曜日
コロナワクチン接種状況(5)
コロナワクチン接種状況(4)からの続き
8月が終わったので,ここまでのコロナワクチン接種状況を復習しておく。6月21日から職域接種が開始された。7月中に65歳以上の希望者全員のワクチン接種を完了するという目標のもとに,6月21日から7月20日の平均接種回数は約150万回になった。しかし,その後,少し失速して7月21日から8月20日の平均接種回数は約130万回にとどまっている。
8月末に総接種回数は1億3千万回に達しており,子どもを除く必要総回数2億2千万回の56%に達している。現在,平均120万回/日の速度で接種が進んでいるため,もしこのペースが維持できれば,9月末には1億6千万回(75%),10月末には2億回(90%)となるので,次に来ると考えられる第6波の様相はこれまでとは違ったものになるのかもしれない。
6月21日以降のデータとして報告されているワクチン接種回数は,土日や祝日が欠損しているので,これを線形補間してさらに7日平均接種回数の値を求めたのが次のグラフである。なお,職域接種の統計への計上は8月に入ってからなので,これも6月22日から線形にならしている。
2021年8月23日月曜日
人類減少
日本経済新聞が大げさなタイトルをつけて,本日の1面トップと2面コラムと6面の特集面を使って,21世紀の後半には世界人口が減少するという予測記事を出していた。
記事のもとになっているのはワシントン大学医学部の保健指標評価研究所(The Institute for Health Metrics and Evaluation:IHME)の2020年7月14日の論文,Fertility, mortality, migration, and population scenarios for 195 countries and territories from 2017 to 2100: a forecasting analysis for the Global Burden of Disease Study である。
うーん,なんで1年遅れの情報を今ごろに出しているのだろうか。1年かけて「人口と世界」という連載特集を組んでいくための準備をしていたのかもしれない。重要な話だとは思うが・・・
IHMEはコロナ感染症の予測にも力を入れているが,日本の感染状況の予測はぶれがおおきくてこれまでも必ずしも当たっていないのだ。まあ,日本の統計が壊滅状態であることも一因かもしれないが,これならばコロラド先生や牧野さんの方がよっぽど正確なのである。
ワシントン大学グループの予測は,国連の中位予測と下位予測の間に含まれている。世界人口は,2067年に97億人でピークとなり,2100年には87億人まで減少する。日本の人口はこの段階で半減し5900万人になっている。
1972年にローマクラブの報告を見て以来,世界人口は指数関数的な爆発をしていて,どうなるのだろうという頭しかなかったが,ついに減少が予測されるところまできていたのだった。そもそも近年は指数関数的な振る舞いをしていないのだった。
国連統計にある世界人口の対数をとって時間に対して直線になっていれば指数関数滴増加である。1950年から2020年までの70年のデータを使って計算してみた。1950年から1960年までは,世界人口は年率1.8%で増加しているが,2000年から2010年までは,年率が1.1%に減少している。というわけで人類の人口の指数関数的増加は終焉を迎えていたのだった。
[1]国際連合(UN)World Population Prospects の使い方(総務省統計局)
2021年7月31日土曜日
コロナワクチン接種状況(4)
コロナワクチン接種状況(3)からの続き
6月中旬の上記記事で,菅首相の話はおかしいのではと指摘したが,その後の遡及入力分を補正すると最終的にはこのころに100万回/日を越えたという彼らの言明の方が正しかった。
ただし,政府の内部データによるシミュレーションは必ずしも正確ではなく,累計接種回数で10%,300万回程度過小評価していた値を当時報告していた。また,6月10日から6月16日の平均ワクチン接種回数は現時点で109万回にまでなっていて,発表時点の週平均104万回という値を上回ったことになる。
そこで首相官邸のコロナワクチンのページで報告されているワクチン接種回数に遡及入力補正を行った現時点でのワクチン総接種回数推定値を求めてみた。遡及入力分がだらだらと指数関数的に登録されると仮定して,7月1日分の一般接種分データの1ヶ月分の推移からざっくりパラメタを求めた。$N(t) = N_0 \{1 - 0.5 * \exp (-t/7) \} $で近似できたことにしよう。
2021年7月8日木曜日
ワクチン接種統計のマジック
オリンピック開始まであと残りわずかとなった。今日,緊急事態宣言が東京・沖縄で8/22まで発出され,蔓延防止等重点措置が埼玉・千葉・神奈川・大阪で 8/22まで延長された。また,北海道・愛知・京都・兵庫・福岡については7/11までで蔓延防止等重点措置が解除された。
いや,いくらなんでもそれはないだろうと,首相官邸のワクチンのページをみると,なにやら内閣官房の新型ワクチンの統計のページの形式が変更されている。あやしい。しかも,新しく設けられている日別のファイルをみると(データ列が途中で入れ替わっているという単純ミスがある),確かに日平均130万回以上接種がすすんでいるかのように見える。
で,よく調べてみると,これには,毎日の遡及入力が含まれない段階の各報告日の過小評価した合計の一覧がならんでいる。一方,それらの最終日において一定の遡及入力が加わったものを並べた結果とは違ってくる。このため,政府発表の数値は,最終的に遡及入力が収束するものと比べて,日々の増加分を過大評価することになっている。グラフでみたほうがわかりやすいだろう。