なお,pdfからのテキストファイルの取出にはpdftotextを使った。
(例)$ pdftotext -f 3 -l 6 20200312-sitrep-52-covid-19.pdf 52.txt
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
#!/usr/bin/perl
# /usr/local/bin/perl
# 03/17/2020 K. Koshigiri
# extract data from WHO covid-19 reports
# https://www.who.int/emergencies/diseases/
# novel-coronavirus-2019/situation-reports/
# usage:: ./corona.pl Japan ??.txt
$country = shift(@ARGV);
print("$country:\n");
foreach $file (@ARGV) {
open(IN, \$file) || die "\$file: ";
$file =~ /^([0-9]+).txt/;
\$no=\$1;
print($no,',');
while($line = <IN>) {
chomp($line);
if(\$line =~ /\$country\$/) {
$flg='y';
} elsif(\$flg eq 'y' && \$line =~ /([0-9]+)/) {
print("$1,");
} else {
$flg='n';
}
}
print("\n");
}
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -手元のMacBook Proの Catalina(10.15.3)に附属のperlは2013年バージョン5.18.4(This is perl 5, version 18, subversion 4 (v5.18.4) built for darwin-thread-multi-2level)だった。最新は,5.30.2のようで,Perl6はどうなっているのかと思えば,そうそう楽土になっていた。
0 件のコメント:
コメントを投稿