2021年9月13日月曜日

クローラ

 クローラ(Crawler)とは「ウェブ上の文書や画像などを周期的に取得し,自動的にデータベース化するプログラムである」。ボット(bot)・スパイダー・ロボットなどとも呼ばれるが,google検索ではロボットと表現されている。

25年ほど前から数年間,学校のホームページ宛の管理者宛てにアンケート調査を繰り返していたことがある。ホームページのURLは目視と手動で集めるたものだ。これに対して,perlのプログラムで(wgetを使って)何階層かのページを取得したうえで,メールアドレスを取り出すという操作をしていた。いまだと(当時でも)ほとんど危ない技だ。

さて,google検索において立て続けに類似パターンの検索をすると,googleから「おまえロボットちゃうか」と叱られるのである。そのとき出てくる警告ページを図に示す。なんのことはない,CAPTCHAのロボットチェックをクリアすればよいだけである。

図:google検索における警告メッセージ

今回,これが現れたのは,ひらがな回文タイプの「なか○かな」の○部分にあ〜んまでを順にいれて調べようとしたからだ。なぜかというと,TikToker/YouTuberのなかねかなの「モテすぎて草,誘ってて森」が流行っていたのだ。

「TikTokでよくみるイケメンが カメラ目線で 音に乗せて にこにこしている動画 あれいつも 思うけど めちゃくちゃ私のこと 誘ってて草 完全に私のこと 好きで森・・・(作詞 かなねかな)」のフレーズが耳から離れない。

なかかな(かな先生)といえば,バイオリンはじめチャンネルだったので,もしかしてこのパターンのアカウントが沢山あるのかと調べてみたところ,TwitterやInstagramやYouTubeで「なか○かな」のユーザがぞろぞろ見つかった。

「かな」が人名を表すと同時に俳句の句末の切れ字になっているのでよく出てくるのかも。

0 件のコメント:

コメントを投稿