2023年4月24日月曜日

情報要約の時代

タイパからの続き

情報検索の時代
が到来したのは,1990年代半ばにインターネット上のワールドワイドウェブが登場してからかもしれない。それを予感していたかのように,「情報選択の時代(Information Anxiety)」を買ったけれど,読む前に処分リストに入ってしまったのか見当たらない。

次に来るのは,情報廃棄の時代かとも思ったが,これは終活を控えた老人の場合だけの話。これはこれでで重要な話題だが,その前に必要なのは,大量の情報の海から漁った情報をどうやってできるだけ効率的に消化するかということだ。情報要約の時代が到来している。

タイパの記事では,YouTubeなど動画における倍速視聴を話題にした。それ以外にも,映画や書籍など,全内容を得るのに時間がかかる情報メディアの吸収時間をできるだけ短縮しようとする動きがみられる。著作権侵害で摘発されたファスト映画は,長時間の映画を10-15分にまとめてあらすじを理解しようというものだ。ビジネス書など本の要約サイトもいくつかある。これらは有料なので,そこまで話題になっているわけではない。また,YouTubeにもいりいろなタイプの本の紹介サイトがある。

ここに至って,大規模言語モデルをベースとした対話型AIシステムが登場し,単一のモデルで自然言語処理の様々なパターンを普遍的にこなすことができるようになった。その一つが文章の要約である。よく吟味してみると微妙な場合もあるが,ちょっと目にはそこらの学生と変わらないレベルで要約ができている。業務利用にはもっとも有用な機能の一つである。

しかしながら,素の状態のGPT-4だけでは,事実ベースの要約などはまだ苦手である。例えば,都道府県の人口ランキングだとか,著名な作家リストだとか,人間が複数のリソースからGoogle検索しながら,データを整理するようなタイプの仕事は難しい。まだ,呪文工学(Prompt Engineerring)を駆使せずに簡単に答えを出す段階には達していないようだ。

マイクロソフトのOffice製品にChatGPT機能のCopilotが組み込まれるように,すべてのPCアプロケーションのユーザインターフェイスが自然言語AIになって,情報のアウトプットの要約化が進むと,長文読解力はますます衰えるのかもしれない。TwitterやTikTokが流行したのと同じ原理だ。

0 件のコメント: