ラベル コンピュータ の投稿を表示しています。 すべての投稿を表示
ラベル コンピュータ の投稿を表示しています。 すべての投稿を表示

2024年2月29日木曜日

赤ちゃんコンピュータ

スマートキャップからの続き

日本でも小学生はGIGAスクール構想で,普段からコンピュータを使う環境が与えられることになった。そうなると,こどもたちがウェラブルコンピュータを使うようになる日も近い。まあ電脳コイルではすでに予言済みだ。

ではその下限年齢はどこまで行くのか?赤ちゃんがゴーグルをするわけにはいかない。老人が,Apple Watchで心拍数や不整脈の検知をするように,赤ちゃんのバイタル情報で健康管理というのはありえなくはない。その場合は,おむつや肌着のセンサーと連動させるのだろうか。

赤ちゃんがハイハイをして立ち上がりだして,喃語を発する頃には,スマートベビーサークルで活動ログをとり,これをAIで分析するというようなこともできそうだ。お金持ちはベビーシッターを雇うことになるので,普通の保育所での異常検知サポート用システムのほうがリアリティがあるかもしれない。

こんな想像は,開発途上国には縁のない,"先進国"のお遊びにすぎないものだろうか。

Q(自分):赤ちゃんや幼児がウェラブルデバイスを身に付けて,健康情報の取得や,成長支援等に使うような時代はくるでしょうか。

A(Gemini):はい、将来的には、赤ちゃんや幼児がウェアラブルデバイスを身に付けて、健康情報の取得や成長支援に活用する時代が到来する可能性が高いです。以下、その可能性について詳しく考察するとともに、具体的なユースケースや課題についてご紹介します。

1. 健康情報の取得

体温、心拍数、呼吸数、睡眠状態などの生体情報をリアルタイムでモニタリング
収集したデータを分析することで、病気の早期発見・早期治療に役立てる
発熱や脱水症状などの異常を早期に検知し、保護者に通知
アレルギー症状の出現を予測し、予防措置を講

2. 成長支援

運動量や睡眠時間の記録
発達段階に合わせた育児アドバイスの提供
乳児の泣き声の分析によるニーズの推測
親子間のコミュニケーション促進

3. 具体的なユースケース

スマートおむつ:おむつ濡れ検知だけでなく、体温や皮膚の状態もモニタリング
ベビー服に内蔵されたセンサー:体の動きを記録し、発育状況を分析
スマートおもちゃ:遊びを通して、赤ちゃんの知育を促進

4. 課題

デバイスの小型化、軽量化、安全性
プライバシー保護
データの正確性
ユーザーインターフェースの開発

5. 技術開発の進展

近年、ウェアラブルデバイスの技術は目覚ましい進歩を遂げており、小型化、軽量化、高機能化が進んでいます。また、センサー技術や人工知能(AI)技術の発展により、より精度の高いデータ収集と分析が可能になりつつあります。

6. 社会的な受容

将来的には、これらの技術開発の進展と社会的な受容が進み、赤ちゃんや幼児向けのウェアラブルデバイスが広く普及していく可能性があります。

7. まとめ

赤ちゃんや幼児向けのウェアラブルデバイスは、健康情報の取得や成長支援など、様々な可能性を秘めています。課題を克服し、技術開発と社会的な受容が進めば、将来的な育児のあり方を変える革新的なツールとなる可能性を秘めています。

写真:赤ちゃんがセンサーをつけるときのイメージ(Natureから引用[1])

写真の話は,直接関係ない件なのだけど,斜め右上で近い話なのかもしれない。

[1] This AI learnt language by seeing the world through a baby’s eyes(Nature)

2024年2月12日月曜日

スマートキャップ

スマートへルメットからの続き

神戸大学の塚本昌彦先生ではないけれど,コンピュータはウェラブルへの道を進んでいる。Appleを例にとれば,MacBookから,iPhone・iPad経由して。Apple Watchや Apple Vision Pro(空間コンピューティング)と来ている。

その本命が電脳コイルのような眼鏡型なのかどうなのかはまだわからない。ただ,ゴーグルタイプではないような気がする。とはいってもリスト型もちょっと違う。視聴覚へのインターフェースを考えれば,頭の周辺で常時身に付けるものになるので,帽子か眼鏡の2択になる。

GoogleのGeminiに「ほとんどの人が常時身に付けることになるAIデバイス(ウェラブルコンピュータ)の形態としてはどんなものが考えられるでしょうか。ゴーグル型,メガネ型,帽子型,腕時計型,それぞれの長所や短所を整理した上で有望な順に並べてください。」と尋ねたところ,1位:腕時計型,2位:メガネ型,3位:ゴーグル型,4位:帽子型ということだ。


図:DiffusionBeeでは適当なイメージが出てこない。


重ねて聞いてみた。「帽子型は,キャップの鍔の部分に格納されている表示用パネルを降ろすことによって,XR機能を持たせることができますし,帽子の周囲に光学センサー(カメラ)を配置することで,視線+手指入力も可能になるのですが。」

Geminiが空気を読んだ結果がこれだ。自分の考えていたことをほぼ説明してくれている。
帽子型ウェアラブルコンピュータは、キャップの鍔に格納された表示用パネルや帽子の周囲に配置された光学センサー(カメラ)を活用することで、XR機能や視線+手指入力など、ユニークな機能を実現できる可能性があります。以下、詳細な考察と、具体的な活用例をいくつかご紹介します。
 1. XR機能
  鍔部分に格納された有機ELパネルなどを利用し、AR/VRコンテンツを表示可能
  透過型ディスプレイを用いることで、現実世界の情報とシームレスに融合
  バイザーを降ろすことで、没入感の高いVR体験を実現
  頭部の動きに追従するヘッドトラッキング機能を搭載することで、より自然な操作感を実現

・具体的な活用例
  ナビゲーション:目的地までの道順を視覚的に表示
  教育:歴史上の人物や建造物を3Dで再現
  エンターテイメント:映画やゲームをより臨場感豊かに体験
  情報表示:ニュースや天気予報などを常に視界に表示

 2. 視線+手指入力
  帽子周囲に配置されたカメラで視線を捕捉
  指先ジェスチャーと組み合わせることで、直感的な操作を実現
  ハンズフリー操作により、作業効率を向上

・具体的な活用例
  スマートフォン操作:画面を見ずに電話をかけたり、メッセージを送ったり
  音楽再生:曲の再生、停止、音量調整などをジェスチャーで行う
  ゲーム操作:視線でキャラクターを操作し、指先で攻撃を行う

 3. その他の機能
  マイクを搭載し、音声認識による操作も可能
  太陽光発電パネルを搭載し、バッテリーの充電を可能
  頭部の温度や湿度を測定し、健康管理に役立てる

 4. 課題
  デザインと機能性の両立
  軽量化とバッテリー持続時間の向上
  プライバシー保護

 5. 将来展望
 技術の発展により、帽子型ウェアラブルコンピュータは、より小型化、軽量化、高機能化が進み、ファッションアイテムとしても広く普及していく可能性があります。また、医療や介護、教育など、様々な分野での活用が期待されています。

 6. まとめ
  帽子型ウェアラブルコンピュータは、XR機能や視線+手指入力など、独特な機能を備えることで、従来のウェアラブルデバイスとは異なる新しいユーザー体験を提供することができます。課題を克服し、技術開発が進めば、将来的に人々の生活に大きな影響を与える革新的なデバイスとなる可能性を秘めています。

2024年2月7日水曜日

Apple Vision Pro(2)

Apple Vision Pro(1)からの続き

2月2日にAppleのVision Proが発売になって,数日が経過した。アメリカ国内だけの限定発売であり,日本語にもまだ対応していないが,YouTubeでは日本人によるファーストインプレッションも沢山あがってきた。

最低の256GBモデルでも3499ドル(52万円),多少オプションを付ければ60万円のシステムなので,おいそれとは手が出ない(昔の為替レートなら30万円なのだけど)。その上現地までの航空費や宿泊費を含めると,仕事関係の人か,収益化につながるYouTuberかよほどのアップルフリークでないと参戦していない(米国の連絡先/配送先住所と米国のAppleIDが必要)。

なおかつ,アップル製品への関心が高くてテクノロジーに関する経験の深い人々による印象なので,割り引いておかないと本当のところはなかなかわからないかもしれない。それでも,その評判はなかなかよいものだった。

視野角は左右90度で上下も狭いが,外部カメラからとりこまれる環境映像が自然にパススルーされている。そこに非常に高精細なVision OSのUI画面が重ねられ,丁寧に個人向けに調整された視覚環境は申し分ないようだ。ユーザインタフェースも視線と指による(音声は英語がひつようなのであまりレビューされていない)もので,まったく違和感なしに使えている。自分が2008年8月に最初に手にしたiPhoneのタッチ画面を楽々と使いこなせたのと同じようだ。

手元にMacbookがあればその画面を表示できて,マウスコントロールやデータのやりとりがVision OS固有アプリとの間で簡単にできるところも素晴らしい。

外付けになるバッテリは妥協できそうだが,問題は,650gの重さのようだ。あと,人によっては眼がつかれるとのこと。ブラウザのYouTubeは問題なく視聴できるらしく,Apple のVisionOS ネイティブアプリもあって,iOSアプリも利用できるらしいからほとんど問題はなさそうだ。

ただ,空間コンピューティングを実現する新しいディスプレイとコンピュータだと考えた場合は,macOSのように,Xcode環境はターミナルが動いて,JuliaとMathematicaまで動かなければちょっとためらわれる。もしそれが可能になれば,いまのMacBook Airとディスプレイを完全におきかえるものとなる(スペック上はM1 MacBook Airを越えられる)。ただし,G5とGPSが使えなければ,モバイル端末としてのiPhone/iPadを代替するまでにはならない。



写真:店頭のApple Vision Pro (Wikipediaから引用)

[4]Apple Vision Pro - できること全て(大川優介)

2023年12月1日金曜日

ai pin

ぼんやりしていると,重要な話題を逃してしまうことが多い。

3週間前の11月10日のニュースになっていたヒューメインai pin である。ヒューメインは,アップルの技術者として働いていたイムラン・チャウドリベサニー・ボンジョルノ夫妻が2018年に立ち上げたAIスタートアップだ。

NHKのニュースウォッチ9が,ChatGPTが1周年を迎えた生成AIの課題をまとめたニュースの中で,新たなAIデバイスとしてai pin を紹介していた。早く教えてよ。調べてみると,3週間も前に最初のニュースが出ていた。

ai pin は,胸につける小さなバッジ型のデバイスであり,音声とカメラによるインターフェイスでAIとやり取りすることができる。ディスプレイはついていないが,小型レーザプロジェクタで手のひらに文字情報を映し出すことができる。なるほどそうきたか。

既に米国では699ドル(日本円で10万円強)販売(予約?)されているが,AI使用料を含んで月々24ドル(3,600円)のサブスクリプションが必要である。日本で使おうとすると国際ローミングが必要なのでちょっとまだ無理そうだった。音声入力インターフェースには良い面と困った面があるので,公共の場でうまく使えるかどうかが勝負か。同時通訳には最適だ。ジェススチャーだけである程度のコマンドが指示できれば問題ないのかもしれないが。



写真:AiPinのサイズ(humaneサイトから引用)

2023年6月10日土曜日

Apple Vision Pro(1)

2023年6月5日のWWDC23で,Apple Vision Pro という最初の空間コンピュータのモデルが発表された。

事前には,アップルから待望のMRゴーグル(ただし非常に高額)が発表されると思っていたが,アップルの宣伝文句はそうではなかった。
(1) Mac (+マウス):パーソナルコンピューティングの登場
(2) iPhone(+マルチタッチ):モバイルコンピューティングの登場
(3) Vision (+指・声・視線):空間コンピューティングの登場
と位置づけられていた。ユーザインターフェイス的には (1.5) iPod (+クリックホイール)もあった。

3500ドル≒49万円なので,一般消費者向けにすぐ普及するというものではないけれど,企業やソフトウェア開発現場では十分導入可能なものだろう。単なるゴーグルと考えると,Meta Quest 3Pico 4の数倍以上だが,新しいコンピュータと考えれば一応納得できるかもしれない。

なにせ,CPUとしてM2チップを搭載し,これに,前方のメインカメラ2基,下側を見るカメラ4基,赤外線照射器が2基,サイドカメラが2基,ライダースキャナ,TrueDepthカメラ2基,マイク6個,内側には眼を囲むようにLED(アイトラッキング用に目に見えない光のパターンを照射)と赤外線カメラ2基,をコントロールするR1チップが加わるというものだ。虹彩認証が組み込まれ,他社のような操作のためのコントローラはない。

一番ビックリしたのは,Twitterでのうみゆき@AI研究さんの次の記事だった。
Vision Proはアイトラッキングと網膜状態の検出ができる。ハンドトラッキング、身体の揺れ方、声の調子とかも常にデータ収集し続けている。AppleWatchを付けてれば脈拍だって取得できる。AppleのAIモデルはこれらの人体データを総合的に判断して、ユーザが好奇心を感じてるか、怯えているか、そういう精神状態を予測する。

眼球を介在した脳コンピュータインターフェイス。あんな大きなものを頭・顔に付けるというのはどうしても納得できないのだけれども(今でも),もしかするとその先には脳波インターフェイスも視野に入ってくるかもしれない。それでもせいぜい,キャップ型空間コンピュータということで勘弁してほしい。


写真:Apple Vision Pro (バッテリで2時間駆動…orz)(Apple から引用)

追伸:年金生活者にはちょっと買えそうもないデバイスだけれども,新しい種族のコンピュータ & 初の3Dムービーカメラ & 初の3Dテレビ と考えるとどうだろうか。問題は,家族で共用できないこと。装着したまま外出するのはたぶん危険をともなうこと。

2023年5月31日水曜日

googleアカウント

あせった。

googleアカウントで使っているシステムに,YouTubeとこのBloggerとBardという三種の神器がある。そのアカウントがログオフされたので,再度ログインしようとしたところ拒否された。メールアドレスもパスワードもまだ忘れてはいない。

図:脱出できない魔のエラー蟻地獄

ところが,上のエラーがでてきて何度試してもダメなものはダメ(アカウント名やパスワードが違うとはいわれていない)。パスワードの変更もできない。困ったときは,helpに頼るか検索すればよいのだけれど,Googleのサポートページはたらい回しされるだけで,役に立たなかった。

しばらく放置していたが,それでは問題は解決しない。そこで,ChatGPTに聞いてみたところ,いくつかヒントがでてきた。その中の二段階認証あたりに問題があるのかと思ってさらに調べていると,復元というキーワードが見つかった。そこで,復元のページからログインしてみると,従来のメールアドレスとパスワードで無事に入ることができた。

その後うまくいったような,そうでもないようなだったので,もう一度復元のページにログインしてからパスワードを変更して,その他のよけいなアプリ連携も消してみた。どれが功を奏したのか分からないが,なんとかYouTubeとBloggerに入ることができ,この記事を書いている。よかったよかった。

最悪の場合の対処を考えていた。(1) Blogger:別のblogサービスに移動するか新しいアカウントをつくってデータを移行する(1500本…),(2) bard:使わなくても大丈夫かもあるいは新しいアカウントで,(3) Gmail:これも使わなくてもいいかもしれない,(4) YouTube:視聴だけなので別アカウントに移行してもチャンネル登録だけなのでそれほど問題ない。

外部のサービスに頼り切りだとこんなときに困る。絶対に日本独自のLLMとクラウドと検索エンジンを作る必要がある。アメリカに貢ぐだけのへたな国防予算よりも圧倒的に優先度が高い(まあそれよりも生きるための食料とエネルギーの自給かもしれないが)。

2023年3月14日火曜日

円周率の日

円周率の分数近似(4年前)からの続き

3月14日は円周率の日だ。

PC-9801を導入して最初のころにBASICで円周率の計算の例題を入力して試してみた。参考書にあったのがマチンの公式だった。$4 \tan^{-1 }\frac{1}{5}- \tan^{-1}\frac{1}{239}=\frac{\pi}{4}$を級数展開して求めるもので,$\tan^{-1} 1 = \frac{\pi}{4}$より収束が良く計算時間も稼げる。それでも当時のBASICインタープリタでは1000桁の計算に多少時間がかかっていた。今では,MathematicaでN[Pi,1000000]とするだけで,0.28秒でMacbook Air M1 の画面に100万桁の円周率が表示される。

1980年代,まだ日本のベクトル型スーパーコンピュータに勢いがあった頃,東大大型計算機センターを舞台として,金田康正さんが円周率計算桁数の世界記録を更新し続けていた。かれらのグループの最後の輝きは,2002年にHITACHI SR8000により1兆桁を計算したというものだった。

その後,時代はPCによる計算競争に移ったが,現在の記録はやはり日本人が持っている。Google Cloudの技術者である岩尾エマはるかが,2019年に31兆4159億2653万5897桁を記録し,2022年には100兆桁に達したチュドノフスキーの公式を用いた計算はGoogle Cloudで157日かけて実行された。

円周率の計算は,arctan型の何種類かの公式やガウス=ルジャンドルのアルゴリズムラマヌジャン型公式が用いられることが多い。チュドヌフスキーの公式は次のようなものだ。$n$が一つ進むごとに14桁近く精度が増えていく。

$ \dfrac{1}{\pi}=12 \Sigma_{n=0}^{\infty} \dfrac{(-)^n (6n)!(545140134n+13591409)}{(3n)!(n!)^3 640320^{n+3/2}}$

これをさらにすすめたものに,ボールウェィンの公式があったので確かめたところ,Juliaの計算値で$n>=1$の場合がおかしい。公式が間違って印刷されているのかと思ったが,Mathematicaではうまくいく。結局,Juliaの変数の任意精度の取り扱いが間違っていた。こちらのほうは,$n$が一つ進むごとに24桁近く精度が増えていく。

$A=1657145277365+212175710912\sqrt{61}$
$B=107578229802750+13773980892672\sqrt{61}$
$C=(5280\,(236674 + 30303\sqrt{61}))^3$
$ \dfrac{1}{\pi}=12 \Sigma_{n=0}^{\infty} \dfrac{(-)^n (6n)!(A+B n)}{(3n)!(n!)^3 C^{n+1/2}}$

以下が問題のJuliaのコードである。

function pit(m)

s61 = sqrt(big(61))
A = 1657145277365 + 212175710912*s61
B = 107578229802750 + 13773980892672*s61
C = (5280*(236674 + 30303*s61))^3
#A = BigFloat(13591409)
#B = BigFloat(545140134)
#C = BigFloat((640320)^3)
sum = big(0)
    for n in 0:m
        n6=factorial(big(6*n))
        n2=factorial(big(n))^3
        n3=factorial(big(3*n))
        sum=sum+(-1)^n*n6/(n2*n3)*(A+B*n)/C^(n+1/2)
    end
return BigFloat(1/(12*sum))
end

bpi = big(pi)
println(bpi-pit(0))
println(bpi-pit(1))
println(bpi-pit(2))
println(bpi-pit(3))

2022年12月25日日曜日

四色問題


四色定理の証明といえば,コンピュータを駆使して2000個の配位集合を虱潰しに調べたことで長年の課題が初めて証明された問題として有名である(1976 Appel, Haken)。

コンピュータに頼らない証明ができないので,なんとなくモヤモヤ感が抜けないと同時に,証明に関する既成の観念を変えた例としてもよくあげられる。深層学習による大規模言語モデルに基づいた物理法則の発見でも同じような固定観念の変更が求められているといわれることもあった。

その四色定理の新しい証明がarxivに登場した。"A non-constructive proof of the Four Colour Theorem"というもので,わずか7ページの論文だ。「このアプローチでは,特定の写像の集合に対する生成関数の特異点解析と,Tutteによる平面写像とその彩色多項式に関する列挙的・漸近的研究が用いられている」

Twitterでは,素人衆の期待の声が多いのだけれど,プロからは厳しい声が上がっているような雰囲気もチラチラ見え隠れしていた。どうなることやら。



写真:一松信の四色問題(ブルーバックス1983年版から引用)

2022年11月13日日曜日

ホール・アース・カタログ

NHKの映像の世紀で先日放映された「世界を変えた“愚か者”フラーとジョブズ」がすごく面白かった。

フラーはアメリカの思想家,建築家であるバックミンスター・フラー(1895-1983)。宇宙船地球号という概念の提唱者であり,ジオデシック・ドームを考案した。1985年に見つかった炭素の同素体のフラーレン(buckminsterfullerene,buckyballs)はフラーにちなんで名付けられている。一方,ジョブズは(Apple)のスティーブ・ジョブズ(1955-2011)である。

この二人の愚か者が,ホール・アース・カタログを経由して強く結ばれていたというのが放送のテーマだった。2005年6月12日にスタンフォード大学の卒業式に招かれたジョブズのスピーチは,簡単な挨拶の後にMy story is about death から始まるが,とても印象深いものだった。その結びの言葉である,Stay Hungry. Stay Foolish. は彼が大きな影響を受けたホール・アース・カタログの最終号からきている。

ホール・アース・カタログは,スチュアート・ブラント(1938-)が創刊したヒッピー文化やハッカー文化などのカウンターカルチャーの雑誌だった。そのブラントが,バックミンスター・フラーの多大な影響を受けていた。カタログの最初には,フラーの4冊の本が取り上げられ,The insights of Buckminster Fuller are what initiated this catalog.とあった。(スチュアート・ブラントが後に原発推進の立場になっていたのはまた別の話,松岡正剛の千夜千冊を参照

ホール・アース・カタログが1974年に終刊を迎えたとき,余剰金の2万ドルをどうするかが議論となり,それは結局,平和活動家のフレッド・ムーア(1941-1997)に託された。そのフレッド・ムーアは,1975年3月にメンロパークで立ち上げられたホームブリュー・コンピュータ・クラブ(1975-1986)の創設に加わる。ジョブズはアップルの共同創業者となるスティーブ・ウォズニアック(1950-)とともにこのクラブに参加していたのだった。

2011年にジョブズは,MacやiPhoneやiPadを残し膵臓ガンで亡くなった。彼が生前に計画していた,ノーマン・フォスター(1935-)のデザインによるアップル・パーク本社の特徴的なドーナツ型の建物は,2017年にできあがった。ノーマン・フォスターはバックミンスター・フラーの弟子でもあった。


写真:アップルパークのアップル本社(Wikipediaから引用)

2022年9月5日月曜日

教育データ標準

GIGAスクール構想からの続き 

まず復習。GIGAスクール構想とは,2019年から文部科学省が取り組んでいる施策である。GIGAはGlobal and Innovation Gateway for All の略であり,全国の児童・生徒に一人一台のコンピュータと高速ネットワークを整備しようというものである。2021年3月には,全自治体の96%以上で整備が終っており,いちおう小中学生一人一台という目的が完了したということらしい。

高等学校については,2022年度中に1学年は100%,2024年度までに高校生一人一台を実現する目標となっていて,すでに半数の府県では100%が達成されている。まあ,小中学校も含めてそれらがうまく機能しているかどうかはまた別の話。

これは25年前の100校プロジェクトを嚆矢とした学校へのインターネット導入の動きに匹敵する大きな変化には違いない。ようやくあのころの理想が具体化できる条件が整いつつあるということか。

ところで,この構想を支えるために,教育データの標準化が取り上げられている。教育データを,(1) 主体情報(児童生徒・教職員・学校の各属性等の基本情報),(2) 内容情報(学習内容の情報),(3) 活動情報(生活活動,学習活動,指導活動などの情報)に区分する。これらをすべて網羅的に扱うわけでなく,データの相互運用性を図るという観点で全国的に統一が必要なものに限り,その使用を強制せず,政策的に誘導するというものだ。

教育データ標準として,すでに次のようなものが定められている。学校コード,教育委員会コード,学習指導要領コード。学校は,位置情報(緯度・経度・標高)や時間情報(開設年月,統合年月,廃止年月)がほしいところだ。教育委員会には事務局の住所・連絡先すらない。学習指導要領コードは,NDCとの対応があれば・・・というか,知識を網羅的にコード化することはそもそも可能なのだろうか。普遍性に欠ける学習指導要領の文章を切り出してコード化するというのはどうにも気持ちが悪い話である。

[1]StuDX Style(文部科学省)GIGAスクール構想の実践事例

2022年8月28日日曜日

画像生成AI(4)

画像生成AI(3)からの続き 

最近の,画像生成AIブームについては,note深津貴之(fladdict)さん世界変革の前夜は思ったより静か)や,ギリア清水亮さんStableDiffusionを使った新しいAI作画サービスを作りました。日本語でOK。無料です)などのIT業界の牽引者の注目を集めている。

この波がどこまで広がるかは,気になるところである。いずれにせよ,大規模言語モデルを背景としたAI系の新しい仕組みは今後されに浸透してゆくことは間違いない。これが,OSの標準機能に噛んでいけば,すべてのアプリケーションでAIの仕組みを使った機能が加わる。すなわち,新しいコンテンツの創造が,適切な対話型インターフェース(最低限のプロンプト・エンジニアリング)によって簡単に実現することになる。

(1) 祐筆:タイトルと趣旨を入れるだけで,自動的に,イラスト入りレポートやエッセイや広告コピーや文学作品を生成する機能を持つワードプロセッサ。
(2) 主計:データの要件と目的を入れるだけで,必要なデータを検索して取り込み,これを分析した結果を生成する機能を持つ表計算ソフト。
(3) 算法:入力と出力の集合の定義と関係を入れるだけで,自動的に数理モデリングの手法を選択して結果を最適な表現形態で表わして説明する統合数学ソフト。
(4) 藝術:着想を入力することで,器楽,声楽,効果音,絵画,写真,イラスト,マンガ,アニメ,立体,動画を自動生成する表現支援ソフト。
(5) 森羅:対象(自然現象,生物,鉱物・地形,人工物・商品,建築・構築物,テキスト・画像断片,人物)を撮影すると,詳細情報を説明する検索ソフト。
(6) 執事:予約や買物や連絡を代行して調整するアシスタント。
(7) 師範:自分の学びたい内容について助言するアシスタント。
このあたりが,近未来のパーソナルコンピュータ(=デジタルアシスタント)が持っている7つの基本アプリケーションのイメージになる(ディープラーニングAIや巨大言語モデルと直接関係しないものも含まれているような・・・)。256GB/8TB M7 MacHeadset Air とかで実現できていれば,すぐにも買いたいけれど,それまで生きていられるかしら。

話を戻すと,Stable Diffusionをベースにして清水さんが作った日本語アプリが Memeplex(α版)である。プロンプトの日本語は英語に変換されて Stable Diffusion 1.4に投げられ,結果は512x512の画像としてユーザごとの領域に出力される。入力の際に,画風指定,スタイル指定,作家指定が,ドロップボックスで設定できるが,もちろん,プロンプト枠に手入力しても構わない。待ち行列で順に処理されるが,その待ち行列の中身が公開されているのがおもしろい(その後これは見えなくなった)。


画像:memeplexに「西方極楽浄土 → western paradise」を入力した結果…orz


2022年6月1日水曜日

タテ型コンテンツ

 NHKのクローズアップ現代でタテ型コンテンツ(動画/漫画)が流行しているという話題。

その前にひとこと。地方版も含めて最近のNHKニュースの訂正頻度がとても多くなってきた。毎日のようにお詫びしている。それに加えて政治ニュースの軽重の付け方や恣意的な報道内容の表現のレトリックにより,ほとんど政府広報のようだといわれている・・・

・・・NHKの質的低下がひどいという前振りのつもりが,感情に任せて話がそれてしまった。そのクローズアップ現代で,桑子キャスターが平然として「固定概念」という識者コメントの言葉をそのまま伝えていた。固定観念または既成概念が正しい

もちろん,言葉は移り変わるものであり,最近の若い人達が固定概念という言葉を使うのは耳にすることがあるので,100%おかしいとはいえない。それにしても,NHKという日本の言語表現基準の中心にあるべき組織で,言葉への感度が落ちているのだろうことが想像され,さきほどの政治的偏向と併せて残念な話なのだった。

さて本題は,YouTubeのようなPCに対応したヨコ型コンテンツより,TikTocのようなスマートフォンと親和性の高いタテ型コンテンツの方が最近注目を集めやすくなっている。スマートフォン上の漫画も,従来のような横スライドでなく,縦スライドでコマ移動するものが増えている。このようなタテ型コンテンツの方が,視聴者への主観的な訴求力が高いという結論だった。

パソコンでも昔,日本電気のPC-100という縦型ディスプレイとマウスから構成された日本版Alto(AppleのMacintoshのルーツ)が,1983年に発売されている。大阪駅前第1ビルのNECショールームで始めた見たときは,なかなかカッコよかった。残念ながら,その後主流になったのはスタンダートな横型ディスプレイのPC-9800シリーズのほうであった。


写真:NECのPC-100(Wikipediaより引用)

P. S.  NECの大阪 Bit-INN かと思ったが,それはやはり日本橋にあった。C&Cプラザ的なものだったのだろうか。

2021年11月29日月曜日

スマートヘルメット

NHKスペシャル「中国新世紀(3)実験都市深圳 メイドインチャイナの行方」を見た。流通用AIロボットの会社である,Dorabot(ドラえもんにインスパイアされている)もすごかったけれど,びっくりしたのはスマートヘルメットだった。

スマートフォンの次に来る新しいイノベーションツールは何かとずっと考えていた。時代はズレるがストリンガーに潰されたSONYの旧AIBO(1999-2005)や,電脳コイル(2007)の電脳メガネが実体化したようなGoogleグラス(2013-2015)はその候補だった。けれど,いまだに登場していない。

いや,ドローンバーチャルリアリティヘッドセットのように,それは既に登場しているのかもしれない。しかし,スマートウォッチは,それだけでは完結しないものなので違うような気がする。やはり,スマートフォンを代替する単一のウェラブルデバイスが必要だ。

視覚や聴覚へのアクセスと常時身に付けられるという条件で思い浮かんだのが帽子である。スマートキャップ ,これならば常時装着することが可能だ。バイザーのところを工夫すればディスプレイにもなるし,将来的には脳インターフェースをとることもできる。

表面に可塑性を持つ太陽電池をコートすれば,充電もより容易になる。計算すると太陽定数から数Wというオーダーになったが,晴れた日に外にいる時間は短いだろうから現実的ではなかった。そもそも事故の時のスマートキャップのバッテリー破損の問題をクリアするほうが大変だろうか。それはスマートフォンでも同じか。

そんなところに,スマートヘルメットがでてきたので,先を越されたかと思った次第。紹介されていた自転車用のものはたいした機能はなかったが,バイク用は,日本製のCROSS HELMETもオーストラリア製のForciteも,それなりのポテンシャルを秘めているように見える。ヘッドアップディスプレイには,速度やルート,さらには後方の映像などの補助情報を準視線上に投影でき,外音取り込み可能なインナーイアーヘッドセットも使える。


写真:NSウェスト&SHOEIのスマートヘルメット(NSウェスト株式会社から引用)

2021年11月15日月曜日

ピクミンブルーム

日本でテレビ放送が始まった 1953年の生まれなので,テレビ環境には十分適応している。ラジオはどうかというと,遅ればせながら高校生から大学生にかけて深夜放送を聞いて育った。もちろん小学生時代の貸本屋から始まって漫画雑誌も大丈夫。コンピュータが登場するのは大人になってからだったが,これもなんとかクリアできた。

ところが,残念ながら自分が適応できなかった種目がある。コンピュータゲームだ。そのはしりのアーケードゲームは1979年に大流行したスペースインベーダー。柳田さん夫妻が新婚旅行でハマったやつだ。喫茶店のようなところで何回か遊んだことはあるが,はまるにはほど遠かった。

やがて,1983年の任天堂ファミリーコンピュータを嚆矢に,次々と家庭用ゲーム機が登場する。残念ながら,結婚してそろそろ子供ができようかという頃であり,全く興味も関心もなかった。子供たちが成長する過程でも,ゲーム機の類を買い与える機会はなかった。1996年のたまごっちをのぞいては。自宅には,PC-9801があり,後にはMacBookなども使えたのだけれど,ポストペットで遊ぶ程度だった。

やがて,スマートフォンの時代になり,子供から強く勧められて,コロプラ(コロニーな生活☆プラス)を始めた。位置情報ゲームとよばれるジャンルのはしりだ。これは10年経った今も愛用している。その後,ギークの間で流行るイングレスを生み出したNIANTICが2016年にポケモンGOを産み出し,これは1〜2年楽しんだ。

この間,ジャンルとしてのアクションゲーム,ロールプレイングゲーム,シミュレーションゲーム,アドベンチャーゲーム,スポーツゲーム,レースゲーム,音楽ゲームなどは全くの未踏の地として残ってしまった。残念なことである。

PC-9801が登場したころに,ASCIIかOhPCに掲載されていたフライトシュミレータの機械語のプログラムを2ページびっしり必死で打ち込んだ。モノクロ線画で,5MHzの8086(128kBRAM)上で動作するコックピットがすぐクラッシュしていた時代から,はや40年になる。

さて,最近ピクミンブルーム(NIANTIC 任天堂)の宣伝に騙されて,これをiPhoneにインストールした。11月1日公開のところを11月6日にスタートしたので,珍しく早い対応だった。散歩の歩数がゲームのポイントに直結するスマートフォン向けARアプリなので,老人には相応しいものかもしれない。


写真:ピクミンブルームのスナップショット

2021年10月6日水曜日

プリンタ廃インクエラー

 昔は,研究室や家庭用のインクジェットプリンタとしてはCANONを使っていたのだけれど,なんで魔がさしたのか,6,7年前に自宅のインクジェットプリンタをEPSONのEP-805AWに変更した。2012年9月の発売だが,買ったときは若干古いモデルになっていたかもしれない。

この機種の修理対応期限は2018年7月になっている。廃インク吸収パッドがいっぱいになると警告が出て,リセットしなければ再び使えなくなる。EPSONのQ&Aサイトには次のようにある

「廃インク吸収パッドの吸収量が限界に達しました。」または「廃インク吸収パッドの吸収量が限界に近付いています。」のエラーが表示された場合の対処方法を教えてください。

 PCまたはプリンター本体に廃インク吸収パッドのエラーが表示された場合は,部品交換が必要です。お客様ご自身での部品交換は,行うことができません。部品交換の作業は,弊社修理センターにて承ります。なお,修理対応期限(補修用性能部品の保有期間)が経過した製品については,修理の受付は行われておりません。お手数ではございますが,製品のお買い換えをご検討ください。

えーっ,阿漕な商売である。6年経てば無理矢理買い替えされられるのだった。早速インターネットを調べてみると,1000円くらいで,廃インクカウンタのリセットツールが販売されていて,化粧用コットンで吸収パッドを代替できるという親切なYouTube動画がたくさん公開されていた。

早速トライしてみた。Amazonでリセットユーティリティを注文したところ,最短5分で届くはずがうんともすんとも返事がないので騙されたかと思ったら,6時間後に無事にメールでマニュアルとソフトのダウンロード先と解除パスワードが送られてきた。マニュアルの説明はWindowsのものであって,Macの場合全く参考にはならなかったが,指示通りに進めてことなきを得た。

問題は,吸収パッドのDIYであり,スギ薬局で高いオーガニックコットン(サイズが一番大きかった)を買ってしまって叱られながら,なんとか無事に作業を終えた。安物ドライバの先端が磁化されていないので,奥深いネジの締め付けが一番の難所だった。

とりあえず,今日のところは動いているので良いことにしよう。ダメなら買い替えるしかないけれど,次に買うならインクタンク式かなあ。最終的に元が取れるかどうかわからないけど。


図:WIC Reset Utilityの最終画面(自動的に指示が出て誘導された結果)


写真:廃インク吸収パッドエラーと廃インクタンク(撮影 2021.10.6)




2021年10月3日日曜日

USB-DAC

 オンライン授業の1回目を配信した後で,「ノイズが大き過ぎて聞き取れない,ノイズキャンセリングマイク使ってください」というコメントがあった。昨年は,「声が小さい」というのが何件かあったので,できるだけ iPhone内蔵マイクには口を近づけるようにしていた。

そもそも,オンラインデジタル教材は「遠隔授業のばたばた(2)」にあるように,iPhone のボイスメモ(非可逆圧縮)で収録した音声の m4aファイルと,iPadの GoodNotes5による手書きノートの jpgファイルを,MabBookAirに転送して,ffmpegでマージして mp4ファイルにしたものだった。

音声の収録に,iPhone内蔵マイクを使っていたのを反省して,多少はマシだと思われるEarPodsのマイクを使うことにした。これも3.5mmジャックで MacBook Airに繋ぐか,ライトニングで iPhone SE2に繋ぐか迷ったけれど,とりあえずライトニングの方を選ぶことにして,ffmpegの音声のビットレートを 72kから144kに上げてみた。

#!/bin/sh
for arg in "\$@"; do
 sips -z 880 660 \$arg.jpg
 ffmpeg -loop 1 -i \$arg.jpg -i \$arg.m4a -ab 144k -vb 288k -c:v libx264 -pix_fmt yuv420p -shortest \$arg.mp4
done


これで解決するかどうかよくわからないけれど,いきなり数万円のコンデンサーマイクを買うのもどうかと思うし,ちょっと関心がある AirPods Proにしたところで目的は達成できなさそうだ。これに至る過程でいろいろ調べてみたけれど,音声入力は奥が深くて難しい。

(1) USB接続のノイズキャンセリングヘッドセット(数千円から1万円)を探してみたが,どうもしっくりこない。

(2) アナログ–デジタルの変換やインピーダンスと入力ゲインに鍵がありそうで,USB-DACというものがあることに気づいた。3.5mmジャックをUSB-Cに変換するタイプが1500円からある。これだと思ったが調べてみると EarPodsのマイク入力には対応できそうでない。

(3) ソフトウェアでノイズキャンセルをAI的に処理するものとして,Krispがあったので早速無料版をインストールしてみたが,今ひとつ要領を得なかった。

(4) コンデンサーマイクは1万円からあるけれど,大き過ぎてどうもしっくりこない。iPhoneのライトニング端子に直挿しするzoomのiQ7が対応アプリのHandy Recorderとの組み合わせで良さげであるが,もう少し様子見をする(電波でプチプチ雑音が入るのが難らしい)。

(5) なんだかんだいって,結局 余分なコストゼロで済ませられる EarPods 単体が最も良さそうだなあ。

YouTubeばかり見ていると素晴らしい音質に慣れてしまうのだけれど,これらのYouTuber は数万円から数十万円のマイクやオーディオ環境を整えているので,なかなか簡単には手が届かないということを学生さんは理解してくれるだろうか。

あるいは自分の方がどこかで間違っているのかもしれない。なにせ,高齢者なので高音域の感度が全く悪くなっており,変なノイズもそもそも自分では聞き取れていない可能性も高い。聞こえチェックで,60代の10,000Hzがクリアできないのだから。


写真:zoomのiQ7(Amazonより引用


2021年10月2日土曜日

iPhone

 携帯電話からの続き

まだMacWorldExpoがあったころ,2007年の1月9日にスティーブ・ジョブズが iPhone を発表した。これですけどね。ほとんど感動ものでした。

さて,当時の54歳の自分はこのころ何をしていたのだろう。インターネット狂想曲がおさまって5年たち,子供達も大きくなって写真もほとんど残っていない時期だ。研究室の分属学生も少なかった。過去の手帳をみてもほどんど白紙(手帳を失くして買い替えた年だろうか)。

日本では,孫正義のおかげでソフトバンクでiPhoneが買えるようになったのが,2007年6月の米国の発売から約1年後の2008年の7月11日であり,そのちょうど1ヶ月後の2008年8月11日に天理市役所近くのソフトバンクショップで購入したのが,iPhone3Gだ。

それまで使っていた携帯電話と最も違っていてよかったのが,GPS機能のついた地図だった。また,さまざまなセンサーを駆使して視覚・聴覚・触覚に訴えるアプリケーションが次々と登場するのも珍しくて,卒業生との飲み会で散々自慢したのだった。通勤時にはずっと手に持ったままだったので,平端駅で電車から降りるときに足を踏み外したくらいだ。

翌2009年にはiPhone3GSが発売され,ハードウェア機能が大幅に強化されたため,早速機種更新に走った。これでようやく実用的にも使えるマシンとなったような気がする。院生の市川君と「携帯情報端末の加速度センサーによる実感をともなった運動の理解」を書いたのもこのころだ。今では,誰もが当たり前のようにこれを使える環境が整っている。ただ,GIGAスクールの時代であっても,必ずしも体系的かつ全面的にこうした授業プランが展開されているわけではない。

2年後の2011年のiPhone4Sからはホワイトモデルを買うようになった。ここに至ってようやくiPhoneフィーバーがおさまってきたと同時に,電車で周りを見回すとみんなiPhoneを持っているという時代がやってきたのだった。そして,2015年末か年明けにiPhone6Sを買ってしばらくしたころには,必要な機能がほぼ充足されると同時に革新的な新機能の登場も少なくなり,自分の中のiPhone熱も冷めてしまった。新機種に対応しようという気分がなくなったのである。もう歳なのであった。

2020年にiPhone SE2に更新した話は既に書いている。あと何種類の端末と出会うことになるのだろうか。


写真:この頃が一番よかったのか?iPhone 4S(Wikipediaより引用)

2021年10月1日金曜日

携帯電話

 2008年8月11日に最初のiPhoneを手に入れるまでは,普通の携帯電話を使っていた。どの機種だったか既に記憶が薄らぎ始めているので,記録しておこうとしたが,必要な情報に辿り着くのがなかなか至難の技だった。

ケータイを買おうと決めたのは,i-Modeが始まったのがきっかけだった。これでi-Modeの教育コンテンツサイトを作れるならば価値があると思った。仕事帰りに,自転車で24号線沿いのドコモショップまで走ってパナソニックのP502iを入手した。ところがなぜかP502iの情報があまり見つからないのだ。

たぶん,2000年の3月ごろから関西で先行販売されていたようだが,しばらくたった2000年から2001年にかけての冬に購入したのではなかったか。モノクロディスプレイで,幅43mm×奥行き130mm×高さ16mm,重量は約69gのコンパクトなストレートタイプ。本体色はプレシャスブルー(紺色)を選んだ。


写真:P502i HYPER プレシャスブルー(インプレス ケータイWatchから引用)

2000年代の前半は,次々と新しい携帯が登場する新製品ラッシュの時期だった。カメラが搭載されディスプレイがカラー化されて,画面のタッチセンサーを除いて,今のスマートフォンのベースが出来上がった。

NTTドコモ向け端末では,NECのNシリーズがよくなってきたのでこれに乗り換えることになる。2年後の2002年11月に,N504iSが登場した。当時主流の折りたたみ式になり,31万画素のCMOSカメラが搭載され,2.5インチ163×216ドットのTFTカラー液晶画面になった。丸くてぽっちゃりしたボディだった。


写真:の1インチサブディスプレイ面(Wikipediaより引用)

これは,当時のほぼ必要な機能を備えていたので長く使った。次に機種変更したのは,5年後の2007年11月に発表されたN905iμである。薄型化を図るためにN905iよりは若干機能が絞られていたが,デザイン性からこれに決めた。残念ながらiPhoneが2008年夏に始まったので,これは娘に譲ることになった(のではなかったか・・・)。


写真:N905iμの全体像(インプレス ケータイWatchから引用)


2021年9月9日木曜日

バグの日

今日,9月9日は重陽じゃなくてバグの日である。重陽の節句は旧暦にあてはめなければ菊の香りがただよってこない。 上巳端午七夕も同様。

残念ながら,日本のソフトウェア会社が8月9日をバグの日として語呂合わせで登録してしまったので,話が面倒なことになっている。パクチーの日と野球の日と鍼・灸・マッサージの日とパーク(駐車場)の日と薬草の日だけでもおなかがいっぱいなのに,国際的に通用しないものを。

1947年の9月9日に,コンピュータ科学者のグレース・ホッパーハーバード・マークIIというコンピュータの不具合を調べているときに,本物の虫がリレーに挟まっているのを記録として貼り付けたことに由来して,コンピュータ(ソフトウェア)おけるバグという表現が定着していく。


写真:Harvard MarkIIのログブックのバグ(Wikipedikaから引用)

昨日から,これまで機嫌よく動いていたWHOの新型コロナウィルス感染症に関するjsonデータ処理プログラムが動かなくなってしまった。最初は自作のフィルタfspのせいかと思ったが,よく調べてみると,jsonデータを取得するlynxのところが原因で引っかかっている。

lynx -source としているのにもかかわらずダウンロードされるのが11MBのバイナリファイル。wget でも同様だった。ところが直接URLをブラウザ(lynxでもOK)でたたいてからテキストが表示された後にダウンロードすれば,適切な40MB程度のテキストファイルが取得できた。うーん,どうしてだろうか,面倒なことだ。

2021年3月16日火曜日

ベンチマークテスト

 YouTubeでPCの動画を見ているとベンチマークテストが行われるのが常である。代表的なものが,MAXONのCinebenchCrystalDiskMarkだった。後者は,AmorphousDiskMarkとして一部機能がMac用に移植されている。で,早速自分のMacBookProでテストしてみた。なかなかイマイチの結果であった。



図 MPBmid2012 512GB SSD / SanDisc Extreme 900のAmorphous Disk Mark の結果