ラベル Apple の投稿を表示しています。 すべての投稿を表示
ラベル Apple の投稿を表示しています。 すべての投稿を表示

2024年6月18日火曜日

スマホソフト競争促進法

スマートフォンにおいて利用される特定ソフトウェアに係る競争の促進に関する法律が,6月12日に参議院本会議で可決された。

発端は,AppleやGoogleのアプリストアが独占的で,他のベンダーの参入を妨げているということだ。AppleのApp Storeでは,登録されたアプリの安全性を慎重に審査しているので,これがなくなることによるセキュリティ上の問題点が懸念されるとの声が広がっていた。完全にそれはぬぐえていないが,とりあえず,ウェブからのアプリの直接ダウンロードを義務づけるまでには至らなくてよかった
スマートフォンが国民生活及び経済活動の基盤となっていることに鑑み、スマートフォンを利用した事業に係る競争環境を整備するため、スマートフォンの利用に特に必要な特定ソフトウェアの提供等を行う事業者を指定し、特定ソフトウェアに係る競争を制限するおそれのある行為を禁止する等の措置を講ずる必要がある。これが、この法律案を提出する理由である。
法案から用語の定義を抜き出してみると。
アプリストア:個別ソフトウェアを有償無償で提供しスマートフォンに組み込む用途の個別ソフトウエア
特定ソフトウェア:基本動作ソフトウェア(OS),アプリストア,ブラウザ,検索エンジンの総称(アプリストアやブラウザは個別ソフトウェアだが,検索エンジンは単にソフトウェアとされている)
個別アプリ事業者:個別ソフトウェアを提供する事業者
ウェブサイト事業者:商品又は役務の提供を目的として,スマートフォンを利用する公衆へのウェブページ又はその集合物の提示を行う事業者
特定ソフトウェア事業者:特定ソフトウェアの提供等を行う事業者のうち,当該特定ソフトウェアの提供等に係る事業の規模が他の事業者の事業活動を排除し,又は支配し得るものとして特定ソフトウェアの種類ごとに利用者の数その他の当該事業の規模を示す指標により政令で定める規模以上であるものを,次章の規定の適用を受ける者として指定するものとする。
特定ソフトウェア事業者(AppleやGoogleのこと)には,特定ソフトウェアの種類ごとに公正取引委員会に指標に関連する事項を届け出る必要がある。ということは,最初にどうやって指標を調べて特定ソフトウェア事業者を指定するのかが微妙なのだけれど,そこま目をつぶるのかな。

法案はわかりにくいので,特定ソフトウェア事業者について,第九条から第五条の禁止される行為と第十条から第十三条の講ずべき措置を,ChatGPT-4oに教えてもらうことにする。もちろん正しいかどうかは保証の限りでない。

A(GPT-4o):
スマートフォンにおいて利用される特定ソフトウェアに係る競争の促進に関する法律案」第五条から第九条で禁止される行為について、具体的な例を挙げて分かりやすく説明します。

第五条:取得したデータの不当な使用の禁止
禁止行為: 指定事業者は、取得したデータを競争上有利に利用してはならない。
具体例:
基本動作ソフトウェア:スマートフォンのOSを提供する事業者が、他のアプリ事業者のアプリ利用データを収集し、そのデータを基に自社の類似アプリを優位に展開すること。
例:OS事業者が他社の地図アプリの利用データを利用して、自社の地図アプリを優位にする。
アプリストア:アプリストアを運営する事業者が、他のアプリの売上データを利用して自社のアプリを優位に販売すること。
例:アプリストア運営者が他社ゲームアプリの売上情報を元に、自社ゲームアプリをプロモーションする。
ブラウザ:ブラウザ提供者が、他のウェブサイトの閲覧データを利用して、自社のサービスを優位に提供すること。
例:ブラウザ事業者が他社のニュースサイトの閲覧履歴を利用して、自社のニュースサイトを優先的に表示する。

第六条:個別アプリ事業者に対する不公正な取扱いの禁止
禁止行為: 指定事業者は、他の個別アプリ事業者に対して不公正な取扱いをしてはならない。
具体例:
不当な差別的扱い:アプリストア運営者が、特定のアプリ開発者だけに不利な条件を課すこと。
例:アプリストアが特定のアプリ開発者にだけ高額な手数料を設定する。

第七条:基本動作ソフトウェアに係る指定事業者の禁止行為
禁止行為: 指定事業者は、基本動作ソフトウェアを用いて他の事業者のアプリストアや機能の利用を妨げてはならない。
具体例:
アプリストアの限定:OS提供者が、自社のアプリストアのみを利用可能にすること。
例:スマートフォンメーカーが自社のアプリストア以外をインストールできないようにする。
機能の制限:他社のアプリがスマートフォンの機能を利用できないようにすること。
例:他社の音声アシスタントアプリがスマートフォンのマイクを利用できないようにする。

第八条:アプリストアに係る指定事業者の禁止行為
禁止行為: 指定事業者は、アプリストアにおいて他の支払手段や商品情報の表示を制限してはならない。
具体例:
支払手段の制限:アプリストア運営者が、自社の支払手段のみを使用させること。
例:アプリストアが自社の決済システム以外を利用できないようにする。
価格情報の制限:他の販売チャネルでの価格情報をアプリ内で表示させないようにすること。
例:アプリストアが、ウェブサイトでの価格情報をアプリ内で表示できないようにする。

第九条:検索エンジンに係る指定事業者の禁止行為
禁止行為: 指定事業者は、自社のサービスを不当に優先表示してはならない。
具体例:
検索結果の操作:検索エンジン提供者が、自社のサービスを他社よりも優先的に表示すること。
例:検索エンジンが自社のショッピングサイトを検索結果の上位に表示する。
これらの禁止行為は、特定ソフトウェアの提供者が市場で不当に優位に立つことを防ぎ、公正な競争環境を維持することを目的としています​​。


A(GPT-4o):
スマートフォンにおいて利用される特定ソフトウェアに係る競争の促進に関する法律案」の第十条から第十三条で指定事業者が講ずべき措置について、具体例を挙げて分かりやすく説明します。

第十条:データの取得等の条件の開示に係る措置
措置内容: 指定事業者は、特定ソフトウェアの利用に伴い取得するデータに関する条件を開示する。
具体例:
基本動作ソフトウェア:スマートフォンのOS提供者が、アプリ開発者に対して、OS利用に伴い取得するアプリの利用状況データやその管理方法を明示する。
例:OS提供者がアプリ開発者に、取得するデータの種類(例:クラッシュログ、使用頻度)やその保存方法を開示する。
アプリストア:アプリストア運営者が、アプリ提供者に対して、アプリストアの利用に伴い取得するデータ(例:ダウンロード数、評価)の取得条件を開示する。
例:アプリストアがアプリ提供者に、ユーザーの評価データの取得方法や利用条件を説明する。

第十一条:取得したデータの移転に係る措置
措置内容: 指定事業者は、利用者が求めに応じて取得したデータを移転できるようにする。
具体例:
基本動作ソフトウェア:スマートフォンのOS提供者が、ユーザーが求めた場合に連絡先データを他のアプリに移転できるようにする。
例:ユーザーが新しいメッセージングアプリを使うために、連絡先を一括で移動できるようにする。
アプリストア:ユーザーが他のアプリストアに移行する際に、購入履歴データを新しいアプリストアに移転できるようにする。
例:ユーザーがGoogle PlayからApp Storeに移行する際に、購入済みアプリの情報を移行できるようにする。

第十二条:標準設定等に係る措置
措置内容: 指定事業者は、標準設定におけるユーザーの選択を容易にする。
具体例:
基本動作ソフトウェア:スマートフォンのOS提供者が、ユーザーが標準の検索エンジンを簡単に変更できるようにする。
例:ユーザーがデフォルトの検索エンジンをGoogleからBingに簡単に変更できるようにするオプションを提供する。
ブラウザ:ブラウザ提供者が、ユーザーが標準設定された検索エンジンを簡単に選択・変更できるようにする。
例:ブラウザの設定メニューで、ユーザーが簡単に検索エンジンを選択できるようにする。

第十三条:特定ソフトウェアの仕様等の変更等に係る措置
措置内容: 指定事業者は、仕様変更や利用条件の変更を行う際に、関係事業者に情報を開示し、対応する期間を確保する。
具体例:
基本動作ソフトウェア:OS提供者が、アップデート前にアプリ開発者に新機能や仕様変更を通知し、適切な対応期間を提供する。
例:新しいOSバージョンがリリースされる前に、アプリ開発者に詳細な変更内容を提供し、テスト期間を確保する。
アプリストア:アプリストア運営者が、ストアポリシーの変更を行う際に、アプリ提供者に通知し、対応期間を設定する。
例:新しいセキュリティ基準の導入前に、アプリ開発者に通知して準備期間を与える。
これらの措置は、公正な競争環境を維持し、利用者と他の事業者が適切に対応できるようにすることを目的としています​​。
これで,実際にサードパーティのアプリストアが登場するのだろうか。ゲームメーカーが独自のアプリストアと課金システムを導入することは,フォートナイトのエピックゲームズの例からもありそうである。それ以外は,ちょっと難しいのではないか。

図:サードバーティーアプリストアのデザインをDALL-Eにまかせてみるが,
全然ダメッぽいのであった。ダメ出し数回してもやっとこの程度(右)

2024年6月12日水曜日

Apple Intelligence

Apple Vision Pro(2)からの続き

6月11日午前2時(現地時間6月10日午前10時)からのWWDC24で,AppleのAI対応機能であるApple Intelligenceが発表された。Apple環境への生成AI機能の導入だ。AppleはAI=Apple Inteligenceと名付けてきた。事前の大方の予想どおりで,特別びっくりするような話はなし。

とりあえず,朝起きて,他の情報を入れる前にAppleのWWDC24キーノートを虚心坦懐に視聴しようとしたところ,NHKの朝のニュースで要点が報じられていた。まあいいか。

(1) 先月のイメージビデオで失敗したので,今回は無難なスカイダイビング物語でスタート。

(2) ティム・クックが最初に紹介したのは,AppleTV+だった。ビデオ配信サービスの中で3年連続1位(Highest Rated Original Programs)だと主張しているけれど本当なのだろうか?

(3) まずはvisionOS2の話から。MacBookの大画面ディスプレイがVision Pro中に展開する。そのApple Vision Proは,米国以外の8カ国で新たに販売開始される。第1弾は6月28日の中国,日本,シンガポール。7月12日に第2弾として,オーストラリア,カナダ,フランス,ドイツ,英国が続く。なお日本での販売価格は59.98万円から。実質70-80万円コースだ。

(4) その後,iOS18,Audio&Home(tvOS),watchOS,iPadOS18,macOS Sequoia(セコイア)と続く。最近のAppleのOSリニューアルはどうでもよいような機能をさも素晴らしいもののようにゴチャゴチャてんこ盛りで付けてくることがさらに多くなった。飾り荷物は振り捨ててほしい。簡素さの中に含まれる美というセンスが完全に欠落してしまった。ここまでで1時間。

(5) 上記の中で少しだけ引っかかったのは,iPadの計算機(手書き機能有り)とmacOS中のiPhoneミラーリングだけだった。ここ,素人受けするポイント。iOS18 / iPadOS18 / macOS Sequoia は,手持ちのiPhone SE2(2020) / iPad Pro 11inch(1st 2018) / MacBook Air M1(2020) でいちおう動くらしい。

(6) 残りの40分がAI機能であるApple Intelligenceの紹介だ。強調されていたのは,Personal Intelligence という言葉と,個人情報を守る仕組みが組み込まれているということだ。Siriが賢くなるだけでなく,OS配下の様々なアプリケーションでAI機能を使うことができる。と同時に,個人の情報に応じた対応が可能になるということだ。標語は,AI for the rest of us 。

特徴的なアプリや事例がピックアップされなかったので,今一つ全体の印象は弱いのだけれど,OSレベルでAI機能が実装されることの意味は大きい。オンデバイス処理とChatGPT-4o等の外部サーバ処理が組み合わせれる。ただ,日本語に対応するのは来年以降(いつ?)である。また,Apple Intelligenceに対応できるのは,iPhone15 ProとMシリーズチップを搭載したiPadやmacだけだ。手持ちのデバイスでは,MacBook Air M1 だけが生き残れる。



図:DALL-EによるPersonal Intelligence + AI for the rest of usのイメージ
その前に入力した無観客WWDC24のキーワードに引きずられている。

P. S. 次の日,日経朝刊は,「Apple AI らしさ不足」というタイトルでさっそくディスりにかかっていた。生成AIの開発遅れを印象づけるものという評価だ。確かに,一瞬Appleの株価は下がったかに見えたが,その後反騰して200ドル台の最高値となった。実際,玄人筋の評価は非常に高い。例えば,エジケン



2024年5月14日火曜日

GPT-4o

OpenAIが5月13日に,新しい生成AIモデルの GPT-4o (小文字の o は omni =普遍的,全体)を発表した。すぐに使えるようになっているが,一般ユーザが全機能をただちに使えるわけでもない。カズさんの村の,ChatGPT 4oで普通に会話できる未来がやってきてしまった。で実例を試していたので,さっそく追試してみる。

が,Macbook上では残念ながらうまくいなかなったような気がする。そこで,iPhoneで試してみると,うまくいっているような気もするし・・・微妙。なお,対応アプリは今のところAppleのみらしいが。

(0) 8ヶ月ぶりにChat GPT-plusにアプライする。前回は6ヶ月のサブスクリプションだった。

(1) macOSの場合
新しいアプリのダウンロードを促される。ChatGPT_Desktop_public_latest.dmg 48MBである。GitHUB上で公開されているものとは違うようだ。
音声対話を選んでみる。音声としてJuniperを選びそれっぽい状態になった。内容は適確なのだけれど,応答は非常に遅い。本人に聞いて見ると自分はGPT-4の派生だがomniは知らないという。OpenAIに聞けという返事。

(2) iOSの場合
以前から入れているアプリに,GPT-4oの選択肢が出てきて利用できるようになった。音声対話も選択できたので,音声としてSkyを選ぶと対話できた。ちなみにカズさんのように画像生成ができることも確認した。応答は先ほどより少しマシか。本人に聞くと自分はGPT-4o(omni)だとのこと。ほんとかなあ。対話ログのシェアでつまづいたので手動で再現。なお,音声対話は自動的に文字起しされて記録が残る。

Q(koshix):
走るメロスの絵をアニメ風で描いてください。

A(GPT-4o):

写真:GPT-4oによる走るメロス(走れメロスではない) 
Q(koshix):
あなたはGPT-4オムニですか。

A(GPT-4o):
はい,私はGPT-4オムニのモデルを使用しています。何かお手伝いできることがあれば,どうぞお知らせください。

Q(koshix):
日本語わかりますか。

A(GPT-4o):
はい,日本語も理解できます,どうぞ日本語で質問やお話をしてください。

Q(koshix):
オムニなんですね。

A(GPT-4o):
そうです,GPT-4オムニは様々なテーマや質問に答えることができるモデルです。何か気になることがあれば,お聞きくださいね。

Q(koshix):
あなたは数学ができますか。

A(GPT-4o):
はい,数学の問題も解くことができます。何か数学に関する質問や問題があれば,教えてください。

Q(koshix):
素数を小さい方から5つ上げて下さい。

A(GPT-4o):
小さいほうから5つの素数は次の通りです:2,3,5,7,11です。他にも質問があれば,どうぞお聞かせください。

Q(koshix):
1から100までの整数の和を求めてください。

A(GPT-4o):
一から百までの整数の和は,等差数列の公式を使って計算することができます。その公式は,$\dfrac{n(n+1)}{2}$です。ここで,$n$は最後の数,つまり百です。計算すると,
$\dfrac{100 \times (100 + 1)}{2} = \dfrac{100 \times 101}{2} = 5050$
ですので,一から百までの整数の和は五千五十です。

P. S. GPT-4oの特徴の説明を忘れていた。音声会話や通訳支援に追従できるほど速くなった 。画像や動画などのマルチモーダル対応。安くなったらしい。無料でも一定範囲で使えるようになるらしい。本物の対応デスクトップアプリはまだ出ていないのかもしれない。


2024年5月12日日曜日

決済トラブル

オンラインの詐欺事件が横行する今日この頃,クレジットカード会社も対策のために怪しい決済の検知にいとまがない。このためしばしば,利用者がトラブルに巻き込まれる。通常は,不正利用検知による一時制限措置のお知らせをクリアすればいいのだけれど・・・。

1.注文Aと問題の発生
(1) 昨日W 13:30 アップル心斎橋店にて,オンラインで商品Aを購入。
(2) 昨日M 13:31 アップルストアからAのご注文内容確認のお知らせ。
(3) 昨日M 13:34 〈重要〉三井住友カード不正利用可能性+利用確認。→→ 本人利用確認✓
(4) 昨日M 14:27 〈同上〉 三井住友カード利用確認OK+利用制限解除+決済不成立。
(5) 昨日T 14:33 上記の件をアップル心斎橋店に電話確認(10分) → 再注文必要とのこと
(6) 昨日S 16:00 アップルから支払い処理に問題ありとのSMS連絡。

店頭にはないオンラインのみの製品だったので,スタッフの丁寧な説明と店頭サポートで問題なくオンライン購入プロセスが完了した。ところがあとで気がつくと,三井住友カードから異常発見通知がきて決済過程は停止していた。(W:ウェブ,M:メール,T:電話,S:SMS)

2.再注文A'とキャンセルと
(7) 昨日W 17:10 自宅に帰り,オンラインのアップルストアで商品A'を購入しなおす。
(8) 昨日 M 17:12 アップルストアからA'のご注文内容確認のお知らせ。
(9) 昨日 M 17:19 アップルストアから支払い問題発生の連絡(実は最初のAの件)
(10) 昨日 W 17:20 あわててアップル商品Aのキャンセル実行
(11) 昨日 W 17:21 〈重要〉三井住友カード不正利用可能性+利用確認。→ 本人利用確認✓
(12) 昨日 M 17:30 アップル商品A'キャンセルのお知らせ
(13) 昨日 M 17:33 〈重要〉三井住友カード不正利用可能性+利用確認。→ 本人利用確認✓
(14) 昨日 M 17:34 〈同上〉 三井住友カード利用確認OK+利用制限解除+決済不成立。
(15) 昨日 M 17:43 〈同上〉 三井住友カード利用確認OK+利用制限解除+決済不成立。

注文Aの件はクリアされたと思ったまま,新たに再注文A'を実行したら,Aの件は片づいていなかった(アップルでは待ち状態)。重複注文になったので,あわてて再注文A'をキャンセルした。これはOK。

3.問題の継続と解消へ
(16) 本日 M 1:31 〈重要〉三井住友カード不正利用可能性+利用確認。→→ 本人利用確認✓
(17) 本日 M 4:59 〈同上〉 三井住友カード利用確認OK+利用制限解除+決済不成立。
(18) 本日 T 9:14 アップル相談窓口に電話連絡(16分)
(19) 本日 M 9:15 アップルID確認リクエスト通知。上記プロセスで必要なID確認の結果。
(20) 本日 S 9:17 〈重要〉三井住友カード不正利用可能性+利用確認。→ 本人利用確認 ×
(21) 本日 T 9:47 三井住友カード相談窓口に電話連絡(9分)→人力で解除

アップルは,決済不成立の場合待ち状態で数時間後に自動でリトライするようだ。これが夜中の(17)の現象。しかし再度,三井住友カード側にはねられてしまう。まあ,確かに怪しい動きではあるよね。朝起きるとこれに気づいたので,本人利用確認✓をして制限解除した。

このままだと永遠の不成立ループになるので,とりあえずアップルの窓口に電話連絡。三井住友側でクリアできれば,自動的に決済に進むとの説明。この途中で,三井住友カード側は,本人利用確認もエラー×ではねられるようになってしまう。これではどうしようもない。三井住友カードの窓口に電話して,事情を説明し,手動で解除してもらう。あとは待つのみ。

4.問題の解決
(22) 本日 M 15:33 アップルご注文ありがとうございます。 
(23) 本日 M 16:57 アップル商品出荷連絡。
(24) 本日 M 18:15  アップル請求金額のお知らせ。

とりあえず問題は解決した。トラブったときの電話が困る。アップル心斎橋や,アップルストアは余裕で10分以上待たされて音楽を聴き続けた。三井住友カードは,AIチャットに誘導されるのだが,これが使いものにならない。ネット上を10分以上たらい回しにされて,ようやく電話番号を発見することができた。電話番号がみつかりにくいだけあって,電話すると窓口にはすぐにつながった。


現金ではなく,カードとオンライン決済とスマホ決済の時代は便利になったかというと,それはそうなのだけれど,問題発生時にとんでもなく面倒なことになる。JRのみどりの窓口も廃止がすすみ,郵便サービスは縮小され,銀行の店舗やATMも減らされ,役に立たないマイナンバーカードでの認証が強制される,とんでもないDX社会が到来しようとしている。災害や戦争には圧倒的に脆弱だし,持続可能性の欠片もみえないDX社会だ。

2024年5月9日木曜日

iPad

日本時間で5月7日の23時にApple Event が開催された。38分なので,WWDCなどに比べると大変短く,iPadの新製品に限定した発表会だった。新製品は,M4のiPad Pro と M2のiPad Air であり,それぞれに13inchと11inchモデルが用意された。

ティム・クックが冒頭で,今日はiPadの話だけですと発言した途端に,株価が下落したらしい。発表内容は事前予想と大きく変わらないのだけれど,一部では,M4チップ=Neural CPU 強化=AI対応=生成AIアプリの全面実装=AI専用マシンとしてのiPadという甘い幻想があったので,期待外れ感が蔓延しているらしい。M4チップのスペックもそれほどではないとのこと。いずれにせよ来月のWWDC24待ちである。それにしても,AI分野でのAppleの出遅れははなはだしい。

iPad Pro の機能を活かすために,1TBモデルを選んでApple Pencil Pro とMagic KeyboardとApple Careをつけると,11inchだとしても38.4万円もする。iPad Airの512MBモデルでは,23.5万円。これでも高すぎる。円安のため,1ドル169円で計算されているらしい。なんてこった。1ドル80円ならば半額で済む。それならば爆売れしそうなのに。

iPad Proでは,厚さが5.1mm (Apple製品中最も薄い)というのが売りになっていた。あとは,2層のOLEDディスプレイとか,横中央に配置された12Mのフェイスカメラとか,高機能化されて,探す機能がついたApple Pencil Proとか。最近,第2世代Apple Pencilを紛失したところなので,それだけは評価できるかもしれない。


写真:iPad Pro の特徴(Apple Event から引用)


2024年2月7日水曜日

Apple Vision Pro(2)

Apple Vision Pro(1)からの続き

2月2日にAppleのVision Proが発売になって,数日が経過した。アメリカ国内だけの限定発売であり,日本語にもまだ対応していないが,YouTubeでは日本人によるファーストインプレッションも沢山あがってきた。

最低の256GBモデルでも3499ドル(52万円),多少オプションを付ければ60万円のシステムなので,おいそれとは手が出ない(昔の為替レートなら30万円なのだけど)。その上現地までの航空費や宿泊費を含めると,仕事関係の人か,収益化につながるYouTuberかよほどのアップルフリークでないと参戦していない(米国の連絡先/配送先住所と米国のAppleIDが必要)。

なおかつ,アップル製品への関心が高くてテクノロジーに関する経験の深い人々による印象なので,割り引いておかないと本当のところはなかなかわからないかもしれない。それでも,その評判はなかなかよいものだった。

視野角は左右90度で上下も狭いが,外部カメラからとりこまれる環境映像が自然にパススルーされている。そこに非常に高精細なVision OSのUI画面が重ねられ,丁寧に個人向けに調整された視覚環境は申し分ないようだ。ユーザインタフェースも視線と指による(音声は英語がひつようなのであまりレビューされていない)もので,まったく違和感なしに使えている。自分が2008年8月に最初に手にしたiPhoneのタッチ画面を楽々と使いこなせたのと同じようだ。

手元にMacbookがあればその画面を表示できて,マウスコントロールやデータのやりとりがVision OS固有アプリとの間で簡単にできるところも素晴らしい。

外付けになるバッテリは妥協できそうだが,問題は,650gの重さのようだ。あと,人によっては眼がつかれるとのこと。ブラウザのYouTubeは問題なく視聴できるらしく,Apple のVisionOS ネイティブアプリもあって,iOSアプリも利用できるらしいからほとんど問題はなさそうだ。

ただ,空間コンピューティングを実現する新しいディスプレイとコンピュータだと考えた場合は,macOSのように,Xcode環境はターミナルが動いて,JuliaとMathematicaまで動かなければちょっとためらわれる。もしそれが可能になれば,いまのMacBook Airとディスプレイを完全におきかえるものとなる(スペック上はM1 MacBook Airを越えられる)。ただし,G5とGPSが使えなければ,モバイル端末としてのiPhone/iPadを代替するまでにはならない。



写真:店頭のApple Vision Pro (Wikipediaから引用)

[4]Apple Vision Pro - できること全て(大川優介)

2024年1月30日火曜日

Apple ID

朝起きていつものようにMacbook Airを立ち上げると,何だかエラーが出ている。

iCloudにアクセスできないとかなんとか。パスワードを入力してもその先に進めない。パスワードの変更もできない。困った。とても困った。Appleのサポートページには,「iCloud に接続またはサインインできない場合」には丁寧な説明がある。が,そこからIDを入れて,CAPTCHAを通ったのに,そこではねられてしまう。どうやらApple IDがロックされていることに気がついた。

思い当たる節がある。いよいよ非常勤講師も最後なので,金曜日に大学のMacbookAirの掃除をしていた。iCloudにログインしたままだったので,ログアウトしようとした。OSが古くてきびきび動かないのでパスワードも何度か間違えてしまう。授業が始まりそうになったので,途中で作業を中断したまま放置してきた。どうもこれがあやしい。

仕方がないので,大学でもう一度状況を確認してから,心斎橋のアップルストアに行こうと考えた。大学のMacbookAirの方は再起動して簡単にiCloudからログアウトできた。もちろんこれだけでは,AppleIDのロックは解除されない。このため,自分のMacBook Air 2000だけでなく,iPhoneもiPadも,メールは届かないし,アップルストアの予約も出来ないし,ICOCAのチャージも出来ない

心斎橋アップルストアの予約のために電話をしてみた。これまた繋がるまでに15分以上待たされた。忍耐力あるもの達だけが通過できるシステムだ。最初に,アンケート協力用の電話番号を入れさせられ,さらに待ち時間用音楽のジャンルを選択するのだが,そんなサービスはいいからとにかく速く対応してほしい。

結局,心斎橋まで行くことはなくて電話だけでロック解除してもらえた。ただし作業は24時間以内なのでしばらく待たなければならない。月にいるSLIMの電源が復活しているかどうかは,地球から電波を送ってそのレスポンスを見る必要があるのだが,気分はこれと同じだ。30分,1時間,3時間では復活していなかったが,6時間でようやくApple IDが復活してほっとした。めでたし,めでたし。

写真:ようやくここまでたどり着いて原因がわかった地点。

2023年12月4日月曜日

万博リング

評判の悪い大阪・関西万博2025の大屋根(リング)である。

万博のシンボルとなる木造大屋根リングは350億円もかかる。そのため,会場建設費+α=2350億円+800億円以上の無駄遣いの象徴とされて,あちこちから叩かれている。まあ大阪維新が万博を持ち出した動機が,同じ夢洲で計画されているIR用地周辺の環境整備だったり,虚構の経済効果だったりするので,それらが見透かされるとこうなってしまう。

そもそも,失われた30年を取り戻すための戦略が,高度成長期の夢よ再びという東京五輪+大阪万博でしかなかったという,創造力+想像力の貧困と税金奪取機会の創出が問題だったわけだ。そのあたりの本質的な問題点を一度忘れて考えてみると,万博にはシンボル的な建造物が必要であるということはわかる。ロンドンの水晶宮,パリのエッフェル塔,大阪の太陽の塔などなど。

1970年の大阪万博にもお祭り広場の上に大屋根があった。その大屋根を突き破った太陽の塔には岡本太郎(1911-1996)が必要だったけれど,今の日本にはそれに匹敵するパワーを持ったクリエイターはいないので,大屋根リング止まりになった。リングがなくて,海外各国からの主要パビリオンもなければ,大阪・関西万博2025は本当にグズグズ,バラバラになってしまうのだろう。

なんだかんだいって,パビリオンが一部建設途上のままでも,2025年の4月に万博が始まってしまえば,マスコミがこぞって囃し立てて機運を盛り上げる。大阪の子供に配った無料チケットの効果もあって,2800万人ではなくともそこそこ人は集まるだろう。よほどの混乱や災害が起きない限りは,東京五輪と同様に無事終って良かったというストーリーがでっち上げられそうな気がする。自分は,万博には行かないつもりだが,孫が連れていってと言い出したときにどうなるかはわからない。


さて,当初計画にはなかった万博リングをごり押しで導入した会場デザインプロデューサの藤本壮介だが,リングのデザインがノーマン・フォスター(1935-)のアップルパーク(2017)のパクリではないかという疑惑記事をみかけた。丸くて中に池があるので似ているというのも言い掛かりじみている。それぐらいはしかたないだろう。ただ,万博リングの直径650mは,アップルパークの直径460mの約√2倍で,万博リングの平均高さ16mの方は,アップルパーク23mの約1/√2倍になっていた。まあ偶然である。

ちなみに,小松左京の物体Oに関係があるのではないかと思って確認してみたが,物体Oは直径1000km,幅100km,高さ200kmの銀の塊だったので形状はかなり違う。また,中心は大阪ではなくて,兵庫県の相生市付近だった。そんなこんなで,リングという形状それ自身はあまりいじめられなくてもいいのにと思う。


図:各リングの断面図の比較

2023年9月26日火曜日

iPhone15

9月13日にAppleからiPhone15シリーズとAppleWatchの発表があった。

Apple Eventのビデオは,飯村正彦さんの風に揺れる洗濯物のパンツのイメージから始まった。なんだろうと思っていると,途中でMother Natureが登場する小芝居があって,それもスルーすると見るべきところはあまりなかった。

仕方がないので,YouTubeで情報収集する。外部インターフェイスがLightningからUSB-Cに変わったというポイント以外の大きな特徴がよくわからないままだった。ましてやAppleWatchはまだ機能が完全ではない健康デバイスという位置づけから変化していない。YouTubeではガジェット系の皆さんが予約争奪戦に走っていた。まあそれが仕事なので引きずられてはいけない。

散歩の時にiPhoneズームがあると遠くの鳥を撮るときに少しだけ楽しいかもしれない。しかし,そのためにわざわざiPhone Pro Maxを買う気にはならない。そもそもアベノミクス円安のせいで値段が高すぎる。最新機種のドル建て価格が一定なのにも関わらず,円価格の上昇が数年続いている。

2020年7月にiPhone SE2を買ってから3年経過しているが,まだ十分働いているので,買い替えは等分先のことになりそうだ。2026年にはサポートが切れるので,それまでには何とかするのか。発売当初の2-3年は毎年機種更新していたが,これから死ぬまでに機種更新するのは残り1,2回ということか。

念のために,iPhone15とSE2の機能を比べてみたのが次の表だ。
iPhone15       iPhoneSE      
2023 Sep       2020 Apr      
139,800円        69,800円      

A16 Bionic       A13 Bionic     
3.5GHz          2.66GHz       
6コアCPU        6コアCPU      
5コアGPU        4コアGPU      
16コアNE        8コアNE       
256GB         128GB        

6.1インチOLDE     4.7インチLCD    
2556×1179ピクセル    1334×759ピクセル  
460dpi          326dpi  
2,000,000:1       1,400:1       
1000ニト       625ニト       

48MPメイン|超広角   12MPシングル    
12MPフロント     7MPフロント     
ズーム .5× 1× 2×    ズーム 1×      

USB-C/USB2      Lightning/USB2   
FaceID        TouchID       
5G          4G/LTE       
BlueTooth5.3       BlueTooth5.0    
MagSafe        —         

20時間ビデオ     13時間ビデオ    
80時間オーディオ   40時間オーディオ  
147.6×71.6×7.8      138.4×67.3×7.3  
171g         148g        

少なくとも,この近所に5Gの電波が届くまではいらないかな。 


写真:iPhone15青 Appleのサイトより引用

2023年6月10日土曜日

Apple Vision Pro(1)

2023年6月5日のWWDC23で,Apple Vision Pro という最初の空間コンピュータのモデルが発表された。

事前には,アップルから待望のMRゴーグル(ただし非常に高額)が発表されると思っていたが,アップルの宣伝文句はそうではなかった。
(1) Mac (+マウス):パーソナルコンピューティングの登場
(2) iPhone(+マルチタッチ):モバイルコンピューティングの登場
(3) Vision (+指・声・視線):空間コンピューティングの登場
と位置づけられていた。ユーザインターフェイス的には (1.5) iPod (+クリックホイール)もあった。

3500ドル≒49万円なので,一般消費者向けにすぐ普及するというものではないけれど,企業やソフトウェア開発現場では十分導入可能なものだろう。単なるゴーグルと考えると,Meta Quest 3Pico 4の数倍以上だが,新しいコンピュータと考えれば一応納得できるかもしれない。

なにせ,CPUとしてM2チップを搭載し,これに,前方のメインカメラ2基,下側を見るカメラ4基,赤外線照射器が2基,サイドカメラが2基,ライダースキャナ,TrueDepthカメラ2基,マイク6個,内側には眼を囲むようにLED(アイトラッキング用に目に見えない光のパターンを照射)と赤外線カメラ2基,をコントロールするR1チップが加わるというものだ。虹彩認証が組み込まれ,他社のような操作のためのコントローラはない。

一番ビックリしたのは,Twitterでのうみゆき@AI研究さんの次の記事だった。
Vision Proはアイトラッキングと網膜状態の検出ができる。ハンドトラッキング、身体の揺れ方、声の調子とかも常にデータ収集し続けている。AppleWatchを付けてれば脈拍だって取得できる。AppleのAIモデルはこれらの人体データを総合的に判断して、ユーザが好奇心を感じてるか、怯えているか、そういう精神状態を予測する。

眼球を介在した脳コンピュータインターフェイス。あんな大きなものを頭・顔に付けるというのはどうしても納得できないのだけれども(今でも),もしかするとその先には脳波インターフェイスも視野に入ってくるかもしれない。それでもせいぜい,キャップ型空間コンピュータということで勘弁してほしい。


写真:Apple Vision Pro (バッテリで2時間駆動…orz)(Apple から引用)

追伸:年金生活者にはちょっと買えそうもないデバイスだけれども,新しい種族のコンピュータ & 初の3Dムービーカメラ & 初の3Dテレビ と考えるとどうだろうか。問題は,家族で共用できないこと。装着したまま外出するのはたぶん危険をともなうこと。

2023年1月8日日曜日

MacのOCR

だいぶ以前,MacでOCRを使いたいと思ったことがあった。散々探し回ったけれどなかなか適当なアプリケーションがなくてそのままになっていた。

ふと気がつくとMacでOCRできるコマンドがころがっていた。Tesseractというものだ。homebrewでインストールしてみると,すでに導入済みだ。あれ?いつ入れたっけ。覚えていないので再インストールし,ついでに日本語セットもインストールした。

brew install tesseract
brew install tesseract-lang
tesseract --list-langs | grep jpn
jpn
jpn_vert
tesseract test.png test.txt -l jpn+jpn_vert


tesseractでOCRを体験しようにあるような例を一通り試してみたところうまくいっている。横書きと縦書きの混合文も大丈夫だけれど,日本語と英語が混じっている場合,わずかに狂いが生じる場合もありそうだ。また,手書き文字はやはりうまくいかない。これが実用的かどうかはちょっと未知数。

しかし,そもそも何をOCRしようと思っていたのかを忘れてしまっている老人だった。

あっ,思い出した(というかblogを検索して見つけた,こういうときのために毎日ログをとっているわけだ)。WHOのCOVID関係のデータがpdfになっていて,そこからテキストデータを取り出したかったのだ。しかし,これは,pdftotextで解決済みだった(久々のPerl 2020.3.18)。


2022年7月15日金曜日

iPhoneの隠しコマンド

 iPhoneの裏コマンドというページにいきあたった。犬は毎日散歩しているので棒にぶつかりっぱなしだ。だから平均移動速度は極端に遅くなる。

iPhoneの電話アプリで,一連の番号を入力すると機能が発現するというものだ。電話番号として,*3001#12345#* を入力すると,接続されている回線業者のネットワークの情報が見える。

試してみると,上記のWebページとは表示が異なったが,いろいろと情報が出てくる。が,素人にはあまり御利益はなかった。ということは,他にもあるのではないかと検索したら,iPhoneの隠しコマンド集というのがあった。

■【注意事項】隠しコマンドは説明書にも書かれておらず、アップル社が公式に公表しているものではないので、何か不利益な事があっても自己責任・自己解決ということを忘れないでください。また、全てのiPhoneの型番で再現する保証はありませんので事前にご了承ください。

それはそうです。なので眺めるだけにしておく。 


写真:iPhoneの画面キャプチャー(右上のリストから詳細情報に入る)

2022年6月7日火曜日

WWDC22

奈良盆地の田植えがはじまると,アップルの開発者カンファレンスWWDC(World Wide Developers Conference)の季節がやってくる。WWDC22のキーノートが日本時間6/7の午前2時から2時間弱あった。もちろん熟睡中である。朝起きてから評判をざっとみると,イマイチ大きなニュースがなかったようだった。

早速,Appleのサイトでキーノートの録画をみる。今回は屋外でのApple Park 内のライブビューイングだった。現地ではTim CookCraig Federighiの登壇あったが,ライブビューの様子が見えない編集動画を公開していた。印象に残ったのは,カプコン伊集院勝さんが登場したところ。バイオハザードビレッジがApple Siliconに対応したので,もうゲーミングPCでなくてよいという話を日本語でしていた。これは珍しいシーンだ。

ハードウェアは,Macbook Air M2とMacbook Pro M2 13inchの2つが軽く紹介されていた。昨年4月に買ったMacbook Air M1 は CPU/GPU=8/8,Memory/Storage=16G/1T で21.5万円,同じスペックのMacbook Air M2は,CPU/GPU=8/8,Mamoru/Storage=16G/1Tで 26.5万円(注:34.5万円 = 10/8,24G/2T)なので,5万円アップだ。為替レートが130円/$の効果もあって,5万円高くなる。

その5万円で手に入るのは,M2チップ(+20%処理性能),新デザイン(軽量・薄型・スクェア・新色),FaceTimeカメラ 720p→1080p,3.5mm ヘッドホンジャック→ハイインピーダンス,スピーカー→×4,MagSafeポート追加,ディスプレイ→LiquidRetina + 500ニト + 13.6 inchなので,微妙。

iOS16やiPadOS16やmacOS Ventura に至っては,ほとんどどうでもいいような細かな機能を,大げさに宣伝しているので,ちょっとうんざりしてしまう。その中で気になったのが,Dictation(日本語は大丈夫なのか)と,iPadOSとmacOSのシームレスな運用を実現するステージマネージャーくらいか。

iPhoneSE第2世代はぎりぎりiOS16に対応したが,次はどうかわからない。iPad ProもiPadOS16をクリアできた。Macbook Air M1 はもうしばらくいけるだろう。ということで,今回も前回に続いていまひとつ盛り上がりに欠けるWWDCだった。

今回の印象でもっとも大きかったは円が弱いことだ。30-40%程度の貨幣価値の違いはボディーブローのように日本の消費者やAppleユーザを毀損している。まさに後進国化のはじまりだ。

2022年3月9日水曜日

Apple Event 2022 March

  日本時間3月9日午前3時(米国時間 3月8日午前10時),Apple Event 2022 March が開かれた。

最近は1時間でさらっと終るEventが中心になっているようなイメージだ。超強力な新しいM1 Ultra チップの紹介では,登場する開発者たちがすべて女性だった。ティム・クックは青いシャツに黄色いバンドのApple Watchをはめている。今回のプレゼンテーションは全体に地味な感じに抑えられていた。戦争中なのであまり浮かれて騒ぐこともできない。さて,今回の目玉は次のとおり。

(1)iPhone SE3: 大変魅力的なのだけれど,自分の生活圏がソフトバンクの5Gサービスエリアになるのは当分先のようなので,それまでは機種更新することはない。SE2とSE3の比較をすると,サイズは全く同じ,A13 BionicからA15 Bionicへ,RAMは3Gが4G,セルラーは4Gが5Gになり,バッテリは13hから15h。12MP(フロント7MP)のカメラの機能はほぼ同じだが,Deep Fusionが加わった,何それおいしいの?指紋認証があるのがありがたいが,あいかわらずLightningコネクタのままだった。

(2)iPad Air: いま,自分が持っているiPad Pro 11" (第1世代)との違い。チップがA12XBionic からM1へ,セルラーモデルでは5Gが可能,12MPと7MPのカメラはフロントだけ広角12MPに。Apple Pencil 2 はともに使える。Proである必要はない

(3)Mac Studio: Mac Studio M1 Max のほぼ最小モデルは,M1 Maxの10コアCPU+24コアGPU+16コア NeuralEngine,32GBメモリ,1TBストレージで,27万円(同じ構成で MacBook Pro 14" = 36.5万円)。一方,Mac Studio M1 Ultra の最小モデルは,M1 Ultraの20コアCPU+48コアGPU+32コア NeuralEngine,64GBメモリ,1TBストレージで,50万円。

MacBook AirのM1チップ(8コアCPU+8コアGPU)の8倍の面積を持つのが M1 Ultraチップである。M1 Ultraの処理性能はM1の数倍以上で旧MacProを越えているのだった。これに27インチのApple Studioディスプレイが20万円か。研究費が潤沢だった25年前ならばたぶん買っていた。コンパクトなのがなにより。

P. S. 1 : その後,ベンチマークの情報も出てきたが,まだ,WindowsのゲーミングPCの最上位機レベルには達していないようだ。シングルコアの性能は,自分のM1 MacBook Airと同じだし。さらに,これは,次のMacProへの伏線であるという噂だった。あとM2との整合性や整理をどうするか問題とか。

P. S. 2 : macOS 12.3(Monterey),iPad OS 15.4,iOS 15.4 のアップグレードが引き続いてやってきた。目玉は,マスクをつけたままのFace ID認証と,Mac-iPad間のユニバーサルコントロールだ。前者は使わないし,後者は試してみたののの,サイドカーの場合と同様に今ひとつピンとこないのであった。


2021年10月21日木曜日

フォトグラメトリ

 水中考古学の山舩幸太郎の話がテレビで流れていた。NHKのカネオ君だったのかな。YouTubeチャンネルもある。沈没船の様子を記録するためには,長期間のダイビング作業が必要であり,コストもたいへんなものになるところ,フォトグラメトリの技術を使って圧倒的に時間と費用が削減できたという印象的な話だった。

そういえば,大学の地学実験の授業ではじめてみたステレオグラムの写真に感動したことを思い出した。ここでは狭義に「デジタルカメラ等で多面的に撮影した複数のデジタル写真をコンピュータで画像解析し,3次元コンピュータグラフィックス等を得るプロセス」のことを考えたい。

AppleのMacBook発表会をみて,ほとんどのYouTuberが単純な性能や機能談義に終始していたところ,トバログ氏が,MacBook Proからみえる今後のAppleの方向性を議論していたのがおもしろかった。それは,Appleが出遅れている 3DCGを利用したVRARなどのMRが重要な役割を果たす世界である。

その兆候は,iPhoneカメラにおけるLiDARセンサーや,次期macOSのMontereyにおけるObjectCaptureという開発者向けAPIなどにみられる。そう,住宅・建築・土木関係や美術館・博物館・考古学あたり,あるいは自動運転・ロボティックス業界の皆様にとってはフォトグラメトリ最強かもしれませんが,一般コンシューマにtiktokのように浸透するには何が必要なのだろうか。VR/ARヘッドセットをかぶるのはちょっと勘弁してほしいのだけれど。


図:photogrammetryのイメージ(lecture.nakayasu.comから引用)

[1] Sketchfab(The Leading Platform for 3D & AR on the web)

2021年10月20日水曜日

MacBook Pro

 4月にMacBook Pro (mid 2012)を壊してしまって MacBookAir (2020 M1)に乗り換えてから半年たった。M1 MacBook Air は大変快調に動作している。夏場に少し熱くなったファンレスマシンだけれど,バックグラウンドで動いていたソフトを1つ外したところ,全く問題なくなった。これからはむしろ掌に冷たいボディの心配をする必要があるかもしれない。

さて,昨日(日本時間2021年10月19日未明)のAppleEventで,新しいM1 Pro/MAX チップを搭載した MacBook Pro が発表された。ネット上ではかなり盛り上がっている。新しいチップは,従来のM1チップに比べて面積が2〜3.5倍(トランジスタ数がMAXで570億個)。CPUコア数は8(高性能4+省電力4)から10(高性能8+省電力2)へ,GPUコア数は8から16/32へと増えている。メモリ帯域幅は200GB/s または 400GB/sで,従来のM1チップの3〜6倍である。

今のM1チップとシングルコアでの性能は変わらないそうで,マルチコアによる性能が1〜2倍の範囲で強化されるということになる。Appleの宣伝では大変素晴らしいことになっているが,あくまでも旧いIntelチップとの比較であり,実運用上どこまで確かなのかは試してみないとわからない。最も,動画編集をしない自分にはそもそも関係ない話かもしれない。

というわけで,新しいMacBookで一番良かったのは,TouchBARの廃止。TouchIDの採用,1080pのフロントカメラ,USB-C (Thunderbolt 4) × 3ポート,Magsafeの復活かな。3.5mmヘッドフォンジャックも残った。それに+10万円の価値があるかどうかという問題だけど・・・。

(1) MacBook Air  13":21.2 × 30.4 × (0.4-1.6) 1.3kg, 8CPU+8GPU, 16G+1T = 20万円

(2) MacBook Pro 14" (Pro):22.1 × 31.3 × 1.5 1.6kg, 10CPU+16GPU,16G+1T = 30万円

(3) MacBook Pro 14" (Pro):22.1 × 31.3 × 1.5 1.6kg, 10CPU+16GPU,32G+2T = 39万円

(4) MacBook Pro 14" (MAX):22.1 × 31.3 × 1.5 1.6kg, 10CPU+16GPU,32G+2T = 43万円

(5) MacBook Pro 14" (MAX):22.1 × 31.3 × 1.5 1.6kg 10CPU+32GPU,64G+4T = 54万円


写真:MacBook Pro 2021 のサイドビュー(Appleより引用)


写真:M1チップの面積(Appleより引用)

2021年10月11日月曜日

mas

 macOSのアプリは,Mac App Soreを経由してインストールするのが普通である。このためのアプリ名がApp Soreでなので,iOSやiPadOS用のサービス兼アプリの App Storeと同じ名前になっている。微妙にややこしい。

macOSのApp Storeアプリは普通のアプリケーションソフトウェアなので GUI(グラフィッカルユーザインターフェイス)でアクセスする。可もなし不可もなし。この CLI=CUI(コマンドラインインターフェース)版で mas(mas-cli)というものがあることがわかった。しかも,homebrewで簡単にインストールできた。使用例は次の如し。

$ mas list

863486266 SketchBook (8.7.0)
539883307 LINE (7.2.0)
640199958 Developer (9.2.3)
409222199 Cyberduck (7.10.2)
409183694 Keynote (11.2)
405399194 Kindle (1.33.0)
895264364 DjVu Reader Pro (2.5.8)
1380563956 辞書 by 物書堂 (1.2.15)
682658836 GarageBand (10.4.3)
1482454543 Twitter (8.82)
1496833156 Playgrounds (3.4.1)
425424353 The Unarchiver (4.3.3)
1168254295 AmorphousDiskMark (3.1)
1055273043 PDF Expert (2.5.18)
409203825 Numbers (11.2)
497799835 Xcode (13.0)
1153157709 Speedtest (1.22)
409201541 Pages (11.2)
721540800 PDF to DjVu (1.3.0)
1465576485 GraphicConverter 11 (11.5.2)
408981434 iMovie (10.2.5)
1438772273 Cinebench (23.2)
1024640650 CotEditor (4.0.8)
405843582 Alfred (1.2)
1444383602 GoodNotes (5.7.36)
1272842196 egword Universal 2 (2.2.11)
古くなってしまった(outdated)アプリケーションを更新する(upgrade)こともできるらしいのだが,どうもそれはうまくいかなかった(できたのもあるが)。

2021年10月3日日曜日

USB-DAC

 オンライン授業の1回目を配信した後で,「ノイズが大き過ぎて聞き取れない,ノイズキャンセリングマイク使ってください」というコメントがあった。昨年は,「声が小さい」というのが何件かあったので,できるだけ iPhone内蔵マイクには口を近づけるようにしていた。

そもそも,オンラインデジタル教材は「遠隔授業のばたばた(2)」にあるように,iPhone のボイスメモ(非可逆圧縮)で収録した音声の m4aファイルと,iPadの GoodNotes5による手書きノートの jpgファイルを,MabBookAirに転送して,ffmpegでマージして mp4ファイルにしたものだった。

音声の収録に,iPhone内蔵マイクを使っていたのを反省して,多少はマシだと思われるEarPodsのマイクを使うことにした。これも3.5mmジャックで MacBook Airに繋ぐか,ライトニングで iPhone SE2に繋ぐか迷ったけれど,とりあえずライトニングの方を選ぶことにして,ffmpegの音声のビットレートを 72kから144kに上げてみた。

#!/bin/sh
for arg in "\$@"; do
 sips -z 880 660 \$arg.jpg
 ffmpeg -loop 1 -i \$arg.jpg -i \$arg.m4a -ab 144k -vb 288k -c:v libx264 -pix_fmt yuv420p -shortest \$arg.mp4
done


これで解決するかどうかよくわからないけれど,いきなり数万円のコンデンサーマイクを買うのもどうかと思うし,ちょっと関心がある AirPods Proにしたところで目的は達成できなさそうだ。これに至る過程でいろいろ調べてみたけれど,音声入力は奥が深くて難しい。

(1) USB接続のノイズキャンセリングヘッドセット(数千円から1万円)を探してみたが,どうもしっくりこない。

(2) アナログ–デジタルの変換やインピーダンスと入力ゲインに鍵がありそうで,USB-DACというものがあることに気づいた。3.5mmジャックをUSB-Cに変換するタイプが1500円からある。これだと思ったが調べてみると EarPodsのマイク入力には対応できそうでない。

(3) ソフトウェアでノイズキャンセルをAI的に処理するものとして,Krispがあったので早速無料版をインストールしてみたが,今ひとつ要領を得なかった。

(4) コンデンサーマイクは1万円からあるけれど,大き過ぎてどうもしっくりこない。iPhoneのライトニング端子に直挿しするzoomのiQ7が対応アプリのHandy Recorderとの組み合わせで良さげであるが,もう少し様子見をする(電波でプチプチ雑音が入るのが難らしい)。

(5) なんだかんだいって,結局 余分なコストゼロで済ませられる EarPods 単体が最も良さそうだなあ。

YouTubeばかり見ていると素晴らしい音質に慣れてしまうのだけれど,これらのYouTuber は数万円から数十万円のマイクやオーディオ環境を整えているので,なかなか簡単には手が届かないということを学生さんは理解してくれるだろうか。

あるいは自分の方がどこかで間違っているのかもしれない。なにせ,高齢者なので高音域の感度が全く悪くなっており,変なノイズもそもそも自分では聞き取れていない可能性も高い。聞こえチェックで,60代の10,000Hzがクリアできないのだから。


写真:zoomのiQ7(Amazonより引用


2021年9月15日水曜日

Apple Event 2021 September

 日本時間9月15日午前2時(米国時間 9月14日午前10時),Apple Event 2021 September が開かれた。

M1 Macbook Airの全画面表示でみる映像はなかなか美しい。バイオリンのドローン空撮映像による音楽から始まり,何だろうかと思っていたら Calfornia Soul(1967)だった。自分には The 5th Dimension のアルバムStoned Soul Picnicバージョンでなじみの曲だ。Tim Cookの挨拶は,そのCalifornia賛美から始まり,TV+のちょっとした宣伝の後,次の新製品が紹介される。

(1) iPad / iPad mini:衆目の一致するところ,今回の目玉はこのiPad mini の発表である。A15 Bionic 搭載の8.3インチ Liquid Retina Display に Apple Pencil 2 が対応した。Top ボタンに Touch ID が対応しているので安心して使える。A15 Bionic は CPU 6コア+ GPU 5コア,ニューラルエンジンによる機械学習速度2倍など,なかなかの性能を発揮できるという謳い文句だ。12MP の超広角フロントカメラはセンターフレームによる自動パンに対応。背面にもフラッシュ付の12MP 広角カメラがある。価格は59,800円($499)から。買わないけれどなかなかよろしい。

iPad mini はだいぶ以前のバージョンを大学の研究費で購入したことがある。iPadとしては2台目だったが,そこまでうまく使いこなせなかったような気がする。小さいほうは iPhone があるので,iPad 的な使い方のためにはもう少し広いエリアが必要だから。

(2) Apple Watch Series 7:ディスプレイ部分などマイナーな改良が中心だけれど,しだいによくなっている。ただ,これはあいかわらず,アウトドア派で健康指向の人向きだと思えてしまうので買いません。フィットネスと健康管理には最適なのだろう。ウェアラブルデバイスとしては,直接,視聴覚とリンクしていないと難しいと考えてしまうのだ。

(3) iPhone 13:これもマイナーバージョンアップ。Pro Max,Pro無印,mini の4系列はこれまでと同じ。機種の色合いも落ち着いてきたようだ。いつのまにか,望遠,広角,超広角の3カメラシステムに慣れてきた。カメラが一回りおおきくなり,マクロ撮影もできるし,アダプティブな120 Hzとかシネマティックモードとか,たいへん結構です。ただ,iPhone SE2を去年買ったばかりなので,iPhone19くらいまでは更新しない年金生活者なのであった。死ぬまでにあと1機種くらいかしら。あるいは日本が滅びるほうが先か。

TIme Cook のエンディングの言葉は,Stay Safe, Take Care だった。ビデオの最後のエンディングロールでは,プレゼンター,キャスト,クルー,撮影環境において入念な感染予防対策を行っていることをこれでもかと強調していた。今回のAppleの映像は全編を通して,これまでのシリーズに比べとてもよくできているような印象だった。もちろん,Steve Jobsのマジック(特に2007年)には届かないかもしれないけれど。


写真:見たことがなかった California Soul のシングル盤(Discogsさんから引用)


2021年6月29日火曜日

音声合成機能(2)

音声合成機能(1)からの続き

 Macの音声合成機能のコマンドライン版 say はもう少し複雑な使い方ができる。なお,$ man -a say > sample.txt でマニュアルコマンドsayの全体をsample.txtに出力できる。以下はzshでなくbashでの例である,zshでは?を\?とエスケープすること。

(1) \$ say -v \? (出力されるVoice一覧)

(2) \$ say --file-format=\? (出力されるファイル形式一覧)

(3) \$ say --file-format=m4af --data-format=\? (あるファイル形式でのデータ形式一覧)

(4) \$ say --file-format=3gpp --bit-rate=\? (あるファイル形式でのビットレート一覧)

(5) \$ say -a \? (出力デバイス一覧)

(6) \$ say '現在の東京の天気は' `curl -s ja.wttr.in/Tokyo\?0 | sed -n 3p | cut -c 31-` 'です'

ビットレートについては,manの記述も微妙だし,うまく出力されないものがあるがよくわからない。例えば,say --file-format m4af --bit-rate ? が返ってこないんだけれど・・・

英語音声として SamanthaとTomをおすすめされた。Good News,Bad News,Cellos,Pipe Organの4つはそれぞれ特定の歌を歌ってくれるらしい。

[1]Mac の say コマンドの使い方(Qiita)
[2]Macのsayコマンドを使って英語スピーチを練習しよう(福野泰介)
[4]Speech Manager (Apple Developer)