2024年12月15日日曜日

Sora

OpenAIの動画生成ツール Sora が使えるようになった。10ヶ月ほど前に東京を歩くイメージがプレビューされていたが,12月9日からChatGPT Plusユーザも限定版が公開された。ただし,昨日までは混んでいますとログインがはじかれていた。ようやく今日になってアクセスできた。

20ドル/月のChatGPT Plusサブスクライバーは,一ヶ月に 50 videos (1000 credits) まで使えるらしい。最高720pの解像度で 5秒までのビデオクリップだ。一瞬,50個だけでお仕舞いかと思ったけれど,毎月課金されているのだから一月分の制限になる。なお,200ドル/月のChatGPT Proだと,500 videos (10,000 credits),1080p 20秒で,watermarkなしのダウンロードまでできるのだ。

早速,次のプロンプトで試してみた。

Japanes Heian era, "Shinden-Zukuri" house, collidor faced at japanese garden, a noble lady of "Nogo" slowly walking wearing "12-hitoe" kimono cloths like the "Genji Monogatari Emaki"

やはり日本文化はだめだわ。平安時代ではなくて江戸時代になっているし,十二単にはなっていない。むしろ中国風の着物ではないか。


図1:Soraで生成した寝殿造の廊下を歩く十二単の女御(480p 5s 2個)

ChatGPTの最初から,俳句がだめだった。英語俳句の和訳版みたいなものしか生成できなかった。やつらは日本文化はほとんど学習できていないのだ。光る君へ的な平安時代の源氏物語絵巻風を要求した結果も見てほしい。まあ,Gemini2.0 Flashに,「源氏物語絵巻のような平安貴族の一場面のイメージ」から始めて詳細プロンプトを得た(イメージはGoogle AI Studioでは生成できないことがわかった)。そこに出てくる障子と襖をそのまま放置してChatGPT-4oに投げ込んだ自分も悪いのだが。

Q(koshix):
「御簾越しに女性が物思いにふける場面」で、2~3人の若い十二単の女御、屋内、秋の紅葉、しっとりと落ち着いた雰囲気」のイメージを生成してください。なお,次のような詳細仕様を参考にしてね。 構図: 御簾を境に、手前に1人、奥に2人程度の若い女性が描かれます。手前の女性は、少しうつむき加減で物思いにふけっている様子。奥の女性たちは、静かに寄り添い、控えめに会話をしているかもしれません。 人物: 若く美しい、十二単をまとった女御たち。髪は長く、黒髪で、お化粧も上品で繊細。それぞれの表情には、少し憂いを帯びたような、しっとりとした感情が感じられるように表現します。 服装: 十二単の色合いは、秋の紅葉に合わせて、落ち着いた赤や黄色、オレンジ色などを基調とし、上品で優雅な雰囲気に。 背景: 屋内の様子。御簾は繊細な模様が施され、奥には、秋の紅葉が美しく見えるように、障子や襖などが描かれます。 雰囲気: 全体的に、しっとりとした落ち着いた雰囲気で、静けさの中に少しの寂しさや憂いが感じられるようにします。光源は柔らかく、間接照明のように落ち着いたトーンで表現します。  

図2:上のプロンプトに対応するイメージ(DALL-E3)

0 件のコメント: