目次【開く】
GoogleのGemini1.5発表をかき消すようなOpenAIのsoraの発表と衝撃
2024年2月16日は2023年から本格化し始めた生成AIの歴史の中でも、世界に衝撃を与える大きな転換点となった日だ。・・・と、後世には言われてるかもしれない。
・・・いきなりの余談だけど、この日、実はGoogleのGeminiの1.5という新しいバージョンが発表されたけど、そのすぐあとにOpenAIがこの発表を行なったので、AI情報を追ってる界隈では「絶対に狙ってやってる」ともっぱら噂だよ(苦笑)
と、本題の『sora』について。
soraとは?
soraとは、OpenAIが開発したテキストからビデオを生成するAIモデルのこと。
ユーザーが短い文章で指示した内容やスタイルに応じて、最大60秒間のリアルで想像力豊かな映像を作り出すことができる。
たとえば、「東京の街中を歩くおしゃれな女性」や「雪原に現れたマンモス」などのシーンをテキストで入力すれば、soraはそれに沿ったビデオを生成する。
Prompt: “Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.”
soraの特徴と魅力
soraは、物理的な世界の動きを理解し、シミュレートする。光や影、色や質感、カメラの動きや角度など、ビデオに必要な要素を自動的に調整して、リアルな映像を作り出せる。
soraはさらに、想像力豊かな映像も生成できる。現実には存在しないものや、まだ見たことのないものをテキストで指示すれば、soraはそれをビデオに表現できる。
例えば「紙でできたサンゴ礁の世界」や「毛皮のヘルメットをかぶった宇宙飛行士の冒険」などのシーンをテキストで入力すれば、soraはそれに沿ったビデオを生成する。
soraは既存のビデオを前後に延長したり、静止画からビデオを生成したりもできる。ユーザーが持っているビデオや画像をsoraに入力すれば、soraはそれを元に新しい映像を作り出せる。
たとえば、「このビデオの続きを見せて」とか「この画像を動かしてみて」という指示をすれば、soraはそれに沿ったビデオを生成する。
soraはまだ一般ピープルは使えないけど
2024年2月16日の公開時点では、soraはビデオ制作に関心のある研究者やクリエイターに限定して公開されている。soraのビデオには、AIによって生成されたことを示す透かし(watermark)が入っている。soraは、OpenAIの使い方に関する規約に従って、暴力的な内容や性的な内容、憎悪的な内容や有名人の顔や他人の著作物などを生成しないように設計されている。
Sora: Creating video from text
soraの由来は日本語の『空』
さらに、日本人としては嬉しいことに、soraのネーミングの由来は日本語の『空』だそうだ。
【日本語の“空”が由来】動画生成AI「Sora」の凄さ
米・OpenAIが発表した生成AI「Sora」
“無限の創造的可能性を連想させる”との思いをこめ、日本語の“空”にちなみ名付ける
報道ステーション+土日ステ (@hst_tvasahi) on X
これまでのOpenAIのchatGPTやGoogleのGeminiの話題はこちら↓
AGIの噂 | cyuncore (キュンコレ)