OpenAIの新しい動画生成AI「Sora」が1080p 最大20秒の最高水準でついに一般公開
OpenAIの動画生成AI「Sora」が、ついに世間に解禁されました。発表からの10カ月を経て、最高水準とされるこの技術が一般ユーザーも利用可能になりました。OpenAIの「12 Days of OpenAI」の第3日目としての大きな発表です。
1080p解像度で最大20秒の動画生成が可能で、「Text to Video」と「Image to Video」の両機能を備えています。最高水準の動画生成力を見せるこの技術は、時間と突破的なアイデアを作ることができるように設計されています。
ChatGPTのプラン利用者には大きな騒ぎ
Soraの利用可能域は、ChatGPTのプランによって異なります。月額200ドル(約三万円)のChatGPT Proプランのユーザーは、ウォーターマークなしで最大20秒の動画を500本まで生成可能です。月額20ドルのPlusプランでは、50本までの動画生成が可能ですが、この場合、ウォーターマーク付きの動画に限られます。
しかし、Plusプランに与えられるクレジット数は1000であるのに対して、1080p解像度の20秒動画を生成するためには2000クレジットが必要なため、試せる機会は限られます。これは\u480p解像度の正方形動画(5秒)でなければ低クレジットでの実用が難しいんです。
Proプランでは無制限モードも
Proプランのユーザーには、月10000クレジットが付与されますが、それでも生成可能な動画は5本に限られます。ただし、「Slow cue mode」を使用することで、無制限に動画を生成できるので、実質的に無制限と言えます。これは「Runway」のUnlimitedプランと似た概念です。
Storyboard機能の実装
Soraは「Storyboard」機能も備えており、これを使用することでタイムライン上で複数の指示を含むカードを組み合わせることが可能です。これにより、複雑な動画シーンを初心者でも作り出すことができます。
対策を導入したモデレーション
いっぽう、人物画像をアップロードして「Image to Video」を使用する場合には定期的な制限が設けられることが惹かれています。これは子供の体現、ディープフェイクなどの問題に対応するための措置です。
今回の公開にあたり、OpenAIのCEO、Sam Altman氏は「so far away」という文章で「Sora」の名前を何度も繰り返した言及を残しており、その動向が既に目撃されていたようです。