OpenAI представила нейромережу Sora, яка створює відеоролики за текстовими запитами

16.02.2024 16:29 39

Наразі система доступна для тестування обмеженому колу користувачів

Компанія OpenAI представила нову систему штучного інтелекту Sora, яка може створювати відеоролики на основі текстового опису. Про це йдеться у блозі компанії.

Зазначається, що Sora може створювати відео тривалістю до хвилини, зберігаючи візуальну якість і дотримуючись підказок користувача.

У соцмережі X OpenAI вже опублікувала кілька відео, створених за допомогою нейромережі.

Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024

Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024

"Sora здатна генерувати складні сцени з кількома персонажами, специфічними типами руху та точними деталями об'єкта і фону. Модель розуміє не лише те, що користувач попросив у запиті, але й те, як ці речі існують у фізичному світі", – йдеться у повідомленні.

У компанії додають, модель має глибоке розуміння мови, що дозволяє їй точно інтерпретувати підказки та генерувати переконливих персонажів, які виражають яскраві емоції.

При цьому в OpenAI вказують на те, що поточна модель має слабкі місця. Труднощі можуть виникати з точним моделюванням фізики, а також їй важко простежувати причинно-наслідкові зв'язки.

"Наприклад, людина може відкусити шматок печива, але після цього на печиві може не залишитися сліду від укусу", – кажуть в компанії.

Модель також може плутати право-ліво, мати труднощі з точним описом подій, що відбуваються в часі, наприклад слідуючи за певною траєкторією камери.

Наразі система Sora доступна для тестування обмеженому колу користувачів. Йдеться про фахівців з протидії поширенню дезінформації, мови ворожнечі та з кібербезпеки, яким запропонували оцінити її ризики.

"Ми також надаємо доступ до ряду художників, дизайнерів і режисерів, щоб отримати відгук про те, як вдосконалити модель, щоб вона була найбільш корисною для творчих професіоналів", – додають в компанії.

Надалі компанія хоче залучити політиків, викладачів і митців у всьому світі, щоб протестувати позитивні випадки застосування нової технології.

Раніше ми повідомляли, що компанія OpenAI випустила нову версію свого популярного чат-бота ChatGPT, який тепер запам’ятовуватиме слова користувачів, щоб використовувати цю інформацію в майбутніх розмовах.

Теги: штучний інтелект