Источник изображения: Generated by Unbounded AI
Компания Stability AI, разработчик модели генерации изображений с открытым исходным кодом Stable Diffusion (SD), сегодня объявила о нескольких новых улучшениях своей платформы Stable Diffusion. Эти обновления не только предлагают новые захватывающие возможности преобразования текста в изображение, но и открывают доступ к миру создания 3D-контента.
Наиболее заметным улучшением является совершенно новая стабильная 3D-модель. До сих пор Stable Diffusion была сосредоточена в основном на создании двумерных (2D) изображений. Стабильные 3D-модели изменят эту ситуацию, предоставив функции, которые помогут создавать любой тип 3D-контента, включая графический дизайн и даже разработку видеоигр.
Для графических дизайнеров, цифровых художников и разработчиков игр создание 3D-контента может быть одной из самых сложных и трудоемких задач, часто занимающих часы (а иногда и дни) для создания умеренно сложного 3D-объекта.
Способность Stable 3D генерировать текстурированные 3D-объекты концептуального качества из изображений или иллюстраций или путем написания текстовых подсказок устраняет большую часть сложностей и позволяет неспециалистам создавать 3D-модель чертежного качества за считанные минуты, выбрав модель.
Объекты, созданные с помощью Stable 3D, имеют стандартный формат файлов “.obj”, который можно редактировать и дорабатывать в 3D-инструментах, таких как Blender и Maya, или импортировать в игровые движки, такие как Unreal Engine 5 или Unity. Значительно снижает нагрузку на создателей.
Stable 3D обеспечивает быструю творческую среду для независимых дизайнеров, художников и разработчиков, позволяя им создавать тысячи 3D-объектов в день за небольшую часть стоимости.
В настоящее время Stability AI открыт только для закрытого предварительного просмотра Stable 3D, запросите доступ
В дополнение к своему набегу на генерацию 3D-контента, Stability AI также запустила инструмент Sky Replacer, который предназначен для того, чтобы делать именно то, что следует из названия — заменять фон неба на 2D-изображениях.
Платформа Stable Diffusion теперь также предлагает стабильную тонкую настройку, которая призвана помочь компаниям ускорить процесс тонкой настройки изображений для конкретных сценариев использования.
Кроме того, компания интегрирует невидимый водяной знак для аутентификации контента в изображениях, сгенерированных Stability AI API. По мере того, как генеративный ИИ становится все более важной частью общих рабочих процессов, все эти новые обновления призваны помочь компаниям в творческом развитии.
Эмад Мостак, генеральный директор Stability AI, сказал в интервью: «Речь идет о том, чтобы дать творческим рассказчикам инструменты, необходимые им для дополнительного контроля над своими изображениями. "
Достижения Stability AI происходят в то время, когда рынок генерации текста в изображение становится все более конкурентным.
Adobe нацелилась на этот рынок с помощью Firefly, инструмента искусственного интеллекта, который тесно интегрирован с программным обеспечением для дизайна компании. Midjourney постоянно добавляет новые функции в свою технологию, чтобы помочь дизайнерам создавать изображения. Не следует упускать из виду, что OpenAI недавно выпустила собственную модель ChatGPT DALL-E 3, которая улучшает способность генерировать текст в изображениях.
Mostaque хорошо знает о своей конкуренции и стремится помочь Stability AI выделиться во многих отношениях. В частности, он подчеркнул, что его компания сейчас переходит от простого предложения моделей к предоставлению канала для идей. Он отмечает, что с новым Sky Replacer и возможностями тонкой настройки все это является дополнительными шагами по сравнению с базовой моделью, используемой для создания изображений.
Sky Replacer — это больше, чем просто функция, она также ориентирована на бизнес-сценарии использования.
Концепция замены фона на изображениях не нова. В приложениях негенеративного ИИ фон часто может быть заменен такими методами, как зеленый экран и хромакей.
По словам Мостака, Stability AI строит и автоматизирует рабочие процессы на основе этих классических технологий, чтобы сделать процессы быстрыми и эффективными для бизнес-пользователей. Изменение фонового цвета неба — это не просто добавление какой-то формы творческого чутья, это функция с очень конкретным и практичным вариантом использования.
«Sky Replacer, например, очень полезен для недвижимости».
Мостак отмечает, что пользователи хотят иметь возможность иметь разные фоны и разные световые эффекты. По сути, подчеркнул он, все дело в обеспечении контроля, поскольку у организаций есть свои собственные рабочие процессы для создания изображений и контента. Стабильность ИИ создает оптимизированные рабочие процессы, чтобы помочь достичь контроля, необходимого для различных сценариев использования.
«Sky Replacer является первым в серии продуктов, которые мы будем запускать, которые очень специфичны для отрасли и предприятия, основываясь на нашем опыте за последние 6-12 месяцев».
Новая модель Stable 3D расширяет модель диффузии, используемую в Stable Diffusion, за счет включения дополнительных наборов 3D-данных и векторизации.
«Я очень рад, что могу создать весь мир в 3D».
Мостак объяснил, что Stable 3D был построен на основе работы Stable Diffusion and Stability AI на Objaverse-XL, одном из крупнейших в мире открытых наборов 3D-данных. Создание и рендеринг 3D-изображений долгое время был ресурсоемким процессом, но Мостак оптимистично настроен в отношении того, что стабилизация 3D будет более эффективной, чем традиционные методы генерации 3D-изображений. Он подчеркнул, что пока еще рано говорить о стабилизации ИИ, но он оптимистично настроен в отношении того, что технология будет неуклонно развиваться и расширяться с течением времени. Стабильная версия 3D изначально доступна в закрытой предварительной версии.
«Это очень эффективно по сравнению с традиционным созданием 3D-моделей. То, что раньше занимало много времени, теперь очень быстро получает первые разрешения. "
На этой неделе администрация Байдена издала указ (EO) об искусственном интеллекте, и одним из его компонентов является интеграция водяных знаков в генерируемый контент.
Stability AI теперь интегрирует невидимые водяные знаки и учетные данные для контента в свой API. Учетные данные для содержимого — это отраслевая инициатива от нескольких поставщиков, которую Adobe и другие компании используют для предоставления авторам информации о контенте. Мостак говорит, что добавление невидимых водяных знаков и учетных данных для контента — это ответственный поступок. Это также часть более широких усилий Stability AI по обеспечению аутентичности контента, который он генерирует.
«Мы действительно внедряем ряд инициатив и некоторые дополнительные инициативы по этому вопросу, а также дополнительные исследования, потому что мы хотим знать, что правда, а что фальшивка», — сказал Мостаке. Это также помогает с некоторыми механизмами атрибуции и другими механизмами, которые мы создаем для будущих выпусков. "
Ресурсы: