Приложение DALL-E способно генерировать изображения, исходя из текстового описания

06.01.2021 21:10

Компания OpenAI известна своими различными наработками в области машинного обучения. В частности, она создала команду ботов, которая весьма успешно может играть в Dota 2, а также разработала инструмент, способный писать очень правдоподобные, но фальшивые новости. Очередным достижением OpenAI стала программа DALL-E (комбинация «Wall-E» и «Дали»), которая может генерировать изображения, исходя из текстового описания.

К примеру, если вы укажете «кот, сделанный из суши» или «лиса, сидящая в поле зимой», получите набор соответствующих картинок. Набор вводных слов пока ограничен, тем не менее, результаты весьма интересные. Опробовать DALL-E можно по этой ссылке.

DALL-E способен не просто создавать картинки из нескольких элементов, но и отображать их с разных ракурсов. Более того, программа может добавлять детали, которые не упоминаются в описании, но необходимы для реалистичного изображения. К примеру, в описании «лиса, сидящая в поле зимой» ИИ определил, что необходимо добавить тень.

«В отличие от механизма 3D-рендеринга, входные данные которого должны быть указаны недвусмысленно и подробно, DALL-E часто может «заполнять пробелы», когда описание подразумевает, что изображение должно содержать определенную деталь, которая явно не указана», — отмечает команда OpenAI.

Приложение DALL-E способно генерировать изображения, исходя из текстового описания

DALL-E при дальнейшем развитии имеет огромный потенциал. Он способен понимать то, как различные объекты меняются со временем, улавливать географический контекст, создавать изображения в различных стилях, дорисовывать недостающие части объектов и т.п. В будущем это может привести к различным последствиям, как хорошим, так и плохим. Например, такая технология может положить конец фотостокам. OpenAI планирует проанализировать какие этические проблемы могут возникнуть с данной технологией и какое влияние она окажет на различные сферы жизни.

Источник: Engadget

Источник