Компания OpenAI известна своими различными наработками в области машинного обучения. В частности, она создала команду ботов, которая весьма успешно может играть в Dota 2, а также разработала инструмент, способный писать очень правдоподобные, но фальшивые новости. Очередным достижением OpenAI стала программа DALL-E (комбинация «Wall-E» и «Дали»), которая может генерировать изображения, исходя из текстового описания.
К примеру, если вы укажете «кот, сделанный из суши» или «лиса, сидящая в поле зимой», получите набор соответствующих картинок. Набор вводных слов пока ограничен, тем не менее, результаты весьма интересные. Опробовать DALL-E можно по этой ссылке.
DALL-E способен не просто создавать картинки из нескольких элементов, но и отображать их с разных ракурсов. Более того, программа может добавлять детали, которые не упоминаются в описании, но необходимы для реалистичного изображения. К примеру, в описании «лиса, сидящая в поле зимой» ИИ определил, что необходимо добавить тень.
«В отличие от механизма 3D-рендеринга, входные данные которого должны быть указаны недвусмысленно и подробно, DALL-E часто может «заполнять пробелы», когда описание подразумевает, что изображение должно содержать определенную деталь, которая явно не указана», — отмечает команда OpenAI.
DALL-E при дальнейшем развитии имеет огромный потенциал. Он способен понимать то, как различные объекты меняются со временем, улавливать географический контекст, создавать изображения в различных стилях, дорисовывать недостающие части объектов и т.п. В будущем это может привести к различным последствиям, как хорошим, так и плохим. Например, такая технология может положить конец фотостокам. OpenAI планирует проанализировать какие этические проблемы могут возникнуть с данной технологией и какое влияние она окажет на различные сферы жизни.
Источник: Engadget