Блог компании

30.05.2015 23:32 | Блог компании

Wolfram Alpha научился описывать содержимое любых картинок и фото

Источник: geektimes.ru
Теги: будущее, как искать информацию
Разработчики сайта Wolfram Alpha добавили в копилку уникальных возможностей системы ещё одну удивительную функцию – распознавание любых фотографий. Каждый желающий может опробовать ImageIdentifyв работе. Достаточно загрузить картинку на демонстрационный сайт и через несколько секунд вы получите ответ. Как утверждают сами разработчики – почти всегда правильный.
.
.
Стивен Вольфрам, основатель и главный идеолог компании, подробно описывает работу системы в записи в своём блоге. Стивен говорит, что 40 лет ждал момента, когда компьютеры научатся распознавать изображения, и был уверен в том, что этот момент настанет. Задача распознавания – одна из самых базовых для человека, и одна из самых сложных – для компьютерных систем и алгоритмов.
.
Стивен пишет, что хотя алгоритм и не всегда распознаёт изображения верно, даже его ошибки сильно напоминают человеческие.
.
Распознавание изображений теперь работает не только на демонстрационном сайте, но и в самом Wolfram Language. Можно задать изображение, получить его описание, а потом использовать уже само описание – получить, например, определение предмета из словарной статьи, или построить облако слов из статьи в Википедии.
.
.
.
Можно написать программу, автоматически анализирующую фотографии и составляющую статистику, делающую какие-либо другие подсчёты, связанные с содержанием картинок, или разбивающую их на категории. Также функция распознавания доступна через API.
.
Для тренировки системы разработчики использовали десятки миллионов изображений. С точки зрения Стивена это сравнимо с тем количеством информации, которое человек получает за первые пару лет жизни. Также Стивен подробно рассказывает в блоге, как разрабатывали систему машинного обучения на нейронных сетях, и какие при этом возникали проблемы. Например, когда систему ещё не научили распознавать лица, она, обработав портрет Индианы Джонса, выдала результат «Шляпа».
.
.
Для проверки системы Вольфрам пробовал скармливать ей разные противоречивые картинки и получал иногда странные, иногда – забавные или даже милые результаты
.
.
Некоторые ошибки распознавания оказались не только вполне объяснимыми, но и даже весьма «очеловеченными». Также интересным оказался опыт распознавания абстрактной живописи – эти картины работали как своеобразные «тесты Роршаха».
.
.
В данный момент ImageIdentify способна распознавать до 10000 различных объектов. Пока она плохо справляется с распознаванием конкретных людей, произведений искусства и редких объектов.
.
Довольно забавно играть с системой, подсовывая ей не самые лёгкие варианты картинок и получая довольно своеобразные ответы.
.
.
Проект Wolfram Alpha был запущен в 2009 году. Система способна отвечать на заданные ей на обычном языке вопросы, и, используя данные из открытых источников, подсчитывать ответы. Например, на вопрос, заданный со смартфона, «Какие самолёты сейчас есть у меня над головой?» система ответит, определив местоположение по GPS, и укажет список самолётов, исходя из данных по рейсам авиаперевозчиков.
.
Создание сайта SeaDesign O2