IBM создала поиск в голосовом Интернете для безграмотных

18/02/2011 18:25

Ранее компания IBM разработала сеть под названием Spoken Web, состоящую из голосовых сайтов для жителей нескольких штатов Индии, а также для Тайланда и Бразилии. Сейчас сеть насчитывает около 10 тысяч пользователей, но в будущем сеть, управляемая голосом и выдающая информацию исключительно в виде звуков, может охватить пятую часть населения планеты. По подсчётам специалистов, именно столько людей в мире не умеет читать. В голосовой сети Spoken Web адресами веб-сайтов являются телефонные номера, набирая такой номер, пользователи попадают на голосовой сайт, на котором могут узнать, к примеру, последние цены на зерно или прослушать объявления о доступных вакансиях. Как правило, голосовой веб-сайт делится на несколько разделов. Голосовые веб-сайты могут создавать не только информационные агентства, но и обычные пользователи сети. Чтобы сориентироваться в них, пользователь использует голосовые команды, обрабатываемые системой. Однако, увеличение количества веб-сайтов и опубликованной на них информации ухудшило оперативность получения необходимых данных. Чтобы ускорить процесс, разработчики создали новый движок. Теперь пользователя просят отфильтровать нужное: назвать имя человека, создавшего голосовой сайт, место, где он был создан, а также уточнить рубрику, в которую был помещён сайт. Из всего нескольких результатов выбрать искомый портал гораздо проще. Сейчас новую технологию опробуют на фермерах индийского штата Гуджарат. Сотрудники IBM уже готовы предложить новый инструмент всем пользователям Spoken Web, но отмечают, что для дальнейшего развития сети необходимы новые решения. Например, ускорить процесс поиска может «умная» система, которая будет выделять в голосовом потоке ключевые слова из запроса пользователей. Сейчас пользователь использует подобную перемотку, но остановки ему приходится делать самостоятельно. Хорошо бы обучить систему самостоятельно определять, какие слова или фразы важны для слушателя. Для этого необходимо набрать статистику и проанализировать поведение пользователей, останавливающих и ускоряющих «чтение» сайтов. Сейчас Spoken Web, по сути, не имеет никакого отношения к Всемирной паутине. Кроме того, пользователи голосовой сети, как правило, интересуются местными сайтами и новостями. Но разработчики из IBM надеются, что в дальнейшем (по мере совершенствования поисковых механизмов) необходимая информация из «общей» сети начнёт появляться и в голосовой. «Мы можем перенести данные с помощью API-функций и технологий, преобразующих текст в речь, - говорит Раджпут. - Но их также нужно будет перевести на нужный язык, а с этим за пределами англоязычной части Интернета проблемы».
Источник