IBM предлагает систему семантического поиска в корпоративной электронной почте

21/12/2007 11:57

В четверг IBM представила опытную версию механизма семантического поиска для компаний, желающих предоставить своим сотрудникам более развитые инструменты для отыскания нужной информации в электронных сообщениях, хранящихся в архивах Microsoft Outlook или IBM Lotus Notes. Система OmniFind Personal Email Search, разаботанная в исследовательских подразделениях IBM в Калифорнии, Израиле и Индии, позволяет искать не только по ключевым словам, но и по смыслам, часто употребляемым в корпоративной электронной почте. В результате IBM смогла предложить заказчикам технологию, которая помогает извлекать полезные сведения, скрытые в базах данных e-mail. Например, чтобы найти номер телефона коллеги, достаточно набрать запрос John phone. Система достаточно «умна», чтобы понять, что нужен номер телефона Джона, а не просто любой телефонный номер из сообщений, где встречается слово John. Для этого разработчики составили индекс ключевых слов, которые обычно ищут в корпоративной e-mail, и индекс связанных с ними ассоциаций и отношений. Система сопоставляет слова из запроса с индексом ключевых слов и выдает результаты, исходя из ассоциаций. Дополнительные правила помогают определить, какие именно сведения нужны в данном случае. Для семантического поиска OmniFind Personal Email Search применяет среду open-source Unstructured Information Management Architecture. Эту технологию разработала IBM и передала Apache Software Foundation. Поверх нее работает система быстрого извлечения слов и смыслов из электронных документов, которая сравнивает их с индексами и выдает результаты в соответствии с разработанными учеными алгоритмами. IBM предлагает ПО бесплатно на своем веб-сайте AlphaWorks и надеется, что отзывы разработчиков помогут ей усовершенствовать технологию и устранить ее недостатки.
Пресс-релиз
Страница загрузки