Поисковик, разработанный студентами и аспирантами ВМиК МГУ, обзавелся собственным индексом

11/12/2005 12:10

В конце ноября разработчики поисковой системы Nigma.Ru объявили о начале работ над собственным индексом, который в дальнейшем позволит избежать обращений к другим поисковым системам. Предполагается, что до конца 2005 года закончится альфа-тестирование алгоритма поиска и будет заказано оборудование необходимое для индексации всего российского интернета. В данный момент около 25 тысяч наиболее популярных сайтов проиндексировано «в глубину» (по несколько тысяч страниц с каждого сайта) и еще 200 тысяч – для полноты поиска, сообщает Вебпланета. Для того, чтобы протестировать «собственный» поиск необходимо, снять «галочки» других поисковых машин в форме поиска, оставив отмеченным только «Nigma». Поиск осуществляется с учетом близости слов, а также с использованием двухстадийного алгоритма морфологического поиска (на первой стадии ведется поиск точно тех словоформ, которые задал пользователь, а вторая стадия запускается только если на первой стадии найдено слишком мало документов). В ближайшее время планируется расширение синтаксиса запросов для поиска фраз. Поисковая система Nigma.Ru была запущена в апреле этого года. Разработчиками выступили студенты и аспиранты факультетов ВМиК и психологии Московского государственного университета им. М.В. Ломоносова. Ими были разработаны оригинальные метапоисковые алгоритмы ранжирования результатов поиска, позволяющие объединять результаты выдачи популярных поисковых систем и группировать их в смысловые кластеры. В настоящий момент проектом занимаются студенты и аспиранты ВМиК, но им периодически помогают и другие факультеты. Размер и состав команды постоянно меняется, но ядро команды – 4 человека, сообщил в интервью MsuNews руководитель проекта Виктор Лавренко. Научные руководители – член-корр. РАН Королев Лев Николаевич (зав.каф.) и доцент Попова Нина Николаевна, кафедра АСВК факультета Вычислительной математики и кибернетики МГУ.
Подробности