Онлайн-сервис Google Docs научился распознавать тексты на 29 языках

1/03/2011 20:27

Google добавил в свой «облачный» сервис Docs функцию распознавания текстов на 29 языках. Строго говоря, «онлайн-распознавалка» Google была впервые анонсирована и интегрирована в Docs еще в июне 2010 г. Тогда ее способности читать текст ограничивались поддержкой основных языков Европы и Америки: английского, испанского, итальянского, немецкого и французского. С сегодняшнего дня OCR-сервис (Optical Character Recognition, оптическое распознавание текстов) Google начал в дополнение к прежним понимать наборы символов нескольких европейских алфавитов, русского, китайского и некоторых азиатских. В числе добавленных языков есть греческий, несколько кириллических (болгарский, сербский и украинский), корйеский, индонезийский и японский. Распознавание китайских текстов ограничивается документами с упрощенным набором иероглифов, принятым сейчас в КНР. Для использования «онлайн-распознавалки» от пользователя требуется загрузить в Google Docs графическое изображение документа (или его PDF-версию), указав вручную формат документа и установив на странице загрузки опцию преобразования изображений и PDF-файлов в формат Google Docs. Функциональность доступна как в оригинальной, так и в русской локализации «Документов Google». Программист Google Джейрон Шеффер (Jaron Schaeffer) предупреждает в корпоративном блоге, что сервис «лучше всего работает с высоким разрешением изображения».
Источник