Для тестирования приложений для перевода текста с картинки «Лента.ру» использовала четыре изображения:
- меню на японском языке;
- рукописное письмо на английском языке;
- постер фильма на французском языке;
- инструкцию на китайском языке.
Перевод текста с изображения может понадобиться в самых разных ситуациях: например, в зарубежном ресторане нет даже англоязычного меню, или в коробку к электронному девайсу вложена инструкция только на китайском. С алфавитными языками дело обстоит проще: можно вбить нужный текст на латинице или кириллице. Но если нужно перевести иероглифы, без функции перевода изображений будет тяжело. К сожалению, она встроена не во все сервисы онлайн-перевода. Дело в том, что у таких переводчиков сразу две функции: OCR (optical character recognition, то есть оптическое распознавание символов) и собственно машинный перевод. «Лента.ру» протестировала лучшие онлайн-переводчики и делится результатами.
Этот переводчик чаще всего используется в России. Он полностью бесплатен и доступен с русского IP. С помощью «Яндекс-переводчика» можно переводить тексты с изображений и в режиме реального времени, и с фото, сохраненных в галерее.
Для тестирования приложений для перевода текста с картинки «Лента.ру» использовала четыре изображения:
Перевод меню получился на троечку: хотя смысл передать удалось, многие части текста остались на японском языке. Встроенная функция определения языка тоже сработала плохо, так что при использовании приложения придется не только выбирать язык, на который нужно сделать перевод, но и указывать язык оригинала.
Перевод рукописного текста на английском получился у «Яндекса» хуже всего: он не смог распознать курсив и перевел только несколько слов из текста.
«Яндекс-переводчику» удалось считать почти весь текст с постера (за исключением символов внизу, которые сложно разобрать и человеку) и перевести его с сохранением смысла. Но для носителя русского языка не все фразы звучат естественно.
Весь текст инструкции был распознан успешно. В целом смысл перевода передан правильно, но слишком много неоднозначных моментов, мешающих понять нюансы. Кроме того, из-за мелкого шрифта трудно разобрать слова.
Чат GPT — это нашумевшая модель генеративного (порождающего) искусственного интеллекта. Перевод текста и распознавание текста с изображения — это лишь одна из его функций. Хотя GPT ограничен в языках, у него есть однозначные преимущества: например, можно уточнить контекст перевода или попросить его объяснить непонятные конструкции. GPT нельзя использовать с российского IP.
Чат GPT распознал меню, верно его перевел и представил перевод в структурированном виде. Неудобно, что перевод не встраивается в оригинальное изображение, трудно сориентироваться.
Чат GPT не смог перевести письмо, так как функция распознавания курсива не включена.
ChatGPT довольно хорошо перевел текст с афиши, к тому же он оставил непереведенными франкоязычные названия изданий. Из-за того, что пользователь получает в ответ текст без привязки к изображению, сориентироваться может быть непросто.
У GPT хорошо получилось перевести инструкцию. Она доступна для понимания и похожа на нормальный текст на русском языке.
«Гугл-переводчик» доступен в России, а еще он поддерживает две с половиной сотни языков. Как и «Яндекс-переводчик», приложение Google может работать в режиме реального времени: для этого нужно навести камеру на текст, который вы хотите перевести.
С меню Google справился примерно на том же уровне, что и «Яндекс»: кое-где перевод хромает, при этом понятен состав каждого блюда, ясно, как оно называется. Переводчик смог распознать весь текст. Правда, текст сложно разобрать, поскольку у изображения с переводом слишком низкое разрешение.
Google полностью распознал курсив и перевел текст с сохранением смысла, но есть некоторые логические и синтаксические ошибки.
Хотя почти весь текст удалось считать, перевод отдельных фраз оставляет желать лучшего.
В целом перевод инструкции получился хорошо, но из-за дефектов распознавания изображения некоторые конструкции оказались вне контекста и были переведены неверно. И снова очень мелкий шрифт.
DeepL (от английского Deep Learning — «машинное обучение») — это популярный переводчик на базе искусственного интеллекта, отличается высоким качеством перевода разных жанров и регистров. Хотя переводчик есть в качестве веб-, десктоп- и смартфон-приложений, перевод по фото возможен только в версии для андроида и айфона. Про-версию приложения нельзя оплатить российской картой.
У DeepL получился очень плохой перевод меню. Почти все позиции были переведены неверно, и текст был распознан плохо.
DeepL сделал неудачный перевод рукописного письма: хотя смысл основного текста отдаленно похож на оригинал, границы предложений нарушены, многие слова вырваны из контекста.
То, что распозналось, переведено отлично, но опять подвел механизм распознавания.
Перевод инструкции оказался средним: в целом можно понять порядок действий, но смысл сильно искажен.
Image to Text («изображение в текст») — приложение, специализирующееся на распознавании текста с картинки. Доступно бесплатно, а продвинутая версия позволяет обрабатывать картинки большего размера. Про-версию приложения нельзя оплатить российской картой.
Сервис распознал и перевел текст на картинке средне, но, как и у Google, качество изображения сильно пострадало, и буквы сложно разобрать. Общий смысл передать удалось.
У Image to Text удалось лучше всех справиться с распознаванием рукописного текста, но в переводе есть ошибки.
Текст был переведен довольно хорошо, но распознавание сработало чуть хуже: так, фамилию главной героини сервис перевел без контекста, из-за чего она стала «жеребенком».
Текст на китайском языке был отлично распознан и переведен с сохранением смысла. Некоторые конструкции кажутся неестественными, но это не вредит пониманию. Очевидный минус — у перевода снова мелкий шрифт.