Proceedings 2000

Contents

ОПЫТ СОЗДАНИЯ

ОНЛАЙНОВОГО ПЕРЕВОДЧИКА "ПРОМТ"

 

 

 

Светова С. Ю.

Компания «ПРОМТ»

svetova@promt.spb.su



 

В конце 90-х годов вопрос о необходимости развития и применения средств машинного перевода вдруг разрешился сам собой. Как выяснилось, кажущееся столь привлекательно единым пространство Интернета разделяют подчас непреодолимые и очевидные - языковые! - барьеры. Стало достаточно просто найти в мире практически любую информацию, но от этого она не становится понятнее - по причинам еще самого древнего происхождения.

Поэтому почти всех пользователей всемирной сети время от времени обуревает желание нажать какую-либо кнопку, подобную Search, с тем чтобы наконец узнать с достаточной долей вероятности, что написано там, куда они в конце концов попали.

Отдавать найденную с подозрением на необходимость информацию для обработки, скажем, в переводческое бюро, - достаточно странный путь, поскольку подозрение это может и не оправдаться, да еще и если сравнить его по затратам с потрясающей быстротой поиска.

Кроме того, приемлемая читабельность текста, которая обеспечивает понимание его основного смысла, пожалуй, и есть основное требование к столь необходимому в Интернете переводческому средству.

Именно потребность в онлайновом переводе обусловила огромный рост интереса к системам машинного перевода, который наблюдается сейчас во всем мире. В ряде случаев (при незнании, недостаточном знании всего языка или языка данной предметной области) перевод информации во всемирной сети доступен только с помощью систем машинного перевода.

И вот тут следующий шаг  - к использованию систем машинного перевода - выглядит достаточно естественным. И этот шаг, который, выражаясь высокопарно, открыл новую эпоху в развитии и функционировании автоматического перевода, был сделан, что привело к небывалому до того росту интереса пользователей ко всем так или иначе работающим системам, а также указало разработчикам МП новые пути и методы совершенствования.

Во-первых, необходимо было создавать совершенно новые программы, призванные решать задачу машинного перевода практически любого текста или текстового фрагмента в Интернете. Что подразумевало бы максимальное облегчение интерфейса, предоставление доступа к основным необходимым для перевода функциям (разумеется, собственно перевод, некоторые возможности предредактирования: выбор и подключение специализированных словарей, выделение слов или сочетаний, не требующих перевода и т.п., доступ к средствам перевода запросов на поиск). Таким образом, вызываемая как вспомогательное средство система машинного перевода должна и выглядеть, и функционировать соответствующим образом.

Активно работая в данном направлении, компания ПРОМТ разработала и выпустила первую систему машинного перевода для Интернета под названием WebTranSite, которая представляла собой небольшую плавающую панель, которая появляется на экране при работе в Интернете (или даже любом Windows-приложении). Работа с программой очень проста - достаточно выделить интересующий фрагмент текста и перетащить его на панель, после чего в небольшом окне появится перевод. Есть возможность подключения предметных словарей, что значительно упрощает исследование самой разнообразной информации, какая только может быть найдена. Крайне удобно также и средство перевода запросов на поиск - достаточно лишь напечатать некоторое ключевое слово или сочетание, и программа переведет его на указанный язык и отправит на один из выбранных поисковых серверов. В настоящее время WebTranSite позволяет переводить с английского, немецкого и французского языков на русский и обратно, то есть дает возможность не только русскоязычному пользователю чувствовать себя комфортно на иностранных страницах, но обеспечивает доступ к страницам на русском языке (например, новостным серверам) всем желающим во всем мире.

Другим специальным "легким" программным продуктом стал WebView - браузер с функциями перевода веб-страниц. Как становится понятно из этого названия, систему можно использовать вместо привычного браузера, особенно в том случае, если вы собираетесь исследовать страницы на иностранных языках, в которых не уверены. Этот переводчик для Интернета устроен также достаточно просто. Окно VewView представлено в привычном для пользователя систем МП двухоконнном виде, однако, в отличие от них, на экране одновременно отображаются не исходный текст и его перевод, а исходная и переведенная страницы. Безусловно, и остальные системы ПРОМТ умеют сохранять форматирование оригинала в переводимом тесте, но можно заметить, что "устройство" обычной веб-страницы намного сложнее любого, даже самого затейливо оформленного текста, включающего и таблицы, и рисунки, и графики и все, что душе угодно. И тем не менее, при переводе с помощью программы WebView полностью сохраняется исходное форматирование, в том числе размещение графических элементов, помимо перевода текстовой информации производится перевод гиперссылок, что позволяет использовать переведенную страницу наравне с оригинальной или вместо нее (что чаще всего и делают пользователи).

Можно с уверенностью сказать, что описанные программы стали одними из самых успешных в распространении (не говоря о том, что первыми!) и применении средств МП в Интернете.

С другой стороны, большинство пользователей рассматривает Интернет не только как почти идеальное средство поиска и доступа к разнообразнейшим сведениям (в чем как раз и помогают системы такого класса,  как как WebTranSite и WebView), но как самое подходящее место для рекламирования, пропагандирования и продвижения многочисленных идей, технологий и всего остального, рассматриваемого как полезное. В частности, что касается машинного перевода,  достаточно широкое распространение получили так называемые онлайновые переводчики, которые, с одной стороны, позволяют любому желающему совершенно бесплатно перевести некоторый фрагмент текста, и таким образом или принять решение о приобретении данной системы перевода как соответствующей его целям и представлениям, или, с другой стороны, это представление приобрести. Подобное сочетание бесплатного получения непосредственного результата и бесплатного же удовлетворения интереса обеспечило онлайновым переводчикам (а также онлайновым электронным словарям) широкую известность и популярность во всем мире.

В качестве примера подобного иностранного переводчика можно привести функционирование системы перевода SYSTRAN (Systran, USA) на сервере Altavista (www.babelfish.altavista.com).

 

Рисунок 1.

 

Что важнее пользователю при переводе информации на иностранных сайтах? Чтобы все, что нужно, вне зависимости от тематической направленности и языка текста, переводилось бы быстро, как говорится, "конфиденциально" (мало ли кто чем интересуется!), в любое время, желательно БЕСПЛАТНО, при этом, как упоминалось уже выше, безупречное качество перевода менее важно, нежели скорость получения представления о конкретном тексте. Все перечисленные условия, как по заказу, описывают обычно рекламируемые преимущества применения систем машинного перевода. А следовательно, почти одновременно сделали вывод разработчики и пользователи, в данной среде они просто незаменимы!

Не могла обойти подобное явление стороной и компания ПРОМТ. В марте 1999 года на сервере www.translate.ru был открыт сервис, позволявший всем пользователям Интернета перевести фрагмент текста с английского языка на русский и обратно. Первоначально предлагавшийся для подключения набор специализированных словарей включал словари по тематикам Коммерция, Юриспруденция и Программное обеспечение, поскольку, как представлялось разработчикам, информация именно таковой направленности чаще всего ищется и исследуется в Интернете.

 

Рис.2

 

Организован онлайновый переводчик опять же достаточно просто. Нужно всего лишь скопировать (или просто напечатать) любой фрагмент текста в верхнем окне, выбрать необходимое направление перевода и подключить один из имеющихся специализированных словарей с тем, чтобы уже через мгновение составить собственное мнение о качестве машинного перевода.

Рис. 3

 

Успех онлайнового переводчика ПРОМТ, как принято выражаться в таких случаях, превзошел все ожидания. Уже через полгода после открытия сервиса был зарегистрирован миллионный перевод, за данный период услугами переводчика воспользовались или заинтересовались около 300 тысяч. посетителей. Функционирование бесплатного сервиса перевода подтвердило готовность и желание пользователей Интернета иметь доступ к подобной услуге - сервер стал одним из наиболее посещаемых мест в российском Интернете.

Активное взаимодействие с посетителями сайта позволило разработчикам компании ПРОМТ составить достаточно четкое представление о целях и методах применения онлайнового перевода.

Итак, приблизительно 40% пользователей переводят разнообразную техническую и деловую информацию, почерпнутую из Интернета же. Как и предполагалось, наличие словаря по Информатике и программному обеспечению в комплекте предлагающихся специализированных словарей оказывается крайне актуальным, поскольку подавляющее большинство переводящих предпочитают знакомиться с разного рода описаниями компьютерной техники и программных средств.

Перевод деловой переписки осуществляют около 30% посетителей сервера. Причем переводится не только коммерческая информация, в изобилии присутствующая в Интернете, но даже и целые контракты (разумеется, по частям, в силу действующего ограничения на количество переводимых символов), бизнес-планы и резюме.

В этом секторе достаточно много иностранных посетителей, желающих ознакомиться с предложениями своих русских партнеров, а заодно и оценить преимущества применения систем МП в своей дальнейшей деятельности на российском рынке, если таковая случится. Поэтому предлагаемые для подключения словари по Коммерции оказались тоже как нельзя кстати.

Из неожиданных результатов использования сервера переводов следует упомянуть довольно большое число пользователей (около 20%), применяющих его как вспомогательное средство при личной переписке, включая разнообразные беседы и общение через чаты. Можно сказать, что это совершенно новая область для машинного перевода, о которой разработчикам, судя по всему, следует серьезно подумать.

Остальные посетители сервера используют его для перевода полученных в Интернете новостей, политических комментариев и обзоров, информации о культуре и искусстве, а также других материалов общего характера.

Кстати, именно эта группа потенциальных пользователей систем машинного перевода обратила на себя внимание контент-провайдеров различных информационных и новостных сайтов, а также разработчиков русских поисковых служб. В частности, их заинтересовала возможность предоставления иностранным посетителям доступа к актуальнейшей информации на русском языке. Безусловно, крупнейшие новостные сайты стараются переводить свои страницы хотя бы на английский язык, но процесс этот зачастую запаздывает и новости в переводе теряют свою "свежесть". С помощью же сервера переводов любой желающий узнает содержание сообщения в ту же самую минуту, как оно появится.

Поэтому контент-провайдеры, оценив качество и скорость работы сервера переводов, проявляют большой интерес к лежащему в его основе новому продукту компании под названием PROMT Internet Translation Server (PITS), который осуществляет перевод непосредственно на сервере. PITS дает контент-провайдерам уникальную возможность предоставления пользователям информацию на их родных языках, независимо от исходного языка требуемого документа.

В настоящее время подобный сервис предоставлен, например, на таких новостных сайтах, как Инфоарт (www.infoart.ru) и РосБизнеКонсалтинг (www.rbc.ru).

Подобная услуга может оказаться удобной не только при предоставлении новостной информации, но и при разного рода запросов, в том числе и к базам данных. Например, PITS функционирует в русской поисковой службе Апорт (www.aport.ru). Есть опыт использования продукта в работе сервера общеевропейского проекта SMARTS, в задачу которого входит обеспечение информацией предприятий малого и среднего бизнеса в  Европе.

В конце 1999 года онлайновый переводчик ПРОМТ был значительно обновлен, помимо перевода с английского, немецкого и французского языков на русский теперь поддерживается и расширенный вариант:  перевод с английского и немецкого языков на французский, таким образом, пользователи получили доступ к самым последним из разработанных направлений перевода. Кроме того, специально для иностранных посетителей сервер стал включать онлайновый конвертер кириллицы.

 

Рис.4.

На основании анализа запросов пользователей был значительно расширен список подключаемых специализированных словарей. В настоящий момент доступен перевод по следующим тематикам:  Коммерция, Информатика, Юриспруденция, Спорт, Путешествия, Разговорник, Автомобили.

Безусловно, разработчики компании ПРОМТ видят в онлайновом переводчике не только новую сферу применения своих систем, но и просто неоценимое средство получения обширнейших сведений о целях и методах их использования, что позволяет развивать и усовершенствовать как сам МП, так и предлагаемый сервис.