GrabDuck

LangPrism – сервис краудсорсинг-перевода веб-содержимого

:


Здравствуй, уважаемое хабрасообщество!

Хочу представить вам наш проект по народному переводу Интернета LangPrism. Краудсорсинг уже давно и уверенно входит во все сферы деятельности человека и применение краудсорсинга для такой области, как перевод, не является чем-то особенно новым, однако мы решили взглянуть на это несколько с иной стороны и хотим представить вам свою точку зрения в виде нашего проекта. Возможно, многим он уже знаком по нашим переводам здесь, на Хабре ( перевод, перевод, еще перевод), но, тем не менее, я решил опубликовать отдельный пост, чтобы рассказать о нем более подробно.

Под катом вы также узнаете о новом Хабре на японском языке, не пропустите!

Praeteritum


Около двух лет назад Microsoft проводила среди своего сообщества программу лояльности ITBonus, в рамках которой она поощряла различные активности, связанные с продуктами Microsoft. В их числе был перевод технических статей и блогов по технологиям Microsoft. Тогда я активно участвовал в этой программе и даже пару раз побывал на первом месте в рейтинге. Однако с самого начала меня очень огорчало отсутствие возможности поделиться своим переводом. Не было никакого другого способа, кроме как отправить html-файл с переводом на почту организаторам. Не говоря уже о том, что редактировать перевод также приходилось вручную, используя инструменты разработчика в Chrome.
Тогда и появилась идея, а почему бы не сделать такой сервис, который будет позволять переводчику прямо в контексте веб-страницы изменять ее содержимое, а другим пользователям просматривать это уже переведенное содержимое. Немного развив эту идею, стало ясно, что она очень схожа с концепцией Википедии.

Большая Идея


Наша большая задумка заключается в том, чтобы объединить идею Википедии и Google Translate. В буквальном смысле, вы посещаете веб-сайт на иностранном языке, используете LangPrism и, если в Википедии вы имеете возможность написать энциклопедийную статью, то LangPrism позволяет вам внести свой вклад за счет перевода веб-страницы на другой язык. При этом ваш перевод моментально становится доступен для других пользователей, что позволяет им читать зарубежные веб-издания на своем родном языке.

Работает это все за счет установленного в браузер расширения LangPrism, которое существует для всех современных браузеров: родное расширение для Chrome и расширение в виде букмарклета для остальных браузеров. При активации расширения происходит следующее:

  • Содержимое исходной страницы отправляется на сервер.
  • Сервер возвращает фрагменты этой страницы, уже переведенные пользователями.
  • Наконец вы получаете пользовательский интерфейс перевода непосредственно на исходной странице и можете переводить нажимая правой кнопкой на предложениях.

Один раз переведенное предложение на каком-то сайте остается в системе памяти переводов и может быть получено оттуда при дальнейших запросах. Таким образом, через некоторое время сама система будет выполнять роль глобальной памяти переводов, которая может быть использована не только для переводов веб-содержимого, но и в других областях, например, при переводе технических текстов, инструкций и пр.

Praesens


Сейчас расширением LangPrism для Chrome пользуются около 1400 человек, количество зарегистрированных пользователей около 420. Немалый вклад в перевод вносят также анонимные пользователи, суммарно переводя до 100.000 слов в месяц. Сайты для перевода выбирает само сообщество на основе своих предпочтений, распределение количества переведенного содержимого по доменам сейчас выглядит следующим образом:

Всего за время существования проекта было переведено более 400.000 слов, что сопоставимо по объему с двумя текстами Войны и мир или пятью солидными 300 страничными книгами. Это весьма неплохо, учитывая, что цикл написания одной книги составляет примерно 1 год. Одним из наиболее популярных сайтов, который переводит наше сообщество, является технологический блог TechCrunch.

На сегодняшний день роль модераторов в системе выполняют сами пользователи и простейший механизм борьбы со спамом. По аналогии с Википедией мы сделали постмодерируемую модель добавления перевода, так что любой ваш перевод сразу становится доступен для других пользователей. Сейчас одним из направлений нашей работы является разработка интеллектуальной технологии противодействия искажению смысла при переводе, которая позволит более точно управлять качеством процесса краудсорсинг-перевода.

Совсем недавно на сервисе появился раздел Переводы, куда попадают наиболее популярные зарубежные статьи, найденные на просторах Интернета. Он предоставляет возможность для переводчиков переводить актуальные статьи и позволить другим людям быть в курсе всего самого интересного, что появляется в сети. Сам раздел оформлен наподобие популярных сейчас сервисов агрегации интересного контента. Этакий StumbleUpon по-русски. За помощь в проработке UX спасибо, Chipsadesign.

Оборотной стороной всей видимой работы по переводу на веб-страницах является портал сообщества LangPrism. Он представляет собой некую социальную сеть для переводчиков, которая позволяет им решать вопросы взаимодействия при совместном переводе, составлять глоссарии и договариваться о стилистике перевода. Каждый переводчик имеет на портале сообщества свой профиль. Портал предоставляет живую ленту, которая показывает последние добавленные пользователями переводы, и своеобразный рейтинг пользователей сообщества собранный по количеству переведенных слов.

Гарри Поттер на русском


Сейчас одним из самых активных направлений работы переводчиков является перевод игры по мотивам книг о Гарри Поттере Pottermore. Браузерные игры оказались отличной нишей для применения LangPrism, поскольку никакого другого способа «натянуть» на них локализованный контент, если официальный перевод отсутствует, нет. В Pottermore используется flash, однако основной текст написан в html, что позволяет его легко переводить. Переводчики и раньше занимались переводом Pottermore, только выкладывали переводы на специализированных форумах, либо в группах ВКонтакте. Для его использования приходилось открывать два окна браузера и сопоставлять исходный текст с переводом, чтобы что-то понять. Теперь рады как сами переводчики, у которых появился удобный инструмент для перевода, так и простые игроки, которые случившееся называют не иначе, как магией. Пользователям LangPrism удалось за три недели полностью перевести Pottermore на русский язык, внеся вклад более чем в 80.000 переведенных слов.

Хабр на японском языке


Не так давно сервисом заинтересовались переводчики из Японии. Неожиданно они начали переводить Хабр на японский язык. Вы можете сами попробовать использовать ЯпоноХабр прямо сейчас. Если это направление продолжится, у нас есть шанс вскоре вещать для японохабраюзеров на их родном языке! Taishiro, Yukihiro thanks for contributing!

Futura


В планах на будущее – сделать LangPrism своеобразным стандартом обмена мультиязычной информацией в сети Интернет, поскольку уже сейчас на разных языках создано достаточно важной и полезной информации, которую нет смысла каждый раз генерировать заново. Достаточно просто проложить информационные, культурные мосты между различными языками и суммарная ценность, накопленная во всем мире, станет доступна каждому человеку. Как в свое время Википедия предоставила инструмент, который позволил сделать слепок всех знаний, которыми обладает человечество, так и мы хотим дать возможность донести эту и многую другую информацию для каждого пользователя в сети Интернет.

Я бы хотел пригласить всех хабраюзеров к участию в этом проекте, и, если каждый, кто читает эту статью сделает хотя бы один перевод, поделится своей идеей или другой помощью, мы еще на один шажок приблизимся к этой поистине большой цели.
Добро пожаловать на LangPrism.