Специалисты ОЦРВ РЖД помогли расшифровать рукописи Петра I

Команда Сочинского филиала Отраслевого центра разработки и внедрения информационных систем (ОЦРВ) ОАО "РЖД", которая является резидентом ИНТЦ «Сириус», одержала победу в международном онлайн-соревновании по анализу данных и искусственному интеллекту AIJ Contest. Предложенное ими решение позволило расшифровать рукописи российского императора Петра I с почти стопроцентной точностью.

В этом году AIJ Contest, которое Сбер организовал вместе с российскими и зарубежными партнерами в рамках конференции Artificial Intelligence Journey, побило все рекорды популярности, собрав около 1000 Data Science специалистов из 43 государств. Участники соревновались в трех треках – задачах с историческим уклоном, разработке алгоритма решения социальной значимой ситуации и генерировании сложных осмысленных текстов на различных языках программирования. В общей сложности участники представили более 2700 решений.

"Digital Петр" – первый трек соревнования, который проводился на базе нескольких технологий искусственного интеллекта – компьютерное зрение, обработка естественного языка и графы знаний. Участникам конкурса предлагалось побороться за приз в рамках образовательной задачи с историческим уклоном: им предстояло создать алгоритм по построчному распознаванию рукописей Петра I. Решения участников направлялись в автоматическую проверяющую систему и оценивались на скрытом наборе данных.

Первое место в этом соревновании заняли Алексей Шоненков, Илья Смолин, Денис Карачев и Максим Новопольцев из сочинского филиала ОЦРВ. Они стали обладателями приза в 1 млн рублей. Их решение позволяет расшифровать рукописную книгу объемом 700 страниц за 20 минут и распознает 97,6% символов, а человек только 40%.

Председатель правления Российского исторического общества Константин Могилевский отметил, что данный проект может стать одним из важнейших в преддверии 350-летия со дня рождения Петра I, которое будет отмечаться в 2022 году. "Петр I оставил после себя много документов. Он писал много, писал быстро, плохим почерком, с сокращениями, с использованием иностранных слов. Сейчас большая научная проблема разобрать рукописное наследие Петра. Эта работа идет не так быстро, потому что на протяжении 150 последних лет в нашей стране только несколько историков были в состоянии разобрать, что Петр написал. Так бы шло еще 150 лет, если бы не вся замечательная команда, которая предложила решение и вынесла его на хакатон", – пояснил он.

Победители соревнования "Digital Петр" работают в центре исследований и разработок на базе филиала ОЦРВ в Сочи. Им от 24 до 27 лет. Уже около двух лет они занимаются исследованиями распознавания рукописного текста и изображений, а также обработкой естественного языка. Исследования, проводимые в лаборатории, используются для решения различных задач РЖД – от интеллектуального поиска и анализа нормативной и организационно-распорядительной документации до распознавания рукописного текста для ускорения ввода данных в различные учетные системы.

Ключевым фактором своего успеха победители соревнования из ОЦРВ называют нестандартные решения и умение работать сообща. Участник команды Алексей Шоненков: "Мы разработали несколько подходов, которых не было ни у кого из участников. Например, подход с разбиением данных – использовали различные комбинации, а затем превращали их в новую уникальную рукопись, которая имитирует рукописный почерк. И еще, как пример слаженной работы в команде, нам удалось организовать работу таким образом, что даже сейчас сможем воспроизвести абсолютно любую проверенную ранее гипотезу".

Команда из ОЦРВ уже решила, как распорядится своим призом. "Планируем собрать две мощные вычислительные станции на новых видеокартах RTX, что позволит решать более сложные задачи для центра, а также поможет саморазвиваться нам и нашим коллегам", – рассказал Алексей Шоненков.

Об ОЦРВ и центре R&D в Сочи:

Отраслевой центр разработки и внедрения информационных систем (ОЦРВ) РЖД был основан 11 февраля 2000 года для централизованной автоматизации деятельности железных дорог. Основной целью центра является развитие экспертизы в области больших автоматизированных систем управления. Вот уже почти 20 лет ОЦРВ специализируется на разработке, внедрении и сопровождении практически всех корпоративных и технологических систем железнодорожной отрасли страны.

В рамках ИТ-стратегии РЖД перед ОЦРВ поставлены масштабные задачи по цифровизации железнодорожной отрасли, унификации подходов к созданию и оптимизации процессов разработки, внедрения и сопровождения информационных систем всех компаний, входящих в Холдинг.

Центр помогает РЖД в решении наиболее сложных задач цифровизации и импортозамещения по направлениям: искусственный интеллект, большие данные, блокчейн, виртуальная и дополненная реальность. Специалистами ОЦРВ реализованы масштабные проекты по управлению трудовыми и финансовыми ресурсами, имущественным комплексом и инфраструктурой, коммерческой и хозяйственной деятельностью одной из ключевых государственных корпораций и ее дочерних структур.

В мае 2018 года на Петербургском международном экономическом форуме РЖД и образовательный фонд "Талант и успех" подписали соглашение о сотрудничестве по созданию в Сочи информационно-технологического кластера Инновационного научно-технологического центра (ИНТЦ) "Сириус". Сейчас сочинский филиал ОЦРВ является одним из его резидентов вместе с Яндексом, банком Тинькофф и социальной сетью ВКконтакте.

В сочинском филиале ОЦРВ работают пять лабораторий и учебный центр, трудятся талантливые программисты, выпускники Московского государственного университета, Московского государственного технического университета имени Баумана, Санкт-Петербургского государственного университета, университета "Иннополис" и ещё нескольких десятков российских вузов. Среди проектов филиала – блокчейн-платформа РЖД, виртуальная диагностика инфраструктуры, нормирование труда сотрудников с помощью компьютерного зрения, платформа больших данных, проекты обучения работников с помощью виртуальной реальности и другие.

Также в соответствии с программой импортозамещения РЖД сотрудники центра участвуют в разработке отечественного программного обеспечения для корпоративных хранилищ больших данных. Задача филиала – разработать полноценный набор инструментов, способных полностью заменить сложное иностранное программное обеспечение.