400 лет в архивах Ватикана. Нейросети прочитали шифр Борга, веками считавшийся неприступным
NewsMakerТо, что выглядело хаотичным набором символов, внезапно обрело голос.
Зашифрованные письма и рукописи веками лежат в архивах как немые свидетели чужих тайн. В них могут скрываться любовные истории, дипломатические интриги, медицинские рецепты, страхи правителей и детали повседневной жизни, которые авторы пытались спрятать от посторонних. Теперь к такой работе подключили искусственный интеллект, и старые шифры начали сдавать позиции быстрее прежнего.
Одним из примеров стал шифр Борга, 408-страничная рукопись из архивов Ватиканской библиотеки. Документ пролежал непрочитанным более 400 лет. Текст был записан 34 необычными символами и отдельными латинскими буквами, а на первой странице была арабская запись. Ключа к шифру не существовало, часть страниц пострадала от времени, поэтому рукопись долго не удавалось прочитать.
Шифр Борга
Но с помощью машинного обучения специалисты смогли раскрыть содержание рукописи. Оказалось, внутри скрывались тысячи странных лечебных советов, включая употребление красного вина высокого качества и ферментацию мускатного ореха в тесте для борьбы с дизентерией. Профессор вычислительной лингвистики Стокгольмского университета Беата Медьеши, участвовавшая в расшифровке, описывает работу с такими документами как медленное восстановление утраченного мира по символам, повторяющимся схемам и частичным совпадениям.
По некоторым оценкам, около 1% материалов в мировых библиотеках и архивах полностью или частично зашифрованы . Среди них могут быть сведения о тайных обществах, политических заговорах, военных планах и личной переписке. Иногда такие находки меняют представления об известных исторических фигурах. Так, ранее расшифрованные письма Марии Стюарт показали её участие в попытках вернуть трон и раскрыли напряжённые отношения с сыном, будущим королём Англии Яковом I.
Главная трудность начинается ещё до взлома шифра. Рукописи нужно оцифровать, а старый почерк, выцветшие чернила и нестандартные знаки замедляют работу. Криптолог французского INRIA Сесиль Пьерро рассказала, что на расшифровку письма Карла V со 120 символами ушло около шести месяцев, а простая перепечатка двух страниц с непривычными знаками может занять целый день.
ИИ уже ускоряет первый этап. Профессор Университета Осло Мишель Вальдиспюль вместе с коллегами использовала платформу Transkribus для обработки секретного письма Зигисмунда Хойснера фон Вандерслебена к шведскому канцлеру Акселю Оксеншерне, написанного в 1637 году во время Тридцатилетней войны. Система распознала строки и символы, хотя результат всё равно потребовал ручной проверки.
Команда проекта Descrypt разрабатывает более гибкие модели для редких алфавитов, придуманных знаков, астрологических символов и необычных числовых систем. Учёные также собирают базу старых шифров, чтобы обучать ИИ на большем числе примеров. Среди найденных материалов уже есть 400 загадочных открыток конца XIX и начала XX века, часть которых оказалась любовными письмами на немецком языке.
Теперь разработчики хотят объединить распознавание рукописи и расшифровку в один процесс. Во время испытания на фрагменте шифра Борга система обработала 500 символов примерно за 29 минут, подготовила английский перевод и объяснила, почему предложенное решение выглядит правдоподобным. Такой подход может помочь не только с письмами Нового времени, но и с древними письменностями, которые до сих пор остаются неразгаданными, включая Фестский диск и линейное письмо А.
Зашифрованные письма и рукописи веками лежат в архивах как немые свидетели чужих тайн. В них могут скрываться любовные истории, дипломатические интриги, медицинские рецепты, страхи правителей и детали повседневной жизни, которые авторы пытались спрятать от посторонних. Теперь к такой работе подключили искусственный интеллект, и старые шифры начали сдавать позиции быстрее прежнего.
Одним из примеров стал шифр Борга, 408-страничная рукопись из архивов Ватиканской библиотеки. Документ пролежал непрочитанным более 400 лет. Текст был записан 34 необычными символами и отдельными латинскими буквами, а на первой странице была арабская запись. Ключа к шифру не существовало, часть страниц пострадала от времени, поэтому рукопись долго не удавалось прочитать.
Шифр Борга
Но с помощью машинного обучения специалисты смогли раскрыть содержание рукописи. Оказалось, внутри скрывались тысячи странных лечебных советов, включая употребление красного вина высокого качества и ферментацию мускатного ореха в тесте для борьбы с дизентерией. Профессор вычислительной лингвистики Стокгольмского университета Беата Медьеши, участвовавшая в расшифровке, описывает работу с такими документами как медленное восстановление утраченного мира по символам, повторяющимся схемам и частичным совпадениям.
По некоторым оценкам, около 1% материалов в мировых библиотеках и архивах полностью или частично зашифрованы . Среди них могут быть сведения о тайных обществах, политических заговорах, военных планах и личной переписке. Иногда такие находки меняют представления об известных исторических фигурах. Так, ранее расшифрованные письма Марии Стюарт показали её участие в попытках вернуть трон и раскрыли напряжённые отношения с сыном, будущим королём Англии Яковом I.
Главная трудность начинается ещё до взлома шифра. Рукописи нужно оцифровать, а старый почерк, выцветшие чернила и нестандартные знаки замедляют работу. Криптолог французского INRIA Сесиль Пьерро рассказала, что на расшифровку письма Карла V со 120 символами ушло около шести месяцев, а простая перепечатка двух страниц с непривычными знаками может занять целый день.
ИИ уже ускоряет первый этап. Профессор Университета Осло Мишель Вальдиспюль вместе с коллегами использовала платформу Transkribus для обработки секретного письма Зигисмунда Хойснера фон Вандерслебена к шведскому канцлеру Акселю Оксеншерне, написанного в 1637 году во время Тридцатилетней войны. Система распознала строки и символы, хотя результат всё равно потребовал ручной проверки.
Команда проекта Descrypt разрабатывает более гибкие модели для редких алфавитов, придуманных знаков, астрологических символов и необычных числовых систем. Учёные также собирают базу старых шифров, чтобы обучать ИИ на большем числе примеров. Среди найденных материалов уже есть 400 загадочных открыток конца XIX и начала XX века, часть которых оказалась любовными письмами на немецком языке.
Теперь разработчики хотят объединить распознавание рукописи и расшифровку в один процесс. Во время испытания на фрагменте шифра Борга система обработала 500 символов примерно за 29 минут, подготовила английский перевод и объяснила, почему предложенное решение выглядит правдоподобным. Такой подход может помочь не только с письмами Нового времени, но и с древними письменностями, которые до сих пор остаются неразгаданными, включая Фестский диск и линейное письмо А.