Молодогвардейцев 454015 Россия, Челябинская область, город Челябинск 89085842764
MindHalls logo

Реализация и криптоанализ шифра простой замены

Приветствую своих маленьких всех любителей криптографии. На этот раз жертвой криптоанализа станет шифр простой замены. До него взлому подверглись такие личности, как шифр Цезаря, шифр простой перестановки и шифр гаммирования. Все они были программно реализованы и успешно взломаны.

По уровню сложности криптоанализ шифра простой замены я ставлю на почетное второе место, сразу после перестановочного шифра, над которым бился не одну неделю. Реализация по-прежнему на скриптовом языке Python. Предлагаю не растягивать вступление и сразу перейти к делу.

Прежде чем продолжить чтение, обратите внимание на реализации других шифров

Шифр простой замены

Поиграю немного в википедию и вкратце обрисую суть шифрования. Каждый символ открытого текста должен быть заменен на соответствующий ему символ из специальной таблицы. Я буду рассматривать случай, когда символы алфавита заменяются на символы из этого же алфавита, но в произвольном порядке. Грубо говоря, ключом шифрования будет служить перемешанный алфавит.

Пример шифрования

Пусть ключ задан следующим образом: (b, a, c, y, v, f, g, u, i, j, k, l, w, n, o, p, q, r, s, t, h, e, m, x, d, z). Алфавит, в котором далеко не все символы стоят на своих законных местах. Дан открытый текст: «hellomynameiskirill». После применения шифра простой замены, мы получим шифротекст: «uvllowdnbwviskirill». Остатки открытого текста прослеживаются потому что мне было лень придумывать хороший ключ, но в идеале шифротекст будет совершенно неузнаваем.

Реализация шифра простой замены

Реализация шифра простой замены — это всего лишь маленькая функция, которая принимает на вход открытый текст и ключ. Оба в виде массива(list) символов. Еще у нас есть алфавит(правильный). Функция бежит по символам текста и формирует шифротекст, согласно ключу.

alphabet = ['a','b','c','d','e','f','g','h','i','j','k','l','m','n','o','p','q','r','s','t','u','v','w','x','y','z']

#Функция шифрования по ключу
#text - list символов текста
#key - list с перестановкой на алфавите
def encrypt(text, key):
    result = []
    for i in range(len(text)):
        result.append(key[alphabet.index(text[i])])

    return result

Криптоанализ шифра простой замены

Добрались до интересной части. Криптоанализ шифра можно, как обычно, разделить на две части: получение первичного ключа с помощью частотного анализа символов, и нахождение финального ключа с помощью частотного анализа биграмм. Получается, нам нужны идеальные частоты символов и биграмм английского текста. Где их добыть, решайте сами. Частоты одиночных символов я выгуглил, а частоты биграмм собрал самостоятельно по очень большому количеству литературных текстов. Так или иначе, с этими частотами криптоанализ работает.

Первый этап. Выполняем частотный анализ символов шифротекста. После этого, выстраиваем символы алфавита в порядке убывания их частот в шифротексте, это и есть первичный ключ. Теперь выполняем расшифровку этим ключом, и получаем первичный открытый текст. На этом первый этап завершен.

Второй этап. В первичном открытом тексте считаем рейтинг биграмм. Теперь нужно провернуть хитрую штуковину. А именно, поменять местами, в первичном ключе, самый частый символ со вторым по частоте. После этого, расшифровать текст новым ключом, и снова посчитать рейтинг биграмм, и, внимание, если он улучшился(т.е. стал меньше по значению, чем предыдущий, до замены), то оставить в ключе эту замену, и перейти к следующей паре. Если же рейтинг не изменился или ухудшился, отменить перестановку символов, и поменять следующую пару. Смысл сего действия в том, чтобы перебрать все возможные перестановки на ключе, которые улучшают рейтинг биграмм. Финальным ключом к шифротексту станет такой ключ, любые перестановки в котором уже никогда не улучшат рейтинг биграмм.

Замечание 1. Для того, чтобы не расшифровывать текст по новой после каждой перестановки на ключе, мы просто меняем в словаре частоты соответствующих биграмм(строки 80-88).

Замечание 2. Вы можете выбрать другой алгоритм обхода ключа для выполнения перестановок на нем, нет предела совершенству.

Реализация функции криптоанализа шифра простой замены

 

Вот такой интересный взлом получился, в этот раз очень мало кода, и много текста. Надеюсь, что хоть что нибудь из моего потока сознания получилось понятным. Я тестировал эту реализацию на разных текста и ключах, она реально работает. У меня на этом все, спасибо за внимание!