Частотный словарь русского языка – словарь вероятностей (частот) появления букв в произвольном тексте – приведен ниже. Символ Частота Символ Частота Символ Частота Символ Частота о 0,090 в 0,035 я 0,018 ж 0,007 е, ё 0, 072 к 0,028 ы, з 0,016 ю, ш 0,006 а, и 0,062 м 0,026 ь, ъ, б 0,014 ц, щ, э 0,003 т, н 0,053 д 0,025 ч 0,013 ф 0,002 с 0,045 п 0,023 й 0,012 р 0,040 у 0,021 х 0,009 Определите количество информации в слове «информатика». Число округлите до целых. В ответе введите только ЧИСЛО.
Сначала найдем вероятности появления каждой буквы в слове "информатика":
и - 0.062
н - 0.053
ф - 0.002
о - 0.090
р - 0.040
м - 0,026
а - 0.062
т - 0.053
и - 0.062
к - 0.028
а - 0.062
Теперь по формуле Шеннона найдем количество информации в каждой букве:
I = -log2(p)
Где p - вероятность появления буквы.
Посчитаем количество информации для каждой буквы и сложим их:
(-log2(0.062)) + (-log2(0.053)) + (-log2(0.002)) + (-log2(0.090)) + (-log2(0.040)) + (-log2(0.026)) + (-log2(0.062)) + (-log2(0.053)) + (-log2(0.062)) + (-log2(0.028)) + (-log2(0.062)) = 3.8 + 4 + 7.5 + 3.1 + 4.4 + 4.7 + 3.8 + 4 + 3.8 + 4.8 + 3.8 ≈ 47
Ответ: 47.