Подсчитайте количество информации, приходящейся на один символ, в представленном тексте. Для решения используйте вероятностную формулу Шеннона, определив вероятность появления каждого символа в тексте: Организационно-правовые формы предприятий в своей основе определяют форму их собственности, то есть кому принадлежит предприятие, его основные фонды, оборотные средства, материальные и денежные ресурсы.
Для расчета количества информации на один символ в тексте необходимо определить вероятность появления каждого символа в тексте, а затем применить формулу Шеннона:
Подсчитаем количество символов в тексте Всего символов: 250
Определим вероятность появления каждого символа в тексте Подсчитаем количество каждого символа в тексте "о" - 33 раз "р" - 14 ра "г" - 3 раз "а" - 20 ра "н" - 12 ра "и" - 14 ра "з" - 9 ра "ц" - 7 ра "л" - 9 ра "ь" - 8 ра "п" - 11 ра "в" - 8 ра "е" - 17 ра "д" - 10 ра "т" - 11 ра "я" - 2 раз "и" - 14 ра "х" - 2 раз "с" - 12 ра "б" - 1 ра "м" - 7 ра "щ" - 1 ра "ы" - 3 раз "е" - 17 ра "н" - 12 ра "о" - 33 раз "м" - 7 ра "с" - 12 ра "о" - 33 раз "в" - 8 раз
Посчитаем общее количество символов Всего символов: 250 шт.
Для расчета количества информации на один символ в тексте необходимо определить вероятность появления каждого символа в тексте, а затем применить формулу Шеннона:
Подсчитаем количество символов в тексте
Всего символов: 250
Определим вероятность появления каждого символа в тексте
Подсчитаем количество каждого символа в тексте
"о" - 33 раз
"р" - 14 ра
"г" - 3 раз
"а" - 20 ра
"н" - 12 ра
"и" - 14 ра
"з" - 9 ра
"ц" - 7 ра
"л" - 9 ра
"ь" - 8 ра
"п" - 11 ра
"в" - 8 ра
"е" - 17 ра
"д" - 10 ра
"т" - 11 ра
"я" - 2 раз
"и" - 14 ра
"х" - 2 раз
"с" - 12 ра
"б" - 1 ра
"м" - 7 ра
"щ" - 1 ра
"ы" - 3 раз
"е" - 17 ра
"н" - 12 ра
"о" - 33 раз
"м" - 7 ра
"с" - 12 ра
"о" - 33 раз
"в" - 8 раз
Посчитаем общее количество символов
Всего символов: 250 шт.
Найдем вероятность появления каждого символа
P('о') = 33 / 250 ≈ 0.13
P('р') = 14 / 250 ≈ 0.05
P('г') = 3 / 250 ≈ 0.01
P('а') = 20 / 250 = 0.0
P('н') = 12 / 250 = 0.04
P('и') = 14 / 250 = 0.05
P('з') = 9 / 250 = 0.03
P('ц') = 7 / 250 ≈ 0.02
P('л') = 9 / 250 = 0.03
P('ь') = 8 / 250 = 0.03
P('п') = 11 / 250 ≈ 0.04
P('в') = 8 / 250 = 0.03
P('е') = 17 / 250 = 0.06
P('д') = 10 / 250 = 0.0
P('т') = 11 / 250 ≈ 0.04
P('я') = 2 / 250 = 0.00
P('х') = 2 / 250 = 0.00
P('с') = 12 / 250 = 0.04
P('б') = 1 / 250 = 0.00
P('м') = 7 / 250 ≈ 0.02
P('щ') = 1 / 250 = 0.00
P('ы') = 3 / 250 ≈ 0.012
Рассчитаем количество информации, приходящееся на символ в битах, используя формулу Шеннона
I = -log2(P)
Для каждого символа
I('о') ≈ -log2(0.132) ≈ 2.9 би
I('р') ≈ -log2(0.056) ≈ 4.2 би
I('г') ≈ -log2(0.012) ≈ 7.1 би
I('а') = -log2(0.08) ≈ 3.6 би
I('н') = -log2(0.048) ≈ 4.4 би
I('и') = -log2(0.056) ≈ 4.2 би
I('з') = -log2(0.036) ≈ 4.8 би
I('ц') ≈ -log2(0.028) ≈ 5.1 би
I('л') = -log2(0.036) ≈ 4.8 би
I('ь') = -log2(0.032) ≈ 5.0 би
I('п') ≈ -log2(0.044) ≈ 4.1 би
I('в') = -log2(0.032) ≈ 5.0 би
I('е') = -log2(0.068) ≈ 3.7 би
I('д') = -log2(0.04) ≈ 4.3 би
I('т') ≈ -log2(0.044) ≈ 4.1 би
I('я') = -log2(0.008) ≈ 6.9 би
I('х') = -log2(0.008) ≈ 6.9 би
I('с') = -log2(0.048) ≈ 4.4 би
I('б') = -log2(0.004) ≈ 8.9 би
I('м') ≈ -log2(0.028) ≈ 5.1 би
I('щ') = -log2(0.004) ≈ 8.9 би
I('ы') ≈ -log2(0.012) ≈ 7.1 бит
Рассчитаем среднее количество информации на символ
H = Σ P * I ≈ 0.046 + 0.235 + 0.085 + 0.36 + 0.2112 + 0.2352 + 0.2016 + 0.357 + 0.432 + 0.4512
0.4016 + 0.2512 + 0.376 + 0.1772 + 0.1104 + 0.0696 + 0.2544 + 0.0356 + 0.357 + 0.4464 ≈ 4.36 бит/символ
Таким образом, на один символ из данного текста приходится в среднем 4.36 бит информации.