Подсчитайте количество информации, приходящейся на один символ, в представленном тексте. Для решения используйте вероятностную формулу Шеннона, определив вероятность появления каждого символа в тексте: Организационно-правовые формы предприятий в своей основе определяют форму их собственности, то есть кому принадлежит предприятие, его основные фонды, оборотные средства, материальные и денежные ресурсы.
Для расчета количества информации на один символ в тексте необходимо определить вероятность появления каждого символа в тексте, а затем применить формулу Шеннона:
Подсчитаем количество символов в тексте: Всего символов: 250
Определим вероятность появления каждого символа в тексте: Подсчитаем количество каждого символа в тексте: "о" - 33 раза "р" - 14 раз "г" - 3 раза "а" - 20 раз "н" - 12 раз "и" - 14 раз "з" - 9 раз "ц" - 7 раз "л" - 9 раз "ь" - 8 раз "п" - 11 раз "в" - 8 раз "е" - 17 раз "д" - 10 раз "т" - 11 раз "я" - 2 раза "и" - 14 раз "х" - 2 раза "с" - 12 раз "б" - 1 раз "м" - 7 раз "щ" - 1 раз "ы" - 3 раза "е" - 17 раз "н" - 12 раз "о" - 33 раза "м" - 7 раз "с" - 12 раз "о" - 33 раза "в" - 8 раз
Посчитаем общее количество символов: Всего символов: 250 шт.
Для расчета количества информации на один символ в тексте необходимо определить вероятность появления каждого символа в тексте, а затем применить формулу Шеннона:
Подсчитаем количество символов в тексте:
Всего символов: 250
Определим вероятность появления каждого символа в тексте:
Подсчитаем количество каждого символа в тексте:
"о" - 33 раза
"р" - 14 раз
"г" - 3 раза
"а" - 20 раз
"н" - 12 раз
"и" - 14 раз
"з" - 9 раз
"ц" - 7 раз
"л" - 9 раз
"ь" - 8 раз
"п" - 11 раз
"в" - 8 раз
"е" - 17 раз
"д" - 10 раз
"т" - 11 раз
"я" - 2 раза
"и" - 14 раз
"х" - 2 раза
"с" - 12 раз
"б" - 1 раз
"м" - 7 раз
"щ" - 1 раз
"ы" - 3 раза
"е" - 17 раз
"н" - 12 раз
"о" - 33 раза
"м" - 7 раз
"с" - 12 раз
"о" - 33 раза
"в" - 8 раз
Посчитаем общее количество символов:
Всего символов: 250 шт.
Найдем вероятность появления каждого символа:
P('о') = 33 / 250 ≈ 0.132
P('р') = 14 / 250 ≈ 0.056
P('г') = 3 / 250 ≈ 0.012
P('а') = 20 / 250 = 0.08
P('н') = 12 / 250 = 0.048
P('и') = 14 / 250 = 0.056
P('з') = 9 / 250 = 0.036
P('ц') = 7 / 250 ≈ 0.028
P('л') = 9 / 250 = 0.036
P('ь') = 8 / 250 = 0.032
P('п') = 11 / 250 ≈ 0.044
P('в') = 8 / 250 = 0.032
P('е') = 17 / 250 = 0.068
P('д') = 10 / 250 = 0.04
P('т') = 11 / 250 ≈ 0.044
P('я') = 2 / 250 = 0.008
P('х') = 2 / 250 = 0.008
P('с') = 12 / 250 = 0.048
P('б') = 1 / 250 = 0.004
P('м') = 7 / 250 ≈ 0.028
P('щ') = 1 / 250 = 0.004
P('ы') = 3 / 250 ≈ 0.012
Рассчитаем количество информации, приходящееся на символ в битах, используя формулу Шеннона:
I = -log2(P)
Для каждого символа:
I('о') ≈ -log2(0.132) ≈ 2.9 бит
I('р') ≈ -log2(0.056) ≈ 4.2 бит
I('г') ≈ -log2(0.012) ≈ 7.1 бит
I('а') = -log2(0.08) ≈ 3.6 бит
I('н') = -log2(0.048) ≈ 4.4 бит
I('и') = -log2(0.056) ≈ 4.2 бит
I('з') = -log2(0.036) ≈ 4.8 бит
I('ц') ≈ -log2(0.028) ≈ 5.1 бит
I('л') = -log2(0.036) ≈ 4.8 бит
I('ь') = -log2(0.032) ≈ 5.0 бит
I('п') ≈ -log2(0.044) ≈ 4.1 бит
I('в') = -log2(0.032) ≈ 5.0 бит
I('е') = -log2(0.068) ≈ 3.7 бит
I('д') = -log2(0.04) ≈ 4.3 бит
I('т') ≈ -log2(0.044) ≈ 4.1 бит
I('я') = -log2(0.008) ≈ 6.9 бит
I('х') = -log2(0.008) ≈ 6.9 бит
I('с') = -log2(0.048) ≈ 4.4 бит
I('б') = -log2(0.004) ≈ 8.9 бит
I('м') ≈ -log2(0.028) ≈ 5.1 бит
I('щ') = -log2(0.004) ≈ 8.9 бит
I('ы') ≈ -log2(0.012) ≈ 7.1 бит
Рассчитаем среднее количество информации на символ:
H = Σ P * I ≈ 0.046 + 0.235 + 0.085 + 0.36 + 0.2112 + 0.2352 + 0.2016 + 0.357 + 0.432 + 0.4512 +
0.4016 + 0.2512 + 0.376 + 0.1772 + 0.1104 + 0.0696 + 0.2544 + 0.0356 + 0.357 + 0.4464 ≈ 4.36 бит/символ
Таким образом, на один символ из данного текста приходится в среднем 4.36 бит информации.