В алфавите племени МУМУ всего 4 буквы (А, У, М, К), один знак препинания (точка) и для разделения слов...

Тематика Информатика
Уровень 10 - 11 классы
алфавит племени МУМУ буквы знаки препинания пробел популярный роман «Мумука» количество знаков количество букв информация в книге
0

В алфавите племени МУМУ всего 4 буквы (А, У, М, К), один знак препинания (точка) и для разделения слов используется пробел. Подсчитали, что в популярном романе «Мумука» содержится всего 10000 знаков, из них: букв А - 4000, букв У - 1000, букв М - 2000, букв К - 1500, точек -500, пробелов - 1000. Какое количество информации содержит книга?

avatar
задан 5 месяцев назад

3 Ответа

0

Для расчета количества информации в книге необходимо использовать формулу Шеннона: H = -∑(P_i * log2(P_i)), где P_i - вероятность появления i-го символа.

Подсчитаем вероятности для каждого символа: P(А) = 4000/10000 = 0.4 P(У) = 1000/10000 = 0.1 P(М) = 2000/10000 = 0.2 P(К) = 1500/10000 = 0.15 P(.) = 500/10000 = 0.05 P(пробел) = 1000/10000 = 0.1

Подставляем значения в формулу: H = -(0.4 log2(0.4) + 0.1 log2(0.1) + 0.2 log2(0.2) + 0.15 log2(0.15) + 0.05 log2(0.05) + 0.1 log2(0.1))

После вычислений получаем значение энтропии H, которое и будет количеством информации, содержащимся в книге.

avatar
ответил 5 месяцев назад
0

Для того чтобы определить количество информации, содержащейся в романе «Мумука», нам необходимо воспользоваться понятием энтропии и теорией информации. Энтропия — это мера неопределенности или количества информации, которую несет сообщение. В данном случае сообщение — это текст романа.

  1. Подсчет вероятностей появления каждого символа:

    Количество различных символов (букв, точки и пробела) в тексте:

    • А: 4000 раз
    • У: 1000 раз
    • М: 2000 раз
    • К: 1500 раз
    • . (точка): 500 раз
    • (пробел): 1000 раз

    Общее количество знаков в тексте: 10000.

    Вероятности появления каждого символа:

    • ( P(A) = \frac{4000}{10000} = 0.4 )
    • ( P(У) = \frac{1000}{10000} = 0.1 )
    • ( P(М) = \frac{2000}{10000} = 0.2 )
    • ( P(К) = \frac{1500}{10000} = 0.15 )
    • ( P(.) = \frac{500}{10000} = 0.05 )
    • ( P(\text{пробел}) = \frac{1000}{10000} = 0.1 )
  2. Вычисление энтропии:

    Энтропия (H) для дискретного источника информации с вероятностями (P) считается по формуле: [ H = - \sum_{i=1}^{n} P(i) \log_2 P(i) ]

    Где (n) - количество различных символов.

    Подставим найденные вероятности: [ H = - \left( 0.4 \log_2 0.4 + 0.1 \log_2 0.1 + 0.2 \log_2 0.2 + 0.15 \log_2 0.15 + 0.05 \log_2 0.05 + 0.1 \log_2 0.1 \right) ]

    Вычислим каждое слагаемое: [ 0.4 \log_2 0.4 \approx 0.4 \times (-1.3219) = -0.5288 ] [ 0.1 \log_2 0.1 \approx 0.1 \times (-3.3219) = -0.3322 ] [ 0.2 \log_2 0.2 \approx 0.2 \times (-2.3219) = -0.4644 ] [ 0.15 \log_2 0.15 \approx 0.15 \times (-2.7369) = -0.4105 ] [ 0.05 \log_2 0.05 \approx 0.05 \times (-4.3219) = -0.2161 ] [ 0.1 \log_2 0.1 = -0.3322 \text{ (уже вычислено выше)} ]

    Теперь сложим все значения: [ H = - ( -0.5288 - 0.3322 - 0.4644 - 0.4105 - 0.2161 - 0.3322 ) ] [ H = 0.5288 + 0.3322 + 0.4644 + 0.4105 + 0.2161 + 0.3322 = 2.2842 \text{ бит на символ} ]

  3. Вычисление общего количества информации:

    Общее количество информации (I) в тексте романа в битах можно найти, умножив энтропию на общее количество символов: [ I = H \times N ] Где (N = 10000) — общее количество символов в тексте.

    [ I = 2.2842 \times 10000 = 22842 \text{ бита} ]

Таким образом, роман «Мумука» содержит 22842 бита информации.

avatar
ответил 5 месяцев назад
0

Для расчета количества информации, содержащейся в книге "Мумука", мы можем воспользоваться формулой Шеннона: H = -Σ(p_i * log2(p_i)), где H - количество информации в битах, p_i - вероятность появления символа i.

Посчитаем вероятности появления каждого символа в тексте: P(А) = 4000 / 10000 = 0.4, P(У) = 1000 / 10000 = 0.1, P(М) = 2000 / 10000 = 0.2, P(К) = 1500 / 10000 = 0.15, P(.) = 500 / 10000 = 0.05, P(пробел) = 1000 / 10000 = 0.1.

Теперь подставим значения вероятностей в формулу и произведем расчет: H = -(0.4 log2(0.4) + 0.1 log2(0.1) + 0.2 log2(0.2) + 0.15 log2(0.15) + 0.05 log2(0.05) + 0.1 log2(0.1)) ≈ 2.105 бит.

Таким образом, книга "Мумука" содержит примерно 2.105 бит информации.

avatar
ответил 5 месяцев назад

Ваш ответ

Вопросы по теме