Урок: Измерение информации
Мы постоянно что-то измеряем — время, длину, скорость, массу.
Величина | Единицы измерения | Измерительный прибор |
масса | грамм, килограмм, центнер, тонна | Для измерения массы предмета используют весы |
длина | миллиметр, сантиметр, метр, километр, | Для измерения длины используют линейку |
время | секунда, минута, час, сутки, месяц, год, век | Для измерения времени используют часы |
угол | градус, радиана | Для измерения углов используют транспортир |
Представленная в цифровом виде информация тоже может быть измерена.
Например, в больнице в палате больного идет обход врачи, осмотрев пациента долго между собой разговаривают при этом они спорят и что-то доказывают друг другу.
Больной слушает и ничего не понимает только чувствует, что речь идет о его здоровье. В чем же дело врачи обсуждают дальнейшее лечение пациента на своем профессиональном языке апеллируя медицинскими терминами, смысл которых больному неведом. Да и не нужно сейчас вводить его в курс лечения пока профессионалы не определяться сами.
С точки зрения медицинской этики больного не следует расстраивать или обнадеживать заранее. Для соседа по палате обсуждаемая информация вообще не имеет никакого значения. Таким образом наблюдается различный подход к одной и той же информации с точки зрения её значимости.
При таком подходе количество информации определить однозначно трудно.
Алфавитный подход к измерению информации
Существует подход который позволяет измерить информационный объем сообщения представленного на некотором языке. Естественном или формальном не зависимо от его содержания. Такой подход называется — алфавитным.
Для количественного выражения любой величины необходима единица измерения. Так, например, существуют единицы измерения для длины, массы, времени и т. д…
Измерение осуществляется путем сопоставления измеряемой величины с единицей измерения. Сколько раз единица измерения укладывается в измеряемый величине таков и результат измерения.
В 1 ДЦ укладывается 10 СМ.
В 1 КГ укладывается 1000 Г.
При алфавитном подходе считается что каждый символ некоторого сообщения имеет определенный информационный вес, т. е. несет фиксированное количество информации. Все символы одного алфавита имеют один и тот же вес зависящий от мощности алфавита.
Мощность алфавита — это количество символов в алфавите.
Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется 1 бит.
Название единицы измерения информации bit происходит от английского словосочетания binary digit что означает двоичная цифра.
1 бит это информационный вес символа двоичного алфавита.
Алфавит любого естественного или формального языка можно заменить двоичным алфавитом при этом мощность исходного алфавита N связана с разрядностью двоичного кода i которое требуется для кодирования всех символов исходного алфавита соотношением:
Информационный вес символа выражается в битах, разрядность двоичного кода принято считать информационным весом символа.
1 байт =8 бит | |
1 Кб =1024 байта | Это килобайт (Кбайт) |
1 Мб =1024 Кб | Это мегабайт (Мбайт) |
1 Гб =1024 Мб | Это гигабайт (Гбайт) |
1 Тб=1024 Гб | Это терабайт (Тбайт) |
1 Пб =1024 Тб | Это петабайт (Пбайт) |
1 Эб =1024 Пб | Это эксабайт (Эбайт) |
1 Зб =1024 Эб | Это зеттабайт (Збайт) |
1 Йб =1024 Зб | Это йоттабайт (Йбайт) |
1 байт — символ, введённый с клавиатуры:
Задача 1. Алфавит сказочной страны содержит 16 символов. Определите информационный вес символа этого алфавита.
Решение. Сначала составим краткую запись условия задачи.
N = 16
i = ?
Нам известно соотношение связывающие величины i и N это
Учитывая исходные данные по условию задачи получаем соотношение
i = 4, так как
Ответ: информационный вес символа алфавита сказочной страны 4 бита.
Научимся определять количество информации, т.е. информационный объем сообщения, представленного символами естественного или формального языка.
Объем складывается из информационных весов составляющих его символов.
Информационный объем сообщения I равен произведению количества символов в сообщении K на информационный вес одного символа алфавита i.
Задача 2. Сообщение, записанное буквами 16-символьного алфавита, содержит 150 символов. Определите количество информации, которое несёт данное сообщение.
Решение.
N = 16 — мощность алфавита.
K = 150 — количество символов в сообщении.
I = ? — определить общее количество информации по формуле I = K * i.
i = 4, так как
Отсюда: I = 150 * 4 = 600
Ответ: количество информации 600 битов.
Задача 3. Информационное сообщение объёмом 700 битов состоит из 140 символов. Какова мощность алфавита, с помощью которого записано это сообщение?
Решение:
I = 700 — количество информации.
K = 140 — количество символов в сообщении.
N = ? — мощность алфавита.
Пользуясь известными формулами получим
i = I/K
i = 700 / 140 = 5 (бит)
Ответ мощность алфавита 32 символа.
Рассмотрим единицы измерения информации.
В современном мире текстовую информацию набирают с помощью компьютера поэтому мы будем говорить о компьютерном алфавите включающим следующие символы.
- Строчные и прописные буквы
- Буквы русского и латинского алфавитов
- Цифры
- Знаки препинания
- Знаки арифметических операций
- Скобки
Такой алфавит содержит
Поскольку 256 равно 2 в 8 степени то информационный вес каждого символа этого алфавита равен 8 битам.
Величина равная 8 битам называется байтом
1 байт это информационный вес символа алфавита мощностью 256
Бит и байт это мелкие единицы измерения на практике для измерения информационных объемов используется более крупные единицы.
Задача 4. Информационное сообщение объемом 2 Кбайта состоит из 2048 символов. Каков информационный вес символа используемого алфавита? Сколько символов содержит алфавит, с помощью которого записано это сообщение?
Решение: Информационный объем представляем в виде произведения.
I = 2 Кб = 2 * 1024 * 8 битов
Воспользуемся формулой
i = I/K = 2 * 1024 * 8 * 2048 = 8 битов
N = 256 символов.
Ответ: информационный вес символа используемого алфавита 8 битов; алфавит, с помощью которого записано это сообщение содержит 256 символов.