1. Тема 1
Основные понятия и методы теории
информатики и кодирования.
Сигналы, данные, информация.
Общая характеристика процессов сбора,
передачи, обработки и накопления
информации
Информатика
2. 2
1.1. Сообщения, данные, сигнал,
атрибутивные свойства информации,
показатели качества информации,
формы представления информации.
Системы передачи информации.
4. 4
ИНФОРМАЦИЯ
• абстракция, абстрактная модель
рассматриваемой системы (в математике);
• сигналы для управления, приспособления
рассматриваемой системы (в кибернетике);
• мера хаоса в рассматриваемой системе (в
термодинамике);
• вероятность выбора в рассматриваемой
системе (в теории вероятностей);
• мера разнообразия в рассматриваемой
системе (в биологии) и др.
18. 18
• Некоторая материальная субстанция, при
помощи которой передается информация,
называется носитель информации, а
сообщение в этом случае будет называться
сигналом.
21. 21
Методы получения информации
• Эмпирические методы или методы
получения эмпирических данных.
• Теоретические методы или методы
построения различных теорий.
• Эмпирико-теоретические методы
(смешанные) или методы построения теорий
на основе полученных эмпирических данных
об объекте, процессе, явлении.
27. 27
Вероятностный подход
• Количество информации – число,
адекватно характеризующее разнообразие
(структурированность, определенность,
выбор состояний и т.д.) в оцениваемой
системе.
• Мера информации – критерий оценки
количества информации.
29. 29
Бит
– (англ. binary digit – двоичное число; также
игра слов: англ. bit – кусочек, частица) –
единица измерения количества информации,
равная одному разряду в двоичной системе
счисления, или по другому – количество
информации, которое мы получаем при
выборе одного из двух возможных вариантов
(да/нет).
30. 30
Пример
• В аэропорту стоит 6 самолетов, из них один
летит в Москву. Сколько информации несет
сообщение «В Москву летит второй
самолет»?
H = log26 = 2,585 бит
31. 31
H = log2N
• Уменьшение Н говорит об уменьшении
разнообразия состояний N системы.
• Увеличение Н говорит об увеличении
разнообразия состояний N системы.
32. 32
Алфавит
• – набор знаков, используемых при
кодировании информации с помощью
некоторого языка. Количество символов в
нем – мощность алфавита.
• АБВГДЕЖЗИКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ
• 0123456789
+Пробел - 34 (H = 5,0875)
- 10 (H = 3,32)
33. 33
Задача
• Определить объем информации в
сообщении:
ПРИВЕТ ВАСЯ
• Решение:
11 символов,
мощность алфавита 34,
1 символ несет 5,0875 бит информации,
11 * 5,0875 = 56 бит.
36. 36
Задача
• Определить объем информации в сообщении,
с учетом распределения вероятности русских
букв в текстах :
ПРИВЕТ ВАСЯ
• Решение:
11 символов,
мощность алфавита 34,
1 символ несет 4,72 бит информации,
11 * 4,72 = 51,92 бит.
39. 39
Вывод
• увеличение меры Шеннона свидетельствует
об уменьшении энтропии (увеличении
порядка) системы;
• уменьшение меры Шеннона
свидетельствует об увеличении энтропии
(увеличении беспорядка) системы.
41. 41
1.3. Системы счисления
Любая система счисления – это система
кодирования числовых величин (количеств),
позволяющая выполнять операции
кодирования и декодирования, то есть по
любой количественной величине однозначно
находить его кодовое представление и по
любой кодовой записи – восстанавливать
соответствующую ей числовую величину.
43. 43
Соответствие разных систем счисления
Основание системы счисления
10
2
8
16
0
0
0
0
1
1
1
1
2
10
2
2
3
11
3
3
4
100
4
4
5
101
5
5
6
110
6
6
7
111
7
7
8
1000
10
8
9
1001
11
9
10
1010
12
A
11
1011
13
B
12
1100
14
C
13
1101
15
D
14
1110
16
E
15
1111
17
F
44. 44
1.4. Кодирование данных в ЭВМ
КОД — правило (алгоритм) сопоставления
каждому конкретному сообщению строго
определённой комбинации символов (знаков)
(или сигналов).
45. 45
Процесс передачи сообщения от
источника к приемнику
Источник
информации
кодирование
Канал связи
Помехи
декодирование
Получатель
информации
48. 48
Азбука Бодо
• Бод (англ. baud) в связи и электронике —
единица измерения символьной скорости,
количество изменений информационного
параметра несущего периодического сигнала
в секунду
50. 50
ASCII
(англ. American Standard Code for
Information Interchange)
• создана в 1963 году и изначально была
семибитной только для английского
алфавита
• позднее появились версии восмибитные
51. 51
• Для русского алфавита была разработана
кодировка КОИ-7 (неудачная), которую
потом переделали в КОИ-8.
• Также большой популярностью пользовалась
кодировка Windows-1251
53. 53
Unicode
• стандарт кодирования символов,
позволяющий представить знаки
практически всех письменных языков
• роль этой кодировки в веб-секторе постоянно
растёт, на начало 2010 доля веб-сайтов,
использующих Юникод, составила около 50
%.