Данные и их представления

Данные – это информация, предоставленная в формализованном виде, пригодном для автоматизированной сборки.

Пример: значения некоторые данные, надо уметь быть записано совершенно разумным способами ( на разных носителях, в разных системах счисления).

Имея некоторые данные, надо уметь правильно их интерпретировать, т. е восстановить из них ту информацию, которая была закодирована. Существуют 2 способа представлять данные аналогичным сигналом и цифровым сигналом. Более общие математические синонимы - непрерывный и декретный.

Аналоговый сигнал - непрерывно изменяющийся во времени, представший непрерывной функцией во времени.

Цифровой сигнал – рассматриваемый на множестве временных отрезков и принимающих значение из множества возможных значений.

Непрерывная функция, которая для любого x0 на некотором отрезке и (x 0 64)и для любого сколь угодно малого Е существует δ, что при *

Неформально говоря, это значит, что в любой точке где функция непрерывна, можно вписать ее в график в сколь угодно малый треугольник. (по высоте).

Дискретность явления – его представимость элементами конечного или отчетного множества.

Счетное множество - бесконечное множество, элементы которого можно пронумеровать натуральными числами.

Несчетное множество - множеств информационных чисел, действительные числа.

В математике есть раздел дискретной математике, которая изучает дискретные структуры.

В математическом понимании – дискретный не значит конечный, но в технике значит.

Мир непрерывен или дискретен?

На микроуровне имеется дискретность. Это элементарные частицы. Есть мнение, что время тоже дискретно, т. е имеется наименьший интервал (10-44 C) - он же наименьший период волн. Но с другой стороны любая элементарная частица является волной, а волна – это понятие непрерывно. На макроуровне физический мир непрерывен, но человек в своем восприятии выделяет в нем отдельные объекты, т.е можно считать, что на физическом уровне сигналь всегда непрерывен. Если он интерпретируется непрерывно, то это аналоговый сигнал, а если мы используем конечный набор уровней сигнала, то это цифровой сигнал. Например: будет передавать в эфир отметил о посещении студентом занятий с предыдущего графика, но не сможем сделать сигнал бесконечно коротким и включить и выключить его мгновенно, поэтому реально это будет выглядеть так:

Кроме того всегда есть помехи. Таким образом, для передачи цифровых данных нужно изменять параметры сигнала так, чтобы были различны отдельные значения из конечного набора (здесь, в том числе важно, чтобы помехи не превышали по своей величине различий между значениями).

Процесс изменения параметров аналогового сигнала в соответствии с цифровыми данными называют цифровой модуляцией (в аналоговой связи бывает аналоговая модуляция, когда параметры изменяются в связи с другими аналоговыми сигналами).

Обычно изменяемый параметр – амплитуда. Это называют амплитудой модуляции.

В высокочастотной радиосвязи изменяются в небольших пределах частоту несущего сигнала при постоянной амплитуде.

Основные преимущества цифрового сигнала – устойчивость к ошибкам (мелкие искажения не влияют на возможность однозначно узнавать цифровые значения, хотя крупные могут искать цифровой сигнал, однако для цифрового сигнала существует алгоритм коррекции ошибок, например, в архиваторах есть настройка «добавить данные для восстановления»). Недостаток - любой аналоговый носитель имеет меньшую информационную емкость, если он используется для передачи цифровых данных. Именно поэтому цифровое вещание только кабельное.

Чаще всего используется двоичный цифровой сигнал, иногда троичный. Например, в цифровой электронике может использоваться 3 вольта для код 1 и 0,5 в – 0.

Встречается задача, представления аналоговых данных цифровой сигнал.

Таким образом, мы вспомнили дискретизацию чисел - приближения написанных аналоговых данных в дискретной последовательности, может ее закодировать двоичной и представить на цифровом носителе.

Допустим, на кодирование дано 8 бит, 160=10100000

Параметрами, влияющими на постфакторы дискретизации является частота выбора или разрешения для пространственных данных , например изображения и глубина кодирования – сколько возможных значений выделяется под каждым измерением . Обычно выделяется целое число бит 8 бит- 256 возможных значений16 бит – 65636; 32 бит- порядка 2 млрд. Для кодирование звука применяется обычно 16 бит, иногда 8 или 20. Частота выборки должна быть как минимум в 2 раза больше максимальной записываемой частоты. Если предел отношения человека 20кГц, то частота выборки обычно берется 44 кГц.

Для кодирования 1 пикселя изображения обычно используют 24 бит.

К цифровым данным можно применять сжатие. Есть 2 вида сжатия: сжатие без потерь и сжатие с потерями. Сжатие без потерь основано на поиске повторяющихся последовательностей данных и их кодирования особым образом. Так работают архиваторы.

Формат bmp поддерживает режим RLE, при котором m рядом стоящих пикселей одинакового цвета будут записаны 1 раз с добавлением множителя n.

Современный графический формат для представления без потерь – PNG (Portable Netovork Grafic).

Однако цифровой сигнал с « живых» данных (звук, фото) полученный дискретизацией не содержит повторяющих последовательностей «как линиями из-за помех и погрешности измерений . Для таких данных может применяться сжатие с потерями. Оно учитывает особенности человеческого восприятия и удаляет ту информацию, которую человек не замечает. В изображении происходит сглаживание редких переходов (jped). Удаление малейших очертаний читает в звуке. (mp3. ogg). Алгоритм сжатия типа jpeg используют временное сжатие при котором для длинных похожих сцен записывается только начальный кадр, а затем его изменения (mpeg). Формат …. Используют только покадровое jpeg сжатия поэтому занимает много места.