4.2. Стандарты MPEG

 

В начале 1988 г. в рамках объединенного технического комитета по информационным технологиям Международной Организации по Стандартизации ISO (International Standards Organization) и Международной Электротехнической Комиссии IEC (International Electrotechnical Commission) была образована рабочая группа экспертов по кодированию движущихся изображений, перед которой была поставлена задача разработать стандарты кодирования сигналов изображения и звукового сопровождения для устранения избыточности информации. Эта группа стала всемирно известной под названием MPEG (Moving Picture Expert Group), основной работой которой остается разработка и утверждение стандартов по компрессии (сжатию), обработке и кодовому представлению сигналов изображения, звука и их комбинаций. Основной обсуждаемый критерий — скорость передачи двоичных символов («битрейт») — зависит от уровня технологий и сферы применения данного формата.

Основные проекты стандартов группы: MPEG-1 (стандарт ISO/IEC 11172) «Кодирование изображения и звука при скоростях передачи данных до 1,5 Мбит/с»; MPEG-2 (стандарт ISO/IEC 13818) «Обобщенное кодирование изображения и звука»; MPEG-4 (стандарт ISO/IEC 14496) «Кодирование аудиовизуальных объектов»; MPEG-7 (стандарт ISO/IEC 15938) «Описание содержания объектов мультимедиа». Из этих стандартов пока не утвержден лишь MPEG-7, однако работы над всеми проектами, за исключением MPEG-1 (устарел, так как разработан с учетом возможностей двухскоростных дисководов CD-ROM и компьютеров с процессором 486), продолжается до настоящего времени.

Один из самых известных стандартов MPEG-2, разработанный этой группой, стал с 1995 г. международным. Первично MPEG- 2 разрабатывался для цифровой передачи и отображения видеосигналов вещательного телевидения, но позже в нем был предусмотрен формат ТВЧ. Стандарт MPEG-2 позволяет при сжатии цифрового видеосигнала получить неизменно высокое качество сигнала от входа до выхода системы, значительное увеличение пропускной способности канала передачи, повышение функциональных возможностей системы, а также улучшение показателей надежности аппаратуры.

Видеосигнал компрессируется в 20 — 40 раз, что позволяет передавать по существующим телевизионным каналам сигнал цифрового ТВЧ или 4 — 10 программ обычного телевидения, а также большое количество другой информации. Одновременно обеспечивается и совместимость с компьютерной техникой, так как использованы аналогичные алгоритмы.

В настоящее время в стандарт MPEG-2 входит 10 частей, oбoзначения которых различаются добавлением через дефис их номеров к номеру стандарта. Первая часть была стандартизована в 1994 г., a последняя — в 1999 г. Необходимо отметить три основных части:

- 13818-1 (Systems) — системная спецификация, которая ycтанавливает правила объединения данных сигналов видео и звука в единый поток;

- 13818-2 (Video) — регламентирует кодовое представление и процесс декодирования, обеспечивающий воспроизведение компрессированных телевизионных изображений, а также сжатие потока видеоданных путем устранения пространственной и временной избыточностей, основанных соответственно на использовании ДКП (DCT — Discrete Cosine Transform) и дифференциального кодирования с компенсацией движения;

- 13818-3 (Audio) — определяет кодовое представление сигнала звукового сопровождения.

Важнейшей особенностью стандарта MPEG-2 является представление сигналов изображения и звукового сопровождения в форме, заданной названными спецификациями, что позволяет обращаться с видео и звуковыми потоками как с потоками компьютерных данных, которые могут записываться на самые разнообразные носители информации с использованием сетей телекоммуникаций, существующих сегодня и могущих появиться в недалеком будущем.

Поток видеоданных, определяемый спецификацией 13818-2, представляет собой сложную структуру, элементы которой строятся и объединяются друг с другом по определенным правилам. В этой структуре следует различать следующие типы элементов потока: видеопоследовательность, группа изображений, изображение, срез, микроблок и блок.

Видеопоследовательность является элементом потока видеоданных и представляет собой серию последовательных кадров телевизионного изображения. Стандарт MPEG-2 допускает как построчные, так и чересстрочные разложения последовательности видеоданных. В последовательностях с построчным разложением каждое изображение представляет собой кадр, а в чересстрочной последовательности могут использоваться изображения как поля, так и кадра.

Технология MPEG использует поточное сжатие видеоданных, при этом обрабатывается не каждый кадр отдельно, а анализируется динамика изменений видеофрагментов и устраняются избыточные данные. Поскольку в большинстве фрагментов фон изображения остается достаточно стабильным, а действие происходит только на переднем плане, алгоритм MPEG начинает сжатие с создания исходного (основного) кадра. Он играет роль опорного изображения при восстановлении остальных изображений. Опорные кадры размещаются последовательно через каждые 10-15 кадров.

В соответствии с используемыми методами кодирования различают три типа изображений: I, P, В.

I (Intra-coded picture) — исходные (И) или опорные кадры кодируются с использованием только той информации, которая содержится в самом изображении. В нем устраняется только пространственная избыточность видеоданных.

P (Predictive-coded picture) — предсказанные (П) кадры, содержащие разницу между текущим изображением и предыдущим I-кадром или P-кадром и учитывающие смещения отдельных фрагментов. Кодируется разница между исходным изображением и предсказанием, полученным на основе предшествующего или последующего изображения типа I или P.

В (Bidirectionally-coded picture) — двунаправленные (Д) кадры, содержащие отсылки к предыдущим или последующим изображениям (I или P) с учетом смещений отдельных фрагментов. При кодировании используется предсказание, формируемое на основе предшествующего и последующего изображений I или P.

При кодировании P и В изображений используется межкадровое кодирование, в котором устраняется и пространственная, и временная избыточности. I-изображение имеет довольно малый коэффициент сжатия и составляет основу MPEG-файла, однако благодаря ему возможен случайный доступ к какому-либо отрывку видеоданных. P-изображение кодируется относительно предыдущих кадров (I или P) и обычно используется как сравнительный образец для дальнейшей последовательности P кадров, что позволяет достичь большого коэффициента сжатия. В-изображение обеспечивает наибольший коэффициент сжатия, но при этом для его привязки  видеопоследовательности необходимо использовать не только предыдущее, но и последующее изображения. Само В-изображение никогда не используется для сравнения. Изображения объединяются в группы GOP (Group of Picture), представляющие собой минимальный набор последовательных изображений, например, группы из 12-ти изображений — (I0, В1, В2, P3, В4, В5, Р6, В7, В8, P9, В10, В11) и (I12, B13, В14, Р15, В16, В17, Р18, В19, В20, Р21, В22, В23) и т.д.

Видеопоследовательность с различными типами изображений условно показана на рис. 4.15, где стрелками даны направления предсказания в пределах одной группы изображений.

Чем больше группа изображений, тем большая степень компрессии может быть достигнута. С информационной точили зрения каждое изображение представляет собой три прямоугольных матрицы отсчетов: яркостную Y и две матрицы цветности CR и Cв. Стандарт MPEG-2 допускает различные структуры матриц.

 

 

 

 

 

Соотношение между числом отсчетов яркости и цветности определяется форматом дискретизации. При формате 4:2:0 размеры матриц CR и СB 2 раза меньше, чем Y, в горизонтальном и вepтикальном направлениях, что условно представлено на рис. 4.16 для отсчетов яркости и цветности. Формат 4:2:2 (наиболее распространенный в цифровом вещательном телевидении) отличается тем, что все три матрицы имеют одинаковые размеры по вертикали, но по горизонтали имеют в 2 раза меньшее число элементов. В формате 4:4:4 все матрицы одинаковы. Условно структуры отсчетов яркости и цветности в этих форматах представлены на рис. 4.17. Основные параметры кодирования для цифрового интерфейса формата 4:2:2 приведены в табл. 4.2.

Каждое изображение делится на срезы (slice), которые состоят из микроблоков, являющихся структурной единицей и соответствующих участку изображения размером 16х16 пикселов. В свою очередь, каждый микроблок состоит из блоков, четыре из

 

 

которых несут информацию о яркости и образуют группу блоков с отсчетами яркости, а остальные — группу блоков с отсчетами цветности, взятых из той же области изображения, что и отсчеты блоков яркости. Число блоков с отсчетами цветности зависит от формата дискретизации: по одному блоку СR и Св в формате 4:2:0, по два — в формате 4:2:2 и по четыре — в формате 4:4:4. Условно структуры изображения со срезами и микроблоками приведены на рис. 4.18 и 4.19. В изображениях типа кадр, в которых может использоваться и кадровое, и полевое кодирование, возможны два варианта внутренней организации микроблоков. При кадровом кодировании каждый блок яркости Y образуется из чередующихся строк двух полей, а при полевом кодировании — из строк только одного из двух полей. Условно структуры микроблоков т при кадровом и полевом кодировании представлены на рис. 4.20. Блоки являются базовыми структурными единицами, над которыми осуществляются основные операции кодирования, в том числе и ДКП, — система внутрикадровой компрессии в стандарте MPEG-2. Каждый блок (8x8 пикселов) подвергается ДКП, в результате которого исходная матрица блоков преобразуется в матрицу частотных коэффициентов. Каждый коэффициент характеризует амплитуду определенной частотной составляющей кадра, причем коэффициенты в матрице располагаются по возрастанию частот по вертикали и горизонтали. Следовательно, матрица ДКП представляет собой двумерный частотный спектр сигналов блока изображения, причем основная энергия концентрируется около нулевых частот. Для значений коэффициентов, не превышающих некоторого порогового, сигналы отсутствуют, что и приводит к желаемой компрессии и почти не сказывается на качестве изображения.

 

 

Все структурные элементы потока видеоданных, полученных в результате внутрикадрового и межкадрового кодирования, кроме блоков и микроблоков, дополняются специальными стартовыми кодами. Каждый элемент содержит заголовок, за которым следуют данные элементов более низкого уровня. В заголовке видеопоследовательности, как элемента высшего уровня, приводится разнообразная дополнительная информация основных параметров телевизионного изображения: размеры и соотношение сторон изображения, частота кадров, скорость потока данных, матрица квантования, формат дискретизации цветности изображения, параметры матрицы для формирования яркостного и цветоразностных сигналов, параметры гамма коррекции и т.д.

 

Стандарт MPEG-2 определяет кодирование, охватывающее требования широкого круга сферы производства и распределения телевизионных программ. Для наиболее эффективного применения и обеспечения высокой степени эксплуатационной совместимости устройств, работающих в стандарте MPEG-2, в нем выделено несколько подмножеств, называемых профилями. В каждом профиле выделено несколько уровней, определяемых совокупностью ограничений, наложенных на параметры цифрового потока. Профиль — подмножество стандарта для специализированного применения, задающее алгоритмы и средства компрессии. Уровни внутри каждого профиля связаны главным образом с параметрами компрессируемого изображения. Стандарт MPEG-2 устанавливает четыре уровня разрешения кадра:

LL (low level) — низкий с разрешением 352x288;

ML (main level) — основной с разрешением 720х576;

HL-1440 (high level) — высокий с разрешением 1440х1152;

HL-1920 — высокий с разрешением 1920х1152,

а также пять базовых профилей кодирования сигналов яркости и цветности:

SP (simple profile) — простой;

MP (main profile) — основной;

SNR (signal to позе ratio) — масштабируемый по отношению сигнал/шум;

Spatial (spatial profile) — с масштабируемым пространственным разрешением;

HP (high profile) — высокий;

422 — студийный.

Масштабируемый профиль поддерживает все типы изображений. На базовом уровне кодера используется обычное кодирование на основе предсказания с компенсацией движения, дискретного косинусного преобразования и квантования ошибки предсказания. Выходные данные этого кодера образуют нижний слой цифрового потока данных. Ошибка квантования, обусловленная квантователем, кодируется с использованием второго квантователя и кодера с переменной длиной слова, а затем передается в качестве верхнего слоя цифрового потока. На приемной стороне производится декодирование либо одного базового слоя, что обеспечивает приемлемое качество изображения, либо обоих слоев, что позволяет уменьшить шумы квантования.

Профиль с масштабируемым пространственным разрешением используется на всех типах изображения. Цифровой поток структурирован и имеет базовый и дополнительные слои. Профиль позволяет иметь наряду с базовым пространственным разрешением и более высокие значения, если декодировать все слои цифрового потока.

Студийный профиль 422 обеспечивает полное разрешение, соответствующее рекомендациям ITU-601.

Основной профиль на основном уровне (Main Profile at Main Level) является очень важной комбинацией в силу того, что она используется в большинстве стран Европы для вещательного телевидения и обозначается как стандарт МР @ ML, в котором применяется кодирование чересстрочных изображений с разрешением 720х576, 25 кадров/с (системы PAL и SECAM) и разрешением 720х480, 30 кадров/с (система NTSC).

Наиболее важные характеристики уровней и профилей стандарта MPEG-2 приведены в табл. 4.3. Пространственная избыточность уменьшается на уровне блока. Для этого используется набор операций: ДКП; взвешенное квантование; энтропийное кодирование серии коэффициентов косинусного преобразования, полученной в результате диагонального сканирования матрицы коэффициентов. Для повышения точности предсказания и сокращения объема необходимых данных для изображения используется компенсация движения. Оценивается величина перемещения движущихся объектов от кадра к кадру и при определении предсказания корректируется положение микроблоков опорного изображения, по отношению к которому находится ошибка предсказания. Определение величины и направления смещения движущихся объектов от кадра к кадру, называемых вектором смещения (Vector Movement Code), производится на уровне микроблока.

Стандарт MPEG-2 предполагает устранение не только пространственной, но и временной избыточностей. Рассмотрим группу из 12-ти изображений со структурой I — В — В — Р — В — В — Р — В — В — Р — В — В, в которой после компрессии объем Р-изображений для типичных сюжетов вещательного телевидения составляет примерно 35% объема, а I- и В-изображений — 25%. Если бы не было сокращения временной избыточности, то объем данных был бы в 3 раза больше. Следовательно, при приблизительно такой же заметности искажений компрессии скорость потока данных уменьшается в 3 раза.

 

 Чем больше группы изображений, тем больше выигрыш, обеспечиваемый за счет устранения временной избыточности.

Рисунок 4.21 иллюстрирует процесс преобразования потока не компрессированных видеоданных по ITU-R601 в компрессированные изображения. Использование двунаправленного предсказания приводит к тому, что декодер может приступить к декодированию В-изображения только после того, когда уже получены и декодированы предшествующее и последующее опорные изображения, с помощью которых вычисляется предсказание. Чтобы не устанавливать в декодере огромные буферные массивы в потоке данных на выходе кодера, поток которого называется элементарным потоком видеоданных, кодированные изображения следуют в порядке декодирования. Таким образом, приведенный выше порядок I, В, В, Р, ... меняется на I, Р, В, В, .... Указанная операция выполняется над всей группой изображений I, Р, В, В, Р, В, В, Р, В, В, I, В, В, где второе I-изображение является первым I- изображением следующей группы. Формирование элементарного потока видеоданных условно показано на рис. 4.22.

 

Возможны два основных режима работы кодера компрессии: с постоянной скоростью потока данных и с постоянным уровнем качества декодированного изображения. Управление степенью компрессии и скоростью потока данных возможно с помощью изменения параметров матрицы квантования. Чем грубее квантование, тем больше нулевых значений в матрице коэффициентов и тем меньше объем данных, необходимых для передачи информации об изображении. Однако с увеличением степени компрессии растут и необратимые искажения изображения из-за шумов квантования. В режиме с постоянным качеством используется фиксированная матрица квантования, но скорость потока компрессированных данных переменная. Чем больше детальность изображения, чем быстрее перемещается объект в поле изображения, тем больше число ненулевых коэффициентов в матрице коэффициентов косинусного преобразования, тем больше объем данных и скорость потока. Такой режим можно использовать для записи компрессированных потоков видеоданных на дисковые накопители при отсутствии ограничений на объем записанных данных. В режиме с постоянной скоростью потока данных в кодере осуществляется непрерывное изменение коэффициентов матрицы квантования. Чем мельче детали, тем более динамично изображение. Такой режим используется в системах передачи компрессированных изображений по каналам связи с фиксированной пропускной способностью и в системах цифрового наземного кабельного и спутникового вещательного телевидения. Стандарты MPEG-2 основаны на адаптивной (согласованной с источником сигнала) обработке изображения, уменьшении временной и пространственной избыточности, особенностях человеческого зрения и повышенной эффективности кодирования. Структурная схема одного из вариантов кодера MPEG-2 приведена на рис. 4.23. Процесс адаптивной обработки видеосигнала начинается в препроцессоре. Сигналы В, G, В преобразуются в яркостной и цветоразностные сигналы, при этом появляется возможность использовать их высокую корреляцию. Далее цветоразностные сигналы проходят фильтр низких частот и прореживаются с фактором два по вертикали и горизонтали, что уменьшает поток информации в 2 раза, так как цветовое разрешение человеческого зрения существенно меньше, чем черно-белое.

 

            Временную избыточность уменьшает блок оценки движения. Сигналы нового кадра изображения, поступающие с препроцессора, сравниваются с хранимым в памяти кодера по микроблокам с размерами 16х16 пикселов. Когда определяется подходящий микроблок, вырабатывается вектор, описывающий направление и дистанцию его движения. Информация о векторах и сведения из памяти поступают в предсказатель, в котором формируется видеосигнал предсказанного изображения, и сравнивается в вычитателе с основным изображением для получения разностного.

Процесс уменьшения пространственной избыточности начинается с переноса сигнала из временной в частотную область. Для этого выполняется ДКП над блоками (8х8 пикселов) разностного изображения, в результате чего формируется частотный спектр каждого блока. В отличие от ПЦТВ он существенно неравномерен. Чем меньше мелких деталей в блоке, тем меньше уровень высокочастотных компонент. Для компрессии информации эти компоненты отбрасываются. В то же время, из-за малых размеров блока и наличия в реальных изображениях большого числа однотонных участков, часто определенное значение имеет только составляющая постоянной яркости. Известно, что при типовом изображении 95% энергии приходится на низкочастотные составляющие, которые необходимо передавать.

С выхода устройства ДКП информация поступает на квантователь, где происходят ее округление и весовая обработка в соответствии с заложенной матрицей. После такой операции частотные составляющие с малой энергией исчезают. Точность квантования можно изменять, т.е. регулировать объем передаваемой информации. После квантования сигналы проходят в кодер, который повышает эффективность передачи информации. Для этого используется несколько приемов.

Во-первых, коэффициенты устройства ДКП считываются в определенном порядке: от низких к высоким частотам, причем часто получаются длинные последовательности нулевых уровней.

Во-вторых, для сжатия применяется код переменной длины, который более эффективен при большем числе повторяющихся знаков, так как в таком коде они передаются следующим образом: сначала указывается один нужный знак, а затем число его повторов.

В-третьих, используется не избыточные коды, основанные на статистике сообщений: символы, частота появления которых выше, кодируется меньшим числом двоичных знаков.

На выходе кодера поток битов имеет непостоянную скорость. Для его согласования с емкостью канала передачи включается буфер. В зависимости от наполняемости вырабатывается сигнал управления точностью квантования и, следовательно, поддерживается постоянная скорость передачи цифрового потока.

Для формирования сигнала точного предсказанного изображения необходимо в памяти кодера иметь копию передаваемого изображения с учетом всех искажений, возникающих при кодировании. Для этого в кодер введена петля компенсации движения, в состав которой входят деквантователь, устройство обратного ДКП (ОДКП) и сумматор. Фактически этот узел представляет собой декодер.

В описанном алгоритме для предсказания сигнала текущего (настоящего) изображения применены сигналы предыдущего (прошлого) изображения, поступающие с видеоисточника. В некоторых случаях лучше использовать сигналы изображения, следующего за предсказуемым (будущего) или обоих (прошлого и будущего). Примером может служить ситуация мгновенного изменения изображения, например, при переключении на другую камеру. При этом настоящее изображение будет лучше коррелированно с будущим, чем с прошлым изображением.

Рассмотренная система предсказания, применяемая для прогрессивной развертки, изменяется при переходе на чересстрочную. Два передаваемых одно за другим поля соответствуют разным моментам. При быстрой смене изображения они могут сильно отличаться, потому предусмотрен режим компенсации движения по полям. Кроме того, имеется основной дуальный режим только для видеосигналов с чересстрочной разверткой, когда В-изображение не используется. В этом ритме векторы смещения, определенные в одном поле, работают и во втором.

Система компенсации движения требует обновления изображения, так  при первом включении телевизора, переключении на другой канал и потере сигнала изображения, хранимого в памяти декодера, оно отличается от передаваемого. В связи с этим, необходимо периодически передавать не разностное, а новое изображение.

Спецификация ISO/IEC 13818-1 стандарта MPEG-2 описывает объединение элементарных потоков одной или нескольких телевизионных программ в единый поток данных, удобных для записи или передачи по каналам цифровой связи. MPEG-2 регламентирует две формы единого потока данных — программный и транспортный потоки. Первым шагом на пути получения единого потока является формирование пакетного элементарного потока PES (Packetised Elementary Stream), представляющего собой последовательность PES-пакетов, которая условно показана на рис. 4.24. Каждый пакет состоит из заголовка и данных пользователя (полезная нагрузка), которая представляет собой фрагменты исходного элементарного потока. В связи с тем, что нет никаких требований по согласованию начала полезных данных пакета и начала блоков доступа, то начало блока доступа может быть в любой точке PES-пакета, а несколько малых блоков доступа могут попасть в один PES-пакет. PES-пакеты могут быть переменной длины. Можно установить фиксированную длину всех пакетов, а можно согласовать начало пакета с началом блока доступа.

Условно заголовок PES-пакета представлен на рис. 4.25. В начале заголовка идет 32-битный код старта, состоящий из стартового префикса (24 бита) и идентификатора потока (8 бит), который позволяет определить длину PES-пакета. Спецификация определяет разрешенные значения чисел в поле идентификатора для 32 элементарных потоков звука и 16 элементарных потоков видеоданных. Флаги 1 и 2 — биты, указывающие на наличие или отсутствие в заголовке дополнительных полей, которые определены как необязательные. Эти поля служат для переноса дополнительной информации (например, авторские права, приоритет и т.п.). Особую значимость имеют биты P и D флага 2, указывающие на наличие полей с метками времени представления PST (Presentation Time Stamps) и декодирования DTS (Decoding Time Stamps), обеспечивающие синхронизацию потоков данных в декодере.

 

Элементарный программные поток объединяет элементарные потоки, образующие телевизионную программу. Принцип формирования элементарного программного потока можно объяснить с помощью рис. 4.26. При формировании элементарного программного потока образуются блоки из PES-пакетов. Блок программного пакета содержит заголовок блока и системный заголовок (необязательный), за которым следует некоторое число PES- пакетов. Заголовок блока содержит информацию, необходимую для идентификации и определения пакета:

- стартовый код (24 бита);

окружения, не вносящего ошибки в цифровые данные, что связано с переменной длиной сравнительно больших блоков. Искажения из-за ошибок одного блока могут означать потерю, например, целого кадра телевизионного изображения. Поскольку длина блока переменная, то декодер не может предсказывать время конца одного блока и начало другого и вынужден полагаться только на информацию о длине, содержащуюся в заголовке. Если соответствующее поле заголовка окажется пораженным ошибками, то декодер выйдет из синхронизации и потеряет, по крайней мере, один блок.

Транспортный поток может объединять пакетные элементарные потоки, переносящие данные нескольких телевизионных программ с независимыми временными базами. Он состоит из последовательности коротких пакетов фиксированной длины (188 байтов). Элементарные потоки видео, звука и дополнительных данных (например, телетекст) разбиваются на фрагменты, равные по длине полезной нагрузке (видео, звуковая или служебная информация) транспортного пакета (184 байта) и мультиплексируются в единый поток, процесс формирования которого можно понять из рис. 4.27.

 

 

Этот процесс имеет ряд ограничений:

- первый байт каждого PES-пакета элементарного потока должен быть первым байтом полезной нагрузки транспортного пакета;

- каждый транспортный пакет может содержать данные лишь одного PES-пакета;

- если PES-пакет не имеет длину, кратную 184 байтам, то один из транспортных пакетов не заполняется данными PES- пакета полностью; в этом случае незаполненная часть транспортного пакета заполняется полем адаптации, длина которого равна разности между 184 байтами и остатком PES-пакета. Кроме выполнения функции заполнения, поле адаптации служит эталонам программное cuнхронизции PCR (Programme Clock Reference), который используется на приемной стороне базовых синхроимпульсов (90 кГц) и является средством для измерения временных меток программы PTS (Programme Типе Stamp).

Транспортные пакеты, переносящие разные элементарные потоки, могут появляться в произвольном порядке. Однако пакеты, принадлежащие одному элементарному потоку, должны следовать в транспортном потоке в хронологическом порядке, т.е. в порядке их формирования из PES-пакетов.

Структура транспортного потока оптимизирована для условий передачи данных в каналах связи с шумами. Это проявляется, прежде всего, в небольшой длине пакетов. Типичные примеры защиты от ошибок, данных транспортного потока зависят от стандарта цифрового вещательного телевидения:

в стандартах DVB (Digital Video Broadcasting) и ISDB (Integrated Services Digital Broadcasting) к 188 байтам каждого транспортного пакета добавляются 16 проверочных байтов кода Рида- Соломона, что позволяет исправить в каждом пакете до 8 пораженных шумом байтов;

в стандарте АТSС DTV (Advanced Television Systems Committee Digital Television) к каждому пакету добавляется 20 поверочных байтов, что позволяет исправлять до 10 байтовых ошибок в одном пакете.

Каждый транспортный пакет содержит 4-байтовый заголовок, расшифровка которого показана в структуре транспортного пакета на рис. 4.28 и табл. 4.4.

Заголовок начинается со стандартного 1-байтового слова синхронизации (двухразрядное число 47 в шестнадцатеричном коде, т.е. 4 бита 0100 — это равно 4 и 0111 равно 7), которое определяет для пакета вхождения в синхронизм. Это значение не является уникальным и может появляться в других полях транспортного пакета. Однако тот факт, что заголовки следуют с интервалом 188 байт, упрощает определение начала пакета. Заголовок представляет необходимую информацию для распаковки различных программ и воспроизведения выбранного элементарного программного потока на приемной стороне.

                                                 

 

 

 

 

 


Транспортный поток может переносить несколько телевизионных программ, состоящих из набора элементарных потоков. Для опознавания пакетов, принадлежащих одному элементарному потоку, используется 13-битный идентификатор. Из 8192 (2) возможных значений 17 зарезервировано для специальных целей, а остальные 8175 могут использоваться для присвоения в качестве номеров элементарным потокам. Следовательно, один транспортный поток может переносить до 8175 элементарных потоков.

Важным компонентом заголовка транспортного пакета является счетчик непрерывности (4 бита), который преобразуется в последовательных транспортных пакетах, принадлежащих одному и тому же элементарному потоку. Это позволяет декодеру обнаруживать потерю транспортного пакета и принимать меры к маскированию ошибок, которые могут возникнуть из-за потери информации.

Идентификатором принадлежности транспортного пакета к определенному элементарному потоку является значение идентификатора пакета PID (Packet Identificator). Для распознавания элементарных потоков и объединения их в телевизионные программы служит программная информация PSI (Program Specific Information), которая должна обязательно передаваться в транспортном потоке. В спецификации стандарта MPEG-2 определено четыре типа таблиц с программной информацией:

- таблица соединения программ PAT (Program Associatiort Table);

- таблица плана программы PMT (Program Мар Table);

- таблица сетевой информации NIT (Network Information Table);

- таблица условного доступа САТ (Conditional Access Table).

Каждая из этих таблиц передается в виде полезной нагрузки одного или нескольких транспортных пакетов. Таблица PAT сообщает список номеров всех программ, которые содержатся в транспортном потоке, и указывает идентификаторы пакетов, в которых находятся PMT-таблицы с информацией о программах и элементарных потоках, из которых они складываются. Таблица соединения программ PAT всегда переносится транспортными пакетами с PID = О. Номер программы 0 (нулевая) зарезервирован и используется для указания на PID пакета с сетевой информацией NIT о сетях передачи транспортного потока, частотах каналов, характеристиках модуляции и т.п. В таблице PMT указываются сведения о программах и тех элементарных потоках, из которых она складывается. Все вместе таблицы с программной информацией образуют иерархический индексный механизм.

Из структурной схемы цифрового канала радиовещания и звукового сопровождения телевизионных программ вещательного телевидения (рис. 4.29) видно, что аналоговый звуковой сигнал в студийном тракте преобразуется в цифровую форму с помощью АЦП А/D. При первичном кодировании используется равномерное квантование отсчетов звукового сигнала с разрешением 16...24 бит/отсчет при частотах дискретизации (выборки) 32...96 кГц. Кодирование звука заключается в расщеплении звуковой полосы обычно на 32 субполосы равной ширины. Частоты звукового сигнала, попадающие внутрь каждой субполосы, подвергаются дискретизации и преобразуются в многобитовый код. Информация о принятой частоте выборки включается в управляющую часть звукового пакета. В каналах студийного качества разрешение принимается равным.16 бит/отсчет, частота дискретизации 48 кГц и полоса частот кодируемого звукового сигнала 20...20000 Гц. При этом динамический диапазон такого цифрового канала составляет около 54 дБ. Скорость цифрового потока при передаче одного такого сигнала равна 48х16 = 768 кбит/с. Это требует суммарной пропускной способности канала связи при передаче звукового сигнала форматов 5.1 (Dolby Digital) или 3/2 (Dolby Surround, Dolby ProLogic) более 3,84 Мбит/с. В связи с тем, что человек способен сознательно обрабатывать лишь около 100 бит/с информации, необходимо признать значительную избыточность цифровых звуковых сигналов, которую надо удалять, не снижая качества сигнала звукового сопровождения телевизионных программ. Это осуществляется за счет сжатия (компрессии) звуковой информации с помощью специальных алгоритмов — маскирования (см. выше).

Компрессия цифровых аудиоданных выполняется в кодере источника. Далее сигнал по каналу связи доставляется к передатчику. На передающей стороне канала доставки используется помехоустойчивое кодирование, которое выполняется в канальном кодере. После помехоустойчивого кодирования индивидуальные цифровые потоки звуковых сигналов радиовещания и вещательного телевидения объединяются. Полученный в результате этого

 

 

суммарный цифровой сигнал также подвергается процедуре помехоустойчивого кодирования. Далее он поступает в канал связи тракта первичного распределения программ для доставки к передатчику. На приемной стороне такого канала обратные преобразования выполняются следующим образом: цифровой сигнал поступает на групповой канальный декодер, после помехоустойчивого декодирования он разделяется на цифровые потоки индивидуальных каналов, проходит канальный декодер, где вновь подвергается помехоустойчивому декодированию, и наконец, выделенный цифровой звуковой сигнал поступает на модулятор. После модуляции он усиливается на промежуточной частоте, затем преобразователем частоты переносится на несущую частоту радиоканала и после усиления излучается в эфир.

Важнейшими частями, определяющими в конечном итоге качество и эффективность системы цифрового радиовещания и вещательного телевидения, являются кодер с компрессией цифровых аудиоданных, упрощенная структурная схема которого показана на рис. 4.30, и модулятор, необходимый для передачи цифрового сигнала по радиоканалу.

При компрессии цифровых аудиоданных различают статистическую и психоакустическую избыточность первичных цифровых звуковых сигналов. Сокращение статистической избыточности базируется на свойствах звуковых сигналов, а сокращение психоакустический — на свойствах слухового аппарата человека.

 

 

После устранения статистической избыточности скорость цифрового потока при передаче высококачественных звуковых сигналов значительно превышает возможности человека по их обработке. Наиболее перспективными с этой точки зрения оказались методы, учитывающие такие свойства слуха, как маскировка, пред- и послемаскировки. Если известно, какие части звукового сигнала слух человека воспринимает, а какие нет вследствие маскировки, то можно вычленить и затем передать по каналу связи лишь те части сигнала, которые человек способен услышать и воспринять, а неслышные отбросить. Кроме того, сигналы можно квантовать с меньшим разрешением по уровням квантования так, чтобы искажения квантования, изменяясь по уровню в соответствии с уровнем самого сигнала, еще оставались бы неслышимыми, т.е. маскировались исходным сигналом. После устранения психоакустический избыточности точное восстановление формы временной функции звукового сигнала при декодировании оказывается уже невозможным. В связи с этим следует обратить внимание на две особенности:

- если компрессия цифровых аудиоданных уже использовалась ранее в канале связи при доставке программы, то ее повторное применение часто ведет к появлению существенных искажений, хотя исходный сигнал кажется на слух вполне хорошим перед повторным кодированием;

- если измерить традиционными методами параметры качества кодеков на тональных сигналах, то можно получить при разных,

 

 

 даже самых малых, скоростях цифрового потока практически идеальные значения измеряемых параметров.

Результаты тестовых прослушиваний для них, выполненные на реальных звуковых сигналах, будут принципиально отличаться. Следовательно, традиционные методы оценки качества для кодеков с компрессией цифровых аудиоданных не пригодны. Для экспертных оценок следует использовать звуковые сигналы специальных компакт-дисков MPEG EBU-SQAM Cat. # 422 204-2.

Наиболее известные алгоритмы кодирования высококачественных звуковых сигналов с компрессией цифровых аудиоданных представлены в табл. 4.5. Работы по анализу качества и эффективности алгоритмов компрессии цифровых аудиоданных с целью их последующей стандартизации начались с 1988 г., когда была образована международная экспертная группа MPEG. На рассмотрение ей было представлено 14 различных алгоритмов компрессии звука, которые прошли тестовые прослушивания. На основе анализа результатов экспертами группы MPEG было принято решение об использовании алгоритмов MUSICAM и ASPEC в качестве базовых при создании первого международного стандарта по компрессии цифрового звука.

На первом этапе итогом работы этой группы стало принятие в конце 1992 г. международного стандарта MPEG-1 ISO/IEC 11172- 3, в обозначении которого цифра 3 после дефиса относится к той части, где речь идет о кодировании звуковых сигналов. К настоящему времени действуют стандарты MPEG-2 ISO/IEC 13818-3, 13818-7 и MPEG-4 ISO/IEC 14496-3.

В отличие от этого в США был разработан стандарт Dolby АС-3 (А/52) в качестве альтернативы стандартам МРЕ6. Несколько позже четко сформировались «платформы» цифровых технологий для радиовещания и вещательного телевидения — DAB (Digital Radio Broadcasting), DRM (Digital Radio Mondiale), DVB (Digital Video Broadcasting) с разновидностями наземного DVB-Т, кабельного DVB-С и спутникового DVB-S, а также ATSC (Advanced Television Systems Committee) телевещания. В вещательном телевидении стандарт DVB все большее распространение находит в Европе, а стандарт АТSС — в США. Отличаются эти «платформы», прежде всего, выбранным алгоритмом компрессии цифровых аудиоданных, видом цифровой модуляции и процедурой помехоустойчивого кодирования звукового сигнала.

 

Компрессия MPEG Layer 1

Известная фирма PHILIPS при разработке цифровых компакт-кассет DCC (Digital Compact Cassette) предложила формат цифровой высококачественной стереофонической аудиозаписи на ленту, позволившей свести скорость потока аудиоданных до 384 Кбит/с за счет удаления 75 % первоначального объема данных. Такая технология сокращения потока данных была названа PASC (Precision Adaptive Subband Coding), т.е. прецизионное адаптивное кодирование в субдиапазонах. Система PASC была принята в качестве исходной базы аудиокомпрессии в рамках видео/ аудиокодирования MPEG Layer1 (Уровень 1). Метод аудиокодирования MPEG Layer 1 состоит в том, что сначала полоса аудио-сигнала с помощью цифровых полосовых фильтров разбивается на 32 субполосы. После разделения сигнала каждый из отсчетов представляется через мантиссу и показатель степени. Далее отсчеты группируются в блоки по 12, в каждом из которых выбирается максимальное значение сигнала. Из этих 32-х максимальных значений составляется так называемый маскирующий профиль, относящийся к данному моменту времени. На основе этого профиля определяется, с какой точностью можно представить мантиссу в каждой субполосе, чтобы шум квантования оставался неслышимым.

 

Компрессия MPEG Layer 2

Алгоритм кодирования MPEG Layer 2 (Уровень 2) наиболее предпочтителен для цифрового вещательного телевидения в Европе и включает в себя некоторые усовершенствованные методы алгоритма Уровня 1. Первоначально он был принят в качестве передающего кодирующего стандарта для европейской системы наземного радиовещания DAB, в рамках которой стал называться MUSICAM. Если говорить об уровнях звуковых стандартов MPEG, то следует отметить, что все они поддерживают кодирование цифровых потоков любой величины из возможного набора на всех трех частотах выборки — 32; 44,1; 48 кГц.

Качество кодирования по Уровню 2 повышается благодаря укрупнению группы данных. Кодер Уровня 2 формирует для каждого аудиоканала кадры размером Зх12х32 = 1152 отсчета. Если на Уровне 1 кодирование осуществляется на базе группы из 12 отсчетов в каждой субполосе, то на Уровне 2 — на базе совокупности трех групп из 12 отсчетов в субполосе. Каждая группа может иметь свою точность квантования (масштабный фактор). Но этот вариант реализуется только тогда, когда это действительно необходимо, чтобы гарантировать отсутствие слышимых искажений. Если требуемые точности оказываются близкими, то можно установить единое значение сразу для двух или трех групп. Эта же ситуация возможна, когда ожидаемые искажения будут неслышимы из-за временного маскирования шума.

В кодировании по Уровню 2 используется более эффективно код представления параметров распределения битов, значений масштабных факторов квантования и самих квантованных значений. Уровень 2 поддерживает возможность многоканальной передачи канала форматом 5.1.

В основе MPEG Уровней 1 и 2 положен ряд технических компромиссов. Один из наиболее жестких — разделение всего частотного диапазона канала звука на 32 полосы одинаковой ширины, что не соответствует характеристикам человеческого слухового аппарата. Эти полосы в диапазоне низких частот оказываются  слишком широки, из-за чего параметры квантования нельзя определить для каждой из них.

 

Компрессия MPEG Layer 3

Алгоритм кодирования MPEG Layer 3 (Уровень 3), применяющийся в Интернете, требует более утонченного подхода, где возможность сильного сжатия  аудиоданных важна с точки зрения загрузки файлов. В цифровом вещательном телевидении Уровень 3 не используется.

Несмотря на значительное разнообразие алгоритмов компрессии цифровых аудиоданных, кодер, реализующий такой алгоритм обработки сигналов, может быть представлен в виде обобщенной структурной схемы (см. рис. 4.30). В блоке временной и частотной сегментации исходный звуковой сигнал S(n) разделяется на субполосные составляющие и сегментируется по времени. Длина кодируемой выборки зависит от формы временной функции звукового сигнала. При отсутствии резких выбросов по амплитуде используется длинная выборка, обеспечивающая высокое разрешение по частоте. В случае же резких изменений амплитуды сигнала длина кодируемой выборки резко уменьшается, что дает более высокое разрешение по времени. Решение об изменении длины кодируемой выборки принимает блок психоакустического анализа, вычисляя значение психоакустический энтропии сигнала. После сегментации субполосные сигналы нормируются, квантуются и кодируются. В наиболее эффективных алгоритмах компрессии кодированию подвергаются не отсчеты выборки звукового сигнала, а соответствующие им коэффициенты (модифицированное дискретное косинусное преобразование МДКП).

Обычно при компрессии цифровых аудиоданных используется энтропийное кодирование, при котором одновременно учитываются как свойства слуха человека, так и статические характеристики звукового сигнала. Однако основную роль при этом играют процедуры устранения психоакустический избыточности. Учет за кономерностей слухового восприятия звукового сигнала выполняется в блоке психоакустического анализа. Здесь по специальной процедуре для каждого субполосного сигнала рассчитывается максимально допустимый уровень искажений (шумов) квантования, при котором они еще маскируются полезным сигналом данной субполосы.

Блок динамического распределения бит в соответствии с требованиями психоакустический модели для каждой субполосы кодирования выделяет такое минимально возможное их число, при котором уровень искажений не превышал бы порога их слышимости, рассчитанного психоакустический моделью. В современных алгоритмах компрессии используются также специальные процедуры, позволяющие управлять энергией искажений квантования в субполосах при недостаточном числе доступных для кодирования бит.

Для обеспечения правильного декодирования компрессированных сигналов, кроме основной аудиоинформации, на декодер передается также определенная дополнительная информация. После кодирования формируются цифровые потоки основной и дополнительной информации, при этом наиболее важная часть цифровых данных подвергается помехоустойчивому кодированию (CRC-код).

 

           

            4.3. Стандарт кодирования звука Dolby Digital (Dоlby AC-3)

 

Стандарт Dolby Digital (Dolby АС-3) — это алгоритм компрессионного кодирования звука, учитывающий характеристики субъективного восприятия человека. Стандарт Dolby Digital обрабатывает многофункциональный цифровой звук для эффективного хранения и передачи. Второе название стандарта Dolby АС-3 происходит от технологии, на которой базируется данный алгоритм. Звуковой сигнал стандарта Dolby Digital обеспечивает воспроизведение любого звука: от моно (1/О) до полноценного 5.1-канального Surround (объемный звуковой стереосигнал). Термин «5.1 Surround» означает, что звуковой тракт состоит из пяти отдельных каналов, полностью охватывающих частотный диапазон в части слышимого спектра от 20 Гц до 20 кГц: левый (L), центральный (С), правый (В), левый окружающий (LS), правый окружающий (RS) и плюс шестой отдельный канал звука с ограниченной (1/10) полосой пропускания, обычно называемый LFE (Low Frequency Effects — эффекты низких частот) и служащий для звукопередачи эффектов на низких частотах 20...120 Гц.

В настоящее время стандарт Dolby Digital является универсальным звуковым форматом для цифрового вещательного телевидения стандартов АТSС и DVB-Т (см. разд. 5.3).

Наиболее важные характеристики стандарта Dolby АС-3 приведены в табл. 4.6. Параметры качества сигналов звука удовлетворяют требованиям Рекомендации J.21 МЭТТ и превосходят параметры современного вещательного телевидения и стандарта S-VHS.

Подобно MPEG, стандарт Dolby АС-3 делит аудиоспектр каждого канала на узкие частотные полосы разных размеров, оптимизированные к частотной избирательности человеческого слуха. Это позволяет четко отфильтровывать шум кодирования так, что он остается только на частотах, очень близких к частотным составляющим кодируемого аудиосигнала. Понижая или полностью подавляя шум кодирования в те моменты, когда аудиосигнала, который должен его маскировать, отсутствует, можно субъективно сохранить качество звучания исходного сигнала. В этом смысле стандарт АС-3 фактически является одной из форм системы шумоподавления Dolby-А.

 

 

 

 

 

 

 

 

 

 

Аналогом стандарта Dolby Digital является Dolby Surround с его единственным ограниченным по частоте окружающим каналом, обычно воспроизводящимся через два громкоговорителя.

Dolby Surround — это процесс мультиплексирования, позволяющий представить любой звуковой стереосигнал четырьмя каналами звука. Кодированный в данном формате сигнал звука полностью совместим с моного или стереовоспроизведением. Приемная система в части звукового тракта должна быть оснащена декодерами Dolby Surround Pro Logic. Тогда слушатель получает возможность иметь четыре звуковых канала (при присоединении комплекта соответствующих колонок): левый, правый, центральный и канал «окружающего» звука, работающий в диапазоне 100...7000 Гц.

Dolby Digital предусматривает два полностью независимых канала, причем каждый из них предлагает такой же полный диапазон воспроизведения, что и три первых канала.

При работе кодера АС-3 в двухканальном стереорежиме добавляется еще один этап обработки, который улучшает взаимодействие с программами, закодированными матрицей системы Dolby Surround. На этом этапе, называемом перематрицированием, спектр сигнала разбивается на четыре частотные полосы, в пределах которой определяют мощности сигналов каналов L и В, а также их сумму и разность. Если наибольшую мощность сигнала имеет один из этих каналов, то полоса частот кодируется как обычно. Если основная мощность сигнала относится к суммирующему или разностному сигналу, тогда соответствующий сигнал кодируется вместо левого и правого. Кодирование сигналов осуществляется последовательно от одной полосе к другой, а информация подается на декодер в потоке кодированных данных.

В стандарте АС-3, как и в других, применяется сжатие динамического диапазона. Система аудиокодирования в АС-З предусматривает встроенную схему управления динамическим диапазоном, которая позволяет использовать общий поток кодированных данных для доставки программ с динамическим диапазоном, соответствующим аппаратуре каждого слушателя. Контрольные значения динамического диапазона передаются каждые 5 мс и применяются в аудиодекодере. Изменения уровня составляют 24 дБ.

 

 

Глава 5

ЦИФРОВОЕ НАЗЕМНОЕ ВЕЩАТЕЛЬНОЕ ТЕЛЕВИДЕНИЕ

5.1. Общие сведения

На сегодня наземное вещательное телевидение в большинстве стран мира является аналоговым, представляя собой весьма сложную систему передачи и приема. Частотный диапазон такого телевидения близок к насыщению, поэтому необходимость перехода к цифровой обработке телевизионных сигналов возникла давно. Однако избежать разногласий при попытках выбора единого стандарта цифровой системы вещательного телевидения пока не удается.

Мировые лидеры цифрового телевидения предлагают три стандарта цифрового наземного вещательного телевидения:

АТSС DTV (Advanced Television Systems Committee Digital Television) — США;

DVB-T (Digital Video Broadcasting Terrestrial) — страны Европы;

ISDB (Integrated Services Digital Broadcasting) — Япония. В США ведутся телевизионные передачи уже с 1998 г. Система ATSC базируется на одночастотной многоуровневой модуляции типа 8-VSB (Vestigial Side Band).

В системе DVB-Т используется многочастотное кодирование. Великобритания стала первой внедрять стандарт цифрового вещательного телевидения в конце 1998 г. Второй страной стала Швеция (весна 1999 г.). А далее — Испания (осень 1999 г.) и в 2000 г. начались опытные передачи в Германии, Нидерландах, Финляндии, Франции, Италии и Дании.

В стандарте ISDB (Япония) используются следующие алгоритмы обработки сигналов:

- сжатие информации с применением стандарта MPEG-2;

- коррекция поврежденных битов кодом Рида-Соломона;

- формирование транспортных потоков данных; использование ширины частотных каналов стандартов аналогового вещательного телевидения и т.д.

Дискуссии о преимуществах и недостатках названных систем еще продолжаются, поэтому очень многим странам предстоит сделать свой выбор.

 

5.2. Стандарт ATSC

Стандарт цифрового наземного вещательного телевидения АТSС описывает систему, спроектированную для передачи высококачественных изображения и звука, а также дополнительных данных в полосе частот с шириной 6 МГц, соответствующей ширине аналогового вещательного телевидения стандарта М системы цветного телевидения NTSC. Техническими задачами, решаемыми в процессе разработки стандарта ATSC, были минимизация объема данных, несущих информацию об изображении и звуке, и достижение предельно высокой пропускной способности канала связи при сохранении заданного качества. Хотя стандарт строго и не регламентирует формат представления передаваемого изображения, но позволяет применить ТВЧ. Система АТSС может использоваться и для передачи телевизионных программ стандартной четкости.

В концепции стандарта АТSС лежат рекомендации Исследовательской группы ITU 11/3 (рис. 5.1), согласно которым в системе цифрового наземного вещательного телевидения выделяют три основных принципа обработки сигналов — кодирование источников сигнала, формирование транспортного потока, канальное кодирование и модуляция. Целью кодирования источника является компрессия (сжатие) телевизионного изображения и звука, в которой используются правила стандарта MPEG-2 для кодирования изображения и правила стандарта компрессии Dolby АС-3 для кодирования звука. При формировании транспортного потока используются методы формирования транспортного потока MPEG-2 для пакетизации потоков видео, звука и дополнительных данных. Формируемые транспортные пакеты имеют фиксированную длину 188 байтов (первый из них является байтом синхронизации), которая считается оптимальной для условий передачи сигналов вещательного телевидения. Таким образом, в значительной части стандарт АТSС представляет собой расширенный стандарт MPEG-2. Стандарту MPEG-2 соответствуют кодирование источника и мультиплексирование транспортного потока. В стандарте АТSС используется многоуровневая амплитудная модуляция с частично подавленной боковой полосой — система VSB (Vestigial Side Band).

 

Стандарт АТSС не регламентирует форматы входных цифровых сигналов изображения, которые могут быть использованы при формировании телевизионных программ. Однако в стандарте приводятся некоторые форматы, применяемые в США в качестве входных для компрессии. Предполагается, что сигналы и других форматов еще будут использоваться. Основные параметры изображения для различных концепций стандарта АТSС и разрешенные форматы компрессии приведены в табл. 5.1 и 5.2.

 

Стандарт MPEG-2 требует, чтобы число строк было кратно 32 при чересстрочном разложении и 16 — при построчном. В концепции SMPTE 274M кодер работает с 1088 строками (32х34 = 1088), где последние 8 не несут полезной информации, хотя их и добавляют к общему потоку данных. Для формата 480 активных строк в каждой строке может быть 704 или 640 элементов, что тоже связано с особенностями кодирования MPEG-2. В концепции ITU-R BT.601-4 входной сигнал содержит 483 активных строки по

 

720 пикселов в каждой. Однако при кодировании используется только 480 строк из 483 и 704 пиксела из 720. Формат 480 строк по 640 пикселов соответствует формату VGA и используется в компьютерной технике.

Для формата 1080 строк (с общим числом строк в кадре 1125 и числом элементов в строке — 2200) используется частота дискретизации 74,25 МГц при 30 кадр/с. Такая же частота дискретизации используется для формата 720 строк (с общим числом строк в кадре 750, числом элементов в кадре 750 и числом элементов в строке 1650) при частоте кадров 60 Гц. При использовании формата 480 строк (525 полных строк в кадре, 858 элементов в полной строке) частота дискретизации равна 13,5 МГц при частоте полей 59,94 Гц.

При разработке системы кодирования и модуляции VSB были использованы все лучшие качества передачи аналогового телевизионного сигнала системы цветного телевидения NTSC, которая обладает высокой помехоустойчивостью с точки зрения надежности работы синхронизации по строкам и полям. Телевизионные приемники системы NTSC хорошо синхронизируются даже при большом уровне импульсных помех, при котором изображение сильно искажено и практически неприемлемо для просмотра зрителем. Достижения цифровой технологии позволяют улучшить качество передачи сигнала изображения при определенных уровнях помех применением кодирования, обнаруживающего и исправляющего ошибки. Но при значительном уровне помех качество изображения и звука в цифровой системе резко снижается.

В этом случае данные, потерянные из-за уменьшения уровня сигнала, могут быть восстановлены или исправлены при одном условии: синхронизация не должна быть нарушена.

Для обеспечения надежной синхронизации в стандарте АТSС используются три дополнительные сигнала:

- пилот-сигнал низкого уровня с несущей частотой, обеспечивающий надежное выделение несущего колебания на приемной стороне;

- сигнал синхронизации сегмента данных, обеспечивающий восстановление тактовой частоты и ее подстройку;

- сигнал синхронизации, служащий для правильного структурирования данных в приемнике, а также для настройки корректора сигнала в приемнике.

Структура и параметры радиосигнала системы NTSC позволяют обеспечить надежную синхронизацию благодаря увеличению мощности передатчика и снижению эффективности использования полосы частот. Спектр радиосигнала NTSC неравномерен, в нем выделяются три гармонических колебаний с частотами F (несущая сигнала яркости изображения), Рс (поднесущая сигнала цветности) и Р(несущая звукового сигнала). На передачу этих колебаний расходуется основная доля мощности, что показывает неэффективность использования мощности передатчика. В то же время средняя мощность излучаемого сигнала зависит от содержания изображения. При ширине полосы частот канала 6 МГц ширина спектра сигнала яркости составляет 4,2 МГц (полоса канала на 43% больше ширины спектра), что означает неэффективность использования полосы частот.

В системе VSB стандарта ATSC эффективность использования полосы частот канала и мощности передатчика значительно выше. Система VSB позволяет передавать поток данных, в которых символы следуют друг за другом с частотой 10,76 МГц. Пределу Найквиста соответствовала бы полоса частот канала 5,38 МГц. Полоса 6 МГц, занимаемая сигналом VSB при использовании амплитудной модуляции с частично подавленной боковой полосой, лишь на 0,62 МГц больше (11,5%), т.е. эффективность значительно выше. Основные параметры системы VSB для наземного вещательного телевидения стандарта ATSC приведены в табл. 5.3.

 

Излучаемый цифровой сигнал является шумоподобным, его спектр характеризуется высокой равномерностью. В спектре присутствует лишь один гармонический пилот-сигнал низкого уровня с частотой F (это частично подавленная несущая), что означает высокую эффективность использования мощности передатчика.

Спектры радиосигналов системы цветного телевидения NTSC и стандарта ATSC приведены на рис. 5.2 и 5.3.

Рассмотрим подробнее модуляцию в системе VSB. В ней допустимы как двухпозиционный модулирующий сигнал, так и многопозиционный. При двухпозиционной передаче, обозначаемой 2- VSB, модулирующий сигнал совпадает по форме с сигналом передаваемых данных и принимает в интервале каждого символа один из двух уровней (характеристические значения его симметричны

 

относительно нуля). Удельная скорость передачи данных равна 1,79 (бит/с) / Гц и близка к теоретическому пределу. При многопозиционной передаче характеристические значения, располагающиеся симметрично относительно нуля, выбираются так, чтобы интервалы между ними были одинаковыми. Например, при восьмипозиционной передаче в системе 8-VSB модулирующий сигнал принимает в интервале символа одно из восьми значений ( -7, -5, -3, -1, 1, 3, 5, 7). В интервале одного символа передаются три двоичных разряда потока данных. При увеличенной в 3 раза удельной скорости в полосе частот 6 МГц система 8-VSB способна передавать поток данных 32,3 Мбит/с. Представление данных при двух- и восьмипозиционной передачах приведено на рис. 5.4 и 5.5.

 

Система VSB разработана в нескольких вариантах, предусматривающих разную структуру модулирующего сигнала: 2-VSB, 4-VSB, 8-VSB, 8Т-VSB, 16-VSB. Число уровней меняется от 2 до 16, при этом соответственно меняется и скорость передачи данных, которая определяется как частота следования символов, умноженная на логарифм числа уровней. Однако, чем больше число уровней, тем меньше помехозащищенность. Исключением из этого правила является только система 8Т-VSB, в которой используется дополнительное кодирование для борьбы с помехами — так называемый решетчатый код. Скорость этого кода равна 2/3, т.е. к каждым двум передаваемым битам добавляется один проверочный. Это кодирование увеличивает помехозащищенность, но снижает скорость передачи данных при сравнении с системой 8-VSB. Общий объем передаваемых данных за единицу времени в системе 87-VSB такой же, как и в 4-VSB. Система 8Т-VSB была выбрана для цифрового наземного вещательного телевидения, которая характеризуется сравнительно высоким уровнем помех.

Данные на входе системы VSB представляют собой последовательность пакетов транспортного потока MPEG-2. В них передаются видеосигнал, сигнал звукового сопровождения и различные дополнительные данные. Поступающие данные разбиваются на сегменты, состоящие из 832 символов. Структура сегмента данных системы 8-VSB приведена на рис. 5.6. Частота следования символов F — 10,76 МГц во всех режимах работы. Длина сегмента согласуется с форматом пакета данных транспортного потока стандарта MPEG-2, каждый из которых состоит из 188 байтов. Из пакета исключается байт синхронизации, а к оставшимся 187 байтам данных добавляются 20 проверочных байтов кода Рида- Соломона. Структура образованного кодового слова (207, 187) позволяет исправлять до 10 ошибочных байтов в каждом слове. Каждые два бита из пакета длиной 207 байтов трансформируются в процессе решетчатого кодирования в 3 бита, которые и определяют, какой из восьми уровней принимает модулирующий сигнал в интервале символа.

Следовательно, один байт преобразуется в четыре символа, а 207 байтов пакета (187 + 20) — в 828 символов. Вместо байта синхронизации в сегмент включается синхросигнал сегмента длиной четыре символа. Синхросигнал сегмента представляет собой импульсы отрицательной полярности (длительность импульсов равна длительности двух символов), с использованием которых

 

может быть восстановлена частота следования символов и определены границы сегмента независимо от передаваемых данных. Введение синхросигнала не снижает эффективности передачи данных, так как он заменяет синхробайт транспортного потока стандарта MPEG-2.

Группа из 312 сегментов, дополненная синхросегментом, образует поле данных, а два поля по 313 сегментов — кадр данных. Синхросегмент поля представляет собой структуру, длина которой, как и сегмент данных, равна длительности 832 символов, и представлен на рис. 5.7. Он включает в себя синхросигнал сегмента и на большей части своей длительности принимает всего два уровня (5 и — 5). Синхросегмент позволяет осуществить кадровую синхронизацию данных при отношении сигнал/шум до 0 дБ. Он используется для определения условий приема, таких, например, как отношение сигнал/шум, а также в качестве опорного сигнала при автоматической настройке корректоров приемника.

Пакет опорного сигнала PN511, состоящий из 511 двоичных символов, используется для настройки корректоров, построенных на многоточечных трансверсальных цифровых фильтрах и компенсирующих искажения канала на больших интервалах времени. Для настройки корректоров малого времени используются три пакета опорных последовательностей PN63. Средний из них инвертируется от поля к полю для идентификации полей. Псевдослучайные последовательности пакетов PN511 и PN63 формируются с использованием регистров сдвига, охваченных цепями обратной связи и тактируемых с частотой следования символов. Формирование этих последовательностей можно понять из рис. 5.8 и 5.9. Перед началом каждого поля данных инициируется генератор последовательностей, путем загрузки в регистры заданных двоичных чисел:

100111 в регистр генератора PN63; 010000000 в регистр генератора PN511.

 

Последовательность ID представляет собой кодовое слово, указывающее на число позиций модулирующего сигнала (т.е. на режим VSB), что позволяет автоматически перестраивать приемник. Сигнал ID всегда передается в двоичной форме. В кодовое слово ID вводится избыточность для обнаружения и исправления ошибок, что обеспечивает его высокую помехозащищенность.

После 92 резервных интервалов передаются 12 символов, представляющих собой повторение 12 последних символов предшествующего сегмента. Эти повторяющиеся символы, включаемые только в системе 8Т-VSB, используются для настройки приемника.

Все варианты VSB используют идентичные синхросигналы для совместимости. Во всех системах также добавляется пилот- сигнал низкого уровня. Он формируется путем добавления постоянного смещения 1,25 единицы к сигналу данных. Поскольку все уровни символов данных приблизительно равновероятны, то сигнал данных имеет нулевую постоянную составляющую. Амплитудная модуляция таким сигналом высокочастотной несущей была бы балансной, т.е. в спектре модулированного колебания были бы только боковые полосы, а несущей не было бы. Добавление смещения означает появление в модулированном радиосигнале несущей постоянного уровня. Уровень несущей невелик и добавляет всего 0,3 дБ к общей мощности радиосигнала, но этого оказывается достаточно для восстановления несущей в приемнике в целях синхронного детектирования.

Структура сформированного   данных в системе VSB кадра данных в системе VSB, состоящего из двух полей, представлена на рис. 5.10. Длительности интервалов сегмента, поля и кадра изображения близки к длительности аналоговых сигналов и соответственно составляют: сегмента — 77,3 мкс, поля — 24,2 мс, кадра — 48,4 мс. Поле состоит из 313 сегментов, а кадр (два поля) — из 626. Поле и кадр данных определяют структуру цифрового потока, содержащего информацию о компрессированных изображении и звуке.

 

Объем дополнительных данных, добавляемых к полезным для синхронизации и исправления ошибок, составляет 11% во всех режимах. Однако в системе 8Т-VSB используется дополнительное решетчатое кодирование со скоростью 2/3, что увеличивает полезные данные до 67%. Система VSB с восемью уровнями модулирующего сигнала способна передавать три бита данных в интервале одного символа, что дает значение скорости передачи 32,29 Мбит/с. При решетчатом кодировании значение этой скорости уменьшается до 21,52 Мбит/с.

В системе VBS выполняются кодирование для исправления ошибок и модуляция. Исправить большие пакеты ошибок можно было бы за счет длины кодового слова блокового кода, но такой подход реально не реализуем. Эффективное решение проблемы с шумами и искажениями канала связи может быть только комплексным, включающим применение как нескольких каскадно-включенных кодеров, рассчитанных на разные типы ошибок, так и разнообразных способов перемешивания и перемежения данных. В связи с этим обработка передаваемых данных перед модуляцией играет важную роль.

Данные на входе передатчика системы 8Т-VSB представляют собой последовательность пакетов транспортного потока MPEG-2. В них передаются видеосигнал, сигнал звукового сопровождения и различные дополнительные данные. Первой операцией обработки данных, предшествующей обработке сигналов и модуляции, является скремблирование, которое обеспечивает превращение сигнала данных в квазислучайную последовательность, что придает спектру излучаемого радиосигнала плоскую форму. Это повышает эффективность работы передатчика и снижает мешающее действие цифрового радиосигнала по отношению к аналоговому, а также способствует надежному выделению сигналов синхронизации.

Дескрембларованае (процесс возврата потока данных в исходное состояние) выполняется на последнем этапе обработки данных в приемнике системы 8Т-VSB.

Скремблирование выполняется путем сложения потока данных с псевдослучайной последовательностью. Генератор псевдослучайной последовательности выполняется на базе 16- разрядного регистра сдвига, охваченного обратной связью, которая подается на восемь промежуточных точек. Выходные сигналы восьми триггеров регистра образуют байты псевдослучайной последовательности (D0, D1, … D7), которые поразрядно складываются с байтами передаваемых данных. Инициализация генератора псевдослучайной последовательности осуществляется путем загрузки в регистр числа F180H. Инициализация производится в начале поля данных во время действия импульса синхронизации сегмента данных.

Кодирование Рида-Соломона состоит в том, что к 187 байтам данных добавляют 20 проверочных байтов. Такая система кодирования позволяет исправлять до 10 ошибочных байтов в каждом слове. Затем данные перемешиваются в устройстве перемежения и порядок их следования изменяется. Слова синхронизации не перемешиваются, так как они должны сохранять структуру и периодичность для надежного выделения в приемнике, где восстанавливается исходный порядок следования данных. При этом длинные пакетные ошибки, обусловленные шумами и помехами, разбиваются на небольшие фрагменты и распределяются по разным кодовым словам кода Рида-Соломона. В каждое кодовое слово попадает лишь малая часть пакетной ошибки, с которой легко справляется система обнаружения и исправления ошибок при сравнительно небольшом объеме проверочных данных.

Первое перемежение данных, используемых в передатчике системы VSB, представляет собой межсегментное перемежение сверточного типа, выполняемое на коммутируемых регистрах, в которых каждая ячейка содержит один байт данных. Байты данных последовательно направляются в разные ветви и после выходного коммутатора порядок их следования меняется. Благодаря перемежению в сегмент попадают байты из разных транспортных пакетов и разных кодовых слов кода Рида-Соломона. Межсегментное перемежение перемешивает байты данных в пределах 52 сегментов данных одного поля, что соответствует 1/6 части поля или приблизительно 4 мс. Перемежению подвергаются только байты данных. Начало процесса сверточного перемежения привязано к первому байту данных.

Межсегментное перемежение, не уменьшающее скорость кода, предназначено для повышения эффективности исправления больших пакетов ошибок с помощью кодирования Рида-Соломона.

При кодировании поток информационных символов делится на блоки фиксированной длины, а к каждому из них добавляется некоторое количество проверочных символов. Каждый блок кодируется независимо от других. К каждому кадру добавляются проверочные символы, которые образуют кадры кодовых слов, но каждый кадр кодируется с учетом предыдущих.

Сверточный код обладает свойствами линейности и постоянства во времени. Сверточный и другие коды удобно описывать с помощью специальной диаграммы или графа, узлы которого находятся в прямоугольной координатной сетке, называемой решеткой. От этого способа описания такие коды и стали называть решетчатыми.

Внутрисегментное перемещение осуществляется вместе с решетчатым кодированием. Для этого используется 12 одинаковых сверточных кодеров и предкодеров. На входной коммутатор-демультиплексор поступают байты с устройства межсегментного перемежения, причем каждый байт обрабатывается целиком одним сверточным кодером. Биты 7, 5, 3, 1 каждого байта подвергаются предкодированию, а биты 6, 4, 2, 0 — сверточному кодированию. Пары битов, дополненные в с версточном кодере третьим, используются для образования символов данных, трансформируемых в 8-уровневые модуляционные символы. Из одного байта в кодере образуются четыре символа. Внутрисегментное перемежение достигается путем кодирования символов группами: О, 12, 24, 36,... образуют символы первой группы, а 1, 13, 25, 37,... — второй, и так далее. Всего образуется 12 групп. Данные, получаемые с выходного мультиплексора, переключаются с кодера на кодер в направлении от нулевого до одиннадцатого в первом сегменте данных, но во втором сегменте порядок следования меняется, и символы считываются от кодеров сначала с номерами 4-11, затем 3-11, а затем с 0-7. Структура перемежения в трех сегментах повторяется в 312 сегментах поля. После того, как вставлены синхросигналы сегментов данных, порядок следования символов данных таков, что символы с одного кодера отстоят друг от друга на расстоянии 12 символов.

В передатчике системы 8Т-VSB решетчатое кодирование завершает обработку данных и далее начинается обработка сигналов. На первом ее этапе включаются импульсы синхронизации сегмента и синхросегменты полей и кадров, а включение пилотсигнала предшествует уже самой амплитудной модуляции с частично-подавленной нижней боковой полосой — VSB. Модулируемой несущей является колебание промежуточной частоты 44 МГц. Выходной сигнал VSB-модулятора фильтруется фильтром, частотная характеристика которого в переходной области вместе с характеристикой соответствующего фильтра приемника имеет косинусоидальную форму. Сглаживание спектра сигнала по косинусоидальному закону характеризуется очень небольшим коэффициентом, в результате чего полоса частот, занимаемая радиосигналом, только на 11,5% превышает предельную. В полосу частот одного из телевизионных каналов спектр модулированного колебания переносится в результате преобразования частоты.

Принимаемый сигнал стандарта ATSC искажается интерференционными помехами совмещенного канала со стороны аналогового сигнала системы NTSC, в котором есть ярко выраженные гармонические колебания, переносящие значительную долю мощности. Для подавления интерференционных помех в приемнике стандарта ATSC используется режекторная фильтрация несущих колебаний видео, цвета и звука, содержащихся в спектре радиосигнала системы NTSC. Однако такая фильтрация не только подавляет наиболее мешающие компоненты в спектре системы NTSC, но и ухудшает прием основного сигнала ATSC.

Режекторный фильтр построен по схеме гребенчатого фильтра, принцип  действия которого показан на рис. 5.11. Амплитудно-частотная характеристика вычислена как модуль преобразования Фурье импульсного отклика. Гребенчатый фильтр подавляет компоненты спектра, отстоящие друг от друга на значение, обратное длительности задержки. Отсчеты белого шума, отстоящие на длительность задержки, некоррелированы, поэтому в вычитателе задержанного сигнала из прямого мощность шума удваивается, что увеличивает пороговое отношение сигнал/шум на 3 дБ.

 

            Рис. 5.11. Гребенчатый фильтр:

а — схема; б — его импульсный отклик;

в — амплитудно-частотная характеристика

 

 

5.3. Стандарт DVВ-Т

 

Спецификация EN 300 744 Европейского стандарта DVB является основным документом, в котором представлена система передачи данных для цифрового наземного вещательного телевидения. Передаваемые данные представляют собой информацию об изображении и звуковом сопровождении телевизионной программы, а также целый ряд дополнительных и служебных сведений. Основным условием передачи этой информации в стандарте DVB-T является то, что данные должны быть закодированы в виде пакетов транспортного потока стандарта MPEG-2.

Стандарт определяет структуру передаваемого потока данных, системы канального кодирования и модуляции для служб наземного телевидения, работающих в форматах различной четкости. Стандарт определяет параметры цифрового модулированного радиосигнала, а также описывает преобразование данных и сигналов в передающей части системы цифрового наземного вещательного телевидения. Преобразования данных и сигналов в передатчике и приемнике стандарта DVB-T можно понять из рис. 5.12 и 5.13.

 

Стандарт описывает «контейнер», приспособленный для доставки пакетированных данных в условиях наземного телевидения. Для системы DVB-Т ни содержание «контейнера», ни происхождение данных не имеют значения, так как она лишь приспосабливает выходные данные транспортного мультиплексора стандарта MPEG-2 к свойствам и характеристикам канала передачи наземного вещательного телевидения, стремясь эффективнее донести их к приемнику. Отличительной особенностью DVB-Т является гармоническое сочетание системы канального кодирования и способа модуляции OFDM (см. выше).

Стандарт DVB-Т разрабатывался для цифрового вещательного телевидения с учетом существующего много десятков лет аналогового вещательного телевидения. При этом требовалось обеспечить защиту от интерференционных помех соседних и совмещенных каналов, обусловленных действующими передатчиками сигналов систем цветного телевидения ВЕСАМ и PAL. При этом должны обеспечиваться максимальная эффективность использования частотного диапазона, устойчивый прием в условиях многолучевого распространения радиоволн, а также возможность приема радиосигналов в движении (в автотранспорте и т.п.) и на комнатные антенны.

Все эти требования в стандарте DVB-T были выполнены благодаря применению новой системы модуляции OFDM, которая отличается передачей сигнала с использованием большого количества несущих колебаний. Несущие являются ортогональными, что делает возможной демодуляцию модулированных колебаний даже в условиях частичного перекрытия полос отдельных несущих. Однако многолучевое распространение радиосигнала в точку приема приводит к ослаблению и даже полному подавлению некоторых несущих вследствие интерференции прямого и задержанного сигналов. Решению этой проблемы помогает кодирование с целью обнаружения и исправления ошибок в канале передачи данных. Применение какой-либо одной системы кодирования не дает желаемого эффекта в условиях наземного телевидения, поэтому в стандарте DVB-Т используется более сложный алгоритм исправления ошибок: сочетание двух видов кодирования — внешнего и внутреннего, рассчитанных на устранение ошибок различной структуры, частоты и статистических свойств и обеспечивающих при совместном применении практически безошибочную работу.

Кодирование обязательно связано с введением в поток данных некоторой избыточности и, соответственно, с уменьшением скорости передачи полезных данных, поэтому наращивание мощности кодирования за счет увеличения объема проверочных данных не всегда соответствует получению реальных данных. Для увеличения эффективности кодирования без снижения скорости кода применяется перемежение данных, при котором пакеты ошибок дробятся на мелкие фрагменты, что обеспечивает стабильность работы системы кодирования. При этом кодирование превращает ОРОМ в СОРОМ, т.е. в кодированное частотное уплотнение с ортогональными несущими, при котором даже полное исчезновение сигнала отдельных несущих не является катастрофой, поскольку данные, переносимые этими несущими, могут быть восстановлены при декодировании. «Контейнер» СОРОМ приспособлен к условиям передачи данных в наземном телевидении благодаря возможности раздельной обработки сигналов большого числа несущих.

При ОFDМ данные передаются с использованием большого количества несущих колебаний. Если таких несущих много, то поток данных, переносимых одной несущей, характеризуется сравнительно небольшой скоростью, т.е. частота модуляции каждой несущей невелика. Однако межсимвольные искажения проявляются и при малой скорости следования модуляционных символов. Чтобы избежать межсимвольных искажений, перед каждым символом вводится защитный интервал. Однако это не просто пауза между полезными символами, достаточная для угасания сигнала символа до начала следующего. В защитном интервале передаются фрагменты полезного сигнала, что гарантирует сохранение ортогональности несущих принятого сигнала.

Защитный интервал зависит от расстояния между передатчиками в одночастотных сетях вещательного телевидения или от задержки естественного эхо-сигнала в сетях вещательного телевидения с традиционным распределением частотных каналов различных стандартов. Чем больше задержка, тем больше должна быть длительность защитного интервала. С другой стороны, для обеспечения максимальной скорости передаваемого потока данных, защитный интервал должен быть как можно меньше.

Предварительные исследования показали, что если одночастотные сети будут строиться, в основном, с использованием существующих передатчиков, то абсолютное значение защитного интервала должно быть около 250 мкс. Если защитный интервал в 250 мкс составляет четвертую часть полезного интервала, то длительность полезного интервала должна быть установлена на уровне 1 мс. Шаг частот несущих связан с шириной основного лепестка спектра одного модулированного несущего колебания и определяется величиной, обратной длительности полезного интервала. Следовательно, расстояние между соседними несущими будет примерно равно 1 кГц. При ширине полосы частот канала 8 МГц и шаге 1 кГц число несущих должно быть 8000.

Если объем данных, которые необходимо передать с помощью одной несущей, окажется слишком большим, то потребуется использовать многопозиционные модулирующие сигналы и помехозащищенность системы будет невелика. Однако помехозащищенность станет достаточно высокой при использовании нескольких тысяч несущих. Передача такого количества несущих автоматически снимает проблему практической реализации благодаря тому, что модуляция ОРОМ представляет собой обратное преобразование Фурье, а демодуляция — прямое. В большинстве быстрых алгоритмов Фурье размер массива данных, подвергающегося преобразованию, кратен целой степени числа 2. Например, можно использовать размер массива N = 8192 = 8 К или N = 2048 = 2 К (где К = 2 = 1024). Практически число несущих меньше, так как их часть не используется, поскольку между полосами соседних каналов должен быть оставлен некоторый зазор. В настоящее время в двух предложенных режимах используется 6817 и 1705 несущих, а по размерности массива быстрого преобразования Фурье системы модуляции называются соответственно 8К OFDM и 2К ОFDМ.

Особенностью стандарта DVB-Т является возможность обеспечения иерархической передачи и приема. Данные на выходе мультиплексора транспортного потока расщепляются на два независимых потока стандарта MPEG-2 (см. рис. 5.12), которым присваиваются разные степени приоритета. Поток с высшим приоритетом кодируется для обеспечения высокой помехозащищенности. Затем оба кодированных потока объединяются и передаются вместе. При этом появляется возможность передачи по одному каналу двух различных программ или одной программы в двух версиях. Первая версия характеризуется высокой помехозащищенностью, но ограниченной четкостью. Вторая обеспечивает высокую четкость, но имеет ограниченную помехозащищенность. На стационарную антенну с помощью высококлассного приемника может быть принята версия с высокой четкостью. Но эта же программа будет принята простым и дешевым приемником в варианте с ограниченной четкостью. Помехозащищенная версия будет также приниматься в тяжелых условиях приема — в движении или на комнатную антенну.

Стандарт DVB-Т был создан для удовлетворения разнообразных требований, которые выдвигаются в странах, переходящих к цифровому вещательному телевидению. При этом предусмотрена работа системы в различных режимах. Для работы одиночных передатчиков и сетей могут использоваться режимы работы с разным числом несущих. Стандарт DVB-Т допускает два режима работы: режим 2К подходит для одиночных передатчиков и малых сетей, а 8К соответствует большим сетям.

Стандарт DVB-Т допускает обмен между скоростью передачи данных и помехозащищенностью. Введение защитного интервала позволяет эффективно бороться с неблагоприятными последствиями многолучевого приема. Однако большой защитный интервал уменьшает скорость передачи полезных данных. Для сохранения большой скорости передачи данных предусмотрен целый набор значений защитного интервала: 1/4, 1/8, 1/16 и 1/32 от длины полезного интервала. Скорость передачи внутреннего кода, обнаруживающего и исправляющего ошибки, может устанавливаться одним из значений следующего ряда: 1/2, 2/3, 3/4, 5/6, 7/8. В стандарте предусмотрена также возможность изменения числа позиций модулирующего сигнала от 4 до 64.

Поскольку распределение ширины полосы частот каналов отличается в различных стандартах (например, 6, 7 или 8 МГц), то перейти от одного стандарта к другому просто. В стандарте DVB-Т это выполняется путем замены тактовой частоты при сохранении всей структуры обработки сигналов.

Выбор комбинаций параметров, относящихся к способу модуляции и числу несущих колебаний, а также скорости передачи внутреннего кода и значению защитного интервала, позволяет создать систему наземного вещательного телевидения, работающую в самых разных условиях передачи и приема, и обеспечивающую заданную область обхвата сигналов вещательного телевидения.

Важным фактором является высокая степень общности стандарта наземного вещательного телевидения DVB-Т с другими стандартами цифрового телевидения: кабельного (DVB-С) и спутникового (DVB-S).

Скремблирование данных является первой операцией, выполняемой в стандарте DVB-Т. Оно обеспечивает превращение цифрового сигнала в квазислучайный. При этом решаются две важные задачи: во-первых, создание в цифровом сигнале достаточно большого числа перепадов уровня и обеспечение возможности выделения из него тактовых импульсов (такое свойство сигнала называется самосинхронизацией); во-вторых, обеспечение более равномерного энергетического спектра излучаемого радиосигнала, благодаря чему повышается эффективность работы передатчика и минимизируется мешающее действие радиосигнала цифрового телевидения по отношению к аналоговому телевизионному сигналу, излучаемому другим передатчиком на этом же канале.

Скремблированию предшествует операция адаптации цифрового потока, представляющего собой последовательность транспортных пакетов MPEG-2 (рис. 5.14). Пакеты, имеющие общую длину 188 байтов (один синхробайт, записываемый как число 47 в шестнадцатеричном коде или 01000111 — в двоичном, и 187 байтов передаваемых данных), объединяются в группы по восемь пакетов. Синхробайт первого пакета инвертируется, образуя число 101110002 = В816. Скремблирование осуществляется путем сложения по модулю 2, т.е. посредством логической операции «исключающее ИЛИ» (XOR) цифрового потока данных и двоичной псевдослучайной последовательности PRBS (Preudo Random Binary Sequence).

 

Генератор последовательности PRBS построен на базе 15- разрядного регистра сдвига, охваченного обратной связью (рис. 5.15). Чтобы формируемая последовательность походила на случайную, а в приемнике можно было бы восстановить передаваемые данные, в начале каждого восьмого пакета производится инициализация генератора PRBS путем загрузки в него числа 100101010000000. После инициализации первый бит псевдослучайной последовательности PRBS складывается с первым битом первого байта транспортного потока, который следует за инвертируемым байтом синхронизации. Байты синхронизации транспортных потоков не скремблируются. Работа генератора PRBS не прекращается во время действия всех восьми пакетов, но в интервале синхробайтов сложения с псевдослучайной последовательностью не производится (для этого используется сигнал разрешения) и синхробайты остаются нескремблированными. Следовательно, длительность псевдослучайной последовательности оказывается равной 1503 байтам (187+188х7).

Исходные данные на приемной стороне восстанавливаются с помощью такого же генератора PRBS, который инициализируется в начале каждой группы из восьми пакетов адаптированного транспортного потока, где на начало группы указывает инвертированный синхробайт пакета.

 

В системе внешнего кодирования для защиты всех 188 байтов транспортного пакета вместе с байтом синхронизации используется код Рида-Соломона. В процессе кодирования к этим 188 байтам добавляется 16 проверочных байтов. При декодировании на приемной стороне это позволяет исправлять до восьми ошибочных байтов в пределах каждого кодированного слова длиной 204 байта.

Внешнее перемещение осуществляется изменением порядка следования байтов в пакетах, защищенных от ошибок. Выполняется оно путем последовательного циклического подключения источника и получателя данных к 12 ветвям. За одно подключение в ветвь направляется и из ветви снимается 1 байт данных. Внешнее перемежение данных условно показано на рис. 5.16.

           

            В 11 ветвях включены регистры сдвига, содержащие разное число ячеек (каждая ячейка хранит один байт данных) и создающие увеличивающуюся от ветви к ветви задержку. Входной и выходной ключи синхронизированы, что не нарушает периодичность и порядок следования байтов синхронизации. Первый синхробайт направляется в ветвь с номером 0, который не вносит задержки. После 17 циклов коммутации ключей через устройство пройдет 204 байта (12х17), что совпадает с длиной кодового слова, в которое превращается пакет данных после кодирования Рида-Соломона. Таким образом, следующий байт синхронизации вновь пройдет через ветвь с нулевой задержкой.

Перемежение является временным перемешиванием байтов данных, поэтому в приемнике исходный порядок следования байтов данных восстанавливается. Полезным в перемежении является то, что длинные пакетные ошибки, обусловленные шумами и помехами в канале связи и искажающие последовательно идущие байты данных, в результате обратного перемежения в приемнике разбиваются на небольшие фрагменты и распределяются по разным кодовым словам кода Рида-Соломона. В каждое кодовое слово попадает лишь малая часть пакетной ошибки, с которой легче справляется система обнаружения и исправления ошибок при сравнительно небольшом объеме проверочных данных.

Прямое и обратное перемежения могут выполняться с помощью практически одинаковых устройств, но только порядок изменения задержки в ветвях устройства обратного перемежения в приемном устройстве должен быть изменен на противоположный. Устройства прямого и обратного перемежения синхронизируются путем направления первого же обнаруженного байта синхронизации через ветвь с номером О.

Внутреннее кодирование в стандарте DVB-T основано на сверточном коде и принципиально отличается от внешнего, которое осуществляется в блоке данных. При кодировании в блоке данных поток информационных символов делится на блоки фиксированной длины, к которым в процессе кодирования добавляется некоторое количество проверочных символов. При этом каждый блок кодируется независимо от других.

При сверточном кодировании поток данных тоже разбивается на блоки, но гораздо меньшей длины, которые называются кадрами информационных символов. К каждому такому кадру добавляются проверочные символы, при этом образуются кадры кодового слова. Каждый кадр кодируется с учетом предыдущих информационных кадров. Для этого в кадре всегда хранится какое-то количество кадров информационных символов, доступных для кодирования очередного кадра кодового слова. Число информационных символов, используемых в процессе сверточного кодирования обычно называют длиной кодового ограничения. Формирование кадра кодового слова сопровождается вводом следующего кадра информационных символов. Следовательно, процесс кодирования связывает между собой последовательные кадры.

Скорость внутреннего кода, определяемая отношением числа символов в информационном кадре к общему числу символов, передаваемых в одном кодовом кадре, может изменяться в соответствии с условиями передачи данных в канале связи и требованиями к скорости передачи данных. Чем выше скорость кода, тем меньше его избыточность и тем меньше его способность исправлять ошибки в канале связи.

В стандарте DVB-Т внутреннее кодирование с изменяемой скоростью строится с использованием базового кодирования со скоростью 1/2. Основу базового кодера представляют два цифровых фильтра с конечной импульсной характеристикой, выходные сигналы, которых Х и Y формируются путем сложения по модулю двух сигналов, взятых в разных точках линии задержки, выполненной в виде регистра сдвига из шести триггеров (рис. 5.17). Входные данные последовательно вводятся в регистр сдвига, а из выходных сигналов фильтров после преобразования в последовательную форму создается цифровой поток, в котором биты, следуют друг за другом в 2 раза чаще, чем на входе. На каждый входной бит приходится два выходных.

В режимах с большей скоростью кодирования передается лишь часть генерируемых сигналов Х и Y, остальные вычеркиваются. На рис. 5.17, б показаны передаваемые сигналы и порядок их следования.

 

В стандарте DVB-Т внутреннее перемежение тесно связанно с модуляцией несущих колебаний. Оно является частотным перемежением, определяющим перемешивание данных, которые модулируют разные несущие колебания. Это весьма сложный процесс, который служит основой принципов модуляции способом ОРОМ. Внутреннее перемежение складывается из перемежений битов и цифровых символов данных. Его первым этапом является демультиплексирование входного потока данных, за которым следует формирование модуляционных символов.

Отдельные несущие могут модулироваться с использованием квадратурной фазовой манипуляции QPSK или квадратурной амплитудной модуляции QAM. Сигналы, модулирующие синфазную и квадратурную составляющие несущей, являются многоуровневыми и описываются последовательностями многопозиционных символов, которые называются модуляционными. При использовании QPSK модулирующий сигнал представляет собой последовательность 4-позиционных символов, выбираемых из алфавита с четырьмя двухразрядными двоичными словами (00, 01, 10, 11), которые определяют фазу модулированного колебания. Для формирования таких символов входной последовательный поток битов надо распределить или демультиплексировать на два субпотока, в каждом из которых тактовая частота будет в 2 раза меньше, чем на входе (рис. 5.18).

 

 

Для 16-позиционной квадратурной амплитудной модуляции 16-QAM надо формировать модуляционные символы в виде 4-разрядных двоичных слов, определяющих фазу и амплитуду модублированного колебания. В этом случае входной поток необходимо демультиплексировать соответственно на четыре субпотока. При использовании модуляции 64-QAM модуляционные символы представляют собой 6-разрядные слова, поэтому входной поток демультиплексируется на шесть субпотоков.

Входной поток данных демультиплексируется на V субпотоков (V = 2 для QPSK, V = 4 или 6 для QAM). Поток битов Х0, Х1, Х2, Х3... преобразуется в последовательность слов из V разрядов. При использовании QPSK два последовательно следующих бита Х0 Х1 отображаются в слово, представленное в параллельной форме и состоящее из битов b0,0 b1,0,биты Х2, Х3 — в слово из битов b0,1 b1,1 и т.д. При использовании 16-QAM выполняется следующая структура отображения последовательного потока входных битов в 4- разрядные слова в параллельной форме Х0, — b0,0, Х1b0,1, Х3b3,0 и т.д. При использовании 64-QAM каждые шесть последовательно следующих битов отображаются в 6-разрядные слова.

Перемещение битов представляет собой процесс, который осуществляется в пределах фиксированной области данных. Выполняется он в пределах последовательности из 126 битов субпотока и только над полезными данными в каждом субпотоке. В процессе перемежения в каждом субпотоке формируется входной битовый вектор B(e) = (be,0, be,1, ..., be,125), преобразуемый в выходной А(е) = (ae,0, ae,1, ..., ae,125), элементы которых — функция перестановки битов, определяемая различным образом для устройства перемежения каждого субпотока.

Для образования цифрового символа данных выходы устройств перемежения субпотоков объединяются так, чтобы каждый символ из V битов (слово Y' w, где w = 0, 1, ..., 125) включал в себя один бит с выхода каждого устройства, при этом выход I, дает старший бит у'w. В режиме 2К процесс битового перемежения повторяется 12 раз, в результате образуется пакет из 1512 цифровых символов данных (126х12), называемый символом OFDM. Эти 1512 цифровых символов данных используются для модуляции 1512 несущих колебаний в интервале одного символа OFDM, длительность которого обозначается Ts. 12 групп по 126 слов, считываемых последовательно с выхода устройства битового перемежения, образуют вектор Y' = (у'0, у'1, ..., у’1511). В режиме 8К процесс битового перемежения повторяется 48 раз, что дает 6048 цифровых символов данных (126х48), используемых для модуляции 6048 несущих. Это дает вектор Y' = 0', у1'..., у’1511).

Перед формированием модуляционных символов выполняется перемежение цифровых символов данных. Вектор на выходе устройства перемежения символов Y=0, у1..., уmax-1) формируется в соответствии с правилом: yH(q) = у'q для четных символов и YH(q) = yq для нечетных, где q = 0, ..., Nmax -1, Nmax = 1512 или 6048; Н (q) — функция перестановки символов, которая производится в пределах блока из 1512 и 6048 символов.

Цифровой символ данных состоит из V битов у'q, = (у0,q’..., уV-1,q’), где q' — номер символа на выходе устройства символьного перемежения. Величины Y используются для формирования модуляционных символов в соответствии с используемым способом модуляции несущих. Модуляционные символы Z являются комплексными, их вещественная и мнимая части отображаются битами уu,q. В комплексной плоскости модулированные несущие показывают точками, соответствующими вершинам суммарных векторов: Сn= С1 + jСQ.

Для прямого и обратного преобразований Фурье разработаны эффективные алгоритмы быстрого преобразования Фурье-БПФ и ОБПФ. Формула для сигнала OFDM, представляющая вещественную часть ОБПФ и регламентирующая формирование радиосигнала, представляет собой важную часть стандарта DVB-Т, так как именно она определяет алгоритмы практической реализации предлагаемого в стандарте способа модуляции ОРОМ.

Отношение Tu/N = Т (где Tu — интервал полезной части сигнала, N — размер массива БПФ), определяющее интервал дискретизации, играет важную роль в спецификации стандарта DVB-Т. Величина 1/Т называется системной тактовой частотой. Время символа и защитный интервал являются целыми кратными Т. В стандарте DVB-Т, рассчитанном на каналы шириной 8 МГц, системная тактовая частота 1/Т = 64/7 МГц. Она является оптимальной с точки зрения уменьшения интерференционных помех из-за взаимодействия с излучаемыми радиосигналами аналогового вещательного телевидения.

Стандарт DVB-Т был спроектирован в первую очередь для ширины полосы частот 8 МГц, единого в Европе для дециметровогo частотного диапазона. Однако его легко можно приспособить к ширине полосы частот канала 7 МГц, для чего необходимо заменить системную тактовую частоту. При этом сохраняется структура обработки сигналов, но объем передаваемых данных составляет лишь 7/8 исходного.

Можно использовать не только вещественную, но и мнимую части ОПФ. Вычислим в соответствии с формулой ОПФ вещественную и мнимую части сигнала S (1).

Умножим вещественную часть на колебание с частотой F, (это колебание называется синфазным), а мнимую — на квадратурное колебание той же частоты (сдвинутое по фазе по отношению к синфазному на 90 град). При этом их суммирующее произведение будет давать сигнал ОРОМ, спектр которого смещен на частоту F,. Такая операция соответствует преобразованию частоты, которое неизбежно используется для переноса радиосигнала в полосу частот выбранного канала вещательного телевидения. Структурная схема такого преобразования представлена на рис. 5.19.

Сигнал, получаемый при способе модуляции с частотным уплотнением, состоит из многих модулированных несущих. Символ OFDM может рассматриваться как разделенный на элементарные пакеты, каждый из которых переносится одной несущей во время одного символа. Число битов, переносимое одной несущей за время переноса символа ОРОМ, зависит от способа модуляции несущих: 2 бита для QPSK, 4 бита для 16-QAM и 6 битов для 64-QAM.

Передаваемый сигнал организуется в виде кадров, каждый из которых состоит из 68 символов ОРОМ, пронумерованных от 0 до 67. Четыре последовательных кадра составляют суперкадр. При выбранной структуре кадра в одном суперкадре содержится целое число пакетов длиной 204 байта, представляющих собой скремблированные транспортные пакеты MPEG-2.

 

Каждый символ длительностью Ts образуется путем модуляции 1705 несущих в режиме 2К и 6817 несущих в режиме 8К. Интервал Ts состоит из двух составляющих: интервала ТV, во время которого передаются входные данные передатчика (полезная информация), называемого полезным, и защитного интервала ТG который представляет собой циклическое повторение части полезного интервала, расположенного перед ним

 

Структура сигнала OFDM в интервале передачи одного символа условно представлена на рис. 5.20.

В дополнение к данным в кадре ОРОМ передаются опорные сигналы и сведения о параметрах передачи. Опорные сигналы, называемые пилот-сигналами, получаются в результате модуляции несущих псевдослучайной последовательностью. Пилот-сигналы используются для синхронизации. Они распределены во времени и в частотном спектре сигнала ОРОМ, их амплитуды и фазы можно использовать для получения сведений о характеристиках канала передачи. В системе используются два типа пилот-сигналов — это непрерывные и распределенные. Непрерывные пилот-сигналы передаются на одних и тех же несущих в каждом символе ОРОМ, а распределенные рассеяны равномерно во времени и по частоте. Непрерывные пилот-сигналы могут использоваться для синхронизации и оценки фазовых шумов канала, а распределенные — для оценки характеристик канала посредством временной и частотной интерполяции. Использование временной интерполяции в промежутках между распределенными пилот-сигналами при достаточной мощности принимаемого сигнала может помочь улучшению приема на движущихся объектах (автомобилях, поездах и т.п.).

Сигналы параметров передачи используются для сообщения приемнику параметров системы, относящихся к канальному кодированию и модуляции: способ передачи — иерархический или неиерархический, параметры модуляции, защитный интервал, скорость внутреннего кода, режим передачи — 2К или 8К, номер кадра в суперкадре. Эти сведения используются приемниками для быстрой настройки. Сигналы параметров передаются на 68 последовательных символах OFDM и обозначаются в виде кадра OFDM. Каждый символ OFDM переносит один бит, который относится к сигналам параметров передачи. Блок данных, соответствующий одному кадру ОРОМ, содержит 68 битов, назначение которых расшифровывается следующим образом:

- 1 бит для инициализации;

- 16 битов для синхронизации;

- 37 битов обеспечивают сигнальную информацию;

- 14 битов проверочные и служат для обнаружения и исправления ошибок, возникающих в канале связи.

Из 37 информационных битов сейчас используются 23, а остальные 14 зарезервированы для дополнения в будущем. Помехозащищенность данных, переносимых сигналами передачи, повышает и способ модуляции. Каждая несущая, переносящая сигналы параметров передачи, модулируется по способу дифференциальной двоичной фазовой манипуляции DBPSK (Differential Binary Phase Shift Keying). При этом фаза несущей меняется на противоположную от символа к символу, если передаваемые данные равны единице, и не меняются, если они равны нулю.

Преобразователь Фурье в качестве модулятора ОРОМ допускает 2048 (режим 2К) и 8192 (режим 8К) несущих, но используется соответственно только 1705 и 6817. Число несущих, переносящих данные, пилот-сигналы и сигналы параметров передачи, должны обеспечивать:

- общую структуру кадра в режимах 2К и 8К;

- достаточное значение защитного частотного интервала между соседними блоками несущих;

- максимальную пропускную способность канала;

- достаточное число пилот-сигналов для получения информации о канале передачи;

- одинаковое число несущих, переносящих полезные данные, в каждом символе ОРОМ;

- целое число транспортных потоков MPEG-2, переносимых в пределах одного суперкадра, независимо от режима передачи.

Основные параметры, характеризующие передачу данных в стандарте DVB-Т, представлены в табл. 5.4.

 

Как видно из табл. 5.4, скорости передачи полезных данных имеют большой диапазон изменения (4,98...31,67 Мбит/с), что позволяет использовать стандарт DVB-Т в телевидении, как ограниченной, так и высокой четкости. Наименьшее значение скорости (4,98 Мбит/с) имеет место при модуляции несущих способом QPSK и скорости внутреннего кода 1/2 и характеризуется самой высокой помехозащищенностью системы передач при отношении сигнал/шум 3,1 дБ. Для достижения скорости 31,67 Мбит/с (модуляция несущих 64-QAM и скорость внутреннего кода 7/8) должно быть обеспечено значение отношения сигнал/шум не менее 20,1 дБ.

 

 

5.4. Стандарт ISDB-Т

Концепция цифрового вещательного телевидения в стандарте ISDB, которая является общей для наземных, спутниковых и кабельных систем, была предложена японской компанией NHK. Спецификация системы цифрового наземного вещательного телевидения ISDB-Т была одобрена ассоциацией ARIB (Association of Radio Industries and Businesses) и Советом по телекоммуникационным технологиям министерства почт и телекоммуникаций Японии (Telecommunication Technology Council of Ministry Posts and Telecommunications). В качестве окончательного проекта стандарта канального кодирования, форматирования данных и модуляции для системы цифрового наземного вещательного телевидения эта спецификация была представлена в виде документа под названием «Channel Coding, Frame Structure and Modulation Scheme for Terrestrial Integrated Services Digital Broadcasting» (ISDB-Т).

Среди стандартов цифрового вещательного телевидения ISDB должен воплотиться в реальность третьим по счету — после американского ATSC и европейского DVB-Т (см. разд. 5.2 и 5.3). Назначением японского стандарта ISDB является интеграция разнообразных служб вещательного телевидения. Нельзя сказать, что эта интеграция не рассматривалась разработчиками других систем цифрового вещательного телевидения. Например, первый этап глобального проекта DVB предполагает переход к цифровому вещательному телевидению, второй — введение интерактивных служб, а третий предусматривает создание домашней мультимедийной платформы MHP (Multimedia Ноmе Platform), которую зрители смогут использовать в качестве приемника телевизионных программ и терминалов различных служб, организованных в рамках спутникового, кабельного и наземного вещательного телевидения, а также в рамках Интернета. Особенность японского пути заключается в том, что интеграция служб является первоочередной, вытекающей из анализа роли телевидения в жизни общества.

Телевизор будущего должен представлять собой информационный терминал, интегрирующий приемники наземного, спутникового и кабельного телевидения, монитор высокой четкости, компьютер с памятью большого объема, аппаратуру обработки звуковых и видеосигналов, интерфейсы линий коммуникаций. Стандарт ISDB может использоваться для цифрового телевидения стандартной и высокой четкости, цифрового радиовещания, а также для передачи сигналов цифрового телевидения и радиовещания в разнообразных комбинациях и в сочетании с текстом, статическими изображениями, графикой и другими данными.

В техническом отношении в стандарте ISDB концепция передачи данных является общей для различных вещательных сред, таких как наземное, спутниковое и кабельное телевидение. Стандарт ISDB интегрирует сигналы изображения, сигналы звукового сопровождения и информацию дополнительных служб, передавая их одновременно в одном канале связи. При этом способ модуляции и параметры кодирования могут устанавливаться независимо для сигнала каждой службы.

В качестве способа передачи данных в стандарте ISDB-Т выбрано частотное уплотнение с ортогональными несущими OFDM. Использование большого числа несущих позволяет иметь значительно больший интервал передачи символа, чем в случае с одной несущей, но c сохранением общей скорости передачи данных в той же полосе частот. При значительном числе несущих появляется возможность использовать часть интервала передачи символа в качестве защитного интервала, во время которого уменьшаются межсимвольные искажения, что значительно снижает искажения от многолучевого приема. Способ передачи данных ОРОМ используется в европейских стандартах цифрового радиовещания DAB (Digital Audio Broadcasting) и цифрового наземного вещательного телевидения DVB-T. Однако стандарт ISDB-Т не копирует DVB-Т.

Концепции ISDB-Т в наибольшей степени отвечает частотное уплотнение с ортогональными несущими, объединенными в группы, которые называют сегментами. Таким образом, канал передачи складывается из некоторого числа сегментов ВSТ (Band Segmented Transmission), благодаря чему способ передачи данных, используемый в системе ISDB-Т, получил обозначение BST-ОI=DМ. Несколько сегментов могут объединяться в группы, называемые слоями, которые образуют логические каналы связи в рамках одного канала. Эту структуру передачи можно проследить по рис. 5.21.

В одном канале может передаваться до трех слоев в одно и то же время. Иерархическая передача достигается передачей слоев с различными способами модуляции и параметрами кодирования, которые отвечают требованиям к передаче данных, переносимых данным слоем. При этом допускается изменение способа модуляции несущих, скорости внутреннего кода, интервала временного перемежения. Гибкое использование схем модуляции и канального кодирования является важнейшим свойством стандарта ISDB. Исследования ISDB показали, что 13 сегментов оказывается достаточным для всех сфер применения цифрового вещательного телевидения с интеграцией служб.

Реализация принципа иерархической передачи данных позволяет осуществить самые разные варианты конфигурации стандарта ISDB-Т. Так например, один сегмент может отводиться для передачи радиопрограмм или данных, которые будут приниматься на переносной или карманный радиоприемник, а все остальные сегменты — для передачи сигнала ТВЧ, который будет приниматься стационарным телевизором. Декодирование данных лишь одного слоя позволяет реализовать прием, для которого предназначается один центральный сегмент. Независимо от того, реализуется или нет иерархическая передача, в одном канале передаются данные одного транспортного потока стандарта MPEG-2.

Важнейшие параметры стандарта вещательного телевидения ISDB-Т во многом схожи с параметрами стандарта DVB-Т. Одна и та же система компрессии в стандарте MPEG-2 применяется для сжатия цифрового видеосигнала стандартной и высокой четкости, что приводит к близким значениям границ диапазона скоростей передачи данных. Использование метода модуляции ОРОМ, диктуемое возможностью повысить эффективность передачи в типичных для наземного вещательного телевидения условиях многолучевого распространения радиоволн и приема в движении, а также стремлением создать одночастотные сети распространения программ, приводит к выбору сходных схем, принципов кодирования данных и модуляции несущих.

В стандартах ISDB-Т и DVB-Т совпадают относительные значения защитного интервала (1/4, 1/8, 1/16, 1/32), близкими являются его абсолютные значения для сходных режимов. Оценка максимального значения требуемого защитного интервала в 250 мкс приводит к длительности полезного интервала в 1000 мкс и шагу частот несущих 1 кГц. Режим 3 стандарта ISDB-Т имеет весьма близкие к этим оценкам параметры (в стандарте DVB-Т режим с подобным шагом частот несущих обозначается 8К). Режим 1 стандарта ISDB-Т подобен режиму 2К стандарта DVB-Т (шаг частот несущих в 4 раза больше шага частот в режиме 3). Для увеличения гибкости в стандарте ISDB-Т предлагается еще один промежуточный набор параметров, в котором шаг частот несущих приблизительно равен 2 кГц (режим 2). В рамках DVB-Т такой режим мог бы быть 4К.

В обоих стандартах используется внешнее кодирование с помощью кода Рида-Соломона, в процессе которого кодовое слово длиной 204 байта формируется в результате добавления 16 проверочных байтов к 188 байтам пакета транспортного потока MPEG-2. В качестве внутреннего кода в обоих стандартах используется одна схема сверточного кодирования со скоростями 1/2, 2/3, 3/4, 5/6, 7/8. Одинаковыми являются и способы модуляции отдельных несущих: QPSK, 16-QAM, 64-QAM. Однако в стандарте ISDB-Т в отличие от DVB-Т используется также дифференциальная квадратурная фазовая манипуляция DQPSK, позволяющая добиваться высокой помехозащищенности передачи. Модуляционные символы при этом способе модуляции, как и в случае QPSK, формируются из двухразрядных двоичных слов.

К принципиальным отличиям стандарта ISDB-T от DVB-Т относятся сегментация в рамках способа BST-ОFDМ и временное перемежение данных. В стандарте DVB-T используется лишь частотное перемежение, которое превращает длинные пакетные ошибки, возникающие из-за подавления частотных компонент спектра принимаемого радиосигнала при многолучевом распространении, в цепочки небольших и легко исправляемых ошибочных фрагментов. Если условия приема меняются очень быстро, частотное перемежение оказывается недостаточным. Временное перемежение создает возможности исправления больших пакетов ошибок, параметры которых быстро изменяются во времени и которые не могут быть разбиты на мелкие фрагменты с помощью частотного перемежения. Использование временного перемежения обеспечивает эффективный прием в тех случаях, когда приемник находится на быстродвижущемся поезде или в автомобиле.

Цифровые данные, содержащиеся в пакетах транспортного потока MPEG-2, подвергаются внешнему кодированию Рида-Соломона (204, 188) и внутреннему сверточному кодированию. Объем добавляемых проверочных данных в случае внешнего кодирования сравнительно невелик, скорость внешнего кода равна 188/204 = 0,92. Скорость внутреннего кода ниже и изменяется от 1/2 до 7/8, при этом добавляется большой объем проверочных данных (так например, при скорости 1/2 общий объем данных, подлежащих передаче, увеличивается в 2 раза по сравнению с исходными). Поток данных подвергается также перемешиванию в процессе частотного и временного перемежений и демультиплексированию, после чего преобразуется в модуляционные символы. Каждая несущая в системах QPSK и DQPSK модулируется пакетами данных, состоящих из двух битов. При модуляции 16-QAM каждый символ переносит 4 бита данных, а при 64-QAM — 6 битов. Суммирование всех несущих, которые входят в сегмент, дает символ OFDM, а 204 последовательных символа образуют кадр ОРОМ.

Пакет данных, которые используются при модуляции несущих одного сегмента ОРОМ, называется сегментом данных. В него входят данные, как описывающие изображение, звук или информацию каких-либо служб, так и проверочные, добавленные при кодировании. Большая часть несущих, объединенных в сегмент OFDM, отводится для передачи перечисленных выше данных, но некоторая их часть используется для передачи параметров и конфигурации мультиплексирования в процессе иерархической передачи.

Пакеты транспортного потока стандарта MPEG-2 длиной 188 байтов в процессе мультиплексирования, кодирования и модуляции преобразуются в сигнал, размещенный во временной и частотной областях. В частотной области весь диапазон частот, выделенный для передачи радиосигнала, делится на сегменты, внутри которых с постоянным шагом частот располагаются несущие колебания (рис. 5.22). Во временной области группы символов объединяются в кадры. На интервале каждого символа несущая принимает новое значение фазы или амплитуды в соответствии с передаваемыми данными. Сумма всех несущих колебаний на интервале одного символа образует символ OFDM.

 

 

 

В каждый кадр сегмента ОFDМ должно попасть целое число пакетов транспортного потока MPEG-2. При фиксированном числе символов в кадре число пакетов зависит от режима. При переходе от режима 1 к режиму 2 число пакетов в кадре сегмента увеличивается в 2 раза, но при смене режима не изменяется скорость передачи данных. Число пакетов MPEG-2 в кадре зависит от способа модуляции несущих. При переходе от способа модуляции QPSK к 16-QAM число битов, переносимых одним символом, увеличивается в 2 раза (от 2 до 4), при переходе от QPSK к 64-QAM — в 3 раза (от 2 до 6). При этом соответственно во столько же раз увеличивается число пакетов транспортного потока MPEG-2 в кадре при одной и той же скорости внутреннего кода. Чем она больше (скорость внешнего кода является постоянной), тем меньше объем добавляемых при кодировании проверочных данных и тем больше входных пакетов транспортного потока MPEG-2 может быть в одном кадре. Но при любом изменении скорости кода в кадр всегда должно входить целое число пакетов MPEG-2. Это позволяет абсолютно точно указать возможные значения числа пакетов в кадре. Наименьшее их число (12) будет при скорости 1/2 в режиме 1 и способах модуляции QPSК или DQPSK. При скоростях 2/3, 3/4, 5/6 и 7/8 число пакетов должно быть соответственно равно 16, 18, 20 и 21.

Число несущих в сегменте, переносящих закодированные с помощью внешнего и внутреннего кодов данные (без несущих, предназначенных для передачи информации о параметрах передачи и конфигурации мультиплексирования в процессе иерархической передачи), должно быть не более 157 (2048/13) в режиме 1, не более 315 (4096/13) — в режиме 2 и не более 630 (8192/13) — в режиме 3. Число битов в 12 пакетах MPEG-2, защищенных от ошибок с помощью внешнего кода, равно 19 584 (8x12x204) (в каждом кодированном пакете 204 байта). После внутреннего кодирования оно достигнет 39 168 (2х8х12х204) битов.

Однако оптимальным считаются числа несущих в сегменте: 96 для режима 1, 192 — для режима 2 и 384 — для режима 3. В режиме 1 к 96 несущим добавляется 12 (восьмая часть), предназначенных для передачи информации о параметрах передачи и конфигурации мультиплексирования, что обеспечивает общее число несущих в сегменте 108. Общее число несущих в 13 сегментах составляет 1404 (108x13). Для синхронизации добавляется еще одна несущая, передающая непрерывный пилот-сигнал. Она располагается над верхней границей массива несущих всех сегментов и является самой высокочастотной. Если конфигурация системы не предполагает использование всех сегментов, то число несущих соответственно уменьшается, но верхняя несущая с непрерывным пилот-сигналом остается во всех случаях. В режимах 2 и 3 общее число несущих равно соответственно 2809 (216х13 + 1) и 5617 (432х13 + 1).

Скорости передачи данных в стандарте ISDB-Т (6 МГц) приведены в табл. 5.5.

Параметры передачи данных в стандарте ISDB-Т (6 МГц) приведены в табл. 5.6.

Скорости передачи данных для одного сегмента в стандарте ISDB-Т (6 МГц) приведены в табл. 5.7.

 

 

 

 

Глава 6

СПУТНИКОВОЕ ВЕЩАТЕЛЬНОЕ ТЕЛЕВИДЕНИЕ

 

6.1. Общие сведения

С выводом на орбиту вокруг Земли первых советских и американских искусственных спутников Земли (ИСЗ) в конце 1950-х - начале 1960-х годов было положено начало применению ИСЗ для радиосвязи и вещательного телевидения. Для передачи телевизионных сигналов ИСЗ выполняет роль промежуточной станции, ретранслирующей сигналы от одной наземной станции к другой.

При запуске ИСЗ может быть выведен на различные орбиты, которые характеризуются следующими основными параметрами: углом наклона плоскости орбиты к плоскости экватора, формой орбиты и высотой над поверхностью Земли.

По углу наклона орбиты разделяются на следующие'.

0 град — экваториальные;

90 град — полярные;

больше 0 град и меньше 90 град — наклонные.

Необходимо отметить, что ИСЗ не может двигаться по любой орбите вокруг Земли. Он может находиться лишь на той орбите, плоскость которой проходит через центр массы Земли.

По форме орбиты разделяются на круговые и эллиптические, а по высоте — на низкие с малым периодом обращения (1...3 ч) и высокие с большим периодом обращения.

На орбите ИСЗ вращается на расстоянии от нескольких сотен до нескольких десятков тысяч километров над поверхностью Земли. После вывода на орбиту спутник продолжает вращаться вокруг Земли с постоянной скоростью без посторонней помощи по инерции, а под действием силы тяжести (гравитационной силы Земли) FG он постоянно находится на заданной орбите (рис. 6.1). Чем ближе спутник к поверхности Земли, тем больше сила FG. Для того, чтобы спутник оставался на орбите, необходимо увеличение скорости его движения по орбите. И наоборот, для спутника, находящегося на более удаленной от Земли орбите, требуется меньшая скорость его движения для удержания его на орбите.

Если ИСЗ выведен на экваториальную орбиту с периодом обращения 24 ч и движется в сторону вращения Земли, то такой ИСЗ для наблюдателя с Земли будет казаться неподвижным. Это происходит на расстоянии от поверхности на орбите спутника чуть больше 3 км/с, что обеспечивает совпадение периодов вращения спутника вокруг Земли и Земли вокруг своей оси. В этом случае говорят, что спутник стационарен по отношению к Земле. Такая орбита ИСЗ называется геосинхронной или геостационарной и отличается высокой стабильностью. Именно такие орбиты используются для спутникового вещательного телевидения. С точки зрения использования числа ИСЗ и охвата единым вещательным телевидением всех стран мира самыми выгодными являются геостационарные орбиты (рис. 6.2).

 

 

 

 

ИСЗ, находящиеся на геостационарной орбите, имеют ряд преимуществ в обеспечении связи:

- связь может быть круглосуточной;

- антеннам земных станций не требуются системы автоматического сопровождения спутника, а механизм привода антенны для перехода на прием сигналов другого спутника может быть достаточно простым;

- из-за постоянства расстояния между спутником и наземной станцией сигнал будет устойчивым на всей трассе передачи информации;

- практически отсутствует доплеровский сдвиг частоты.

Зона покрытия спутника на геостационарной орбите составляет около одной трети земной поверхности, за исключением областей, находящихся выше 75 град северной и южной широт. Следовательно, три ИСЗ, размещенные на геостационарной орбите со сдвигом 120 град, позволяют создать глобальную систему спутниковой связи, которая позволяет охватить вещательным телевидением около 98% всей поверхности Земли (рис. 6.3).

 

К числу высокостабильных также относится наклонная орбита ИСЗ с углом наклона к поверхности Земли 63,5 град и 24- часовым периодом обращения вокруг Земли.

Базовая спутниковая система связи состоит из двух наземных станций — передатчика и приемника и ИСЗ, находящегося на геостационарной орбите (рис. 6.4). Спутник, который называют активным ретранслятором, действует как преобразователь частоты, так как принимает сигналы от передающей станции (линия связи Земля — спутник) на одной частоте, передает их обратно (линия связи спутник – Земля) на наземную станцию на другой, более низкой, частоте. Для прохождения ионосферы окружающей Землю частоты линий связи Земля – спутник и спутник – Земля выбираются выше 100 МГц.

 

 

Схема охвата вещательным телевидением земной поверхности может быть представлена следующим образом. Сигналы с телевизионного центра, ведущего передачу, поступают на специальный передатчик, который с помощью высоконаправленной антенны передает их на ИСЗ. Принятые на спутнике сигналы усиливаются и модулируют сигналы двух передатчиков ретранслятора. Один передатчик излучает энергию в направлении следующего активного ретранслятора (направленное излучение), другой

в направлении Земли (ненаправленное излучение). На Земле эти сигналы принимаются специальными приемными устройствами, усиливаются и передаются на телевизионный центр, где окончательно и формируются телевизионные сигналы. Сформированный сигнал изображения вместе с сигналом звукового сопровождения поступают на передатчик телевизионного центра для телевизионного вещания. Кроме того, по радиорелейным и кабельным линиям связи сигнал может быть передан на другие телевизионные центры.

Если спутниковая передача ориентирована на индивидуальных пользователей, то излучаемый спутником сигнал направлен не на конкретную приемную антенну, а на некоторую площадь или зону обслуживания. Для представления распределения передаваемой спутником мощности электромагнитного излучения используются контурные карты и каждый спутник формирует свою собственную зону обслуживания на поверхности Земли. Типичный набор контурных линий зоны обслуживания спутника ASTRA VI

показан на рис. 6.5. Каждая линия зоны соответствует постоянному значению испускаемой спутником мощности, измеренной в единицах децибел на ватт (дБВт).

 

Запуск ИСЗ на 24-часовую геосинхронную или полусинхронную (наклон 63,5 град) орбиты связан с рядом трудностей, создаваемых воздействием гравитационных полей Луны и Солнца, а также необходимостью удерживать эти спутники на орбите и ориентировать их по отношению к Земле. В связи с этим к современным спутникам предъявляют очень жесткое требование — точность его положения на орбите должна составлять не менее 99,9 %.