1. ПОЧЕМУ РАДИОВЕЩАНИЕ В XXI ВЕКЕ ДОЛЖНО СТАТЬ ЦИФРОВЫМ?

 

Аналоговое вещание или цифровое, "цифра" или "аналог"? По реакции на этот вопрос всех заинтересованных слушателей, видимо, можно поделить на "прагматиков" и "эстетов". Первые считают, что чем больше звуковых программ (хотя бы и в цифровом формате) доступно человеку, тем лучше, эстеты же предъявляют к звуку (точнее — к звуковоспроизведению) особые требования, находя в "цифровом звуке" существенные недостатки. Вот отзыв экспертов журнала "High End Review" о звучании CD-системы — в сравнении со звучанием аналогового тракта Zarathustra [105]: "Тембрально все сбалансировано, но звучит плоско и одинаково, сквозь мутную непрозрачную взвесь... От упругого рельефного звука контрабаса остаются лишь щипки за струны, само же звучание, размытое и неопределенное, предстает в виде аморфного гула. Звучание фортепиано становится каким-то ватным, неживым. Исполнительская манера беспардонно нивелируется: расслышать нюансы игры музыканта в схематически изображенном звуке практически невозможно. Игра медных духовых приобретает "ресторанный" оттенок, будто через дешевый микрофон: звук упрощенный, с компрессированный его грубой мембраной".

Тем не менее, ясно одно: будущее, как бы не противились тому многие, останется за "цифрой". Как в звукозаписи, так и в эфирном радиовещании по ряду чрезвычайно важных причин выбор сделан в пользу применения цифровых форматов. В радиовещании для такого выбора оказалось достаточным наличие лишь двух неустранимых недостатков аналогового радиовещания: "расточительного" использования частотного ресурса, по определению ограниченного, и неспособностью противостоять многообразным помехам, а также замираниям сигнала в многолучевом канале, в частности при приеме на подвижном объекте.

Отвечая на вопрос, возможен ли "аналоговый" ренессанс, можно лишь выразить надежду (для некоторого успокоения современных лириков), что ренессанс "аналогового" качества звука воплотится в "цифре" — в новых цифровых форматах.

 

1.1. Состояние аналогового радиовещания и ресурсы повышения его качества

 

Несмотря на бурное развитие телевидения — на сегодняшний день важнейшего электронного средства массовой информации, эфирное радиовещание во всем мире продолжает оставаться основным источником информации для населения. Для эфирного радиовещания в мире используется служб, различающихся целями, техническими параметрами и зонами обслуживания. Основные характеристики существующих систем эфирного радиовещания приведены в табл. 1.1, где для сравнения указаны планируемые параметры цифрового радиовещания. Эти системы условно можно разделить на три класса:

1) системы с амплитудной модуляцией (АМ), использующие диапазоны КМВ, ГМВ и ДКМВ (т.е.частоты ниже 30 МГц), что по терминологии "Регламента радиосвязи" (в дальнейшем — РР [78]) соответствует диапазонам НЧ, СЧ и ВЧ;

2) МВ (УКВ) ЧМ системы, использующие метровые волны, т.е.работающие на частотах 30...300 МГц в диапазоне ОВЧ;

3) системы непосредственного спутникового радиовещания (DSR, ADR, World Space, Digital System Е и ряд других), работающие в диапазонах УВЧ и СВЧ.

Напомним тем, кто давно не заглядывал в РР, что в диапазоне КМВ организуется всего 15 радиоканалов, в диапазоне ГМВ— 120; разнос между несущими частотами в этих диапазонах принят равным 9 кГц, а необходимая ширина полосы (и следовательно, значение верхней модулирующей частоты F,) выбирается Администрацией связи в пределах от 9 (F, = 4,5 кГц) до 20 (F, = 10 кГц) кГц;

в диапазоне ДКМВ, как правило, разнос несущих частот составляет. 10 кГц, а ширина полосы частот радиоканала — 9 кГц.

Вещание на частотах ниже 30 МГц характеризуется уникальными возможностями в части распространения радиоволн, что обеспечивает большие зоны охвата и мобильный прием с относительно небольшим ослаблением; ВЧ диапазон единственно пригоден для реализации международного радиовещания.

            Однако АМ радиовещание характеризуется использованием аналоговых методов и ограниченным качеством вещания. Последнее в значительной степени объясняется интерференцией в результате специфических механизмов распространения радиоволн, которые преобладают в этой части частотного спектра.

Состояние передающей сети АМ вещания в настоящее время оставляет желать лучшего из-за несоответствия передающих устройств современным требованиям ввиду [28]:

 

 

отсутствия режима однополосной передачи;

невозможности регулировки уровня несущей, позволяющей улучшить условия электромагнитной совместимости (ЭМС) и уменьшить энергопотребление;

отсутствия устройств автоматического обслуживания;

низкого коэффициента полезного действия, не превышающего 50% (по сравнению с величиной 85-90% у современных передатчиков);

отсутствия режима передачи цифровых сигналов. Парк радиопередающих устройств различной мощности в диапазонах АМ вещания насчитывает в России 450 единиц, на их долю приходится 57% электроэнергии, потребляемой всем оборудованием электросвязи. По разным оценкам от 65 до 80% АМ вещательных передатчиков должны быть списаны по причине физического и морального износа (значительная их часть во много раз превысила установленную продолжительность эксплуатации). Это делает весьма актуальной полную модернизацию радиовещательных сетей АМ вещания. Предполагается, что замена передатчиков с аналоговой модуляцией цифровыми позволит снизить излучаемую и потребляемую мощности приблизительно на порядок[100].

Системы, реализующие АМ вещание, характеризуются достаточно низким качеством, с весьма ограниченной полосой воспроизводимых звуковых частот (порядка 4,5 кГц). Они подвержены индустриальным помехам и помехам от других радиостанций и бытовой техники. Как правило, это монофоническое вещание, передачи которого принимаются на стационарные (фиксированные) и подвижные приемники (в табл. 1.1 соответственно Ф и П). Во время приема в автомобилях весьма вероятны глубокие замирания. Отношение сигнала к несущей (С/Н) на длинных и средних волнах близко к 20 дБ, а на коротких волнах — часто опускается до нуля. Существенным недостатком, объясняемым ограниченными возможностями частотного ресурса, является незначительное число передаваемых программ.

Несколько поднять субъективное качество радиоприема в диапазонах длинных, средних и коротких волн удается путем использования специальной обработки вещательного сигнала на входе АМ модулятора радиовещательного передатчика. С этой целью используются аудиопроцессоры различных типов. В ряде стран в диапазоне средних волн достаточно широко применяются системы стереофонического радиовещания, что также повышает качество услуги.

Единственным видом существующего аналогового радиовещания, способным передавать звуковые вещательные сигналы с высоким качеством, является ОВЧ ЧМ (FM) радиовещание в диапазоне метровых волн. Для радиовещания в этом диапазоне в России выделены следующие полосы частот: 66 ... 74 (4,55...4,1 м) и 87,5 ... 108 (3,4...2,79 м) МГц (в Западной Европе 88 ... 104 МГц, в США — 88 ... 108 МГц). В каждом из указанных участков спектра можно организовать в масштабах страны сети четырех программного вещания, т.е.одновременно передавать четыре разные программы, причем лишь две из них могут быть стереофоническими. Несмотря на то, что каждый аналоговый канал занимает довольно узкую полосу (130...190 кГц), из-за сильного взаимного влияния сигналов соседних зон их приходится значительно разносить. Поэтому увеличение числа одновременно передаваемых в вещательной сети стереофонических программ без увеличения взаимных помех при их приеме становится невозможным [27].

Ввиду большой ширины частотных каналов и применения частотной модуляции реализуются высокие параметры качества. В частности, использование ЧМ позволяет значительно увеличить отношение сигнал/помеха — по сравнению с АМ в 5,8 раза (15дБ) при монофоническом вещании и в 2 раза (5,5дБ) — при стереофоническом. Для построения систем двухканальной стереофонии используют под несущую частоту, которую модулируют по амплитуде или по частоте. Международным Консультативным Комитетом по Радио — МККР (теперь вместо него действует секция МСЭ-Р) для диапазона ОВЧ ЧМ рекомендованы [27,78]:

1. Система ЧМ-АМ с полярной модуляцией(ПМ). Описана в 1939 г. А.И. Косовым и внедрена в 50-х гг. в СССР благодаря работам проф. Л.М. Кононовича. Работает с амплитудной модуляцией под несущей частоты 31,25 кГц (эта частота равна удвоенной строчной частоте 15,625 кГц отечественного стандарта телевидения). В России используется на частотах 66...74 МГц. Первая опытная передача состоялась в Ленинграде 6 января 1960 г. Утверждена для регулярного вещания в декабре 1963 г.; рекомендована к использованию Рекомендацией 450 МККР в 1966 г.

2. Американская система ЧМ-АМ с пилоттоном (ПТ). Разработана инженерами фирмы Zenit-General Electric в конце 1950-х гг., с амплитудной модуляцией под несущей частоты 38 кГц при частоте пилоттона 19 кГц. В России используется на частотах 88...108 МГц. Утверждена для регулярного вещания в 1961 г.; рекомендована к использованию Рекомендацией 450 МККР в 1966 г. Получила широкое распространение во многих странах мира, в том числе в Западной Европе.

3. Шведская система ЧМ- ЧМ Берглунда. Использует частотную модуляцию под несущей частоты 33,5 кГц и сжатие динамического диапазона сигнала.

Системы 1 и 2 близки по структуре и параметрам. Главное различие — в степени подавления под несущей на стороне передачи: в системе 1 — в 5 раз (на 14 дБ), а в американской системе— практически полностью (в 100 раз — на 40 дБ) и вновь восстанавливается в приемнике путем удвоения частоты пилот- тона 19 кГц, передаваемого малым уровнем. Подавление амплитуды под несущей существенно улучшает энергетические показатели системы.

Ввиду того, что по происхождению система 1 — российская, а 2 — американская, стало традицией называть вещание в системе 1 — "ЧМ вещанием", а в системе 2 — "FM вещанием". Хотя используемый в них принцип один и тот же, однако, на приемник, предназначенный для "ЧМ вещания ", нельзя принять стерео сигнал "FM вещания ", и наоборот.

Система 3 отличается большей помехоустойчивостью, чем системы 1 и 2, благодаря сжатию динамического диапазона сигнала, передаваемого на поднесущей, и применению частотной модуляции под несущей. При этом обеспечивается такое большое переходное затухание между левым и правым каналами, что по ним вместо стереофонического сигнала можно передавать две независимые монофонические программы.

Для передачи сигнала стереовещания используется один радиопередатчик, несущую которого модулируют по частоте комплексным стереосигналом (КСС). КСС предварительно формируется из сигналов левого (Л) и правого (П) каналов. Для повышения помехозащищенности исходных сигналов Л и П в области верхних частот, где уровни спектральных составляющих существенно меньше, чем на средних частотах, сигналы подвергают частотным предыскажениям с помощью предыскажающего контура с постоянной времени равной 50 мкс в системе ПМ и 75 мкс- в системе ПТ.

Важнейшим параметром любой системы вещания является ширина занимаемой полосы частот каждым вещательным каналом. Для частотной модуляции справедливо следующее приближенное соотношение (правило Карсона): — ширина занимаемой в эфире полосы частот;  — верхняя частота в спектре комплексного стерео сигнала; 1д— максимальная девиация частоты несущей. В системе ПМ 1д составляет 50 кГц, в системе ПТ — 75 кГц. Чем эта цифра больше, тем помехозащищенность системы выше, но требуемая в эфире полоса шире.

Так, занимаемая каждым вещательным каналом в эфире полоса частот составляет: для системы с полярной модуляцией— около 130 кГц в режиме монофонической передачи и около 190 кГц в стереофоническом режиме, для системы с пилот-тоном в стереофоническом режиме — около 206 кГц. Однако, для большинства программ вещания (учитывая, что внеполосное излучение составляет, согласно РР [78], около 1% излучаемой мощности) занимаемая полоса в эфире составляет: для системы ПМ— 165 кГц; для системы ПТ — 190 кГц.

К недостаткам ОВЧ ЧМ вещания следует отнести трудность организации и малую пропускную способность информационных каналов для передачи дополнительной сервисной информации в вещательном ЧМ канале, малые размеры зоны уверенного приема, ограниченные условием прямой видимости, а также многолучевой интерференцией и другими помехами при приеме в движущемся транспорте, когда нельзя воспользоваться преимуществами направленных антенн, в то время как использование именно таких антенн обычно планируется при расчетах зон приема с гарантированным качеством. А самое главное, ЧМ передатчики, будучи аналоговыми и работая по принципу "одна частота — один передатчик — одна программа", не способствуют рациональному использованию частотного спектра как национального общероссийского ресурса [100].

От общего числа (около 3000) радиовещательных передатчиков около 85% составляют ОВЧ ЧМ передатчики; среди них 539 РВС

 

 

На практике подобное достигается только в дорогостоящих высококлассных тюнерах. Несмотря на прогресс техники, получить такие же показатели в массовой аппаратуре не удается. Увеличение девиации частоты в ЧМ передатчике могло бы способствовать улучшению качественных показателей бытовых приемников, однако оно бы привело к расширению полосы частот, занимаемой передачей. Кроме того, обеспечить высококачественный стереофонический прием можно только в стационарных условиях и с ориентированной антенной. Но и в этом случае достигаемые потребительские характеристики ОВЧ ЧМ приемников заметно уступают одноименным характеристикам современной цифровой звукотехники.

Автомобильные антенны обычно являются ненаправленными, принимают прямые и отраженные сигналы, поэтому при приеме ЧМ сигналов в определенных местах это приводит к снижению уровня сигнала ниже определенного порога, а следовательно, к преобладанию шумов, ухудшающих качество приема или приводящих к полной его потере. (Дополнительная литература [6, 8, 27, 36, 48, 76, 100]).

 

1.2. Целесообразность применения цифровых технологий в радиовещании

 

Качество современного звукового вещания достигло довольно высокого уровня. Внедрение системы радиовещания в диапазоне метровых волн, использующей частотную модуляцию, позволило приблизить воспроизведение передаваемых программ к их естественному звучанию. Тем не менее существующая система аналогового ЧМ вещания далеко не полностью удовлетворяет современным требованиям, как по качеству звучания, существенно уступающему достигаемому в современной бытовой цифровой аппаратуре качеству записи и воспроизведения звука, так и в отношении количества передаваемых программ. Высокая плотность ОВЧ ЧМ радиовещательных станций в эфире в конкретном регионе создает большой уровень взаимных помех. Из- за многолучевого распространения радиоволн метрового диапазона невозможен полноценный прием стереофонических программ в автомобиле. В то же время число источников цифровых звуковых программ, доступных слушателю дома или в дороге, неуклонно возрастает. На смену аналоговой пластинке и аналогoeoмy магнитофону пришли цифровые источники, такие, в частности, как компакт-диск. И только радио пока остается  бастионом аналогового звука" [17].

Сейчас большинство радиостанций используют аналоговое радиовещание, даже если источником является CD-проигрыватель, цифровой магнитофон или, что уже нередко встречается на коммерческих радиостанциях, компьютер с банком музыкальных записей в стандарте MPEG. Перед передачей в эфир цифровой сигнал преобразуется в обычный аналоговый и все остается  прежде — у слушателей, особенно автомобилистов, возможны проблемы с качеством приема.

Дальнейшее улучшение качества звучания аналогового радиоприемника сопряжено с большими трудностями — как техническими, так и экономическими. А поскольку устойчивая привычка к качественному звучанию на уровне компакт-диска, которое становится общепринятым стандартом, уже появилась, то единственным решением, позволяющим существенно повысить потенциал радиовещания, является внедрение цифровой техники, используемой в настоящее время практически только для управления работой радиоприемника. Кроме того, общая тенденция развития информатизации общества требует при рассмотрении концепции радиовещания учитывать его как один из видов систем мультимедиа и принимать универсальные решения.

Исторически цифровые технологии в звуковом вещании впервые были использованы для передачи вещательных программ по наземным и спутниковым линиям связи, а к концу 1970-х гг. ХХ в. появилась возможность организации непосредственного спутникового радиовещания в цифровом формате в рамках радиовещательной спутниковой службы (РВСС). Вещание с ИСЗ можно было осуществлять в одном из выделенных в соответствии с РР диапазонов частот, наиболее используемые из которых: 3,4...4,2 ГГц и 11,7...12,5 ГГц [27].

Первое поколение систем непосредственного спутникового вещания, появившееся в нашей стране на рубеже 1970-1980-х гг. (системы "Орбита- РВ" и "Радикал-ЗВ"), предназначались исключительно для распределения большого количества звуковых программ по территории страны. В этом случае не могло быть и речи ни о коллективном, ни, тем более, об индивидуальном приеме— антенны приемных ЗС имели диаметр соответственно 12 и 4 м. В те годы это была весьма совершенная техника. Так, система "Орбита- РВ" работала через геостационарный ИСЗ 'Горизонт" и располагала сетью из нескольких десятков приемных станций по всей стране; она обеспечивала передачу "пакета", содержащего до 25 программ разного качества [92].

К следующему поколению систем спутникового вещания с приемом на стационарную антенну можно отнести цифровую систему непосредственного спутникового радиовещания DSR, реализованную в Германии и Франции с использованием ИСЗ TV-SAT 2 и DFS-3 Kopernikus в каналах для непосредственного спутникового ТВ вещания в диапазоне 11,9...12,7 ГГц. Эту систему относят к системам непосредственного ЦРВ (НЦРВ), поскольку здесь предусмотрен коллективный и индивидуальный прием на антенны с диаметром от 0,4 м (оптимально — 0,9 м). Теоретически возможен прием на подвижные приемники, но это связано с разработкой и использованием сложных управляемых антенн на фазированных решетках.

Передача звуковых сигналов в формате DSR обеспечивает качество лучшее, чем при МВ ЧМ вещании. Однако это качество реализуется лишь при приеме на стационарные остронаправленные антенны, да и радиочастотный ресурс здесь используется

весьма неэффективно. Более подробно системы НЦРВ будут рассмотрены в следующих разделах книги.

Системы радиовещания изначально создавались для приема в стационарных условиях на направленную антенну, установленную на высоте уровня крыш, и не предусматривали возможность мобильного приема. Но в настоящее время имеется огромное число абонентов, использующих переносные малогабаритные и автомобильные радиоприемники, Однако в движении, как правило, условия приема существенно хуже по сравнению с приемом на стационарную антенну. Это объясняется интерференцией радиоволн, приходящих в точку приема (на ненаправленную антенну) со всех сторон. Проблемы многолучевого приема особенно обострены в условиях высотной городской застройки.

В качестве возможного решения проблемы мобильного приема в высококачественном радиовещании является переход к цифровому стандарту передачи информации. Однако перехода к простым методам цифровой передачи информации недостаточно, так как на принимаемый сигнал, способный обеспечить высококачественный звук, резко негативно влияют изменяющиеся условия приема. Поэтому необходимо полное переосмысление самих принципов цифровой передачи вещательных сигналов.

Международный союз электросвязи, комитеты, занимающиеся международной стандартизацией систем радиовещания, выбрали цифровые системы как для развития наземного вещания в разных диапазонах частот, так и для реализации концепции НЦРВ. Похоже, выбор цифровой технологии в эфирном радиовещании является фундаментальным и необратимым решением.

Одним из наиболее привлекательных аспектов цифровых методов передачи является то, что они более эффективны в условиях сильных помех и обеспечивают более рациональное использование радиочастотного ресурса. Цифровая обработка сигналов и методы цифровой связи приводят к новым применениям, включая мобильный компьютер, факсимильный аппарат и другие мобильные услуги по обработке информации. Высокая помехоустойчивость позволяет системам ЦРВ либо превзойти по эффективности использования РЧС системы аналогового радиовещания (на частотах выше 30 МГц), либо в полосах аналогового вещания обеспечить существенно более высокие стандарты качества услуги.

Преимущества цифровой реализации основаны также на том обстоятельстве, что цифровая техника переживает быстрые и впечатляющие темпы улучшения характеристик, снижения стоимости и потребляемой мощности.

Успехи технологии сверхвысокого порядка интеграции элементов сделали цифровую обработку сигналов вещания и их цифровую передачу по радиоканалам более эффективной, нежели аналоговая обработка и аналоговые методы передачи. К наиболее эффективным методам цифровой обработки и передачи звуковых вещательных сигналов относятся:

преобразование и кодирование (кодирование источника), позволяющие эффективно устранить избыточность в таких сигналах, благодаря чему в раз уменьшить скорость передаваемого цифрового потока по сравнению с методами ИКМ;

помехоустойчивое кодирование канала — кодирование с исправлением ошибок, представляющее собой метод обработки сигналов, предназначенный для увеличения надежности их передачи по цифровым каналам за счет специально вводимой избыточности. Такая обработка, в сочетании с процедурой перемещения сигналов по времени и частоте, приводит к существенному повышению энергетической эффективности систем цифрового вещания, значительному повышению их помехоустойчивости. Цифровые системы вещания имеют более высокие характеристики по сравнению с аналоговыми системами в условиях сильных стоканальных помех и помех по соседнему каналу. Возможность работы систем ЦРВ в условиях сильных помех повышает эффективность использования РЧС, обеспечивает возможность совместной (аналоговой и цифровой) передачи звуковой программы в одном радиоканале;

новейшие методы цифровой модуляции позволяют повысить эффективность использования РЧС по сравнению с аналоговыми методами. Прежде всего речь идет о спектральных методах модуляции, при которых процессы модуляции и демодуляции производятся над сигналами, представленными в частотной области;

применение цифровых методов для синхронизации, передачи управляющих сообщений и контроля параметров позволяет значительно снизить потери на передачу вспомогательной информации, обеспечивающей функционирование аппаратуры как системы синхронной связи;

цифровые системы позволяют относительно легко реализовывать архитектуры с гибко изменяемой шириной полосы частот — как в радиочастотном диапазоне, так и в диапазоне звуковых частот (основной полосе);

цифровая технология позволяет вводить новые услуги, которые не поддерживались аналоговыми системами вещания, например прием, совместно с радиовещательными программами, большого объема текстовой информации различного назначения, дополнительных сведений и данных, существенно повышающих качество услуги и расширяющих ее объем. Благодаря применению эффективных методов цифровой обработки и передачи звуковых вещательных сигналов достигаются следующие дополнительные преимущества:

возможность, при соответствующем выборе метода кодирования, практически полной коррекции искажений, возникающих в тракте передачи;

возможность приема звуковых программ в условиях селективных как по частоте, так и по времени замираний, обусловленных многолучевым характером распространения радиоволн и меняющейся во времени картиной их отражений от местных предметов при приеме на подвижном объекте;

экономичное использование радиочастотного спектра. В зависимости от используемого диапазона частот это позволяет осуществлять передачу либо большого количества звуковых программ в одном блоке (на частотах выше 30 МГц), либо цифровой звуковой программы с полосой до 10 кГц и более в канале, совмещенном с каналом аналогового радиовещания (на частотах ниже 30 МГц);

передача на малой мощности, позволяющая эффективно декодировать сигнал при отношении несущей к шуму (Н/Ш) порядка 5 дБ. Для сравнения: удовлетворительный прием в ОВЧ ЧМ системе реализуется при Н/Ш не менее 40 дБ. Сказанное иллюстрирует рис. 1.1, на котором показана зависимость качества радиоприема (по ориентировочной субъективной оценке слушателей) от отношения несущая/шум;

высокая технологичность радиоприемников и другого цифрового оборудования.

Так, многоцелевые программируемые цифровые сигнальные процессоры позволяют выполнять цифровые модуляторы и демодуляторы на полностью программной основе.

 

 

В результате существует устойчивая тенденция к непрерывному уменьшению стоимости цифровых схем.

Успешное внедрение любой новой системы радиовещания зависит от своевременного и правильного определения ее ключевых преимуществ перед другими системами. В работе [69] представлена оценка по простой пятибалльной шкале основных характеристик пяти известных систем радиовещания (табл. 1.3). Как видно из таблицы, по большинству характеристик минимальный разрыв (разность оценок л) не превышает одного балла. Это значит, что по этим параметрам ни одна из известных систем радиовещания не обладает существенным преимуществом. Но есть один показатель, по которому цифровое радиовещание в формате DAB намного превосходит аналоговые системы. Речь идет о возможности транслировать в одном радиоканале одновременно несколько радиопередач.

При традиционном линейном программировании передачи выходят в эфир по очереди в соответствии с временной сеткой вещания. Недостатком такого способа программирования является неравномерное распределение численности аудитории по времени суток. Известно, что человек слушает радио в среднем около 3 часов в сутки. И если в удобное для прослушивания время он не находит на привычной частоте интересующую его передачу, то переключается на другую радиостанцию. Вещатель при этом теряет аудиторию, а слушатели часто не получают того, чего хотят.

 

 

В системе DAB появляется возможность транслировать в одном цифровом потоке сразу несколько программ, причем их количество, а также структуру и характеристики каждого канала в отдельности, можно оперативно изменять в соответствии с критериями программной политики РВС. У программной сетки появляется второе измерение, что обеспечивает вещателю возможность многоканального программирования. В результате вещатель может предложить своим слушателям своеобразный радиожурнал с большим тематическим и жанровым набором передач ([6, 8, 9, 14, 18, 22, 27, 36, 46 — 48, 76, 79, 82, 84, 89, 93, 96, 98, 100, 105])

 

1.3. Логика появления современных систем ЦРВ       

 

Эволюция радиосистем передачи естественным образом привела в 70-х гг. ХХ столетия к появлению цифровых систем, обладавших очевидными преимуществами перед аналоговыми. Большинство методов цифровой обработки и передачи звуковых вещательных сигналов, послуживших основой для разработки современных систем ЦРВ, известны достаточно давно и широко применяются в существующих системах обработки и передачи звуковых программ. Наиболее полно эти методы проявились в разработках аппаратуры цифровой звукозаписи, цифровых систем передачи сигналов 3B по радиорелейным и спутниковым линиям связи. Как отмечалось выше, на этой основе в нашей стране и за рубежом были созданы цифровые спутниковые системы распределения программ звукового вещания на приемники со стационарными антеннами. Если первые из них (Орбита- РВ, Радикал) требовали дорогостоящих приемных установок с многометровыми параболическими антеннами, то DSR — европейский проект 1980-х гг. — уже был рассчитан на коллективное и даже индивидуальное применение, поскольку обеспечивал прием 16 стереофонических программ на параболическую антенну диаметром до 90 см. Эта система успешно эксплуатируется до сих пор. Однако реализация концепции ЦРВ стала возможной лишь благодаря принципиально новым техническим решениям.

В середине 1980-х гг. специалистам стало ясно, что, оставаясь в рамках классического последовательного метода передачи, малоэффективного цифрового компандирования звукового вещательного сигнала и используя сантиметровый диапазон волн, невозможно решить важнейшую задачу радиовещания— обеспечить высококачественный прием на мобильный приемник нескольких стереофонических программ. Прежде всего, система должна работать в традиционных "радиовещательных" диапазонах волн. Однако эти диапазоны давно поделены между различными службами и даже если новая услуга будет востребованной, трудно рассчитывать на выделение полос частот, существенно превышающих те, что используются при аналоговом вещании. Отсюда следует первое важное требование к системам ЦРВ— высокая частотная (спектральная) эффективность, причем чем ниже по шкале частот организуется цифровое радиовещание, тем выше должна быть эффект использования спектра.

Как известно, эта проблема впервые была решена в ходе разработки проекта Eureka 147 — речь идет о знаменитой системе MUSICAM (развитая версия системы MASCAM), ныне известной как система кодирования звука по стандарту MPEG-1 Layer 11. Однако эффективности этой системы кодирования (вкупе с модуляцией ОФМ-4) оказалось недостаточно для построения системы ЦРВ, работающей на частотах ниже 30 МГц, т.е. в диапазонах длинных, средних и коротких волн. Здесь, уже в ходе работ консорциума DRM над проектом системы для этого диапазона частот, были разработаны более совершенные системы кодирования звука (MPEG-4 AAC, MPEG-4 CELP и MPEG-4 HVXC) и использована квадратурная амплитудная модуляция (от 4-КАМ до 64-KAM).

Обеспечение мобильного приема также требовало нетрадиционного подхода. Применение разнесенного приема, но в рамках последовательного метода передачи (классическое решение в системах подвижной связи [52]), не привело к желаемым результатам. Удачное решение — модем COFDM — было найдено (применительно к радиовещанию) опять же в процессе работы над проектом Eureka 147. Разработчиками использован параллельный (многочастотный/ метод  с большим числом кодированных когерентных несущих. При таком распараллеливании цифрового потока появляется возможность резко снизить скорость передачи на каждой несущей, ввести временной интервал, защищающий приемник от эхо-сигналов, а также реализовать перемежение сигналов по частоте — фактически многократно повторять каждую звуковую программу на входе приемника. Использование такого модема обеспечило возможность построения одночастотной вещательной сети (SFN), когда сеть передатчиков, передающих один и тот же набор звуковых программ, работают на одной частоте с целью увеличения зоны (площади) обслуживания.

Заметим, что эффективность описанного метода передачи в значительной степени определяется также и системой канального кодирования, согласованного с фазовой (или фазовой) модуляцией, а также системой демодуляции / декодирования с использованием алгоритма Витерби.

Обратим внимание также на основные системные преимущества ЦРВ. Это, прежде всего, высокая эффективность использования радиочастотного спектра. Так, например, в системе ЦРВ Eureka 147 для передачи шести стереофонических программ на всей территории России требуется полоса частот около 1,5 МГц. В системе ОВЧ ЧМ вещания — при передаче трех программ более низкого качества — 8 МГц.

К системным преимуществам ЦРВ следует также отнести:

возможность оперативно изменять параметры мультиплексирования (уплотнения) передаваемого многопрограммного сигнала (количество и параметры стереофонических и монофонических программ, соотношения объемов дополнительной информации в цифровом потоке), что открывает широкие возможности выбора для служб радиовещания, повышает экономическую эффективность передающего оборудования, расширяет круг потенциальных потребителей;

возможность интеграции с компьютерами посредством РС- карты, что является важным элементом технологии мультимедиа;

реализованную в европейском стандарте Eureka 147 возможность построения одночастотной сети вещания, благодаря чему возрастает качество мобильного приема и уменьшается уровень электромагнитного загрязнения окружающей среды, поскольку в такой сети хорошие условия радиоприема создаются при относительно низких уровнях мощности передатчиков;

принципиальную возможность интеграции с системами глобального позиционирования (GPS), обеспечивающими быстрое и точное определение координат пользователя с помощью приемника сигналов ЦРВ;

технологичность изготовления бытового приемника. Благодаря использованию цифровых элементов узлы приемника легко поддаются реализации в виде специализированных цифровых интегральных микросхем и практически не требуют настройки, что важно при массовом производстве. ([43-45, 56, 83, 95, 111 — 114])

 

1.4. Цифровое радиовещание как перспективная услуга

 

Изменим жизнь к лучшему. Еще 5 лет назад трудно было предположить, что подобный призыв мог иметь отношение к услугам эфирного радиовещания в России. Действительно, после внедрения около полувека назад ОВЧ ЧМ вещания на метровых волнах ничего сколько-нибудь значительного в этом сегменте услуг электросвязи не появлялось. А сегодня в нашей стране серьезно обсуждается концепция внедрения цифрового радиовещания, оснащаются оборудованием (к сожалению, не отечественного производства) опытные зоны вещания в Москве и Санкт-Петербурге, проводятся впечатляющие эксперименты по цифровому радиовещанию на коротких и средних волнах, выделены первые участки радиочастотного спектра ЦРВ как перспективная система радиовещания должно характеризоваться определенным набором потребительских свойств, делающих услуги эфирного радиовещания привлекательными для пользователей. При этом следует отдавать отчет в том, что конкретные характеристики таких услуг будут отличаться в зависимости от используемого диапазона частот. Так, системы ЦРВ, работающие на частотах выше 30 МГц, т.е. в диапазонах метровых и дециметровых волн, должны обладать следующим набором потребительских свойств:

1) блок принимаемых программ должен состоять минимум из 5 — 6 стереофонических программ с качеством приема эквивалентным CD, причем должна быть предусмотрена возможность замены некоторого количества таких программ на большее их число, но более низкого качества;

2) наряду с многопрограммным радиовещанием должна быть реализована возможность приема, индикации и записи разнохарактерной дополнительной информации;

3) качество приема должно гарантироваться почти в любых условиях, в том числе и на мобильный приемник при его перемещениях в пределах заявленной зоны обслуживания;

4) приемник ЦРВ должен быть надежен, но достаточно прост в эксплуатации, иметь развитые сервисные возможности и доступную цену.

Для систем ЦРВ, работающих на частотах ниже 30 МГц, указанные выше потребительские свойства должны быть скорректированы в части п.1 — числа и качества программ, принимаемых в одном блоке. Так, в системе DRM предусматривается возможность одновременного приема одной программы в цифровом и аналоговом форматах, передаваемых в одном канале. Полоса звуковых частот, в значительной мере характеризующая качество вещательной передачи, в аналоговом формате составляет около 5 кГц, а в цифровом — может, в принципе, достигать 15 кГц.

Первые три из вышеперечисленных потребительских свойств, характерных для перспективной системы радиовещания, работающей на частотах выше 30 МГц, реализованы в настоящее время только в рамках европейской программы цифрового радиовещания Eureka 147 (часто для названия этой системы используют аббревиатуру DAB — зарегистрированную торговую марку, принадлежащую только участникам проекта Eureka 147) [114].

"Об услуге пусть рассказывает не оказавший, а получивший ее"- советовал римский писатель и философ Сенека. Последовав этому мудрому совету, приведем мнение о достоинствах "цифрового радио" специалистов канадской радиовещательной корпорации, которые провели в 1996 г. сравнительные испытания ряда европейских и американских модификаций системы ЦРВ, остановив свой выбор на системе Eureka 147/DAB [110, 112]:

"Цифровое радио обеспечивает кристально чистый звук, сопоставимый по качеству с CD или с акустическим качеством концертного зала. Обычное аналоговое радио не может выполнить этот стандарт хотя бы потому, что не может обеспечить динамический диапазон CD. Также — в отличие от радио с АМ и ЧМ — цифровой радиоприемник фактически не восприимчив к вмешательству и поэтому отсутствуют любые разовые искажения звука или искажения типа "наложенная дорожка", которая повторяет передачу с некоторым запаздыванием (в случае отражения сигнала от зданий или неровностей местности), что неприятно слушателю, находящемуся дома или в автомобиле (вагоне поезда). Причина такой надежности цифрового радио в том, что оно использует "хитрый" приемник, внутри которого имеется микрокомпьютер. Последний способен к сортировке отраженных и искаженных сигналов и восстановлению высококачественного звука. В то же время обычный аналоговый приемник не может отличать и отфильтровывать полезную информацию от бесполезного шума. Он воспроизводит полностью тот принятый сигнал, на частоту которого он настроен, каким бы он ни был...".

Поэтому не удивительно, что система цифрового радиовещания Eureka 147/DAB выиграла в сравнительных испытаниях с семью другими системами. При этом оценивались такие параметры, как совместимость с существующим МВ ЧМ вещанием, устойчивость приема сигналов, качество воспроизведения и возможность передачи данных.

Пользователь услуги цифрового радиовещания стандарта DAB — помимо возможности высококачественного приема нескольких моно- и стереофонических программ — должен иметь возможность дополнительно принимать (одновременно со звуковыми сигналами) буквенно-цифровую и/или графическую информацию, включая рекламную, справочную, коммерческую, в том числе конфиденциальную. Разработанный стандарт включает в себя два канала для передачи данных. Дополнительная информация выводится на жидкокристаллический дисплей приемника, а при необходимости и на внешнее устройство типа персонального компьютера (ПК). Текстовая информация может предназначаться, например: для идентификации жанров принимаемых программ и комментариев к исполняемым музыкальным произведениям; она может представлять собой информацию о состоянии на дорогах, погоде, включая сообщения о возможных критических ситуациях; сигналы пеиджинговои связи, а также услуги типа "оплачиваемое радио" (оплаченная возможность прослушивать определенные радиопередачи).

Понятие "развитые сервисные возможности DAB — радиоприемника" подразумевает широкие эксплуатационные возможности:

простоту беспоисковой настройки — желаемая станция задается набором букв или выбирается из названий станций или радиопередач, показанных дисплеем приемника;

индикацию вида (моно/стерео), характера (речь, классическая, популярная или рок-музыка) и наименования (например, "Маяк", "Европа-плюс" и т. п.) программы на многофункциональном дисплее приемного устройства;

способность приемника контролировать силу принимаемого сигнала и использовать эту информацию для автоматического переключения при мобильном приеме;

возможность запрограммировать радиоприемник таким образом, чтобы он отбирал передачи только определенного формата, а также устанавливать индивидуальные уровни громкости и динамический диапазон для каждой программы. Сегодня определены 30 стандартных информационных категорий или жанров: новости, спорт и искусство. Новые расширенные возможности DAB-радиовещания облегчают поиск и сокращают время настройки — слушатель может программировать DAB-приемник для поиска программ указанного формата, т.е. создавать собственную программу из различных каналов, объединяя их при программировании по желанию.

В дополнение к вышесказанному отметим, что использование в быту радиоэлектронной аппаратуры с цифровым приемным трактом позволит в будущем реализовать ряд принципиально новых потребительских возможностей, таких, например, как определение точного географического местоположения с помощью сигналов "Системы геостационарных спутников" (система глобального позиционирования GPS), прием сигналов будущей интегральной (многофункциональной) службы ЦРВ (ISDB), предусматривающей прием и передачу информации из компьютерных баз данных и факсимильных сообщений [90]. Таким образом, сегодня система цифрового радиовещания способна предоставить нечто большее, чем просто "высококачественный звук на радиоволнах" — это интеллектуальное коммуникационное устройство, которое предложит больше услуг и удобств, чем способна обеспечить обычная аналоговая технология.

Некоторые общие сведения о существующих и перспективных системах вещания, в которых использована передача звуковой информации в цифровом виде, приведены в табл. 1.4 [17].

Системы DSR (цифровое спутниковое радио) и ADR (цифровое радио "Astra"),  и система Eureka 147, обеспечивают радиовещание с качеством, близким к качеству компакт-диска (в DSR — практически без сжатия звуковых данных), однако первые две имеют существенные ограничения. Для передачи звуковых программ они используют спутниковый канал, энергетические соотношения в котором таковы, что принимать их можно, только используя стационарную спутниковую антенну, в то время как DAB-передача принимается в движении и на автомобильный, и на переносной приемник.

Это является большим преимуществом системы Eureka 147, так как по оценке специалистов более 85% радиоприемников, находящихся в эксплуатации, — именно автомобильные или переносные. Кроме того, идеологически радиовещание DSR и ADR, в отличие от DAB, ориентировано на всю аудиторию той территории, которую покрывает антенна спутника, и слабо учитывает местные интересы слушателей. И еще: они фактически могут передавать параллельно музыкальной или речевой программе очень ограниченный объем данных и в этом смысле абсолютно не готовы к будущим потребностям уже появляющихся мультимедийных приложений.

Приведенные в этой таблице сведения, в принципе, должны быть дополнены данными по крайней мере по двум стремительно развивающимся системам — уже упоминавшейся системе DRM и системе непосредственного (спутникового) ЦРВ World Space.

Для ряда стран, уже имеющих наземную сеть АМ радиовещания, особенно при наличии большой территории, гораздо привлекательнее внедрение наземного цифрового радиовещания в диапазонах с АМ по мировому проекту DRM. Но самым прогрессивным в мире на сегодня оказался проект спутникового цифрового радиовещания World Space, в зоне действия которого проживает около 4 млрд. человек [93].

World Space и Alcatel Space, мировой лидер в области проектирования и производства спутниковых технологий, уже подписали

 

 

 

и мультимедийные услуги по всему европейскому континенту без многочисленных наземных ретрансляционных станций, требующих постоянной смены частот. Радиослушатели смогут принимать любые программы, в том числе на своем родном языке, находясь дома, в дороге или за рубежом. Европейская спутниковая система станет последним компонентом глобальной системы World Space, которая уже покрывает Африку, Ближний Восток и Азию, планируется в Ю. Америке и уже работает как ХМ Satellite Radio в США. Специалисты отмечают не только принципиально иную бизнес-модель спутникового радиовещания, которое может существовать и без традиционной радиорекламы, на деньги подписчиков, но и ожидаемые революционные изменения в программировании и в выборе содержания прослушиваемых передач, которые станут доступными самим радиослушателям.

Однако даже после планирующегося на 2003 г. запуска четвертого, европейского спутника проекта World Space, не будут решены задачи сплошного покрытия колоссальной территории России, в особенности ее северной части, высококачественным радиовещанием. Здесь как раз становится актуальным наземное цифровое радиовещание в диапазонах с АМ по проекту DRM и, в будущем, непосредственное спутниковое цифровое радиовещание с использованием спутников связи на  орбитах ([27, 28, 35, 36, 39, 47, 57, 59, 76, 84, 96, 114, 116, 120]).

1.5. Чем в первую очередь привлекательно цифровое радиовещание для России?

 

Цифровое радиовещание является областью, к которой в настоящее время привлечено повышенное внимание практически во всех промышленно развитых странах мира.

Для России внедрение цифрового радио особенно актуально, так как должно обеспечить не только значительное повышение качества и количества программ и дополнительных услуг населению, но и более эффективное использование РЧС, снижение энергопотребления радиопередающими средствами, загрузку промышленности и создание новых рабочих мест. ЦРВ в диапазонах частот выше 30 МГц (стандарт Т-DAB) за счет значительного увеличения количества одновременно передаваемых звуковых программ (до 6 стерео или 12 моно) позволит учесть все многообразие интересов слушателей, охватить самые разнообразные

возрастные и социальные группы радиослушателей. Однако достоинства этого стандарта смогут в полной мере оценить в лучшем случае лишь около 45% населения страны — ведь именно столько россиян живет в крупных городах.

В последнее время в России интенсивно развивается коммерческий сектор радиовещания с использованием ОВЧ ЧМ вещания, однако задача охвата многопрограммным радиовещанием всего населения страны даже не приблизилась к своему решению. Полный охват населения оказывается нерентабельным для коммерческих ЧМ радиостанций. Аналогичная ситуация скорее всего возникнет и при развертывании систем стандарта Т-DAB, близкого к ОВЧ ЧМ вещанию по возможностям охвата территории.

Это означает, что задача охвата населения радиовещанием на всей территории России в перспективе может быть решена с обязательным использованием частотных ресурсов в диапазонах длинных, средних и коротких (для удаленных северных районов) волн. Поэтому, по мнению ряда ведущих специалистов отрасли, перспективы совершенствования услуг эфирного радиовещания в нашей стране следует связывать с технологией, реализуемой стандартом DRM. Однако при внедрении цифрового радиовещания в диапазонах с АМ необходимо обеспечить сохранение возможности приема для огромного количества существующих аналоговых радиоприемников.

Сюжет "ЦРВ для России", только затронутый в этом разделе, будет развиваться в ходе изложения материала на протяжении практически всей книги.

 

2. БАЗОВЫЕ ПРОЦЕДУРЫ ОБРАБОТКИ СИГНАЛА"'"' В ЦИФРОВОМ РАДИОВЕЩАНИИ

 

Электросвязь относится  сфере высоких технологий и ее развитие в значительной степени обусловлено достижениями в области теории связи. Основополагающее значение для создания систем цифровой связи и вещания имели работы В.А. Котельникова и Клода Шеннона (теория потенциальной помехоустойчивости и теория информации). Наряду с этими фундаментальными работами можно выделить разделов теории связи и математики, оказавших существенное влияние на создание систем цифрового радиовещания, и прежде всего — теория сигналов (теория модуляции) и статистическая радиотехника. Именно совокупность всех этих знаний и составляет теорию цифрового радиовещания.

Современные системы цифрового радиовещания — продукт компьютерных технологий. Возможности современной микроэлементной базы и программного обеспечения позволили реализовать обработку звукового вещательного сигнала на новом технологическом уровне. Материалы этого раздела посвящены изучению базовых процедур обработки сигнала в цифровом радиовещании. Здесь используются элементы теории ЦРВ — в той ее части, которая необходима для пояснения физических принципов и алгоритмов обработки сигнала, построения системы и обоснования системных параметров. Знакомясь с этим материалом, помните слова все того же Люка де Вовенарга, сказанные еще в XVIII веке: "язык и мысль ограничены, истина же беспредельна".

Глава открывается краткой характеристикой двоичного канала связи, структура которого определяет необходимые процедуры обработки звукового вещательного сигнала в современных системах ЦРВ; рассмотрены модели дискретного канала, определяющие помехоустойчивость связи. Модели непрерывного (физического) канала, входящего в состав дискретного, и их влияние на характеристики систем ЦРВ разных частотных диапазонов и вариантов построения будут рассмотрены в следующей главе.

 

2.1. Основные характеристики двоичного канала связи

 

Двоичный канал связи. Основой любой системы ЦРВ как радиосистемы передачи информации, в каком диапазоне частот она бы ни работала, является двоичным канал связи, общая модель которого приведена на рис. 2.1. Характеристики этого канала определяют основные свойства цифровой системы вещания и прежде всего — энергетические и спектральные.

 

 

Звуковой вещательный сигнал, поступающий на вход системы в аналоговой форме, подвергается в кодере источника аналого-цифровому преобразованию (АЦП) и кодированию с устранением избыточности. Цифровое представление вещательного сигнала (ВС) основано на сохранении его формы в процессе дискретизации и квантования, что подразумевает использование метода кодирования формы сигнала. В этом методе используются три основных способа кодирования: импульсно-кодовая модуляция (ИКМ), дифференциальная ИКМ (ДИКМ) и дельта-модуляция (ДМ).

В цифровом звуковом вещании, как правило, для первичного АЦП применяется ИКМ с линейным квантованием. Поэтому в цифровом сигнале на выходе системы ИКМ сохраняется вся избыточность аналогового ВС. В результате ИКМ- преобразования формируется индивидуальный цифровой поток — информационная кодовая последовательность x = (x;), i = 1;2, содержащая символы "1" и "0". Важной характеристикой цифрового потока является цифровая скорость передачи сигнала — произведение частоты дискретизации F, (в килогерцах) на число бит на отсчет (разрядность двоичного кода) m = log определяемое максимальным числом уровней шкалы квантования. В большинстве известных форматов ЦРВ для монофонического канала R« = 48x16 = 768 кбит/с. Эта величина представляет собой информационным объем цифрового представления ВС, который необходимо знать при его передаче по каналу.

Приведенное значение В, представляет собой минимально-необходимую скорость, поскольку она обеспечивает только требуемое качество передачи вещательных сигналов, но не обеспечивает функционирование аппаратуры ЦРВ как системы связи. Поэтому в индивидуальном цифровом потоке необходимо учесть передачу дополнительных, служебных, сигналов цикловой синхронизации, контроля и управления:

Значение коэффициента К обычно составляет 1,05...1,1. В результате использования в кодерах источника систем ЦРВ высокоэффективных алгоритмов компактного представления ВС (например, MUSICAM) обеспечивается многократное сжатие звуковой информации при сохранении субъективно высокого качества передачи звука. О сохранении формы сигнала в этом случае речи быть не может.

В зависимости от типа звуковой программы и требований к качеству ее воспроизведения степень сжатия может отличаться в десятки раз. Обычно считается приемлемым изменение коэффициента сжатия в пределах 2 < k < 24 и более (см. также разд. 2.2). Заметим, что передача стереофонических программ требует удвоения скорости индивидуального цифрового потока.

На следующем этапе компактно представленные сигналы подвергаются ряду преобразований, основное из которых — помехоустойчивое кодирование в кодере канала. Хотя различные схемы кодеров канала очень непохожи друг на друга и основаны на различных математических теориях, все они характеризуются использованием значительного объема дополнительных, или избыточных, символов. В результате цифровая скорость передачи ВС одной монофонической программы возрастет до величины

RДД= (2 — R) RДД, где В — кодовая скорость применяемого корректирующего кода (всегда В < 1). При передаче пакета из N программ суммарная скорость потока R,=N RДД.

Следующая, и последняя в рамках принятой модели на рис. 2.1, процедура преобразования ВС на передающей стороне двоичного канала связи — модуляция, а первая на приемной стороне — демодуляция. Модем, реализующий эти процедуры, является своеобразным интерфейсом, согласующим дискретный канал (сечение А-Г на рис 2.1) с непрерывным (сечение Б-В), представленным на рисунке физическим каналом.

Модуляция — это процесс изменения во времени значений одного или нескольких параметров несущего ВЧ колебания — амплитуды, частоты или фазы — в соответствии с изменениями передаваемого сигнала (сообщения). Высокая помехоустойчивость, энергетическая эффективность и экономное расходование полосы частот в современных цифровых системах связи и вещания достигаются в значительной степени благодаря рациональному выбору параметров модуляции. Заметим, что в современных перспективных системах ЦРВ процедуры модуляции и демодуляции неотделимы от соответственно кодирования и декодирования канала. Объединение указанных процедур позволяет существенно повысить энергетическую и частотную эффективность передачи.

Для ориентировочной количественной оценки модема как интерфейса "дискретный канал — непрерывный канал" предположим, что применяется квадратурная фазовая модуляция ФМ-4. В этом случае требуемую полосу передачи радиоканала можно определить по приближенной формуле. Отсюда видно, что требуемая полоса частот определяется полной скоростью цифрового потока и кратностью модуляции фазы. В нашем примере В = 2, поэтому при передаче, например, 6 стереофонических программ, задавшись значениями коэффициентов К= 1,08; k = 6 (что позволит практически сохранить исходное качество звука) и R = 1/2, получаем следующую оценку требуемой полосы передачи радиоканала: М 1,56 МГц. Это весьма реалистичная оценка — например, полоса радиоканала системы Т-DAB со сложным многочастотным сигналом СОРОМ близка к полученному значению.

Дискретный канал имеет дискретный вход и дискретный выход. Совокупность элементов, расположенная на рис. 2.1 справа от сечения А-Г, определяет модель дискретного канала и, следовательно, математические соотношения, связывающие с помощью переходных вероятностей множества входных и выходных символов. Для описания дискретного канала необходимо знать алфавит входных символов (x), их вероятности появления р(х), скорость передачи символов К алфавит символов на выходе канала (zj и значения переходных вероятностей р(ух) появления символа у при условии передачи символа х. Первые две характеристики определяются свойствами источника сообщений, скорость R, — полосой пропускания непрерывного канала, входящего в состав дискретного, объем алфавита выходных символов — алгоритмом работы решающей схемы демодулятора, переходные вероятности р(у(х) — характеристиками непрерывного канала.

В простейшем случае алфавит входных символов (х) и алфавит символов на выходе канала  совпадают, переходные вероятности постоянны во времени, а переходы различных символов независимы. Это случай дискретного канала без памяти, наиболее часто используемой разновидностью которого является двоичный симметричный канал (ДСК). Диаграмма переходных вероятностей в ДСК представлена на рис. 2.2а.

Примером такого канала является когерентная система с противоположными (фазоманипулированными) сигналами, т.е. ФМ-2. Здесь переходные вероятности Р, определяют вероятность неискаженной (правильной) передачи символов 1 и О, а переходные вероятности Р — вероятность искажения (трансформации) символов. Очевидно, что Р+ Р =1.

 

 

        

 

 

Модели ДСК соответствует квантование выходного сигнала демодулятора Z на два уровня (L=2), как это показано на рис. 2.26. Например, Z, =1 при Z>0 и Z,-==О — при Z<0.

В таком канале вероятность ошибочного приема Р, некоторого символа не зависит от того, как приняты другие символы. Поэтому вероятность ошибочного приема таких-либо q символов в переданной кодовой комбинации из  символов подчиняется биномиальному распределению. Зная вероятность ошибки Р  и используя  (2.3), можно найти все необходимые характеристики.

Заметим, что в общем случае в дискретном канале объемы алфавитов входных и выходных символов не совпадают. Примером может служить двоичный симметричный канал со стиранием (ДСКС), в котором выходной сигнал демодулятора квантуется на три уровня (L=З): диаграмма переходных вероятностей ДСКС представлена на рис. 2.3а, а характеристика квантователя — на рис. 2.36. Такой канал называют также каналом с нулевой зоной; на характеристике квантователя это зона. Алфавит на выходе содержит один добавочный символ по сравнению с алфавитом на входе. Этот добавочный символ (символ стирания s) появляется на выходе канала с вероятностью Р когда анализируемый сигнал нельзя с большой вероятностью отождествить ни с одним из передаваемых символов. В результате здесь Р = Р+ Р где вероятность Р, характеризует (как в ДСК) ошибки трансформации символов. Стирание символов при применении соответствующего помехоустойчивого кода позволяет заметно повысить помехоустойчивость цифрового канала ЗВ [83].

В реальных системах связи редко появляется возможность использовать точные значения выходного напряжения демодулятора Z, поскольку декодер является специализированным цифровым вычислительным устройством, на вход которого должны поступать дискретные данные. Поэтому обычно напряжение Z; квантуется на L уровней ( 2", п = 1,2,...) и представляется некоторыми числами Z; (j=1,2,...,L), указывающими тот уровень квантования, которому соответствует данное напряжение.

 

 

 

 

 

 

Помимо наиболее распространенного двоичного (L=2) квантования, соответствующего бинарным (жестким) решениям, часто используемым в современных цифровых системах связи и вещания, применяется и квантование на L=8 уровней, обеспечивающее мягкие решения. Более подробно эти вопросы будут рассмотрены в разд. 2.7, посвященном демодуляции и декодированию.

В теории передачи дискретной информации принято различать два вида ошибок: статистически независимые (некоррелированные) и статистически зависимые (коррелированные). Примером модели канала со статистически независимыми ошибками является ДСК. Дискретный канал с замираниями и, следовательно, с памятью, является каналом с группированием ошибок. Ошибки в таких каналах возникают в виде пакетов (пачек). Под пакетом понимается последовательность символов, в которой первый и последний приняты ошибочно, а между ними могут быть как правильно, так ошибочно принятые символы. Предполагается, что пакеты возникают независимо друг от друга. Помимо этого канал характеризуется вероятностью ошибок внутри пакета и распределением P(q) вероятностей длины (числа символов) пакета (2.3).

Большинство реальных каналов имеют "память", которая проявляется в том, что вероятность ошибки в символе зависит от того, какие символы передавались до него и как они были приняты. Первый факт обусловлен межсимвольными искажениями (МСИ), являющимися результатом рассеяния сигнала в , а второй— изменением отношения сигнал/шум в канале или характера помех. При рассеянии сигнала приходящая на вход приемника  является суммой некоторого числа предыдущих посылок с соответствующими весовыми коэффициентами. Поэтому вероятность ошибки в последующем символе будет зависеть от характера передаваемой информации за время рассеяния сигнала.

Простой моделью двоичного симметричного канала с памятью (ДКП) является канал, который может находиться в одном из двух состояний: 0 и 1. В обоих состояниях возможны независимые ошибки с вероятностями р, и р,, где нижние индексы указывают на состояние канала [18].

Одним из распространенных методов описания дискретного канала с памятью, связанной с МСИ, является использование аппарата цепей Маркова (посимвольное описание). В этом случае последовательность состояний двоичного канала рассматривается как N-связная двоичная цепь Маркова, а значения символов на каждой позиции — как состояние цепи, где N — число символов, на которое распространяется память канала [77, 94].

 

2.2. Основы процесса кодирования источника

 

Введение. Целью сжатия (компактного представления) сигналов (3C) является снижение скорости цифрового потока на выходе кодера источника до предельно возможной величины, при которой шумы, помехи и искажения остаются еще незаметными на слух даже для высококвалифицированных экспертов, т.е. при условии сохранения заданного качества воспроизведения сигнала в результате цифро-аналогового преобразования. Это может быть использовано либо для повышения пропускной способности системы передачи в заданной полосе частот, либо для уменьшения полосы частот, необходимой для передачи заданного объема звуковой информации. Пропускная способность слухового аппарата человека оценивается в 100...120 кбит/с, однако сознательно из этого скоростного потока он способен обрабатывать (т.е. воспринимать) лишь около 100 бит/с информации. Поэтому можно говорить о присущей звуковому сигналу избыточности. Если часть этой интеллектуальной деятельности мозга "переложить" на процессор кодера источника, то удастся сократить скорость передачи. При этом степень сжатия определяется эффективностью используемых алгоритмов и требованиями к заметности возникающих искажений.

Избыточность — это характеристика вещательного сигнала, не поддающаяся непосредственному измерению. Ее наличие обнаруживается по косвенным признакам, опосредовано, как субъективная, психофизическая реакция человека. Величина избыточности является функцией времени и определяется характером звуковой программы. Вследствие этого способы достаточно полного использования избыточности сигналов ЗВ предусматривают динамический анализ реального сигнала, позволяющий оценить его избыточность на коротком временном интервале. Поэтому сокращение избыточности при цифровом представлении звуковых сигналов является достаточно серьезной проблемой.

Стандарты компрессии цифровых аудиоданных. Цифровое кодирование высококачественных 3C стало важным направлением в области акустики и обработки сигналов. В Европе в 1986 г. были выделены направления, требующие высокого качества звука, сравнимого с CD-качеством, но при более низких цифровых скоростях: цифровое радиовещание, звуковое сопровождение ТВ, репортажные каналы, тракты распределения программ, производство программ, бытовая и студийная звукозапись, средства мультимедиа. Эти области применения обозначены группой ISO/MPEG в Европейском стандарте, определяющими стандарт с типовыми цифровыми скоростями от 64 до 192 кбит/с на монофоническую программу.

Новейшие исследования в области компрессии цифровых аудиоданных привели к появлению новых методов кодирования: MUSICAM (Европа), ASPEC и АТАС (США). Разработаны европейские стандарты MPEG-1 (ISO/IEC 11172-3), MPEG-2 (ISO/IEC 13818-3, 13818-7) MPEG-4 (ISO/IEC 14496-3), а также американский стандарт ATSC АС-З.

Практическое применение методы компактного цифрового представления звуковых сигналов, изложенные в этих стандартах, нашли в европейской системе цифрового радиовещания Т-DAB и американской АТ$С АС-3 (Dolby АС-3). Применяется компрессия в сетях Internet (Layer 3 или иначе MP3) и при передаче сигналов по сетям ISDN. Скорость цифрового потока (bit rate) на выходе кодера с компрессией цифровых данных обычно лежит в пределах 32... 192 кбит/с на канал. В системе DAB предпочтение отдано скорости передачи 128 кбит/с (Layer 2), а в системе АС-3 при формате 5.1 -скорости 384 кбит/с. В новейших гибридных методах кодирования высококачественных звуковых сигналов, сочетающих в себе идеи параметрического кодирования и кодирования с преобразованием (стандарт ISO/IEC 13818-7 ААС), удалось уменьшить скорость цифрового потока при передаче стереофонического сигнала до 32...64 кбит/с, т.е. примерно в 25 раз по сравнению с ее исходной величиной в приблизительно 1,5 Мбит/с.

В стандарте ISO/IEC 11172-3 (MPEG-1 Аудио) [116] предусмотрено несколько уровней (или слоев) компрессии цифровых аудиоданных, при этом декодеры более высокой ступени могут декодировать сигналы, подвергнутые меньшей компрессии на стороне передачи. Возможны при ступени компрессии в полосе частот сигналов 3B, равной 20 кГц, каждая из которых характеризуется своей совокупностью параметров: скоростью цифрового потока передачи RДД, коэффициентом компрессии (сжатия) К, величиной запаздывания (задержки) сигнала при обработке Т„ а также рекомендуемой областью применения:

Layer 1 (слой 1) — RДД = 192 кбит/с; К = 4; Т, = 20 мс; в профессиональной аппаратуре с очень высоким качеством звука и достаточной емкостью памяти; характеризуется относительно небольшой сложностью реализации;

Layer 2 (слой 2) — RДД = 128 кбит/с; К = 6; Т, = 40...50 мс; в высококачественном радиовещании, системах передачи; характеризуется средней сложностью реализации;

Layer 3 (слой 3) — R,Д = 64 кбит/с; К= 12; Т, > 50 мс; в радиовещании и в системах записи с малой емкостью памяти и средним качеством, для передачи речи по узкополосным каналам сети ISDN; отличается высокой сложностью реализации.

Уровень 2 идентичен общеизвестной системе кодирования звука MUSICAM, в то время как уровень 1 следует понимать как упрощенную версию MUSICAM. Система MUSICAM была разработана в 1989 г. Институтом техники радиовещания в Мюнхене, фирмой PHILIPS и ССЕТТ (Исследовательский центр по радиовещанию и связи во Франции) в рамках проекта Eureka 147/DAB [106,114]. Она принадлежит к классу новых кодеков источника, способных достигнуть требуемого качества звука при типовых цифровых скоростях (64...192 кбит/с на монофоническую программу) с помощью удаления из сигнала естественной избыточности в соответствии с законами психоакустики. В 1993 г. система MUSICAM была стандартизована в Европе в стандарте ISO/IEC 11172-3 (MPEG-1 Audio, Layer 2) [56,116].

Методы кодирования. Как отмечалось выше, результативность компактного представления 3C определяется эффективностью используемых алгоритмов сжатия и требованиями к заметности возникающих искажений. На рис. 2.4 в общем виде представлены наиболее общие сведения о компактном представлении звуковых сигналов. Прокомментируем эту информацию.

В системах связи и вещания естественная избыточность источника сообщений является ресурсом, который традиционно используют для уменьшения цифровой скорости передачи. Для достижения этого обычно осуществляется переход от исходного представления сигнала 3B, полученного в результате первичного ИКМ- преобразования, к другому представлению, характеризующемуся меньшей избыточностью. Если этот переход осуществляется во временной области, т.е. кодированию подвергаются временные параметры 3C, то операция называется кодированием формы сигнала. Примерами кодирования данного вида являются различные компандерные системы (разновидности ИКМ и ДИКМ), использующие эффект маскировки шумов сигналов большого уровня и др. Однако после такого преобразования скорость цифрового потока остается достаточно высокой, поскольку здесь осуществляется далеко неполное сокращение избыточности. Дело в том, что обычная широкополосная ИКМ (16 или 16/14- разрядная) создает широкополосный, почти белый шум квантования, спектральное распределение которого очень отличается от частотно-зависимой чувствительности уха.

Различают статистическую и психофизиологическую (психоакустическую) избыточность звуковых сигналов. Сокращение статистической избыточности базируется на учете свойств самих звуковых сигналов. Она обусловлена наличием корреляционной связи между соседними отсчетами 3C при его дискретизации. Используя статистические свойства сигнала: динамический диапазон, спектральную плотность мощности и полосу частот, распределение мгновенных значений, функцию корреляции сигнала и др. удается снизить цифровую скорость потока, не ухудшая объективные параметры качества и не изменяя форму сигнала.

Особенно важную роль играет сокращение психофизиологической избыточности звуковых сигналов, основанное на учете особенностей слухового восприятия человека. Среди этих особенностей частотная и временная маскировка, инерционность, деление на "критические полоски слуха" (ряд выделяемых слуховым анализатором человека специфических под диапазонов частотного спектра, в котором осуществляется частотная маскировка одного сигнала другим), низкая чувствительность слуха к снижению точности передачи градаций амплитуды и фазы спектральных компонентов и ряд других. Психофизиологические методы сокращения избыточности обеспечивают большее снижение цифровой скорости потока, однако при этом изменяется форма сигнала и ухудшается объективное качество сигналов ЗВ. Однако это ухудшение качества, как правило, остается незаметным на слух.

Наиболее перспективным является представление ЗС в частот области, реализуемое через кодирование формы спектра и обеспечивающее на сегодняшний день наибольшую эффективность сжатия. Кодирование формы спектра обеспечивает наиболее полный учет психофизиологических особенностей слухового восприятия, а также допускает немалое количество методов сокращения статистической избыточности звуковых сигналов.

Таким образом, в большинстве современных систем компактного представления сигнала вещания (с устранением статистической и психофизиологической избыточности источника) при значительном сжатии сигнала его форма изменяется — претерпевают изменения временные, динамические и частотные характеристики сигнала, что, в конечном итоге, не может не отразиться на качестве восстановленного сигнала. Тем не менее, заметные на слух искажения, как правило, отсутствуют и обеспечивается высокое субъективное качество звучания.

Для оценки качества работы кодека источника могут быть приняты два критерия — сохранения объективного и субъективного качества. Первый предполагает определение искажений с помощью аппаратных средств, в частности, по форме сигнала, а второй — по заметности искажений при проведении субъективно- статистических испытаний (ССИ). Второй критерий менее жесткий, но он не всегда достаточен. Вопросам оценки качества звуковых вещательных сигналов посвящен ряд разделов седьмой главы.

Сокращение статистической избыточности источника. Для уменьшения статистической избыточности применяют достаточно сложные алгоритмы обработки. При их использовании потери информации нет, однако исходный сигнал оказывается представленным в более компактной форме, требующей меньшего количества бит при его передаче. Важно, чтобы все эти алгоритмы позволяли при обратном преобразовании восстанавливать исходные сигналы с минимальными искажениями. Наиболее часто для этой цели используют ортогональные преобразования. Преобразование считается эффективным, если [43]:

- обладает быстрым вычислительным алгоритмом, как, например, быстрое преобразование Фурье (БПФ);

- обеспечивает наибольшую концентрацию энергии в небольшом числе коэффициентов преобразования;

- практически отсутствует корреляция между самими коэффициентами преобразования;

- при обратном преобразовании (восстановлении исходного сигнала) искажения сигнала малы.

Оптимальным с этой точки зрения является преобразование Карунена-Лоэва, но его реализация требует значительных вычислительных затрат. Незначительно ему уступает по эффективности модифицированное дискретное косинусное преобразование (МДКП). Для него разработаны быстрые вычислительные алгоритмы и, что важно — между коэффициентами БПФ и МДКП существует простая связь, что позволяет получать результаты, достаточно хорошо согласующиеся с работой механизмов слуха.

Уменьшить скорость цифрового потока позволяют также методы кодирования, учитывающие статистику ЗС, например, вероятности появления уровней разной величины. Примером такого учета являются коды Хаффмана, где наиболее вероятным значениям сигнала приписываются более короткие кодовые слова, а значения отсчетов, вероятность появления которых мала, кодируются родовыми словами большей длины. Именно в силу этих двух причин в наиболее эффективных алгоритмах компрессии цифровых аудиоданных кодированию подвергаются не сами отсчеты ЗС, а коэффициенты МДКП. Кроме того, при кодировании коэффициентов МДКП часто используются кодовые таблицы Хаффмана.

 

 

Устранение статистической избыточности звуковых сигналов все же не приводит к значительному уменьшению скорости цифрового потока. Даже при использовании достаточно сложных алгоритмов обработки устранение статистической избыточности позволяет, в конечном итоге, уменьшить требуемую пропускную способность канала связи лишь на 15...20% по сравнению с ее исходной величиной. Достоинством же таких методов сокращения избыточности является сохранение формы сигнала и, следовательно, объективных параметров качества.

Заметим, что и после устранения статистической избыточности скорость цифрового потока при передаче широкополосных ЗС и возможности человека по их слуховому восприятию отличаются на несколько порядков. Это свидетельствует о существенной психофизиологической избыточности первичных цифровых звуковых сигналов и возможности ее уменьшения.

Сокращение психофизиологической избыточности источника. Напомним, что уменьшение психофизиологической избыточности основано на учете особенностей слухового восприятия человека, и прежде всего — на частотной и временной маскировке, инерционности и делении на "критические полоски слуха". Так, в пределах каждой из 24 критических полосок слуха, образованных слуховым анализатором в диапазоне частот 20...20000 Гц, наибольшая по абсолютной величине спектральная составляющая маскирует рядом стоящие компоненты спектра, если ее уровень превышает некоторое пороговое значение, которое может быть найдено из кривых маскировки [101].

Большое значение имеет такое понятие как порог слышимости, ниже которого акустические сигналы не воспринимаются. Величина порога слышимости не постоянна, она согласуется со звуковыми событиями и зависит, во-первых, от частоты и, во- вторых, от уровня других сигналов, на фоне которых воспринимается данный звук. Например, вследствие маскировки громкий звук может сделать неслышимым тихое звучание. При этом значение имеют формы спектров ЗС, их уровни и временная последовательность. Важно и то, идет ли речь о тонах или звуках, имеющих широкополосные спектры. Достаточно полно исследовано, как изменяется (сдвигается) временно порог слышимости одного сигнала в присутствии другого, как тон и шум делают неслышимым звучание в соседних частотных полосах диапазона слышимых частот (см. кривые изменения относительного порога слышимости тона N, в присутствии узкополосного мешающего шума N, показанные на рис. 2.5 [101,76]), и как громкое звуковое событие маскирует восприятие более тихих звуков, которые начинаются  раньше, т.е. опережают сигнал высокого уровня на интервал времени 30...20 мс (явление предмаскировки), или позже, т.е, запаздывают по времени на 0...120 мс (явление послемаскировки). Если известно, какие доли (части) ЗС ухо воспринимает, а какие нет вследствие явления маскировки, то нужно вычленить и затем передать по каналу связи лишь те части сигнала, которые ухо способно воспринять, а неслышимые составляющие сигнала можно отбросить.

 

Кроме того, сигналы можно квантовать с возможно меньшим разрешением так, чтобы шумы квантования, изменяясь по величине с изменением уровня самого сигнала, еще не становились бы слышимыми. Учет всех этих свойств слуха и связанных с ним особенностей восприятия позволяет многократно сократить общее число бит, требуемое для цифрового представления 3C, т.е. сократить то количество информации, которое необходимо передать или запомнить, без потери качества звучания [23, 43, 76].

При согласовании шума квантования с характеристиками слуха изменяется форма сигнала и ухудшается объективное качество 3C, оставаясь субъективно незаметным на слух. Наиболее перспективным здесь является представление 3C в частотной области, которое обладает целым рядом достоинств, поскольку известно, что в начальной стадии процесса восприятия слуховой анализатор человека осуществляет некоторый спектральный анализ. Как отмечалось выше, сокращение избыточности посредством представления сигнала 3B в частотной области реализуется через кодирование формы спектра, обеспечивающее наибольшую эффективность сжатия (К может достигать 11 — 12 и более) и допускающее одновременное использование ряда методов сокращения статистической избыточности 3C. Рассмотрим более подробно вопросы кодирования 3C во временной и частот- ной областях.

Кодирование во временной области. Эта группа методов оперирует с отсчетами 3C во временной области и ориентирована на формирование кодов отсчетов, обеспечивающих  ошибок кодирования полезным 3C. Типичными представителями данной группы методов являются компандерные системы, позволяющие поддерживать отношение сигнал/шум кодирования на уровне 50...60 дБ, что обеспечивает маскировку шума кодирования. Наиболее распространенным в данном классе является метод кодирования %САМ (почти мгновенное компандирование), позволяющий передавать монофонический 3C со скоростью цифрового потока 323 кбит/с (см. например, [18, 22, 46, 76]).

Другим представителем методов кодирования во временной области является ДИКМ, позволяющая учитывать при кодировании статистические свойства 3C, связанные с корреляцией между отсчетами. При этом кодированию подлежат не сами отсчеты 3C, а разности между текущими отсчетами и их предсказанными значениями на основе использования предшествующих отсчетов. В вырожденном случае предсказание осуществляется по одному предшествующему отсчету.

Если разностный сигнал кодируется одним двоичным разрядом, то ДИКМ вырождается в дельта- модуляцию (ДМ). В реализационном плане ДМ является наиболее простым методом кодирования ЗС, так как не требует дорогостоящих многоразрядных АЦП и ЦАП. Однако для сохранения высокого качества при ДМ приходится устанавливать частоту дискретизации существенно выше номинального значения, принимаемого в ИКМ.

Существуют и другие методы кодирования сигналов во временной области, например, апертурные методы, методы векторного квантования и др. Однако они не находят применения в цифровых системах передачи ЗС, так как приводят к существенному усложнению аппаратуры без ощутимого повышения эффективности кодирования [3].

Таким образом, сжатие с сохранением объективного качества, возможное только при кодировании формы сигнала, характеризуется коэффициентом сжатия (компрессии) К = 2 — 5 (в зависимости от жанра фрагмента вещательного сигнала). К настоящему времени способ кодирования формы сигнала с целью снижения скорости цифрового потока, видимо, свои возможности практически исчерпал.

Кодирование в частотной области (спектральные методы кодирования). Наибольшей эффективностью при кодировании высококачественных цифровых вещательных сигналов обладают спектральные методы. В общем виде процедура кодирования в частотной области включает две операции: спектральный анализ ЗС и собственно кодирование спектра. Соответственно, процедура восстановления ЗС включает операции декодирования спектральных составляющих и синтеза сигнала во временной области по его спектру. При этом выделяют два основных метода спектрального анализа-синтеза ЗС.

Анализ-синтез гребенкой квадратурно- зеркальных полосовых фильтров. Спектр ЗС разделяется на полосы частот (т.е. исходный сигнал преобразуется в многоканальный полосный), в каждом полосовом канале осуществляется уменьшение частоты дискретизации до величины, равной удвоенной полосе пропускания соответствующего фильтра. Кодированию подвергаются последовательности отсчетов полосовых сигналов. Для синтеза исходного ЗС производится повышение частоты дискретизации полосовых

сигналов до исходной величины и их суммирование. В идеале полосы фильтров должны соответствовать критическим полоскам человеческого слуха.

Анализ-синтез с помощью ортогональных преобразований предполагает разбиение последовательности отсчетов 3C на блоки. Над каждым блоком выполняется дискретное ортогональное преобразование. Для синтеза исходного 3C достаточно выполнить обратное ортогональное преобразование. В общем случае блоки отсчетов перекрываются и в местах перекрытия сглаживаются функцией "временного окна". Применение окон позволяет компенсировать эффект Гиббса и формировать спектр 3C с наибольшей концентрацией энергии в тех частотных диапазонах, где фактически присутствует сигнал. Размерность преобразования определяется требуемой разрешающей способностью по частоте. С точки зрения концентрации энергии спектра сигнала и учета физиологических особенностей слуха предпочтительны- ми являются преобразования, базис которых образует гармонические сигналы: дискретные преобразования Фурье, косинусное и т. д [3, 43 и др.].

Возможен комбинированные метод анализа-синтеза, сочетающий разделение спектра 3C на полосы частот с помощью гребенки цифровых фильтров и тонкий спектральный анализ в каждой полосе с помощью ортогонального преобразования. В данном методе, варьируя длину блока ортогонального преобразования и ширину полос фильтров, можно добиться переменной разрешающей способности по частоте, что хорошо согласуется с особенностями обработки 3C в слуховой системе человека.

Процедура кодирования спектральных составляющих включает два этапа: распределение бит, выделенных на кодирование спектральных составляющих так, чтобы ошибки кодирования наилучшим образом маскировались полезным сигналом и преобразование кода спектральных составляющих. При этом максимальный эффект достигается, если квантование сигнала производится адаптивно в соответствии с максимальным уровнем 3C в субполосе. Методы кодирования, основанные на использовании спектрального анализа-синтеза с помощью полосовых фильтров, называют (под)полосным кодированием. Наиболее яркими представителями методов подполосного кодирования являются метод MUSICAM, использующий гребенку из 32 полосовых фильтров, и метод SB — ADPCM, использующий гребенку

из 8 фильтров и кодирование полосовых сигналов методом адаптивной ДИКМ.

Методы кодирования, использующие спектральный анализ- синтез с помощью ортогональных преобразований, называют кодированием с преобразованием. Типичными представителями этой группы являются адаптивное кодирование с дискретным ко- синусным и модифицированным дискретным косинусным преобразованиями — методы АТАС и ASPEC.

Перспективы компактного представления связывают с алгоритмами кодирования источника — MPEG-4 ААС и MPEG-4 CELP, разработанными для стандарта DRM и включающими средства повышения помехоустойчивости и технологию расщепления полосы спектра (SBR), что обеспечивает передачу почти полной звуковой полосы даже при очень низких скоростях передачи данных, характеризующих алгоритм кодирования.

Дополнительную информацию по процедуре кодирования источника читатель найдет ниже — в главах, посвященных изучению конкретных систем ЦРВ (разд. 4.3 и 5.5).

 

2.3. Особенности кодирования речевого сигнала

 

Речь и речевой сигнал. При использовании выделенных, чисто информационных, радиовещательных каналов (см. материал о системе DRM — гл. 5) целесообразна оптимизация основных параметров системы вещания с учетом преобладающего вида передаваемого сигнала — речевого. В силу существенно более "скромных" характеристик речевых сигналов (РС) по сравнению с широкополосными вещательными (прежде всего в части полосы частот, динамического диапазона и требований к верности передачи не только семантической, но и эмоциональной информации), оптимизация параметров информационных каналов может привести к заметному повышению их частотной эффективности.

Речь представляет собой колебания сложной формы, зависящей от произносимых слов, тембра голоса, интонации, пола и возраста говорящего. Спектр речи весьма широк (примерно от 50 до 10 000 Гц), но для постоянных каналов 3B, используемых в основ- ном для передачи речи или в качестве соединительных линий между студиями и КВ, СВ и ДВ радиовещательными передатчиками, ограничиваются полосой 5 или 7 кГц. Характеристики этих каналов изложены в Рекомендациях J.23 МККТТ и 503-4 МККР [27].

Ограничение полосы РС ухудшает восприятие ряда звуков (например, шипящих, существенная часть энергии которых сосредоточена в верхней части речевого спектра), но мало затрагивает разборчивость.

Под речевым сигналом понимают электрическое колебание, наблюдаемое на выходе акустоэлектрического преобразователя при воздействии на его вход акустического речевого колебания. Сообщение, передаваемое с помощью РС, является дискретным, т.е. может быть представлено в виде последовательности символов из конечного их числа. Символы, из которых составлен РС, называются фонемами. В каждом языке имеется присущее ему множество фонем, обычно от 30 до 50 (в русском языке большинство исследователей насчитывают 42 звука речи— 6 гласных и 36 согласных). Между буквами и фонемами одного и того же языка нет однозначной связи (буквы — это то, что мы читаем, фонемы — то, что произносим), поэтому число фонем и число букв неодинаково во всех языках.

Звуки речи делятся на звонкие и глухие. При формировании звонких звуков (их называют вокализованными) голосовые связки осуществляют квазипериодические колебательные движения, в результате чего создается прерывистый поток воздуха. Период повторения этого импульсного периодического процесса называют периодом основного тона (ОТ) голоса, а обратную величину—основного шпона. У мужчин среднее значение частоты ОТ составляет 120 Гц, а у женщин 220 Гц. Периодически повторяющиеся импульсы ОТ имеют дискретный спектр с большим числом (до 40) гармоник, частоты которых кратны частоте основного тона. Медленное изменение частоты ОТ при произнесении речи создает эмоциональную окраску и называется интонацией. У каждого человека свой диапазон изменения основного тона (как правило, немного более октавы) и своя интонация. Последняя имеет большое значение для узнаваемости говорящего.

При произнесении глухих звуков (их называют невокализованными) голосовые связки находятся в расслабленном состоянии и поток воздуха из легких свободно проходит в полость рта. Встречая на своем пути различные преграды в виде языка, зубов, губ, он образует завихрения (турбулентный шумовой поток), создающие широкополосный шум со сплошным спектром. Такой шум, возбуждая голосовой тракт, создает фрикативные и взрывные звуки. Последние формируются путем создания в голосовом тракте смычки с последующим внезапным высвобождением сжатого в области за смычкой воздуха.

Таким образом, при произнесении звуков речи через голосовой тракт проходит или тональный импульсный сигнал, или шумовой, или тот и другой вместе. Поскольку голосовой тракт представляет собой сложный акустический фильтр с рядом резонансов, создаваемых полостями рта, носа и носоглотки, равномерный тональный или шумовой спектр превращается в спектр с рядом максимумов (формант) и минимумов. Для каждой фонемы огибающая спектра имеет индивидуальную и вполне определенную форму. При произнесении речи спектр ее непрерывно изменяется и образуются формантные переходы.

Спектральная плотность мощности русской речи (рис. 2.6) характеризуется максимумом в окрестности частоты 400 Гц и спадом со скоростью приблизительно 9 дБ/от на частотах выше указанной. На этом рисунке приведены усредненные данные для мужского и женского голосов.

 

Речевой тракт с математической точки зрения можно описать системой дифференциальных и интегральных уравнений, используя методы математической физики. Однако часто составление и решение этих уравнений связано с непреодолимыми трудностями. В этих условиях прибегают к различного рода приближенным моделям формирования речи, достаточным для практических приложений.

Модель речеобразования, применяемая в системах кодирования с адаптивным предсказанием, рассмотрена ниже.

Речь с физической точки зрения состоит из последовательности звуков речи с паузами между их группами. Каждый звук является реализацией случайного процесса с определенными характеристиками. Гласные звуки речи имеют в среднем длительность около 200 мс, согласные — около 80 мс, а звук "п" — около 30 мс. Звуки речи неодинаково информативны: гласные звуки содержат малую информацию о смысле речи, а глухие согласные наиболее информативны (например, в слове "посылка" последовательность "о, ы, а" ничего не говорят, а "п, с, лк" дают почти однозначный ответ о смысле). Разборчивость речи снижается при действии шумов, в первую очередь из-за маскировки глухих звуков.

В системе речевой передачи в качестве получателя речевых сигналов выступает слуховая система человека — речевое колебание воздействует на органы слуха человека, вызывая определенные слуховые ощущения. Свойства слуха человека, используемые для оптимизации алгоритмов обработки речевых сигналов, а также для согласования технических средств их передачи с субъективными характеристиками восприятия: восприятие по частоте и критические полоски слуха; порог слышимости и уровень громкости; эффект маскировки и психофизическая избыточность; постоянная времени слуха.

Кодирование речи. Трудность создания кодеков, обеспечивающих минимально возможную скорость передачи для речевого источника, обусловлена рядом причин. Во-первых, речевой сигнал не является стационарным процессом. Законы изменения его вероятностных характеристик на участках произнесения гласных и согласных звуков существенно различаются, не говоря уже о паузах и смычках (участки звучания согласных типа "м", "н", "п" и т. п.), где характеристики могут изменяться почти скачком.

Вторая причина связана с определением (формализацией) критерия верности передачи, свойственным получателю. Действительный критерий восприятия, который характеризует качество слухового приема речевого сигнала человеком, отличается от распространенного критерия средней квадратическое ошибки или от какого-либо другого критерия, контролирующего отклонение "формы реализаций". Поэтому воспользоваться непосредственно результатами теории передачи информации для расчета качественных характеристик источника речевого сигнала затруднительно.

Однако, можно получить оценки минимально возможной скорости передачи из других соображений, используя физические свойства получателя и источника речевых акустических колебаний.

Ранее отмечалось, что человек может воспринимать смысловую информацию по слуховому каналу со сравнительно малой скоростью (порядка сотни бит/с). Известно также, что частота механических колебаний артикуляционных органов при произношении звуков речи по грубым оценкам не превышает нескольких десятков герц. Это позволяет предположить, что для прохождения "речевой информации" достаточно располагать пропускной способностью канала, не превышающей 100 бит/с. В то же время, наряду с требованием обеспечения высокой верности слухового приема сообщения, крайне важно сохранить при передаче и такие субъективные характеристики как узнаваемость, натуральность звучания, малую субъективную громкость фоновых шумов и т. л. Оценить количество информации, которое надо передать с учетом этих дополнительных требований, затруднительно.

Исторически сложились два направления кодирования речи: кодирование формы сигнала (КФС) и кодирование источника сигнала. Первый метод основан на использовании статистических характеристик РС и практически не зависит от механизма его формирования. Это означает, что при таком методе кодирования входной РС рассматривается как чисто аналоговый, а природа человеческой речи и ее восприятия в алгоритме кодирования практически не учитываются. Кодеры этого типа обеспечивают высокое качество передачи речи (хорошую разборчивость и натуральность речи), но отличаются меньшей по сравнению со вторым методом экономичностью, что является результатом достаточно высокого уровня не устраненной избыточности. Следствие этого — скорость цифрового потока редко бывает меньше 32 кбит/с. Поэтому для кодирования речи со скоростью передачи 16 кбит/с и меньше

 — прежде всего для цифровых систем сотовой связи, а в последние годы и для систем ЦРВ

— получили мощное развитие разнообразные методы кодирования источника.

Цифровое представление речевого сигнала основано на сохранении его формы в процессе дискретизации и квантования. В методе КФС используются три основных способа кодирования: ИКМ, ДИКМ и ДМ — как и при кодировании источников широкополосного ВС, где, однако, они не получили широкого распространения в силу низкой эффективности. При кодировании РС метод КФС весьма развит и применяется до настоящего времени. Приоритетом здесь пользуются дифференциальные методы кодирования, прежде всего — адаптивная АДИКМ.

В дифференциальных кодеках квантованию и передаче по цифровому каналу подвергается разность между текущим отсчетом PC x(k) и его предсказанным значением х-(k), т.е. ошибка предсказания z(k)=x(k) — х-(k). Определим предсказанное значение как

 

 

где а, и Р — коэффициенты и порядок предсказания, когда значение сигнала в k- тактовый момент определяется через его же значение в предыдущие (k — 1),..., (k — р) тактовые моменты.

Дисперсия разности z(k) существенно меньше дисперсии отсчета PC X(k). Следовательно, шум квантования при подаче на вход квантователя z(k) будет меньше, чем при непосредственном квантовании в обычной ИКМ. При одинаковом уровне шума число уровней квантования z(k) будет меньше, а длина двоичного кодового слова (число разрядов m) и необходимая скорость передачи К, (2.1) будут снижены.

Процедура предсказания может быть фиксированной и адаптивной. Фиксированное предсказание характеризуется постоянными параметрами предсказывающего фильтра

 

где b p и P — постоянные коэффициенты и порядок предсказания; z' — оператор задержки на i интервалов дискретизации. Адаптивное предсказание основано на слежении за изменением кратко- временной дисперсии PC и характеризуется адаптацией коэффициентов предсказателя a(k). В этом случае оценивается кратковременная корреляционная функция PC в предположении его локальной стационарности, а коэффициенты предсказания выбираются для минимизации среднего квадрата погрешности предсказания на коротком интервале времени.

Адаптивные методы кодирования речи позволяют существенно (в два и более раз) снизить цифровую скорость передачи. МККТТ рекомендует применять методы АДИКМ для передачи речи со скоростью 32 кбит/с — стандарт ITU-Т G 726.

Кодирование с адаптивным предсказанием. Как отмечалось ранее, при кодировании формы PC практически не учитываются свойства артикуляционного аппарата человека и особенности его слухового восприятия. В то же время именно здесь заключен значительный ресурс избыточности речевого сигнала. На использовании этого ресурса избыточности основывается широко распространенное параметрическое представление речевого сигнала, т.е. его описание как выходного отклика модели речеобразования. На первом этапе построения параметрического представления речевое колебание подвергается дискретизации и квантованию, а затем обрабатывается для получения параметров модели. Параметры модели разделяются на параметры возбуждения (относящиеся к источнику звуков речи) и параметры голосового тракта (относящиеся непосредственно к отдельным звукам речи).

Озвученная речь, представляющая большую трудность для сжатия, образуется с помощью голосовых связок человека. Скорость их периодических колебаний задает частоту основного тона— периодическую подпитку энергией голосового тракта человека, который представляет собой объемный резонатор. Голосовой тракт формирует спектральную окраску речи, или, другими словами, ее формантную структуру. Другое название голосового тракта — синтезирующий фильтр. Условно PC можно разделить на две составляющие, отвечающие за ОТ (возбуждение фильтра) и голосовой тракт (формантная структура сигнала). Соответственно, большинство на сегодня используемых алгоритмов, так или иначе, решают один вопрос — как наиболее эффективно выделить и сокращенно описать обе составляющие. А отрезки глухой речи при моделировании заменяют спектрально окрашенным шумом.

Как правило, кодеки источника строятся с использованием модели линейного предсказания, которая лежит в основе адаптивного кодирования с предсказанием. Характерной чертой кодеков источника (по сравнению с кодеками формы сигнала) является то, что они производят все операции анализа, кодирования, декодирования сразу для целого сегмента отсчетов.

Линейное предсказание (LPC) является одним из наиболее эффективных методов анализа речевого сигнала. Этот метод доминирует при оценке основных параметров PC, таких как период ОТ, форманты, спектр, позволяя точно и надежно оценить параметры линейной системы с переменными коэффициентами.

Основные положения метода линейного предсказания хорошо согласуются с моделью речеобразования (рис. 2.7), в соответствии с которой РС можно представить в виде сигнала на выходе линейной системы с переменными во времени параметрами, возбуждаемой квазипериодическими импульсами (в пределах вокализованного сегмента) или случайным шумом (на невокализованном сегменте). Метод анализа на основе линейного предсказания заключается в том, что очередная выборка РС с некоторой степенью точности предсказывается линейной комбинацией Р предшествующих выборок, а именно, k-я выборка РС x(k) может быть приблизительно предсказана путем суммирования с определенным весом некоторого числа предшествующих выборок сигнала (2.4) — в полном соответствии с тем, как это было при ДИКМ.

 

Разность между истинным x(k) и предсказанным х-(k) значениями выборки определяет ошибку (остаток) предсказания:

 

 

Анализ сигналов и расчет систем кодирования значительно облегчается при их описании в частотной области. Для этого сигналы и системы представляются в дискретном времени с использованием преобразования Фурье и z-преобразования [75]. Прямое z-преобразование последовательности x(k) определяется уравнением

 

а в результате г-преобразования разностного уравнения (2.6) имеем

 

 

 

Эта величина может интерпретироваться как выходной сигнал фильтра-анализатора, передаточная функция которого где z  соответствует задержке PC на одну выборку; P(z) — коэффициент передачи предсказывающего устройства — предиктора.

Амплитудно-частотная характеристика такого фильтра погрешности предсказания должна быть обратно АЧХ голосового тракта (следовательно, обратно и огибающей спектра входного сигнала), поэтому фильтр-анализатор A(z) называется инверсным. При подаче речевого сигнала на вход инверсного фильтра с оптимально подобранными параметрами его выходной сигнал будет представлять собой сигнал возбуждения R(z), подобный (с точностью до ошибок, определяемых конечностью порядка предсказания P и погрешностью оценки коэффициентов предсказания) сигналу возбуждения u(k) на входе фильтра голосового тракта на рис. 2.7. При этом на выходе инверсного фильтра остается только периодическая составляющая PC, соответствующая основному тону.

Из выражения (2.8) получают модель фильтра- синтеза тора

 

 

где H(z) = G / A(z) — передаточная функция синтезирующего фильтра, обратная передаточной характеристике фильтра- анализатора с точностью до скалярного коэффициента усиления G. Фильтр-анализатор и фильтр-синтезатор являются рекурсивными, поскольку значение сигнала на их выходах определяется лишь предшествующими выходными выборками PC.

Фильтр H(z) — это линейная система с переменными параметрами (фактически — модель фильтра голосового тракта), которая возбуждается импульсной последовательностью для вокализованных звуков и шумом для невокализованных (см. рис. 2.7). Такая модель имеет следующие параметры: классификатор вокализованных и невокализованных звуков, период основного тона для вокализованных сегментов, коэффициент усиления G и коэффициенты а цифрового фильтра. Все эти параметры, разумеется, медленно изменяются во времени.

Основная задача анализа на основе линейного предсказания заключается в непосредственном определении коэффициентов предсказания а по речевому сигналу с целью получения хороших оценок его спектральных характеристик путем использования уравнения (2.9). Вследствие изменения свойств РС во времени коэффициенты предсказания должны оцениваться на коротких сегментах речи и подбираться так, чтобы ошибка предсказания z(k) была минимальной. Обычно в качестве критерия используется минимум среднеквадратической ошибки. Для определения коэффициентов предсказания необходимо решать систему Р линейных уравнений с Р неизвестными коэффициентами.

Таким образом, кодирование речи на основе метода линей- ного предсказания заключается в том, что по линии связи передаются не параметры РС как такового, а параметры некоторого фильтра, в известном смысле эквивалентного голосовому тракту, и параметры сигнала возбуждения этого фильтра. В качестве такого фильтра используется линейного предсказания (ФЛП), названный ранее фильтром-анализатором с передаточной функцией A(z). При кодировании производится оценка параметров ФЛП и параметров сигнала возбуждения, а при декодировании сигнал возбуждения пропускается через фильтр-синтезатор, на выходе которого получается восстановленный сигнал речи. Варианты алгоритмов кодирования отличаются набором передаваемых параметров фильтра, методом формирования сигнала возбуждения и рядом других деталей, а процедура кодирования речи сводится к следующему (рис. 2.8):

- оцифрованный сигнал речи "нарезается" на сегменты длительностью 20 мс (160 выборок по 8 бит в каждом сегменте);

- для каждого сегмента оцениваются параметры ФЛП и параметры сигнала возбуждения; в качестве сигнала возбуждения в простейшем (по идее) случае может выступать остаток предсказания, получаемый при пропускании сегмента речи через фильтр A(z) с параметрами, полученными из оценки для данного сегмента;

 

 

- параметры фильтра и параметры сигнала возбуждения кодируются по определенному закону и передаются в канал связи.

Процедура декодирования речи заключается в пропускании принятого сигнала возбуждения через синтезирующий фильтр известной структуры, параметры которого переданы одновременно с сигналом возбуждения. При этом подчеркнем, что как анализирующий, так и синтезирующий фильтры являются цифровыми и процедуры кодирования и декодирования речи реализуются в соответствующих вычислителях (процессорах).

Приведенное описание процессов кодирования и декодирования речи не является исчерпывающим, оно объясняет лишь принцип действия кодека. Практические схемы заметно сложнее, и это связано в основном со следующими двумя моментами.

Во-первых, речевой сигнал обладает двумя видами внутренних корреляционных связей, кратковременной и долговременной избыточностью, поэтому в подавляющем большинстве современных речевых кодеков используется два предсказателя: кратковременный и долговременный. Первый предсказатель (STP), учитывающий кратковременную избыточность PC, связан с корреляциями между близко расположенными отсчетами сигнала и определяет огибающую спектра. Его порядок обычно бывает 6 — 10. Второй, долговременный, предсказатель (LTP) определяет тонкую структуру PC и связан с корреляцией двух отрезков сигнала между собой, реально — двух соседних периодов ОТ. Сочетание двух предсказателей с разными характеристиками позволяет в значительной мере устранить остаточную избыточность и приблизить остаток предсказания по своим статистическим характеристикам к белому шуму. При этом на приемную сторону передаются остаток предсказания и коэффициенты обоих (STP и LTP) предсказаний.

Во-вторых, использование остатка предсказания в качестве сигнала возбуждения оказывается недостаточно эффективным, так как требует для кодирования слишком большого числа бит. Поэтому практическое применение находят более экономичные (по загрузке канала связи, но отнюдь не по вычислительным затратам) методы формирования сигнала возбуждения.

В 1980 г. был предложен многоимпульсный метод возбуждения (MPE). Его основным преимуществом является то, что он определяет возбуждение для любого речевого сегмента и при этом не требуется предварительных знаний ни о локализованности данного сегмента, ни о периоде ОТ. Согласно этому методу, сигнал остатка линейного предсказания представляется в виде последовательности импульсов (обычно 8 импульсов на период ОТ) с неравномерно распределенными интервалами и с разными амплитудами, причем оптимизируются как положение, так и амплитуды импульсов. Амплитуды и положения импульсов определяются на покадровой основе. При этом используется процедура анализа через синтез (рис. 2.9).

Генератор возбуждения создает неравномерно распределенную последовательность импульсов Ч которая в качестве сигнала возбуждения поступает на вход синтезирующего фильтра, на выходе которого возникают синтезированные речевые выборки х'(k). Эти выборки сравниваются с соответствующими

 

 

 

речевыми выборками x(k) исходного речевого сигнала и находится ошибка предсказания z(k). В процессе кодирования каждого речевого сегмента (или кадра) для него находятся такие "наилучшие" положения импульсов в последовательности V< и их амплитуды, которые обеспечивают минимальную ошибку.

Метод "анализа через синтез" получил очень широкое распространение. Это обусловлено тем, что оптимальные значения для некоторых параметров, участвующих в синтезе речи, можно найти только методом перебора (внутри заданного заранее множества их значений). В упрощенном виде метод выглядит так:

- в составе речевого кодера присутствуют синтезирующие блоки декодера;

- последовательно перебираются возможные значения искомого параметра;

- для каждого значения с помощью блоков синтеза синтезируется речевой сигнал;

находится ошибка между синтезированным и исходным входным сигналом;

- в процессе перебора значений искомого параметра находится то значение, при котором получается минимальная ошибка;

- это значение и есть искомое значение параметра. При вычислении величины ошибки между синтезированной и исходной речью, как правило, используют не среднеквадратический критерий, а критерий, учитывающий особенности субъективного восприятия слушателем (эффект маскировки сигнала малого уровня сигналом большого уровня и т.д.). Для этого сигнал ошибки пропускают через взвешивающий фильтр W(z), который перестраивается одновременно с синтезирующим фильтром и перераспределяет энергию ошибки по частотному диапазону. Шум квантования распределяется так, чтобы большая часть его находилась в местах расположения формантных областей (максимумов ) РС, а меньшая — между областями. В этом случае в формантных областях произойдет маскировка шума речевым сигналом, в результате чего общая заметность шума уменьшится.

На рис. 2.9 пунктирной линией показана цепь управления, в задачи которой входит нахождение оптимального (по минимуму ошибки) расположения импульсов в возбуждающей последовательности. В результате при скоростях 16 и 9,6 кбит/с синтезированная речь соответствует по качеству сигналам ИКМ с мгновенным компандирование.

В 1984 г., как естественное развитие многоимпульсного метода возбуждения, было предложено так называемое векторное кодирование (VQ), когда кодируется одновременно группа параметров, характеризующих позиции импульсов и их амплитуды. В этом случае в качестве сигнала возбуждения используется последовательность отсчетов (" вектор" ), взятая из заданного набора этих последовательностей (т.е. из "кодовой книги векторов"). Входной вектор, представляющий собой образец входного РС, сравнивается с векторами, находящимися в кодовой книге, и находится вектор, наиболее близкий к входному. Каждому "вектору" из этой "книги" соответствует свой индекс (номер), который и передается по каналу связи на приемную сторону. На приемной стороне используется такая же кодовая книга, из которой по индексу извлекается требуемый вектор.

Кодовые книги бывают детерминированными и стохастическими. Детерминированные книги образуются посредством процесса "обучения", т.е. заполнения книги векторами, полученными из реальных РС. Обучение проводится на достаточно большой длительности (30...40 мин) на мужских и женских голосах. В отличие от детерминированных, стохастические книги не требуют обучения — они заполняются случайными гауссовскими последовательностями (отрезками белого шума с нулевым средним и единичной дисперсией). Размер кодовой книги вызывает значительное влияние на качество речи. Ввиду очень больших вычислительных затрат прямой перебор векторов для отыскания среди них оптимального оказывается очень часто не возможен, поэтому, как правило, прибегают к структурированию содержания книги (применение древовидного поиска и т.д.).

Векторное кодирование лежит в основе метода линейного предсказания с кодовым возбуждением (CELP), с разновидностью возбуждения векторной суммой (VSELP). В CELP- кодере наиболее подходящий вектор возбуждения выбирается из заранее составленной кодовой книги, содержащей обычно 2, N = 7 — 10, квази случайных векторов заданной длины с элементами, нормированными по амплитуде; амплитуда  возбуждения кодируется отдельно в соответствии с громкостью передаваемого элемента речи.

Схема передающей части CELP-кодера приведена на рис. 2.10 (кодек CELP- 4,8, стандарт США FS-1016). В таком кодере используются LPC-синтезатор (долговременный предиктор — LTP и кратковременный предиктор — STP), стохастическая кодовая книга и применяется процедура анализа через синтез (см. рис. 2.9).

 

 

Работа CELP-кодера заключается в следующем. Выход кодовой книги расчленяется на блоки по L отсчетов. Каждому блоку приписывается определенный индекс вектора возбуждения C- сигнал возбуждения U. Вектор С масштабируется посредством коэффициента усиления g,. Полученный сигнал возбуждения UД g фильтруется с помощью двух адаптивных фильтров предсказания 1/P(z) и 1/A(z), представляющих собой LPC-синтезатор. Яри этом фильтр 1/A(z) осуществляет формирование огибающей спектра PC, а фильтр 1/P(z) определяет период основного тона PC в диапазоне от 2 до 17,5 мс, что соответствует изменению частоты ОТ от 500 до 57 Гц. На выходе предикторов формируется синтезированный PC

 

 

При оценке разности между синтезированным х'(k) и оригинальным x(k) сигналом так же, как и при многоимпульсном возбуждении, используется взвешивающий фильтр W(z). Эта процедура повторяется со всеми сигналами возбуждения и таким образом определяется то возбуждение, которое создает минимальную ошибку z(k). Параметры возбуждения Ц, и о вместе с параметрами двух фильтров предсказания передаются на прием, составляя выходную информацию кодера. На приеме после декодирования эти сигналы используются для образования синтезированного PC.

Одним из основных узлов CELP-кодера является стохастическая кодовая книга — последовательность векторов возбуждения.

Выбор сигнала возбуждения О, из кодовой книги состоит из выбора оптимального индекса возбуждения С, и относящегося к нему такого усиления g, чтобы синтезированная речь в наибольшей степени соответствовала исходной (оригинальной) речи и приводила бы к минимизации взвешенного остатка предсказания.

Очевидно, чем изощренней алгоритм кодирования РС, тем сложнее его реализовать. Сложность, прежде всего, связана с вычислениями, необходимыми для воспроизведения процессов декодирования сигналов в реальном времени в абонентского устройства ЦРВ. Скорость обработки измеряется в миллионах инструкций в секунду (MIPS). Достижения в области создания цифровых сигнальных процессоров (DSP) и СБИС, обеспечивших резкое увеличение емкости элементов памяти, позволяют выполнять сложные алгоритмы кодирования речи даже в однокристальных микропроцессорах.

Подробности о кодировании речи можно узнать, в частности, в [30, 58, 75, 103].

 

2.4. Кодирование канала и перемещение символов

 

Введение. Высшее качество воспроизведения звуковой передачи в цифровой системе вещания достигается при условии, что принятый цифровой поток не отличается от переданного. Однако при передаче цифровых данных по каналу с шумом и, тем более, с замираниями, обусловленными многолучевым распространением, всегда существует вероятность того, что принятые данные будут содержать ошибки. Частота появления ошибок, при превышении которой принятые данные использовать нельзя, определяется свойствами слухового восприятия человека.

Снижение вероятности ошибок может быть достигнуто путем повышения требований к энергетическим характеристикам радиосистемы передачи — мощности радиопередатчиков, коэффициенту усиления антенн, шумовой температуре приемников. Однако далеко не всегда эти меры экономически оправданы и позволяют снизить вероятность ошибок до пренебрежимо величины. Поэтому приходится прибегать к внесению в цифровой канал искусственной избыточности для канального кодирования с исправлением ошибок (FEC coding), которое позволяет уменьшить вероятность ошибок до приемлемой. Кодирование канала (иначе — избыточное или помехоустойчивое кодирование), по существу, представляет собой метод обработки сигналов, предназначенный для увеличения надежности передачи информации по цифровым каналам.

Выбор типа корректирующего кода и его параметров зависит от требуемой достоверности приема, допустимой скорости передачи, вида ошибок в канале. Учитывается также, что в результате эффективного устранения избыточности в процессе кодирования источника, предшествующего кодированию канала, информационная ценность каждого передаваемого в канал бита резко возрастает. Приблизительное соотношение естественной избыточности источника звукового сигнала и искусственной избыточности, вносимой в канал кодером канала, иллюстрирует рис. 2.11.

 

Различные схемы кодирования очень непохожи друг на друга и основаны на различных математических теориях, однако всем им присущи два общих свойства [41]. Одно из них — использование избыточности. Избыточные символы используют для того, чтобы при воздействии помех сделать маловероятной потерю сообщением его индивидуальности из-за искажения достаточно большого числа символов. Второе свойство состоит в усреднении шума. Эффект усреднения достигается за счет того, что избыточные символы зависят от нескольких информационных.

Начало технике помехоустойчивого кодирования было положено оригинальной работой Шеннона (1948 г.), который, в частности, показал, что если пропускная способность канала связи больше требуемой скорости передачи информации, т.е. больше производительности источника информации, то при использовании соответствующего алгоритма помехоустойчивого кодирования для данного канала можно построить систему связи со сколь угодно малой вероятностью ошибки на выходе.

Правда, доказав существование необходимых помехоустойчивых кодов, Шеннон не указал методов их построения, и для решения этой задачи потребовались значительные усилия в течение нескольких десятков лет. Так, если первые блочные коды, позволявшие корректировать одиночные ошибки, были построены в 1949 и 1950 гг. (известными американскими учеными М. Дж. Голеем и Р. Хэммингом), то начало практического приме- нения методов помехоустойчивого кодирования в цифровых системах связи и вещания относится к концу 1970-х гг.[6].

Первые коды были разочаровывающее слабы по сравнению с тем, на что указывала теория Шеннона, однако их значение весьма велико, так как их создание дало толчок для огромного числа последующих работ в области теории кодирования — прежде всего в направлениях построения хороших кодов и удобных схем кодирования и декодирования. Назовем здесь основные, самые значительные результаты, нашедшие широкое применение в современных системах ЦРВ.

В 1955 г. (США — П. Элайес; СССР — Л.М. Финк и В.И. Шляпоберский) был предложен весьма важный класс сверточных (или рекуррентных) кодов, нашедший широкое применение в современной технике связи. Исследования, связанные с построением таких кодов и разработкой эффективных с вычислительной точки зрения алгоритмов их декодирования, заняли почти двадцать лет.

Весьма важный и обширный класс циклических кодов Боуза, Рой-Чоудхури (США, 1960 г.) и Хоквингема (Франция, 1959 г.), названный кодами БЧХ, позволяет корректировать многократные ошибки в принятой кодовой комбинации.

Значительным достижением в области теории кодирования явилась разработка в 1967 г. одним из крупнейших американских ученых А. Витерби весьма эффективного с вычислительной точки зрения алгоритма декодирования сверочных кодов по максимуму правдоподобия.

В 1980-х гг. появилось новое научное направление — синтез специально построенных сигналов — сигнально-кодовых конструкций (СКК). Методы модуляции, кодирования и оптимального приема СКК позволяют создавать системы связи, в которых возможна передача информации с качеством, приближающимся к потенциальному пределу, определяемому положениями теорий Котельникова и Шеннона. В 1982 г. в результате теоретических исследований американского ученого Г. Унгербоека была создана решетчатая кодовая модуляция (РКМ). Этот вид модуляции основывается на сочетании многопозиционных сигналов и помехоустойчивых кодов. Для оптимального приема сигналов РКМ используется метод правдоподобия, реализуемый в виде алгоритма Витерби.

Применение РКМ позволяет (при заданных скорости передачи сигналов и вероятности ошибочного приема) уменьшить необходимые энергетику линии и полосу частот. Этот вид модуляции находит широкое применение и в современных системах ЦРВ.

Кодирование канала, как правило, сопровождается двумя весьма простыми, но чрезвычайно эффективными процедурами- скремблированием индивидуальных цифровых потоков и перемещением символов. Скремблирование (рандомизация), предваряя кодирование канала, превращает цифровой сигнал в квазислучайный и тем самым приводит к более равномерному энергетическому спектру излучаемого радиосигнала. Кодеру канала в системах ЦРВ всегда сопутствует блок временного перемежения. Простое перемежение (перестановка во времени) символов, предложенное в 1960 г. академиком А.А. Харкевичем и профессором Э.Л. Блохом, позволяет декоррелировать ошибки в канале, т.е. преобразовать пакеты ошибок большой кратности в одиночные, сведя, в первом приближении, канал с памятью к ДСК. Такой метод декорреляции ошибок широко применяется в системах ЦРВ.

Ошибки и методы защиты от них в цифровом вещательном канале. Наличие помех в цифровом тракте передачи учитывается на входе приемника путем суммирования аддитивного случайного процесса n(t) с полезным сигналом. Наиболее распространено предположение о процессе n(t) как о нормальном белом шуме с нулевым средним значением и односторонней спектральной плотностью N, = kT, Вт/Гц (здесь k — постоянная Больцмана, Т — эквивалентная температура источника шума, К), так что при шумовой полосе приемника М мощность шума равна P = И,М. Поскольку имеется одновременно несколько источников шума, то их суммарный эффект учитывается через эффективную шумовую температуру системы.

Наряду с белым шумом цифровая радиосистема передачи может подвергаться воздействию кратковременных импульсных помех, взаимных помех между сигналами разных систем передачи, использующих один и тот же частотный диапазон, и, наконец, замираний, приводящих практически к пропаданиям сигнала. Последние наблюдаются в системе ЦРВ при приеме на подвижном объекте. Под воздействием помех возникают ошибки при передаче отдельных символов или кодовых слов (КС) цифрового сигнала, фазовые дрожания, проскальзывания, т.е. выпадения части сим- волов или кодовых слов. Все эти искажения, свойственные цифровой передаче, преобразуются на аналоговом выходе системы в искажения сигнала ЗВ, которые могут быть заметны на слух.

В спутниковых каналах (т.е. в системах НЦРВ с приемом на стационарную антенну) превалируют флуктуационные помехи, под действием которых в цифровом сигнале возникают ошибки, обусловленные трансформацией принимаемых символов. Поэтому за модель цифрового спутникового канала, как правило, принимают модель ДСК (см. разд. 2.1).

Одиночная ошибка в кодовом слове вызывает неправильное восстановление отсчета в декодере, т.е. искажение выходного аналогового сигнала, которое субъективно может восприниматься как щелчок. Величина искажения и громкость щелчка зависят от веса искаженного разряда КС, а громкость, кроме того, зависит от уровня и характера маскирующего сигнала. Не все одиночные ошибки заметны на слух. При попадании ошибки в младшие разряды КС щелчок не отмечается даже при отсутствии маскировки. В то же время ошибки в пяти-шести старших разрядах вызывают глубокие изменения уровня сигнала и проявляются в виде громких щелчков, сильно ухудшающих качество звукопередачи.

При расчете требуемой достоверности цифровой передачи сигналов ЗВ принято исходить из того, что при высококачественном звуковоспроизведении субъективно допустимо появление не более одного щелчка в час. Исходя из этого определяется величина долговременной максимально допустимой вероятности ошибок в канале передачи [18, 27, 79, 83]:

 

 

 

Естественно, что при Р, < (Р ) качество звукопередачи повышается (щелчки будут слышны реже), однако это требует весьма дорогостоящих решений по улучшению энергетических характеристик системы передачи.

Для устранения влияния ошибок на качество звукопередачи необходимо принимать специальные меры, которые состоят в обнаружении и последующем маскировании либо исправлении ошибок. При этом допустимые искажения цифрового сигнала достаточно трансформировать в искажения на аналоговом выходе, лежащие ниже порога чувствительности человеческого слуха. На основе этого принципа и реализуется маскирование — замена искаженного отсчета сигнала ЗВ другим отсчетом, минимально отличающимся от истинного. При этом инерционность слуха человека позволяет эффективно массировать ошибки, если их число не превышает одной -десяти в секунду, т.е. если интервал времени между смежными ошибками (интервал маскирования) отвечает условию Т, > 0,1...1,0 с [83].

Выбор способа обнаружения ошибок, методов маскирования и исправления зависит как от среднего значения вероятности ошибок, так и от законов их группирования (табл. 2.1).

 

 

Наиболее распространенными являются два способа маскирования: экстраполяция 1-го порядка, когда разница между двумя предшествовавшими безошибочными отсчетами добавляется к отсчету, который предшествует ошибочному, и интерполяция нулевого порядка, в соответствии с которой искаженный отсчет определяется как среднее арифметическое предыдущего и последующего отсчетов. В современных системах применяется также интерполяция 1-го порядка, когда для определения искаженного отсчета используются по два отсчета, предшествующих и последующих искаженному.

В гауссовских каналах с относительно низким числом ошибок, когда превалируют одиночные ошибки, для их обнаружения используют проверку на четность, т.е. (n,n-1) — код. Такая проверка осуществляется путем добавления в каждое КС одного проверочного символа (О или 1), определяемого как сумма информационных символов по модулю 2. В результате количество единиц в передаваемом в канал КС всегда будет четным. Однако ясно, что таким способом в декодере удается лишь установить сам факт ошибки, но не исправить ее. Таким способом нельзя также определить место пораженного разряда КС и установить наличие более одной ошибки (или нечетного их числа).

Обнаружение и тем более исправление ошибок возможно только при введении в цифровой сигнал определенной избыточности, причем исправление ошибок — задача гораздо более сложная, чем обнаружение, и поэтому требует существенно большей избыточности. Избыточное кодирование, основанное на применении специальных корректирующих кодов, реализуется путем добавления по определенному алгоритму в каждое КС (чаще — в группу КС) некоторого количества поверочных символов.

В системах ЦРВ помехоустойчивое кодирование реализуется в виде двух процедур — блочного (block coding) или сверточного кодирования (convolutional coding) и перемещения (interleaving).

Избыточное (помехоустойчивое) кодирование. Различают коды для обнаружения ошибок и коды для исправления обнаруженных ошибок, причем наиболее используемыми для этих целей являются двоичные коды. Основным показателем корректирующей способности кода является кодовое расстояние d, равное минимальному числу позиций, в которых кодовые комбинации отличаются друг от друга. Если в пределах блока кода при передаче появляется q ошибочных символов, то считают, что произошла ошибка кратности q.

В современных системах цифрового звукового вещания для обнаружения и исправления ошибок применяют либо блочные корректирующие (n ,k)-коды (часто это коды БЧХ или РС — Рида- Соломона), либо сверточные коды (СК). Определяющее различие между кодерами для кодов этих двух типов состоит в наличии или отсутствии памяти. Кодер для блочного кода отображает последовательности из k входных символов в последовательности из п выходных символов, причем всегда и > k. Каждый блок из п символов зависит только от соответствующего блока из k сим. волов и не зависит от других блоков, при этом блок состоит из двух частей: первая часть из k символов содержит передаваемую информацию, т.е. отсчеты звукового сигнала, а вторая состоит из r = n — k поверочных символов, вычисляемых путем суммирования по модулю 2 информационных символов. Отношение R = k / n называется скоростью кода, а  = 1 — R — характеризует его избыточность. На практике значение k достигает нескольких сотен, а R = 0,3...0,9.

Теорией кодирования установлено [41,67 и др.], что для обнаружения всех ошибок кратности q, необходимо использовать код с кодовым расстоянием d > q, + 1, а ошибки кратности q Д Могут быть исправлены кодом, у которого d > 2 q Д + 1. В то же время известно [67], что декодирование, при котором исправляются все комбинации из о„или меньшего числа ошибок и одновременно обнаруживаются все комбинации из q, или меньшего числа ошибок (при этом g, > q), возможно тогда и только тогда, когда минимальное кодовое расстояние кода равно: d = qД + q, + 1.

Заметим, что поскольку поверочные символы также подвергаются поражению помехами, то при использовании помехоустойчивого кодирования вводится вероятность Р„независимых ошибок в символах блока кода длины п, из которых только k информационных (вероятность поражения последних по-прежнему Р, ). Связь Р, и Р„для блоковых кодов устанавливается приближенным соотношением:

 

Как известно [67], для любых значений z и о существует двоичный код БЧХ длины п = 2' - 1, исправляющий все комбинации из о и меньшего числа ошибок и содержащий не более чем r = z q, поверочных символов; такой код характеризуется минимальным кодовым расстоянием d = 2qД + 1, причем кодовое расстояние можно увеличить до d = 2gД + 2, увеличив на единицу число поверочных символов, т.е. приняв r = zg Д + 1. Например, выбрав z = 6, потребуем исправления двух (q Д = 2) ошибок. В этом случае возможны два варианта кода: БЧХ (63,51,5), имеющий d = 5 и способный обнаруживать и исправлять двойные

ошибки, и БЧХ (63,50,6) с расстоянием б = 6, обнаруживающий тройные и исправляющий двойные ошибки.

Среди блоковых разделимых кодов наибольшее распространение получили систематические коды, у которых определены число и место расположения поверочных символов. К таким кодам относятся коды Хемминга и циклические. Первые используются в системах передачи сигналов ЗВ для защиты кодовых слов коэффициента масштаба при почти мгновенном компандировании, например, код (11,6) для исправления одиночных ошибок в форматах передачи звука С-МАС и D2-МАС [46,76]. Среди циклических кодов наибольшее распространение получили блоковые коды БЧХ, в частности, в упоминавшейся ранее системе НЦРВ DSR [45,113] применяется код БЧХ (63,44) с кодовой скоростью R = 0,7, способный исправлять трехкратные ошибки и обнаруживать ошибки кратности 4 с последующим маскированием (интерполяцией) кодовых слов, которые их содержат.

При q > 3 - 5 эффективность блоковых кодов заметно снижается, т.е. существенно возрастает требуемая при этом избыточность. Потому в современных системах ЦРВ, как правило, используются более эффективные сверточные коды, в которых обрабатывается непрерывная последовательность символов без деления ее на независимые блоки. СК — это линейный рекуррентный код. В общем случае он образуется следующим образом. В каждый тактовый момент времени на вход кодирующего устройства поступает m символов сообщения; п выходных символов формируются с помощью рекуррентного соотношения из К = т + q символов сообщения, среди которых m поступили в данный тактовый момент времени, а q — в предшествующие. Символы сообщения, из которых формируются выходные символы, хранятся в памяти кодера. Параметр К часто называют длиной кодового ограничения (ДКО) данного кода. Он играет ту же роль, что и длина блокового кода. СК характеризуются также скоростью В = m / n и свободным расстоянием d Д, аналогичным параметру d блочных кодов. Типичные значения параметров сверточных кодов: m, п =1 — 8, К =1/4 — 7/8, К=3-10.

Сверточный кодер с кодовым ограничением К представляет собой регистр сдвига с К ячейками, в котором символы кодовой последовательности формируются суммированием по модулю 2 символов с выходов некоторых ячеек. Коммутатор на выходе устанавливает очередность посылки кодовых символов в канал.

Регистр сдвига можно рассматривать либо как регистр, содержимое которого сдвигается на один разряд вправо при введении в него слева каждого нового двоичного символа (содержимое самого правого разряда при этом теряется), либо как цифровую линию задержки, в которой каждый элемент задержки хранит один двоичный символ до поступления нового символа.

Простой пример сверточного кодера со скоростью 1/2 и ДКО равным 3 (К=З) показан на рис. 2.12 [77]. Здесь отражена ситуация, когда на вход кодера поступают четыре двоичных символа 0 1 1 О. На его выходе появятся соответственно комбинации символов: 00, 11, 10, 10, т.е, для каждого входного символа на выходах двух сумматоров образуются два выходных. Они являются линейными функциями поступающего информационного символа и комбинации, записанной в первых двух разрядах Т и Т> регистра (логического состояния регистра).

Связь между ячейками регистра сдвига и сумматорами удобно описывать порождающими многочленами g(x), j = 1,...,n, называемыми также генераторными полиномами кодера СК. В рассматриваемом случае многочлен g(x) = 1+х описывает связи верхнего сумматора, а многочлен g(х) = 1+х+х — связи г нижнего сумматора. Степени растут слева направо, так что самая левая ячейка соответствует свободному члену. Ясно, что выбор генераторных полиномов тождествен заданию номеров отводов К- разрядного регистра сдвига. Записывая последовательность коэффициентов g в виде двоичных комбинаций, получим (х)= 1 0 1 и g(х)= 1 1 1. Для длинных кодов используют восьмеричную форму записи, когда многочлены представлены как g(X) = 5 и g>(x) = 7, либо сокращенно G = (5,7). Для пояснения процессов кодирования и декодирования СК часто используют решетчатую диаграмму (структуру). Такая диаграмма для кодера (рис. 2.12) изображена на рис. 2.13. На решетке состояния первых двух ячеек регистра сдвига показаны узлами, а переходы — соединяющими их линиями (ветвями, ребрами). Решетка состоит из 2 =4 узлов-состояний и из ветвей, исходящих из каждого узла. Число таких ветвей равно основанию кода. Четыре возможных состояния обозначены цифрами 00,01,10,11, заключенными в рамку. Решетчатая диаграмма дает наглядное представление всех разрешенных путей при кодировании. Каждой информационной последовательности на входе кодера соответствует единственный путь по решетке.

 

 

По приходе на кодер очередного информационного символа первые две ячейки регистра меняют свои состояния. Если приходящий символ 1, то возможный переход состояния показан пунктирной линией, а если 0 — то сплошной линией. После каждого перехода из одного состояния в другое происходит смещение на один шаг вправо. Цифрами внизу рисунка обозначены тактовые моменты прихода на кодер очередного символа. Выходные символы СК, порождаемые приходящим информационным символом, записываются над ветвями. Как и ранее, всякая входная последовательность соответствует некоторому пути на диаграмме, представляющей все разрешенные пути, по которым может продвигаться кодер при кодировании. Кодовая последовательность СК формируется путем считывания комбинаций над ветвями при прослеживании данного пути, например, входная последовательность 10110 формирует на выходе код 1101001010.

Из рис. 2.13 следует, что начиная с третьего такта структура диаграммы повторяется, и каждое из 4 возможных состояний регистра определяется только двумя предшествующими состояниями. Например, состояние 10 на третьем такте имеет два входных пути по кодовому дереву, соответствующих информационным символам 110 и 010. Эти пути разошлись в такте 0 и слились в такте 3. В общем случае структура диаграммы повторяется через К тактов, а пути сливаются через К-1 последовательно поступающих одинаковых информационных символов. Таким образом, важное значение решетчатого представления состоит в том, что с ростом числа входных символов число узлов (вершин)  не растет, а остается равным 4 (при К = 3). В результате этого, если в некоторой точке был выбран неверный путь, то позднее он может слиться с верным путем.

Корректирующая способность СК зависит от так называемого свободного расстояния dД, которое по существу содержит ту же информацию о коде, что и кодовое расстояние для блочных кодов. Оно определяется как минимальный вес (минимальное число единиц) пути на решетчатой диаграмме, начинающегося и заканчивающегося в нулевом узле, т.е. минимальному весу пути по диаграмме из состояния 00 в это же состояние. Так, для кода (1/2), К=3 имеем dД=5, поскольку самый короткий путь из состояния 00 к такому же состоянию требует последовательного прохождения трех ветвей 11, 01 и 11, содержащих в сумме 5 единиц. Свободное расстояние используется для оценки помехоустойчивости декодирования СК с применением алгоритмов максимального правдоподобия (в частности, алгоритма Витерби, см. разд. 2.7).

В табл. 2.2 приведены порождающие многочлены оптимальных СК с относительной скоростью передачи 1/2 и ДКО равным 3-8, а также значения свободных расстояний этих кодов [41].

Перемещение. Описанные выше коды эффективны в каналах с независимыми ошибками. Если возможно пакетирование (группирование) ошибок, то одним из основных методов повышения верности передачи дискретных сообщений в таких каналах (обычно это каналы с замираниями) является использование

 

перемещения символов и кодовых блоков во времени — в сочетании с кодом, исправляющим независимые ошибки. При таком подходе— фактически являющимся временным разнесением — последовательность на выходе кодера подвергается перемежению до передачи по каналу и восстанавливается в деперемежителя перед декодированием, так что на входе декодера ошибки распределяются более равномерно (рис. 2.14) [41]. Перемежение вносит задержку при передаче сигнала, но позволяет декоррелировать ошибки (разорвать между ними статистические связи) в канале, т.е. преобразовать пакеты ошибок большой кратности в одиночные.

Любой (n ,k) — код, исправляющий о ошибок, дополненный процедурой перемежения символов, способен исправлять пакеты из )о ошибок. Такой (jn, jk) — код образуется одновременным использованием j одинаковых (n, k)-кодеров с чередованием их выходных символов.

Использование перемежения — одна из характерных особенностей сотовой связи и современных систем ЦРВ. Это является следствием неизбежных глубоких замираний сигнала в условиях многолучевого распространения, которое практически всегда имеет место, особенно в условиях плотной городской застройки. При этом группа следующих один за другим символов, попадающих на интервал замирания (провала) сигнала, с большой вероятностью оказывается ошибочной. Если же перед выдачей информационной последовательности в радиоканал она подвергается процедуре перемежения, а на приемном конце восстанавливается прежний порядок следования символов, то пакеты ошибок с большой вероятностью рассыпаются на одиночные ошибки.

Известны диагональная, блочная, сверточная и другие схемы перемежения и их модификации. Устройства перемежения могут быть периодическими и псевдослучайными [41]. Первые из них предпочтительнее из-за простоты, однако вторые имеют преимущество в каналах, где характеристики группообразования ошибок меняются во времени. Структуры устройств перемежения являются внешними по отношению к устройствам кодирования и декодирования.

В периодическом устройстве перемежения перестановка символов является периодической функцией времени. Рассмотрим далее наиболее простое блоковое (В,N)-устройство перемещения, символы на вход которого поступают блоками и устройство осуществляет одну и ту же перестановку каждого блока символов. При этом кодовые символы записываются в столбцы матрицы, состоящей из N строк и В столбцов (рис. 2.15). Перестановка состоит в том, что для передачи по каналу символы считываются из матрицы по строкам.

В устройстве восстановления осуществляется обратная операция: символы записываются по строкам, а считываются — по столбцам. Следовательно, если, к примеру, входная последовательность имела вида  выходная будет такой, что такие устройства легко реализуются.

 

 

Характеристики блокового перемежения можно найти в монографии [41]; здесь ограничимся лишь сведениями о том, что любой пакет ошибок длиной Ь < В переходит на выходе деперемежителя в одиночные ошибки, каждые две из разделены не менее чем N символами, а задержка устройства составляет 2NB символов (в дополнение к задержке в канале) и каждое из устройств требует наличия памяти емкостью NB символов.

В типичных случаях параметры устройства перемежения выбирают такими, чтобы длина b всех ожидаемых пакетов ошибок не превышала В, а параметр N был больше длины блока (n) при блоковых кодах, а для СК — больше ДКО. При этом каждый пакет ошибок длиной b < В приведет не более чем к одной ошибке в каждом блоке кода.

Итак, в канале с замираниями и эффективным перемежением характеристики декодирования мало отличаются от характеристик в канале с постоянными параметрами и независимыми ошибками, т.е. ДСК. При этом важно выявить зависимость между допустимой остаточной вероятностью ошибок и глубиной перемежения, т.е. размерами матрицы. Эта зависимость позволит найти характеристики устройств перемежения, исходя из необходимой надежности связи и заданных параметров радиоканала (отношение сигнал/шум, глубина и скорость замираний). Аналитическое решение этой задачи наталкивается на определенные трудности, вызванные сложностью или отсутствием математических моделей, связывающих характеристики группирования ошибок с параметрами радиоканала. Более приемлемый путь

 — имитационное моделирование радиоканала с заданными параметрами с целью получения потока ошибок, имеющего все необходимые свойства. После деперемежения и статистической обработки этого потока возможно оценить остаточную вероятность ошибок.

Декодер помехоустойчивого кода не исправляет ошибки, кратность q которых превышает некоторую величину d, зависящую от кодового расстояния применяемого кода. Поэтому остаточная вероятность ошибки есть не что иное как вероятность P(N, d) того, что число ошибок q превысит величину d в блоке кода длиной N. Для заданных параметров кода легко определить экспериментальную вероятность (частоту) P(N, d), разбивая поток ошибок с выхода деперемежителя на блоки заданной длины. Меняя матрицу перемежения, можно проследить взаимосвязь глубины перемежения и остаточной вероятности ошибок в каналах с различными характеристиками. Для реализации этой идеи было проведено моделирование радиоканала с экспоненциально- коррелированными райсовскими замираниями. Использовались сигнал ОФМ-2, оптимальный некогерентный алгоритм приема и блоковое перемежение с матрицей Nx B [61].

На рис. 2.16 приведены типичные для райсовского канала (см. также разд. 3.5) зависимости P*( N, d) = F(d) при различном числе столбцов матрицы перемежения В. Для сравнения здесь же построена та же зависимость для ДСК при той же средней вероятности ошибок р, рассчитанная по формуле

 

Зависимости типа изображенных на рис. 2.16, построенные для различных значений параметров радиоканала и ширины окна анализа, позволяют по известной исправляющей способности и длине блока кода определить остаточную вероятность ошибки на выходе декодера при заданной глубине перемежения. В результате расчет помехоустойчивости канала с замираниями обогащается данными о степени декорреляции группирующихся ошибок, что характеризует степень приближения такого канала к модели ДСК.

Метод кодирования канала с перемежением символов наиболее эффективен при мобильном приеме с быстрыми замираниями, приводящими к относительно коротким пакетам ошибок. В то же время, чтобы сохранить выигрыш от применения кодирования в каналах с очень медленными замираниями, необходим очень большой объем цифровой памяти, встроенной в приемник. Поэтому в последнем случае необходима иная стратегия борьбы с длинными пакетами ошибок и так называемыми выпадениями цифрового сигнала. В частности, могут быть использованы методы пакетов ошибок, изложенные в работах [2, 9, 10, 85].