© ЕПОС. Публикации"
Публикация предоставлена Электронным библиотечным фондом "Наука и Техника"
Юрий РУДАКОВ, начальник отдела сетевых технологий компании "ЕПОС"
Сеть любой компании или организации создается для обеспечения пользователей простым доступом к информации, приложениям и сетевым сервисам. Однако и производительность и доходы компании могут значительно пострадать, когда сервер, работающий с одним или более бизнес-приложениями, становится недоступным. Потери от простоев, по различным источникам, для средней компании составляют от единиц до десятков тысяч долларов в минуту. Решения, позволяющие уменьшить время простоя, мы рассмотрим для сетей NetWare компании Novell, поскольку именно эти сети наиболее распространены в Украине.
Под отказоустойчивостью обычно понимается способность вычислительной системы выполнять возложенные на нее функции в случае отказа или сбоя некоторых ее компонентов. Средство достижения отказоустойчивости аппаратная и программная избыточность. Известно, что для обеспечения отказоустойчивости серверов в них используются многопроцессорные платы, память с коррекцией единичных ошибок, жесткие диски, объединенные в RAID-массивы, резервные сетевые платы, дублирование источников питания, избыточность вентиляции, средства контроля температуры и других жизненно важных параметров. В современных серверных решениях предусматривается "горячая замена" большинства избыточных компонентов при выходе из строя одного из них. В конструкциях корпусов предусматривается модульная архитектура, способствующая уменьшению времени ремонта. Все эти технологические ухищрения в итоге направлены на уменьшение времени простоев сети.
Более высокой степенью отказоустойчивости обладает хорошо известное решение Novell, в котором избыточность оборудования создается не только на уровне избыточности компонентов серверов, но и на уровне самих серверов, под названием System Fault Tolerance level 3 или SFT III.
В такой системе (рис. 1) предусматривается два идентичных сервера, синхронизация работы которых обеспечивается специальными программно-аппаратными средствами.
Рис. 1. System Fault Tolerance level 3
Один из серверов является первичным, а другой вторичным. В сети оба сервера выглядят как единое целое. В случае отказа первичного сервера, его зеркальная копия вторичный сервер подхватывает все запущенные процессы практически мгновенно, так что пользователи не замечают случившегося. Вторичный сервер в такой системе, работающей в штатном режиме, непосредственного участия в обслуживании сетевых запросов не принимает и не увеличивает производительность сети. Это, а также жесткие требования к дополнительному оборудованию и программному обеспечению (ПО) подсистемы, обеспечивающей зеркальность серверов, делают такое решение достаточно дорогим. Такое решение оправдывает себя, когда к доступности серверов предъявляются повышенные требования. Требования к полной идентичности серверов ограничивают возможности по реализации системы SFT III на практике. Если у вас есть сервер, который проработал года два, то непросто будет найти на рынке точно такой же. В тех случаях, когда не требуется мгновенного переключения на зеркальный сервер, целесообразно использовать другое решение для сетей NetWare Novell Standby Server.
Novell Standby Server является программным решением для зеркалирования данных между серверами и создания системы с полным резервированием для защиты сети от сбоев оборудования и ПО. Novell Standby Server для NetWare/intraNetWare, разработанный компанией Vinca Corporation, увеличивает возможности Novell по предоставлению клиентам широкого выбора при внедрении сетевых решений повышенной надежности.
За счет зеркалирования серверов Standby Server обеспечивает избыточность системы и позволяет в любой момент произвести переключение на резервный сервер в случае отказа оборудования или ПО основного сервера. Это позволяет снизить время простоя сети и обеспечить постоянную работу пользователей с критичными для бизнеса приложениями.
Novell Standby Server дает возможность использовать для зеркалируемой пары серверов любую комбинацию аппаратных средств, сертифицированных для работы с NetWare (рис. 2).
Рис. 2. Novell Standby Server
Зеркалирование информации осуществляется по выделенному соединению между серверами при помощи двух дополнительных сетевых карт. Поддержание идентичности данных серверов основано не на копировании файлов, а на зеркальной обработке транзакций.
Когда первичный сервер отказывает, то пользователи, у которых установлены 32-битные клиенты от Novell или Microsoft, испытывают небольшую паузу, пока идет процесс активизации Standby Server. Пользователи, у которых установлены более старые клиенты, должны повторно зарегистрироваться на сервере с тем же именем и паролем.
Standby Server можно сконфигурировать в режиме One-to-Many, когда первичный сервер может зеркалироваться на локальный и удаленный сервер одновременно. Удаленный сервер подключается к первичному серверу, используя технологию WAN-сетей. Существует также версия Many-to-One, которая позволяет нескольким первичным серверам защищать свои данные на одном Standby-сервере. На основе технологии Standby Server разработано надежное средство резервного копирования Novell SnapShot Server для NetWare/intraNetWare. При его помощи можно производить резервное копирование данных в течение рабочего дня без снижения производительности системы. SnapShot Server это NLM модуль, который поставляется с каждым Standby Server Many-to-One.
В рассмотренном решении резервный сервер большую часть времени используется в пассивном режиме, как хранилище зеркальных данных. Это снижает эффективность использования оборудования. Проблема загрузки резервного сервера решена в последнем продукте Novell, вышедшем в конце 1998 года: Novell High Availability Server (NHAS).
NHAS позволяет использовать оборудование архитектуры Intel в составе двух серверов и подключенного к ним разделяемого дискового массива. Спаривая два независимых сервера в конфигурации Active/Active, NHAS позволяет каждому NetWare серверу монтировать данные другого сервера, если происходит отказ одного из серверов в кластере. Мониторинг серверов производится посредством обычного сетевого соединения, дискового канала, и/или выделенного соединения, при помощи дополнительных сетевых карт. Когда один из серверов не отвечает на запросы, начинается процесс восстановления (failover). Клиентские и серверные приложения, которые были запущены на отказавшем сервере, могут быть настроены на автоматический перезапуск на уцелевшем сервере.
NHAS осуществляет поддержку для томов, виртуальных IP и IP адресов основных бизнес-приложений, таких как Oracle®, web-серверы и других, автоматически перемещая их из отказавшего сервера на уцелевший. Также NHAS производит динамическое перераспределение пользовательских лицензий, автоматически добавляя пользовательские лицензии и права на уцелевший сервер из отказавшего сервера. Когда отказавший сервер будет восстановлен, то пользовательские лицензии и права будут возвращены на него.
NHAS также поможет вам избежать запланированных остановок сети, позволяя остановить работающий сервер для модернизации или профилактики, в то время как оставшийся сервер будет обеспечивать беспрепятственный доступ пользователей к сетевым ресурсам. Производительность приложений, при использовании NHAS, будет выше, так как рабочая нагрузка распределяется между двумя серверами. Типовая конфигурация этого решения показана на рис. 3.
Рис. 3. NHAS
NHAS поддерживает централизацию быстро растущих ресурсов данных, их гарантированную доставку и сохранение на недорогих устройствах массовой памяти. Это достигается потому, что NHAS использует стандартные RAID-устройства, наращивание емкости которых производится очень просто. Плюс к этому, вы можете использовать второй сервер как работающую платформу, чтобы получить все преимущества от ваших инвестиций.
Системные требования:
Например, дисковая подсистема Compaq Proliant Fiber Channel с одним хост-адаптером в каждом сервере или IBM 3518 Shared SCSI дисковая подсистема.
Возможно использовать и другие дисковые подсистемы:
В сетевой лаборатории "ЕПОС" был успешно испытан комплект оборудования для кластерных решений фирмы AMI при совместной работе с NHAS. В состав комплекта входит два трехканальных RAID-контроллера, внешний дисковый массив и два сервера Expert S 152B на основе серверной платформы Intel. Инсталляция NHAS на NetWare 4.11 не вызвала каких-либо затруднений ни в плане конфигурации оборудования, ни при подключении драйверов контроллеров.