Смирнов Николай, itex_spb@cards.lanck.net, тел (812) 393-46-53
Директор филиала ООО "АЙТЕКС-М" в Санкт-Петербурге
Современную организацию невозможно представить без электронных данных. И чем крупнее фирма, тем сильнее ее функционирование зависит от компьютерной техники. Документы и бухгалтерия, счета клиентов и организаций, рекламная информация, почта, программы, файлы с графическими и аудио/видео данными, корпоративные базы данных и т.д., - все находится на дисках серверов локальных сетей или дисках мэйнфреймов.
Можно даже сравнить, что информация - это кровь, которая течет по жилам корпорации и поддерживает ее жизнедеятельность.
В настоящее время, практически все организации сталкиваются с проблемой критического нарастания объемов информации. Рост данных ставит перед техническим персоналом любой компании задачу построения современной системы хранения данных. По данным исследования, проведенного компанией Meta Group (Стэмфорд, шт. Коннектикут), объем информации, аккумулируемой компаниями, удваивается каждые 18 месяцев. Конечно, такие показатели пока более актуальны для зарубежных компаний, но и в российских фирмах идет процесс увеличения объемов полезной информации. Тем более, что сейчас в России быстрыми темпами развиваются такие сферы деятельности, как электронная коммерция, планирование ресурсов предприятия (ERP) и управление взаимоотношениями с потребителями (customer relationship management - CRM).
Исторически сложилось так, что на каждом предприятии собрался целый комплекс различных автоматизированных систем, каждая из которых так или иначе решает те задачи, для которых она предназначена. Ни для кого не секрет, что обмениваться данными все эти системы могут с большим трудом, а то и вообще требуется новый ввод данных для каждой конкретной системы. Поэтому, возникает заинтересованность пользователей в концентрации информации, чтобы применять ее на различных системных платформах. При этом, совместное использование информации предполагает консолидацию корпоративного аппаратного обеспечения. Преобладающие в корпоративных информационных системах приложения баз данных только усиливают потребность в связях между различными платформами. Концепцию "большого мешка" успешно применяют многие компании. Проведенный Business Research Group опрос 300 специалистов показал, что две трети респондентов рассматривают возможность объединения устройств хранения данных в единую подсистему, допускающую совместное использование данных.
Как это ни удивительно, большинство компаний пока относятся к вопросу создания структуры хранения данных не слишком серьезно. "Пока что большинство компаний действуют импульсивно. Осознавая рост объема информации, они просто увеличивают число серверов и расширяют объем дискового пространства. Лишь немногие подходят к проблеме стратегически", - говорит Джефф Хайн, руководитель подразделения профессионального обслуживания компании Berkshire Computer Products (Хопкинтон, шт. Массачусетс). Причем такой поход наблюдается как в зарубежных, так и в российских компаниях.
Можно долго обсуждать успехи технического прогресса, однако в словосочетании "информационные технологии" второе понятие всегда подчинено первому, а информация стоила, и будет стоить дороже средств ее обработки, передачи и хранения. Плата за поддержку неизбежно увеличивающихся объемов данных составляет сегодня, по данным IDC, 50% всех расходов на ИТ-решения. И все это для того, чтобы избежать еще более высоких расходов, связанных с потерями доступа к хранилищам информации и измеряемых от 20 тыс. до 6 млн. долл. в час в зависимости от приложения. Эта сумма складывается из стоимости снижения продуктивности служащих из-за сбоя в системе, стоимости работы, которая не может быть выполнена, пока система не восстановлена, стоимости ремонта вышедших из строя элементов системы. Поэтому при реализации критически важных для предприятия приложений стоит учесть, что цена простоев из-за сбоев системы вполне оправдывает вложение немалых средств в установку отказоустойчивых архитектур. Десять лет назад, когда сервер локальной сети на базе процессора Intel выходил из строя, неприятности компании ограничивались возмущением пользователей по поводу отсутствия доступа к электронной почте. Теперь же при выходе из строя приложений, от которых напрямую зависит прибыль, и при потере доступа к ценной информации компания терпит убытки.
В Соединенных Штатах, где зависимость от компьютеров выше, чем в России, поскольку техника и программы используются более широко, убытки от сбоев систем составляют до 4 млрд. долларов в год (по данным FIND/SVP). Как правило, остановка американской фирмы на срок до 8 дней ведет к снижению до 3-4% годового оборота компании, а из простоя в 10 дней способны выкарабкаться немногие компании. Полная же потеря корпоративной информации грозит компании крахом.
Одной из основных проблем построения дисковой подсистемы хранения данных, во все времена остается задача обеспечения их продолжительного функционирования. Решение этой задачи имеет три составляющих: надежность, доступность (готовность) и удобство обслуживания. Все эти три составляющих предполагают, в первую очередь, борьбу с неисправностями системы, порождаемыми отказами и сбоями в ее работе.
Дисковая подсистема хранения данных имеет в своем составе накопители на жестких магнитных дисках. Как любой технически сложный продукт, накопители на жестких дисках подвержены выходу из строя по внешним и внутренним причинам. К внешним относятся - механические, электрические, плохие условия эксплуатации. Внутренние причины делятся на два типа. Первые, "фатальные" - выгорание микросхем управления, выход из строя контактов, внутренние разрушения компонентов. Вторые проявляются в виде постепенного ухудшения функциональных показателей диска, выхода характеристик за пределы рабочего диапазона.
Повышение надежности системы основано на принципе предотвращения неисправностей, путем снижения интенсивности отказов и сбоев, за счет применения электронных схем и компонентов с высокой и сверхвысокой степенью интеграции, снижения уровня помех, облегченных режимов работы схем, обеспечения тепловых режимов их работы, а также за счет совершенствования методов сборки аппаратуры. Единицей измерения надежности является среднее время наработки на отказ (MTBF - Mean Time Between Failure).
В 1987 году трое специалистов из университета Беркли опубликовали статью с описанием методов повышения надежности путем использования массивов небольших (3.5- и 5.25-дюймовых) дисководов, которые могут достичь показателей производительности, характерных для одного большого дорогого диска (Single Large Expensive Disk - SLED) в мэйнфреймах. Эта технология получила название RAID - Redundant Array of Inexpensive Disks (избыточный массив недорогих дисков). Но позже, расшифровка аббревиатуры RAID претерпела изменение - теперь она означает Redundant Array of Independent Disks (избыточный массив независимых дисков). Дисковый массив RAID - это консолидированная серверная система для хранения данных большого объема. В массивах RAID значительное число дисков относительно малой емкости используется для хранения крупных объемов данных, а также для обеспечения более высокой надежности и избыточности. Подобный массив воспринимается компьютером как единое логическое устройство.
Повышение готовности предполагает предотвращение влияния отказов и сбоев на работу системы хранения данных с помощью средств контроля и коррекции ошибок, а также средств автоматического восстановления рабочего процесса после проявления неисправности. Ключевым моментом здесь является обеспечение защитной избыточности на базе как аппаратного, так и программного обеспечения. Это позволяет сохранить текущее состояние данных или продолжить выполнение процесса до замены вышедших из строя компонентов на исправные.
Отказоустойчивая система хранения данных должна обеспечивать переключение на альтернативное устройство в случае сбоя, а также информировать администратора о любых изменениях конфигурации, так чтобы он мог восстановить вышедшие из строя компоненты прежде, чем перестанут работать их дубликаты. Для этого система должна посылать сообщения на консоль администратора, регистрировать на диске все ошибки для периодического просмотра, а также иметь возможность отправить внешнее сообщение, в случае если сбой произошел в отсутствие администратора на своем рабочем месте.
Повышение готовности - есть способ борьбы за снижение времени простоя системы. Единицей измерения здесь является коэффициент готовности, который определяет вероятность пребывания системы в работоспособном состоянии в любой произвольный момент времени. Статистически коэффициент готовности определяется как MTBF/(MTBF+MTTR), где MTTR (Mean Time To Repair) - среднее время восстановления (ремонта), т.е. среднее время между моментом обнаружения неисправности и моментом возврата системы к полноценному функционированию.
Необходимо сказать несколько слов о пользе применения резервного копирования. Конечно, обеспечение резервного копирования данных увеличивает стоимость системы хранения данных, но нужно помнить, что резервные копии - это своего рода "спасательный круг", способный пригодиться в самых разных ситуациях (например пожар, наводнение, террористический акт, и т.п.). Поэтому, возможен разумный компромисс между суммарной стоимостью систем резервного копирования и убытками, которые может понести фирма в случае потери данных.
Понятно, что чисто техническими решениями невозможно полностью предотвратить возможные потери данных. Необходимы также организационные меры, предупреждающие потерю информации. Во-первых, необходимо обеспечить безопасность доступа к информации, во-вторых, разработать технологию резервного копирования и восстановления, и, наконец, определить место хранения резервных носителей.
При соблюдении всех этих мероприятий, потери информации сводятся к минимуму, и, если даже, по каким-то причинам происходят потери - обеспечивается быстрое восстановление данных с максимально возможной достоверностью.
Думается, что о необходимости применения дисковых подсистем хранения данных было сказано уже достаточно. Поэтому, более полезным представляется сформулировать список общих вопросов, которые следует учитывать, при выборе определенной системы хранения данных:
В настоящее время на рынке представлено достаточно большое количество дисковых подсистем хранения данных различных производителей, отличающихся по своим возможностям и характеристикам. В качестве примера можно рассмотреть систему TETRAGON фирмы COMPAREX (Германия), производителем которой является фирма HITACHI (Япония). Дисковые системы TETRAGON являются лидером на мировом рынке по техническим характеристикам и надежности, на самом деле гарантируют 100%-ную доступность данных (по данным Gartner Group). Организация Raid Advisory Board по своей классификации дисковых массивов, с точки зрения пользователей по защищенности данных, присвоила семейству COMPAREX TETRAGON максимальный класс DTDS+ (Disaster Tolerant Disk System, или удаленное "зеркало") - обеспечивающий сохранность данных даже при полном отказе или физическом разрушении одной из систем, а также доступ к данным при отказе любой единичной компоненты и сохранность данных при сбоях питания и других воздействиях окружающей среды.
Дисковые подсистемы хранения данных COMPAREX TETRAGON T2000/T2100 имеют следующие технические характеристики:
Кроме этого имеется еще одна шина, используемая только для целей управления с пропускной способностью 100 MB/s. Для модели T2100 пропускная способность каждой из двух внутренних шин 240 MB/s, а шин управления по 135 MB/s (их также 2 шт.).
Для обмена данных между серверами и системой TETRAGON, в ней имеются канальные процессоры, которые представляют из себя мощные RISС - процессоры. В модели TETRAGON 2000 таких процессоров может быть до 4, а в модели T2100 - до 8 шт. Каждый из канальных процессоров имеет по 4 физических пути для перепосылки данных.
Объем энергонезависимой кэш-памяти может составлять до 8GB (модель Т2000) и до 16GB (T2100).
Построение системы предоставляет полную независимость от марок вычислительного оборудования, с которым предполагается совместная работа. Не требуется установки дополнительного программного обеспечения - достаточно только средств операционной системы.
- Возможности выполнять все модификации оборудования, не прерывая работы пользователя.
- Использованием технологии RAID-5
- Наличию динамических запасных дисков, которые используются автоматически в случае отказов основных дисков. В маловероятном случае сбоя диска, его содержание автоматически восстанавливается на запасном дисководе, а после установки исправного переписывается обратно. Даже при интенсивной работе пользователей вся эта операция займет не более 2 часов. Пользователь может иметь до 8 запасных дисков
- Отсутствию в системе не продублированных элементов и модулей.
В данной статье рассмотрены вопросы необходимости построения систем хранения информации в крупных организациях. А также описаны наиболее предпочтительные, с нашей точки зрения, технологии и продукты, которые обеспечивают с технической стороны максимально возможную надежность и доступность данных.
А с экономической стороны позволяют сохранить вложенные инвестиции, за счет больших возможностей масштабируемости.