Критерии надежности современного дата-центра

Posted on Posted in Статьи

По прогнозам аналитиков IDC, потребление ресурсов центров обработки данных в течение трех лет вырастет почти на 750%.

В связи с этим, количество дата-центров продолжает расти, а для обеспечения конкурентных преимуществ, требования к их надежности становятся все выше. В дата-центре, как и на любом комплексном объекте, качественное управление – один из важнейших способов борьбы за экономическую и производственную эффективность.WJL

Персоналу необходимо непрерывно контролировать работу ЦОДов и сопровождающих его инженерных и ИТ-систем в режиме реального времени, что зачастую — затруднительно и неудобно. Но без постоянного контроля за состоянием оборудования (как вычислительных мощностей дата-центра, так и обеспечивающих его работу вспомогательных систем) сложно обнаружить возникновение аварий в дата-центре, их причины и принять меры для скорейшего устранения.

Так, например, в ходе исследования Ponemon Institute, в котором было опрошено 450 работников ЦОД, выяснили, что полный выход ЦОД из строя случается в среднем 5 раз за 4 года (т.е. 167.5мин в год), а частичные перебои в работе ЦОД происходили почти 14 раз за 4 года. Получается, что средняя стоимость простоя ЦОД составляет около $5 600, а для телекоммуникационных копаний превышает $11 000 за одну минуту простоя.

Современные дата-центры нуждаются в комплексном решении, позволяющем анализировать, визуализировать и преобразовывать их данные. Но требуемый уровень надежности невозможно обеспечить только за счет построения ЦОД из качественных элементов. Наличие автоматизированной системы мониторинга ЦОД рекомендовано для каждого уровня его эксплуатационной стабильности и обязательно для достижения надежности выше 99,984% (согласно исследованиям The Uptime Institute и стандарта ANSI-TIA-942/2005).

Необходимо выбрать такую систему мониторинга, которая позволит не только фиксировать нештатные ситуации и оперативно оповещать о них, а даст возможность проактивного наблюдения и аналитики, позволяющей предотвращать инциденты.

По словам Сергея Авдаляна, руководителя отдела офисных решений службы ИТ «Соник Дуо», в ЦОД необходимы слаженная работа большого количества систем, быстрота и высокое качество диагностики отказов, которые могут возникать в пассивном и активном сетевом оборудовании и программном обеспечении, в частности в результате влияния человеческого фактора.

Снимок экрана 2015-12-18 в 12.18.21В реальной интегрированной системе управления инфраструктурой ЦОД приходится анализировать более 200 источников данных и 150 управляющих воздействий, включая контроль распределенных сетей передачи данных, мониторинг кондиционеров и активного сетевого оборудования. Самостоятельно обрабатывать все эти информационные потоки не предоставляется возможности, поэтому очень важно использовать надежную систему мониторинга для своевременного выявления причин отказа в работе.

Одна из ключевых особенностей мониторинга дата-центра – необходимость сочетания нескольких программных решений для обхвата всех критически важных систем — от контроля уровня температуры и влажности в помещении до систем контроля и управления доступом. Эти системы оснащены отдельными решениями для мониторинга, что значительно усложняет процесс централизованного управления, и увеличивает вероятность не заметить проблему.

SAYMON решает эту проблему за счет создания комплексного решения для мониторинга всех инженерных систем на единой программной платформе, что позволит сократить операционные расходы ЦОДа в несколько раза. Решение дает возможность контролировать и моделировать границы допускаемых показателей, выявляя при этом потенциальные проблемы систем, что в результате может поспособствовать быстрому её устранению. Также с помощью нашей системы мониторинга клиенты могут GraphicsWidgets2получать полную информационную поддержку даже к арендуемым серверам.

Современные дата-центры, имеющие различные системы мониторинга, не всегда могут предоставить своим клиентам доступ к ним. SAYMON способен не только объединить различные системы мониторинга в одну, но и выдать полную информацию клиентам  ЦОДа о параметрах работы арендуемых мощностей: доступ к состоянию оборудования и информационных систем, к характеристикам сетевых ресурсов, потребляемой мощности и температуре в помещении. Все это может в значительной степени повысить «прозрачность» центров обработки данных и увеличить их ценность для клиентов.

 

Основные функции SAYMON:

  1. Сбор данных о состоянии инженерной системы

Мониторинг инженерной инфраструктуры ЦОД состоит из набора датчиков, сенсоров и других устройств, круглосуточно контролирующих и осуществляющих сбор первичной информации. Они отслеживают:

  • электроснабжение;
  • кондиционирование;
  • климатические условия в серверных шкафах и помещения ЦОД;
  • контроль доступа.
  1. Обработка и хранение данных

Все собранные данные о состоянии подсистем обрабатываются и консолидируются на сервере мониторинга. Программно-аппаратный комплекс системы производит анализ данных и выводит полученный результат в удобном и наглядном виде. Информация формируется в виде сообщений и архивируется в хранилище для возможности просмотра динамики событий в любое время.

  1. Визуализация текущего состояния и оповещение об аварийных ситуациях

Система мониторинга постоянно контролирует состояния инженерной инфраструктуры и динамику её изменений. Администратор в режиме реального времени может изменять детализацию визуализированных объектов, наблюдая при этом за схематическим изображением ЦОДа со всеми параметрами, привязанными к конкретным узлам. В случае возникновения аварийной ситуации администратору сразу же приходит оповещение.

DeviceAlert2

Система мониторинга решает такие задачи, как:

  • Контроль над инженерным оборудованием в режиме реального времени при помощи схем, графиков и таблиц;
  • Электронные уведомления, автоматически формируемые системой, при угрозе критических и иных ошибок;
  • Визуализация информации, передаваемой от технического оборудования в одно единое информационное пространство;
  • Накопление и хранение всей информации о событиях, происходящих в технических процессах;
  • Обеспечение повышенной безопасности и надежности функционирующего оборудования инженерных систем.

Таким образом, можно сделать вывод о том, что мониторинг является неотъемлемым элементом дата-центра в целом и отдельных его систем в частности, так как без него нельзя говорить о высокой надёжности ЦОДа. Современный центр обработки данных может гарантировать непрерывность предоставления услуг и обеспечение возможности самостоятельно контролировать стабильность и безаварийность работы клиентам, используя неограниченные возможности системы мониторинга.