Как устроена система мониторинга холодоснабжения нашего дата центра

Наши коллеги из дата-центра NORD-4 компании Даталайн, в котором находится наше оборудование, рассказали о том, как устроена система мониторинга холодоснабжения в дата центре.

Для проекта NORD-4 была выбрана водно-гликолевая система охлаждения. На схеме выше она обозначена желто-синими линиями. Поскольку холодоносителем в системе является жидкость, крайне важно следить за:

  • температурой;
  • влажностью и протечками;
  • давлением в контуре;
  • работой чиллеров, насосов и прочего оборудования.

Все кондиционеры и чиллеры подключены к общей системе мониторинга. Сотрудники дата-центра следят за показателями каждого устройства.

Дашборд с параметрами.

В системе мониторинга также отображается статус работы оборудования: отключен, штатная работа, авария, ведется ремонт.

Зеленым цветом обозначены штатно работающие чиллеры, белым – отключенные. Если что-то пошло не так, индикатор загорается красным цветом.

Датчики температуры

Параметр-фронтмен в системе мониторинга – это температура в холодных коридорах машинных залов. Средняя температура в залах колеблется в пределах от 23 до 27 Сº. При такой температуре оборудование еще не греется, но уже не покрывается инеем :). Этот параметр прописан в SLA, и за его несоблюдение придется платить штраф заказчику. От него и отталкиваются сотрудники дата-центра, настраивая всю систему холодоснабжения в дата-центре.

Стабильность температуры в залах – это не дискретный параметр, а процесс, который обеспечивается оборудованием системы холодоснабжения.

Температура в машинном зале на дашборде системы мониторинга. Показатели температуры отражают расположение датчиков в зале.

Во всех холодных коридорах разместили по три температурных датчика. Как показывает практика, трех штук вполне достаточно, и вот почему:

  • Если возникнут проблемы с холодоснабжением в целом, специалисты увидят изменения температуры на всех датчиках. Частные же изменения в рамках одной стойки говорят о проблемах в установке оборудования или локальной неисправности стойки, а не о проблемах в системе холодоснабжения.
  • По желанию заказчика есть возможность установить на его стойки отдельный набор датчиков, которые обеспечат максимальный контроль, но это, скорее, исключение.

В горячих коридорах установлено по одному датчику. Их показания несут исключительно информационный характер.

В двух словах, используйте датчики рационально и без паранойи. Избыточное количество датчиков создает «шум» на панели наблюдения и не дает инженерам сосредоточиться.

Температурный датчик, установленный на стойке.

Температура жидкости. Вода охлаждается по следующей схеме. Чиллер охлаждает гликоль, который поступает в теплообменник. За счет холодного гликоля в теплообменнике теплая вода охлаждается. После того, как вода и гликоль «обменялись» температурами, вода идет в кондиционеры в залах, а гликоль возвращается в чиллер.

Взаимодействие наружного и внутреннего контуров в чиллерной схеме.

В первую очередь, для системы важна температура воды, которая поступает в кондиционеры. Она должна стабильно держаться на заданном уровне. Для нашей системы это 18 Сº.

Для регулировки температуры используется трехходовой клапан (ТХК). Он регулирует объем воды, выходящей из теплообменника. Если температура повышается, клапан открывается сильнее и подает больше воды в теплообменник. Текущий процент открытия ТХК выводится в интерфейс системы мониторинга.

Осталось разобраться с мониторингом температуры гликоля и воды в самих контурах. Температура отслеживается на всей протяжённости трубопровода, датчики размещаются так:

  • на входе и выходе чиллера;
  • на входе и выходе теплообменника;
  • на входе и выходе из кондиционера.

Температура «за бортом». Этот показатель не касается дата-центра напрямую, но он также важен в мониторинге. На каждой локации установлена независимая метеостанция, считывающая температуру, влажность и скорость ветра. Эти данные показывают, как работает система кондиционирования в реальных погодных условиях на конкретном объекте. Поскольку в Москве годовой перепад может составлять от –35 Сº до +35Сº, мы обязаны следить за погодой и заранее готовиться к ее причудам.

Так выглядит установленная на объекте независимая метеостанция.

К примеру, каждым летним вечером дежурный инженер получает прогноз погоды из трех источников. Если ожидается температура выше 30 Сº, ответственные специалисты получают sms-рассылку с призывом быть бдительнее.

Данные температуры и влажности с метеостанции в дата-центре на дашборде системы мониторинга.

В целом же мониторинг не имеет сезонного деления, в отличие от оборудования, которое нужно готовить к зиме/лету.

Другие датчики

Датчики протечек. В каждом машинном зале NORD-4 установлено по 14 кондиционеров Stulz. Они оснащены заводскими датчиками протечек, но для мониторинга их недостаточно. В местах задвижек, стыков труб, на теплообменнике, под кондиционерами и в других критичных узлах мы установили независимую сеть датчиков. Данные от них собираются и поступают в общую систему.

Весь четвертый этаж дата-центра выделен под систему кондиционирования: там находятся теплообменники, насосы, баки. Датчики протечек не ставятся под каждой единицей охлаждающего оборудования, так как в полу сделана «разуклонка». Если образуется протечка, вода уйдет по сливам в накопительные емкости. Перед каждой сливной воронкой стоят датчики протечек. Иными словами, мониторится не устройство, а зона, откуда может потечь вода.

 Так на дашборд выводятся сработавшие датчики протечек.

Давление жидкости. Помимо температуры и влажности, отслеживаетя давление жидкости в охлаждающем контуре. Поскольку система замкнута, падение давления может означать разгерметизацию – читай, протечку. Резкое падение – это уже серьёзная проблема, предусмотренная в аварийной инструкции.

Мониторинг давления осуществляется в разных точках на всех этажах дата-центра. Показатель нормы для давления слегка плавающий: это страхует систему от ложных срабатываний из-за перепада высот.

Сложности в построении системы мониторинга

На первый взгляд кажется, что пуск системы мониторинга – линейный процесс: установили датчики, объединили их в сеть, усадили людей за пульт и забили в систему пороговые значения. Но в случае с NORD-4 были нюансы: залы заполняются постепенно, и никто не знает заранее, что за оборудование и на каких стойках будет размещено.

Запуская систему мониторинга, были выставлены пороговые значения, руководствуясь проектным решением. Так, показатель WATER OUT (вода, которая поступает в кондиционеры в залах) должен составлять стабильные 18 Сº. Исходя из этого вычисляем остальные значения и создаем таблицу «идеальных» параметров.

По мере заполнения ЦОДа контрольная панель может начать выдавать ложные предупреждения. Это крайне опасно, так как внимание специалиста рассеивается, и он может пропустить настоящую проблему. Это называется «перемониторингом»: на новом оборудовании показатели могут слегка плавать внутри пороговых значений, создавая варнинги.

Поэтому тонкая настройка происходит в процессе работы. Все изменения пороговых значений и параметров мониторинга сначала согласуются с техническим директором и руководителем эксплуатации, и только после этого заносятся в систему.

Ссылка на оригинал статьи: https://habrahabr.ru/company/dataline/blog/338966/

Как облако для бизнеса ускорит ваши сервисы?Как облако для бизнеса ускорит ваши сервисы?

Чтобы сдержать влияние кризиса и сократить затраты на ИТ-инфраструктуру, компании все чаще выбирают миграцию в публичное облако для бизнеса своих основных ИТ-приложений, например 1С.  Мы обновили свою инфраструктуру в облаке именно с учетом работы тяжелых приложений, таких как 1С Предприятие,  и нашего предыдущего опыта работы с данными клиентов и оценке их производительности в облаке. И вот к каким выводам пришли:

13 июня, 2020
Выпущен релиз Ubuntu 20.04 LTS. Что нового?Выпущен релиз Ubuntu 20.04 LTS. Что нового?

Выпущен новый релиз Ubuntu версии 20.04 с кодовым названием Focal Fossa и разработчики позиционируют Ubuntu 20.04 как важное и успешное обновление с поддержкой в течение следующих 5 лет. Что нового в данном релизе и как обновиться с предыдущих версий?  

24 апреля, 2020
Обновления в облаке - АпрельОбновления в облаке - Апрель

Обновили шаблоны операционных систем для быстрых серверов, уже содержат последние обновления безопасности. Добавили оптимизированные шаблоны для запуска 1С Битрикс, улучшили производительность битрикс до 195 пунктов. 

20 апреля, 2020