Какой персонал обеспечивает непрерывную работу дата-центра
Кто и как обеспечивает работу ЦОД
Современный ЦОД обычно представляется нам как несколько больших помещений, под завязку заполненных серверами, системами хранения данных и коммутационным оборудованием. Однако дата-центр — это еще и люди, от опыта, компетенций и скорости реакции которых напрямую зависит операционная устойчивость дата-центра. Какие специалисты обеспечивают жизнедеятельность центров обработки данных и какие задачи решают на своих местах — в этой статье.
Одной из самых частых причин простоя ЦОД называют человеческий фактор. Случайная ошибка может лишить доступа к данным десятков тысяч пользователей, остановить работу компании и нанести ей огромный материальный и репутационный ущерб. Поэтому так важно, чтобы в ЦОД было достаточное количество персонала и каждый сотрудник находился на своем месте: имел необходимые для работы знания и релевантный опыт.
О роли человеческого фактора мы писали в статье: «Почему человеческий фактор приводит к сбоям в работе ЦОД и как этого избежать».
Кто обеспечивает работу дата-центра
В современном ЦОД можно выделить шесть категорий персонала:
- Инженеры IT-подразделения – отвечают за логику ЦОД: выполнение процессов и обмен данными.
- Механики – отвечают за работу вычислительного оборудования (железа).
- Электрики – контролируют работу электросетей, оперативно восстанавливают электроснабжение в случае его отключения или провала напряжения.
- Инженеры узкой специализации – обслуживают кондиционеры, источники бесперебойного питания, генераторы и другое специфическое оборудование, которое участвует в жизнеобеспечении ЦОД.
- Менеджеры – сдаю дата-центр в аренду.
- Вспомогательный персонал – техники, уборщики помещений и т. п.
Отдельно стоит сказать о тех, кто занимается инженерными системами. Это могут быть и штатные сотрудники, и привлеченные со стороны. Например, что делать, если срочно нужен ремонт ИБП? Это простое оборудование с точки зрения эксплуатации, но сложное, когда речь заходит о его ремонте (за исключением, пожалуй, модульных систем бесперебойного обеспечения). И иногда проще иметь в штате человека, который разбирается в ИБП и может в случае аварии найти ее причину и заказать необходимые комплектующие.
Но также эту функцию могут выполнять подрядчики. Крайне редко такие организации обслуживают инженерные системы ЦОД в комплексе — чаще всего у них есть специализация.
Другая история с электриками: без опытного специалиста не обойтись ни одному дата-центру. Даже если у ЦОД нет свой подстанции, в пределах досягаемости должен быть опытный электрик, который будет решать проблемы с непрерывной подачей электроэнергии и контролировать ее качество. Отдавать эту задачу на сторону не только невыгодно, но и потенциально опасно для ЦОД.
От профессиональной подготовки электрика зависит стабильная работа ЦОД
Требования к инженерному составу ЦОД
Наличие тех или иных компетенций у инженерного состава очень важно для работы ЦОД. Так как обслуживать приходится сложные интеллектуальные системы и дорогое оборудование, цена ошибки слишком высока. Основные требования, которые выдвигают к инженерам IT-подразделения, — наличие системного мышления и способность находить причины логических ошибок в работе дата-центра. Еще один важный скилл – умение работать в команде и взаимодействовать с другими квалифицированными сотрудниками.
Так как решения о жизнеобеспечении ЦОД часто принимают коллективно, а отдельные его системы взаимозависимы (ни одна из них не работает изолированно от остальных), требуется определенная гибкость в подходах к устранению проблем и как минимум наличие координационной службы.
Принципиально придерживаться единого подхода при восстановлении инфраструктуры после сбоя или при выполнении рискованных операций. Например, когда отказоустойчивость систем снижается во время планового техобслуживания или модернизации дата-центра.
Кадровый состав ЦОД часто формируется на этапе его строительства. Чем более простыми и надежными станут инфраструктурные решения, тем меньше работа дата-центра будет зависеть от квалификации персонала и будет более устойчивой к возможным ошибкам персонала.
Общие требования к персоналу ЦОД
Несмотря на обилие разноплановых специальностей, требующихся для поддержания работы дата-центра, часть требований к специалистам будет общей. Ниже перечислены некоторые из них.
- Разбираться (хотя бы поверхностно) в смежных областях знаний и системах. Например, для электрика большим плюсом будет знание принципов работы и основ ремонта ИБП. А менеджерам по продажам услуг будет легче презентовать их клиенту, владея знаниями о работе ЦОД в целом.
- Соблюдать внутренний регламент дата-центра. Каждый новый сотрудник должен подписать документ, где указаны общие правила работы на территории ЦОД. Это позволяет предотвратить часть инцидентов, которые могут привести к авариям и остановке работы. На самом деле, менеджер, не знакомый с внутренним распорядком, может причинить такой же вред, как и некомпетентный электрик.
- Соблюдать правила работы с электрическими системами. Это требование справедливо и для инженеров, и для уборщиков помещений. Последние должны иметь удостоверение по электробезопасности, чтобы работать в щитовых.
ЦОД – живой организм, в его жизнедеятельности тесно взаимосвязана работа железа, ПО и высококвалифицированных специалистов. Если возникают сбои в аппаратной и программной части, именно от человека или группы людей будет зависеть, как быстро ЦОД восстановится и заработает в штатном режиме. Потому важно тщательно отбирать специалистов на любую должность: от главного инженера до электрика.