Метрики оценки энергоэффективности ЦОД: PUE,RCI, RTI и другие
Какие метрики используют для оценки эффективности ЦОД
Какие метрики используют для оценки эффективности ЦОД
Энергоэффективность в тренде: коммерческие дата-центры переходят на «зеленые» технологии, чтобы потреблять больше электроэнергии из альтернативных возобновляемых источников. Но энергоэффективность сама по себе не дает полной картины и не позволяет комплексно оценивать ЦОД. Разбираемся, по каким еще метрикам можно делать выводы об эффективности центра обработки данных.
По мере роста мирового рынка ЦОД – в 2018 году он достиг $210 млрд – появилась потребность в четких и прозрачных критериях оценки работы дата-центров. Значительную часть метрик разработали в The GreenGrid – объединении ИТ-специалистов и компаний, занимающихся вопросами энергоснабжения и охлаждения дата-центров, а также проблемами информационной экосистемы.
Первую систему показателей эффективности ЦОД в The Green Grid предложили еще в 2007 году, но самые популярные критерии давали однобокое представление о ЦОД. За последние несколько лет ситуация немного улучшилась, но по-прежнему есть над чем работать: там, где дата-центр оценивают по одному критерию (о нем мы расскажем в первую очередь), часто упускают возможности для повышения общей производительности и эффективности.
В 2016 году The Green Grid разработала и опубликовала глобальный стандарт коэффициента PUE для оценки энергоэффективности дата-центров. Хотя PUE использовали и раньше, отраслевым стандартом он стал недавно.
PUE – эффективность использования электроэнергии
PUE (Power Usage Effectiveness) – показывает, насколько эффективно ЦОД использует энергию, которую получают его потребители. Коэффициент PUE регулярно включают в свои расчеты крупнейшие владельцы центров обработки данных, такие как Microsoft и Google.
PUE показывает отношение суммарной мощности ЦОД к суммарной мощности полного набора ИТ-оборудования: серверов, систем хранения данных, коммутаторов и других сетевых устройств.
Многие операторы используют PUE как единственный показатель эффективности ЦОД, но это неправильно. Часто они не учитывают климатические условия региона, в котором расположен объект, а также не знают о том, что у PUE нет практического смысла, когда ИТ-оборудование работает не на полную мощность. Чуть реже встречается ситуация, когда оборудование, которое питается из электросети ЦОД, параллельно используется сторонними потребителями.
При идеальной организации ЦОД PUE не превышает значения 1,25, а в оптимальном случае находится в пределах 1,25–1,43 единицы. Операторы, которые не предпринимают меры для повышения энергоэффективности, в расчетах получают более 2,5 единицы.
DCiE (Data Center Infrastructure Efficiency) – величина, обратная PUE. Она определяет отношение мощности ИТ-оборудования к общей мощности оборудования. DCiE еще называют коэффициентом эффективности инфраструктуры дата-центра.
Большинство участников рынка ЦОД заинтересованы в снижении PUE и ради этого воплощают в жизнь самые разные, иногда фантастические идеи. Компания Google построила ЦОД на берегу Финского залива и теперь использует его ледяные воды в системе охлаждения. В Великобритании и Дании массово используют ветрогенераторы как альтернативные источники энергии. А в Рейкьявике эффективному охлаждению способствуют сразу два фактора: в меру холодный климат с незначительными перепадами температуры и доступная геотермальная энергия. Есть и другие способы снизить PUE: например, в Стокгольме в рамках проекта Stockholm Data Parks продают избыточное тепло.
RCI – индекс охлаждения стойки
При проектировании центра обработки данных важно учесть особенности окружающей физической среды, от которой зависит надежная работа ИТ-оборудования. Слишком высокая температура на входе критична для серверов и систем хранения данных. В ASHRAE (Американском обществе инженеров по отоплению, охлаждению и кондиционированию воздуха) подсчитали, что ЦОД с чрезмерным охлаждением тратят деньги впустую, а с недостаточным охлаждением – подвергают ИТ-оборудование рискам, связанным с перегревом.
Это способствовало появлению нового стандарта, который ограничивает допустимые значения температуры – RCI (Rack Cooling Index), или индекс охлаждения стойки. Эта метрика разделяется на два критерия оценки: RCI (HI) и RCI (LO). Если RCI (HI) достигает 100 %, значит, температура на входе не превышает допустимый максимум, если RCI (LO) равен 100 % – температура не превышает рекомендуемый минимум. Если оба параметра по 100 %, получается абсолютное соответствие, когда температура на входе не превышает рекомендованный диапазон. При разработке метрики RCI учитывались рекомендации ASHRAE и требования NEBS – отраслевого стандарта для телекоммуникационной отрасли.
RCI может стать ключевым элементом в разработке стратегии оптимизации затрат на электроэнергию в центрах обработки данных. Задача этой метрики – помочь операторам ЦОД понять и сбалансировать требования к надежности оборудования и стоимости охлаждения.
RTI – индекс температуры возврата
Эта метрика напрямую связана с RCI, но решает и дополнительные задачи: помогает оценить эффективность системы охлаждения в пределах всего ЦОД. RTI (Return Temperature Index) сложнее и требует больше вводных данных для расчетов, но дает более полное представление о работе системы циркуляции воздуха.
В большинстве дата-центров воздух вначале охлаждается и потом через воздухозаборники подается к передней части серверных стоек. Горячий воздух, в свою очередь, принудительно отводится через заднюю часть стоек и заново отправляется в систему охлаждения, где его температура снова снижается. Этот процесс цикличен.
Но также есть другой воздух, который не принимает участия в охлаждении ИТ-оборудования. Он появляется, если охлажденный воздух подается под слишком высоким давлением, в горячих коридорах переизбыток перфорации или есть негерметичные отверстия там, где кабель проходит через напольное покрытие. Проблема в том, что этот «неучтенный» воздух тоже тратит ресурсы охлаждения.
Метрика RTI определяет количество полезного воздуха, участвующего в рециркуляции, – вначале охлаждает оборудование, а затем в горячем виде возвращается в систему охлаждения. Если RTI равен 100 %, значит, весь воздух, который контактирует с ИТ-оборудованием, используется для его охлаждения. На практике достичь такого показателя невозможно, но операторы ЦОД могут приблизить фактическое значение RTI к идеальному.
Дополнительные метрики оценки энергоэффективности
Деятельность The Green Grid направлена на разработку общих стандартов в области энергоэффективности ЦОД. В 2011 году эта организация предложила дополнительные метрики, которые будут использоваться наравне с PUE и помогут операторам проектировать, строить и эксплуатировать дата-центры.
ERE (Energy Reuse Effectiveness) – показывает эффективность повторного использования энергии, прежде всего тепловой, которая выделяется в ходе эксплуатации ЦОД. Метрику ERE применяют за пределами центра обработки данных.
WUE (Water Usage Effectiveness) – демонстрирует эффективность использования водных ресурсов в ЦОД для охлаждения. Есть два подвида метрики: WUE и WUE (source). Во второй модели оценки к воде, которую дата-центр потребляет на месте, добавляется вода, идущая на выработку энергии для ЦОД.
DCCE (Data Center Compute Efficiency) – определяет эффективность вычислений в дата-центре. Благодаря этой метрике владельцы корпоративных ЦОД лучше понимают, насколько рационально используются вычислительные ресурсы без привязки к производительности компьютерных систем.
IUE (Infrastructure Usage Efficiency) – относительно новая метрика, анонсированная в июне 2019 года группой китайских экспертов TGGC (The Green Gauge China, сформирована на базе The Green Grid). IUE поможет операторам ЦОД снизить затраты на содержание инфраструктуры, а также ее негативное воздействие на окружающую среду. IUE объединяет подачу и распределение электроэнергии, охлаждение и распределение хладагентов (в том числе охлажденный воздух), а также подсчет емкости стоек по высоте U. Тем самым она расширяет понятие PUE и добавляет в него новые переменные, отражающие ИТ-нагрузку дата-центра.
Другие критерии оценки работы ЦОД
CUE (Carbon Usage Effectiveness) – КПД использования углерода, который обозначает степень экологичности потребления электроэнергии в ЦОД. В основе этой метрики лежит структура источников энергии, характерная для конкретной страны. Например, в одной стране основным энергоносителем будет газ, в другой – нефть, в третьей – атомная энергия, а в четвертой – «зеленая» энергия.
SEER (Seasonal Energy Efficiency Ratio) – сезонный коэффициент энергоэффективности, который позволяет оценить работу холодильного оборудования ЦОД с учетом места монтажа и температуры окружающей среды, характерной для конкретного сезона.
DCeP (Data Center Energy Productivity) – критерий оценки количества полезной работы на единицу потребляемой ЦОД энергии. DCeP выходит за рамки стандартного PUE, так как учитывает ряд дополнительных факторов, например особенности бизнеса компании, владеющей дата-центром.
EDE (Electronics Disposal Efficiency) – показывает эффективность утилизации ИТ-оборудования, используемого в ЦОД. Метрика стала актуальной после того, как сократился цикл работы вычислительных машин, а операторы начали переходить на компактные и высокопроизводительные серверы и системы хранения. В The Green Grid разработали метрику EDE, чтобы снизить поток электронного мусора и привлечь внимание к проблеме его утилизации.
Метрики The Green Grid помогают операторам не просто повышать показатели энергоэффективности, но и демонстрировать достижения в других сферах: рационально использовать «зеленую» энергию, снижать негативное влияние на окружающую среду, контролировать производительность ИТ-оборудования. Независимая организация продолжает работать над созданием универсальных критериев оценки работы ЦОД, а также упрощает задачу инженерам, которые занимаются их проектированием, строительством и эксплуатацией.