Схемы резервирования N+1 и 2N в ЦОД: сравнение и расчет отказоустойчивости
Надежность инфраструктуры — ключевой фактор для любого современного центра обработки данных (ЦОД). От бесперебойной работы электропитания зависит доступность облачных сервисов, банковских транзакций, телекоммуникаций и корпоративных систем. Даже кратковременное отключение может привести к многомиллионным потерям.
Именно поэтому в проектировании инженерной инфраструктуры ЦОД особое внимание уделяется схемам резервирования электропитания, в первую очередь системам источников бесперебойного питания (ИБП). Наиболее распространёнными архитектурами являются N+1 и 2N.
В этой статье подробно разберём:
• принцип работы схем N+1 и 2N
• различия в надежности
• влияние на стоимость инфраструктуры
• методы расчета отказоустойчивости
• практические рекомендации по выбору архитектуры
По статистике отрасли:
• более 70% аварий ЦОД связаны с электропитанием
• простой крупного дата-центра может стоить от $5000 до $9000 в минуту
• большинство отказов происходит не из-за оборудования, а из-за одной точки отказа (Single Point of Failure)
Чтобы устранить такие точки отказа, используются избыточные компоненты инфраструктуры: дополнительные ИБП, силовые линии, распределительные устройства и генераторы.
Наиболее популярные архитектуры резервирования:
На практике N+1 и 2N — самые распространенные модели для коммерческих дата-центров.
Например:
• расчетная нагрузка ЦОД — 400 кВт
• мощность одного модуля ИБП — 100 кВт
Для обеспечения нагрузки требуется:
N = 4 модуля ИБП
В архитектуре N+1 устанавливается дополнительный резервный модуль:
N + 1 = 5 модулей ИБП
В нормальном режиме работы нагрузка распределяется между всеми модулями в системе, в зелёном режимы работы, когда нагрузка на ИБП незначительна, лишние модули выводятся в горячий резерв, это делается для повышения общего КПД системы. Если один из рабочих модулей выходит из строя, в нормальном режиме нагрузка распределяется между оставшимися модулями, то есть каждый из них автоматически берет на себя его часть его нагрузки, в зелёном режиме включается в работу один из модулей горячего резерва.
Преимущества схемы N+1
1. Баланс стоимости и надежности
Минимальное увеличение стоимости инфраструктуры.
2. Высокая гибкость масштабирования
Можно добавлять модули по мере роста нагрузки.
3. Оптимально для модульных ИБП
Современные системы легко поддерживают горячую замену модулей.
4. Высокий КПД системы
Недостатки
• существует единая силовая цепь питания
• возможны точки отказа на уровне распределения
• не защищает от отказа всей системы ИБП
Типичные области применения
Схема N+1 чаще всего используется в:
• корпоративных дата-центрах
• региональных ЦОД
• телекоммуникационных узлах
• коммерческих облачных площадках Tier II
отказоутойчивости, архитектура 2N предполагает полное дублирование всей цепи электропитания.
Фактически создаются две независимые системы питания, каждая из которых способна обеспечить 100% нагрузки дата-центра. Благодаря этому устраняются единые точки отказа и достигается максимально возможный уровень отказоустойчивости. Такая архитектура применяется в ЦОД, где простой недопустим. Основная идея архитектуры заключается в создании двух полностью независимых линий электропитания, которые обычно обозначаются как:
• Линия A
• Линия B
Каждая из этих линий включает полный набор инфраструктуры:
• ввод электропитания
• система ИБП
• распределительные устройства
• кабельная инфраструктура
Каждая линия способна самостоятельно обеспечить всю нагрузку ЦОД.
Преимущества схемы 2N
1. Максимальная отказоустойчивость
Отказ одной линии не влияет на работу дата-центра.
2. Отсутствие единых точек отказа
Каждая система полностью независима.
3. Возможность обслуживания без остановки
Можно проводить сервис на одной линии без риска для инфраструктуры.
4. Соответствие требованиям Tier III
Недостатки
Главный недостаток — стоимость.
Инфраструктура практически удваивается:
• ИБП
• распределительные щиты
• кабельные линии
• системы охлаждения
Стоимость может увеличиваться на 70–100% по сравнению с N+1.
Где применяется 2N
• банковские ЦОД
• государственные дата-центры
• биржевые площадки
• гипермасштабируемые облака
• критически важные инфраструктуры
Главный компромисс при выборе схемы — стоимость vs отказоустойчивость.
показатели.
MTBF — Mean Time Between Failures
Среднее время между отказами оборудования.
Например:
Чем выше MTBF, тем надежнее компонент.
MTTR — Mean Time To Repair
Среднее время восстановления системы после отказа.
Для дата-центров обычно принимаются значения:
• 2–4 часа для модульных ИБП
• 1–2 часа для заменяемых модулей
• до 8 часов для крупных систем питания
Availability — доступность системы
Основной показатель надежности.
Формула:
Availability = MTBF / (MTBF + MTTR)
Пример
Допустим:
• MTBF системы ИБП = 200 000 часов
• MTTR = 4 часа
Тогда доступность одного ИБП:
0.99998
Однако при резервировании надежность значительно увеличивается.
Расчет для N+1
Вероятность полного отказа системы возникает только если откажут два модуля
одновременно.
Это значительно снижает вероятность простоя.
Расчет для 2N
Для отказа требуется:
• отказ линии A
• отказ линии B
Вероятность такого события крайне мала.
Именно поэтому архитектура 2N обеспечивает уровень доступности:
99.9999%
экономику проекта.
Когда выбирать N+1
Подходит если:
• бюджет ограничен
• дата-центр коммерческий
• уровень Tier II достаточен
• требуется масштабирование
Когда выбирать 2N
Оптимально если:
• требуется максимальная доступность
• инфраструктура обслуживает критические сервисы
• простой недопустим
• ЦОД соответствует Tier III
Архитектура N+1 обеспечивает оптимальный баланс стоимости и отказоустойчивости, поэтому широко применяется в коммерческих дата-центрах.
Схема 2N, в свою очередь, предоставляет максимальную надежность благодаря полному дублированию инфраструктуры и используется в критически важных системах, где простой недопустим.
При выборе архитектуры необходимо учитывать:
• уровень доступности сервисов
• требования стандарта Tier
• бюджет проекта
• масштабируемость инфраструктуры
Уровню Tier IV соответствует уровень резервирования 2N+1, когда в каждой лини питания 2N используется внутреннее резервирование ИБП N+1. Инфраструктура уровня Tier III относительно несложно преобразуется в уровень Tier IV по
электропитанию, просто заменой моноблочныз ИБП на модульные с резервированием
N+1.
Правильно спроектированная схема резервирования позволяет не только повысить
надежность ЦОД, но и обеспечить стабильную работу цифровых сервисов, на которых
сегодня строится экономика.
Именно поэтому в проектировании инженерной инфраструктуры ЦОД особое внимание уделяется схемам резервирования электропитания, в первую очередь системам источников бесперебойного питания (ИБП). Наиболее распространёнными архитектурами являются N+1 и 2N.
В этой статье подробно разберём:
• принцип работы схем N+1 и 2N
• различия в надежности
• влияние на стоимость инфраструктуры
• методы расчета отказоустойчивости
• практические рекомендации по выбору архитектуры
Почему резервирование критически важно для ЦОД
Современные дата-центры проектируются по стандартам надежности Tier I–IV, где уровень доступности инфраструктуры напрямую зависит от архитектуры резервирования.По статистике отрасли:
• более 70% аварий ЦОД связаны с электропитанием
• простой крупного дата-центра может стоить от $5000 до $9000 в минуту
• большинство отказов происходит не из-за оборудования, а из-за одной точки отказа (Single Point of Failure)
Чтобы устранить такие точки отказа, используются избыточные компоненты инфраструктуры: дополнительные ИБП, силовые линии, распределительные устройства и генераторы.
Наиболее популярные архитектуры резервирования:
| Схема | Принцип |
| N | Без резервирования |
| N+1 | Один резервный модуль |
| 2N | Полное дублирование системы |
| 2(N+1) | Две независимые системы с резервом |
На практике N+1 и 2N — самые распространенные модели для коммерческих дата-центров.
Схема резервирования N+1
Под N понимается количество оборудования, необходимое для обеспечения полной расчетной нагрузки дата-центра.Например:
• расчетная нагрузка ЦОД — 400 кВт
• мощность одного модуля ИБП — 100 кВт
Для обеспечения нагрузки требуется:
N = 4 модуля ИБП
В архитектуре N+1 устанавливается дополнительный резервный модуль:
N + 1 = 5 модулей ИБП
В нормальном режиме работы нагрузка распределяется между всеми модулями в системе, в зелёном режимы работы, когда нагрузка на ИБП незначительна, лишние модули выводятся в горячий резерв, это делается для повышения общего КПД системы. Если один из рабочих модулей выходит из строя, в нормальном режиме нагрузка распределяется между оставшимися модулями, то есть каждый из них автоматически берет на себя его часть его нагрузки, в зелёном режиме включается в работу один из модулей горячего резерва.
Преимущества схемы N+1
1. Баланс стоимости и надежности
Минимальное увеличение стоимости инфраструктуры.
2. Высокая гибкость масштабирования
Можно добавлять модули по мере роста нагрузки.
3. Оптимально для модульных ИБП
Современные системы легко поддерживают горячую замену модулей.
4. Высокий КПД системы
Недостатки
• существует единая силовая цепь питания
• возможны точки отказа на уровне распределения
• не защищает от отказа всей системы ИБП
Типичные области применения
Схема N+1 чаще всего используется в:
• корпоративных дата-центрах
• региональных ЦОД
• телекоммуникационных узлах
• коммерческих облачных площадках Tier II
Схема резервирования 2N
Схема резервирования 2N считается одной из самых надежных архитектур электропитания в центрах обработки данных. В отличие от схемы N+1, где резервируется лишь отдельный компонент системы, хотя и самый важный с точи зренияотказоутойчивости, архитектура 2N предполагает полное дублирование всей цепи электропитания.
Фактически создаются две независимые системы питания, каждая из которых способна обеспечить 100% нагрузки дата-центра. Благодаря этому устраняются единые точки отказа и достигается максимально возможный уровень отказоустойчивости. Такая архитектура применяется в ЦОД, где простой недопустим. Основная идея архитектуры заключается в создании двух полностью независимых линий электропитания, которые обычно обозначаются как:
• Линия A
• Линия B
Каждая из этих линий включает полный набор инфраструктуры:
• ввод электропитания
• система ИБП
• распределительные устройства
• кабельная инфраструктура
Каждая линия способна самостоятельно обеспечить всю нагрузку ЦОД.
Преимущества схемы 2N
1. Максимальная отказоустойчивость
Отказ одной линии не влияет на работу дата-центра.
2. Отсутствие единых точек отказа
Каждая система полностью независима.
3. Возможность обслуживания без остановки
Можно проводить сервис на одной линии без риска для инфраструктуры.
4. Соответствие требованиям Tier III
Недостатки
Главный недостаток — стоимость.
Инфраструктура практически удваивается:
• ИБП
• распределительные щиты
• кабельные линии
• системы охлаждения
Стоимость может увеличиваться на 70–100% по сравнению с N+1.
Где применяется 2N
• банковские ЦОД
• государственные дата-центры
• биржевые площадки
• гипермасштабируемые облака
• критически важные инфраструктуры
Сравнение схем N+1 и 2N
| Параметр | N+1 | 2N |
| Надежность | высокая | очень высокая |
| Стоимость | средняя | высокая |
| Масштабируемость | отличная | ограниченная |
| Соответствие Tier | II | III |
Главный компромисс при выборе схемы — стоимость vs отказоустойчивость.
Основные метрики надежности
При анализе отказоустойчивости инженерной инфраструктуры применяются следующиепоказатели.
MTBF — Mean Time Between Failures
Среднее время между отказами оборудования.
Например:
| Оборудование | MTBF |
| Модуль ИБП | 200 000 часов |
| Статический байпас | 300 000 часов |
| PDU | 250 000 часов |
Чем выше MTBF, тем надежнее компонент.
MTTR — Mean Time To Repair
Среднее время восстановления системы после отказа.
Для дата-центров обычно принимаются значения:
• 2–4 часа для модульных ИБП
• 1–2 часа для заменяемых модулей
• до 8 часов для крупных систем питания
Availability — доступность системы
Основной показатель надежности.
Формула:
Availability = MTBF / (MTBF + MTTR)
Пример
Допустим:
• MTBF системы ИБП = 200 000 часов
• MTTR = 4 часа
Тогда доступность одного ИБП:
0.99998
Однако при резервировании надежность значительно увеличивается.
Расчет для N+1
Вероятность полного отказа системы возникает только если откажут два модуля
одновременно.
Это значительно снижает вероятность простоя.
Расчет для 2N
Для отказа требуется:
• отказ линии A
• отказ линии B
Вероятность такого события крайне мала.
Именно поэтому архитектура 2N обеспечивает уровень доступности:
99.9999%
Практические рекомендации по выбору
При проектировании инфраструктуры ЦОД важно учитывать не только надежность, но иэкономику проекта.
Когда выбирать N+1
Подходит если:
• бюджет ограничен
• дата-центр коммерческий
• уровень Tier II достаточен
• требуется масштабирование
Когда выбирать 2N
Оптимально если:
• требуется максимальная доступность
• инфраструктура обслуживает критические сервисы
• простой недопустим
• ЦОД соответствует Tier III
Заключение
Схемы резервирования N+1 и 2N являются основой надежности современных центров обработки данных.Архитектура N+1 обеспечивает оптимальный баланс стоимости и отказоустойчивости, поэтому широко применяется в коммерческих дата-центрах.
Схема 2N, в свою очередь, предоставляет максимальную надежность благодаря полному дублированию инфраструктуры и используется в критически важных системах, где простой недопустим.
При выборе архитектуры необходимо учитывать:
• уровень доступности сервисов
• требования стандарта Tier
• бюджет проекта
• масштабируемость инфраструктуры
Уровню Tier IV соответствует уровень резервирования 2N+1, когда в каждой лини питания 2N используется внутреннее резервирование ИБП N+1. Инфраструктура уровня Tier III относительно несложно преобразуется в уровень Tier IV по
электропитанию, просто заменой моноблочныз ИБП на модульные с резервированием
N+1.
Правильно спроектированная схема резервирования позволяет не только повысить
надежность ЦОД, но и обеспечить стабильную работу цифровых сервисов, на которых
сегодня строится экономика.