Отказоустойчивый кластер — это набор серверов, которые работают вместе, обеспечивая или высокую доступность, или непрерывную доступность. Вот полное руководство
Если один из серверов выходит из строя, другой узел в кластере может взять на себя его рабочую нагрузку с минимальным временем простоя или вообще без него посредством процесса, называемого аварийным переключением.
Некоторые отказоустойчивые кластеры используют только физические серверы, тогда как другие используют виртуальные машины (ВМ).
Основная цель отказоустойчивого кластера — обеспечить CA или HA для приложений и служб.
Также называемые отказоустойчивыми (FT) кластерами, кластеры CA позволяют конечным пользователям продолжать использовать приложения и службы без каких-либо тайм-аутов в случае сбоя сервера.
Кластеры высокой доступности могут вызвать кратковременное прерывание обслуживания клиентов, но система автоматически восстановится без потери данных и с минимальным временем простоя.
ТОО Лингуа Мадре оказывает в Казахстане полный спектр услуг по поставке и технической поддержке программного обеспечения для резервного копирования, репликации и синхронизации данных. Свяжитесь с нашими экспертами для получения информации о том, чем мы можем вам помочь. | ||
Отказоустойчивый кластер. Узнать больше о программном обеспечении для резервного копирования в Казахстане | Связаться с нами |
Кластер состоит из двух или более узлов или серверов, которые передают данные и программное обеспечение для обработки данных по физическим кабелям или выделенной защищенной сети. Другие виды технологии кластеризации могут использоваться для балансировки нагрузки, хранения и одновременной или параллельной обработки. В некоторых реализациях отказоустойчивые кластеры сочетаются с дополнительной технологией кластеризации.
Отказоустойчивая кластеризация
Для защиты ваших данных выделенная сеть соединяет узлы отказоустойчивого кластера, обеспечивая необходимое резервное копирование CA или HA.
Как работает отказоустойчивый кластер
В то время как отказоустойчивые кластеры CA рассчитаны на 100-процентную доступность, кластеры HA пытаются обеспечить доступность на уровне 99,999 %, также известную как «пять девяток». Это время простоя составляет не более 5,26 минут в год. Кластеры ЦС обеспечивают большую доступность, но для их работы требуется больше аппаратного обеспечения, что увеличивает их общую стоимость.
Кластеры высокой доступности
В кластере высокой доступности группы независимых серверов совместно используют ресурсы и данные по всей системе. Все узлы отказоустойчивого кластера имеют доступ к общему хранилищу.
Кластеры высокой доступности также включают соединение для мониторинга, которое серверы используют для проверки «пульса» или работоспособности других серверов. В любой момент хотя бы один из узлов в кластере активен, а хотя бы один пассивен.
В простой конфигурации с двумя узлами, например, если узел 1 выходит из строя, узел 2 использует пульсирующее соединение, чтобы распознать сбой, а затем настраивается как активный узел. Программное обеспечение для кластеризации, установленное на каждом узле кластера, обеспечивает подключение клиентов к активному узлу.
В более крупных конфигурациях для управления кластером могут использоваться выделенные серверы . Сервер управления кластером постоянно отправляет сигналы пульса, чтобы определить, не выходит ли из строя какой-либо из узлов, и если да, то указать другому узлу взять на себя нагрузку.
Некоторое программное обеспечение для управления кластером обеспечивает высокую доступность для виртуальных машин (ВМ) путем объединения машин и физических серверов, на которых они расположены, в кластер. В случае сбоя виртуальные машины на отказавшем узле перезапускаются на альтернативных узлах.
Общее хранилище представляет собой потенциальную единую точку отказа. Однако использование RAID 6 вместе с RAID 10 может гарантировать, что обслуживание будет продолжаться даже в случае выхода из строя двух жестких дисков.
Если все серверы подключены к одной и той же электросети, электричество может стать еще одной точкой отказа. Узлы могут быть защищены путем оснащения каждого из них отдельным источником бесперебойного питания (ИБП).
Кластеры непрерывной доступности
В отличие от модели высокой доступности, отказоустойчивый кластер состоит из нескольких систем, совместно использующих одну копию операционной системы компьютера. Программные команды, выдаваемые одной системой, также выполняются в других системах.
CA требует, чтобы организация использовала форматированное компьютерное оборудование и дополнительный ИБП. В отказоустойчивом кластере ЦС операционная система (ОС) имеет интерфейс, с помощью которого программист может проверять важные данные в заранее определенных точках транзакции. CA может быть достигнут только при использовании постоянно доступной и почти точной копии физической или виртуальной машины, на которой запущена служба. Эта модель резервирования называется 2N.
Системы условного доступа могут компенсировать самые разные сбои. Отказоустойчивая система может автоматически обнаруживать сбой:
- Жесткий диск
- Блок компьютерного процессора
- Подсистема искусственного интеллекта/вывода
- Блок питания
- Сетевой компонент
Точка отказа может быть немедленно идентифицирована, и резервный компонент или процедура могут быть заменены немедленно без перерыва в обслуживании.
Программное обеспечение для кластеризации можно использовать для группировки двух или более серверов, чтобы они работали как один виртуальный сервер, или вы можете создать множество других настроек аварийного переключения ЦС.
Например, кластер может быть настроен таким образом, что в случае сбоя одного из виртуальных серверов другие реагируют на это, временно удаляя виртуальный сервер из кластера. Затем он автоматически перераспределяет рабочую нагрузку между оставшимися серверами до тех пор, пока отключенный сервер не будет готов снова подключиться к сети.
Альтернативой отказоустойчивым кластерам ЦС является использование «двойного» аппаратного сервера, в котором дублируются все физические компоненты. Эти серверы выполняют вычисления независимо и одновременно на отдельных аппаратных комплексах. Эти «двойные» аппаратные системы выполняют синхронизацию с помощью выделенного узла, который отслеживает результаты, поступающие с обоих физических серверов.
Хотя это обеспечивает безопасность, этот вариант может быть даже дороже, чем другие варианты.
Практическое применение отказоустойчивых кластеров
Постоянная доступность критически важных приложений
Отказоустойчивые системы необходимы для компьютеров, используемых в системах оперативной обработки транзакций (OLTP). OLTP, который требует 100-процентной доступности, используется, например, в системах бронирования авиабилетов, электронных биржевых торгах и банкоматах.
Многие другие типы организаций также используют либо кластеры CA, либо отказоустойчивые компьютеры для критически важных приложений, таких как предприятия в области производства, логистики и розничной торговли. Приложения включают электронную коммерцию, управление заказами и системы учета рабочего времени сотрудников.
Для кластеризации приложений и служб, требующих времени безотказной работы «пять девяток», кластеры высокой доступности обычно считаются подходящими.
Аварийное восстановление
Аварийное восстановление — еще одно практическое применение отказоустойчивых кластеров. Конечно, настоятельно рекомендуется размещать отказоустойчивые серверы на удаленных узлах на случай стихийного бедствия, например, пожара или наводнения, которое выведет из строя все физическое оборудование и программное обеспечение в основном центре обработки данных.
Например, в Windows Server 2016 и 2019 Microsoft предоставляет реплику хранилища — технологию, которая реплицирует тома между серверами для аварийного восстановления. Эта технология включает в себя функцию гибкой отработки отказа для отказоустойчивых кластеров, охватывающих две географические площадки.
Растягивая отказоустойчивые кластеры, организации могут выполнять репликацию между несколькими центрами обработки данных. Если в одном месте происходит авария, все данные продолжают существовать на резервных серверах в других местах.
Репликация базы данных
Согласно Microsoft, компания изначально представила отказоустойчивый кластер Windows Server (WSFC) в Windows Server 2016 для защиты «критически важных» приложений, таких как база данных SQL Server и коммуникационный сервер Microsoft Exchange.
Другие поставщики баз данных предлагают технологию отказоустойчивого кластера для репликации базы данных. MySQL Cluster, например, включает механизм пульса для мгновенного обнаружения сбоя, обычно в течение одной секунды, для других узлов в кластере без прерывания обслуживания клиентов. Функция географической репликации позволяет зеркально отображать базы данных в удаленных местах.
Типы отказоустойчивых кластеров
Отказоустойчивые кластеры VMWare
Среди доступных продуктов виртуализации VMware предлагает несколько инструментов виртуализации для кластеров виртуальных машин. vSphere vMotion предоставляет архитектуру условного доступа, которая точно воспроизводит виртуальную машину VMware и ее сеть между сетями физических центров обработки данных.
Второй продукт, VMware vSphere HA, обеспечивает высокую доступность для виртуальных машин, объединяя их и их хосты в кластер для автоматического аварийного переключения. Инструмент также не зависит от внешних компонентов, таких как DNS, что снижает количество потенциальных точек отказа.
Отказоустойчивый кластер Windows Server (WSFC)
Вы можете создавать отказоустойчивые серверы Hyper-V с помощью WFSC — функции в Windows 2016 и 2019, которая отслеживает кластерные физические серверы, обеспечивая при необходимости отработку отказа. WFSC также отслеживает кластерные роли, которые ранее назывались кластерными приложениями и службами. Если кластерная роль работает неправильно, она либо перезапускается, либо перемещается на другой узел.
WFSC включает в себя предыдущую технологию Microsoft Cluster Shared Volume (CSV), чтобы обеспечить согласованное распределенное пространство имен для доступа к общему хранилищу со всех узлов. Кроме того, WSFC поддерживает общее файловое хранилище CA для виртуальных машин кластера SQL Server и Microsoft Hyper-V. Он также поддерживает роли высокой доступности, работающие на физических серверах и виртуальных машинах кластера Hyper-V.
Отказоустойчивые кластеры SQL Server
В SQL Server 2017 Microsoft представила Always On, решение высокой доступности, которое использует WSFC в качестве технологии платформы, регистрируя компоненты SQL Server как ресурсы кластера WSFC. Согласно Microsoft, связанные ресурсы объединяются в роль, которая зависит от других ресурсов WSFC. Затем WSFC может определить и сообщить о необходимости либо перезапустить экземпляр SQL Server, либо автоматически переключиться на другой узел.
Отказоустойчивые кластеры Red Hat Linux
Производители ОС, отличные от Microsoft, также предоставляют собственные технологии отказоустойчивых кластеров. Например, пользователи Red Hat Enterprise Linux (RHEL) могут создавать отказоустойчивые кластеры высокой доступности с надстройкой высокой доступности и глобальной файловой системой Red Hat (GFS/GFS2). Предусмотрена поддержка растянутых кластеров с одним кластером, охватывающих несколько сайтов, а также многосайтовых «аварийно-устойчивых» кластеров. Многосайтовые кластеры обычно используют репликацию хранилища данных с поддержкой сети хранения данных (SAN).
ТОО Лингуа Мадре оказывает в Казахстане полный спектр услуг по поставке и технической поддержке программного обеспечения для резервного копирования, репликации и синхронизации данных. Свяжитесь с нашими экспертами для получения информации о том, чем мы можем вам помочь. | ||
Отказоустойчивый кластер. Узнать больше о программном обеспечении для резервного копирования в Казахстане | Связаться с нами |