Всегда нужно быть готовым к непредвиденным обстоятельствам, и теперь, когда в северном полушарии начинается лето, а погодные условия неблагоприятны, что проявляется, например, в виде экстремальной жары, пожаров и ураганов, которые грозят перебоями в электроснабжении, крайне важно, чтобы для операторов ЦОД это не стало неприятным сюрпризом. Первый шаг — создание плана обеспечения непрерывности бизнеса и аварийного восстановления, который устраняет распространенную причину простоя ЦОД: человеческую ошибку. Хорошо подготовленный контрольный список снижает риск возниковения ошибок и упущений при стихийном бедствии и гарантирует, что организация будет готова к любым возможным ситуациям.
- Оценка рисков. Это должен быть первый шаг для любой организации при разработке плана аварийного восстановления. Какие типы угроз существуют в вашем регионе? Нужно подготовить планы по таким стихийных бедствиям, как ураганы, наводнения, торнадо, пожары, землетрясения и вулканы, но находятся ли какие-либо из ваших объектов рядом с зонами радиационного воздействия, токсичными отходами или взрывчатыми веществами?
- План эвакуации. Безопасность человека всегда на первом месте, поэтому у вас должен быть план эвакуации персонала, потенциально подверженного риску. Он должен включать в себя подробный план взаимодействия с персоналом для подтверждения его безопасности.
- Защита ЦОД от атмосферных воздействий. Если угроза связана с ураганом, наводнением или погодой в целом, примите необходимые меры для защиты своего объекта. Закрепите или храните незакрепленные предметы и убедитесь, что серверы надежно закреплены в своих стойках. Прочистите водосточные желоба и ливневые стоки. Убедитесь, что двери могут надежно блокируются, защищая от сильных ветров и дождей. Вода — враг ЦОД, поэтому делайте все возможное, чтобы она не попала в серверные помещения.
- Резервное копирование данных. Многие центры обработки данных обычно выполняют резервное копирование данных раз в неделю. Если прогноз погоды неблагоприятный, увеличьте его частоту. Вероятность чрезвычайной ситуации часто непредсказуема, поэтому организациям следует рассматривать возможность ежедневного резервного копирования как регулярную практику. Подумайте, где выполняется резервное копирование данных. Резервная копия должна находиться вне объекта, но убедитесь, что это место безопасно и защищено от потенциальной катастрофы.
- Проверьте генератор: Существует тенденция, что о генераторе после его установки вообще забывают, но для того, чтобы он работал должным образом, требуется техническое обслуживание и уход. Полностью ли заполнен его бак чистым топливом? Нет ли загрязняющих веществ в топливопроводе и воздушном фильтре? Регулярно проверяйте генератор перед любыми ожидаемыми погодными явлениями. Организуйте не менее трех поставщиков топлива на случай продолжительного простоя. Помните, что спрос на топливо после стихийного бедствия огромен, и ваша организация не будет единственной организацией, требующей доставки.
- Общайтесь с коммунальными предприятиями. Рассмотрите последствия перебоев поставок электроэнергии, воды, услуг телефонии или Интернета. Заблаговременно обратитесь к поставщикам коммунальных услуг для составления планов действий в чрезвычайных ситуациях. Создайте список контактов и разработайте план коммуникации, если традиционные каналы недоступны.
- Персонал для экстренных ситуаций. В случае серьезной катастрофы местные сотрудники могут быть недоступны для работы. Они могут эвакуироваться со своими семьями, решать неотложные вопросы, связанные с разрушениями своих домов или повреждениями транспортных средств или не могут добраться до центра обработки данных из-за непроходимости дорог. Подумайте о привлечении экстренных бригад и организации временных мест проживания рядом с центром обработки данных, чтобы обеспечить наличие персонала на объекте.
- Контакты с поставщиками. Составьте список поставщиков и определите как приоритетных тех, с кем требуется связь в случае чрезвычайной ситуации. Свяжитесь с ними заранее и договоритесь обо всем необходимом, чтобы вы смогли сосредоточиться на более неотложных потребностях во время кризиса.
- Доверяйте своей команде. Объедините все отделы — ИТ, административно-хозяйственный, безопасности, кадров, коммуникаций, юридический, логистики, информационной безопасности — и убедитесь, что все понимают свои обязанности на протяжении всего кризиса. Составьте план взаимодействия с этой командой в случае, если обычные каналы коммуникации не работают.
- Подтвердите страховое покрытие. В первую очередь — обеспечьте страхование самого объекта, но возможно и дополнительное страхование инфраструктуры или непрерывности бизнеса. Если ЦОД не работает в течение недели, страховка непрерывности бизнеса может компенсировать компании потери дохода.
- Помните о периферийных вычислениях. Сегодня корпоративный центр обработки данных — это всего лишь одна часть распределенной сети. Многие организации управляют несколькими периферийными объектами. Эти объекты имеют большее значение, чем когда-либо прежде, и их необходимо учитывать при планировании действий в случае стихийных бедствий. Во многих случаях основной ЦОД может быть защищен от определенного события, но один или несколько периферийных объектов — подвержены риску. Расставляйте приоритеты по степени критичности. Составьте план для этих объектов и персонала на этих объектах.
- Не забывайте об облаке. Тот факт, что некоторые из ваших данных и приложений размещены в облаке, не означает, что они всегда защищены от чрезвычайных ситуаций. Эти облачные серверы где-то находятся в центре обработки данных, и вы должны знать, как ваш поставщик облачных услуг справится с потенциальной чрезвычайной ситуацией. Как часто он выполняет резервное копирование данных? Есть ли у них резервные площадки? Задавайте эти вопросы до кризиса, потому что после него будет уже слишком поздно.
- Учитывайте тех, кто пользуется ситуацией. Хакеры рассматривают стихийные бедствия или аналогичные чрезвычайные ситуации как возможность доступа к сетям, когда о кибератаках забывают. Убедитесь, что ваши отделы информационной и физической безопасности готовы к действиям злоумышленников.
Контрольный список аварийного восстановления центра обработки данных — — это неоценимая часть планирования непрерывности бизнеса. Вместе с командой нужно регулярно обновлять план, особенно при внесении изменений в критически важное оборудование и персонал.
В состав этой команды могут входить не только сотрудники подходящего поставщика услуг ЦОД, которые помогут в оценке рисков, необходимых для надлежащей подготовки к чрезвычайной ситуации. Эти специалисты по инфраструктуре, прошли специальное обучение и обеспечат своевременное и безопасное восстановление. Обратитесь к ближайшему поставщику услуг за помощью в планировании.