По крайней мере, один раз в год приходит время переосмыслить документацию ИТ-отдела, касающуюся аварийного восстановления.
Одна из вещей, над которой я работал в течение последних двух лет, — это наш сетевой журнал. Мы храним копии этого документа в двух местах — в нашей системе управления документами (которую можно экспортировать на компакт-диск) и в печатном виде, потому что, когда системы не работают, последнее, что вы не можете получить, это документация о том, как чтобы все снова заработало.
Вот краткое изложение того, что у меня есть до сих пор — в 10 пунктах:
- Сводная информация о Runbook — список всех серверов с их IP-адресами, основным назначением, списком известных приложений, работающих на каждом из них, виртуальных или нет. Я также включил список серверов, на которых работает операционная система, список ключевых баз данных на серверах и, наконец, копии некоторых из наших важных паролей.
- Enterprise AD — список всех корпоративных доменов и какие серверы выполняют какие роли. Я включаю всю информацию IP для каждого сервера, разделы и тома на каждом и где хранится база данных AD. Функциональные уровни для домена и леса также задокументированы.
- Основные серверы и функции — это похоже на раздел Enterprise AD, но это для всех контроллеров, не относящихся к домену. Я перечисляю информацию о сервере для файловых служб, серверов баз данных и их приложений и серверов резервного копирования. Я документирую общие ресурсы, информацию о разделах и томах (включая размер), важные службы, которые должны быть запущены, и где найти копии установочных носителей.
- ImageRight — наша система управления документами заслуживает отдельного раздела. В дополнение к элементам, аналогичным серверам в предыдущем разделе, я также включил некоторые основные этапы восстановления, зависимости и последовательность загрузки серверов и служб. Любая другая информация для регулярного обслуживания или деятельности в этой системе, также включена сюда.
- Email / Exchange — это еще одна ключевая система, которая заслуживает отдельного раздела в моем офисе. Я включаю все детали сервера (как выше), а также полностью перечисляю все параметры конфигурации Exchange. Большая часть информации о конфигурации хранится в Active Directory. Тем не менее, я чувствую себя лучше, когда записываю это. Я также включил сюда документацию, касающуюся нашего стороннего брандмауэра спама и других серверов, связанных с поддержкой электронной почты.
- Сведения о резервном копировании — список каждого сервера резервного копирования, какими заданиями он управляет и какие данные собирает каждое из этих заданий.
- Телекоммуникации — Подробная информация о серверах и ключевых услугах. Я также включаю информацию относительно наших автосекретарей, деревьев меню и программных клавиш.
- Сеть — Карты и диаграммы для VLAN, статические назначения IP-адресов, внешние IP-адреса.
- Контакты и поддержка — внутренние и внешние номера поддержки и другая важная идентификационная информация.
- Аварийное восстановление — информация о местонахождении нашего комплекта аварийного восстановления, горячей линии и веб-сайта. Список содержимого нашего комплекта для аварийного восстановления и статей базы знаний, касающихся некоторых из наших задач по аварийному восстановлению, и печатных копий всех этапов аварийного восстановления.
Этот документ всегда используется — я постоянно добавляю и изменяю информацию и делаю заметки, а также стараюсь не отставать от изменений, которые другие члены команды вносят в системы, с которыми они работают больше всего. Это никогда не будет «сделано», но я надеюсь, что всякий раз, когда мне придется тянуться к нему, я получу необходимую информацию.