SRE. Рецепты выживания в продакшене для инженера по надежности. Наталья Савенкова

Чтение книги онлайн.

Читать онлайн книгу SRE. Рецепты выживания в продакшене для инженера по надежности - Наталья Савенкова страница 17

Жанр:
Серия:
Издательство:
SRE. Рецепты выживания в продакшене для инженера по надежности - Наталья Савенкова

Скачать книгу

Ничего не видно и мало что понятно! С тех пор после значительных модификаций я прихожу туда смотреть, как это видно с их мест, подбираю расположение, масштабы и цветовую гамму.

      Также интересно и полезно смотреть, как люди пользуются каким-то моими интерфейсными разработками. Вроде делаешь так, как кажется удобно, а в глазах других людей удобно может быть совсем иначе, либо они вообще не знают о существовании каких-то возможностей.

      Делаете что-то для других? Сходите посмотреть, как они этим пользуются.

      57. Нативные средства

      Когда-то совсем давно, когда я была совсем “зелёной”, а с MySQL было принято работать через PhpMyAdmin, чтобы не связываться с командами и щёлкать мышкой по кнопкам, жизнь случайно свела меня с суровой админской тусовкой.

      И вот в одну из наших встреч я наблюдала, как ребята копаются в своём MySQL через консоль. Помнится, обсуждали мы тюнинг СУБД. Я тогда поинтересовалась у одного, почему он выбрал такой неудобный способ. Он сказал мне то, что навсегда изменило моё отношение к этому: "Ты всегда должна суметь написать запрос в консоли".

      С тех пор я избегаю всякой тонкой настройки своего рабочего окружения, потому что это сильно ограничивает и ослабляет в перспективе.

      Вот как настрою я себе инструменты, много классных алиасов и какой-нибудь vim с парой десятков удобных плагинов… Но в ситуации катастрофы я вообще-то работаю в среде, где этого всего нет. И что я тогда буду делать? Без алиасов как без рук? Это всё удобно и без сомнений сокращает время, но всегда нужно суметь это сделать руками.

      58. Самодостаточная версия

      Как-то раз… (с этих слов можно было бы начинать каждую главу этой книги). Как-то раз мы сидели на очередном разборе полётов коллег. Выше я уже писала, что не надо ходить по всем граблям самостоятельно, а надо смотреть на чужие грабли и оценивать свои собственные риски этих граблей. На разборе коллеги рассказывали про затянувшийся инцидент и причины, по которым они не могли восстановиться быстро. Причина очевидная и очень простая: новый конфигурационный файл, сделанный специально для новой версии, был несовместим со старой версией. При этом процесс отката на предыдущую версию откатывал только код, а не конфигурацию. Конфигурационные файлы не имели версионирования, поэтому откатывать их было некуда. Основное время починки инцидента заняло исправление и доставка совместимой версии конфигурации. Читая эти строки, в голову приходит мысль “какая нелепость, это же так очевидно”. На самом деле, это становится очевидно тогда, когда вы с этим столкнулись.

      Оценка риска складывается из двух составляющих: вероятность возникновения и тяжесть последствий. Вероятность откатывать новую версию на старую очень высокая. Последствия отката на версию, которая не работает, катастрофичны.

      После этого случая у коллег мы сразу пошли делать у себя версионирование всех компонентов и консистентные инструменты отката на предыдущие версии.

      Таким

Скачать книгу