SRE. Рецепты выживания в продакшене для инженера по надежности. Наталья Савенкова

Чтение книги онлайн.

Читать онлайн книгу SRE. Рецепты выживания в продакшене для инженера по надежности - Наталья Савенкова страница 12

Жанр:
Серия:
Издательство:
SRE. Рецепты выживания в продакшене для инженера по надежности - Наталья Савенкова

Скачать книгу

Безопасности, которая есть в вашей компании, если она достаточно крупная. Никто точно не знает, чем они там занимаются, но эти ребята постоянно сильно заняты. Когда вы придёте к ним со словами “я хочу сделать свою систему более безопасной, выдайте мне ваш чек-лист, и я что-нибудь у себя улучшу”, вы станете сотрудником года в их глазах, а ваши белые крылья перестанут помещаться в коридоре.

      Если такой службы у вас нет, то найдите какой-нибудь гайд в интернете типа “100 лучших советов по кибербез” и полистайте его.

      Это совершенно очевидная рекомендация, но почему так никто не делает? Здесь работает такой же жизненный принцип, как с логами или бекапами – либо вы уже соблюдаете рекомендации СИБ, либо вы их ещё не соблюдаете.

      Просто возьмите гайд по безопасности с рецептами и сделайте то, что там написано. Как бы вы не старались, всё равно у вас будут дыры, но их будет немного меньше.

      P.S. Когда-то очень давно, ещё в начале моей карьеры в разработке, в журнале Хакер вышла статья с подробным разбором того, как был взломан один из сайтов, над которым я работала… Даже не знаю, что здесь сильнее – жажда славы или чувство позора.

      36. Доступность из внешнего мира

      Почти все рецепты в этой книге крутятся вокруг backend-систем. У нас в бекенде всегда куча мониторинга на все случаи жизни, мы любим собирать много разной информации и рисовать из неё разноцветные графики. Но есть нюанс. График можно нарисовать из тех данных, которые к нам пришли вместе с запросом. Но если сервис недоступен снаружи, то не будет и запросов, которые могли бы принести нам информацию. Когда график количества запросов в секунду начинает внезапно показывать 0, то на это есть целый ряд причин: например, закончилось место в хранилище метрик. А если на графике не ноль, а просто “стало чуть меньше, чем было пять минут назад”? Да кто такое заметит вообще?! Тем более ночью.

      Для этих случаев есть разные сервисы, которые проверяют работу вашей системы снаружи. Они могут это делать из разных стран, притворяться разными устройствами и так далее. например, провайдеры предоставляют сервис looking glass. Настройте внешние проверки доступности системы из популярных браузеров и важных для вас локаций. В один из солнечных дней вы вдруг узнаете, что работу вашего сервиса по ошибке заблокировали в какой-нибудь стране.

      37. Аварийные и предупреждающие оповещения

      Мониторинг не имеет смысла без оповещений для ситуаций, требующих внимания. Ни один нормальный человек не будет сидеть весь день и смотреть в экран на красивые разноцветные линии.

      Разделите ваши оповещения на категории:

      – полезно знать

      – сломалось, нужно починить в рабочее время

      – сломалось, нужно починить срочно

      – всё совсем плохо

      Для оповещений разной степени важности используйте разные каналы доставки. Если все сообщения вы шлёте в один канал, то со временем там наступит бардак и важное станет теряться.

Скачать книгу