opinions

Как не сойти с ума, чиня прод – практические заметки SRE

Привет, %username%! Иногда кажется, что про надежность уже сказано всё: SLO, error budget, postmortem’ы, Chaos Engineering и вот это всё. Но потом ты открываешь очередной инцидент в проде — и понимаешь, что падает не «абстрактная система», а вполне конкретная «штука», которую ты вчера трогал руками. И вот ты сидишь, смотришь в логи и графики, и главный вопрос звучит примерно так: «А можно было сделать так, чтобы сегодня я спал?» ...

2026-02-14 11:29 · 9 минут · jtprogru
work

Мониторинг бизнес-метрик: как понять, что твой сервис действительно работает

Привет, %username%! Сегодня поговорим о теме, которая часто остается в тени инфраструктурного мониторинга, но при этом не менее важна — о мониторинге бизнес-метрик. Если ты SRE, DevOps или TeamLead, то наверняка сталкивался с ситуацией: все графики зеленые, CPU не плавится, память в норме, а бизнес приходит и говорит “что-то не работает”. И вот тут начинается самое интересное. ...

2025-12-22 10:23 · 11 минут · jtprogru
opinions

Tron как первый SRE

Привет, %username%! В 2010 году в прокат вышел фильм Tron: Наследие. И только с недавних пор, уже работая на позициях Site Reliability Engineer (SRE), я начал считать его (программу Tron) первой имплементацией SRE. ...

2025-12-14 10:22 · 6 минут · jtprogru
interview

[Interview] Задачка с собеса 0003

Привет, %username%! Очередная задача с собесов, которая является вариацией задачи 0002, но не менее интересная из-за своих нюансов и условий – она про архитектуру. ...

2022-01-22 13:00 · 7 минут · jtprogru
basics

[Basics] Что показывает atop?

Привет, %username%! Мониторинга много не бывает, а значит такие инструменты как Zabbix, Prometheus и другие имеют какие-то недостатки. Одним из основных недостатков может быть то, что для мониторинга нужна инфраструктура. А если у нас один сервер, то нам может быть достаточно такого инструмента как atop. ...

2020-12-05 19:36 · 2 минуты · jtprogru
opinions

[Opinion] Что ты такое – DevOps?

Привет, %username%! Последние несколько лет у всех на слуху такой термин как DevOps. И скажу больше – я даже нанимал иногда людей на позицию DevOps. Но вот на просторах интернета очень много статей на тему, что это такое и эта будет еще одной – отражающей мое мнение о том, что или кто этот ваш DevOps. ...

2020-11-09 22:25 · 7 минут · jtprogru
basics

[Basics] Мониторинг: что/куда/зачем?

Привет, %username%! Поговорим о такой безумно важной вещи как мониторинг! Постараемся ответить на некоторые вопросы связанные с мониторингом инфраструктуры и приложений. ...

2020-10-14 20:48 · 6 минут · jtprogru
howto

[HowTo] Установка Grafana 7 на Ubuntu 20.04

Привет, %username%! Немного пробежимся по типичной установке типичной Grafana 7 на типичную Ubuntu 20.04. Так же из плюшек у нас будет авторизация по LDAP (MS Active Directory). Собственно говоря – погнали! ...

2020-07-11 02:00 · 5 минут · jtprogru
howto

[HowTo] Установка Zabbix 5.0 на Ubuntu 20.04

Привет, %username%! Данная статья - обычный пересказ официальной документации Zabbix и не содержит в себе ничего магического. Да и процесс установки уже мною освещался ранее на CentOS и Ubuntu. ...

2020-07-10 02:00 · 2 минуты · jtprogru
develop

[Develop] Экспорт dashboards/datasource из Grafana

Привет, %username%! Небольшая заметка о том, как не пролюбить (с любовью настроенные) дашборды в Grafana если вдруг понадобилось перенести хранение настроек с SQLite на MySQL. ...

2020-03-11 22:50 · 2 минуты · jtprogru