opinions

Как не сойти с ума, чиня прод – практические заметки SRE

Привет, %username%! Иногда кажется, что про надежность уже сказано всё: SLO, error budget, postmortem’ы, Chaos Engineering и вот это всё. Но потом ты открываешь очередной инцидент в проде — и понимаешь, что падает не «абстрактная система», а вполне конкретная «штука», которую ты вчера трогал руками. И вот ты сидишь, смотришь в логи и графики, и главный вопрос звучит примерно так: «А можно было сделать так, чтобы сегодня я спал?» ...

2026-02-14 11:29 · 9 минут · jtprogru
opinions

Digital Immune System: цифровой иммунитет твоей инфраструктуры

Привет, %username%! Сегодня поговорим о концепции, которую Gartner включил в топ-10 стратегических технологических трендов — Digital Immune System (DIS), или «Цифровая иммунная система». Звучит футуристично, но на самом деле это про то, как сделать наши системы такими же адаптивными и самовосстанавливающимися, как человеческий организм. ...

2026-02-10 22:14 · 4 минуты · jtprogru
opinions

Эволюция практик Site Reliability Engineering: краткий анализ тенденций 2020-2025

Привет, %username%! Попытался разобраться, куда катится Site Reliability Engineering (SRE) за последние лет пять. Ниже накидал мысли по этому поводу. Ссылки на все отчеты вроде не забыл, так что зацени, а потом го в комменты – обсудим вместе. ...

2026-01-05 19:16 · 12 минут · jtprogru
work

Мониторинг бизнес-метрик: как понять, что твой сервис действительно работает

Привет, %username%! Сегодня поговорим о теме, которая часто остается в тени инфраструктурного мониторинга, но при этом не менее важна — о мониторинге бизнес-метрик. Если ты SRE, DevOps или TeamLead, то наверняка сталкивался с ситуацией: все графики зеленые, CPU не плавится, память в норме, а бизнес приходит и говорит “что-то не работает”. И вот тут начинается самое интересное. ...

2025-12-22 10:23 · 11 минут · jtprogru
howto

Запуск Kali Linux в UTM на macOS под ARM

Привет, %username%! Сегодня я расскажу тебе про то, как можно развернуть Kali Linux на маках с процессорами Apple Silicon (M1/M2/M3), используя бесплатную альтернативу Parallels Desktop — виртуализатор UTM. И да, это не только для пентестеров, но и для всех, кому нужна тестовая среда на базе Linux. ...

2025-12-18 06:20 · 6 минут · jtprogru
opinions

Tron как первый SRE

Привет, %username%! В 2010 году в прокат вышел фильм Tron: Наследие. И только с недавних пор, уже работая на позициях Site Reliability Engineer (SRE), я начал считать его (программу Tron) первой имплементацией SRE. ...

2025-12-14 10:22 · 6 минут · jtprogru
opinions

Как именно лег «Аэрофлот»

Привет, %username%! Далее будет небольшой разбор нашумевшей истории о сбое информационных систем компании «Аэрофлот». Как именно лег «Аэрофлот» 28 июля 2025 года около 4:30 утра карта сети «Аэрофлота» начала «гаснуть»: рабочие станции перезагружались и превращались в кирпичи, отвалился корпоративный домен, перестали работать SAP ERP, документооборот и ITSM. Хакеры, имея права администратора в AD, разлили через GPO задачу на стирание данных и удар по домену, после чего единственным способом остановить разрушение стало физически рубить каналы связи и электричество целыми этажами. ...

2025-12-09 14:04 · 5 минут · jtprogru