Social Discovery Group (SDG) is the 3rd largest social discovery company in the world, uniting 60+ brands with 500 million users. We solve the problems of loneliness, isolation, and disconnection by transforming virtual intimacy into the new normal. Our portfolio includes online communication platforms focusing on AI, game mechanics, and video streaming - Dating.com, DateMyAge, Cupid Media, Dil Mil, Kiseki, and others.
We are looking for a Senior Monitoring Engineer (Zabbix/Prometheus).
Your main tasks will be:
-
Develop and optimize all components of the Zabbix monitoring instance, including provisioning High Availability at different levels.
-
Ensure SLA compliance through effective monitoring and timely incident response.
-
Configure monitoring end-to-end (metrics, triggers, alerts, escalations).
-
Create and modify monitoring templates and Grafana dashboards.
-
Ensure PostgreSQL backups and high availability for monitoring data.
-
Improve monitoring quality via retrospective analysis of trigger precision/recall and false-positive reduction.
-
Generate periodic reports based on data from monitoring systems.
We expect from you:
-
3+ years as a Senior Zabbix Administrator and Prometheus Administrator (mandatory).
-
1+ year working with PostgreSQL (mandatory).
-
Strong hands-on with Zabbix, Prometheus, Grafana (required).
-
Practical experience with Ansible, Git/GitLab/CI/CD, RPM-based Linux (CentOS/AlmaLinux/RHEL).
-
Scripting skills in bash and/or Python; PowerShell is a plus.
-
Ability to own monitoring configuration and continuously raise quality and reliability.
What do we offer:
- REMOTE OPPORTUNITY to work full time;
- Vacation 28 calendar days per year;
- 7 wellness days per year (time off) that can be used to deal with household issues, to lie down and recover without taking sick leave;
- Bonuses up to $5000 for recommending successful applicants for positions in the company;
- Full payment for professional training, international conferences and meetings;
- Corporate discount for English lessons;
- Health benefits. According to the paychecks, if you are not eligible for corporate medical insurance, the company will compensate you with up to $ 1,000 gross per year per employee. This can be spent on self-purchase of health insurance or on doctor’s fees for yourself and close relatives (spouse, children);
- Workplace organization. The company provides all employees with an equipped workplace and all the necessary equipment (table, armchair, wifi, etc.) in our offices or co-working locations. In the other locations, the company provides reimbursement of workplace costs up to $ 1000 gross once every 3 years, according to the paychecks. This money can be spent on the rent of the co-working room, on equipping the working place at home (desk, chair, Internet, etc.) during those 3 years;
- Internal gamified gratitude system: receive bonuses from colleagues and exchange them for our merchandise, team building activities, massage certificates, etc.
Social Discovery Group (SDG) — третья по величине компания в мире в сфере social discovery, объединяющая 60+ брендов с аудиторией в 500 миллионов пользователей. Мы решаем проблемы одиночества, изоляции и отсутствия связи, превращая виртуальную близость в новую норму. В наше портфолио входят платформы для онлайн-коммуникации с акцентом на ИИ, игровые механики и видеостриминг: Dating.com, DateMyAge, Cupid Media, Dil Mil, Kiseki и другие.
-
Мы ищем Senior Monitoring Engineer (Zabbix/Prometheus).
Ваши задачи:
-
Разработка и оптимизация всех компонентов инстанса Zabbix, включая обеспечение High Availability на разных уровнях.
-
Контроль соблюдения SLA за счёт эффективного мониторинга и своевременной реакции на инциденты.
-
Полная конфигурация мониторинга (метрики, триггеры, алерты, эскалации).
-
Создание и модификация шаблонов мониторинга и дашбордов в Grafana.
-
Обеспечение резервного копирования PostgreSQL и высокой доступности данных мониторинга.
-
Повышение качества мониторинга через ретроспективный анализ точности/полноты (precision/recall) триггеров и снижение числа ложных срабатываний.
-
Формирование регулярных отчётов на основе данных из систем мониторинга.
-
Мы ожидаем:
-
3+ лет опыта в роли Senior Zabbix Administrator и Prometheus Administrator (обязательно).
-
1+ год работы с PostgreSQL (обязательно).
-
Уверенное владение Zabbix, Prometheus, Grafana (требуется).
-
Практический опыт с Ansible, Git/GitLab/CI/CD, RPM-семейством Linux (CentOS/AlmaLinux/RHEL).
-
Навыки скриптинга на bash и/или Python; знание PowerShell будет плюсом.
-
Готовность брать на себя ответственность за конфигурацию мониторинга и постоянно повышать его качество и надёжность.
-
Что мы предлагаем:
-
Удалённая работа на полный день (REMOTE OPPORTUNITY).
-
28 календарных дней отпуска в год.
-
7 wellness-дней в год (оплачиваемое свободное время), которые можно использовать для бытовых дел или отдыха без оформления больничного.
-
Бонусы до $5000 за рекомендации успешно нанятых специалистов.
-
Полная оплата профессионального обучения, международных конференций и митапов.
-
Корпоративная скидка на занятия английским.
-
Медицинские льготы. Если вы не подходите под корпоративную медстраховку, компания компенсирует до $1000 gross в год на сотрудника (на самостоятельную покупку страховки или оплату врачей для себя и близких — супруг(а), дети).
-
Организация рабочего места. Компания предоставляет оборудованное рабочее место (стол, кресло, Wi-Fi и т. п.) в наших офисах или коворкингах. В других локациях — компенсация расходов на рабочее место до $1000 gross раз в 3 года по подтверждающим документам (коворкинг или обустройство домашнего рабочего места: стол, кресло, интернет и т. д.).
-
Внутренняя геймифицированная система благодарностей: получайте бонусы от коллег и обменивайте их на мерч, тимбилдинги, сертификаты на массаж и др.