SRE & Observability Engineer (senior)

г. Москва
Опыт работы От 3 до 6 лет
Занятость: полная

Описание

Мы строим абсолютно новую платформу в Ozon.ru, основанную на современных технологиях. Задача SRE-команды - обеспечение высокой доступности внутренних и публичных сервисов компании.

SRE в Ozon - это разработка для разработки, мы снабжаем разработчиков инструментами, которые решают их повседневные проблемы - поиск performance-проблем, отладка приложений и трассировка.

Мы ищем SRE-инженера, который поможет нам развивать общую инженерную инфраструктуру, являющуюся незаменимым инструментом для сотен разработчиков.

Задачи:

  • развитие нашей системы распределенного трейсинга: мы процессим >1kk спенов/сек и хотим строить in-memory поиск и аналитику по этим данным, чтобы разработчики могли быстрее находить узкие места
  • развитие системы мониторинга на базе Prometheus и long-term хранения данных. Мы активно контрибъютим в Thanos.
  • обеспечение разработчиков инструментами для отладки и мониторинга - дешбордами, логами, трейсами и алертами
  • разработка клиентских библиотек, которыми инструментируются сервисы для интеграции с системами мониторинга, трейсинга и логирования
  • планирование инфраструктуры и обеспечение отказоустойчивости и высокой доступности указанных систем совместно с системными инженерами
  • сбор метрик со всех подсистем - от браузера пользователя до дисковой подсистемы на сервере баз данных
  • написание экспортеров метрик для Prometheus

Мы ожидаем, что Вы:

Минимально

  • ты умеешь писать чистый, тестируемый код на одном или более языках: C, C++, Java, Python, Go, Ruby, PHP (мы пишем на Go)
  • ты свободно пользуешься терминалом в Linux и понимаешь, куда посмотреть, когда сервер тупит
  • ты понимаешь принципы обеспечения высокой доступности приложений и слышал о балансировщиках нагрузки и rate-limiter'ах
  • ты работал с распределенными системами (микросервисы, service discovery) и соответствующими инструментами (LXC, Docker, orchestration systems)

Желательно

  • тебе интересен анализ, проектирование и решение проблем в масшабных распределенных системах
  • ты умеешь дебажить и оптимизировать код, автоматизировать рутинные операции
  • ты умеешь делать CI, build pipeline и собирать Docker-образы
  • ты умеешь собирать deb или rpm пакеты и писать Makefile
  • ты хорошо знаком с эксплуатацией софта и работал с системами мониторинга (Prometheus), трейсинга (OpenTracing) и логирования (Graylog)

Мы предлагаем:

  • Здоровье: ДМС со стоматологией, страхование от несчастных случаев, полис выезжающих за рубеж. В офисе ведут прием врач-терапевт и психолог;

  • Спорт: йога в офисе, беговой, футбольный, волейбольный клубы. Скидки на клубные карты фитнес-сетей;

  • Развитие: У нас есть корпоративная офлайн библиотека, доступ к онлайн-библиотеке MyBook и к онлайн-платформе обучения Eduson;

  • Корпоративные программы: скидки и привилегии от компаний-партнёров для наших сотрудников;

  • Социальная ответственность: материальная помощь, подарочные сертификат при рождении ребенка;

  • Питание: можно перекусить на оборудованных кухнях (завтраки, фрукты, овощи, сэндвичи), в офисе расположены вендинговые аппараты здоровой еды. Вечером вас ждут аппетитные ужины;

  • Офис в Москва-Сити: просторный open-space с панорамными видами и местами для отдыха, социальная инфраструктура.

Ключевые навыки:

  • go
  • golang
  • Kubernetes
  • Linux

Условия и бонусы

  • Бонусы от партнеров
    Бонусы от партнеров
    Скидки в фитнес-клубах, кафе, ресторанах и множество других спецпредложений и бонусов от наших партнеров
  • Команда профессионалов
    Команда профессионалов
    Мы собрали лучших в своем деле специалистов
  • Карьерный рост
    Карьерный рост
    У нас всегда есть возможности роста для тех, кто готов хорошо поработать
  • ДМС
    ДМС
    Медицинское страхование, включая услуги стоматолога и оплату больничны

Оставьте отклик

Мы с вами свяжемся, ответим на все вопросы и будем рады увидеть у себя.

Я соглашаюсь передать свои персональные данные, содержащиеся в анкете и всех приложенных файлах, в ООО «Интернет Решения» исключительно для включения во внешний кадровый резерв и чтобы компании ООО «Интернет Решения», ООО «Озон Технологии» и ООО «Интернет Трэвел» могли предлагать мне вакансии. Я понимаю и соглашаюсь, что мои данные будут храниться и обрабатываться в ООО «Интернет Решения» в течение пяти лет, в соответствии с Федеральным законом «О персональных данных»

Спасибо за отклик

В ближайшее время мы свяжемся с вами.

Я соглашаюсь передать свои персональные данные, содержащиеся в анкете и всех приложенных файлах, в ООО «Интернет Решения» исключительно для включения во внешний кадровый резерв и чтобы компании ООО «Интернет Решения», ООО «Озон Технологии» и ООО «Интернет Трэвел» могли предлагать мне вакансии. Я понимаю и соглашаюсь, что мои данные будут храниться и обрабатываться в ООО «Интернет Решения» в течение пяти лет, в соответствии с Федеральным законом «О персональных данных»

Спасибо за отклик

В ближайшее время мы свяжемся с вами.

Спасибо за отклик

В ближайшее время мы свяжемся с вами, обсудим все детали и сможем предложить вакансии.