Разгоняем обработку событий до 1.6М/сек. Опыт Badoo

Темы доклада:

Зачем собирать статистику

Жизненный цикл статистики

1. Define

Что собираем?

2. Collect

Статистика отсылается одновременно с бизнес-событием, но отдельным потоком.

Доставка событий

Нужен транспорт. Выбираем его под задачу и мощности. Аспекты: гарантии доставки, биндинги для языков программирования, масштабируемость.

Варианты: РСУБД, Flume, Kafka, LSD.

В Badoo используют LSD — Live Streaming Daemon.

3. Process

Что хотим получить из данных?

Как рисовать график?

Будем использовать гибридный подход: от каждого свои преимущества. Хвост из сырых данных и долгосрочный timeseries.

Метрики росли, компания последовательно переходила по технологиям:

ClickHouse

«Инструмент классный, документация ваще огонь, я сам туда писал».

Итоги фазы:

4. Present

Доступ к данным

Результаты фазы Present: