Опубликовал статью на Хабре, где рассказываю о том, как мы перешли от системы MapReduce к новому стриминговому движку. Это значительно ускорило обработку данных. Исходники движка доступны на гитхабе.
Вот статья: https://habr.com/ru/companies/yandex/articles/808059/