YTsaurus: основная система для хранения и обработки данных Яндекса теперь в опенсорсе

Руководитель отдела распределённых вычислений Яндекса Максим Бабенко рассказывает, как YTsaurus прошёл десятилетний путь от внутренней разработки до опенсорс-платформы

Привет! Меня зовут Максим Бабенко, я руковожу отделом технологий распределённых вычислений в Яндексе. Сегодня мы выложили в опенсорс платформу YTsaurus — одну из основных инфраструктурных BigData‑систем, разработанных в Яндексе.

YTsaurus — результат почти десятилетнего труда, которым нам хочется поделиться с миром. В этой статье мы расскажем историю возникновения YT, ответим на вопрос, зачем нужен YTsaurus, опишем ключевые возможности системы и обозначим область её применения.

В Github‑репозитории находится серверный код YTsaurus, инфраструктура развёртывания с использованием k8s, а также веб‑интерфейс системы и клиентский SDK для распространённых языков программирования — C++, Java, Go и Python. Всё это — под лицензией Apache 2.0, что позволяет всем желающим загрузить его на свои серверы, а также дорабатывать его под свои нужды.

Читайте далее на Хабре. Или смотрите видео:

Войдите, чтобы сохранить пост