Машинное обучение

YTsaurus покрывает все этапы ML-пайплайна: подготовку данных, обучение моделей, валидацию и inference. Данные не перемещаются между системами — всё происходит в одном месте с прозрачным управлением ресурсами.

Цикл работы ML-инженера

Обрабатывайте миллиарды записей из логов, событий и телеметрии с помощью SPYT, MapReduce или YQL. Выполняйте сложные JOIN’ы, агрегации и трансформации данных прямо в хранилище — без выгрузки во внешние системы.

Статические таблицы хранят исторические датасеты с поколоночным сжатием и схематизацией

Динамические таблицы позволяют инкрементально обновлять признаки в реальном времени.

Встроенные очереди с поддержкой Kafka-интерфейса позволяют направить поток данных прямо в систему без дополнительных интеграций.