Обучаем ML-модели и запускаем batch-инференс на YTsaurus, как в Яндексе

Доклад с конференции Yandex Neuro Scale 2025

На конференции Yandex Scale в сентябре 2025 года Никита Семёнов показал, как использовать YTsaurus для разработки интеллекта автономного транспорта. Но это лишь часть более общего тренда: платформа используется в ML‑проектах разного масштаба. Чем в них полезен YTsaurus:

  • позволяет распараллеливать обучение и batch‑инференс от одной до тысяч GPU,
  • автоматически распределяет доступные вычислительные ресурсы между задачами,
  • даёт возможность работать с данными — от подготовки до хранения — единым способом.

За счёт этого мы улучшаем совместимость разных ML‑проектов и снижаем операционные издержки. Для Яндекса важно, что благодаря этому можно добиться постоянного использования имеющихся GPU и CPU, и поддерживать одну систему вместо нескольких.

В материале на Хабре рассказываем, как попробовать возможности платформы самостоятельно. Внутри статьи вы также найдёте полную инструкцию с подробным описанием пяти сценариев практического воркшопа.

Войдите, чтобы сохранить пост