Проверка упавших джобов

При работе с кликами в YTsaurus иногда возникают сбои — например, запросы выполняются с ошибками или прерываются. Из-за этих сбоев внутри YT‑операции падают джобы (задания). Чтобы оперативно выявить и устранить проблему, нужно уметь анализировать логи упавших джобов.

Важно

Если число упавших джобов операции превысит 100, логирование остановится — логи не сохранятся. Поэтому важно оперативно реагировать на сбои, чтобы избежать потери информации.

Как посмотреть и проанализировать логи

Failed Jobs

  1. Откройте веб-интерфейс YT‑операции (1), как описано в разделе Как попасть в веб-интерфейс YT-операции.

  2. Справа в блоке Failed (2) проверьте количество упавших джобов.

  3. Перейдите на вкладку Jobs (3) на панели вкладок.

  4. В открывшемся списке джобов с помощью фильтра State: Failed (4) найдите те, которые упали.

  5. В строке с упавшим джобом найдите столбец Error / Debug.

  6. Чтобы выгрузить лог джоба, в поле Stderr (5) нажмите кнопку Download download.

  7. Изучите лог и обратите внимание на следующее:

    • сообщения об ошибках (обычно содержат ключевые слова Error, Exception, Failed);
    • временные метки (чтобы понять, когда именно произошёл сбой);
    • упоминания ресурсов (например, таблиц или файлов), с которыми работал джоб.

Примечание

Сохраняйте логи упавших джобов — они пригодятся для:

  • мониторинга стабильности системы;
  • анализа повторяющихся ошибок;
  • предоставления данных в в службу поддержки.