CHYT

CHYT powered by ClickHouse — это технология, которая позволяет поднять кластер из серверов ClickHouse непосредственно на вычислительных узлах YTsaurus.

ClickHouse поднимается внутри Vanilla-операции и работает с данными, которые лежат в YTsaurus. Такая операция называется кликой (подробнее можно прочитать в разделе Концепции). Клики бывают публичные (доступные всем пользователям) и приватные (личная клика пользователя или команды). Публичная клика ch_public — основная общедоступная клика, запущенная на каждом кластере YTsaurus.

Основные преимущества

Подавляющее большинство родной функциональности ClickHouse доступно в CHYT. Ознакомиться с богатыми возможностями ClickHouse можно в официальной документации.

Помимо этого есть следующие плюсы:

  • Не нужно копировать данные из YTsaurus в ClickHouse.
  • Можно использовать вычислительную квоту в YTsaurus для быстрых вычислений.
  • Можно быстро проводить вычисления над данными в YTsaurus небольшого и среднего объемов (до 1 ТБ), до 100 раз быстрее чем запуск MapReduce операции.
  • Поддерживается работа со статическими таблицами и динамическими таблицами.

Ограничения

Обрабатываемые таблицы должны быть схематизированы.