CHYT
CHYT powered by ClickHouse — это технология, которая позволяет поднять кластер из серверов ClickHouse непосредственно на вычислительных узлах YTsaurus.
ClickHouse поднимается внутри Vanilla-операции и работает с данными, которые лежат в YTsaurus. Такая операция называется кликой (подробнее можно прочитать в разделе Концепции). Клики бывают публичные (доступные всем пользователям) и приватные (личная клика пользователя или команды). Публичная клика ch_public
— основная общедоступная клика, запущенная на каждом кластере YTsaurus.
Основные преимущества
Подавляющее большинство родной функциональности ClickHouse доступно в CHYT. Ознакомиться с богатыми возможностями ClickHouse можно в официальной документации.
Помимо этого есть следующие плюсы:
- Не нужно копировать данные из YTsaurus в ClickHouse.
- Можно использовать вычислительную квоту в YTsaurus для быстрых вычислений.
- Можно быстро проводить вычисления над данными в YTsaurus небольшого и среднего объемов (до 1 ТБ), до 100 раз быстрее чем запуск MapReduce операции.
- Поддерживается работа со статическими таблицами и динамическими таблицами.
Ограничения
Обрабатываемые таблицы должны быть схематизированы.