Bigdata SQL: Impala

Impala is an MPP-based SQL query engine that provides high-performance, lowlatency SQL queries on data stored in HDFS in different file formats. Impala integrates  with the Apache Hive metastore and provides a high level of integration with Hive and compatibility with the HiveQL syntax. The Impala server is a distributed engine consisting of daemon processes, such as the Impala deamon itself and the catalog service, and statestore deamons.

Impala – это основанный на MPP механизм SQL-запросов, который обеспечивает высокопроизводительные SQL-запросы с низкой задержкой для данных, хранящихся в HDFS в различных форматах файлов. Impala интегрируется с хранилищем метаданных Apache Hive и обеспечивает высокий уровень интеграции с Hive и совместимость с синтаксисом HiveQL. Сервер Impala – это распределенный механизм, состоящий из процессов-демонов, таких как сам  Impala и служба каталога, а также процессы основного хранилища.