Skip to main content

quantileTDigestWeighted

Приблизительно вычисляет квантиль числовой последовательности, используя алгоритм t-digest. Функция учитывает вес каждого элемента последовательности.

Максимальная ошибка 1%. Потребление памяти — log(n), где n — число значений. Результат не детерминирован и зависит от порядка выполнения запроса.

Производительность функции ниже, чем производительность функции quantile или quantileTiming. По соотношению размера состояния к точности вычисления, эта функция значительно превосходит quantile.

Внутренние состояния функций quantile* не объединяются, если они используются в одном запросе. Если вам необходимо вычислить квантили нескольких уровней, используйте функцию quantiles, это повысит эффективность запроса.

Примечание

Использование quantileTDigestWeighted не рекомендуется для небольших наборов данных и может привести к значительной ошибке. Рассмотрите возможность использования quantileTDigest в таких случаях.

Синтаксис

quantileTDigestWeighted(level)(expr, weight)

Синоним: medianTDigestWeighted.

Аргументы

  • level — уровень квантили. Опционально. Константное значение с плавающей запятой от 0 до 1. Мы рекомендуем использовать значение level из диапазона [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану.
  • expr — выражение, зависящее от значений столбцов, возвращающее данные числовых типов или типов Date, DateTime.
  • weight — столбец с весам элементов последовательности. Вес — это количество повторений элемента в последовательности.

Возвращаемое значение

  • Приблизительный квантиль заданного уровня.

Тип:

  • Float64 для входных данных числового типа.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

SELECT quantileTDigestWeighted(number, 1) FROM numbers(10)

Результат:

┌─quantileTDigestWeighted(number, 1)─┐
│ 4.5 │
└────────────────────────────────────┘

Смотрите также