Создание гистограммы с использованием API Snowpark Python

В Snowflake SQL есть функция WIDTH_BUCKET, которую можно использовать для создания гистограммы:

with hist as (
  select
    width_bucket(
      x,
      min(x) over (partition by null),
      max(x) over (partition by null),
      10
    ) as hist_bin
  from mydata
)

select hist_bin, count(*) as hist_count
from hist
group by 1
order by 1

Это утомительно, но это работает.

Однако я не вижу эквивалентной функции width_bucket в API Snowpark Python.

Есть ли аналог в Snowpark?

Или мне также нужно вручную создавать сегменты с большим уродливым выражением case?

python snowflake-cloud-data-platform histogram

06.06.2024 20:51

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вы можете получить доступ к любой встроенной функции SQL с помощью Snowflake.snowpark.functions.call_function

Из примеров документации:

>>> df = session.create_dataframe([1, 2, 3, 4], schema=["a"])  # a single column with 4 rows
>>> df.select(call_function("avg", col("a"))).show()

"AVG(""А"")" 2,500000

Чтобы получить доступ к пользовательской функции, используйте Snowflake.snowpark.functions.call_udf

06.06.2024 23:06

Другие вопросы по теме

Как использовать значение из набора результатов в цикле for в хранимой процедуре Snowflake?

Ошибка конвейера Azure DevOps: пароль не является целым числом в команде SnowSQL

Снежинка — проблема при использовании переменной Bind

Ошибка «Снежинка» с заголовком CSV: ... столбец «TRANSIENT_STAGE_TABLE»

Как предотвратить внедрение sql в функцию фильтра снежинки

Как программно выбрать конкретную схему в Snowpark на листе Snowsight Python?

Snowflake — временная метка устаревшего потока

Извлечение времени из атрибута даты/времени в Snowflake

Проблема с последовательностью снежинок

Снежинка SQL | Как суммировать различные значения за один проход?

Создание гистограммы с использованием API Snowpark Python

Ответы 1

Другие вопросы по теме

Похожие вопросы