# Packages

config

No description provided by the author

stats_analyzer

итоги

Мы можем сделать запрос на все цифровые колонки, чтобы узнать их средние значения, в том числе медиану, квантили, макс мин и среднее и сумму. Далее получаем количество уникальных значений для каждой колонки. Создаем группировку для каждой строковой колонки и показываем 10 самых популярных значений, не делаем это для колонок, где уникальных значений больше 1000 и больше 10% от общего датасета. создаем группировку для всех колонок, уникальность которых меньше 1000 и показываем самые популярные значения с этими группировками показываем самые не популярные значения, 10 штук. показываем гистограмму распределения для каждого цифрового значения но делаем выборку из самых популярных значений. берем между квантилями 0,4 и 0,6, гистограмму из 100 значений

находим колонки с датами, для каждой такой колонки делаем такую выборку: общее количество, сумма каждой цифровой колонки, + медиана каждой цифры + среднее значение с группировкой по дням, месяцам, часам

# Packages

# README

stats_analyzer