Categorygithub.com/pivolan/stats_analyzer
repositorypackage
0.0.0-20241220210236-78c12f06bd66
Repository: https://github.com/pivolan/stats_analyzer.git
Documentation: pkg.go.dev

# Packages

No description provided by the author

# README

stats_analyzer

итоги

Мы можем сделать запрос на все цифровые колонки, чтобы узнать их средние значения, в том числе медиану, квантили, макс мин и среднее и сумму. Далее получаем количество уникальных значений для каждой колонки. Создаем группировку для каждой строковой колонки и показываем 10 самых популярных значений, не делаем это для колонок, где уникальных значений больше 1000 и больше 10% от общего датасета. создаем группировку для всех колонок, уникальность которых меньше 1000 и показываем самые популярные значения с этими группировками показываем самые не популярные значения, 10 штук. показываем гистограмму распределения для каждого цифрового значения но делаем выборку из самых популярных значений. берем между квантилями 0,4 и 0,6, гистограмму из 100 значений

находим колонки с датами, для каждой такой колонки делаем такую выборку: общее количество, сумма каждой цифровой колонки, + медиана каждой цифры + среднее значение с группировкой по дням, месяцам, часам