А здесь блог про аналитику

  • Доверительный интервал

    Доварительный интервал — это диапазон значений выборочной совокупности, в который попадает среднее генеральной совокупности с определенной вероятностью. Например, 95% доверительный интервал означает, что в диапазон значений от n1 до n2 с 95% вероятностью попадает среднее значение всей генеральной совокупности. Для нормального распределения это диапазон равняется среднее ± 1,96*σ. Сигма (σ) — это стандартное отклонение. Ссылки…


  • Корреляция и причинно-следственная связь

    Корреляция — это некоторая взаимосвязь между двумя величинами, т.е. изменения этих величин синхронны. Корреляция может бычть прямая и обратная. Причинно-следственная связь — это явление, когда мы точно знаем, что из-за изменения одной величины изменится другая, например, из-за изменения цены на какое-либо сырье изменится и цена конечного продукта. При этом приравнивать корреляцию и причинно-следственную связь нельзя,…


  • Нормальное распределение

    Нормальное распределение — это распределение плотности вероятности, которое имеет колоколообразную форму. Также называется Гауссовым. Закон нормального распределения находит свое отражение везде вокруг нас, где мы получаем большое количество измерений — рост, вес, размеры листа дерева и многое другое. Какие же есть свойства у нормального распределения Ссылки на материалы:


  • Виды средних

    В распределении можно рассчитать несколько видов средних. Основные из них — мат. ожидание, мода, медиана, гармоническое, геометрическое, и др. Основные виды: В разных случаях тот или иной метод лучше описывает распределение. Например, если у нас идеальное нормальное распределение, среднее, мода, медиана совпадают. А если у нашего распределения длинный хвост справа, то медиана и мода будут…


  • Квартиль

    Квартиль переводится как четверть. Какие есть квартили: Разница между третьим и первым квартилями называется межквартильным расстоянием Ссылки на материалы:


  • Медиана

    Медиана в статистике — величина в выборке, которая делит выборку пополам — т.е. половина значений выборки больше медианы, а половина — меньше. Ссылки на материалы:


  • Мода

    Мода в статистике — наиболее часто встречающееся значение в выборке. Ссылки на материалы:


  • Математическое ожидание

    Математическое ожидание — среднее значение случайной величины. Рассчитывается также как сумма произведений всех ее значений на вероятности этих значений. Ссылки на метариалы:


  • Характеристики распределения

    У любого распределения есть характеристики, которые его описывают. Основные характеристики: Ссылки на материалы:


  • Выбросы в статистике

    Выброс — элемент выборки, значительно отличающийся от других значений выборки. Один из вариантов определения выбросов: Графически можно посмотреть выбросы, построив распределения — гистограммы, боксплот. Ссылки на материалы:


  • Закон больших чисел

    Закон больших чисел (ЗБЧ) гласит, что в большой выборке среднее значение этой выборке будет близко с теоретическому среднему. И чем больше выборка, тем ближе это эмпирическое среднее к теоретическому. Ссылки на материалы:


  • Что такое межквартильное расстояние

    Межквартильное расстояние — это расстояние между первым и третьим квартилями или между 25 (1 квартиль) и 75 (3 квартиль) процентилями. Ссылки на материалы: