-
Доверительный интервал
Доварительный интервал — это диапазон значений выборочной совокупности, в который попадает среднее генеральной совокупности с определенной вероятностью. Например, 95% доверительный интервал означает, что в диапазон значений от n1 до n2 с 95% вероятностью попадает среднее значение всей генеральной совокупности. Для нормального распределения это диапазон равняется среднее ± 1,96*σ. Сигма (σ) — это стандартное отклонение. Ссылки…
-
Корреляция и причинно-следственная связь
Корреляция — это некоторая взаимосвязь между двумя величинами, т.е. изменения этих величин синхронны. Корреляция может бычть прямая и обратная. Причинно-следственная связь — это явление, когда мы точно знаем, что из-за изменения одной величины изменится другая, например, из-за изменения цены на какое-либо сырье изменится и цена конечного продукта. При этом приравнивать корреляцию и причинно-следственную связь нельзя,…
-
Нормальное распределение
Нормальное распределение — это распределение плотности вероятности, которое имеет колоколообразную форму. Также называется Гауссовым. Закон нормального распределения находит свое отражение везде вокруг нас, где мы получаем большое количество измерений — рост, вес, размеры листа дерева и многое другое. Какие же есть свойства у нормального распределения Ссылки на материалы:
-
Виды средних
В распределении можно рассчитать несколько видов средних. Основные из них — мат. ожидание, мода, медиана, гармоническое, геометрическое, и др. Основные виды: В разных случаях тот или иной метод лучше описывает распределение. Например, если у нас идеальное нормальное распределение, среднее, мода, медиана совпадают. А если у нашего распределения длинный хвост справа, то медиана и мода будут…
-
Квартиль
Квартиль переводится как четверть. Какие есть квартили: Разница между третьим и первым квартилями называется межквартильным расстоянием Ссылки на материалы:
-
Медиана
Медиана в статистике — величина в выборке, которая делит выборку пополам — т.е. половина значений выборки больше медианы, а половина — меньше. Ссылки на материалы:
-
Мода
Мода в статистике — наиболее часто встречающееся значение в выборке. Ссылки на материалы:
-
Математическое ожидание
Математическое ожидание — среднее значение случайной величины. Рассчитывается также как сумма произведений всех ее значений на вероятности этих значений. Ссылки на метариалы:
-
Характеристики распределения
У любого распределения есть характеристики, которые его описывают. Основные характеристики: Ссылки на материалы:
-
Выбросы в статистике
Выброс — элемент выборки, значительно отличающийся от других значений выборки. Один из вариантов определения выбросов: Графически можно посмотреть выбросы, построив распределения — гистограммы, боксплот. Ссылки на материалы:
-
Закон больших чисел
Закон больших чисел (ЗБЧ) гласит, что в большой выборке среднее значение этой выборке будет близко с теоретическому среднему. И чем больше выборка, тем ближе это эмпирическое среднее к теоретическому. Ссылки на материалы:
-
Что такое межквартильное расстояние
Межквартильное расстояние — это расстояние между первым и третьим квартилями или между 25 (1 квартиль) и 75 (3 квартиль) процентилями. Ссылки на материалы: