В этой статье рассмотрим 4 математические функции с конкретными примерами, которые часто используются при анализе данных.
В современном мире анализ данных является неотъемлемой частью принятия решений в различных сферах жизни. Математическая статистика является мощным инструментом для работы с данными, который позволяет извлекать из них полезную информацию. В данной статье мы рассмотрим 5 ключевых функций статистики, которые помогут вам в анализе данных.
Функция 1: Среднее значение
Среднее арифметическое значение (mean) — это одна из самых распространенных и простых статистических характеристик. Она представляет собой сумму всех значений в выборке, деленную на их количество. Среднее значение используется для определения центральной тенденции в наборе данных. Это может быть полезно, например, при анализе продаж или доходов, где среднее значение показывает среднюю сумму покупки или дохода.
Excel функция =СРЗНАЧ()
Однако стоит помнить, что среднее значение не всегда является лучшим показателем центральной тенденции. В случае, если в наборе данных есть выбросы, среднее значение может быть искажено ими. В таких случаях лучше использовать медиану, которая является более устойчивой к выбросам.
Наглядно это можно увидеть в примере ниже.
Ситуация 1 | Ситуация 2 | |
Europe Corp | 1 000,00 | 1 000,00 |
Europe Corp | 10 000,00 | 1 500,00 |
Europe Corp | 5,00 | 1 324,00 |
Среднее значение | 3 668,33 | 1 274,67 |
Функция 2: Медиана
Медиана (median) — это значение, которое разделяет выборку на две равные половины. То есть, половина значений выборки меньше медианы, а другая половина — больше.
Медиана является более устойчивой характеристикой, чем среднее значение, так как она не подвержена влиянию выбросов. Это делает ее особенно полезной при анализе данных с возможными выбросами или при работе с небольшими выборками.
Excel функция =МЕДИАНА()
Наглядно это можно увидеть в примере ниже.
| Ситуация 1 | Ситуация 2 |
Europe Corp | 1 000,00 | 1 000,00 |
Europe Corp | 10 000,00 | 1 500,00 |
Europe Corp | 5,00 | 1 324,00 |
Медиана | 1 000,00 | 1 324,00 |
Функция 3: Стандартное отклонение
Стандартное отклонение (standard deviation) — это мера того, насколько значения в выборке отклоняются от среднего значения. Оно показывает, насколько данные разбросаны вокруг среднего значения, и может использоваться для определения степени вариации данных.
Стандартное отклонение является полезным инструментом для определения характера распределения данных и выявления аномалий. Оно также используется для построения доверительных интервалов и проверки гипотез.
Excel функция =СТАНДОТКЛОН.В()
Наглядно это можно увидеть в примере ниже.
Ситуация 1 | Ситуация 2 | |
Europe Corp | 1 000,00 | 1 000,00 |
Europe Corp | 10 000,00 | 1 500,00 |
Europe Corp | 5,00 | 1 324,00 |
Станд. отклонение | 5 505,91 | 253,62 |
Функция 4: Коэффициент корреляции
Коэффициент корреляции (correlation coefficient) — это статистическая величина, которая показывает степень линейной связи между двумя переменными. Показатель степени связи между двумя переменными или измерениями.
Значения коэффициента корреляции могут варьироваться от -1 до +1, где -1 означает полную отрицательную корреляцию, 0 — отсутствие связи, а +1 — полную положительную корреляцию. Обозначается буквой r.
- r=0 — нет никакой связи;
- r =0.01–0.3 — слабая связь;
- r =0.31–0.7 — умеренная связь;
- r =0.71–0.99 — сильная связь;
- r =1 — совершенная связь.
Коэффициент корреляции позволяет определить, есть ли связь между двумя переменными, и если да, то какова ее характер. Это важно при анализе взаимосвязей между различными факторами, влияющими на исследуемый процесс или явление.
Excel функция =КОРРЕЛ()
На примере ниже рассмотрим корреляцию количества купленного мороженого к температуре воздуха. В последних двух примерах мы видим, что чем больше температура воздуха, тем больше/меньше мороженого куплено. А значит, такие данные можно использовать для анализа и поиска зависимости. А вот в первой колонке связи почти нет.
Кол-во мороженого | Температура | Кол-во мороженого | Температура | Кол-во мороженого | Температура |
124 | 20 | 25 | 20 | 365 | 20 |
365 | 25 | 124 | 25 | 124 | 25 |
25 | 30 | 365 | 30 | 25 | 30 |
-0,28 | 0,97 | -0,97 |
А какими функциями пользуетесь вы?
Наши курсы
Видео версию другого урока можно посмотреть тут.
Если вам понравился урок, то можете поддержать проект по кнопке ниже. Это очень поможет делать для вас больше интересных и полезных выпусков. Спасибо!
Если вам понравился урок, подписывайтесь на канал или группу и ставьте лайки. А также пишите в комментариях свои кейсы или вопросы. Самые интересные мы обязательно разберем.