В этой статье рассмотрим 4 математические функции с конкретными примерами, которые часто используются при анализе данных.
В современном мире анализ данных является неотъемлемой частью принятия решений в различных сферах жизни. Математическая статистика является мощным инструментом для работы с данными, который позволяет извлекать из них полезную информацию. В данной статье мы рассмотрим 5 ключевых функций статистики, которые помогут вам в анализе данных.
Функция 1: Среднее значение
Среднее арифметическое значение (mean) – это одна из самых распространенных и простых статистических характеристик. Она представляет собой сумму всех значений в выборке, деленную на их количество. Среднее значение используется для определения центральной тенденции в наборе данных. Это может быть полезно, например, при анализе продаж или доходов, где среднее значение показывает среднюю сумму покупки или дохода.
Excel функция =СРЗНАЧ()
Однако стоит помнить, что среднее значение не всегда является лучшим показателем центральной тенденции. В случае, если в наборе данных есть выбросы, среднее значение может быть искажено ими. В таких случаях лучше использовать медиану, которая является более устойчивой к выбросам.
Наглядно это можно увидеть в примере ниже.
Ситуация 1 | Ситуация 2 | |
Europe Corp | 1 000,00 | 1 000,00 |
Europe Corp | 10 000,00 | 1 500,00 |
Europe Corp | 5,00 | 1 324,00 |
Среднее значение | 3 668,33 | 1 274,67 |
Функция 2: Медиана
Медиана (median) – это значение, которое разделяет выборку на две равные половины. То есть, половина значений выборки меньше медианы, а другая половина – больше.
Медиана является более устойчивой характеристикой, чем среднее значение, так как она не подвержена влиянию выбросов. Это делает ее особенно полезной при анализе данных с возможными выбросами или при работе с небольшими выборками.
Excel функция =МЕДИАНА()
Наглядно это можно увидеть в примере ниже.
| Ситуация 1 | Ситуация 2 |
Europe Corp | 1 000,00 | 1 000,00 |
Europe Corp | 10 000,00 | 1 500,00 |
Europe Corp | 5,00 | 1 324,00 |
Медиана | 1 000,00 | 1 324,00 |
Функция 3: Стандартное отклонение
Стандартное отклонение (standard deviation) – это мера того, насколько значения в выборке отклоняются от среднего значения. Оно показывает, насколько данные разбросаны вокруг среднего значения, и может использоваться для определения степени вариации данных.
Стандартное отклонение является полезным инструментом для определения характера распределения данных и выявления аномалий. Оно также используется для построения доверительных интервалов и проверки гипотез.
Excel функция =СТАНДОТКЛОН.В()
Наглядно это можно увидеть в примере ниже.
Ситуация 1 | Ситуация 2 | |
Europe Corp | 1 000,00 | 1 000,00 |
Europe Corp | 10 000,00 | 1 500,00 |
Europe Corp | 5,00 | 1 324,00 |
Станд. отклонение | 5 505,91 | 253,62 |
Функция 4: Коэффициент корреляции
Коэффициент корреляции (correlation coefficient) – это статистическая величина, которая показывает степень линейной связи между двумя переменными. Показатель степени связи между двумя переменными или измерениями.
Значения коэффициента корреляции могут варьироваться от -1 до +1, где -1 означает полную отрицательную корреляцию, 0 – отсутствие связи, а +1 – полную положительную корреляцию. Обозначается буквой r.
- r=0 — нет никакой связи;
- r =0.01–0.3 — слабая связь;
- r =0.31–0.7 — умеренная связь;
- r =0.71–0.99 — сильная связь;
- r =1 — совершенная связь.
Коэффициент корреляции позволяет определить, есть ли связь между двумя переменными, и если да, то какова ее характер. Это важно при анализе взаимосвязей между различными факторами, влияющими на исследуемый процесс или явление.
Excel функция =КОРРЕЛ()
На примере ниже рассмотрим корреляцию количества купленного мороженого к температуре воздуха. В последних двух примерах мы видим, что чем больше температура воздуха, тем больше/меньше мороженого куплено. А значит, такие данные можно использовать для анализа и поиска зависимости. А вот в первой колонке связи почти нет.
Кол-во мороженого | Температура | Кол-во мороженого | Температура | Кол-во мороженого | Температура |
124 | 20 | 25 | 20 | 365 | 20 |
365 | 25 | 124 | 25 | 124 | 25 |
25 | 30 | 365 | 30 | 25 | 30 |
-0,28 | 0,97 | -0,97 |
А какими функциями пользуетесь вы?
Видео версию другого урока можно посмотреть тут.
Если вам понравился урок, то можете поддержать проект по кнопке ниже. Это очень поможет делать для вас больше интересных и полезных выпусков. Спасибо!
Если вам понравился урок, подписывайтесь на канал или группу и ставьте лайки. А также пишите в комментариях свои кейсы или вопросы. Самые интересные мы обязательно разберем.