Статистические тестирования: для чего они нужны и как их проводить
Анализ данных • 24 июля 2024 • 5 мин чтения
Статистические тестирования: для чего они нужны и как их проводить
Аналитики данных помогают бизнесу находить неочевидные закономерности и проверять гипотезы с помощью статистических тестов. Рассказываем, в чём их суть и как их проводят.
Аналитики данных применяют в работе три раздела статистики:
1. Описательная статистика. Используется для описания характеристик набора данных. Есть, например, среднее, медиана, стандартное отклонение.
2. Корреляционный анализ. Статистический метод, с помощью которого исследуют взаимосвязи между наборами данных. При этом не всегда отсутствие корреляции значит, что связи нет, и наоборот.
3. Индуктивная статистика. Помогает делать выводы о популяции на основе выборок. Сюда как раз относят статистические тестирования.
Научиться решать задачи бизнеса с помощью статистики можно на курсе Практикума «Аналитик данных». После окончания учёбы студенты смогут проводить тестирования, создавать дашборды и рассчитывать ключевые метрики компании.
Вернёмся к статистическим тестам: они помогают определить, насколько важны различия между выборками. Выборка — это часть генеральной совокупности, которую ещё называют всей совокупностью объектов, или популяцией. Выборка должна быть репрезентативной, то есть обладать характеристиками генеральной совокупности. Например, генсовокупность — все люди, которые покупали что-то в интернете, а выборка — это 1000 случайных людей из всех тех, кто приобретал что-то онлайн.
Разберём суть статистических тестов на примере тестирования медицинского препарата. Пример упрощён: в реальности в таких тестах используют двойной слепой метод, когда участники и исследователи не знают деталей эксперимента до его окончания.
Есть две группы людей, которые принимали новые таблетки для повышения уровня IQ. Прежде чем проводить тест, необходимо выдвинуть гипотезу. Результаты теста покажут, подтверждается она или нет. Статистические гипотезы обычно делятся на две: нулевую и альтернативную.
При проведении статистического теста аналитик обычно начинает с предположения, что нулевая гипотеза верна, и пытается опровергнуть её. Если полученные данные не согласуются с нулевой гипотезой, аналитик принимает альтернативную гипотезу. При этом даже когда результат подтверждает нулевую гипотезу, это не обязательно означает, что она верна, — всегда существует вероятность ошибки.
Есть два типа ошибок:
1. Ошибка первого рода. В результате теста нулевую гипотезу не принимают, но на самом деле она верна.
2. Ошибка второго рода. Нулевую гипотезу принимают, но на самом деле она не верна.
Результат теста должен быть статистически значимым — то есть он с высокой вероятностью не случаен и отражает реальную ситуацию. Статистическую значимость в аналитике данных обозначают показателем p-value. Ещё существует уровень значимости alpha — вероятность ошибки первого рода, когда есть риск отвергнуть истинную нулевую гипотезу. Обычно аналитики используют значение alpha 0,05 (5%), для повышения точности иногда берут 0,01 (1%).
Виды статистических тестов различают по особенностям данных, которые нужно протестировать, и целям тестирования. Разберём подробнее два типа: параметрические и непараметрические.
Параметрические тесты предполагают, что данные распределяются по определённому шаблону. Часто это нормальное (или Гауссово) распределение — в виде колокола. Если изобразить его на графике, большинство значений сосредоточено вокруг среднего, а крайние значения встречаются редко.
Продолжим пример с IQ. Распределение коэффициента интеллекта нормальное, то есть среднее значение IQ всех людей стремится к 100. Поэтому проверка действия таблеток для ума — это параметрический тест. Препарат дают членам тестовой выборки и анализируют результаты на