Книга Статистика и котики, страница 7. Автор книги Владимир Савельев

Разделитель для чтения книг в онлайн библиотеке

Онлайн книга «Статистика и котики»

Cтраница 7

Статистика и котики

Чтобы разобраться во всех этих влияниях, статистики пользуются многофакторным дисперсионным анализом. Простейший из них — двухфакторный — разбивает дисперсию на четыре части. Первая отвечает за влияние вида на размер, вторая — за влияние диеты, третья — за взаимодействие этих факторов, а последняя определяется всякими левыми причинами.


Статистика и котики

Проверяем мы аж три нулевые гипотезы.

1. Биологический вид не связан с размером.

2. Диета не связана с размером.

3. Диета действует на всех животных одинаково.


Статистика и котики

Соответственно, для каждой из них считается свой критерий Фишера. И — как и в однофакторном дисперсионном анализе — чем его значение больше, тем больше влияние того или иного фактора.


Статистика и котики

Для интерпретации результатов двухфакторного дисперсионного анализа легче всего воспользоваться вот такими графиками. Они отражают и средние значения, и дисперсию, и влияние каждого фактора, и их взаимодействие.


Статистика и котики

В частности из этого графика мы можем сделать следующие выводы.

1. В среднем самые большие животные — слоники, а самые маленькие — котики.

2. Диета по-разному влияет на животных в зависимости от вида. Котики, будучи облигатными хищниками, лучше растут при мясной диете, слоники — наоборот, а вот песикам по большому счету все равно, что есть.

3. Если не учитывать влияние вида, то разные формы диеты не влияют на средний размер животных. Если бы такое влияние существовало, то и котики, и песики, и слоники вырастали бы больше при употреблении мяса, чем при употреблении капусты.

Дисперсионные анализы для трех и более факторов строятся подобным образом: мы проверяем влияние каждого фактора, а также все возможные взаимодействия между ними.


НЕМАЛОВАЖНО ЗНАТЬ!

Сколько нужно котиков?


К настоящему моменту мы продвинулись довольно-таки далеко в вопросах применения статистических критериев для изучения особенностей котиков и других видов животных. Однако за бортом остался очень важный вопрос: сколько котиков необходимо измерить, чтобы критерии давали надежный результат?

Дело в том, что, если вы измерите слишком мало котиков, песиков и слоников, вы можете не зафиксировать даже ощутимые различия. Это может произойти, например, если вам случайно попались очень большие котики и очень маленькие слоники, что при маленьких выборках время от времени случается.


Статистика и котики

В то же самое время, если вы наберете слишком большую выборку, то даже минимальное отклонение от нулевой гипотезы будет давать значимый результат.

Поэтому котиков должно быть не слишком много и не слишком мало. И чтобы определить, сколько их должно быть, проводятся специальные вычисления.

Оптимальный размер выборки зависит от нескольких факторов, главными из которых являются критический p-уровень значимости (как правило, 0,05 или 0,01) и показатель мощности критерия. Последняя определяется как вероятность того, что этот критерий найдет значимые различия там, где они действительно есть. Оптимальным считается показатель мощности в 0,8. Соответственно, в оставшихся 20% случаев критерий пропустит значимые различия.

Оставшиеся факторы определяются самой природой критерия.

В некоторых статистических программах есть специальные калькуляторы мощности. Выбрав необходимый критерий, задав p <0,05 и мощность выше 0,8 и проделав некоторые дополнительные операции, вы можете получить количество котиков, необходимое для проведения исследований.


Статистика и котики
Глава 7.
Что делать, если котик заболел
или критерии различий для связанных выборок

Если ваш котик заболел, то его, разумеется, надо лечить. И, как правило, мы делаем это с помощью лекарств. Однако лекарство — штука сложная. Одним котикам оно поможет, на других не повлияет, третьим же может стать хуже.


Статистика и котики

Отсюда вопрос: как понять, можно ли давать лекарство заболевшему котику или нет? Ответ на него могут дать меры различий для связанных выборок. Нулевая гипотеза таких критериев — после приема лекарств состояние котиков не изменится.

Первое, что приходит в голову, это посчитать количество котиков, которые выздоровели, и число котиков, которым стало хуже, а затем сравнить эти показатели между собой. Котики, на которых лекарство не повлияло, обычно не учитываются.


Статистика и котики

Такой подход вполне справедлив, и соответствующий метод называется критерием знаков. Однако на практике он применяется нечасто, поскольку не позволяет определить, насколько сильно изменилось состояние котиков.


Статистика и котики

Гораздо чаще мы можем встретить вариант уже известного нам критерия Стьюдента — t-критерий для связанных (зависимых) выборок. Идея тут также довольно проста. Сначала мы считаем разности между состоянием каждого котика до и после приема лекарств. Затем мы находим среднее значение от этих разностей.


Статистика и котики

Очевидно, что чем больше это значение, тем сильнее улучшилось или ухудшилось среднее состояние котиков. Если же одной половине котиков стало лучше, а другой — ровно настолько же хуже, то средняя разность будет равна 0.

Вход
Поиск по сайту
Ищем:
Календарь
Навигация