Информационная "копилка" опыта педагогов в сфере экологического образования и воспитания
Ошмарин Александр Петрович
Рекомендации для учителей, педагогов дополнительного образования и школьников Рассмотрим применение статистического метода хи-квадрат на примере генетической задачи. Решение вопроса о том, случайно ли отклонение фактически полученного расщепления потомства при скрещивании от теоретически рассчитанного, возможно только с применением методов статистики. Самым простым и удобным методом является критерий хи-квадрат, предложенный английским математиком К. Пирсоном в 1900 году. Его суть сводится к расчету некоей величины c
2 и ее дальнейшей оценке. Расчет осуществляется по формуле:
где S — знак суммы, q — теоретически ожидаемое число особей с определенным признаком, d — отклонение фактически полученных данных от теоретически ожидаемых для каждого класса (p – q). В процессе расчетов сначала высчитывают отклонение (в ту или иную сторону) фактического расщепления по каждому классу от теоретически рассчитанного. Например, при моногибридном скрещивании из общего числа в 100 полученных горошин теоретически рассчитанное по предполагаемой формуле расщепления 3 : 1 число зеленых горошин = 25, желтых = 75, фактически получено 23 зеленых и 77 желтых горошин. Следовательно, отклонение по зеленым горошинам составляет –2, по желтым +2 (сумма всех отклонений должна равняться нулю). Затем каждое отклонение возводят в квадрат (d2, в данном случае 2 х 2 = 4) и делят его на теоретически ожидаемое число (q, в данном случае на 25 и 75). Затем все частные суммируют и получают величину c 2 (в нашем примере 4/25 + 4/75 » 0,213). Оценку величины c 2 проводят по таблице Фишера:
В этой таблице вероятность (Р) — числовая мера возможности появления случайного события, заключенная между нулем и единицей. При Р = 1 событие считается достоверным, то-есть единственно возможным, при Р = 0 оно оказывается невозможным, при 0 < Р < 1 — случайным или возможным с разной степенью вероятности. При Р = 1 наблюдалось бы полное соответствие теоретически рассчитанных и экспериментальных данных, но это практически невозможно. Поэтому необходимо принять уровень значимости, при котором отклонением можно пренебречь и принять нулевую гипотезу. В биологических исследованиях обычно принимают 5%-ный уровень значимости, которому отвечает вероятность Р = 0,05. Она говорит о том, что если сравниваемые величины отличаются случайно, то значение хи-квадрат, указанное в таблице, может появиться только в 5 выборках из 100 подобных. Значит, если рассчитанный нами показатель c 2 будет равен или больше указанного в таблице в колонке 0,05, это означает, что различия между сравниваемыми величинами нельзя считать случайными, и нулевую гипотезу следует отвергнуть. Вероятность 0,01 говорит о том же, только появление значения хи-квадрат, указанного в таблице, возможно лишь один раз на 100, т.е. еще более редко. Нулевая гипотеза подтверждается, если рассчитанное значение c 2 меньше табличного для данной вероятности. Наконец, что такое число степеней свободы? Это число независимо рассчитанных теоретически ожидаемых величин. В рассматриваемом примере рассчитаны две теоретически ожидаемые величины (число желтых и зеленых горошин). Однако если рассчитать число горошин с рецессивным признаком, то число горошин с доминантным признаком определяется автоматически (в 3 раза больше), оно зависит от числа горошин с рецессивным признаком (и наоборот). Следовательно, в данном случае число независимо рассчитанных величин равно единице. Это и есть число степеней свободы. В общем виде число степеней свободы при анализе расщепления всегда равно числу различных классов минус единица. Критерий хи-квадрат дает надежные результаты, если объем выборки более 50, а теоретически ожидаемые частоты в классах не менее 5. [вверх] |