Вроде бы, приблизительное освоение R , стат. пакета для великих и ужасных, оказалось не столь уж трудоемким делом. Думаю, что данные для следующей статьи буду уже обсчитывать этой программой. В качестве введения использовал n+1 вопрос про R А.Б. Шипунова (МГУ). Интересно, что практически одновременно за освоение R принялся
kouprianov (http://kouprianov.livejournal.com/104184.html). Итак, первые пробные результаты:
Данные, две выборки (это средние значения для популяций числа дорсальных щетинок в рядах 1-4):
1) 27.13333 27.0 26.8 25.81818 24.33333 29.0 26.125 25.44444 25.66667 26.66667 27.5 25.0 27.0 28.25 26.25 25.85714 25.5 26.0 26.2 25.83333 26.11765 26.4 26.46667 24.0 26.4 27.0 26.73333 25.94118
2) 22.33333 24.8 23.26667 22.2 22.0 23.16667
Критерий Манна-Уитни (результат, который дает Statistica):
А вот три результата, которые дают разные пакеты из состава R:
Wilcoxon rank sum test with continuity correction (wilcox.test)
W = 166, p-value = 0.0002303
(Warning message: In wilcox.test.default совпадающие значения: не могу высчитать точное p-value)
Exact Wilcoxon rank sum test (wilcox.exact, пакет exactRankTests)
W = 166, p-value = 5.205e-06
Asymptotic Wilcoxon Mann-Whitney Rank Sum Test (wilcox_test, пакет coin)
Z = 3.7058, p-value = 0.0002107
Похоже, что первый результат R примерно совпадает с первым результатом Статистики (но значение p все же другое!), второй результат R - с третьим результатом Статистики (значение p другое!), и третий результат R - со вторым результатом Статистики (возможно, что здесь совпадение точное). Важно то, что в Статистике совершенно непонятно, что как считалось, тогда как в хелпах к R, кажется, достаточно легко найти ссылки на конкретные алгоритмы.
![[livejournal.com profile]](https://www.dreamwidth.org/img/external/lj-userinfo.gif)
Данные, две выборки (это средние значения для популяций числа дорсальных щетинок в рядах 1-4):
1) 27.13333 27.0 26.8 25.81818 24.33333 29.0 26.125 25.44444 25.66667 26.66667 27.5 25.0 27.0 28.25 26.25 25.85714 25.5 26.0 26.2 25.83333 26.11765 26.4 26.46667 24.0 26.4 27.0 26.73333 25.94118
2) 22.33333 24.8 23.26667 22.2 22.0 23.16667
Критерий Манна-Уитни (результат, который дает Statistica):
| Rank Sum | Rank Sum | U | Z | p-level | Z | p-level | Valid N | Valid N | 2*1sided |
D1_4 | 572.0000 | 23.00000 | 2.000000 | 3.704382 | 0.000212 | 3.705798 | 0.0002107 | 28 | 6 | 0.0000059484 |
А вот три результата, которые дают разные пакеты из состава R:
Wilcoxon rank sum test with continuity correction (wilcox.test)
W = 166, p-value = 0.0002303
(Warning message: In wilcox.test.default совпадающие значения: не могу высчитать точное p-value)
Exact Wilcoxon rank sum test (wilcox.exact, пакет exactRankTests)
W = 166, p-value = 5.205e-06
Asymptotic Wilcoxon Mann-Whitney Rank Sum Test (wilcox_test, пакет coin)
Z = 3.7058, p-value = 0.0002107
Похоже, что первый результат R примерно совпадает с первым результатом Статистики (но значение p все же другое!), второй результат R - с третьим результатом Статистики (значение p другое!), и третий результат R - со вторым результатом Статистики (возможно, что здесь совпадение точное). Важно то, что в Статистике совершенно непонятно, что как считалось, тогда как в хелпах к R, кажется, достаточно легко найти ссылки на конкретные алгоритмы.