Тромбикула идет в поход на Запад
Jan. 22nd, 2009 04:20 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Публиковаться в западных журналах для меня давно привычно, но до сих пор я посылал туда практически только описания новых видов/находок. Статьи же с мат. статистикой шли в ЗИНовские "Энтомологическое обозрение" и "Паразитологию", где как раз с точки зрения статистики никто их не рецензировал. Переходной точкой (если не считать использования критерия Манна-Уитни в статье 2006 г. из Belgian Journal of Entomology) была статья с логистической регрессией, вышедшая в 2008 г. в московском англоязычном журнале "Acarina". И вот наконец я собрался и отослал статью со статистикой в австралийский Invertebrate Systematics (импакт 1.66). Делал я ее очень долго: создание файла с текстом датировано 25.01.2008. Статья посвящена ревизии одной группы близких видов клещей-краснотелок. Статистическая методика там применена на полную катушку: многомерное шкалирование, UPGMA, логистическая регрессия, size-correction по Мозиманну и непараметрические критерии различия. Не исключено, конечно, что эта статья, пропутешествовав по редакциям, закончит свой путь в "Трудах ЗИНа", но если удастся ее опубликовать в Invertebrate Systematics, то она одна сделает мне ПРНД за год (ПРНД, кстати, только что отменили на уровне РАН, но в ЗИНе нечто подобное все равно предполагается использовать).
Главный результат, вообще говоря, был получен практически без статистики: с помощью шкалирования, которое, на самом деле, является всего лишь способом представления данных. Вот результат по 17 исходным морфометрическим признакам, даже без поправки на размер:
Группы 1, 2 и 3 - это географические формы одного вида: 1 - Кавказ и Турция, 2 - горы Азии (Киргизия, Южный Казахстан, Алтай и Тува), 3 - равнины (Башкирия, Северный Казахстан, Алтайский край, Монголия). Причем анализ дистанций между ними в пространстве size-in и size-free переменных показывает, что "равнинная" форма отличается от "горной" только меньшим размером - что вполне объяснимо с помощью эко-географической изменчивости, которая обычна у краснотелок. А вот "кавказская" группа отличается от них обеих специфической "формой" (т.е. соотношением промеров); впрочем, отличия небольшие. (Общую красивую картину нарушает только положение выборки из Армении (Haghartsin), которая по идее должна входить в группу 1).
А теперь дистанции между этими явно внутривидовыми группировками можно взять за масштаб для оценки различий между всеми остальными выборками:
Это UPGMA, и переменные здесь уже претерпели size-correction (т.е. в данном случае были поделены на геометрическое среднее). Обратите внимание на выборки Koytezek и Galaligez: первая включает голотип lubrica, а вторая - голотип dimidiata, но дистанция между ними такая же, как между формами scrupulosa! Явно, что dimidiata надо сводить в синоним к librica.
Вот так у нас, нумерических систематиков, решается задача классификации. Ну, а теперь можно, с помощью логистической регрессии, строить дискриминантную функцию для разграничения scrupulosa и lubrica. И вот здесь только и начинается "статистика" в узком смысле - построение и тестирование гипотез.
Главный результат, вообще говоря, был получен практически без статистики: с помощью шкалирования, которое, на самом деле, является всего лишь способом представления данных. Вот результат по 17 исходным морфометрическим признакам, даже без поправки на размер:

Группы 1, 2 и 3 - это географические формы одного вида: 1 - Кавказ и Турция, 2 - горы Азии (Киргизия, Южный Казахстан, Алтай и Тува), 3 - равнины (Башкирия, Северный Казахстан, Алтайский край, Монголия). Причем анализ дистанций между ними в пространстве size-in и size-free переменных показывает, что "равнинная" форма отличается от "горной" только меньшим размером - что вполне объяснимо с помощью эко-географической изменчивости, которая обычна у краснотелок. А вот "кавказская" группа отличается от них обеих специфической "формой" (т.е. соотношением промеров); впрочем, отличия небольшие. (Общую красивую картину нарушает только положение выборки из Армении (Haghartsin), которая по идее должна входить в группу 1).
А теперь дистанции между этими явно внутривидовыми группировками можно взять за масштаб для оценки различий между всеми остальными выборками:

Это UPGMA, и переменные здесь уже претерпели size-correction (т.е. в данном случае были поделены на геометрическое среднее). Обратите внимание на выборки Koytezek и Galaligez: первая включает голотип lubrica, а вторая - голотип dimidiata, но дистанция между ними такая же, как между формами scrupulosa! Явно, что dimidiata надо сводить в синоним к librica.
Вот так у нас, нумерических систематиков, решается задача классификации. Ну, а теперь можно, с помощью логистической регрессии, строить дискриминантную функцию для разграничения scrupulosa и lubrica. И вот здесь только и начинается "статистика" в узком смысле - построение и тестирование гипотез.