Тут есть специалисты по статистическому анализу? Если есть – ответе на несколько вопросов.

1)  Имется массив данных. 5 столбцов данных для 2-х состояний. Распределение логнормальное. Вопрос: Можем ли мы проводить кореляцию или нужно логарифмировать т. е. нормализовать данные?
2)   Тот же массив данных. Если мы в пакете Statistica запускаем кореляцию по всем данным сразу, то кореляция получается по 362-м строкам из 2450-ти. Почему? Потому что в первых 3-х столбцах много дефектных значений, которые выброшены. Вопрос: Как нам нужно провести кореляцию - попарно сравнивать все данные или можно весь массив.
12 года назад от Зорган Лафорте

1 ответ

0 голосов
По первому пункту. Если данные количественные (непрерывная случайная величина) , можно применить ранговую кореляцию Спирмена. Можно попробовать сделать преобразование данных (через натуральный логарифм или квадратный корень) . Потом проверить нормальность (лучше по Шапиро-Уилксу) . Если получилось нормальное распределение, считаем коэффициент Пирсона. Если данные качественные (дискретная случайная величина) там много вариантов. Считаем через кросстабуляцию.
По второму пункту. При попарных сравнениях большого массива данных можно получить много "ложных кореляций". Дабы себя обезопасить, выбирайте все, что корелирует (p0. 01) и считайте частные коэффициенты кореляции.
 
ИМХО А пакет Statistica - полное дерьмо.
12 года назад от Лилия Казанская

Связанные вопросы