zhakota / HackFGR

GNU General Public License v3.0
0 stars 0 forks source link

Задача 1. Можно ли сравнивать данные? #1

Open zhakota opened 1 year ago

zhakota commented 1 year ago

Можем ли мы сравнивать данные веса плода/новорождённого между УЗИ (рассчитывается ожидаемый вес по формулам), неонатологов (измеряют только живорождённых) и патологов (измеряют мёртворождённых и живорождённых)?

Данные представлены в виде M(SD) и центильных таблиц. Мало кто приводит размер выборки по неделям гестации. Т.е. полноценного мета-анализа вида M, SD, sample size не получается.

Можно попытаться сделать что-то типа umbrella meta-analysis. Набираем в каждую подгруппу (УЗИ, неонатологи, патологи) и далее получаем уже некое подобие M, SD, sample size. Примеры исходных данных лежат в data/raw/

  1. Если статистически значимых отличий нет, то можно использовать для ориентира данных всех специальностей для бесшовной аналитики и усреднять вес и длину. Если есть, то в какой паре?
  2. Если статистически значимой разницы в паре неонатология-патанатомия нет, то переходим к Задаче №2.
  3. Если все статистически значимо отличаются, то фиксируем это факт и переходим к задаче 3 п2
zhakota commented 1 year ago

Трудности задачи:

  1. Нет общего интервала по сроку гестации
  2. Нет общего выражения данным (средние значения или центили)
  3. Единичные данные о количестве выборки для каждой неделе гестации

Решения:

  1. Взяли интервал максимально охватывающий все подгруппы 24-40 недель
  2. Преобразовали центили в M(SD)
  3. Стандартный алгоритм мета-анализа не подходит. Подобрали....
zhakota commented 1 year ago

@anton-shikov что ещё можно добавить про трудности?

anton-shikov commented 1 year ago
  1. Отсутствие конкретны данных по разным полам (особенно при анализе патологии)
  2. Неравномерность выборок по числу исследований, использующих определённый метод анализа
  3. Высокий разброс данных, при усреднении средних он становится ещё выше, что вызвано отсутствием сырых данных для каждого образца
anton-shikov commented 1 year ago

Использовано два подхода для сравнения значений:

1) Попарное сравнение средних в пределах каждой недели для разных методов (патология-неннатология, патология-УЗИ, неонатология-УЗИ) как при учёте конкретного пола, так и при использовании средних значений по обоим полам.

После проведения теста для каждой пары сравнений отображали распределение значений p-value, как сырых, так и скорректированных с помощью поправок на множественные сравнения (BH, FDR, разные поправки дали одинаковый результат).

Значимые пары сравнений были обнаружены только для 33 и 38 недель при учете средних по полу. При использовании поправок на множественные сравнения никаких значимых различий обнаружено не было.

Аналогичным методом было оценено влияние пола на вес плода (попарные сравнения проведены между весом мальчиков и девочек) в пределах одного конкретного метода. Различия по сырым значениям обнаружены только для 24 недели при использовании УЗИ, но поправка на множественные сравнения убирает значимость. В группе оценки патологии анализ провести нельзя, т.к. присутствует только одно исследование (данные source).

2) Применение метаанализа с использованием функции metamean из пакета meta. В пределах определённого периода гестации были сравнены конкретные методы. Использовался зонтичный метаанализ. Исследования одного типа были объединены, и далее были рассчитаны средние средних и средние средних SD. Учитывались как обобщённые данные по обоим полам, так и данные по конкретному полу.

В каждом случае учитывался p-value при проведении heterogeneity test (тест на различия между данными). Единственное различие наблюдалось при учёте 24 недели при использовании УЗИ.

Как и в предыдущем подходе, значимых различий при использовании поправок на множественные сравнения нет. Исходя из этого, можно сделать вывод, что разные методы исследования дают сопоставимые результаты. При анализе патологии вес тела получается меньшим, но значимых различий нет, что, вполне вероятно, вызвано проблемами в данных (неоднородность выборок, невозможность провести обычный мета-анализ из-за отсутствия размера выборки, большой разброс в оценке средних).