最初に考えるのは研究の問いです。
flowchart TD
A["研究の問いから始める"] --> B["群間差をみたい"]
A --> C["関連をみたい"]
A --> D["調整付き効果や予測をみたい"]
A --> E["time-to-event を解析したい"]
A --> F["一致度や再現性をみたい"]
A --> G["等価性や非劣性を示したい"]
version 1.0.0 で主に対応するのは群間差の分岐です。
群間差の中での基本分岐
flowchart TD
A["群間差をみたい"] --> B{"アウトカム型"}
B --> C["連続"]
B --> D["二値・名義"]
B --> E["順序"]
B --> F["カウント"]
C --> C1{"群数"}
C1 -->|2群| C2{"対応あり?"}
C1 -->|3群以上| C3{"反復測定?"}
C2 -->|No| C4{"正規性は十分?"}
C2 -->|Yes| C5{"差分はほぼ正規?"}
C4 -->|Yes| T1["Welch t-test"]
C4 -->|No| T2["Mann-Whitney U test"]
C5 -->|Yes| T3["Paired t-test"]
C5 -->|No| T4["Wilcoxon signed-rank test"]
C3 -->|No| C6{"正規性は十分?"}
C3 -->|Yes| C7{"連続の反復測定?"}
C6 -->|Yes| T5["Welch ANOVA"]
C6 -->|No| T6["Kruskal-Wallis test"]
C7 -->|Yes| T7["Repeated-measures ANOVA"]
C7 -->|No| T8["Friedman test"]
D --> D1{"対応あり?"}
D1 -->|No| D2{"期待度数は小さい?"}
D1 -->|Yes| T9["McNemar test"]
D2 -->|Yes| T10["Fisher exact test"]
D2 -->|No| T11["Chi-squared test"]
E --> E1{"対応・反復の有無"}
E1 -->|独立2群| T12["Mann-Whitney U test"]
E1 -->|対応2群| T13["Wilcoxon signed-rank test"]
E1 -->|独立3群以上| T14["Kruskal-Wallis test"]
E1 -->|反復3群以上| T15["Friedman test"]
F --> T16["単純検定ではなく回帰へ"]
実務上のルール
- 群間差だけを見たいなら、この分岐に従って
select_test()を使います。 - 共変量調整、生存時間、一致度、等価性・非劣性は単純検定ではなく別の解析分岐に進みます。
-
statsguiderは不適切な分岐では無理に実行せず、止めて案内します。
もっともシンプルな例
select_test(
data = dat,
outcome = "biomarker",
group = "group",
outcome_type = "continuous",
paired = "no",
repeated = "no",
run = "recommend",
language = "ja"
)