statsguider
は、データの性質を選ぶだけで使うべき統計手法を案内するパッケージです。
基本の流れは 3 段階です。
- データの性質を指定する
- 推奨される手法を確認する
- 必要ならそのまま実行する
select_test() で使う主な引数
表の列を指定する引数:
-
data: 解析に使うdata.frame -
outcome: 結果変数の列名 -
group: 群や条件を表す列名 -
id: 対応あり・反復測定で使う被験者 ID 列
選択式の引数:
-
goal-
"difference": 群間差を見たい -
"association": 関連を見たい -
"adjusted_effect": 調整付き効果を見たい -
"time_to_event": 生存時間を扱いたい -
"agreement": 一致度を見たい -
"equivalence": 等価性・非劣性を見たい
-
-
outcome_type-
"continuous": 連続値 -
"binary": 二値 -
"nominal": 名義尺度 -
"ordinal": 順序尺度 -
"count": カウント
-
-
paired-
"yes": 同じ対象を2回測っている -
"no": 独立した群を比べる
-
-
repeated-
"yes": 同じ対象を3回以上測っている -
"no": 反復測定ではない
-
-
adjust-
"yes": 共変量調整が必要 -
"no": 単純比較でよい
-
-
normality-
"auto": 自動判定 -
"yes": 正規性を仮定する -
"no": 正規性を仮定しない -
"unknown": わからない
-
-
run-
"recommend": 手法だけを返す -
"run": 手法を選んで実行する
-
-
language-
"en": 英語表示 -
"ja": 日本語表示
-
まずは推奨だけを見る
dat <- subset(statsguider::wet_example, visit == "week4")
select_test(
data = dat,
outcome = "biomarker",
group = "group",
outcome_type = "continuous",
paired = "no",
repeated = "no",
run = "recommend",
language = "ja"
)
#> statsguider の推奨
#> - 判定: 推奨
#> - 推奨手法: Welchのt検定
#> - 代替手法: Mann-Whitney U検定
#> - 理由: 連続値をもつ独立2群で、正規性も大きくは崩れていないと判断しました。
#> - 次の一歩: Welchのt検定を使ってください。必要なら順位ベースの代替手法を使います。
#> - 補足:
#> * 正規性を自動判定し、`yes` と分類しました。そのまま実行する
select_test(
data = dat,
outcome = "biomarker",
group = "group",
outcome_type = "continuous",
paired = "no",
repeated = "no",
run = "run",
language = "ja"
)
#> statsguider の結果
#> - 手法: Welchのt検定
#> - 理由: 連続値をもつ独立2群で、正規性も大きくは崩れていないと判断しました。
#> - 要約: Welchのt検定 を選んだ理由は、データが continuous 型、群数 2、paired = "no"、repeated = "no" だったためです。
guided_test() で順番に選ぶ
guided_test(
dat,
answers = list(
goal = "difference",
outcome = "biomarker",
group = "group",
paired = "no",
repeated = "no",
adjust = "no",
outcome_type = "continuous",
normality = "auto"
),
run = "recommend",
language = "ja"
)
#> statsguider の推奨
#> - 判定: 推奨
#> - 推奨手法: Welchのt検定
#> - 代替手法: Mann-Whitney U検定
#> - 理由: 連続値をもつ独立2群で、正規性も大きくは崩れていないと判断しました。
#> - 次の一歩: Welchのt検定を使ってください。必要なら順位ベースの代替手法を使います。
#> - 補足:
#> * 正規性を自動判定し、`yes` と分類しました。select_test() は引数を直接指定したいときに向いています。
guided_test()
は質問に答えながら進みたいときに向いています。