はじめに

statsguider は、データの性質を選ぶだけで使うべき統計手法を案内するパッケージです。

基本の流れは 3 段階です。

データの性質を指定する
推奨される手法を確認する
必要ならそのまま実行する

`select_test()` で使う主な引数

表の列を指定する引数:

data: 解析に使う data.frame
outcome: 結果変数の列名
group: 群や条件を表す列名
id: 対応あり・反復測定で使う被験者 ID 列

選択式の引数:

goal
- "difference": 群間差を見たい
- "association": 関連を見たい
- "adjusted_effect": 調整付き効果を見たい
- "time_to_event": 生存時間を扱いたい
- "agreement": 一致度を見たい
- "equivalence": 等価性・非劣性を見たい
outcome_type
- "continuous": 連続値
- "binary": 二値
- "nominal": 名義尺度
- "ordinal": 順序尺度
- "count": カウント
paired
- "yes": 同じ対象を2回測っている
- "no": 独立した群を比べる
repeated
- "yes": 同じ対象を3回以上測っている
- "no": 反復測定ではない
adjust
- "yes": 共変量調整が必要
- "no": 単純比較でよい
normality
- "auto": 自動判定
- "yes": 正規性を仮定する
- "no": 正規性を仮定しない
- "unknown": わからない
run
- "recommend": 手法だけを返す
- "run": 手法を選んで実行する
language
- "en": 英語表示
- "ja": 日本語表示

まずは推奨だけを見る

dat <- subset(statsguider::wet_example, visit == "week4")

select_test(
  data = dat,
  outcome = "biomarker",
  group = "group",
  outcome_type = "continuous",
  paired = "no",
  repeated = "no",
  run = "recommend",
  language = "ja"
)
#> statsguider の推奨
#> - 判定: 推奨
#> - 推奨手法: Welchのt検定
#> - 代替手法: Mann-Whitney U検定
#> - 理由: 連続値をもつ独立2群で、正規性も大きくは崩れていないと判断しました。
#> - 次の一歩: Welchのt検定を使ってください。必要なら順位ベースの代替手法を使います。
#> - 補足:
#>   * 正規性を自動判定し、`yes` と分類しました。

そのまま実行する

select_test(
  data = dat,
  outcome = "biomarker",
  group = "group",
  outcome_type = "continuous",
  paired = "no",
  repeated = "no",
  run = "run",
  language = "ja"
)
#> statsguider の結果
#> - 手法: Welchのt検定
#> - 理由: 連続値をもつ独立2群で、正規性も大きくは崩れていないと判断しました。
#> - 要約: Welchのt検定 を選んだ理由は、データが continuous 型、群数 2、paired = "no"、repeated = "no" だったためです。

`guided_test()` で順番に選ぶ

guided_test(
  dat,
  answers = list(
    goal = "difference",
    outcome = "biomarker",
    group = "group",
    paired = "no",
    repeated = "no",
    adjust = "no",
    outcome_type = "continuous",
    normality = "auto"
  ),
  run = "recommend",
  language = "ja"
)
#> statsguider の推奨
#> - 判定: 推奨
#> - 推奨手法: Welchのt検定
#> - 代替手法: Mann-Whitney U検定
#> - 理由: 連続値をもつ独立2群で、正規性も大きくは崩れていないと判断しました。
#> - 次の一歩: Welchのt検定を使ってください。必要なら順位ベースの代替手法を使います。
#> - 補足:
#>   * 正規性を自動判定し、`yes` と分類しました。

select_test() は引数を直接指定したいときに向いています。 guided_test() は質問に答えながら進みたいときに向いています。

select_test() で使う主な引数

まずは推奨だけを見る

そのまま実行する

guided_test() で順番に選ぶ

`select_test()` で使う主な引数

`guided_test()` で順番に選ぶ