実習1資料
ホーム 上へ 健康科学研究 基礎研究 NEW リンク

 

重要!

SSDATA.xlsファイルの「課題」シートに訂正がありました(20030115)。

スポーツ統計学レポートの提出方法

 1/15実習課題1から3を行い,SSDATA.xlsファイルを以下のアドレスに添付ファイルで提出する。

 送付先: egawa@tai-ken.jp

 期限: 1/20(火)17:00まで

 提出方法: Subjectに学籍番号,氏名を記入する。本文に実習の感想,意見,次回の希望などを記入する。

 備考: 1/15課題提出者を,出席扱いとする。期限を過ぎての提出は認めない。

 

第1回(2004.1.15) 実習資料

G.I.O.

この実習の一般学習目標は、「研究デザインに応じた統計的手法を適用し、科学的な結論を得るプロセス」を学習することである。

S.B.O.

この実習の個別学習目標は、

  1. 研究デザインに適した統計的手法を選択できること
  2. 統計的手法に応じたデータセットを作成できること
  3. 解析結果に基づいた結論を述べることができること

である。

研究デザインと統計的手法

研究デザインは、次のとおりに分類されます。

bulletケース・コントロール研究
bulletコホート研究
bullet横断研究
bullet介入研究
bullet動物実験
bullet臨床試験
bullet疫学的介入研究

前回(1/8)の復習

「研究デザインに応じた統計的手法を適用し、科学的な結論を得るプロセス」を理解するために,表2を常に参照して下さい。

前回は,
 

bullet研究デザインの分類
bullet統計手法の分類(表3)
bullet統計手法に応じたデータセットの作成
bullet運動生理学的研究の実例

を実習しました。次に,前回の課題の解答例を示します。

a 2群,
b 1元配置分散分析,
c U,
d H,
e 20,
f カイ2乗
g 対応のある,
h 3群以上,
i 連続,
j 順序,
k 線形回帰,
l 分散分析,
m ロジスティック,
n 判別分析,
o 時間依存性

データ解析の入り口

 まずは,元データを見てみましょう(PDFはこちら)。

このデータは,A社(従来型)と,B社(新型)の測定機器で測定した筋力データ(単位:kg)です(仮想データ)。

これらの機器で測定したデータを検討してみましょう。実習のために,SSDATA.xlsファイルを入手します (「課題」シートに訂正あり:20030115)。

次の手順に従い,実習します。

  1. 「1次データ」シートを参照して,「入力フォーム」にデータを入力する
  2. 自分で入力した「入力フォーム」シートと,「入力データ」シートと比較する

関門:「入力データ」シートの入力のままでは,統計解析ができません。どのように改善したらいいか考えてみましょう。

データクリーニング

 「入力データ」シートには,いくつかの問題があります。

  1. タイプミス(C7)がある
  2. 空白セル(C15)がある

この状態では,解析を進める事ができません。これらの問題を解決するために,入力したら元データと比較することが大切です。

空白セルは,元データの作成時点で記入しなかったのか?,データが測定できなかったのか?この資料だけでは不明です。

この実習ではC15セルを上につめて解析を進めます。

関門:データクリーニングが終了したら,必ずデータを凍結(フリーズ)すること。

データの特徴を把握する-グラフ作成

 では,このデータの特徴を把握するために,グラフを作成してみましょう。データの分布を作図するにはいくつかの方法があります。

ここではA社とB社を比較したいので,それぞれのデータを散布図にします。

次の手順に従い,実習します。

  1. フリーズした「入力データ」のデータを,「課題」シートにコピーする(デモをみながら)
  2. 演習1を行う

関門:このグラフから,何が分かるでしょうか?

データの特徴を要約する-基本統計量の計算

 データの特徴が把握できたら,基本統計量を計算して,特徴を数値で表現してみます。

次の手順に従い,実習します。

  1. 「課題」シートのG5からG13セルに,例数,最小値,最大値,最頻値,合計,平均,分散,標準偏差,偏差平方和を求める関数を入力する(I5からI13や”Excelを使った統計計算実習”の項を参考にしながら)
  2. 同様に,H5からH13セルにも入力する

関門:Excelには統計計算に便利な関数が多数含まれている。ただし,いくつかの関数には制限もある。

データの特徴を要約する-ヒストグラム作成

 次に,データの分布の形状を把握するために,それぞれのヒストグラムを作成します。

次の手順に従い,実習します。

  1. 「課題」シートのG17からH25セルに,Excelの「分析ツール」を活用して,度数分布表を作成する(デモをみながら)
  2. 演習2を行う

関門:このグラフから,何が分かるでしょうか?Excelのヒストグラムはちょっとしたクセがあるので注意。詳しくは各自研究してください。

いよいよ解析!でもその前に-どんな手法を使うのか?

 このデータは,A社とB社の機器で測定したデータでした。

関門:これらのデータには,どのような解析手法が適しているでしょうか?

2群間の平均値の比較

 ここでは,A社とB社の2群間の平均値を比較してみます。このような解析を適用する場合には,次のステップが必要です。

  1. 2群の分散が等しいかを確認する(F検定)
  2. F検定の結果により,等分散の仮定によるt検定かWelch検定を選択する

 では,早速解析してみましょう。

次の手順に従い,実習します。

bullet手順1
  1. 「課題」シートのL4およびM4セルに,分散を入力する
  2. M6セルに,F比を入力する
  3. L9セルで,F検定を行う
bullet手順2
  1. L11セルで,検定方法を選択する
  2. L14セルで,t検定を行う

 Excel関数を用いない場合には,次の手順で検定統計量(t値)を計算し,検定します(Welch検定の場合)。

  1. L18からM22セルに,統計量を入力する
  2. L23セルに,平均値の差を入力する
  3. L24セルに,等価自由度を入力する
  4. L25セルに,有意水準を入力する
  5. L26セルに,t値を入力する
  6. L27からL31セルに,両側棄却値,上片側棄却値,下片側棄却値,両側確率,片側確率を入力する

関門:このデータに適用できる他の手法も,考えてみましょう。

信頼区間の推定

 これまでの実習で,「2群間の差が4kgである」ことを統計学的に示すことができました。

しかし,2つの測定機器を並行して使う立場では,いつも4kgの差が出るということではないのではないかと考えました。

そこで,手元のデータから,2つの測定機器のデータの信頼区間を推定してみましょう。

次の手順に従い,実習します。

  1. 「課題」シートのL34セルに,信頼率を入力する
  2. L35セルに,信頼上限を入力する
  3. L36セルに,信頼下限を入力する

関門:演習3に取り組みましょう!

質疑応答(小休止の予定)

統計的手法に応じたデータセットの作成(ここは飛ばすかもしれません)

 第1回資料の自由課題に取り組みましょう!

自由課題1:これらのデータセットを作成した研究者が設定したと考えられる研究目的をそれぞれ述べよ。

表4:男性と女性では身長が異なるかを明らかにすること

表5:年代によって身長が異なるかを明らかにすること

表6:親子の身長には相関関係があるかどうかを明らかにすること

運動生理学的研究の実例

 それでは、運動生理学的研究の「研究デザインに応じた統計的手法を適用し、科学的な結論を得るプロセス」を見てみましょう。
 

 この研究(2003)では,体位傾斜モデルを用いて,「重力に伴う体性感覚入力はH反射回路を抑制する」という仮説を検証している。

 同一被験者に仰臥位(SP)および直立位(STD)の2条件を提示して、H反射の応答を比較した。

統計的手法
 

 生理学的には、条件刺激効果を明らかにするには試験刺激条件が一定であることが必要である。

  →試験刺激の指標であるMサイズについても同様に検討した

 評価指標であるH反射の個人差は大きい。

  →この点を考慮して対応のあるt検定を行った。

データセット

 まずMサイズ、H反射のデータセットを入手する。
 

自由課題2:仰臥位と直立位のMサイズをプロットし、データの解釈を試みよ。

「解答例」 1名は他の10名と比べて大きい。全体ではSPとSTDの変化は小さい。

自由課題3:仰臥位と直立位のH反射をプロットし、データの解釈を試みよ。

「解答例」 SPのばらつきよりも,STDのばらつきの方が小さい。全体ではSPよりもSTDの方が小さい。

関門:最後に,演習4に取り組みましょう!

Mサイズ、H反射のデータセットのDからG,およびJからMのデータについて検討せよ。

ヒント:Excelの「分析ツール」で解析できます。でも,問題があります。

解析例はこちら

実習資料

表2 研究デザイン→統計的手法の適用→科学的結論のプロセス

表3 変数のタイプと統計的手法

 

Excelを使った統計計算実習

統計用語

数 式

Excel関数
例数 COUNT
合計 SUM
平均 AVERAGE
分散 VAR
標準偏差 STDEV
偏差 なし
偏差平方和 DEVSQ
積和 なし
共分散 COVAR
ピアソンの積率相関係数 PEARSON
スピアマンの順位相関係数 なし
回帰直線 LINEST
定数項 INTERCEPT
回帰係数 SLOPE

Excelを使った検定実習

検定手法

数 式

Excel関数
カイ2乗検定

Aij = i 行 j 列内の実測値の度数 (実測値頻度)

Eij = i 行 j 列内の期待値の度数 (期待値頻度)

r = 行数,c = 列数

Ni・ = i行の合計, N・j = j列の合計,N = 総合計

CHITEST(実測値範囲,

期待値範囲)

t検定

尾部  1=片側分布、2=両側分布

検定種類

1=対応データ

2=等分散

3=非等分散(ウェルチ検定)

TTEST(配列 1,配列 2,

尾部,

検定種類)

相関係数の検定

なし
F検定

FTEST(配列 1,配列 2)

Excelを使った推定実習

推定

数 式

Excel関数

2群間の差

1=対応データ

2=等分散
3=非等分散(ウェルチ検定)

TDIST

TINV

相関係数

NORMSINV

FISHER

FISHERINV

分散比

FDIST

FINV

 

参考書

 石村貞夫,分散分析のはなし,東京図書,1992 実験系の学生は必読

 宮原英夫,丹後俊郎(編),医学統計学ハンドブック,朝倉書店,1995 図書館で調べるときに便利

 内田 治,すぐわかるEXCELによる統計解析,東京書籍,1996 実習の題材を参考にしました

 石村貞夫,SPSSによる分散分析と多重比較の手順,東京図書,1997 SPSSユーザーは必携

 加藤千恵子,石村貞夫,Point統計学,相関係数と回帰直線,東京書籍,2003 もう一度復習する人向け,実習の題材を参考にしました

 涌井良幸,涌井貞美,図解でわかる統計解析用語辞典,日本実業出版社,2003 手元に置いておきたい

 井川俊彦,Excelによる統計クイックリファレンス,共立出版,2003 Excelユーザーは必携

 中澤 港,Rによる統計解析の基礎,ピアソンエデュケーション,2003 これからの解析ソフト(フリーウェア)として有望

 

おすすめ!

 永田 靖,統計的方法のしくみ―正しく理解するための30の急所,日科技連出版社,1996 1日1テーマずつ,1ヶ月で読破できる

 粕谷英一,生物学を学ぶ人のための統計のはなし―きみにも出せる有意差,文一総合出版,1998 有意差の呪文にとらわれないように

 浜田知久馬,学会・論文発表のための統計学―統計パッケージを誤用しないために,真興交易医書出版部,1999 修士レベルでマスターしておこう

 中村好一,基礎から学ぶ楽しい疫学,医学書院,2002 疫学って何?という人にオススメ

 

お手軽!!

 石村貞夫,統計解析のはなし,東京図書,1989 基礎からわかりやすく解説

 豊田秀樹,前田忠彦,柳井晴夫,原因を探る統計学,ブルーバックス,講談社,1992 因果関係を論じるための方法がわかる

 新村秀一,パソコンによるデータ解析,ブルーバックス,講談社,1995 SPSSユーザーの入門書として最適

 

もっと勉強したい人のために

 篠原弘章,共分散分析法 行動科学のBASIC,ナカニシヤ出版,1989 交絡因子の調整方法が詳解されている

 市川伸一,岸本淳司,大橋靖雄,浜田知久馬,SASによるデータ解析入門 SASで学ぶ統計的データ解析(第2版),東京大学出版会,1993 SASユーザーは必携

 John M. Chambers(著),Trevor J. Hastie(著),柴田里程(訳),Sと統計モデル―データ科学の新しい波,共立出版,1994 数理統計,モデリングの解説

 Alexander M. Walker(著),丸井英二,林 邦彦,中井里史(訳),疫学研究の考え方・進め方―観察から推測へ ,新興医学出版社 ,1996 疫学の考え方が深められる

 永田 靖,吉田道弘,統計的多重比較法の基礎,サイエンティスト社,1997 いつまでもpost hocと言い続けなくてすむように

 斧田大公望,計数値の経時的分散分析,メディカルリサーチセンター,2001 調査研究を繰り返すデザインの解析方法

 田部井明美,SPSS完全活用法―共分散構造分析(Amos)によるアンケート処理,東京図書,2001 アンケートも新しい手法で解析できる

 丹後俊郎,医学データ―デザインから統計モデルまで データサイエンス・シリーズ,共立出版,2002 医学データの解析事例が豊富

 Alan Agresti(著),渡邉裕之,菅波秀規,吉田光宏,角野修司,寒水孝司,松永信人(訳),カテゴリカルデータ解析入門,サイエンティスト社,2003 入門となっているが難しい