めもめも ...〆(。_。)
認知心理学・認知神経科学とかいろいろなはなし。 あるいは科学と空想科学の狭間で微睡む。
×
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
今更すぎてむしろ恥ずかしいぐらいの話。
分散分析の結果を記入するとき、F(自由度)=F値、pが有意水準より大きいか小さいか って表記しますよね。
そんときの自由度の計算どうなってたっけ?ってのが気になりだして気になったら昼もねむたいので(それは春だからだ)、ちょっとめも。
まず基本。
自由度のなかみは
F(条件差の自由度,誤差の自由度)
の2つ。
1要因やったら、
(条件差の自由度)=(条件の数)-1
でおk。
なんで-1なん?ってひとは、はこにしまうイメージを描こう。
たとえばはこが3つあってものをそれぞれ1こずつしまうとき、どのはこにしまうか選べるのは1かいめと2かいめでしょ?
最後の1かいは、もうはこが選べない。
自由に選べる回数が自由度ってこと。
統計に即して言うと、統計では母集団の平均とか分散を推定するんやけど、母集団は知りえない。
なので
{(各サンプルデータ)-(サンプルの平均値)}の2乗の総和
を母分散にしたいところなんやけど、平均自体も
(母分散)/(サンプル数)
の分散を持つから、
最終的に
(母分散)={(各サンプルデータ)-(サンプルの平均値)}の2乗の総和+(母分散)/(サンプル数)
になりますよ、と。
んで変形したら
(母分散の推定値、すなわち不偏分散)=[{(各サンプルデータ)-(サンプルの平均値)}の2乗の総和]/{(サンプル数)-1}
になるよー、と。
分母が自由度。
んで、そもそもサンプルデータからサンプルの平均値引き算したものの総和って必ず0になるよね?
そしたら、例えばサンプルが3つあったとき、データの2つは勝手な値とってもいいけど、最後の1こは帳尻あわせで自動的に値が決まるでしょー。
だから勝手な値とれる数って(サンプル数)-1だよねって話。
うむわかりにくい。
説明ヘタでごめん。
話戻って、誤差の自由度はどうなるか。
対応がない場合は、
(誤差の自由度)=(サンプル数-1)*(条件数)
まあ自由度だけで考えるなら、t検定を条件数だけ繰り返すようなもん。
(実際には同一の統計的検定でt検定を繰り返すことはない。前した話なので省略)
対応がある場合は、
(誤差の自由度)=(サンプル数ー1)*(条件数-1)
なんで自由度が変わってくるかというと、対応のある場合ってのは「被験者の効果」があって、実験の効果との交互作用があると考えられるから。
よーするに、おんなじ被験者からとったデータは対応づけとかないと、解釈ずれちゃうかもしれないでしょってこと。
対応がなかったら、各条件において勝手にサンプル並べることもできるけど、対応があるときはサンプル並べを自由にできる回数が1回へる。
なので上の式。
2要因だったら、
主効果のF値のときは、
F(主効果の条件差の自由度,誤差の自由度)
条件差の自由度は1要因のと同じ。
対応なし・対応なしの完全無作為化要因計画なら、
(誤差の自由度)=(1こめの要因の条件数)*(2こめの要因の条件数)*(サンプル数ー1)
交互作用のときは
F(交互作用の条件差の自由度,誤差の自由度)
誤差は上に同じ。
(交互作用の条件差の自由度)=(1こめの要因の条件数-1)*(2こめの要因の条件数-1)
1こ対応あり・1こ対応なしの分割プロット法なら、
対応なしのほうの主効果では、
(誤差の自由度)=(対応なしの要因の条件数)*(サンプル数-1)
対応ありのほうの主効果・交互作用はおんなじ誤差項をつかうので、
(誤差の自由度)=(対応なしの要因の条件数)*(対応ありの要因の条件数-1)*(サンプル数-1)
ちなみに交互作用の条件差の自由度は上におなじ。
んで2つとも対応ありの乱塊要因計画なら、
(主効果の誤差の自由度)=(その要因の条件数-1)*(サンプル数-1)
(交互作用の誤差の自由度)=(対応なしの要因の条件数-1)*(対応ありの要因の条件数-1)*(サンプル数-1)
と。
条件差はそれぞれ上に同じ。
なんだ、混乱してたわりには整理するとかんたんなー。
表でもつくろーかと思ったけどめんどくさいのでやめた。
あ、これぜんぶサンプル数が同じ場合ね。
数が違う場合とか3要因とかはまた今度かんがう。
3要因でもまーにたようなかんじなのでとくにかんがえなくてもいいとおもうけど。
数が違ってくる場合については他に考慮することとか増えてくるから、まあそれはまたこんど。
分散分析の結果を記入するとき、F(自由度)=F値、pが有意水準より大きいか小さいか って表記しますよね。
そんときの自由度の計算どうなってたっけ?ってのが気になりだして気になったら昼もねむたいので(それは春だからだ)、ちょっとめも。
まず基本。
自由度のなかみは
F(条件差の自由度,誤差の自由度)
の2つ。
1要因やったら、
(条件差の自由度)=(条件の数)-1
でおk。
なんで-1なん?ってひとは、はこにしまうイメージを描こう。
たとえばはこが3つあってものをそれぞれ1こずつしまうとき、どのはこにしまうか選べるのは1かいめと2かいめでしょ?
最後の1かいは、もうはこが選べない。
自由に選べる回数が自由度ってこと。
統計に即して言うと、統計では母集団の平均とか分散を推定するんやけど、母集団は知りえない。
なので
{(各サンプルデータ)-(サンプルの平均値)}の2乗の総和
を母分散にしたいところなんやけど、平均自体も
(母分散)/(サンプル数)
の分散を持つから、
最終的に
(母分散)={(各サンプルデータ)-(サンプルの平均値)}の2乗の総和+(母分散)/(サンプル数)
になりますよ、と。
んで変形したら
(母分散の推定値、すなわち不偏分散)=[{(各サンプルデータ)-(サンプルの平均値)}の2乗の総和]/{(サンプル数)-1}
になるよー、と。
分母が自由度。
んで、そもそもサンプルデータからサンプルの平均値引き算したものの総和って必ず0になるよね?
そしたら、例えばサンプルが3つあったとき、データの2つは勝手な値とってもいいけど、最後の1こは帳尻あわせで自動的に値が決まるでしょー。
だから勝手な値とれる数って(サンプル数)-1だよねって話。
うむわかりにくい。
説明ヘタでごめん。
話戻って、誤差の自由度はどうなるか。
対応がない場合は、
(誤差の自由度)=(サンプル数-1)*(条件数)
まあ自由度だけで考えるなら、t検定を条件数だけ繰り返すようなもん。
(実際には同一の統計的検定でt検定を繰り返すことはない。前した話なので省略)
対応がある場合は、
(誤差の自由度)=(サンプル数ー1)*(条件数-1)
なんで自由度が変わってくるかというと、対応のある場合ってのは「被験者の効果」があって、実験の効果との交互作用があると考えられるから。
よーするに、おんなじ被験者からとったデータは対応づけとかないと、解釈ずれちゃうかもしれないでしょってこと。
対応がなかったら、各条件において勝手にサンプル並べることもできるけど、対応があるときはサンプル並べを自由にできる回数が1回へる。
なので上の式。
2要因だったら、
主効果のF値のときは、
F(主効果の条件差の自由度,誤差の自由度)
条件差の自由度は1要因のと同じ。
対応なし・対応なしの完全無作為化要因計画なら、
(誤差の自由度)=(1こめの要因の条件数)*(2こめの要因の条件数)*(サンプル数ー1)
交互作用のときは
F(交互作用の条件差の自由度,誤差の自由度)
誤差は上に同じ。
(交互作用の条件差の自由度)=(1こめの要因の条件数-1)*(2こめの要因の条件数-1)
1こ対応あり・1こ対応なしの分割プロット法なら、
対応なしのほうの主効果では、
(誤差の自由度)=(対応なしの要因の条件数)*(サンプル数-1)
対応ありのほうの主効果・交互作用はおんなじ誤差項をつかうので、
(誤差の自由度)=(対応なしの要因の条件数)*(対応ありの要因の条件数-1)*(サンプル数-1)
ちなみに交互作用の条件差の自由度は上におなじ。
んで2つとも対応ありの乱塊要因計画なら、
(主効果の誤差の自由度)=(その要因の条件数-1)*(サンプル数-1)
(交互作用の誤差の自由度)=(対応なしの要因の条件数-1)*(対応ありの要因の条件数-1)*(サンプル数-1)
と。
条件差はそれぞれ上に同じ。
なんだ、混乱してたわりには整理するとかんたんなー。
表でもつくろーかと思ったけどめんどくさいのでやめた。
あ、これぜんぶサンプル数が同じ場合ね。
数が違う場合とか3要因とかはまた今度かんがう。
3要因でもまーにたようなかんじなのでとくにかんがえなくてもいいとおもうけど。
数が違ってくる場合については他に考慮することとか増えてくるから、まあそれはまたこんど。
この記事にトラックバックする
トラックバックURL:
カレンダー
10 | 2024/11 | 12 |
S | M | T | W | T | F | S |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
カテゴリ説明
もっさり:日々の雑感をもっさり。
がっつり:論文や研究関連をがっつり。
びっくり:科学ニュースでびっくり。
まったり:空想科学などでまったり。
ばっかり:デザイン系自己満足ばっかり。
ほっこり:お茶を嗜んでほっこり。
がっつり:論文や研究関連をがっつり。
びっくり:科学ニュースでびっくり。
まったり:空想科学などでまったり。
ばっかり:デザイン系自己満足ばっかり。
ほっこり:お茶を嗜んでほっこり。
最新コメント
※SPAMが多いのでhttpを含むコメントと英語のみのコメントを禁止しました※
最新記事
(05/08)
(04/24)
(04/10)
(02/03)
(11/01)
最新トラックバック
プロフィール
HN:
az
性別:
非公開
自己紹介:
興味のあるトピックス
分野は視覚認知。視知覚にがて。
あと記憶全般。
カテゴリ (semanticsか?) とかも。
最近デコーディングが気になる。
でも基本なんでもこい。
好奇心は悪食。
好きな作家(敬称略)
川上弘美
小林秀雄
津原泰水
森茉莉
レイ・ブラッドベリ
イタロ・カルヴィーノ
グレッグ・イーガン
シオドア・スタージョン
分野は視覚認知。視知覚にがて。
あと記憶全般。
カテゴリ (semanticsか?) とかも。
最近デコーディングが気になる。
でも基本なんでもこい。
好奇心は悪食。
好きな作家(敬称略)
川上弘美
小林秀雄
津原泰水
森茉莉
レイ・ブラッドベリ
イタロ・カルヴィーノ
グレッグ・イーガン
シオドア・スタージョン
ブログ内検索
最古記事
(08/05)
(08/16)
(08/19)
(08/19)
(08/21)
カウンター
フリーエリア
PR
STARの分散分析の結果はあれどどの数字が(F=_,_)の中身かわかりませんでした^^;
初歩的すぎてどのサイトにも載ってないし参考書にも載って無くて
どうしよーかと思って死にそうになってました.
ほんとにありがとうございます
分散分析の表記って初学者にはわけがわからないですよねー。
ちなみに、このめもぶろぐにおいて、自由度の記述などt検定や分散分析についてのめも書きは、森敏昭・吉田寿夫両先生の『心理学のためのデータ解析テクニカルブック』(北大路書房)という本に基づいていることが多いです。
大学図書館には置いてあるでしょうから、もし厳密な記述が知りたい場合は読んでみてください。
数式がいっぱいで最初は混乱すると思いますが、じっくり腰をおちつけて読んでいけば、丁寧な説明がされていることがわかると思います。
参考になれば幸いです。
今卒論であります.
ちょうど1年ちょっと前ですね.
前よりは統計と仲良くなってきたと思いますがまだまだ苦手です.
またまたお世話になりました.
卒論は大変ですよね!でも、大学ならではのいい経験ですのでがんばってくださいね。
統計は奥が深くてわたしもまだまだ未熟ですが、ちょっとずつ前進していけたらなあと思っています。
お互いがんばりましょう!