>
no title

1: 名無しさん@おーぷん 22/07/31(日) 22:12:33 ID:J0WR
調査機関が信じられないってのはまあわかる
でも
「たった500人のうち300人?300人いたところで10万人の中では少数派ですね(笑)」
みたいな統計っていうもの自体信じてない奴結構おるよな

引用元: ・統計を頑なに信じてない奴っているよな

60: 名無しさん@おーぷん 22/07/31(日) 23:07:44 ID:wAm4
統計をかたくなに信じない人っておるんやろか
>>1に逆張りしたい人がいるだけでその人はなにかを信じてるわけではなくて逆張りがしたいだけなような気が

63: 名無しさん@おーぷん 22/07/31(日) 23:08:58 ID:J0WR
>>60
Twitterで統計が出てるニュースにぶら下がってるリプをぼんやり眺めていればいくつか見つけられるで
ストックしてないから挙げられないのが歯がゆい

66: 名無しさん@おーぷん 22/07/31(日) 23:10:45 ID:wAm4
>>63
それもなんかツイート元を揶揄したいとか
否定したいとかちゃうかなぁ

そもそも統計自体に否定したいとか肯定したいみたいな感情がわかないような
統計自体には興味がない が正しい予感

2: 名無しさん@おーぷん 22/07/31(日) 22:12:52 ID:DDvY
いない

3: 名無しさん@おーぷん 22/07/31(日) 22:13:00 ID:0C4Z
統計的にはワイも結婚できるんよな?

4: 名無しさん@おーぷん 22/07/31(日) 22:13:10 ID:vjqS
おんj民はセイバーメトリクス大嫌いやろ

16: 名無しさん@おーぷん 22/07/31(日) 22:35:39 ID:k1PW
>>4
セイバーメトリクスは学問的な統計学としては微妙な立ち位置やし

5: 名無しさん@おーぷん 22/07/31(日) 22:13:20 ID:7CHP
ネトウヨに多い

6: 名無しさん@おーぷん 22/07/31(日) 22:14:12 ID:J0WR
疑うのはいいけど、統計の疑い方をわかってないというか

7: 名無しさん@おーぷん 22/07/31(日) 22:16:00 ID:4wby
統計は数量比較を行う学問で必然的に諸事象を互換的同質的な単位に還元するけど、現実には互換するもののない完全に一回的な事象(自分自身の生存など)があって、それに対して統計的事実を適用させることの妥当性は何なの?

12: 名無しさん@おーぷん 22/07/31(日) 22:31:36 ID:J0WR
>>7
自分自身というのがある母集団の特徴と似ていれば、「その母集団の人間の生存(期間)」っていう確率変数と見なすってこと

8: 名無しさん@おーぷん 22/07/31(日) 22:17:34 ID:DDvY
統計習いたての大学1年生?

11: 名無しさん@おーぷん 22/07/31(日) 22:29:36 ID:J0WR
>>8
またこの手のレスか
ワイの最近習ったことになったものがそろそろ数え切れなくなってきた

9: 名無しさん@おーぷん 22/07/31(日) 22:19:57 ID:aKre
政府が捏造数字出してくる国の国民は数字なんか信用しないやろね
「ああ、また政府が自分に都合のいいように捏造した数字出してきよった誰か信じるかい糞が」
ってなるよね
嘘つき狼少年政府なんか早晩潰れるやろうね

10: 名無しさん@おーぷん 22/07/31(日) 22:22:58 ID:3vwU
>>9
捻くれすぎやろ

13: 名無しさん@おーぷん 22/07/31(日) 22:32:34 ID:J0WR
>>9
>調査機関が信じられないってのはまあわかる

14: 名無しさん@おーぷん 22/07/31(日) 22:32:44 ID:FdfR
秋山先生の出口調査とみそ汁の話

15: 名無しさん@おーぷん 22/07/31(日) 22:35:36 ID:J4PC
統計のマジックって言葉で全部反論できると思ってる奴

17: 名無しさん@おーぷん 22/07/31(日) 22:36:43 ID:7XEv
>>15
これ
したり顔でこれ言うバカ多過ぎ

18: 名無しさん@おーぷん 22/07/31(日) 22:39:13 ID:4wby
確率変数ってこと結局は予測に過ぎないやろ信じるか信じないかは自由ちゃうか?

21: 名無しさん@おーぷん 22/07/31(日) 22:41:49 ID:J0WR
>>18
その推定値を取る確率や、95%の確率で真の値が収まる範囲なんかはキッチリ出るで
推定値そのものがイチかバチかって思ってるやろ

23: 名無しさん@おーぷん 22/07/31(日) 22:44:08 ID:4wby
>>21
その辺はようわからんな

32: 名無しさん@おーぷん 22/07/31(日) 22:49:01 ID:J0WR
>>23
つまり、「この値になります。信じるか信じないかはあなた次第」ではなくて、
「この範囲に収まる確率はキッチリ〇%です。この結果をどう使うかはあなた次第」やねん

34: 名無しさん@おーぷん 22/07/31(日) 22:49:59 ID:4wby
>>32
サイコロの場合の「収まる範囲」ってのはどっから何処までになるんや?1~6か?

42: 名無しさん@おーぷん 22/07/31(日) 22:52:30 ID:J0WR
>>34
さいころの出目の平均をμとすれば、実際に振った結果から真のμが収まる範囲ってのを考えることになるんや
一回しか振らないと「μがあるかもしれない範囲」はかなり広くなってしまうけど、振りまくれば狭めていける
具体的な範囲は振った回数に依存して決まるで

55: 名無しさん@おーぷん 22/07/31(日) 23:03:53 ID:4wby
>>42
ようわからんが狭まるか?サイコロの場合1~6の範囲があるのは初めから自明やろ?

58: 名無しさん@おーぷん 22/07/31(日) 23:05:39 ID:J0WR
>>55
1~6の範囲に平均μが収まるのは100%の確率
でも99%の確率でμが収まる範囲はどうだろう?

83: 名無しさん@おーぷん 22/07/31(日) 23:19:35 ID:4wby
>>58
確率が下がると範囲も狭まるってことか?正規分布になるんかな?
それやとサイコロのある目が出るのは厳密には1/6じゃないってことか?

86: 名無しさん@おーぷん 22/07/31(日) 23:21:52 ID:k1PW
>>83
よく見てみ出た目の平均値の話やで

90: 名無しさん@おーぷん 22/07/31(日) 23:27:09 ID:J0WR
>>83

範囲を狭めると、その範囲に収まる確率は低くなる
どこにあるかわからない未知の値γがあったとして、-∞から∞の間にある可能性は100%やろ?
でもそれでは何にもならないから、もっと特定化したいわけ
それでいくらかの誤差を許して95%で収まる範囲を推定するとしたら、その範囲はサンプルサイズに応じてどんどん狭く(精度が高く)なっていくんや
サイコロの例に戻せば、平均が1~6の範囲にあるのはわかりきっているけども、なんの意味もないからもっと狭めたいんや

19: 名無しさん@おーぷん 22/07/31(日) 22:40:19 ID:975n
ワイはそんなこと無いイメージやけどなあ

20: 名無しさん@おーぷん 22/07/31(日) 22:41:38 ID:lKNt
でも無作為に抽出した一万人のアンケート結果が本当に日本国民全員にアンケートを取った場合と同じような結果になるのかどうかって文系には怪しいなぁと思ってまう

25: 名無しさん@おーぷん 22/07/31(日) 22:44:26 ID:J0WR
>>20
本当に無作為抽出ができてるなら1万人ものサンプルサイズならめちゃくちゃ似た結果になると思うで
RやらPythonやらで実際に1億行のデータセットを生成して、そこからランダムに1万行抽出してみれば簡単に確かめられるで

26: 名無しさん@おーぷん 22/07/31(日) 22:46:03 ID:lKNt
>>25
ふっしぎやなぁ

22: 名無しさん@おーぷん 22/07/31(日) 22:43:55 ID:4wby
サイコロを振れば1/6の確率で4の目が出るわけだが、実際に振ったとき5の目が出たとする。
これってその確率が当たったとも言えないし、外したとも言えんよな?
だとしたら、統計は現実に対してなにもしていないことにならんか

29: 名無しさん@おーぷん 22/07/31(日) 22:46:58 ID:J0WR
>>22
振り続ければ1/6に近い割合で4が出る、というさいころ自体の性能を記述できとる訳や
広く捉えれば、掃除機の性能とかと同じ

24: 名無しさん@おーぷん 22/07/31(日) 22:44:22 ID:9KYZ
平均1.2人

27: 名無しさん@おーぷん 22/07/31(日) 22:46:46 ID:wAm4
政府の統計が正しくなかったって・・・

ロジカルシンキング崩壊するやん

33: 名無しさん@おーぷん 22/07/31(日) 22:49:19 ID:rR2c
>>27
政府にだって都合の良い事悪い事利権関係あるんやから事実統一教会がそうであったように無い方が不思議なくらいやわ

28: 名無しさん@おーぷん 22/07/31(日) 22:46:54 ID:jI8m

30: 名無しさん@おーぷん 22/07/31(日) 22:48:01 ID:xD7i
人を騙すために使う奴が多すぎるからしょうがないね

31: 名無しさん@おーぷん 22/07/31(日) 22:48:23 ID:p2lu
無作為がどのレベルでできてるか微妙やしな

35: 名無しさん@おーぷん 22/07/31(日) 22:50:26 ID:gqwD
寿命との関係性を示したいのに元々健康状態の悪い被験者を集めたりとか健康商品を販売してる企業が自ら治験を行って都合のいいデータを取ったりみたいなのは多い気がする
統計が悪いんじゃなくてそれを主張の根拠として提示する新聞やネット記事のような扱う側が悪いと思うけど

36: 名無しさん@おーぷん 22/07/31(日) 22:50:38 ID:wAm4
統計でもういっこ困るのは
どうやって集めたのか やねんな
アンケートって設問の用意の仕方で結果を恣意的に誘導できるみたいやから

38: 名無しさん@おーぷん 22/07/31(日) 22:51:55 ID:4wby
>>36
大学の時に心理学部のやつがやってたアンケートはかなり怪しかったな恣意的ではないんやろうけど人によって解釈変わるやろって設問多かったわ

40: 名無しさん@おーぷん 22/07/31(日) 22:52:08 ID:k1PW
>>36
これ特に重要だからまともな学術論文にはデータ収集方法が必ず記載されてる
逆に企業広告とかで変なのはそれが記載されてない

44: 名無しさん@おーぷん 22/07/31(日) 22:53:46 ID:wAm4
>>40
アンケート調査会社の中の人曰く
それが腕前なんだとか

クライアントの求める結果を出すそうな

37: 名無しさん@おーぷん 22/07/31(日) 22:51:20 ID:p2lu
番組とかサイトで円グラフだけ出されるのはあんまり信用してないわ総勢何人に聞いて年齢別の内訳とか載ってないとね

39: 名無しさん@おーぷん 22/07/31(日) 22:52:01 ID:9KYZ
校長「せやな」

41: 名無しさん@おーぷん 22/07/31(日) 22:52:17 ID:dYJ7
無作為に集められたサンプル←馬鹿

43: 名無しさん@おーぷん 22/07/31(日) 22:52:48 ID:wAm4
ロジカルになにかを判断しようと思ったら
データを元に恣意をできるだけはさまずに
そのデータの表す問題点とか傾向をもとに判断をすることになるんやけど
データが恣意的に誘導された結果だとそれをいくら恣意を挟まないように分析してもそもそも恣意が入ってしまってるっていう

45: 名無しさん@おーぷん 22/07/31(日) 22:54:27 ID:0LkO
結局のところ都合の悪い事実を信じたくないだけやから
最終的には結果が改竄されてるとか正直に答えさせない同調圧力ガーとか陰謀論吐いてブンムクレる

46: 名無しさん@おーぷん 22/07/31(日) 22:55:23 ID:xD7i
>>45
スレの中身読んでる?全くそんな話してないけど
お前が一番都合のいいように解釈してるやん

49: 名無しさん@おーぷん 22/07/31(日) 22:56:48 ID:p2lu
>>46
返球鋭すぎて草

47: 名無しさん@おーぷん 22/07/31(日) 22:55:32 ID:yHXG
ネット上男女300人に聞きましたみたいなのはさすがに待てよってなる

48: 名無しさん@おーぷん 22/07/31(日) 22:56:35 ID:nTpt
>>47
同じネットでもTwitter、5ちゃん、ヤフコメでかなり結果変わりそう

50: 名無しさん@おーぷん 22/07/31(日) 22:57:01 ID:J0WR
>>47
ネット上男女300人に聞いた場合、そのサイトのターゲットの男女を母集団とした分析になるな

51: 名無しさん@おーぷん 22/07/31(日) 22:59:05 ID:J0WR
精緻な理論はともかく、母集団と標本って考え方だけは高校教育までにぶち込んだ方がいいと思うけど、まあカリキュラム上難しいんやろうな

52: 名無しさん@おーぷん 22/07/31(日) 22:59:41 ID:4wby
統計を頑なに信じてない奴ってのはサイコロの出目はランダムなんだから1/6なんかあてにならねーよって言いだす奴のことなんか?

53: 名無しさん@おーぷん 22/07/31(日) 23:00:33 ID:J0WR
>>52
そういう人も含まれるかな

54: 名無しさん@おーぷん 22/07/31(日) 23:02:05 ID:5tyu
統計自体は信用できる
でもアンケートなんて適当に答えるのが多いでしょ?
自分もポイ活でアンケートよく回答してるけどこれ「はい」にすると長くなりそうだなって思って「いいえ」にしたりする
ゴミを入れたらゴミが出てくるってこと

57: 名無しさん@おーぷん 22/07/31(日) 23:04:12 ID:J0WR
>>54
もちろんそういう懸念があるので、学術的に利用できる質問票の指針とか、質問票自体の研究が結構されとるで

282: 名無しさん@おーぷん 22/08/01(月) 00:53:46 ID:Fgf0
>>275
ここまで伸びると再利用で済んで便利>>57

286: 名無しさん@おーぷん 22/08/01(月) 00:54:50 ID:fKfs
>>282
やっぱ研究されてるわけね
てことは懸念材料って考え方もあるわけですよね

291: 名無しさん@おーぷん 22/08/01(月) 00:57:00 ID:215e
>>286
調査対象や調査票デザインそのものが結論反映してること多いからな

幸せですか?
本当に幸せですか?
その幸せ本物ですか?
幸せの意味を全検討してそれでも幸せですか?
日本人は不幸らしいですよ?それでも幸せですか?
幸せなわけないだろ?幸せですか?その幸せ本物ですか??

みたいな調査票で幸せじゃなさそうな人に聞くとかな

295: 名無しさん@おーぷん 22/08/01(月) 00:58:33 ID:Sjx3
>>291
あなたは幸せですか?
1幸せ
2不幸

1と答えた方に質問です、具体的に最近幸せだったと思うエピソードを3点記入してください

これでも幸せ回答回避できる

56: 名無しさん@おーぷん 22/07/31(日) 23:04:09 ID:k1PW
アンケート系は確かにどこまで信頼したらいいのか怪しい
アンケートに答えてくれるって時点でバイアスかかってるのはよく言われてるしな

59: 名無しさん@おーぷん 22/07/31(日) 23:07:37 ID:J0WR
>>56
サンプリングバイアスの解決っていうのも結構盛んやで
Heckmanの2段階推定っていう手法では、端的に言えばサンプリングバイアスを仮定して真の値を推定するんや

96: 名無しさん@おーぷん 22/07/31(日) 23:30:13 ID:J0WR
>>93
サンプリングバイアスに関しては>>59みたいな手法があるねんな
まあ、統計の分析を見たときにまず疑う部分としては妥当やと思う

61: 名無しさん@おーぷん 22/07/31(日) 23:08:21 ID:qVbX
大学で統計学が可しか取れなかったから嫌い

64: 名無しさん@おーぷん 22/07/31(日) 23:09:18 ID:k1PW
>>61

65: 名無しさん@おーぷん 22/07/31(日) 23:09:54 ID:J0WR
>>61
浮いただけモーマンタイや

62: 名無しさん@おーぷん 22/07/31(日) 23:08:23 ID:wAm4
おんJは天邪鬼が多いという

67: 名無しさん@おーぷん 22/07/31(日) 23:10:57 ID:qVbX
基礎統計とかいう講義名のくせに異常に難しかったゾ

69: 名無しさん@おーぷん 22/07/31(日) 23:12:30 ID:J0WR
>>67
再生性とかやらされてそう

68: 名無しさん@おーぷん 22/07/31(日) 23:11:59 ID:wAm4
興味ないので無視もできるし乱暴なことも言えるんかねぇ

70: 名無しさん@おーぷん 22/07/31(日) 23:12:40 ID:grEB
理論が分からないから信じる信じないでしか判別できないって感じやないか
そりゃ統計の名を借りて無茶苦茶やってるのも多いけどその違いがわからないから一括りにして信じられないとなる

71: 名無しさん@おーぷん 22/07/31(日) 23:13:22 ID:wAm4
政府の統計がおかしかったです
これくらい統計に興味がなくなる話もないかもね
なにを元に方針決めてるねんってことに

72: 名無しさん@おーぷん 22/07/31(日) 23:13:52 ID:wAm4
統計を貶めているのはこういうニュースな気がするわ

73: 名無しさん@おーぷん 22/07/31(日) 23:14:12 ID:JNh5
統計は手法が間違ってたら意味ないし
そのくらいは気を付けないとね

74: 名無しさん@おーぷん 22/07/31(日) 23:14:19 ID:J0WR
再掲
>調査機関が信じられないってのはまあわかる

75: 名無しさん@おーぷん 22/07/31(日) 23:14:22 ID:grEB
あと確率論的なものの扱い方ってわからん人間にはどれだけ説明してもわかってもらえないところがある

78: 名無しさん@おーぷん 22/07/31(日) 23:16:42 ID:J0WR
>>75
最もプリミティブな「何%で〇〇が起きる」は天気予報で慣れてるわけやし、一段一段理解できればわかると思うんやけどな~

82: 名無しさん@おーぷん 22/07/31(日) 23:19:06 ID:grEB
>>78
たぶん多くの人は降ったか降ってないかの実害的なところしか注目してへんと思う
数字じゃなくて雨マークだけ見る

76: 名無しさん@おーぷん 22/07/31(日) 23:14:26 ID:qVbX
統計学の授業で無理やりExcel使わされたから社会人になってもExcel嫌いが継続してるゾ

77: 名無しさん@おーぷん 22/07/31(日) 23:15:24 ID:J0WR
>>76
Excelでよかったやないか
その授業限りなのにRやPython触らされるよりよっぽどやと思う

79: 名無しさん@おーぷん 22/07/31(日) 23:17:18 ID:9ZP3
視聴率信じれるか?
数百世帯しか置いてないんやで

81: 名無しさん@おーぷん 22/07/31(日) 23:18:06 ID:J0WR
>>79
数百もあればそこそこの精度やん
まあデジタルなんだからいい加減デジタルに大規模調査しろよってのはワイも思う

80: 名無しさん@おーぷん 22/07/31(日) 23:17:43 ID:qVbX
Excelでゴールシークするンゴ

84: 名無しさん@おーぷん 22/07/31(日) 23:19:56 ID:JNh5
ポアソン分布ちゃうか

85: 名無しさん@おーぷん 22/07/31(日) 23:20:53 ID:qVbX
統計学の授業で唯一好きだったのはランダムウォークとマルチンゲールっていう言葉の響き

89: 名無しさん@おーぷん 22/07/31(日) 23:24:22 ID:k1PW
>>85
ランダムウォークまでする統計学の講義なんて珍しいな
確率過程はまだまだホットな分野やで

92: 名無しさん@おーぷん 22/07/31(日) 23:28:08 ID:J0WR
>>89
想像やけど時系列データやったんちゃうかな
ARとかMAとかやったらとりあえずランダムウォークから入るやろ

87: 名無しさん@おーぷん 22/07/31(日) 23:21:58 ID:v9Wq
サイコロの例で言うと
形の見えないサイコロを出た目のデータだけを見ながら推測していく
って感じじゃね?
試行回数が増えるほど推測の信頼性が増していく

88: 名無しさん@おーぷん 22/07/31(日) 23:22:37 ID:qVbX
あとベイズ確率?とかいうのがよくわからんかった記憶

91: 名無しさん@おーぷん 22/07/31(日) 23:27:52 ID:dSv2
交絡の一つも考えてない統計はクソだと思う

95: 名無しさん@おーぷん 22/07/31(日) 23:29:12 ID:J0WR
>>91
そういう場合、単なる実現値上の関係を記述してるに過ぎないわな

97: 名無しさん@おーぷん 22/07/31(日) 23:30:18 ID:dSv2
>>95
統計がある制限のもとある可能性の高さを論じてるだけなのに結論が独り歩きしてそれを振りかざすやつがいる
馬鹿に統計をもたせるなと

93: 名無しさん@おーぷん 22/07/31(日) 23:29:01 ID:dSv2
てか数云々よりサンプリングのされやすさがサンプル群の偏りを生むほうが問題

94: 名無しさん@おーぷん 22/07/31(日) 23:29:12 ID:oDeH
実験計画法は感動した記憶がある
なお説明しろって言われても覚えてない模様

98: 名無しさん@おーぷん 22/07/31(日) 23:30:50 ID:qVbX
あーそういえば大学のとき数学科で統計学扱うところは卑しいからって内部生がほとんどいなくてロンダばっかりだったの思い出したわ
金儲けにつながる統計学学ぶやつは卑しいって内部生が敬遠してたの思い出した

105: 名無しさん@おーぷん 22/07/31(日) 23:33:52 ID:cOdH
>>98
これもうアホやろ…

99: 名無しさん@おーぷん 22/07/31(日) 23:31:38 ID:sCnA
確率統計は高校までにもっとやった方がええわ
コロナやワクチンの一連で強くそう思った

101: 名無しさん@おーぷん 22/07/31(日) 23:32:50 ID:J0WR
>>99
これ超思う
一様分布と二項分布に限ってもいいからちょっとだけ齧らせたほうがいい

102: 名無しさん@おーぷん 22/07/31(日) 23:33:04 ID:k1PW
>>99
一応高校の情報はそこらへん入れるらしい
いつから変わるのかは知らんけど

100: 名無しさん@おーぷん 22/07/31(日) 23:31:53 ID:dSv2
実験科学ならまだしも社会学の調査なんてのはあくまで参考やろな

103: 名無しさん@おーぷん 22/07/31(日) 23:33:15 ID:J0WR
>>100
信頼性は分野ではなく手法に依存すると思う

108: 名無しさん@おーぷん 22/07/31(日) 23:35:01 ID:dSv2
>>103
データの性質とかもあると思うけど

110: 名無しさん@おーぷん 22/07/31(日) 23:36:51 ID:J0WR
>>108
得られたデータセットから飛躍しない範囲の研究であればおしなべて信頼性はあると思うけど

112: 名無しさん@おーぷん 22/07/31(日) 23:40:03 ID:dSv2
>>110
それがカッチリした数値ならそうなんやろけど
そもそも手法ごとに頑強性とかあるわけやん

113: 名無しさん@おーぷん 22/07/31(日) 23:41:35 ID:J0WR
>>112
せやからその通りで、>>103で言ったように信頼性は手法に依存すると思うよ
カッチリしてない数値っていうのはなんや?ダミー変数とか?

116: 名無しさん@おーぷん 22/07/31(日) 23:45:18 ID:dSv2
>>113
単純にデータが順序だったりすると言えることは弱くなるやろ?
結局信頼性は手法による、社会学のようなデータにはその信頼性の落ちる手法を使わざるを得ないっていう話なんよ

123: 名無しさん@おーぷん 22/07/31(日) 23:48:01 ID:J0WR
>>116
例えば「Aランク、Bランク、Cランク」とかのことか
それは各ダミー変数を独立変数としてOrdered ProbitのモデルのMLEで推定するで
サンプリングが正しく行われていて、分析がこういう感じなら別に信頼性は損なわれないと思う

126: 名無しさん@おーぷん 22/07/31(日) 23:50:33 ID:dSv2
>>123
結局言ってることを弱くすれば嘘は言ってないって範囲が広がるってのを信頼性って言ってるのかな

129: 名無しさん@おーぷん 22/07/31(日) 23:52:39 ID:J0WR
>>126
得られたデータセットから言えることを言う、それ以外は言わない
これが信頼性やと思うけど
で、意外とそこまでフワフワした結論ばかりでもないで

130: 名無しさん@おーぷん 22/07/31(日) 23:53:47 ID:dSv2
>>129
押し問答な上にそちらのほうが詳しいだろうからこれ以上早めておきます
世の科学者がそれ以外は言わないとか適切な手法を選択するとかが守られてるといいけどね

132: 名無しさん@おーぷん 22/07/31(日) 23:57:02 ID:J0WR
>>130
押し問答というか、そもそもフワフワした主張を具体化していってただけなんやけど
あと、それは査読+批判的研究で担保される(べき)ことやね
ちょっと乱暴な話やけど、被引用件数が多くて肯定的に論じられてることが多い研究は信用していいと思う

135: 名無しさん@おーぷん 22/07/31(日) 23:59:07 ID:dSv2
>>132
数学に近い分野はいいんだろうけどね
医学とか軽い地獄だと思う

139: 名無しさん@おーぷん 22/08/01(月) 00:01:06 ID:Fgf0
>>135
医学、特に脳科学は相関関係のみで終わってることもよくあるね
相関関係があるってところ以上に踏み込まなければ大丈夫だとは思うけど、「後の研究に託す」以上の価値は無さそうだよね

143: 名無しさん@おーぷん 22/08/01(月) 00:02:43 ID:oPqH
>>139
別な根拠がなきゃ疑似相関かどうかの結論が出せないんやからしゃーない

144: 名無しさん@おーぷん 22/08/01(月) 00:02:56 ID:fKfs
>>139
そもそもバラツキが大きいものばかり扱うしサンプリングの正しさも担保し難いし何より査読者が統計をわかってるとは限らないと言うね

104: 名無しさん@おーぷん 22/07/31(日) 23:33:43 ID:oDeH
イッチおすすめの統計学の全体を把握するのに使えるような初学者向けの本てある?

107: 名無しさん@おーぷん 22/07/31(日) 23:34:42 ID:J0WR
>>104
初学者っていうのが本当の初学者ならとりあえずamazonで「統計学 入門」って調べてカラーのイラストが載ってる奴読んだらええ

106: 名無しさん@おーぷん 22/07/31(日) 23:34:01 ID:qVbX
数学の中で統計学と確率論は1番社会に出て役に立つと思うわ
それこそ文系でも役に立つ

109: 名無しさん@おーぷん 22/07/31(日) 23:36:34 ID:k1PW
一般教養レベルだと東大出版会の統計学入門が定番だけどガチ初心者には厳しそう

111: 名無しさん@おーぷん 22/07/31(日) 23:38:59 ID:J0WR
>>109
あれ尖度とか歪度とかも網羅しててどれが重要なのかとか分かり辛いから、読み進めて通読するのには向かないと思う
「あれどうやるんだっけ?」ってときの辞書的に使うものだと思ってる

114: 名無しさん@おーぷん 22/07/31(日) 23:41:57 ID:5zao
うん
でもお前らメンタリストのダイゴ叩いてるよね?(笑)

115: 名無しさん@おーぷん 22/07/31(日) 23:44:00 ID:J0WR
>>114
別に嫌いではないけど、そもそも彼引用しないじゃん
「〇〇大学の研究では~」とか、ひどいと「ある研究者は~」が常套句やし

118: 名無しさん@おーぷん 22/07/31(日) 23:45:30 ID:5zao
>>115
ダイゴの本読んだことないでしょ?


そういうところな

124: 名無しさん@おーぷん 22/07/31(日) 23:49:04 ID:J0WR
>>118
動画の話をしてたけど、一応(通読はしてないけど)読んだことはあるよ
巻末見てもリストが無いんよ

117: 名無しさん@おーぷん 22/07/31(日) 23:45:26 ID:k1PW
>>114
肩書がメンタリストなんだから心理学や統計学とは一切無関係だゾ

119: 名無しさん@おーぷん 22/07/31(日) 23:46:02 ID:5zao
お前らの大嫌いな風水も

統計ですよオンカス(笑)

122: 名無しさん@おーぷん 22/07/31(日) 23:47:52 ID:dSv2
>>119
おんJ民が風水嫌いって統計データあるんすか?

120: 名無しさん@おーぷん 22/07/31(日) 23:46:13 ID:qVbX
統計学は数学の中で一番卑近やからそこがええわ

121: 名無しさん@おーぷん 22/07/31(日) 23:47:14 ID:dSv2
ワイも別に自信あるわけやないけど統計の一番の問題って使う人間すらよくわかってないのに使われてるケースが多いってことやない?
ソフトにポンで手法がアカンやつ使ってましたとか
でも一般人はそんなん知らん上に結論だけ持っていく
論文そのものと同じで学問の場以外で統計云々持ち足すのはあまりにも危険な気がする

125: 名無しさん@おーぷん 22/07/31(日) 23:49:52 ID:5zao
あたし慶應義塾大学だけど
普通にめっちゃ本読むけどな(笑)

127: 名無しさん@おーぷん 22/07/31(日) 23:51:00 ID:rBKK
統計がどれだけいい加減かなんて
実際に統計をやってみればわかるよ

128: 名無しさん@おーぷん 22/07/31(日) 23:51:37 ID:dSv2
やってみるってのが学問として学ぶことなのか自分が研究で使ってみるのかで話違うような

131: 名無しさん@おーぷん 22/07/31(日) 23:54:36 ID:rBKK
やってみな
外れ値もデータに入れてることに気づくから
そして世の中の統計はちゃんと外れ値処理してるのか疑心暗鬼になるし

136: 名無しさん@おーぷん 22/07/31(日) 23:59:24 ID:J0WR
>>131
結果のみから完全に見通すのはエスパーじゃなきゃ無理やけど、大体は代表値が平均なのか中央値なのかとか、ヒストグラムの形とかで判別できそうやない?

133: 名無しさん@おーぷん 22/07/31(日) 23:58:06 ID:LwQP
統計=正解みたいに語られるのがなぁ
あくまで傾向やんな

140: 名無しさん@おーぷん 22/08/01(月) 00:01:12 ID:oPqH
>>133
帰無仮説、つまりAとBは同じものだよってのを否定できるような使い方なら傾向以外の結論も出せるで
使い方次第や結局

142: 名無しさん@おーぷん 22/08/01(月) 00:02:42 ID:Fgf0
>>140
多分>>133は仮説検定も結局慣例的に定めたp値で判断しているだけであって、断定でないってことが言いたいんやないのかな

145: 名無しさん@おーぷん 22/08/01(月) 00:03:15 ID:y9iM
>>142
そそそ、そうや!

146: 名無しさん@おーぷん 22/08/01(月) 00:04:24 ID:oPqH
>>142
それは必要に応じて優位水準を引き下げればいいわけやん?
ヒッグス粒子とかが持ち出されやすいけど、ほぼ確実に間違いが存在しえない、ってくらいにデータを持ち出せば統計的に断定に近い結論は出せる

148: 名無しさん@おーぷん 22/08/01(月) 00:05:58 ID:Fgf0
>>146
それをワイに言われても困るけども、多分95%有意水準なのか99%有意水準なのか99.9%有意水準なのかってことは彼には関係ないんやない?

149: 名無しさん@おーぷん 22/08/01(月) 00:06:51 ID:oPqH
>>148
まあそうなんかな?
主張をもう少し述べてくれないと反論のしようがないわね

134: 名無しさん@おーぷん 22/07/31(日) 23:58:54 ID:sqH1
まあ300人だと信じられないのはわかる
確度が低い

137: 名無しさん@おーぷん 22/07/31(日) 23:59:48 ID:k1PW
心理学の再現性危機もそうやけど古い研究は引用数多くても怪しいし、そこらへんは専門家じゃないとなかなか判別できないと思う

138: 名無しさん@おーぷん 22/07/31(日) 23:59:54 ID:rBKK
社内資料で中央値も資料に載せたら
平均値だけでいいんだよと言われ資料から削られた

141: 名無しさん@おーぷん 22/08/01(月) 00:02:02 ID:UFmj
データの母数は大事だよ

147: 名無しさん@おーぷん 22/08/01(月) 00:05:20 ID:fKfs
サンプル数が十分確保できるってのがまず幻想だと思う
むしろ統計を捨ててでもあるデータだけで現象を報告すべきこともある
統計信奉はそう言う別の危険性もあると思う

150: 名無しさん@おーぷん 22/08/01(月) 00:06:54 ID:Fgf0
>>147
十分ってのは?
確かにサンプルサイズが2,3では困るけども、サイズに応じて言えることはあると思う

158: 名無しさん@おーぷん 22/08/01(月) 00:09:46 ID:fKfs
>>150
サンプルサイズって言っても他のパラメーターで群分けしていけばいくらでも小さくなるしなあ

162: 名無しさん@おーぷん 22/08/01(月) 00:11:23 ID:oPqH
>>158
それが意味のあるパラメーター分けなのかはちゃんと精査せんとアカンわな
そこは人間の頭でやらないと出来ないからパッと見ではどうしようもない

168: 名無しさん@おーぷん 22/08/01(月) 00:13:31 ID:fKfs
>>162
同感ですね
そこを見誤って使うリスクがどこまでもある

164: 名無しさん@おーぷん 22/08/01(月) 00:12:26 ID:Fgf0
>>158
いくつも共変量を持つサンプルはその観測でセットやで
観測iでyi,x1i, x2i, x3i,って変数があるならそれが一つのi
独立変数に応じてサンプルサイズが小さくなるということはないで

170: 名無しさん@おーぷん 22/08/01(月) 00:14:19 ID:oPqH
>>164
これなに言ってるか全くわからないからワイの知識不足だぁ

175: 名無しさん@おーぷん 22/08/01(月) 00:17:34 ID:Fgf0
>>170
すべてのiさん∈{1さん、2さん、…nさん}について、
所得i、最終学歴i、年齢i、家族の人数i
っていう観測ができたとする
もしこの変数が増えてもサンプルサイズはnのままやで

184: 名無しさん@おーぷん 22/08/01(月) 00:21:33 ID:oPqH
>>175
サンプルサイズは標本数とは違うのか
それとも変数nの上限が増えようとも変数はnのままだから標本数が変わらないよってことなのか
それとも変数にあたる所得や年齢などの種類が増えても標本数nはそのままだと言いたいのか

三つの内どれや?

190: 名無しさん@おーぷん 22/08/01(月) 00:23:56 ID:Fgf0
>>184
最初と最後
nは変数ではなく定数やで

193: 名無しさん@おーぷん 22/08/01(月) 00:24:37 ID:oPqH
>>190
ほーんサンプルサイズと標本数違うんか
じゃあサンプルサイズってなんや?

205: 名無しさん@おーぷん 22/08/01(月) 00:28:10 ID:Fgf0
>>193
この例ではサンプルサイズはnのこと
サンプルサイズ(標本サイズ)とサンプル数(標本数
)の違いに関しては丁寧な解説がいくつもあるのでこういうの↓とかおすすめ
https://ai-trend.jp/basic-study/basic/samplesize/

208: 名無しさん@おーぷん 22/08/01(月) 00:29:23 ID:oPqH
>>205
ああなるほどわかったわサンガツ

214: 名無しさん@おーぷん 22/08/01(月) 00:31:47 ID:UFmj
>>205
つまりサンプル数はなんらかの属性で分けたグループの種類の数で
サンプルサイズは同じグループの中にいるサンプルの数って事やな?

199: 名無しさん@おーぷん 22/08/01(月) 00:26:01 ID:fKfs
>>190
なんか教科書とか読んでても思うんやけど、そう言う定義的な話とリアルなデータの取り扱いの状況の間が開きすぎてる気がするなあ
例題でやってくれててもシンプルすぎて実用に耐えんというか
そらパーフェクトに理解すればいいんだろうけどそれができたら苦労しない

212: 名無しさん@おーぷん 22/08/01(月) 00:30:25 ID:Fgf0
>>199
nっていうのは、工場でネジの欠陥品の割合を検査したときに実際に調査したネジの本数やで

217: 名無しさん@おーぷん 22/08/01(月) 00:32:24 ID:fKfs
>>212
いやそれが普遍って話は正直どうでもええんよ
各群のデータ数って概念が当然出るわけやけどそのへんの話が本命

227: 名無しさん@おーぷん 22/08/01(月) 00:35:54 ID:Fgf0
>>217
そのへんの話が本命っていうのはどういうこと?
何がわかってないのかがわからない

237: 名無しさん@おーぷん 22/08/01(月) 00:37:58 ID:fKfs
>>227
いや実データがピンとこないみたいだしこちらも別に提示できないしもういいかなって
コロナで言えば重症度の違う人のデータをどうまとめたり分けたりして比較するかってなるわけ

252: 名無しさん@おーぷん 22/08/01(月) 00:42:31 ID:Fgf0
>>237
なるほど
そういう場合は重症度を変数としてモデルに含めるのが普通だと思う

266: 名無しさん@おーぷん 22/08/01(月) 00:46:24 ID:fKfs
>>252
それで、そもそもそこを含めるべきなのか4段階なのか入院ありなしで分けるのかってモデルの立て方がいろいろで
重症度と年齢や基礎疾患があったり何が適切なのかってのが難しいなって
統計のプロと組むって話は勿論あるけど専門家同士で話が通じ合わなかったりね

277: 名無しさん@おーぷん 22/08/01(月) 00:52:27 ID:Fgf0
>>266
モデル自体を検定する方法もあるんや

283: 名無しさん@おーぷん 22/08/01(月) 00:54:06 ID:fKfs
>>277
そもそも無数のモデルを検定しまくると何も言えくなったりしない?

294: 名無しさん@おーぷん 22/08/01(月) 00:57:46 ID:Fgf0
>>283
そこが研究の質なわけ
どういう変数を取ってきてどういうモデルを作るのかってとこね

178: 名無しさん@おーぷん 22/08/01(月) 00:20:00 ID:fKfs
>>164
そう言う数学的な話は抽象的過ぎてよくわからないから脇において群分けするケースってのは想定できる?

153: 名無しさん@おーぷん 22/08/01(月) 00:07:56 ID:NiHy
>>147
希少な古生物の発掘例とかなら分かる

151: 名無しさん@おーぷん 22/08/01(月) 00:07:35 ID:2cHK
ワイは統計ガチでわからんから逆に統計学の知見をガーって言われると真実かどうか確認する術がないので統計学的知見を根拠に主張された時点で議論に参加するのをやめて判断を全部保留するようにしてる


157: 名無しさん@おーぷん 22/08/01(月) 00:09:38 ID:Fgf0
>>151
それかなりの議論が無理じゃね?
そもそも先行研究を参照するっていうこともできなくなるような

160: 名無しさん@おーぷん 22/08/01(月) 00:10:32 ID:2cHK
>>157
実際問題世界中にある殆どの議論を正確に一般人が議論することは不可能っていう思想の持主だからそれで正しいで

163: 名無しさん@おーぷん 22/08/01(月) 00:11:29 ID:fKfs
>>157
学問の場以外では普通やないか?
特に匿名掲示板なんかで統計がって言い出すにそういう態度になるのはわかるわ

166: 名無しさん@おーぷん 22/08/01(月) 00:13:05 ID:oPqH
>>163
統計が正しい形で取られているか精査するためには特定の分野の専門知識や資料の読み込みが必須になるからまあそれはそうかもしれない

169: 名無しさん@おーぷん 22/08/01(月) 00:14:05 ID:Fgf0
>>163
そうかな?
「〇〇さんによる20xx年の研究では」って具体的に示された場合は結構普通に取り入れると思うけど
単に「統計ではこうやで」って言われたら無限に突っ込めるけどさ

177: 名無しさん@おーぷん 22/08/01(月) 00:18:08 ID:oPqH
>>169
そこがどういう条件で取られたものなのか、その条件がどう結果にたいして働くのか、ってのが考えにくいから困るんちゃうかな
学問機関の持ち出した統計ならともかく単に企業がやってるってだけでも信頼は揺らぐし

182: 名無しさん@おーぷん 22/08/01(月) 00:21:16 ID:fKfs
>>169
匿名掲示板でそれをやる?
それこそ統計に配慮して何がどこまでの範囲で言えるってちゃんと言ってる?
出典示したから勝手に調べてねは論文でやることで

187: 名無しさん@おーぷん 22/08/01(月) 00:22:55 ID:Fgf0
>>182
ワイはポンって貼って概要を説明したりはするで

191: 名無しさん@おーぷん 22/08/01(月) 00:23:56 ID:fKfs
>>187
それは親切な話やけどこういう場で論文や統計みたいな専門知識前提のデータで力押しするの好きやないわ個人的にね

195: 名無しさん@おーぷん 22/08/01(月) 00:25:34 ID:Fgf0
>>191
専門知識は精緻な理論の論理構造を点検するために必要やけど、論文って基本的に「目的」「結果」「解釈」だけ分かれば情報として利用可能やで

152: 名無しさん@おーぷん 22/08/01(月) 00:07:49 ID:fKfs
ワクチンの有効性や副反応みたいに素人的には99.99ですら不十分って話もあるけどね

154: 名無しさん@おーぷん 22/08/01(月) 00:09:17 ID:UFmj
統計学を教育課程に入れてくれ
古文と漢文廃止でいいから

155: 名無しさん@おーぷん 22/08/01(月) 00:09:26 ID:oPqH
いうてそこまでの誤差まで押さえる必要がある場合って少ないから傾向や集団のなかでの割合を知りたいなら大抵はサンプル数2000くらいかな?
それくらいあれば十分やけどな

156: 名無しさん@おーぷん 22/08/01(月) 00:09:35 ID:JQiy
検定って「このデータで得られた知見は偶然出たものです残念でした」というのはある程度説得できそうだけど
「このデータで得られた知見は正しい」というところまでは説得できないのでは

159: 名無しさん@おーぷん 22/08/01(月) 00:09:47 ID:7Uiw
サンプルを操作して、匙加減で誤魔化せちゃうからね

161: 名無しさん@おーぷん 22/08/01(月) 00:11:20 ID:CIOc
統計を必須にしたらj民が女叩きも年収マウントもできなくなるだろ?

165: 名無しさん@おーぷん 22/08/01(月) 00:12:41 ID:UFmj
>>161
できるぞ

167: 名無しさん@おーぷん 22/08/01(月) 00:13:25 ID:2cHK
統計学的正しさで主張の正しさを担保するのと統計データーを参考に主張するのはかなり距離があるのは理解しているつもり

171: 名無しさん@おーぷん 22/08/01(月) 00:14:36 ID:JQiy
やっぱり「世の中は3つの嘘がある…3つ目は統計だ!」ってのは名言やなあって

172: 名無しさん@おーぷん 22/08/01(月) 00:16:29 ID:UFmj
それってあなたの感想ですよね なんかそういうデータあるんですか?

173: 名無しさん@おーぷん 22/08/01(月) 00:16:58 ID:VW5L
ガウス分布
exp(-x^2/2σ^2)
の分散はなんぼや?

174: 名無しさん@おーぷん 22/08/01(月) 00:17:14 ID:UFmj
>>173
日本語でおk

180: 名無しさん@おーぷん 22/08/01(月) 00:20:51 ID:NiHy
>>173
正規化してないの気持ち悪いな

176: 名無しさん@おーぷん 22/08/01(月) 00:17:56 ID:2cHK
識字率が10%ぐらいしかない国での投票結果みたいな資料を異分野で出されると手も足も出ないのは実際あると思う

179: 名無しさん@おーぷん 22/08/01(月) 00:20:51 ID:JQiy
統計を学ぶと企業がどれだけ統計で嘘ついてるかわかるで
母数を出さないとか結構有名企業でもやってるからな

181: 名無しさん@おーぷん 22/08/01(月) 00:20:57 ID:Sjx3
統計自体は信じてるんやけど
質問方法とか解釈の仕方が信用出来ないのは多いわ

183: 名無しさん@おーぷん 22/08/01(月) 00:21:18 ID:UFmj
>>181
それはあるね

185: 名無しさん@おーぷん 22/08/01(月) 00:21:48 ID:UFmj
誰か統計の信憑性測るAI作ってくれ?

186: 名無しさん@おーぷん 22/08/01(月) 00:22:55 ID:4Hyo
校長

188: 名無しさん@おーぷん 22/08/01(月) 00:23:19 ID:Sjx3
[ank:1m:おんJ民は善人ばかり,おんJ民は悪人もいる,おんJ民はうんち]
おんJ民をどう思いますか?
以下の中から選んでください

197: 名無しさん@おーぷん 22/08/01(月) 00:25:42 ID:Sjx3
>>188
おんJ民12人に対してアンケートを取った結果
8割のおんJ民が自らを「うんち」だと考えているとわかりました

自己評価が低い人達なんでしょうか?

201: 名無しさん@おーぷん 22/08/01(月) 00:26:47 ID:JQiy
>>188
これは真理をついた高等ギャグ
おんJ民を岸田政権に変えてみな
「国民の殆どが岸田政権を善良だと思っていない」というデータが得られたって言えるんやで

203: 名無しさん@おーぷん 22/08/01(月) 00:27:42 ID:Sjx3
>>201
「良いと思っていない」って回答はミスリードとして良く使われるよな

210: 名無しさん@おーぷん 22/08/01(月) 00:30:09 ID:JQiy
>>203
質問の仕方でデータを操作するわけやね
統計の教科書でもよく戒められているのだがね

204: 名無しさん@おーぷん 22/08/01(月) 00:27:56 ID:4Hyo
>>201
つまりワイらが岸田政権やったのかー

189: 名無しさん@おーぷん 22/08/01(月) 00:23:23 ID:4Hyo
校長「統計なんてどの手法を選ぶかやぞ」

192: 名無しさん@おーぷん 22/08/01(月) 00:24:03 ID:UFmj
>>189
外れ値は除外します?

194: 名無しさん@おーぷん 22/08/01(月) 00:24:47 ID:4Hyo
>>192
二極化しとったら

196: 名無しさん@おーぷん 22/08/01(月) 00:25:37 ID:215e
今北
イッチがボコボコになってそう

198: 名無しさん@おーぷん 22/08/01(月) 00:25:46 ID:1fDy
心理学で統計やらされてたなあ
有意差の判定ばっかやったけど

200: 名無しさん@おーぷん 22/08/01(月) 00:26:22 ID:1JaL
少なくともテレビや総務省はうさんくさいとしか

202: 名無しさん@おーぷん 22/08/01(月) 00:26:50 ID:gn2b
クソ統計
発熱が10%なわけなか!
https://i.imgur.com/cY4mXLc.png

209: 名無しさん@おーぷん 22/08/01(月) 00:29:39 ID:fKfs
>>202
こういうのもサンプリング方が調査票だとしたら申告しない割合とか補正してるんやろか?

216: 名無しさん@おーぷん 22/08/01(月) 00:32:20 ID:4Hyo
>>202
これ推測すればベースが治験データやと思うんや
治験ってのは合併症のない健康な人を管理環境下でやるから
リアルワールドとは必ず差異が出る

218: 名無しさん@おーぷん 22/08/01(月) 00:32:49 ID:UFmj
>>216
確かに

206: 名無しさん@おーぷん 22/08/01(月) 00:28:10 ID:2RvQ
無学なワイでもナイチンゲールやジョンスノウの井戸の話聞いてたら統計学の有益さは理解するで
あとは統計の結果を示す側と、それを読みとる側に情報の非対称性があるか否かちゃうんか

213: 名無しさん@おーぷん 22/08/01(月) 00:30:39 ID:fKfs
>>206
情報の非対称性ってまさにやね
そこは統計の問題やわ

207: 名無しさん@おーぷん 22/08/01(月) 00:29:15 ID:4Hyo
個情法あたりの許す範囲で
オープンデータとして公開すれば検証可能になるくらいの話やな

211: 名無しさん@おーぷん 22/08/01(月) 00:30:18 ID:Sjx3
統計で「無作為」って言うけど
これ数学的に定義されていない無作為とかもありえるんかな?

数学詳しくないから細かいツッコミされても困るが

215: 名無しさん@おーぷん 22/08/01(月) 00:32:07 ID:NiHy
>>211
普通は一様ランダムにって読みとると思う

220: 名無しさん@おーぷん 22/08/01(月) 00:33:26 ID:Sjx3
>>215
例えばダーツを当てるとかも無作為になるのかとか
作為的では無いが回答者に紹介してもらった人からアンケートをとったとか

これも無作為にはなると思うねんな

222: 名無しさん@おーぷん 22/08/01(月) 00:34:21 ID:oPqH
>>220
それは回答してくれた人間の中で、って注釈を入れるべきやし質問方法も明記すべきやな
それがないデータは信用に値しないと判断しても差し支えない

224: 名無しさん@おーぷん 22/08/01(月) 00:35:37 ID:NiHy
>>220
単語的にはそうも読み取れるけど専門用語としての「無作為」はそういうのは考えない
後、紹介するってのはもうバイアスがかかってるから作為的になる

219: 名無しさん@おーぷん 22/08/01(月) 00:33:22 ID:oPqH
>>211
それは無作為だと思われる方法の内どれかひとつで選んだ、って意味やとおもう
例えば全部のデータに番号ふってくじ引きで選ぶとか、全数を特定の数(例えば10とか)で割ってそれぞれからひとつのを選んできてデータを取るとか

248: 名無しさん@おーぷん 22/08/01(月) 00:41:29 ID:Fgf0
>>211
無作為の一つの定義はこう

まず、iさんのyをx(の2倍)で説明するモデルがあるとする
yi=2xi+ui

実際にはyiはぴったりxiの2倍にならないこともあって、uiっていうのはその誤差を補正する項

254: 名無しさん@おーぷん 22/08/01(月) 00:43:08 ID:Sjx3
>>248
ふむ、わからん
数学に馴染みがなさ過ぎてどう分布に繋がるのかがさっぱりや?

256: 名無しさん@おーぷん 22/08/01(月) 00:44:01 ID:Fgf0
>>248
>>254
すまん途中だった
E[ui|xi]=E[ui]なら、独立変数とその他の影響が関係ないから無作為抽出できてるとかって考えたりする

259: 名無しさん@おーぷん 22/08/01(月) 00:44:56 ID:Sjx3
>>256
ようわからんが「作為」を数式化して
「ではない」で否定する感じか?

264: 名無しさん@おーぷん 22/08/01(月) 00:46:04 ID:Fgf0
>>259
成り立ってるなら無作為抽出
成り立ってないなら無作為抽出じゃない
それだけの話

265: 名無しさん@おーぷん 22/08/01(月) 00:46:21 ID:UFmj
>>256
ui|xi ってどういう意味や

269: 名無しさん@おーぷん 22/08/01(月) 00:47:11 ID:Fgf0
>>265
普通に条件付き期待値
E[x|y]とかと同じ

281: 名無しさん@おーぷん 22/08/01(月) 00:53:30 ID:UFmj
>>269
期待値わからん 要するにどういう意味の式なんや

287: 名無しさん@おーぷん 22/08/01(月) 00:55:09 ID:Fgf0
>>281
確率変数Yがyだったという条件のもとでのxの期待値
uiとxiに関しても同じ

302: 名無しさん@おーぷん 22/08/01(月) 01:03:31 ID:UFmj
>>287
すまんそれは調べて大体わかったんだが
それをui xiに当てはめた場合どういう言い回しになるかわからんのや

305: 名無しさん@おーぷん 22/08/01(月) 01:04:54 ID:Fgf0
>>302
>>287をそのまま当てはめればいい
xiという観測値が得られたという条件のもとでのuiの期待値

325: 名無しさん@おーぷん 22/08/01(月) 01:17:52 ID:UFmj
>>305
大体わかったわ三月
もう一個わからんのやけど補正値の期待値っていうのはどうやって出すんや?

326: 名無しさん@おーぷん 22/08/01(月) 01:19:32 ID:Fgf0
>>325
誤差項の期待値を直接求めることはできないので、標本平均から推定する
これはxやyも同じ

329: 名無しさん@おーぷん 22/08/01(月) 01:21:54 ID:UFmj
>>326
yiの標本平均で出したのがuiで
yiとxiの標本平均から出したのがui|xiっていう認識でいいけ?

332: 名無しさん@おーぷん 22/08/01(月) 01:26:24 ID:Fgf0
>>329
ui|xiじゃなくてE[ui|xi]
|は期待値に関する記法で、これだけでは特に意味を持たない
すべてのiさん∈{1さん、2さん、…、nさん}について観測できてるのがyiとxiで、uiは先述のモデルのように定義されてる

335: 名無しさん@おーぷん 22/08/01(月) 01:28:56 ID:UFmj
>>332
スッキリしたわ サンキュー

221: 名無しさん@おーぷん 22/08/01(月) 00:33:50 ID:JQiy
大学が出している就職率なんかも
統計やってない一般人は「入学した人全員の就職率」と思うわね
実際は「大卒者の就職率」なのだが

223: 名無しさん@おーぷん 22/08/01(月) 00:35:31 ID:215e
ニートを対象に「あなたはニートですか?」と聞いたら6割がニートだと回答した話すこ
統計学的に味わい深い

226: 名無しさん@おーぷん 22/08/01(月) 00:35:50 ID:UFmj

>>223
残りの四割はなんだよ

231: 名無しさん@おーぷん 22/08/01(月) 00:36:29 ID:JQiy
>>226
高等遊民かな

241: 名無しさん@おーぷん 22/08/01(月) 00:39:37 ID:fKfs
>>223
ワイは統計じゃないけど少年院の奴らはケーキを三等分できないって話がなんだかなって思う
そらそんなとこにいるのに調査に協力してる奴なんて相当のマヌケじゃない?

243: 名無しさん@おーぷん 22/08/01(月) 00:40:46 ID:215e
>>241
あれは話としては衝撃的かつイメージしやすかったせいで読み手側が一般化しすぎたんちゃうか

250: 名無しさん@おーぷん 22/08/01(月) 00:41:58 ID:fKfs
>>243
犯罪は知能の低い群がそれ故に起こすのだみたいな結論を出すわけじゃん
でも無報酬で協力しないようなずる賢い群は調査されてないわけよ

255: 名無しさん@おーぷん 22/08/01(月) 00:43:30 ID:215e
>>250
あれそんな結論やったんか…
なかにはこんなどうしようもない人もいるんですっていう逆の話ちゃうんか

268: 名無しさん@おーぷん 22/08/01(月) 00:47:09 ID:fKfs
>>255
ネットのいいぶりがそうだからてっきりそうなのかと
それは救いの無い話だな…

247: 名無しさん@おーぷん 22/08/01(月) 00:41:27 ID:1fDy
>>241
あれのカラクリはあの医者が見てる少年院が特にそういう子の多い少年院やねん
普通に高卒認定資格取らせて社会復帰させようとしてる少年院もあるで

225: 名無しさん@おーぷん 22/08/01(月) 00:35:40 ID:fKfs
そもそも10%の発熱というデータを一般人がどうしようというのか

230: 名無しさん@おーぷん 22/08/01(月) 00:36:28 ID:UFmj
>>225
確率は高くないという情報でプラシーボが働くかもしれない

234: 名無しさん@おーぷん 22/08/01(月) 00:37:12 ID:oPqH
>>230
プラセボは痛みに働きやすいけど他の症状には働きにくいんだよなぁ……

238: 名無しさん@おーぷん 22/08/01(月) 00:38:20 ID:UFmj
>>234
ないよりはマシやろ 効かんわけじゃないし

239: 名無しさん@おーぷん 22/08/01(月) 00:38:36 ID:oPqH
>>238
そうかも……

228: 名無しさん@おーぷん 22/08/01(月) 00:36:06 ID:oPqH
論文とかでは無作為がどう無作為なのかとかは明記される
逆にどう傾向がある人間を調査したかもめいきされがちやけど企業発表のデータやと疎かにされてるから企業系は信用ならないって学者がいう根拠にはなってると思う

233: 名無しさん@おーぷん 22/08/01(月) 00:37:02 ID:Sjx3
>>228
論文ってかちゃんとした報告書だと計算方法とかまでめっちゃ細かく書いてるよな
なんとか白書とか

236: 名無しさん@おーぷん 22/08/01(月) 00:37:41 ID:oPqH
>>233
そら信頼性に直結するからな
それ書かなきゃ論文じゃねぇただの感想文や

229: 名無しさん@おーぷん 22/08/01(月) 00:36:12 ID:Sjx3
全国の男子高校生から無作為にアンケートを取った結果
なんと99%が男子だと判明した

みたいなのありそうよな

232: 名無しさん@おーぷん 22/08/01(月) 00:36:37 ID:4Hyo
>>229
案外多いな

235: 名無しさん@おーぷん 22/08/01(月) 00:37:23 ID:215e
>>229
社会学でよくやるな
独身女性が集まる店で利用者を調べたらなんと8割が独身女性でした!独身化が進んでいます!

240: 名無しさん@おーぷん 22/08/01(月) 00:39:12 ID:Sjx3
プラセボで虫歯が全快しました?

242: 名無しさん@おーぷん 22/08/01(月) 00:40:25 ID:hGh8
統一を信じろ

244: 名無しさん@おーぷん 22/08/01(月) 00:41:01 ID:UFmj
完全に全ての属性の頻度ををランダムにするっていうのは難しいな

253: 名無しさん@おーぷん 22/08/01(月) 00:42:50 ID:oPqH
>>244
多少偏っても大丈夫なように標本を大きくするんやしまあ折り込み済みではある
その上でできるだけ無作為に取ろうねってことや

258: 名無しさん@おーぷん 22/08/01(月) 00:44:28 ID:UFmj
>>253
まあそうだろうね

260: 名無しさん@おーぷん 22/08/01(月) 00:45:14 ID:Fgf0
>>253
一致性を持たない場合サンプルサイズがいくら大きくなっても正しく推定できないよ

245: Isabelle◆jDillabxa6 22/08/01(月) 00:41:14 ID:JSRj
めちゃ伸びてるな
なしたん

246: 名無しさん@おーぷん 22/08/01(月) 00:41:20 ID:Sjx3
ケーキを三等分にすることに情熱を燃やす人おるけど
カップケーキ作れば問題解決では?

249: 名無しさん@おーぷん 22/08/01(月) 00:41:44 ID:7KjR
矢野の悪口はやめろ

251: 名無しさん@おーぷん 22/08/01(月) 00:42:18 ID:215e
調査にわざわざ答えるような人は…フィルターでいえばネットの政治絡みのアンケートとか反対がかなり増える気がするわ

257: 名無しさん@おーぷん 22/08/01(月) 00:44:17 ID:1fDy
ちなみにネットのアンケートって年収5000万以上の層は全くやらんらしいで

263: 名無しさん@おーぷん 22/08/01(月) 00:45:58 ID:Sjx3
>>257
お小遣い稼ぎポイント稼ぎやからさもありなん
と言うか実体験としてアンケートに真面目に答えない人が多そうな気がする

特に長いやつ

267: 名無しさん@おーぷん 22/08/01(月) 00:46:35 ID:215e
>>257
あれってそもそも答えるとポイントがもらえるアプリのユーザーとかやろ?
母数集団がすでにかなりの傾向持ってるよな

273: 名無しさん@おーぷん 22/08/01(月) 00:48:47 ID:fKfs
>>267
社会学的統計ってのはどうしても統計以前にその前提が雑だよねえ

274: 名無しさん@おーぷん 22/08/01(月) 00:50:14 ID:Fgf0
>>273
「アプリのアンケート」が社会学の研究で使われているならその主張に正当性はあるだろうけど、そうでないなら「社会学」を勘違いしているだけだと思う

275: 名無しさん@おーぷん 22/08/01(月) 00:52:02 ID:fKfs
>>274
アンケート自体がどうなのかなって思うけどその辺どう処理されてるんかなって
調査票の類も

261: 名無しさん@おーぷん 22/08/01(月) 00:45:18 ID:kJXf
統計重視打線構想

12345←いい打者順
バント禁止
投手は4人で一組
とにかくフライを打つ
一死一塁は走る
シフトは敷かない
厳しいコースは振らない

262: 名無しさん@おーぷん 22/08/01(月) 00:45:31 ID:215e
ビッグデータブームとか統計学最強本とかのせいで間接要因か直接要因か考えずに数字だけで結論するネット軍師は増えた気がする(無統計)

270: 名無しさん@おーぷん 22/08/01(月) 00:47:19 ID:1fDy
昔は手作業で単回帰直線書いてたとかにわかには信じられへんよなあ

272: 名無しさん@おーぷん 22/08/01(月) 00:48:43 ID:NiHy
>>270
学部の実験レポートが手書き必須だったンゴねぇ…

271: 名無しさん@おーぷん 22/08/01(月) 00:47:32 ID:Sjx3
ひろゆき「なんかそんなデータあるんですか?」
ワイ「ありますよ」(作為的な統計データを出す)
ワイ「でもこれ作為的だから意味ないんですよねぇwww」

とかやってみたい

276: 名無しさん@おーぷん 22/08/01(月) 00:52:09 ID:215e
一見して低レベルそうで実は難しい方法論的な話なんやけど
「質問したことで回答が激しく影響されるタイプの問い」あるよな

あなたは幸せですか?とか
幸せな人に聞いても「言われてみると…?」ってなって半数は「そうでもない」になるとか

278: 名無しさん@おーぷん 22/08/01(月) 00:52:37 ID:215e
社会学は下手すりゃ5人に聞いて一般化するからな

279: 名無しさん@おーぷん 22/08/01(月) 00:53:03 ID:NiHy
そこで計算社会科学ですよ!
まぁまだあんまりぽいけども

280: 名無しさん@おーぷん 22/08/01(月) 00:53:21 ID:24dW
アホか!
統計を信じてないわけじゃないわ!

都合の悪い事実を信じないだけや!

284: 名無しさん@おーぷん 22/08/01(月) 00:54:10 ID:215e
意見関係の統計風アンケートをマスコミが濫用しすぎたせいで信頼度下がってるんやろな

290: 名無しさん@おーぷん 22/08/01(月) 00:56:42 ID:fKfs
>>284
さっきの発熱とかも自己申告制なら相当雑だと思う

285: 名無しさん@おーぷん 22/08/01(月) 00:54:17 ID:1fDy
医学関連もp値.1で有意差判定したりするらしいからそのへんはまあ……
社会学は統計もやけどオーラル面も必要やし

288: 名無しさん@おーぷん 22/08/01(月) 00:55:34 ID:fKfs
てかイッチは普段どういうデータを統計処理してるん?

289: 名無しさん@おーぷん 22/08/01(月) 00:56:28 ID:Fgf0
>>288
ワイはあんまりやってない
GDPとか所得とかはまあ多少触ったり

292: 名無しさん@おーぷん 22/08/01(月) 00:57:30 ID:fKfs
>>289
経済系ってことね

293: 名無しさん@おーぷん 22/08/01(月) 00:57:39 ID:n8QQ
統計を頑なに信じてない奴は統計的にどれくらいの割合なんや

296: 名無しさん@おーぷん 22/08/01(月) 00:58:35 ID:215e
統計学的には血液型は真なんやけど理系は嫌うよな
説明要因が(まだ見つから)ないけど統計的には有意差がありますの典型例ちゃう?

297: 名無しさん@おーぷん 22/08/01(月) 00:59:09 ID:Fgf0
>>296
「血液型は真」ってどういう意味?

298: 名無しさん@おーぷん 22/08/01(月) 00:59:25 ID:215e
>>297
血液型性格診断や

299: 名無しさん@おーぷん 22/08/01(月) 00:59:41 ID:Fgf0
>>298
有意差あるの?

303: 名無しさん@おーぷん 22/08/01(月) 01:04:02 ID:fKfs
>>296
真かどうかは知らんけどバラエティサイエンス番組みたいなので輸血がしにくい血液型は周りからの扱われ方が異なるからだーみたいなの言ってたな

300: 名無しさん@おーぷん 22/08/01(月) 01:01:25 ID:fKfs
性格ってデータがもう怖い

301: 名無しさん@おーぷん 22/08/01(月) 01:02:13 ID:fKfs
このスレに出現した数から出すか

304: 名無しさん@おーぷん 22/08/01(月) 01:04:25 ID:NiHy
一応論文は出てるぽい
強いジャーナルじゃなさそうだから真偽は分からんが
https://prtimes.jp/main/html/rd/p/000000001.000076346.html

306: 名無しさん@おーぷん 22/08/01(月) 01:06:12 ID:fKfs
>>304
これはそれこそ質問の誘導とかすでにそう言う風潮を知識として知っててそれを受け入れるかどうかのバイアスがエグいのでは

308: 名無しさん@おーぷん 22/08/01(月) 01:06:49 ID:Fgf0
>>304
概要読んだ
この場合、血液型と自己認識との相関であって、占いでよくある「誰にでも当てはまっているようなことでも自分に当てはまっているように感じている」ということを除外できていないな

314: 名無しさん@おーぷん 22/08/01(月) 01:08:47 ID:215e
>>308
特定の状況でどう行動したか という外形的なデータでやって有意差出てたらおもろかったのにな

320: 名無しさん@おーぷん 22/08/01(月) 01:11:20 ID:fKfs
>>314
それもすでに刷り込みがあったら生物学的な先天的血液型じゃなくて社会的風潮による後天的教育効果ってならんかなあ
結局生物学的と言うなら仮設でもなぜそうなのかって筋道がないと
例えば特定のウイルスが糖鎖型の違いで増殖し難くてそれが神経系に作用するとかね
ねーわ

321: 名無しさん@おーぷん 22/08/01(月) 01:13:09 ID:Fgf0
>>320
別に生物学的とは言ってないのでは
仮にA型であることに起因して環境が変わって性格形成に影響するなら、因果推論としては血液型による因果ってことでおkやし

324: 名無しさん@おーぷん 22/08/01(月) 01:17:23 ID:fKfs
>>321
まあそれならバーナム効果じゃないけど言われたことを当たってると枠に当てはめてるだけではって言う方を攻めたほうが早そうと言うか
A→Bの間が気になるかならないかってのは学問の性質によるんやろか

331: 名無しさん@おーぷん 22/08/01(月) 01:23:09 ID:Fgf0
>>324
その通りで、せやから>>308って考えたわけやな
いや、そこに関心があるなら環境を共変量として因果推論してやればええんやけど、「Aを変えたらそれによってBが変わる」が分かれば政策なりなんなりで十分実用足り得るからな

307: 名無しさん@おーぷん 22/08/01(月) 01:06:22 ID:Sjx3
血液型で傾向はあるらしいがな

ただ性格って言うと無理あるよな

309: 名無しさん@おーぷん 22/08/01(月) 01:07:15 ID:YNi9
男は直情的で暴力を振るいやすい
女は感情的で論理的に討論を行えない
←ムキ~?全ての男(or女)がそうじゃない??取り消せ??

こういうのとか統計結果やねんから受け入れろやって思うわ

312: 名無しさん@おーぷん 22/08/01(月) 01:08:26 ID:Sjx3
>>309
人間を二等分にして比べる方がおかしい気がするけどな
日本人は陰険
アメリカ人は暴力的

みたいな

317: 名無しさん@おーぷん 22/08/01(月) 01:09:11 ID:fKfs
>>312
人間を三等分できない少年か

319: 名無しさん@おーぷん 22/08/01(月) 01:09:29 ID:215e
>>317
うまい!

323: 名無しさん@おーぷん 22/08/01(月) 01:14:06 ID:YNi9
>>312
情報に踊らされるのはいかんが
先入観ありきで行動起こすのは正しいやん
だってそれが先人の知恵や自分の経験則からくる最も的確な対処法なんやし
2極化して考えるのは間違いかも知らんが傾向として知るのは大事

310: 名無しさん@おーぷん 22/08/01(月) 01:07:49 ID:VW5L
カイ二乗分布ってなんや?

315: 名無しさん@おーぷん 22/08/01(月) 01:08:50 ID:Fgf0
>>310
お、久しぶり
カイ二乗分布っていうのは、正規分布に従うような変数を2乗したものの和が従う分布やで

311: 名無しさん@おーぷん 22/08/01(月) 01:08:03 ID:215e
有意差が観察できることとそれを説明できることはイコールやないんよね
なのに観察できたら説明できたと勘違いしたり
逆に説明できないからと有意差を否定する人もいる
ここの相関をめぐる態度おもろいわ
血液型診断でそれがいちばん明らかに出ると思う

313: 名無しさん@おーぷん 22/08/01(月) 01:08:27 ID:fKfs
知識がない群ってのがわからんしなあ
本人に知識がなくても周りが血液型の風潮から判断したことを本人に血液型と結び付けずに言うというケースもレアではないだろうし

316: 名無しさん@おーぷん 22/08/01(月) 01:09:01 ID:n8QQ
ラーメンを食べた者は100%死ぬ

318: 名無しさん@おーぷん 22/08/01(月) 01:09:25 ID:kJXf
ケーキでは

322: 名無しさん@おーぷん 22/08/01(月) 01:13:53 ID:Fgf0
(注記:そもそもワイはこの因果関係にすら懐疑的です)

327: 名無しさん@おーぷん 22/08/01(月) 01:20:27 ID:215e
バカほどワクチン打たない!みたいな血液型性格診断なみのガバガバ短絡説明には飛びつくのに血液型性格診断だけはなぜかカテゴリカルに否定されるのおもろいわ
誰か複合的な要因から研究してほしい

328: 名無しさん@おーぷん 22/08/01(月) 01:21:16 ID:fKfs
そもそもバカとか真面目とかそういうデータがもう無理…

330: 名無しさん@おーぷん 22/08/01(月) 01:22:49 ID:215e
>>328
統計そのものとはまた独立した部分でわりと濫用されがちな言われかたやろ?
コロナのときひどかったわ

333: 名無しさん@おーぷん 22/08/01(月) 01:26:26 ID:fKfs
血液型性格判断ってのが例えば高校のクラスで性格の自己申告と血液型を調べて一致した度合って話なら普通に有意とかありえるんじゃないかなあ
多分それを否定してるって人たちの多くは血液型による先天的な性格への作用って主張ってものがあると思ってのことじゃないのかね

334: 名無しさん@おーぷん 22/08/01(月) 01:28:10 ID:fKfs
往々にしてあるのは具体的なデータのどの部分がその記号に当てはまるかって話な気がする

336: 名無しさん@おーぷん 22/08/01(月) 01:29:20 ID:ssb8
結局中心極限定理理解できなかった

337: 名無しさん@おーぷん 22/08/01(月) 01:30:35 ID:Fgf0
>>336
確率変数の標本平均は、サンプルサイズが大きくなると漸近的に正規分布に従うようになる
というだけの話

338: 名無しさん@おーぷん 22/08/01(月) 01:35:12 ID:Fgf0
正直統計学とか全然専門じゃないから適当にだべって終わりにするつもりだったんやけど、予想外に伸びたからずっと居てしまった