情報更新

last update 03/29 14:53

ツイート検索

 

@genkuroki
サイトメニュー
Twilogユーザー検索

Twilog

 

Stats Twitter歴
5,100日(2010/04/13より)
ツイート数
315,685(61.8件/日)

ツイートの並び順 :

表示するツイート :

2020年11月30日(月)67 tweetssource

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 尤度函数と事後分布がほぼ同一の点を中心とする鋭い単峰型になっている場合には、最尤法、MAP法、ベイズ法の区別は実践的に無意味です。

こういう場合が結構あることは、「主義」と無関係に純粋に数学的にもしくはコンピュータによるお遊びで分かることです。「主義」によらない手堅い知識‼️

posted at 23:59:32

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 補足:モデルがシンプルならば、サンプルサイズnを大きくして行くと、尤度函数、尤度函数×事前分布、事後分布の形が、台がより小さな(1点の周囲に集中した)単峰型になります。そういう場合には(nが大きければ)最尤法、MAP法、ベイズ法の区別は実践的に無意味になることが数学的に確定します。

posted at 23:55:01

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 しかし、「形」を見る経験を積み重ねて行くと、尤度函数、尤度函数×事前分布、事後分布の形がよく見る単峰型にならずに、「高い山と低い山」「台が三日月型で凸ではない」「nを大きくしても薄く細く広がったまま全然単峰型に近付かない」のような多彩な様相を示す場合があることにも気付きます。

posted at 23:51:36

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 すると、シンプルなモデル(事前分布もおとなしめ)では、尤度函数、尤度函数×事前分布、事後分布の「形」(後者の2つは定数倍を除けば等しい)はほぼ同じになることに誰でもすぐに気付きます。

その場合には、最尤法、MAP法、ベイズ法の違いは大きくない。

posted at 23:47:11

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 そのとき、最尤法とMAP法もまとめて学んでしまうべきです。尤度函数や尤度函数×事前分布の「形」を見ることと、事後分布の「形」を見る手間はほぼ同じです。

最尤法の理解には尤度函数に「形」を知っていることが必要だし、MAP法の理解には尤度函数×事前分布の「形」を知っていることが必要。

posted at 23:44:05

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 事後分布や予測分布がどのような「形」になるかの知識抜きに、ベイズ統計をまともに応用できるはずがない。

今ならコンピュータで豊富に例を作れる。

個人で勉強する場合にやるべきことは、簡単なモデルで事後分布と予測分布をプロットしまくることでしょう。

posted at 23:40:40

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 最初に説明するべきことは、数学的に適当なゆるい条件を満たす任意の事前分布と任意の統計モデルの組み合わせについて、ベイズ統計の仕組みがどのような性質を持つかについてでしょう。

どのような思想に基いてベイズ統計を利用しても、その数学的性質は当然共通になります。その知識は手堅い。

posted at 23:37:44

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 21世紀現代のベイズ統計の周辺の数学的理解に基けば、明らかに必須ではない事前分布の主観確率による解釈を最初に説明するのは馬鹿げています。

必須でないものを最初に基礎に据えるのは、読者をミスリードすることから説明を始める行為になってしまいます。

posted at 23:33:52

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 「②ベイズ主義の主観確率」の意味での「主義」がベイズ統計で必須であるという誤解が広まっているせいで、まともな科学の研究者がベイズ統計を使った論文の査読で余計な苦労をさせられてしまう場合もあるらしい。

ベイズ統計の解説を主観確率のベイズ主義から始める習慣はクズそのもの。

posted at 23:28:35

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 「①あらゆるモデルは主観的に設定される」の意味での「主観」と「②ベイズ主義の主観確率」の意味での「主観」の意味は全然違います。

①は自明過ぎてつまらない話だが、レトリックとしては便利。

②の意味での主観はベイズ統計に必須ではない。まともな人なら必須だと主張するはずがない。 twitter.com/hidekatsu_izun

posted at 23:28:34

11月30日

@sekibunnteisuu

積分定数@sekibunnteisuu

掛け算の順序指導を、「その後の算数・数学の理解のために有用」という方に質問です。

あなた自身は、掛け算の式を書くときは順序を意識しましたか?

算数・数学を理解しましたか?(ここでは、高校で教わる数学をおおむね理解している、としましょう)

Retweeted by 黒木玄 Gen Kuroki

retweeted at 22:04:28

11月30日

@katzkagaya

Katsushi Kagaya, PhD@katzkagaya

補足すると「正規分布で事後分布が近似できない時、最尤法では…」と書いたことに対する応答でした。「哲学がそもそも異なるからこの文の意味が通らないという応答です。ここではその哲学は必要とせずにモデルを比較してるよと反論しました。

Retweeted by 黒木玄 Gen Kuroki

retweeted at 15:00:25

11月30日

@yamazaksv2

yamazaks💉ppmp💉@yamazaksv2

発達段階は誰がどうやって決めますか?それは万人に共通でしょうか?
算数と数学を分けたのはいつ誰が何のためでしょうか?

10人いれば10通りの発達段階があります。一律一斉指導だけでは限界があることは周知の事実です。
算数と数学だけでなく教科の境目は入試と授業の都合に過ぎません。 twitter.com/00_z_e_r_o_00/

Retweeted by 黒木玄 Gen Kuroki

retweeted at 14:15:59

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#超算数 #掛算 小学校での算数教育が特殊なローカルルールによって数学的な見方・考え方を否定していることに気付いた児童の保護者達は、学習指導要領における算数の目標を引用して「これに従え!」と言えばよいと思う。

一方『学習指導要領解説』(≠学習指導要領)には拘束力はない。

posted at 14:11:56

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#超算数 #掛算 学習指導要領の側が、算数も数学であることを強調するように改訂されている証拠。添付画像はそれぞれ

www.mext.go.jp/component/a_me

www.shinko-keirin.co.jp/keirinkan/sho/

より。添付画像1は平成29年版学習指導要領における算数の目標の説明。明らかに「数学的」が頻出キーワード化している。 pic.twitter.com/P01oOzWZT2

posted at 14:07:07

11月30日

@Y_Kaneko

金子洋一神奈川20区(相模原市南区、座間市)日本維新の会@Y_Kaneko

これはひどい。白川氏の主張通りの金融政策がとられ続けていたら、超円高で国内ものづくり産業は壊滅し、時給も上がらず就職氷河期が続き、株価も今の半分以下で企業も資金不足、笑うのはキャッシュリッチな富裕層だけだっただろうに。⇒和辻哲郎文化賞に白川前日銀総裁 www.kobe-np.co.jp/news/keizai/20

Retweeted by 黒木玄 Gen Kuroki

retweeted at 13:49:39

11月30日

@kuri_kurita

💙💛 k u r i t a 🐈‍⬛ 🐈 𓃭 𓃠@kuri_kurita

算数教育との絡みで「発達段階」という言葉を持ち出してくる奴は間違いなくヘッポコ(←湾曲表現)。

彼らが「発達段階」に関して主張する内容を裏付ける科学的に認められた事実や観察結果も無い、あるいはすでに否定されている。
そうでないと言うなら出すべき。(と言われて出してきた人は皆無) twitter.com/00_z_e_r_o_00/

Retweeted by 黒木玄 Gen Kuroki

retweeted at 13:43:31

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 例えば「期待値」や「回帰直線」の説明はずさんです。

こういう指摘を「揚げ足取り」のように解釈せずに、著者による統計学の態度全般の傾向を示す証拠だと解釈するべき。

実際、統計モデルが不十分な場合のベイズ更新やAICの説明のための「平均尤度」の解説もずさんです。 twitter.com/genkuroki/stat

posted at 12:34:34

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 『統計学を哲学する』のような本が売れるメリットがデメリットを上回るようにするためには、

* 統計学はお墨付きを得るための道具ではないので、統計学がお墨付きに必要な様々な主義を必要としていると誤解してはいけない。

* この本の統計学の解説はずさん。

の2点は強調しておくべき。 twitter.com/genkuroki/stat

Retweeted by 黒木玄 Gen Kuroki

retweeted at 12:26:00

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 一般向けの統計学の解説本にもひどいものが多い。しかし、そういう本であっても、数学的な計算の仕方などについては運良く手堅い知識を身に付けてしまうことは十分あり得る。

『統計学を哲学する』から運良く手堅い知識を身に付けてしまう幸運は起こり得るのだろうか?私は苦しいと思う。

posted at 11:46:10

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 『統計学を哲学する』のような本が売れるメリットがデメリットを上回るようにするためには、

* 統計学はお墨付きを得るための道具ではないので、統計学がお墨付きに必要な様々な主義を必要としていると誤解してはいけない。

* この本の統計学の解説はずさん。

の2点は強調しておくべき。 twitter.com/genkuroki/stat

posted at 11:41:57

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 『統計学を哲学する』のような本が沢山売れることによってどのような良い影響(統計学に興味を持つ人が増えるのは良いこと)と悪い影響があるのかは分かりませんが、

統計学はお墨付きを得るための道具ではない

という考え方は広まって欲しいと思う。

あと、私についてデマを流すのはやめろ(笑)

posted at 11:08:06

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 統計学で使われている数学の使い方のかなりの部分が、統計学使用時のリスクの確率的評価に関係しています。そしてそういう部分は結構繊細。

実際にはそういう繊細さを認識せずに統計学を使っている人達も沢山いるという現実もある。

posted at 11:08:06

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 統計学に興味を持っている沢山の世間一般の人達に『統計学を哲学する』はアピールする力を持っています。

しかし、統計学の利用が常にリスクを伴うギャンブルになることを強調するのではなく、統計学によって【お墨付き】が得られる哲学的理由を説明しようとしている。これはかなりの危険行為。

posted at 11:08:05

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 『統計学を哲学する』のようなスタイルが好きなサークル内部でこの本を高く評価することは御自由にやってもらって構わないと思いますが、その本の統計学パートがひどくずさんである点について何も語らないのは非常にまずいです。

posted at 10:47:41

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 『統計学を哲学する』が読む価値のある本だと主張したい人が認めなければいけないことは、その本における統計学の紹介の仕方が極めてずさんであること。

だからこの本を読んで統計学についての真っ当な地図を描けるような誤解を読者が持たないように正直に警告しておくことが必要です。

posted at 10:43:40

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 さらに【最終的に数学的に割り切れない話にも突入することは当たり前なのですが~】と「当たり前」とも言っている。

そういう数学的に割り切れない話に突入するために必要な前提をぶっとばして、よく見る【お墨付き】に必要な「主義」の要約を始める馬鹿げた行為をクズ扱いしているだけ。 twitter.com/genkuroki/stat

posted at 10:39:29

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 私がまるで「(数理)統計学は特定の主義にコミットすることなしに現実世界に適用可能である」の類のことを述べているかのようなデマを流すのはちょっとひど過ぎ。

「主義」について杜撰な議論をしていることの指摘と、「主義」が完璧に無用だと語るのは全然違う行為。 pic.twitter.com/wpLC8fvc2D

posted at 10:39:27

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 「うっひゃー、それミスリーディングだろ!」のような解説が、「分かり易かった」のような肯定的評価を受けて広まって行く現実が進行しているような気がするのは私だけ?

ここ数年の経験で、世界的に心理統計関係の解説からミスリーディングな解説が出て来ている場合が多いと思っています。

posted at 10:12:13

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 2×2の分割表の独立性のχ²検定は非常に有名な典型的な仮説検定の1つです。そのような仮説検定においても(最尤法による)予測分布のデータによる相対評価がもろに出て来ているわけです。

posted at 10:09:00

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 例:2×2の分割表の独立性検定は、帰無仮説で制限する前のモデルと帰無仮説で制限したモデルの予測分布を比較するモデル選択の一種になっている。

(ただし仮説検定なので帰無仮説を課した側のモデルが正しいのに間違って棄却される確率(第一種の過誤の確率)を低くおさえようとする。)

posted at 10:04:54

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 何が問題か?

教科書には仮説検定や信頼区間について以上で述べた意味でひどく非科学的な説明が書いてあるように見える。

そのせいで生じている誤解を、最近の「統計モデリング」推しの解説がさらに悪化させているように見える。

「頻度論vs.ベイズ」的なデタラメの普及はこれの一部分。

posted at 09:42:10

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 以上で私は科学のイロハのイである「データを使ったモデルの評価」という考え方に戻って、仮説検定、信頼区間、統計モデリングにおけるモデル選択について統一的な説明をしているのですが、特別なことは述べておらず、どちらかと言えば常識的な考え方を述べているに過ぎません。

posted at 09:38:53

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 『統計的有意性とP値に関するASA声明』のような内容的には常識に属する声明がわざわざ出されていることは、仮説検定自体が多くの場合に誤用されていることを示しています。

「使用した統計モデル」(例:正規分布モデル)も疑うべきであることを正直に説明しない解説が悪いのだと思います。

posted at 09:35:15

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 仮説検定や信頼区間もモデルによるデータの生成法則の近似の度合いを評価しているとみなせるし、『統計的有意性と P 値に関する ASA 声明』に忠実に従ってもそうならざるを得ないので、統計モデリングに移行した途端に全然違うことを始めると他人に教えるのは非常にまずい。

posted at 09:32:06

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 仮説検定や信頼区間を使う統計分析ではモデルで母集団分布を近似できていることを前提にするが、統計モデリングでは近似できていることを前提にせずに近似の度合いを評価しようとする、のような__明らかに間違っている解説__を聞いてしまった人は要注意‼️聞いた人がいれば報告してほしい。

posted at 09:22:45

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 例えば、正規分布モデルを用いたt検定では「正規分布でデータを生成した未知の分布がよく近似されている」という前提も当然疑いの対象としなければいけません。

多くの解説が(ASA声明に反して)この事実を正直に説明していない点は極めて非科学的な態度だと思います。

posted at 09:15:00

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 P値で評価されるのは、帰無仮説単体ではなく、背後にある仮定のすべてです(ASA声明)。

だから、仮説検定において「使用した統計モデルでデータを生成した未知の分布が十分よく近似されていること」を当然の前例にすることは、P値の典型的な誤用であるということになります。

posted at 09:12:18

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 統計学よりも上位にある普遍的な考え方(科学のイロハのイ!)である「データによるモデルの評価」という基本に戻るべき。

仮説検定や信頼区間の基礎教育の問題点は、統計モデルをテストしていることが分からない説明になっていることです。

posted at 09:05:53

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 この基本的事実を押さえずに、「仮説検定や信頼区間よりも、統計モデリングを使うべきだ」(もしくは前者より後者が優れている)というような説明をしている人達がいるから、初学者達がミスリードされて分からなくなってしまうのです。

posted at 09:05:52

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 あと言うまでもなく(教科書に書いてあるように)、情報量規準によるモデル選択は複数の統計モデルのデータによる相対評価になっています。

要するに、仮説検定、信頼区間、情報量規準によるモデル選択はどれも「統計モデルのデータによる評価」に過ぎないわけです。続く

posted at 08:59:51

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 仮説検定はデータを用いた統計モデルの評価になっている。

信頼区間も同様で、信頼区間はパラメータ付きの統計モデルのデータを用いた評価になっています。信頼係数1-αのパラメータθの信頼区間の定義は、統計モデルM(θ)がデータから有意水準αで棄却されないθの範囲だとみなせます。

posted at 08:56:03

11月30日

@genkuroki

黒木玄 Gen Kuroki@genkuroki

#統計 仮説検定やそれと表裏一体の信頼区間の解釈は、それらが前提にしているすべての前提を含めて行われるべきで(ASA声明がはP値について強調していること)、そのためには使用した統計モデルが何であるかを理解しておくことが必要です。

仮説検定では本当は統計モデル全体がテストされている。

posted at 08:49:49

このページの先頭へ

×