そもそもクラスサイズに関する研究は相当昔まで遡ることができ、例えばそれは戦前にまで遡ることができる(JEPのサーベイに詳しい)。
多くの地域•学校でクラスサイズに関するフィールド実験がなされ、その結果の多くはクラスサイズと成績との間には相関なしというものであった。この研究結果は当時のクラスサイズ政策に大きく影響を与え、クラスサイズ拡大の政策に寄与した。
興味深いのはJEPのサーベイによれば、その背景には出生率の増加に裏打ちされた人口の増加があり多くの児童•生徒に義務教育を施す必要がある中で、どうすれば学業達成を犠牲にすることなくその目標を達成できるかという社会的要請があったという事実であろう。そのため、戦争などで人口が減少しわざわざクラスサイズを大きくする必要性がなくなると、クラスサイズ研究は急速に少なくなったという。
As the financial pressure on schools declined, interest in the importance of class size did as well, and class size research all but ceased for the next 15 years.
Rockoff, J. (2009). Field experiments in class size from the early twentieth century. Journal of Economic Perspectives, 23(4), 211-30.
このクラスサイズに関する研究状況が改善するのには戦後になってまたしばらく待つ必要がある。1980年代に入るとある程度の生徒や学校に関するデータセットが揃ってきたこともあり、多くの研究がなされるようになる(メモ:これは感想ですが特に教育学方面で?)。
そこでの解析とは多分にクラスサイズと学業達成の間の単純な関係性を観察するものであり、その意味では学力の生産関数の推定などを多分に性質を同じくするものであった。そのため、今日ではこのころの研究を振り返ることはあまりない(と思う)。
サーベイペーパー
• 基本的にはサーベイペーパーなのだが、s-t ratio における1994年までのメタアナリシスなども掲載している。
しかし90年代後半より、因果推論に関する関心と技術の高まりを背景に、クラスサイズと学業達成、若しくはクラスサイズとそのほかの要素の関係性を見ようという研究が多く登場した。その最もリジッドな例がテネシー州STAR実験の分析であり、またマイモニデスルールに在る外生成を用いた推定で在る。
クラスサイズ効果については、モダンな研究としてはおおまかに2つの方法で推定されてきた。即ち、実験環境の利用した推定(RCT)と擬似的な実験環境を利用した推定(マイモニデスルール、Fuzzy RDD)である。
特に前者については、多くの研究がクラスサイズの正の効果(即ち小さいクラスサイズはアウトカムに対して正の効果をもたらす)が認められるとしている。そのためクラスサイズ効果については、概ね存在が確認されていると言っていいだろう。
一方で、後者については初期の研究では正の効果を報告しているものが多い一方で、効果がないとしている研究も多くあることに注意が必要である。
STAR実験は以下の様に実施された、大規模なクラスサイズに関するフィールド実験である。
The largest class size experiment ever conducted, it involved the participation of 79 schools, 328 classes, and roughly 6,500 students when it began in 1985. Students and teachers were randomly assigned to small or large classes (averaging 15 or 23 students, respectively) from kindergarten through third grade, and students have been followed over time.
Rockoff, J. (2009). Field experiments in class size from the early twentieth century. Journal of Economic Perspectives, 23(4), 211-30.
ToDo : この論文20世紀初頭のCSRに関する研究のサーベイなので、これを引用するのは変
STAR実験のデータを用いた解析では、おおまかに次の様な結果が出ている。即ち、
また重要な非線形性として以下の様な点が報告されている。
またSTAR実験をどう受け止めるかについては議論があり、例えばhanushekは次の様な点をあげている。
Hanushek, E. A. (1999). Some findings from an independent investigation of the Tennessee STAR experiment and from other investigations of class size effects. Educational Evaluation and Policy Analysis, 21(2), 143-163.
全部をあげるとキリがないが、以下のものはサーベイが纏まっていたり、強く有用だったりすると思われる。
Krueger, A. B. (1999). Experimental estimates of education production functions. The quarterly journal of economics, 114(2), 497-532.
Finn, J. D., & Achilles, C. M. (1999). Tennessee’s class size study: Findings, implications, misconceptions. Educational evaluation and policy analysis, 21(2), 97-109.
STAR実験研究初期の教育社会学方面からのレビュー
Hanushek, E. A. (1999). Some findings from an independent investigation of the Tennessee STAR experiment and from other investigations of class size effects. Educational Evaluation and Policy Analysis, 21(2), 143-163.
大分批判的なレビュー
Schanzenbach, D. W. (2006). What have researchers learned from Project STAR?. Brookings papers on education policy, (9), 205-228.
後からの振り返りレビュー
Chetty, R., Friedman, J. N., Hilger, N., Saez, E., Schanzenbach, D. W., & Yagan, D. (2011). How does your kindergarten classroom affect your earnings? Evidence from Project STAR. The Quarterly Journal of Economics, 126(4), 1593-1660.
非認知や労働市場との関連など
Konstantopoulos, S. (2011). How consistent are class size effects?. Evaluation Review, 35(1), 71-92.
上記の研究のレプリケーションを実施。おおまかに上記論文は正しいという結論に。
STAR実験以外でRCTを行なってクラスサイズ縮小の効果について調べたというものだと、次の様な例をあげることができる。
Angrist and Lavy(1999)など擬似的な実験的環境を利用して推定するという研究も多くなされた。これらの研究の多くはマイモニデスルールを用いた2SLSを実行するものである。
その成績を対象に解析した研究の主要な結果としては、次の様な点を挙げることができる。
正確にいうと、この点についてかなり総体的には曖昧なところが残る。
一部の研究は確かに有意性を示していている一方で、もう一部で有意でなかったという研究もある。
この点についてSchanzenbach(2014)のポリシーサーベイなどが出ており、基本的には有意なんじゃないか?という議論は出ている
結局のところ「クラスサイズポリシーが有効でない」という言説は、多くはコストベネフィット的な観点であろうと思われる。
主だったところだと以下の研究を上げれるだろう。
Angrist, J. D., Lavy, V., Leder-Luis, J., & Shany, A. (2017)
Urquiola, M., & Verhoogen, E. (2009)
Barrett, N., & Toma, E. F. (2013)
まずマイモニデスルールを用いた(結果も含んでいる)主要な論文は以下の通り。
Angrist, J. D., & Lavy, V. (1999). Using Maimonides’ rule to estimate the effect of class size on scholastic achievement. The Quarterly Journal of Economics, 114(2), 533-575.
Data: イスラエルの学校データ
EstSt: マイモニデスルールを用いたIV
Result: significant(Grade5:Math•Language, Grade: Language)
Urquiola, M. (2006). Identifying class size effects in developing countries: Evidence from rural Bolivia. Review of Economics and statistics, 88(1), 171-177.
Data: ボリビアのデータ
EstSt:
2つの戦略でクラスサイズの効果を図っている
1. マイモニデスルール
2. 田舎はそもそも学校選択の余地がないし、一様にSES低いからよい?
Result: 成績:significant
単学級のデータ使えば、クラス編成についての内生成は取り除けるからいいのでは?というアイディアを提出
Data: コネチカット、幼稚園ー小学校
EstSt:
Result: 成績 : insignificant
TODO: 唯、ちょっと理屈をしっかり把握できていないので、読み込む必要がある
また上記の研究を反映して色々な国/母集団でその効果の確認を行う研究がなされている。
おおまかには有意な結果を報告している。
他Pikettyがフランスでやったりしているが、そのジャーナル掲載版が見つからず、一旦メモ。 (mimeoとして残っているだけ? )
中にはマイモニデスルールを用いたRDDの仮定に対して疑問を提出するものもある。すなわちマイモニデスルールのカットオフポイント付近での恣意的な操作が発生しうるとしている論文がいくつかある。
これまで挙げてきたようなものも含めると、以下の様な論文をあげることができる。
ここまで記述したものは全て学力への影響を見たものであった。
しかしクラスサイズの縮小や非認知能力などのcognitive以外にどのような影響を与えているか、もしくはそれが労働市場などにどのような影響を与えているかを見る研究も(当然存在する)
非認知能力について調査した文献として、(目に入る範囲で)referすべき重要な文献を以下の表にまとめた。
その主要な結果をまとめると、
おおまかには非認知に対しては効果がありという研究 これは単に効果がないという研究は世に出ないだけ?
そこでの非認知というのは質問紙から構成された心理学的な尺度の研究は少ないがFredrickssonやDee and Westのものなど
基本的には単年度の定点観測のデータ(VAにはなっていない)
Name | EstimationStrategy | Data(Nation & Grade & level) | Output(significant) | Hetero |
---|---|---|---|---|
Dee, T. S., & West, M. R. (2011) | OLS, variation between subject at a class room | U.S. 8th grade, individuals , NELS:88 | 学力(significant?) 非認知 質問紙回答(授業へのやる気系, significant) 卒業率など(数年後, significant) 賃金(10年後, significant) * ちょっとアウトカムが多くて把握しきれない |
|
Chetty et al. 2011 | RCT-ols | アメリカ、テネシー州, 幼稚園-1st~3rd, individuals | * 大人になってから(27歳)の成果を測定 賃金(significant) 大学出席率(significant) 持ち家率(significant) 貯蓄(significant) |
|
Fredricksson et al. 2013 | Maimonides | スウェーデン, grade4-6, individuals, 1967~1982年 | • cognitive(IQ) & non-cognitive (significant, 13 years old) 数学 スウェーデン語 Non Cog(effort motivation, aspirations, self-confidence, sociability, absenteeism, and anxiety) • Academic achievement (significant, 16 years old) • Wage (significant, 27-42 years old) |
</span>
Data: Sweden, primaryschool
EstSt: IV for maimonides rule
Result:
以下のものたちに対して有意
Chetty, R., Friedman, J. N., Hilger, N., Saez, E., Schanzenbach, D. W., & Yagan, D. (2011)
Fredriksson, Peter, Björn Öckert, and Hessel Oosterbeek. “Long-term effects of class size.” The Quarterly Journal of Economics 128.1 (2012)
Fridericsonのショートレビュー
Previous attempts have been plagued by lack of precision (Chetty et al. 2011), unavailability of directly linked data on labor market outcomes (Krueger 2003; Schanzenbach 2007), or strong identifying assumptions (Dearden, Ferri, and Meghir 2002; Dustmann, Rajah, and van Soest 2003)
日本語のペーパーは以下の様なものをあげることができる。 特に重要なのは、Hojo, M. (2013)•Akabayashi, Hideo, and Ryosuke Nakamura(2014)•伊藤他(2017)などだろうが、 そこまでリジッドに有意であったという報告は少ないように思える。
Name | EstimationStrategy | Data(Nation & Grade & level) | Output(significant) | Hetero |
---|---|---|---|---|
二木美苗. (2013). | Maimonides | Japan, 8th grade, individuals, TIMSS2003 | Math(insignificant) Science(insignificant) Non-cognitive(質問紙) 高い意欲(NonCog) 自信(NonCog) 有用性(NonCog) 帰属性(NonCog) 興味(NonCog) 意欲(NonCog) 混乱(NonCog) |
|
Hojo, M. (2013) | Maimonides rule, piecewise-linear specification(estimated by spline completion) | Japan, 4th grade, individuals, TIMSS 2003 | Mathematics(significant, ??ほんまけ) Science(significant, ??ほんまけ) |
|
妹尾渉, 篠崎武久, & 北條雅一. (2013). | OLS in Unit class school | Japan, 6th • 9th, individuals, 全国学力・学習状況調査(平成 19 年度実施) | Japanese(significant) Math(significant) |
|
Akabayashi, Hideo, and Ryosuke Nakamura(2014) | Maimonodes Rule, Value Added | Yokohama(National Achievement Test 2008 , Yokohama Achievement Test 2009), 6 grade, 9 grade, school level | Japanese language (significant only at 6grade) Math (insignificant) |
|
妹尾渉, 北條雅一, 篠崎武久, & 佐野晋平. (2014) | Maimonides Rule | Japan, 6th • 9th grade, individuals, 全国学力・学習状況調査 | Japanese(insignificant at only 6th grade) Math(insignificant) |
|
妹尾渉. (2016) | MultiLevel | Japan ,6th • 9th grade, individuals, 全国学力・学習状況調査 2013 | Math(significant) Japanese(significant) |
|
伊藤他(2017) | 方法:実質RCT(全ての学校がクラスサイズルールに従っている)-階層ベイズ | 日本(中部地方の位置中規模市), 小学4年〜中学3年 | 学業成績(国語・数学, significant) 非認知 友人関係(insignificant) 教師との関係(insignificant?) 向社会的行動(significant) ソーシャルサポート(友人or教師)(significant) メンタルヘルス(significant) |
</span>
CSR(Class size reduction policy)は、実は内実にジレンマを孕みうる。
すなわちCSRで子供一人当たりの教員の数を増やすと教員の採用数を挙げなきゃいけなくなるため、むしろレベルの低い教員を採用する必要が出てくる、といったジレンマである。
その文脈では、以下の様な文献が知られてる。
"This tradeoff implies that as class size increases, at first the negative class size effect is smaller than that of introducing a first time teacher."
first time theacher : 初任
そもそもCSRがなぜ効果を持ちうるかという点については十分な検証がなされていないのが現状である。
上記にも述べた通りCSRの現代的研究は時代性を帯びており、そのメカニズム自体を考える前に検証が始まっているのかもしれない。
私見ではあるが、CSRはSTratioなど学校の中で教員がなぜ生徒にとって重要なのかを考える材料の一つであるように思う.
プリミティブではあるがCSRが効く理由としてはLazearのモデルをあげる研究が多い。下記に記すのはそのような言及をしている研究である。
Mueller, S. (2013). Teacher experience and the class size effect—Experimental evidence. Journal of Public Economics, 98, 44-52.
Schanzenbach, D. W. (2006). What have researchers learned from Project STAR?. Brookings papers on education policy, (9), 205-228.
解釈のみ
Bandiera, O., Larcinese, V., & Rasul, I. (2010). Heterogeneous class size effects: New evidence from a panel of university students. The Economic Journal, 120(549), 1365-1398.
引用数 128 * Data: data:administrative data on individual students from a leading UK university, for the academic years 1999/00 to 2003/4.
イギリスの大学のデータを用いてクラスサイズの学業達成への影響を調査。 クラスサイズに効果はある、という結論に。 特に着目したのはその非線型性。次の様な非線型性が確認された