多くの研究で言われている流れとして、教員の履歴書上の特性は教育成果に対して重要ではなく、その一方て教授方法とかそのプロセスは非常に重要なのではないかということがある(Aslam & Kingdom、HanushekのTQ論文とか)。
” To avoid the reflection problem (Charles F. Manski 1993), we use two measures of peer quality that are not determined by contact with peers: observable peer characteristics that change exogenously, such as experience and certification test scores; and unobservable peer quality based on teacher-specific, time-invariant, value-added estimates from pre-sample data.”
(悩み)次にそのセレクションを除くための固定効果を考えるんだけど、ここをもっとシステマティックに出せないかな、、、と。今のところ職人的な気がする。うううむ。「ある学校に入るのは教員と学校のマッチング」だから、教員固定効果と学校固定効果を入れることがとりあえず必然って感じかな。そんでさらに、time-variant factorにも対応するために、後述の教員学校固定効果や学校年度効果に拡張するって感じかな。
“To ensure that we do not use changes in peer quality due to teacher self-selection, we identify the changes in the performance of a teacher’s students that are correlated with changes in the composition of her peers within the same school by including teacher-school fixed effects.”
ここでのピアの定義は同じ学校の同じ学年をピアの定義としている。これがかなり重要な想定で、普通に考えたらピアの影響なんて同じ学年だけではなく同じ学校の教員からも受けるはず。それにも関わらず(推定上の都合で)ピアの定義を狭めている。そのためここで分析されるピア効果は、実際のピア効果のlower boundであることに注意しよう。
“We can evaluate the selection bias due to unobserved teacher characteristics using the approach of Altonji, Elder, and Taber (2005). “”
”Can measurement error explain the results?” 実際に変な回答によるバイアスの発生具合をシミュレーションによって分析(これもsignal extractionっぽい).
within-school approach
例えば次の様に行った後、within–school selectionがどの程度発生しているかを図ろうとしている。
“Even after controlling for the endogenous selection of students to schools, unobserved traits of the student (μics) and the teacher (ηcs) may additionally create within–school endogeneity issues and lead to a biased estimate of γ.”
この後”3.1. Within–school selection of students, teachers and teaching style”でその程度を測定していて、これは重要なので読んでおく。
教員の効果を測定する手法として、非常に頻繁に用いられるのは教員付加価値である。これは教育生産関数のインプットというより、むしろアウトプットを評価しているという点に注意を払う必要がある。すなわち、一般に教員能力といえば子供の人的資本を促進するものだと考えるが、ここではその結果である。そのため、この教員効果がインプットにもなりうるという点は別で評価する必要がある(→教員付加価値のcausal impactを評価する一連の研究)。
多くの場合教員効果を推定するときは、次の様なモデル化を行う(Jackson, Rockoff & Staiger(2014)に従っているが、文中での意図と書かれている数式が違うと思うので勝手に直している。)。
\[A _ { ijt } = \beta X _ { ijt } + \nu _ { ijt } \quad where \quad \nu _ { ijt } = \theta _ { j } + \mu _ { jt } + \varepsilon _ { ijt }\]iは生徒、jは教員、tは時間を指し、Aは教育成果、Xは生徒の個人特性、$\nu$は観察不可能な要因を表す。$\nu$は教員効果$\theta$、クラスルーム効果$\mu$、その他の要因$\varepsilon$で構成されるとする。 上記式から$A _ { i t } - \beta X _ { i t } $は教員効果$\theta$についての情報を持つがその中には今関心がないノイズである$\mu$と$\varepsilon$を含んでいる。そのため、多くの研究はsingal extraction問題を解くことで教員効果を推定している。
ノイズを含む信号から真の情報を抽出する問題を一般にsingal extractionと言う。 よく使う定理として次を挙げることができる。
signal extraction 定理
とした時に、次の様なシグナルの集合$X = \{x_i | i \in I \}$を受け取るとする。
\[\begin{eqnarray} x_i &=& \theta + \epsilon_i \\\\ && where \\ \epsilon_i &\sim& N(0, 1/\rho_i ) \\ Cov(\epsilon_i, \epsilon_j) &=& 0 (i \neq j) \end{eqnarray}\]この時、$\theta$に関する予想は
\[\begin{eqnarray} E(\theta | X) &=& \frac{\rho}{\rho ^ { \prime }} m + \sum _ { i = 1, i \in I} \frac{\rho_i}{\rho ^ { \prime }} x _ { i } \\ V(\theta | X) &=& 1 / \rho ^ { \prime } \\ && where \\ \rho ^ { \prime } &=& \rho + \sum _ { i = 1, i \in I} \rho _ { i } \end{eqnarray}\]となるように更新される。
直感的にはpriorも含めて情報の正確さで重み付けをしていって、fundamental variableを更新していく手続きである。
この時、先の教育生産関数の式は教員効果$\theta _ {j}$についての次の様なシグナルなのではないかと考えることができる。
\[s_{ijt} = A _ { ijt } - \beta X_{ ijt } = \theta _ {j} + \mu _ {jt} + \varepsilon _ {ijt}\]ただし先ほどのsignal extractionのセットアップだとシグナルのノイズ間に相関がないというセットアップだったので、このままでは使えない。そのため、次の様なセットアップに書き直す(害はない)。教員jがt期に担当している生徒を$I_{jt}$と書けば、
\[\begin{eqnarray} s_{jt} &=& \frac{\sum_{i, i \in I_{jt}} s_{ijt}}{\|I_{jt}\|} \\ &=& \theta _ {j} + \mu _ {jt} + \frac{\sum_{i, i \in I_{jt}} \varepsilon _ {ijt}}{\|I_{jt}\|} \\ &=& \theta _ {j} + v_{jt} \end{eqnarray}\]という教員効果$\theta _ {j}$についてのシグナルを毎期受け取ると考えることができる。
もし教員効果$\theta _ {j}$に対するpriorが期待値0及び分散$V(\theta)$であり、上記シグナルをt期分受け取ると上記のsignal extraction定理より(そのシグナルの集合を$s_j = \{s_{jt} | t \in T \}$と書くことにする)、
\begin{eqnarray} E(\theta | s_j ) &=& \sum_{t, t \in T} s_{jt} \frac{ \frac{1}{V(v_{jt})} }{ \frac{1}{V(\theta)} + \sum_{t, t \in T}\frac{1}{ V(v_{jt})} } \end{eqnarray}
さらに、Lefgren&Sims(2012)などはシグナルをさらに集約して、 \begin{eqnarray} s_{j} = \theta _ {j} + \frac{\sum_{t, t \in T} v_{jt}}{ || T || } \end{eqnarray} と書いて、$V(\frac{\sum_{t, t \in T} v_{jt}}{|T|}) = \frac{V(v_j)}{|T|}$と書くことで($V(v_j)$というものをどっかから調達してくるということ)、
\[\begin{eqnarray} E(\theta | s_j ) &=& s_{j} \times \frac{ \frac{1}{\frac{V(v_j)}{\|T\|}}}{ \frac{1}{V(\theta)} + \frac{1}{\frac{V(v_j)}{\|T\|}} } \\ &=& s_{j} \times \frac{V(\theta)}{V(\theta) + \frac{V(v_j)}{\|T \|}} \end{eqnarray}\]と教員効果を構成している。
( ただし初期の研究では、クラスの効果と教員の効果を分けていない研究も結構ある。
The earliest studies by Hanushek and Murnane, as well as work by Nye et al. (2004), did not distinguish between classroom and teacher effects. This limitation is essentially what separates these early studies from more recent work, beginning with Rockoff (2004), Rivkin et al. (2005), and Aaronson et al. (2007). In nearly all studies in this literature, teacher effects are assumed to be fully persistent or fixed across classrooms. We discuss recent papers that relax this assumption below.
Lefgren, L., & Sims, D. (2012). Using subject test scores efficiently to predict teacher value-added. Educational Evaluation and Policy Analysis, 34(1), 109-121. 個人的には一番丁寧かつ、subject別ではない取り出しみたいな取り組みをしていて面白かった。
Our VA model implies that a 1 standard deviation (SD) improvement in teacher VA raises normalized test scores by approximately 0.14 SD in math and 0.1 SD in English, slightly larger than the estimates in prior studies which do not account for drift.
chetty(2013, a)によれば教員付加価値に本質的な意味があるか否かという立場には次の観点があるとしている。すなわち、
While most of the international achievement datasets are cross-sectional, Singh (2015) uses a longitudinal dataset that observes individual students at ages 5 and 8 in four developing countries. The findings show that the large cross-country learning gaps between low-performing Peru and high-performing Vietnam (apparent earlier in Table 1) are virtually nonexistent at school-entry age.
