可观测数据与不可观测数据的建模关系
如下图所示,Z3代表可直接观测的变量,ζ代表难以直接观测的数据。Z1和Z2代表可以帮助我们理解Z3和ζ之间关系的变量,虽然我们不能直接观测ζ,但可以通过建立模型,利用可观测数据Z1、Z2和Z3来推断ζ。
模型表达式:
Y = G(X, Z)
其中:
- Y 是我们希望预测或解释的目标变量。
- X 代表模型输入特征。
- Z = (Z1, Z2, Z3) 代表建模时可供选择的数据, 包括可观测变量和辅助变量。
- G 代表我们实际建立的模型,用于刻画X和Z之间的关系。