可观测数据与不可观测数据的建模关系

如下图所示,Z3代表可直接观测的变量,ζ代表难以直接观测的数据。Z1和Z2代表可以帮助我们理解Z3和ζ之间关系的变量,虽然我们不能直接观测ζ,但可以通过建立模型,利用可观测数据Z1、Z2和Z3来推断ζ。

模型表达式:

Y = G(X, Z)

其中:

  • Y 是我们希望预测或解释的目标变量。
  • X 代表模型输入特征。
  • Z = (Z1, Z2, Z3) 代表建模时可供选择的数据, 包括可观测变量和辅助变量。
  • G 代表我们实际建立的模型,用于刻画X和Z之间的关系。

三种可见数据与不可见数据的关系