5.2 R统计分析中的关键元素是公式的应用: 几乎所有函数都采用相同的符号。典型的公式形式为y ~ model,其中y为响应变量,model为一些元素项的集合,需要估计参数。这些元素项通过特定的运算符连接。例如,a+b表示a和b的相加效应;如果X是一个矩阵,则X[,1]+X[,2]+...+X[,ncol(X)]反映各列的相加效应。还可以使用索引向量来选择特定列进行分析,如X[,2:4]。a:b表示a和b的交互效应,而a*b则表示相加和交互效应。poly(a, n)表示a的n阶多项式,包括所有直到n阶的交互作用。b %in% a表示b和a的嵌套分类设计。-b表示去除因子b的影响,如(a+b+c)^2-a:b等同于a+b+c+a:c+b:c。y~x-1表示通过原点的线性回归,而y~1则拟合一个没有因子影响的模型(仅有截距)。offset(...)可向模型中添加影响因子,但不估计任何参数。