layout: default
这几个看的比较糙,就写到一起了。
把模型做因式分解
$$ f(x1, x2, x3) = f(0) + f(x1) + f(x2) + f(x3) + f(x1, x2) + f(x1, x3) + f(x2, x3) + f(x1, x2, x3) $$
尽量拆解变量之间的关系,进行简化。方案比较理想。
删除一个特征,看模型预测值的变化,来衡量特征重要性 用训练集还是测试集实验呢?测试集
优点
缺点
描述:训练一个可解释的模型去拟合原模型,通过解释「可解释模型」来解释原模型。 看法:在原模型不可变的情况下比较适用。比如线上模型出故障了排查原因、线上模型由于各种原因不能修改。
描述:挑选原数据集中具有代表性的点(Prototypes),再挑选Prototypes 代表的不好的点Criticisms,利用这些代表点来解释模型,看是否被模型正确判定。 看法:
参考:https://christophm.github.io/interpretable-ml-book/global-methods.html