shap.ExactExplainer
- class shap.ExactExplainer(model, masker, link=CPUDispatcher(<function identity>), linearize_link=True, feature_names=None)
通过优化的精确枚举计算 SHAP 值。
对于每个样本中与背景不同的特征少于约 15 个的模型的标准 Shapley 值掩码器,这效果很好。当每个样本中与背景不同的特征少于约 100 个时,它也适用于来自 hclustering 结构化掩码器的 Owen 值。此解释器通过对掩码集进行排序以最小化顺序差异来最小化所需的功能评估次数。这对于标准 Shapley 值使用格雷码完成,对于 hclustering 结构化掩码器使用贪婪排序方法完成。
- __init__(model, masker, link=CPUDispatcher(<function identity>), linearize_link=True, feature_names=None)
使用给定的掩码器对象为给定模型构建 explainers.Exact 对象。
- 参数:
- modelfunction
一个可调用的 python 对象,它为给定的输入数据样本集执行模型。
- maskerfunction 或 numpy.array 或 pandas.DataFrame
一个可调用的 python 对象,用于“掩盖”隐藏特征,形式为 masker(mask, *fargs)。它接受单个二进制掩码和输入样本,并返回掩码样本矩阵。这些掩码样本使用模型函数进行评估,然后对输出进行平均。作为 SHAP 使用的标准掩码的快捷方式,您可以传递背景数据矩阵而不是函数,该矩阵将用于掩码。要使用聚类博弈结构,您可以传递 shap.maskers.TabularPartitions(data) 对象。
- linkfunction
链接函数,用于在模型的输出单位和 SHAP 值单位之间进行映射。默认情况下,它是 shap.links.identity,但 shap.links.logit 可能很有用,以便在概率单位中计算期望,而解释保持在(更自然地可加的)对数几率单位中。有关链接函数如何工作的更多详细信息,请参阅广义线性模型的链接函数的任何概述。
- linearize_linkbool
如果我们使用非线性链接函数来获取期望值,那么对于单个背景样本相对于该链接函数是可加的模型,在使用具有多个样本的背景掩码器时将不再是可加的。例如,这意味着线性逻辑回归模型将具有交互效应,这些效应是由期望平均值中的非线性变化引起的。为了在仍然尊重链接函数的情况下保留模型的可加性,我们默认情况下线性化链接函数。
方法
__init__
(model, masker[, link, ...])使用给定的掩码器对象为给定模型构建 explainers.Exact 对象。
explain_row
(*row_args, max_evals, ...)解释单行并返回元组 (row_values, row_expected_values, row_mask_shapes)。
load
(in_file[, model_loader, masker_loader, ...])从给定的文件流加载 Explainer。
save
(out_file[, model_saver, masker_saver])将解释器写入给定的文件流。
supports_model_with_masker
(model, masker)确定此解释器是否可以处理给定的模型。
- explain_row(*row_args, max_evals, main_effects, error_bounds, batch_size, outputs, interactions, silent)
解释单行并返回元组 (row_values, row_expected_values, row_mask_shapes)。
- classmethod load(in_file, model_loader=<bound method Model.load of <class 'shap.models._model.Model'>>, masker_loader=<bound method Serializable.load of <class 'shap.maskers._masker.Masker'>>, instantiate=True)
从给定的文件流加载 Explainer。
- 参数:
- in_file要从中加载对象的文件流。
- save(out_file, model_saver='.save', masker_saver='.save')
将解释器写入给定的文件流。
- static supports_model_with_masker(model, masker)
确定此解释器是否可以处理给定的模型。
这是一个抽象静态方法,旨在由每个子类实现。