API 参考
此页面包含 SHAP 中公共对象和函数的 API 参考。 此外,还提供了一些示例笔记本,演示了如何使用每个对象/函数的 API。
解释
|
表示 SHAP 解释的可切片并行数组集。 |
|
一个 |
解释器
|
使用 Shapley 值来解释任何机器学习模型或 Python 函数。 |
|
使用 Tree SHAP 算法来解释集成树模型的输出。 |
|
TreeExplainer 的实验性 GPU 加速版本。 |
|
计算线性模型的 SHAP 值,可以选择考虑特征间的相关性。 |
|
此方法通过迭代输入的排列来近似 Shapley 值。 |
|
使用 Partition SHAP 方法来解释任何函数的输出。 |
|
使用 Shapley 抽样值解释方法(也称为 IME)的扩展来计算 SHAP 值。 |
|
计算广义加性模型的 SHAP 值。 |
|
旨在近似深度学习模型的 SHAP 值。 |
|
使用 Kernel SHAP 方法来解释任何函数的输出。 |
|
使用期望梯度(积分梯度的扩展)来解释模型。 |
|
通过优化的精确枚举计算 SHAP 值。 |
简单地返回模型系数作为特征属性。 |
|
|
简单地返回随机(正态分布)特征属性。 |
|
简单地将 lime.lime_tabular.LimeTabularExplainer 包装到通用的 shap 接口中。 |
|
简单地将 MAPLE 包装到通用的 SHAP 接口中。 |
|
简单地将 tree MAPLE 包装到通用的 SHAP 接口中。 |
简单地返回树模型的全局增益/基尼特征重要性。 |
绘图
|
创建一组 SHAP 值的条形图。 |
|
将单个预测的解释绘制为瀑布图。 |
|
创建 SHAP 依赖散点图,可以选择按交互特征着色。 |
|
创建一组 SHAP 值的热图。 |
|
使用加性力布局可视化给定的 SHAP 值。 |
|
使用着色和交互式标签绘制文本字符串的解释。 |
|
绘制图像输入的 SHAP 值。 |
|
基本的偏依赖图函数。 |
|
使用累积 SHAP 值可视化模型决策。 |
|
使用 SHAP 值作为嵌入,我们将其投影到 2D 以进行可视化。 |
初始化交互式力图所需的 javascript 库。 |
|
|
此图绘制两组之间平均 SHAP 值的差异。 |
|
绘制带有文本输出的图像输入的 SHAP 值。 |
|
创建 SHAP 监控图。 |
|
创建 SHAP 蜜蜂图,如果提供了特征值,则按特征值着色。 |
|
创建 SHAP 小提琴图,如果提供了特征值,则按特征值着色。 |
掩码器
这是所有掩码器的超类。 |
|
|
这通过在给定的背景数据集上积分来掩盖表格特征。 |
|
这通过在给定的背景数据集上积分来掩盖表格特征。 |
|
这使用观察到的特征的值来估算缺失特征的值。 |
这使输入在掩码期间保持不变,并用于诸如评分标签之类的事情。 |
|
|
这会将几个不同输入的掩码器合并为一个复合掩码器。 |
|
一个掩码器,它将掩码数据和原始数据都作为一对输出。 |
|
一个掩码器,它是掩码器和模型的组合,并输出掩码参数和模型的输出。 |
|
这根据给定的分词器掩盖标记。 |
|
使用模糊或修复来掩盖图像区域。 |
模型
|
这是所有模型的超类。 |
|
使用 Teacher Forcing 技术为输出文本解释算法生成分数(对数几率)。 |
|
使用基本模型生成目标句子/ID。 |
|
为因果/掩码 LM 的前 k 个标记生成分数(对数几率)。 |
|
这包装了一个 transformers pipeline 对象,以便于解释。 |
实用工具
|
拟合特征 X 相对于目标变量 y 的分层聚类模型。 |
|
叶子排序是欠定义的,这选择了保持附近样本相似的排序。 |
|
|
|
以与给定分区树一致的方式随机打乱索引。 |
|
|
|
按其他特征与给定索引处的特征的交互程度对其进行排序。 |
按其他特征与给定索引处的特征的交互程度对其进行排序。 |
|
|
执行输入数据 |
|
|
|
一种表示对象上的一组点链式操作的方法,而无需实际运行它们。 |
|
|
|
这是一个实用程序类,它组合了一个模型、一个掩码器对象和一个当前输入。 |
|
从给定的聚类构建稀疏 CSR 掩码矩阵。 |
数据集
|
以 scipy csr 矩阵格式返回稀疏数据集。 |
|
以结构化格式返回 Adult 人口普查数据。 |
|
以表格格式返回加州住房数据。 |
|
预测每 10 万人口的暴力犯罪总数。 |
|
相关组(60 个特征) |
|
以友好的包返回糖尿病数据。 |
|
返回一组 50 张代表 ImageNet 图像的图像。 |
|
以友好的包返回经典的 IMDB 情感分析训练数据。 |
|
独立线性(60 个特征) |
以方便的包返回经典的 Iris 数据集。 |
|
|
以方便的包返回 Linnerud 数据集,用于多目标回归。 |
|
以友好的打包版本返回 NHANES I 数据,并将生存时间作为标签。 |
从 LightGBM 存储库返回排名数据集。 |