shap.datasets.corrgroups60

shap.datasets.corrgroups60(n_points: int = 1000) tuple[DataFrame, ndarray]

相关组 (60 个特征)

一个合成数据集,包含 60 个特征,这些特征在不同的特征组之间具有紧密的相关性。

参数:
n_pointsint, 可选

要生成的数据点数量。 默认为 1,000。

返回:
Xpd.DataFrame

特征数据矩阵

ynp.ndarray

目标变量

说明

  • 该数据集的生成考虑了不同特征组之间已知的相关性。

  • 每个特征都是一个单位方差高斯随机变量,中心位于 0 附近。

  • 标签是基于特征的线性函数生成的,并添加了随机噪声。

示例

data, target = shap.datasets.corrgroups60()