shap.datasets.corrgroups60
- shap.datasets.corrgroups60(n_points: int = 1000) tuple[DataFrame, ndarray]
相关组 (60 个特征)
一个合成数据集,包含 60 个特征,这些特征在不同的特征组之间具有紧密的相关性。
- 参数:
- n_pointsint, 可选
要生成的数据点数量。 默认为 1,000。
- 返回:
- Xpd.DataFrame
特征数据矩阵
- ynp.ndarray
目标变量
说明
该数据集的生成考虑了不同特征组之间已知的相关性。
每个特征都是一个单位方差高斯随机变量,中心位于 0 附近。
标签是基于特征的线性函数生成的,并添加了随机噪声。
示例
data, target = shap.datasets.corrgroups60()