shap.datasets.iris
- shap.datasets.iris(display: Literal[False] = False, n_points: int | None = None) tuple[DataFrame, ndarray]
- shap.datasets.iris(display: Literal[True] = False, n_points: int | None = None) tuple[DataFrame, list[str]]
返回经典的 Iris 数据集,以方便的包形式提供。
- 参数:
- displaybool
如果为 True,则返回原始特征矩阵以及类标签(以字符串形式)。默认为 False。
- n_pointsint, 可选
要抽样的数据点数量。如果提供,则随机抽样指定数量的点。
- 返回值:
- Xpd.DataFrame
特征矩阵。
- ynp.ndarray 或字符串列表
如果
display
为 False,则返回表示编码为整数的类标签的 numpy 数组。如果display
为 True,则返回类标签列表。
注释
该数据集包括三种鸢尾花的花萼长度、花萼宽度、花瓣长度和花瓣宽度的测量值。
类标签被编码为整数 (0, 1, 2),代表物种(setosa、versicolor、virginica)。
如果
display
为 True,则类标签以字符串形式返回。
示例
获取特征矩阵和类标签
features, labels = shap.datasets.iris()
获取特征矩阵和字符串形式的类标签
features, class_labels = shap.datasets.iris(display=True)