shap.datasets.iris

shap.datasets.iris(display: Literal[False] = False, n_points: int | None = None) tuple[DataFrame, ndarray]
shap.datasets.iris(display: Literal[True] = False, n_points: int | None = None) tuple[DataFrame, list[str]]

返回经典的 Iris 数据集,以方便的包形式提供。

参数:
displaybool

如果为 True,则返回原始特征矩阵以及类标签(以字符串形式)。默认为 False。

n_pointsint, 可选

要抽样的数据点数量。如果提供,则随机抽样指定数量的点。

返回值:
Xpd.DataFrame

特征矩阵。

ynp.ndarray 或字符串列表

如果 display 为 False,则返回表示编码为整数的类标签的 numpy 数组。如果 display 为 True,则返回类标签列表。

注释

  • 该数据集包括三种鸢尾花的花萼长度、花萼宽度、花瓣长度和花瓣宽度的测量值。

  • 类标签被编码为整数 (0, 1, 2),代表物种(setosa、versicolor、virginica)。

  • 如果 display 为 True,则类标签以字符串形式返回。

示例

获取特征矩阵和类标签

features, labels = shap.datasets.iris()

获取特征矩阵和字符串形式的类标签

features, class_labels = shap.datasets.iris(display=True)