shap.datasets.imagenet50

shap.datasets.imagenet50(resolution: int = 224, n_points: int | None = None) tuple[ndarray, ndarray]

返回一组代表 ImageNet 图像的 50 张图像。

参数:
resolutionint

图像的分辨率。目前,唯一支持的值是 224。

n_pointsint, 可选

要采样的数据点数量。如果为 None,则使用整个数据集。

返回:
Xnp.ndarray

表示来自 ImageNet 的特定分辨率的图像。

ynp.ndarray

目标变量,即 ImageNet 类。

注释

此数据集是通过随机找到一个可用的 ImageNet 链接,然后将原始 ImageNet 图像粘贴到 Google 图片搜索中,并限制为可重复使用的许可图像而收集的。下载了类似的图像(现在具有重复使用权),作为原始 ImageNet 图像的粗略替代品。重点是拥有 ImageNet 的随机样本,用作解释在 ImageNet 数据上训练的模型的背景分布。

请注意,由于图像只是粗略的替代品,因此标签可能不再正确。

示例

要获取处理后的图像和标签

images, labels = shap.datasets.imagenet50()