shap.datasets.imdb

shap.datasets.imdb(n_points: int | None = None) → tuple[list[str], ndarray]

返回经典的 IMDB 情感分析训练数据，并以友好的方式打包。

用于二元文本分类任务。

参数:

返回:

注释

使用该数据时需要引用的论文是： http://www.aclweb.org/anthology/P11-1015

示例

要获取处理后的文本数据和标签

text_data, labels = shap.datasets.imdb()