shap.models.TextGeneration

class shap.models.TextGeneration(model=None, tokenizer=None, target_sentences=None, device=None)

使用基础模型生成目标句子/ID。

它为一个模型（预训练的 Transformer 模型或函数）生成目标句子/ID。

__init__(model=None, tokenizer=None, target_sentences=None, device=None)

从预训练的 Transformer 模型或函数创建一个文本生成器模型。

对于预训练的 Transformer 模型，应该传递一个分词器。

参数:

model: 对象或函数: 任何预训练的 Transformer 模型或函数的对象，用于生成目标句子/ID。
tokenizer: 对象: 一个分词器对象 (PreTrainedTokenizer/PreTrainedTokenizerFast)，用于分词句子。
target_sentences: 列表: 每个解释行的目标句子。
device: 字符串: 默认情况下，它会推断系统是否具有 GPU 并相应地设置设备。应为 ‘cpu’ 或 ‘cuda’ 或 PyTorch 模型。

返回:

方法

`__init__`([model, tokenizer, ...])	从预训练的 Transformer 模型或函数创建一个文本生成器模型。
`get_inputs`(X[, padding_side])	此函数对源句子进行分词。
`load`(in_file[, instantiate])	这旨在被子类覆盖并使用 super 调用。
`model_generate`(X)	此函数为 TensorFlow 和 PyTorch 模型执行文本生成。
`parse_prefix_suffix_for_model_generate_output`(output)	计算特殊 token 是否出现在模型生成输出的开头/结尾。
`save`(out_file)	将模型保存到给定的文件流。

get_inputs(X, padding_side='right')

此函数对源句子进行分词。

在模型无关的情况下，该函数调用 model(X)，预计返回一批输出句子，这些句子被分词以计算输入。

参数:

返回:

classmethod load(in_file, instantiate=True)

这旨在被子类覆盖并使用 super 调用。

当不被实例化时，我们返回构造函数参数值。由于 Serializable 类没有构造函数参数，我们只返回一个空字典。

model_generate(X)

此函数为 TensorFlow 和 PyTorch 模型执行文本生成。

参数:

返回:

parse_prefix_suffix_for_model_generate_output(output)

计算特殊 token 是否出现在模型生成输出的开头/结尾。

参数:

返回: