Fine-tuning for classification 3. Fine-tuning Model

Fine-tuning the model on supervised data

我们必须定义并使用训练函数来微调预训练的 LLM，并提高其垃圾邮件分类准确性。训练循环如图 6.15 所示，与我们用于预训练的整体训练循环相同；唯一的区别是我们计算分类准确性，而不是生成样本文本来评估模型。

图 6.15 训练深度神经网络的典型训练循环在 PyTorch 中由几个步骤组成，遍历训练集中的批次，进行多个周期。

训练函数实现了图6.15中显示的概念，也与用于模型预训练的train_model_simple函数密切对应。唯一的两个区别是我们现在跟踪看到的训练样本数量（examples_seen），而不是标记的数量，并且我们在每个训练周期后计算准确率，而不是打印样本文本。

# Overall the same as `train_model_simple`
def train_classifier_simple(model, train_loader, val_loader, optimizer, device, num_epochs,
                            eval_freq, eval_iter):
    # Initialize lists to track losses and examples seen
    train_losses, val_losses, train_accs, val_accs = [], [], [], []
    examples_seen, global_step = 0, -1

    # Main training loop
    for epoch in range(num_epochs):
        model.train()  # Set model to training mode

        for input_batch, target_batch in train_loader:
            optimizer.zero_grad() # Reset loss gradients from previous batch iteration
            loss = calc_loss_batch(input_batch, target_batch, model, device)
            loss.backward() # Calculate loss gradients
            optimizer.step() # Update model weights using loss gradients
            examples_seen += input_batch.shape[0] # New: track examples instead of tokens
            global_step += 1

            # Optional evaluation step
            if global_step % eval_freq == 0:
                train_loss, val_loss = evaluate_model(
                    model, train_loader, val_loader, device, eval_iter)
                train_losses.append(train_loss)
                val_losses.append(val_loss)
                print(f"Ep {epoch+1} (Step {global_step:06d}): "
                      f"Train loss {train_loss:.3f}, Val loss {val_loss:.3f}")

        # Calculate accuracy after each epoch
        train_accuracy = calc_accuracy_loader(train_loader, model, device, num_batches=eval_iter)
        val_accuracy = calc_accuracy_loader(val_loader, model, device, num_batches=eval_iter)
        print(f"Training accuracy: {train_accuracy*100:.2f}% | ", end="")
        print(f"Validation accuracy: {val_accuracy*100:.2f}%")
        train_accs.append(train_accuracy)
        val_accs.append(val_accuracy)

    return train_losses, val_losses, train_accs, val_accs, examples_seen

def evaluate_model(model, train_loader, val_loader, device, eval_iter):
    model.eval()
    with torch.no_grad():
        train_loss = calc_loss_loader(train_loader, model, device, num_batches=eval_iter)
        val_loss = calc_loss_loader(val_loader, model, device, num_batches=eval_iter)
    model.train()
    return train_loss, val_loss

接下来，我们初始化优化器，设置训练的轮数，并使用 train_classifier_simple 函数开始训练。在 M3 MacBook Air 笔记本电脑上，训练大约需要 6 分钟，而在 V100 或 A10 0 GPU 上则少于半分钟：

import time

start_time = time.time() 
torch.manual_seed(123) 
optimizer = torch.optim.AdamW(model.parameters(), lr=5e-5,weight_decay=0.1) 

num_epochs = 5

train_losses, val_losses, train_accs, val_accs, examples_seen = \
    train_classifier_simple( 
        model, train_loader, val_loader, optimizer, device,
        num_epochs=num_epochs, eval_freq=50,eval_iter=5)

end_time = time.time() 
execution_time_minutes = (end_time - start_time) / 60 
print(f"Training completed in {execution_time_minutes:.2f} minutes.")

## output

我们然后使用 Matplotlib 绘制训练集和验证集的损失函数。

import matplotlib.pyplot as plt

def plot_values(epochs_seen, examples_seen, train_values, val_values, label="loss"):
    fig, ax1 = plt.subplots(figsize=(5, 3))

    # Plot training and validation loss against epochs
    ax1.plot(epochs_seen, train_values, label=f"Training {label}")
    ax1.plot(epochs_seen, val_values, linestyle="-.", label=f"Validation {label}")
    ax1.set_xlabel("Epochs")
    ax1.set_ylabel(label.capitalize())
    ax1.legend()

    # Create a second x-axis for examples seen
    ax2 = ax1.twiny()  # Create a second x-axis that shares the same y-axis
    ax2.plot(examples_seen, train_values, alpha=0)  # Invisible plot for aligning ticks
    ax2.set_xlabel("Examples seen")

    fig.tight_layout()  # Adjust layout to make room
    plt.savefig(f"{label}-plot.pdf")
    plt.show()


epochs_tensor = torch.linspace(0, num_epochs, len(train_losses))
examples_seen_tensor = torch.linspace(0, examples_seen, len(train_losses))

plot_values(epochs_tensor, examples_seen_tensor, train_losses, val_losses)

根据图 6.16 中明显的急剧下降趋势，我们可以看出模型正在很好地从训练数据中学习，并且几乎没有过拟合的迹象；也就是说，训练集和验证集损失之间没有明显的差距。

Note
早些时候，当我们开始训练时，我们将训练周期的数量设定为五个。训练周期的数量取决于数据集和任务的难度，并没有通用的解决方案或推荐，尽管五个周期通常是一个不错的起点。如果模型在前几个周期后出现过拟合，如损失图所示（见图6.16 ），您可能需要减少周期的数量。相反，如果趋势线表明验证损失在进一步训练中可能改善，则应增加训练周期的数量。在这个具体案例中，五个周期是一个合理的数字，因为没有早期过拟合的迹象，且验证损失接近0。

epochs_tensor = torch.linspace(0, num_epochs, len(train_accs))
examples_seen_tensor = torch.linspace(0, examples_seen, len(train_accs))

plot_values(epochs_tensor, examples_seen_tensor, train_accs, val_accs, label="accuracy")

图 6.17 训练准确率（实线）和验证准确率（虚线）在早期轮次中显著提高，然后趋于平稳，几乎达到完美的准确率分数 1.0。

在使用 train_classifier_simple 函数时，这意味着我们的训练和验证性能的估计仅基于五个批次，以提高训练的效率。

现在我们必须通过运行以下代码来计算整个数据集的训练、验证和测试集的性能指标，这次不定义 eval_iter 的值：

train_accuracy = calc_accuracy_loader(train_loader, model, device)
val_accuracy = calc_accuracy_loader(val_loader, model, device)
test_accuracy = calc_accuracy_loader(test_loader, model, device)

print(f"Training accuracy: {train_accuracy*100:.2f}%")
print(f"Validation accuracy: {val_accuracy*100:.2f}%")
print(f"Test accuracy: {test_accuracy*100:.2f}%")

## outptu
Training accuracy: 97.21%
Validation accuracy: 97.32%
Test accuracy: 95.67%

训练集和测试集的表现几乎完全相同。训练集和测试集准确率之间的微小差异表明对训练数据的过拟合程度很小。通常，验证集的准确率要高于测试集的准确率，因为模型开发往往涉及调整超参数以在验证集上表现良好，这可能无法有效地推广到测试集。这种情况很常见，但可以通过调整模型的设置，如增加 dropout 率 (drop_rate) 或优化器配置中的 weight_decay 参数，来尽量缩小这个差距。

Using the LLM as a spam classifier

经过微调和评估模型后，我们现在准备分类垃圾消息（见图6.18）。让我们使用我们微调的基于GPT的垃圾分类模型。

以下 classify_review 函数遵循与我们之前在SpamDataset中使用的类似的数据预处理步骤。然后，在将文本处理为令牌ID后，该函数使用模型预测一个整数类别标签，然后返回相应的类别名称。

def classify_review(text, model, tokenizer, device, max_length=None, pad_token_id=50256):
    model.eval()

    # Prepare inputs to the model
    input_ids = tokenizer.encode(text)
    supported_context_length = model.pos_emb.weight.shape[0]
    # Note: In the book, this was originally written as pos_emb.weight.shape[1] by mistake
    # It didn't break the code but would have caused unnecessary truncation (to 768 instead of 1024)

    # Truncate sequences if they too long
    input_ids = input_ids[:min(max_length, supported_context_length)]

    # Pad sequences to the longest sequence
    input_ids += [pad_token_id] * (max_length - len(input_ids))
    input_tensor = torch.tensor(input_ids, device=device).unsqueeze(0) # add batch dimension

    # Model inference
    with torch.no_grad():
        logits = model(input_tensor)[:, -1, :]  # Logits of the last output token
    predicted_label = torch.argmax(logits, dim=-1).item()

    # Return the classified result
    return "spam" if predicted_label == 1 else "not spam"

让我们在一个示例文本上尝试这个 classify_review 函数：


text_1 = (
    "You are a winner you have been specially"
    " selected to receive $1000 cash or a $2000 award."
)

print(classify_review(
    text_1, model, tokenizer, device, max_length=train_dataset.max_length
))

## output
spam

text_2 = (
    "Hey, just wanted to check if we're still on"
    " for dinner tonight? Let me know!"
)

print(classify_review(
    text_2, model, tokenizer, device, max_length=train_dataset.max_length
))

## output
not spam

最后，我们保存模型，以便将来如果想要重新使用模型时，无需再次训练它。我们可以使用torch.save方法.保存后，也可以加载模型

torch.save(model.state_dict(), "review_classifier.pth")

model_state_dict = torch.load("review_classifier.pth", map_location=device, weights_only=True)
model.load_state_dict(model_state_dict)

Summary

对LLM进行fine-tuning有不同的策略，包括classification fine-tuning和instruction fine-tuning。
Classification fine-tuning涉及通过一个小型分类层替换LLM的输出层。
在将文本消息分类为"垃圾邮件"或"非垃圾邮件"的情况下，新的分类层仅包含两个输出节点。此前，我们使用的输出节点数量等于词汇表中唯一token的数量（即50,256个）。
与预训练时预测文本中的下一个token不同，classification fine-tuning训练模型输出正确的类别标签——例如"垃圾邮件"或"非垃圾邮件"。
Fine-tuning的模型输入是转换为token ID的文本，这与预训练类似。
在对LLM进行fine-tuning之前，我们需要先加载预训练好的基础模型。
评估分类模型涉及计算分类准确率（正确预测的比例或百分比）。
Fine-tuning分类模型使用与预训练LLM时相同的交叉熵损失函数。

Fine-tuning the model on supervised data

# Overall the same as `train_model_simple`
def train_classifier_simple(model, train_loader, val_loader, optimizer, device, num_epochs,
                            eval_freq, eval_iter):
    # Initialize lists to track losses and examples seen
    train_losses, val_losses, train_accs, val_accs = [], [], [], []
    examples_seen, global_step = 0, -1

    # Main training loop
    for epoch in range(num_epochs):
        model.train()  # Set model to training mode

        for input_batch, target_batch in train_loader:
            optimizer.zero_grad() # Reset loss gradients from previous batch iteration
            loss = calc_loss_batch(input_batch, target_batch, model, device)
            loss.backward() # Calculate loss gradients
            optimizer.step() # Update model weights using loss gradients
            examples_seen += input_batch.shape[0] # New: track examples instead of tokens
            global_step += 1

            # Optional evaluation step
            if global_step % eval_freq == 0:
                train_loss, val_loss = evaluate_model(
                    model, train_loader, val_loader, device, eval_iter)
                train_losses.append(train_loss)
                val_losses.append(val_loss)
                print(f"Ep {epoch+1} (Step {global_step:06d}): "
                      f"Train loss {train_loss:.3f}, Val loss {val_loss:.3f}")

        # Calculate accuracy after each epoch
        train_accuracy = calc_accuracy_loader(train_loader, model, device, num_batches=eval_iter)
        val_accuracy = calc_accuracy_loader(val_loader, model, device, num_batches=eval_iter)
        print(f"Training accuracy: {train_accuracy*100:.2f}% | ", end="")
        print(f"Validation accuracy: {val_accuracy*100:.2f}%")
        train_accs.append(train_accuracy)
        val_accs.append(val_accuracy)

    return train_losses, val_losses, train_accs, val_accs, examples_seen

def evaluate_model(model, train_loader, val_loader, device, eval_iter):
    model.eval()
    with torch.no_grad():
        train_loss = calc_loss_loader(train_loader, model, device, num_batches=eval_iter)
        val_loss = calc_loss_loader(val_loader, model, device, num_batches=eval_iter)
    model.train()
    return train_loss, val_loss

import time

start_time = time.time() 
torch.manual_seed(123) 
optimizer = torch.optim.AdamW(model.parameters(), lr=5e-5,weight_decay=0.1) 

num_epochs = 5

train_losses, val_losses, train_accs, val_accs, examples_seen = \
    train_classifier_simple( 
        model, train_loader, val_loader, optimizer, device,
        num_epochs=num_epochs, eval_freq=50,eval_iter=5)

end_time = time.time() 
execution_time_minutes = (end_time - start_time) / 60 
print(f"Training completed in {execution_time_minutes:.2f} minutes.")

## output

我们然后使用 Matplotlib 绘制训练集和验证集的损失函数。

import matplotlib.pyplot as plt

def plot_values(epochs_seen, examples_seen, train_values, val_values, label="loss"):
    fig, ax1 = plt.subplots(figsize=(5, 3))

    # Plot training and validation loss against epochs
    ax1.plot(epochs_seen, train_values, label=f"Training {label}")
    ax1.plot(epochs_seen, val_values, linestyle="-.", label=f"Validation {label}")
    ax1.set_xlabel("Epochs")
    ax1.set_ylabel(label.capitalize())
    ax1.legend()

    # Create a second x-axis for examples seen
    ax2 = ax1.twiny()  # Create a second x-axis that shares the same y-axis
    ax2.plot(examples_seen, train_values, alpha=0)  # Invisible plot for aligning ticks
    ax2.set_xlabel("Examples seen")

    fig.tight_layout()  # Adjust layout to make room
    plt.savefig(f"{label}-plot.pdf")
    plt.show()


epochs_tensor = torch.linspace(0, num_epochs, len(train_losses))
examples_seen_tensor = torch.linspace(0, examples_seen, len(train_losses))

plot_values(epochs_tensor, examples_seen_tensor, train_losses, val_losses)

Note
早些时候，当我们开始训练时，我们将训练周期的数量设定为五个。训练周期的数量取决于数据集和任务的难度，并没有通用的解决方案或推荐，尽管五个周期通常是一个不错的起点。如果模型在前几个周期后出现过拟合，如损失图所示（见图6.16 ），您可能需要减少周期的数量。相反，如果趋势线表明验证损失在进一步训练中可能改善，则应增加训练周期的数量。在这个具体案例中，五个周期是一个合理的数字，因为没有早期过拟合的迹象，且验证损失接近0。

epochs_tensor = torch.linspace(0, num_epochs, len(train_accs))
examples_seen_tensor = torch.linspace(0, examples_seen, len(train_accs))

plot_values(epochs_tensor, examples_seen_tensor, train_accs, val_accs, label="accuracy")

在使用 train_classifier_simple 函数时，这意味着我们的训练和验证性能的估计仅基于五个批次，以提高训练的效率。

现在我们必须通过运行以下代码来计算整个数据集的训练、验证和测试集的性能指标，这次不定义 eval_iter 的值：

train_accuracy = calc_accuracy_loader(train_loader, model, device)
val_accuracy = calc_accuracy_loader(val_loader, model, device)
test_accuracy = calc_accuracy_loader(test_loader, model, device)

print(f"Training accuracy: {train_accuracy*100:.2f}%")
print(f"Validation accuracy: {val_accuracy*100:.2f}%")
print(f"Test accuracy: {test_accuracy*100:.2f}%")

## outptu
Training accuracy: 97.21%
Validation accuracy: 97.32%
Test accuracy: 95.67%

Using the LLM as a spam classifier

经过微调和评估模型后，我们现在准备分类垃圾消息（见图6.18）。让我们使用我们微调的基于GPT的垃圾分类模型。

def classify_review(text, model, tokenizer, device, max_length=None, pad_token_id=50256):
    model.eval()

    # Prepare inputs to the model
    input_ids = tokenizer.encode(text)
    supported_context_length = model.pos_emb.weight.shape[0]
    # Note: In the book, this was originally written as pos_emb.weight.shape[1] by mistake
    # It didn't break the code but would have caused unnecessary truncation (to 768 instead of 1024)

    # Truncate sequences if they too long
    input_ids = input_ids[:min(max_length, supported_context_length)]

    # Pad sequences to the longest sequence
    input_ids += [pad_token_id] * (max_length - len(input_ids))
    input_tensor = torch.tensor(input_ids, device=device).unsqueeze(0) # add batch dimension

    # Model inference
    with torch.no_grad():
        logits = model(input_tensor)[:, -1, :]  # Logits of the last output token
    predicted_label = torch.argmax(logits, dim=-1).item()

    # Return the classified result
    return "spam" if predicted_label == 1 else "not spam"

让我们在一个示例文本上尝试这个 classify_review 函数：


text_1 = (
    "You are a winner you have been specially"
    " selected to receive $1000 cash or a $2000 award."
)

print(classify_review(
    text_1, model, tokenizer, device, max_length=train_dataset.max_length
))

## output
spam

text_2 = (
    "Hey, just wanted to check if we're still on"
    " for dinner tonight? Let me know!"
)

print(classify_review(
    text_2, model, tokenizer, device, max_length=train_dataset.max_length
))

## output
not spam

最后，我们保存模型，以便将来如果想要重新使用模型时，无需再次训练它。我们可以使用torch.save方法.保存后，也可以加载模型

torch.save(model.state_dict(), "review_classifier.pth")

model_state_dict = torch.load("review_classifier.pth", map_location=device, weights_only=True)
model.load_state_dict(model_state_dict)

Summary

对LLM进行fine-tuning有不同的策略，包括classification fine-tuning和instruction fine-tuning。
Classification fine-tuning涉及通过一个小型分类层替换LLM的输出层。
在将文本消息分类为"垃圾邮件"或"非垃圾邮件"的情况下，新的分类层仅包含两个输出节点。此前，我们使用的输出节点数量等于词汇表中唯一token的数量（即50,256个）。
与预训练时预测文本中的下一个token不同，classification fine-tuning训练模型输出正确的类别标签——例如"垃圾邮件"或"非垃圾邮件"。
Fine-tuning的模型输入是转换为token ID的文本，这与预训练类似。
在对LLM进行fine-tuning之前，我们需要先加载预训练好的基础模型。
评估分类模型涉及计算分类准确率（正确预测的比例或百分比）。
Fine-tuning分类模型使用与预训练LLM时相同的交叉熵损失函数。

Fine-tuning for classification 3. Fine-tuning Model

阅读此文章之前，你可能需要首先阅读以下的文章才能更好的理解上下文。

Fine-tuning the model on supervised data

Using the LLM as a spam classifier

Summary

Fine-tuning for classification 3. Fine-tuning Model

阅读此文章之前，你可能需要首先阅读以下的文章才能更好的理解上下文。

Fine-tuning the model on supervised data

Using the LLM as a spam classifier

Summary