探索文本风格迁移的无监督奥秘：超越规则与平行语料的界限

发表于2025-07-24|更新于2025-07-26|计算机科学

|浏览量:

你好，各位技术与数学爱好者！我是 qmwneb946，很高兴再次与大家一同踏上技术探索之旅。今天，我们要深入探讨一个既迷人又极具挑战性的自然语言处理（NLP）前沿领域——文本风格迁移的无监督方法。想象一下，你写了一段话，希望它听起来更礼貌、更幽默、或者更像某个特定作家的风格，而且无需人工标注大量的“原版-目标风格”对照文本。这听起来是不是很像科幻小说？但随着深度学习的飞速发展，这正逐渐变为现实。

引言：文本风格的魔法与挑战

在自然语言中，“内容”和“风格”是两个既紧密相连又相对独立的维度。内容指的是文本所传达的语义信息，即“说了什么”；而风格则关乎“如何说”——它涵盖了用词、句式、语气、情感倾向，甚至作者的个性等方方面面。文本风格迁移（Text Style Transfer）的目标，就是在保持文本核心内容不变的前提下，将其表达风格从源风格（Source Style）转换为目标风格（Target Style）。

这项技术在诸多领域拥有巨大潜力：

个性化写作助手：帮助用户将正式邮件转换为轻松语气，或将随意聊天转换为专业报告。
情感调节：将负面评论转换为中性或积极表述，促进线上交流和谐。
文学创作：模拟特定作家的文风，或将现有作品转化为不同体裁。
内容审查与修订：自动调整内容以符合特定平台的风格指南。
提升表达多样性：避免重复的句式和词汇，使表达更生动。

然而，文本风格迁移绝非易事。最大的挑战在于风格与内容的解耦（Disentanglement）。我们如何确保模型在改变风格的同时，不会意外地修改或丢失原始语义？此外，另一个核心瓶颈是数据稀缺性。传统的监督学习方法需要大量的“平行语料”，即同一内容在不同风格下的对应文本对。例如，一句“这饭真难吃”的礼貌版本可能是“这道菜的味道可能不太符合我的口味”。构建这样的数据集耗时耗力，在很多场景下几乎不可能实现。这正是无监督方法大显身手的地方。无监督方法旨在利用非平行语料，甚至仅仅是目标风格的文本集合，来实现风格迁移，从而极大地拓展了这项技术的应用边界。

接下来，我们将深入探索无监督文本风格迁移的核心思想、主流方法及其所面临的挑战与未来的发展方向。

核心概念：内容与风格的解耦艺术

在深入探讨具体方法之前，我们首先需要理解“无监督”在这个语境下的具体含义，以及它所面临的核心问题。

什么是无监督文本风格迁移？

顾名思义，无监督文本风格迁移是指在没有平行语料（即没有内容相同但风格不同的文本对）的情况下进行风格迁移。模型通常只能访问到大量不同风格的文本数据，但无法直接从“输入-输出”对中学习转换规则。这要求模型具备更强的自主学习和推断能力。

风格与内容的解耦难题

无监督风格迁移的核心挑战是内容-风格解耦（Content-Style Disentanglement）。我们希望模型能够学习到一个内容表示（Content Representation），它只编码文本的语义信息，而不包含风格信息；同时学习到风格表示（Style Representation），它只编码文本的风格属性。在迁移时，我们可以保持内容表示不变，用目标风格的表示替换源风格的表示，然后通过解码器生成目标风格的文本。

数学上，我们可以将一个文本 $x$ 看作是其内容 $c$ 和风格 $s$ 的组合，即 $x = f(c, s)$ 。我们的目标是找到一个转换函数 $T(x, s_{target})$ ，使得 $T(f(c, s_{source}), s_{target}) = f(c, s_{target})$ 。关键在于如何从 $x$ 中有效地提取出 $c$ 和 $s$ ，并在没有直接监督信号的情况下实现 $s_{source} \rightarrow s_{target}$ 的转换。

无监督方法的主流范式

为了解决内容-风格解耦和数据稀缺的问题，研究者们提出了多种巧妙的无监督方法。我们将重点介绍以下几类：

基于生成对抗网络（GANs）的方法

生成对抗网络（Generative Adversarial Networks, GANs）是无监督学习的强大工具，其核心思想是通过**生成器（Generator）和判别器（Discriminator）**之间的对抗博弈来学习数据分布。在文本风格迁移中，GANs被用来训练生成器生成符合目标风格的文本。

基本思想

将目标风格的文本视为“真实”数据，生成器则试图生成“假”但足够逼真的目标风格文本。判别器则努力区分真实文本和生成文本。当判别器无法区分时，意味着生成器已经成功捕捉到了目标风格的特征。

循环一致性 GAN (CycleGAN) 的启发

受图像风格迁移中 CycleGAN 的启发，许多文本风格迁移模型引入了**循环一致性损失（Cycle Consistency Loss）**来解决内容保存问题。CycleGAN 的核心思想是：将源风格文本 $x_A$ 转换为目标风格文本 $x_{AB}$ ，然后再将 $x_{AB}$ 转换回源风格文本 $x_{ABA}$ ，期望 $x_{ABA}$ 与 $x_A$ 尽可能相似。这强制模型在转换过程中保留核心内容。

具体来说，一个 CycleGAN 风格迁移模型通常包含：

两个生成器： $G_{A \to B}$ 将源风格 A 转换为目标风格 B，和 $G_{B \to A}$ 将目标风格 B 转换为源风格 A。
两个判别器： $D_B$ 判别文本是否为风格 B 的真实文本，和 $D_A$ 判别文本是否为风格 A 的真实文本。

损失函数通常包括：

对抗损失（Adversarial Loss）：使得生成器能生成目标风格的文本，并使判别器难以区分真伪。
$\mathcal{L}_{GAN}(G, D, X, Y) = E_{y \sim P_{data}(y)}[\log D(y)] + E_{x \sim P_{data}(x)}[\log (1 - D(G(x)))]$
其中 $X$ 是源风格文本集， $Y$ 是目标风格文本集。
循环一致性损失（Cycle Consistency Loss）：确保内容在往返转换中得以保留。
$\mathcal{L}_{cyc}(G_{A \to B}, G_{B \to A}) = E_{x_A \sim P_{data}(x_A)}[\|G_{B \to A}(G_{A \to B}(x_A)) - x_A\|_1] + E_{x_B \sim P_{data}(x_B)}[\|G_{A \to B}(G_{B \to A}(x_B)) - x_B\|_1]$
这里使用了 L1 范数，但在文本领域，通常会使用基于词嵌入或语义相似度的度量，或者直接作用于离散词序列的损失，例如负对数似然或基于编辑距离的惩罚。
内容损失（Content Loss）/语义保留损失：显式地鼓励内容保持。这可能通过预训练的语言模型（如 BERT）提取的句子嵌入相似度来衡量。
$\mathcal{L}_{content}(x, x') = \| \text{Encoder}(x) - \text{Encoder}(x') \|_2$

挑战

GANs 在文本生成方面面临独特的挑战：

离散输出问题：文本是离散的词序列，而 GANs 的生成器通常需要可微分的连续输出，这导致梯度难以直接回传。常用的解决方案是使用 Gumbel-Softmax 或强化学习（REINFORCE）。
训练不稳定：GANs 训练本身就以不稳定著称，在离散文本领域尤甚，容易出现模式崩溃（Mode Collapse），即生成器只生成少数几种样本。
内容控制不足：尽管有循环一致性损失，但仍难以完全保证内容在风格转换后的精确语义不变。

# 概念性伪代码：基于GAN的文本风格迁移训练循环
# (实际实现会涉及复杂的架构如seq2seq, Transformer, 以及梯度处理)

# 假设 G_AB, G_BA 是生成器 (e.g., Transformer-based)
# 假设 D_A, D_B 是判别器 (e.g., CNN-based 或 LSTM-based)
# 假设 text_A 是源风格文本数据集, text_B 是目标风格文本数据集

for epoch in range(num_epochs):
    for batch_A, batch_B in zip(text_A_loader, text_B_loader):
        # 1. 训练判别器 D_B (使其能区分真实B和生成的B)
        D_B.zero_grad()
        real_B_logits = D_B(batch_B)
        fake_B = G_AB(batch_A) # 将A转换为B
        fake_B_logits = D_B(fake_B.detach()) # .detach() 阻止梯度回传到G_AB

        d_b_loss_real = adversarial_loss(real_B_logits, is_real=True)
        d_b_loss_fake = adversarial_loss(fake_B_logits, is_real=False)
        d_b_loss = (d_b_loss_real + d_b_loss_fake) / 2
        d_b_loss.backward()
        optimizer_D_B.step()

        # 2. 训练判别器 D_A (使其能区分真实A和生成的A) - 类似 D_B

        # 3. 训练生成器 G_AB 和 G_BA
        G_AB.zero_grad()
        G_BA.zero_grad()

        # 对抗损失: G_AB 欺骗 D_B
        fake_B_for_G = G_AB(batch_A)
        g_ab_adv_loss = adversarial_loss(D_B(fake_B_for_G), is_real=True)

        # 循环一致性损失: A -> B -> A' 尽可能接近 A
        reconstructed_A = G_BA(fake_B_for_G)
        cycle_loss_A = l1_loss(reconstructed_A, batch_A) # 在文本中可能需要更复杂的语义相似度损失

        # 身份映射损失 (可选): B -> B' 尽可能接近 B (有助于保留内容)
        # identity_B = G_AB(batch_B)
        # identity_loss_B = l1_loss(identity_B, batch_B)

        # 对抗损失: G_BA 欺骗 D_A (类似G_AB)
        fake_A_for_G = G_BA(batch_B)
        g_ba_adv_loss = adversarial_loss(D_A(fake_A_for_G), is_real=True)

        # 循环一致性损失: B -> A -> B' 尽可能接近 B
        reconstructed_B = G_AB(fake_A_for_G)
        cycle_loss_B = l1_loss(reconstructed_B, batch_B)

        total_g_loss = g_ab_adv_loss + g_ba_adv_loss + \
                       lambda_cycle * (cycle_loss_A + cycle_loss_B) # + lambda_identity * (identity_loss_A + identity_loss_B)
        total_g_loss.backward()
        optimizer_G.step()

# 注意: 真实的文本GANs会使用Gumbel-Softmax, REINFORCE等技术处理离散性。
# 'adversarial_loss' 通常是二元交叉熵损失。
# 'l1_loss' 在文本中通常指编码空间距离或语义相似度。

基于自编码器（Autoencoder）/变分自编码器（VAE）的方法

自编码器（Autoencoders, AEs）和变分自编码器（Variational Autoencoders, VAEs）旨在学习数据的高效低维表示。在风格迁移中，它们被用于将文本编码到一个潜在空间（Latent Space），并尝试在这个潜在空间中解耦内容和风格。

基本思想

一个典型的解耦 VAE 模型包含：

编码器（Encoder）：将输入文本 $x$ 映射到一个潜在空间，生成内容表示 $z_c$ 和风格表示 $z_s$ 。
解码器（Decoder）：从 $z_c$ 和 $z_s$ （或者目标风格的 $z_s'$ ) 重构文本。

为了实现内容和风格的解耦，通常会引入额外的机制：

对抗性学习（Adversarial Learning）：在潜在空间中，训练一个判别器来预测 $z_c$ 所对应的文本风格。编码器则被训练以迷惑这个判别器，使得 $z_c$ 无法泄露任何风格信息。这强制 $z_c$ 成为一个纯粹的内容表示。同时，可以有一个风格分类器直接作用于 $z_s$ 来确保其能捕捉到风格信息。
特定损失函数：
- 重构损失（Reconstruction Loss）：确保解码器能从潜在表示中准确重构原始文本，通常是词级别的交叉熵损失。
  $\mathcal{L}_{rec} = - \sum_{i=1}^N \log P(x_i | z_c, z_s)$
- KL 散度损失（KL Divergence Loss）：VAEs 特有，强制潜在变量 $z_c$ 和 $z_s$ （如果也是变分的话）的分布接近标准正态分布，有助于潜在空间的平滑和可采样性。
  $\mathcal{L}_{KL} = D_{KL}(Q(z_c|x) || P(z_c)) + D_{KL}(Q(z_s|x) || P(z_s))$
- 风格分类损失（Style Classification Loss）：对由编码器生成的 $z_s$ 或直接对生成文本的风格进行分类，确保其能捕捉到风格特征。
  $\mathcal{L}_{style\_cls} = \text{CrossEntropy}(S(G(z_c, z_{s\_target})), \text{target\_style})$
  其中 $S$ 是一个风格分类器。
- 内容保留损失：可以通过在编码内容 $z_c$ 上应用一个风格分类器，并对其进行惩罚来鼓励其不包含风格信息。

具体实现：解耦VAE

在解耦VAE中，通常会有两个独立的编码器（或一个编码器但将输出分离）：一个编码器负责内容 $E_c(x) \to z_c$ ，另一个编码器负责风格 $E_s(x) \to z_s$ 。解码器 $D(z_c, z_s)$ 负责生成文本。

为了确保 $z_c$ 是风格无关的，可以训练一个风格判别器 $D_{style}$ 来预测 $z_c$ 的风格。 $E_c$ 的训练目标是让 $D_{style}$ 无法正确预测其风格，这通常通过梯度反转层（Gradient Reversal Layer）实现，使得 $E_c$ 的梯度方向与 $D_{style}$ 的梯度方向相反。

在推理时，给定源文本 $x_{src}$ ，我们提取其内容表示 $z_c = E_c(x_{src})$ 。为了获得目标风格的文本，我们从目标风格的文本中采样一个风格表示 $z_{s\_target}$ ，或者直接使用预定义的风格向量，然后将其与 $z_c$ 一同送入解码器 $D(z_c, z_{s\_target})$ 来生成新文本。

# 概念性伪代码：基于VAE的文本风格迁移训练循环
# (更简化，着重于解耦逻辑)

# 假设 Encoder_Content, Encoder_Style 是内容和风格编码器
# 假设 Decoder 是文本解码器
# 假设 Style_Discriminator 是风格判别器 (对内容编码进行判别)
# 假设 text_data 包含带有风格标签 (但无平行语料) 的文本

for epoch in range(num_epochs):
    for text, style_label in text_data_loader:
        # 1. 前向传播
        z_content_mu, z_content_logvar = Encoder_Content(text)
        z_style_mu, z_style_logvar = Encoder_Style(text)

        # 重参数化技巧采样 z_c, z_s
        z_c = reparameterize(z_content_mu, z_content_logvar)
        z_s = reparameterize(z_style_mu, z_style_logvar)

        # 重构文本
        reconstructed_text = Decoder(z_c, z_s)

        # 风格迁移文本 (假设我们有一个目标风格的采样 z_s_target)
        # 例如，可以从目标风格的文本中编码得到 z_s_target，或者是一个固定向量
        # transferred_text = Decoder(z_c, z_s_target)

        # 2. 计算损失
        # 重构损失 (衡量原始文本与重构文本的相似度)
        rec_loss = cross_entropy_loss(reconstructed_text, text)

        # VAE KL 散度损失 (正则化潜在空间)
        kl_content_loss = kl_divergence(z_content_mu, z_content_logvar)
        kl_style_loss = kl_divergence(z_style_mu, z_style_logvar)

        # 风格对抗损失 (训练 Encoder_Content 使得 z_c 不含风格信息)
        # Style_Discriminator 尝试从 z_c 预测 style_label
        # Encoder_Content 尝试欺骗 Style_Discriminator (通过梯度反转或类似机制)
        predicted_style_from_zc = Style_Discriminator(z_c)
        # style_adv_loss = adversarial_loss(predicted_style_from_zc, style_label_for_adversary)
        # 通常这里会有一个GRL来反转梯度，使Encoder_Content最小化判别器的准确率

        # 风格分类损失 (训练 Encoder_Style 使得 z_s 包含风格信息)
        predicted_style_from_zs = Style_Classifier_on_Zs(z_s) # 这里的Style_Classifier_on_Zs是针对z_s的分类器
        style_cls_loss = cross_entropy_loss(predicted_style_from_zs, style_label)

        # 3. 优化
        # total_loss = rec_loss + kl_content_loss + kl_style_loss + style_adv_loss + style_cls_loss
        # total_loss.backward()
        # optimizer.step()

# 注意:
# reparameterize 函数用于从mu和logvar采样，以便反向传播。
# style_label_for_adversary 在对抗训练中通常是随机标签或所有标签混合，以使判别器困惑。
# 实际实现中，Style_Discriminator 和 Encoder_Content 的优化会交替进行。

挑战

真正的解耦：虽然引入了对抗性损失，但要完全解耦内容和风格仍是一个艰巨的任务。潜变量之间可能会存在信息泄漏。
潜在空间的语义：潜在空间的质量直接影响生成文本的流畅度和多样性。
采样的挑战：如何有效地从目标风格的潜在空间中采样出合适的风格向量以生成高质量文本。

基于回译（Back-translation）/枢轴（Pivot）的方法

这种方法借鉴了机器翻译中的思想，通过“翻译”到某个中间表示或“风格无关”表示，再“翻译”回来。

基本思想

翻译到风格无关表示：将源风格文本“翻译”成一个去除了所有风格信息，只保留内容的核心表示。这通常通过一个预训练的通用语言模型或专门训练的去风格化编码器完成。
翻译到目标风格：然后，将这个风格无关的内容表示“翻译”成目标风格的文本。

或者，另一种思路是：

翻译到目标风格：直接将源风格文本 $x_A$ 翻译为目标风格 $x_B = G_{A \to B}(x_A)$ 。
回译并强制一致：再将 $x_B$ 回译回源风格 $x_A' = G_{B \to A}(x_B)$ 。通过强制 $x_A'$ 与原始 $x_A$ 尽可能相似，来保持内容的一致性。这与 CycleGAN 的循环一致性思想异曲同工，但可以更灵活地应用于非GAN框架，例如基于 Transformer 的 Seq2Seq 模型。

实现细节

使用预训练语言模型：可以直接利用大型预训练语言模型（如 T5, BART）的强大生成能力。可以微调模型以执行“去风格化”操作（例如，通过提示词引导模型生成一个风格中立的版本），然后再次微调或提示生成目标风格文本。
双重监督学习（Dual-Supervised Learning）：通常涉及两个或多个互为逆操作的生成器，它们在无平行数据的情况下互相提供监督信号。例如，一个生成器将文本从风格 A 转换为 B，另一个将文本从 B 转换为 A。损失函数包括：
- 对抗损失：确保生成的文本符合目标风格。
- 回译内容损失：确保回译后的文本与原始文本内容相似。这可以通过 BLEU 分数、ROUGE 分数或语义嵌入相似度来衡量。
- 风格分类损失：确保生成的文本确实具有目标风格。

挑战

风格无关表示的定义：如何精确地得到一个“风格无关”或“内容核心”的表示是关键。它既要保留所有语义，又不能带有任何风格偏向。
回译的质量：如果回译过程本身就存在内容丢失或风格混淆，那么整个框架的效果会大打折扣。
语言模型的偏差：预训练语言模型可能本身就存在某些风格偏好。

基于强化学习（Reinforcement Learning, RL）的方法

强化学习将文本风格迁移建模为一个序列决策问题。

基本思想

一个**代理（Agent）通过对源文本进行一系列的词语修改操作（插入、删除、替换）来逐步转换其风格。每次修改后，代理会得到一个奖励（Reward）**信号，这个奖励信号由以下几部分构成：

风格奖励：通过一个预训练的风格分类器来评估当前文本与目标风格的匹配程度。
内容保留奖励：通过语义相似度度量（如 BERTScore）或回译损失来评估内容是否被改变。
流畅性奖励：通过语言模型（如 GPT-2）的困惑度来评估生成文本的流畅性和语法正确性。

代理的目标是学习一个策略（Policy），最大化长期累积奖励。常用的算法是基于策略梯度的 REINFORCE。

挑战

稀疏奖励：在文本生成这种高维离散空间中，奖励信号往往是稀疏的，代理难以有效探索。
探索-利用困境：如何在探索新的修改方式（探索）和利用已知有效修改方式（利用）之间取得平衡。
训练复杂性：RL 训练通常比监督学习更不稳定、更耗时。
内容保持的挑战：微小的词语改动可能导致语义的巨大偏移，RL 需要精细的奖励设计来避免这种情况。

基于大型语言模型（LLMs）的提示（Prompting）/情境学习（In-context Learning）

近年来，随着 GPT-3、ChatGPT、Llama 等大型语言模型的崛起，文本风格迁移进入了一个全新的范式：零样本（Zero-shot）或少样本（Few-shot）的提示学习。

基本思想

大型语言模型在海量文本数据上进行了预训练，这使得它们隐式地学习了各种语言风格的特征。通过精心设计的提示（Prompt），我们可以引导 LLM 在不进行任何模型参数微调的情况下，直接生成具有目标风格的文本。

例如，如果你想将一段文本变得更礼貌，可以这样提示：

请将以下文字转换为更礼貌的语气：
"这饭真难吃。"

修改后：

模型可能会返回：“这道菜的味道可能不太符合我的口味。”或者“感谢您的烹饪，但它似乎不太适合我的味蕾。”

情境学习（In-context Learning）

通过在提示中提供几个示例（少量样本），可以进一步提高风格迁移的效果。

将以下文字转换为更礼貌的语气：

示例1：
原句：快点把报告发给我。
修改后：请您尽快提交报告，谢谢。

示例2：
原句：这地方太吵了，没法工作。
修改后：这个环境有些嘈杂，可能不太适合专注工作。

请将以下文字转换为更礼貌的语气：
原句：你上次说的那个功能到底做了没？
修改后：

模型会根据前面给出的示例，学习到“礼貌语气”的具体特征，并应用到新的输入上。

优势

无需训练：最大的优势是无需大量平行语料，也无需进行模型训练或微调。这极大地降低了实现成本和复杂性。
泛化能力强：LLMs 对各种风格和任务的泛化能力非常强。
内容保持能力：LLMs 通常能较好地保持原文内容，因为它们在预训练时就学习了强大的语义理解能力。
可控性：通过调整提示词，可以相对灵活地控制风格转换的强度和方向。

挑战

“幻觉”现象：LLMs 可能会生成一些与原文内容不符的“幻觉”信息。
风格强度控制：难以精确控制风格转换的程度（例如，非常礼貌 vs 略微礼貌）。
计算成本：使用大型 LLMs 进行推理的成本较高。
偏差：LLMs 可能会继承训练数据中的偏见，导致风格转换结果不尽如人意。
隐私与安全：输入到 LLM 的数据可能涉及隐私问题。

尽管存在这些挑战，基于 LLM 的提示方法无疑是目前无监督文本风格迁移领域中最具前景和易用性的方向之一，尤其是在快速原型开发和广泛应用方面。

评估指标：衡量风格迁移的成功

评估文本风格迁移的质量是一个多维度的挑战，因为我们需要同时考虑以下三个方面：

流畅性（Fluency）/语法正确性（Grammaticality）：生成的文本是否自然、连贯，符合语法规则？
内容保留（Content Preservation）：生成的文本是否准确地保留了原始文本的核心语义信息？
风格强度（Style Strength）/风格转移准确性（Style Transfer Accuracy）：生成的文本是否成功地转换到了目标风格，并且风格强度足够明显？

评估通常结合自动化指标和人工评估：

自动化评估指标

流畅性：
- 困惑度（Perplexity）：使用一个预训练的语言模型（如 GPT-2, BERT）来计算生成文本的困惑度。困惑度越低，文本越流畅。
- BLEU / ROUGE：虽然主要用于机器翻译，但也可以在特定场景下（如回译任务）衡量生成文本与参考文本的相似度。
内容保留：
- BLEU / ROUGE：同样可用于衡量生成文本与原始文本的相似度，但可能无法捕捉深层语义。
- 语义相似度：
  - 词嵌入相似度：计算原文和生成文本的词向量平均值或 sentence embedding（如 Word2Vec, GloVe, FastText）的余弦相似度。
  - BERTScore：利用 BERT 模型的上下文嵌入来计算语义相似度，通常比传统指标更准确。它计算生成句子中每个 token 与参考句子中最佳 token 之间的相似度，并考虑上下文信息。
  - NLI (Natural Language Inference) Entailment Score：使用预训练的 NLI 模型判断生成文本是否蕴含或矛盾于原始文本。
风格强度/风格转移准确性：
- 风格分类器准确率：训练一个独立的文本分类器来识别目标风格。然后，将生成文本输入该分类器，计算其被正确分类为目标风格的比例。这个指标非常关键，但分类器本身的准确性会影响评估的可靠性。

人工评估

尽管自动化指标提供了量化的参考，但它们往往无法完全捕捉人类对文本质量的感知。因此，**人工评估（Human Evaluation）**是不可或缺的黄金标准。

招募一批标注员，让他们对生成文本进行评分，通常包括：
- 内容保留：1-5分，文本是否保留了原始内容。
- 风格转换：1-5分，文本是否成功转换到目标风格。
- 流畅性：1-5分，文本是否自然流畅，无语法错误。
还可以进行 A/B 测试或排名任务，让标注员比较不同模型生成的文本。

三者权衡：在实际应用中，往往需要在流畅性、内容保留和风格强度之间进行权衡。一个模型可能在风格转换上表现出色，但牺牲了内容或流畅性，反之亦然。