冒充人类作者,ChatGPT等滥用引担忧,一文综述AI生成文本检测方法( 二 )


对于黑盒检测,因为用户可以微调他们的模型,改变模型输出的风格或者格式,从而导致黑盒检测无法找到通用的检测特征 。
白盒检测可能是一个解决办法,公司在开源模型之前可以给模型中加入一个水印 。但是用户同样可以通过微调模型,改变模型 token 的采样机制来移除水印 。现在还没有一种水印技术能够抵御用户的这些潜在攻击 。