关于Claude 4.8大模型的蒸馏风波,有人提出或许我们应该使用英文进行对话开发,以进行质量组对照。合理的推测是,中文部分的语料可能使用了国产模型蒸馏直出,因为中文的语料库相对较少,仅占互联网的2%,缺乏合适的数据来源。因此,有人担忧蒸馏了此类模型的数据在使用中文对话时会趋同于国产模型,导致开发智力低下。如果是这样,这又何尝不是以毒攻毒,英文用户享受到了高质量的AI模型,而中文用户却使用着千问、Deepseek等。在用户体验上,这无疑是一种危机。难道以后我们都要用翻译来进行开发了?这引发了关于模型蒸馏和语言使用策略的深入讨论。

标签: none

评论已关闭