DeepSeek V3自称是ChatGPT，或因为AI训练数据污染问题？正观新闻

DeepSeek V3自称是ChatGPT，或因为AI训练数据污染问题？

2024-12-30 18:04

近日，AI公司DeepSeek发布的最新模型DeepSeek V3在测试中出现异常：它自称是OpenAI的ChatGPT，并能提供OpenAI的API使用说明。加之DeepSeek V3训练只花了557.6万美元的成本，便有人就怀疑DeepSeek V3是在ChatGPT的输出基础上训练的。

同时，OpenAI董事长Altman也发了一个状态，似乎在暗讽着什么……

不过，从目前整体讨论的观点来看，说DeepSeek V3是在ChatGPT输出上训练的可能性不大，因为ChatGPT的影子无处不在，导致AI公司们获取的数据中混入了大量ChatGPT生成的内容，使模型“身份混淆”。

随着AI生成内容在网络上激增，训练数据污染问题日益严重。对此，DeepSeek表示正在优化数据清洗流程，以提升模型的独立性和准确性。

截至目前，DeepSeek V3还没有解决这个“身份混淆”bug。

然而，DeepSeek V3也不是第一个自我识别错误的模型。谷歌的Gemini和其他模型有时会声称自己是其竞争对手的模型。例如，在普通话提示下，Gemini曾说自己是百度的文心一言。

作者：杨启隆

编辑：钟响

特别声明

本文为正观号作者或机构在正观新闻上传并发布，仅代表该作者或机构观点，不代表正观新闻的观点和立场，正观新闻仅提供信息发布平台。