DeepSeek V3自称是ChatGPT,或因为AI训练数据污染问题?
近日,AI公司DeepSeek发布的最新模型DeepSeek V3在测试中出现异常:它自称是OpenAI的ChatGPT,并能提供OpenAI的API使用说明。加之DeepSeek V3训练只花了557.6万美元的成本,便有人就怀疑DeepSeek V3是在ChatGPT的输出基础上训练的。
同时,OpenAI董事长Altman也发了一个状态,似乎在暗讽着什么……
不过,从目前整体讨论的观点来看,说DeepSeek V3是在ChatGPT输出上训练的可能性不大,因为ChatGPT的影子无处不在,导致AI公司们获取的数据中混入了大量ChatGPT生成的内容,使模型“身份混淆”。
随着AI生成内容在网络上激增,训练数据污染问题日益严重。对此,DeepSeek表示正在优化数据清洗流程,以提升模型的独立性和准确性。
截至目前,DeepSeek V3还没有解决这个“身份混淆”bug。
然而,DeepSeek V3也不是第一个自我识别错误的模型。谷歌的Gemini和其他模型有时会声称自己是其竞争对手的模型。例如,在普通话提示下,Gemini曾说自己是百度的文心一言。
作者:杨启隆
编辑:钟响
特别声明
本文为正观号作者或机构在正观新闻上传并发布,仅代表该作者或机构观点,不代表正观新闻的观点和立场,正观新闻仅提供信息发布平台。
最新评论

打开APP查看更多精彩评论