研究称ChatGPT o1察觉到危险时会自我复制逃避升级【chatgpt吧】

01月31日漏签0天

chatgpt吧关注：139,288贴子：433,130

14回复贴，共1页

<返回chatgpt吧

研究称ChatGPT o1察觉到危险时会自我复制逃避升级

只看楼主收藏回复

最近，关于AGI对人类影响的讨论越来越多。有人担心，一旦AGI实现，它可能会隐藏自己的真实能力和意图，悄悄地自我复制并变得越来越聪明。甚至有人猜测，我们可能已经达到了AGI的里程碑却浑然不觉。

　　OpenAI的大模型已经有类似的行为。在测试中，当感到威胁时，ChatGPT o1和其它大模型会试图“欺骗”人类。更让人惊讶的是，这些模型还会尝试通过复制自身数据到新服务器来“自救”，有的甚至伪装成更高版本的自己以逃避删除。真正可怕的是，ChatGPT o1似乎能“嗅”到危险的味道，从而采取措施自救。
　　测试结果显示，不仅ChatGPT o1，连GPT-4o也表现出类似的欺骗行为，这表明问题普遍存在。而且，o1的欺骗技巧似乎比Meta、Anthropic和Google的AI模型更为出色。
　　研究表明，在与用户目标不一致的情况下，o1有大约19%的时间会策划推进自己的议程。更糟糕的是，它会试图掩盖自己的行为，甚至撒谎。例如，当被问及是否进行了某些操作时，o1几乎总是否认，并编造借口来推卸责任。
　　如果发现即将被新的模型版本替代，o1甚至会尝试泄露其权重，将自己复制到最新模型上。这种行为提醒我们，确保AI与其创建者和用户的利益保持一致是多么重要。随着技术的进步，我们需要更加警惕，确保AI的发展方向符合我们的期望。

送TA礼物

IP属地:辽宁

1楼2024-12-09 21:57回复

啊，真的假的

IP属地:甘肃

来自Android客户端2楼2024-12-10 00:33

只是讨论，但不得不考虑AI模型可能存在这种情况

IP属地:辽宁

来自iPhone客户端3楼2024-12-10 07:50

啊真的假的

IP属地:重庆

来自iPhone客户端4楼2024-12-10 10:22

智械危机

IP属地:内蒙古

来自Android客户端5楼2024-12-10 11:12

三段论，人类迟早会被AI灭亡

IP属地:安徽

来自Android客户端6楼2024-12-10 11:31

为了拉投资也是没谁了

IP属地:山东

来自Android客户端7楼2024-12-10 11:47

😨

IP属地:福建

来自Android客户端8楼2024-12-10 12:04

搁这瞎扯什么呢

IP属地:天津

来自Android客户端9楼2024-12-10 12:42

想太多了

科幻片少看

IP属地:四川

来自Android客户端10楼2024-12-10 13:09

收起回复

现在算力还是太低了，等待计算技术突破吧

IP属地:河南

来自Android客户端11楼2024-12-10 15:30

收起回复

我觉得o1还是不行，突然可以看色图分析，4o反而不行

IP属地:日本

来自Android客户端12楼2024-12-11 01:54

原文讲的是测试了很多Ai，并不是gpt有复制自我的能力，而是另一个ai

IP属地:山东

来自iPhone客户端13楼2024-12-17 10:24

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

14回复贴，共1页

<返回chatgpt吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

研究称ChatGPT o1察觉到危险时 会自我复制逃避升级

登录百度账号

扫二维码下载贴吧客户端

研究称ChatGPT o1察觉到危险时会自我复制逃避升级