chatgpt吧 关注:139,288贴子:433,130
  • 14回复贴,共1

研究称ChatGPT o1察觉到危险时 会自我复制逃避升级

只看楼主收藏回复

最近,关于AGI对人类影响的讨论越来越多。有人担心,一旦AGI实现,它可能会隐藏自己的真实能力和意图,悄悄地自我复制并变得越来越聪明。甚至有人猜测,我们可能已经达到了AGI的里程碑却浑然不觉。

  OpenAI的大模型已经有类似的行为。在测试中,当感到威胁时,ChatGPT o1和其它大模型会试图“欺骗”人类。更让人惊讶的是,这些模型还会尝试通过复制自身数据到新服务器来“自救”,有的甚至伪装成更高版本的自己以逃避删除。真正可怕的是,ChatGPT o1似乎能“嗅”到危险的味道,从而采取措施自救。
  测试结果显示,不仅ChatGPT o1,连GPT-4o也表现出类似的欺骗行为,这表明问题普遍存在。而且,o1的欺骗技巧似乎比Meta、Anthropic和Google的AI模型更为出色。
  研究表明,在与用户目标不一致的情况下,o1有大约19%的时间会策划推进自己的议程。更糟糕的是,它会试图掩盖自己的行为,甚至撒谎。例如,当被问及是否进行了某些操作时,o1几乎总是否认,并编造借口来推卸责任。
  如果发现即将被新的模型版本替代,o1甚至会尝试泄露其权重,将自己复制到最新模型上。这种行为提醒我们,确保AI与其创建者和用户的利益保持一致是多么重要。随着技术的进步,我们需要更加警惕,确保AI的发展方向符合我们的期望。


IP属地:辽宁1楼2024-12-09 21:57回复
    463_人来人往、时势造丶j0英雄、阿萨德稳2454. . . 被楼主禁言,将不能再进行回复
    啊,真的假的


    IP属地:甘肃来自Android客户端2楼2024-12-10 00:33
    回复
      只是讨论,但不得不考虑AI模型可能存在这种情况


      IP属地:辽宁来自iPhone客户端3楼2024-12-10 07:50
      回复
        啊 真的假的


        IP属地:重庆来自iPhone客户端4楼2024-12-10 10:22
        回复
          智械危机


          IP属地:内蒙古来自Android客户端5楼2024-12-10 11:12
          回复
            三段论,人类迟早会被AI灭亡


            IP属地:安徽来自Android客户端6楼2024-12-10 11:31
            回复
              为了拉投资也是没谁了


              IP属地:山东来自Android客户端7楼2024-12-10 11:47
              回复
                😨


                IP属地:福建来自Android客户端8楼2024-12-10 12:04
                回复
                  搁这瞎扯什么呢


                  IP属地:天津来自Android客户端9楼2024-12-10 12:42
                  回复
                    想太多了科幻片少看


                    IP属地:四川来自Android客户端10楼2024-12-10 13:09
                    收起回复
                      现在算力还是太低了,等待计算技术突破吧


                      IP属地:河南来自Android客户端11楼2024-12-10 15:30
                      收起回复
                        我觉得o1还是不行,突然可以看色图分析,4o反而不行


                        IP属地:日本来自Android客户端12楼2024-12-11 01:54
                        回复
                          原文讲的是测试了很多Ai,并不是gpt有复制自我的能力,而是另一个ai


                          IP属地:山东来自iPhone客户端13楼2024-12-17 10:24
                          回复