宇宙战争吧 关注:7,353贴子:235,003
  • 3回复贴,共1

【AI】如何设计试卷,测试目前AI智能水平能否实现自主太空战舰?

只看楼主收藏回复

(AI从业者一枚)
1. 目前有关战斗飞船能否完全AI自主的讨论,似乎没有切实的实验数据支撑。空中楼阁的讨论没有任何意义,不如进行一些实际实验。
2. 最常见的实验方法就是设计一套benchmark试题,测试AI的回答是否合格。
3. 目前最顶尖的AI都是语言模型(以及少数图文模型),从输入输出形式上并不适合战舰的操控。这也限制了试题的形式(例如,没法直接让一个GPT-4模型操控战舰姿态,哪怕强行把战舰操纵文字化,也会导致模型性能下降),基本上只能是文字问答或者图文问答。因此,目前可行的测试主要是粗略测试目前AI的总体智能水平,能否处理舰艇乘员遇到的问题。并不能直接反映太空战舰专用AI的性能,只能是作为可行性的参考,但总是聊胜于无的。
4. 基于以上,应该如何设计一套考校目前AI的题目,测试其总体智能水平在太空战争场景下能否替代军舰乘员?


IP属地:北京1楼2024-09-13 15:48回复
    先用亡星余孤训练


    IP属地:广东2楼2024-09-13 16:39
    回复
      让语言模块去控制飞船真的看不出有什么意义。gpt4会因为一次输入过多的数据卡壳,因为时间设置偷懒,费那么大力气模仿人最后的结果却是把人的缺点也学来了。


      IP属地:北京来自Android客户端3楼2024-09-13 17:11
      回复
        别跟llm摔跤了


        IP属地:辽宁来自Android客户端4楼2024-09-13 18:19
        回复