(AI从业者一枚)
1. 目前有关战斗飞船能否完全AI自主的讨论,似乎没有切实的实验数据支撑。空中楼阁的讨论没有任何意义,不如进行一些实际实验。
2. 最常见的实验方法就是设计一套benchmark试题,测试AI的回答是否合格。
3. 目前最顶尖的AI都是语言模型(以及少数图文模型),从输入输出形式上并不适合战舰的操控。这也限制了试题的形式(例如,没法直接让一个GPT-4模型操控战舰姿态,哪怕强行把战舰操纵文字化,也会导致模型性能下降),基本上只能是文字问答或者图文问答。因此,目前可行的测试主要是粗略测试目前AI的总体智能水平,能否处理舰艇乘员遇到的问题。并不能直接反映太空战舰专用AI的性能,只能是作为可行性的参考,但总是聊胜于无的。
4. 基于以上,应该如何设计一套考校目前AI的题目,测试其总体智能水平在太空战争场景下能否替代军舰乘员?
1. 目前有关战斗飞船能否完全AI自主的讨论,似乎没有切实的实验数据支撑。空中楼阁的讨论没有任何意义,不如进行一些实际实验。
2. 最常见的实验方法就是设计一套benchmark试题,测试AI的回答是否合格。
3. 目前最顶尖的AI都是语言模型(以及少数图文模型),从输入输出形式上并不适合战舰的操控。这也限制了试题的形式(例如,没法直接让一个GPT-4模型操控战舰姿态,哪怕强行把战舰操纵文字化,也会导致模型性能下降),基本上只能是文字问答或者图文问答。因此,目前可行的测试主要是粗略测试目前AI的总体智能水平,能否处理舰艇乘员遇到的问题。并不能直接反映太空战舰专用AI的性能,只能是作为可行性的参考,但总是聊胜于无的。
4. 基于以上,应该如何设计一套考校目前AI的题目,测试其总体智能水平在太空战争场景下能否替代军舰乘员?