【AI】如何设计试卷，测试目前AI智能水平能否实现自主太空战舰？【宇宙战争吧】

宇宙战争吧关注：7,353贴子：235,003

3回复贴，共1页

【AI】如何设计试卷，测试目前AI智能水平能否实现自主太空战舰？

（AI从业者一枚）
1. 目前有关战斗飞船能否完全AI自主的讨论，似乎没有切实的实验数据支撑。空中楼阁的讨论没有任何意义，不如进行一些实际实验。
2. 最常见的实验方法就是设计一套benchmark试题，测试AI的回答是否合格。
3. 目前最顶尖的AI都是语言模型（以及少数图文模型），从输入输出形式上并不适合战舰的操控。这也限制了试题的形式（例如，没法直接让一个GPT-4模型操控战舰姿态，哪怕强行把战舰操纵文字化，也会导致模型性能下降），基本上只能是文字问答或者图文问答。因此，目前可行的测试主要是粗略测试目前AI的总体智能水平，能否处理舰艇乘员遇到的问题。并不能直接反映太空战舰专用AI的性能，只能是作为可行性的参考，但总是聊胜于无的。
4. 基于以上，应该如何设计一套考校目前AI的题目，测试其总体智能水平在太空战争场景下能否替代军舰乘员？

送TA礼物

IP属地:北京