neurosama吧 关注:21,554贴子:112,475
  • 9回复贴,共1
求助

关于牛肉模型的实现方法

只看楼主收藏回复

如题,之前vedal放出一个页面,透露过牛肉的核心是nlp,但是也有人说vedal调用了openai的api之类的
鄙人也想搞一个类似的模型用来聊天,查了一下之后发现pytorch可以达到类似效果,所以目前在学pytorch尝试模仿牛肉做一个类似的聊天模型,但是因为vedal只透露了是nlp,我也不清楚pytorch能不能做到。pytorch可以用来实现牛肉那样的效果吗?希望有大佬可以解答一下


IP属地:新疆来自Android客户端1楼2024-01-12 17:30回复
    建议去neuro的dc社区问,那里从事这方面的大佬多,吧里很少有人懂


    IP属地:北京来自Android客户端3楼2024-01-12 17:32
    回复
      pytorch是一个deep learning框架啊,想要实现当然是可以的,但是你从pytorch学到手写LLM还是需要很多时间的吧。neuro我估计是开源LLM上做了一些tuning,你只要做聊天模型的话条用openai的api应该就可以满足要求了。


      IP属地:北京4楼2024-01-12 23:35
      回复
        我是小白这几天也在做这个,我把huggingface上各种开源模型都试了一遍(openai要钱就没有考虑)。pytorch应该可以达到类似的效果,但是比较麻烦,而且电脑跑不动模型,效果不是很好
        这两天在github找到一个ollama,用起来还可以,而且非常简单
        之后还想给它加上长期记忆、语音交互等等其他功能,但是感觉好难啊


        IP属地:河南来自Android客户端5楼2024-01-18 23:55
        回复
          来张无印良品


          IP属地:湖北来自Android客户端6楼2024-02-01 12:32
          回复
            https://github.com/shengxia/RWKV_Role_Playing,估计这个项目对你有用


            IP属地:内蒙古来自Android客户端7楼2024-02-08 09:43
            回复
              我是做到了在本地跑起来了LLM模型的程度🤔


              IP属地:广东来自Android客户端8楼2024-02-14 14:05
              回复
                api应该是牛肉的那些功能用的吧,比如玩geoguesser之类的,那很难是vedal自己能做到的,至于语言模型本身应该是他自己微调出来的


                IP属地:上海来自iPhone客户端9楼2024-02-16 14:26
                回复
                  6


                  IP属地:山西来自Android客户端10楼2024-03-05 17:51
                  回复
                    6


                    IP属地:广东来自iPhone客户端11楼2024-07-30 14:36
                    回复