核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
代码:
能分享一下你写过的rust项目吗?
怎么传输大文件到国外?
30年过去了,美国没有比B2更强的轰炸机了么?
老板说我设计了一周的海报还是不行,我到底该怎么学啊?
为什么 php 可以做到 7 毫秒以内响应,而 .net 做不到?
如何评价女明星梅根福克斯的身材?
理论上flutter性能应该非常高才对,为什么好些flutter应用性能一般?
python与nodejs哪个性能高?
Windows内核的私有api是怎么被发现的?
程序员看剧的时候,如果看到有敲代码页面,会暂停看代码吗?
jwt的设计合理吗?
为什么 Bun 选择了 Zig 以及 JSCore?
中餐炒菜那么好吃,为什么欧美人不学去?
为什么都认为无GC语言一定会比有GC语言要快?
世界上到底有没有只要无脑执行就能长期正收益盈利的交易策略,好让我死心?
太空中没有氧气,为什么太阳还在燃烧?
昌平君是吕不韦,这是谁提出来,有什么证据,真的吗?
为什么说J***a21的虚拟线程不再有阻塞的问题?
Node.js是谁发明的?
开了个MC服务器,有点不知道咋维护,有谁愿意帮我看看嘛?
编程问题哪里解决?
iOS的墓碑机制这么厉害,为什么Windows、Linux不***用呢?
flutter为什么不用Go语言,而用Dart?
穿了瑜伽裤真的舒服吗?
为什么Rust的包管理器Cargo这么好用?
什么是防抖和节流?有什么区别?如何实现?
程序员需要用到内置kvm功能的显示器吗?或者是外置的kvm切换器吗?
为什么现在键盘轴体不用颜色命名了,全是些莫名其妙的名字,看不懂到底是什么?
一个非常漂亮的残疾女孩,会有人愿意娶吗?