核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。
{dede:pagebreak/}
你为什么坚持使用/学rust?
巅峰期的成龙身体素质是怎么一种存在?
为什么 Windows 没有比较成熟的第三方桌面环境(explorer.exe)?
如何评价《灵笼 2》第六集?
刘强东称「跨境电商的模式长期来看不可持续」,有依据吗?京东不走跨境电商模式,对其国际市场布局有何影响?
***拍大尺度片子时摄影师不会看光吗?
写CUDA到底难在哪?
女生第一次来大姨妈什么感受?
NAS的盘是否需要一次性买齐?
夸克网盘有可能超越百度网盘吗?
能分享一下你写过的rust项目吗?
Chrome 浏览器设计的神细节有哪些?
周杰伦为什么不告粥饼伦黑伦侵犯他的名誉权?
空战的时候可不可以先击落预警机?
为什么用 electron 开发的桌面应用那么多?
微软宣布 5 月 28 日开始下架「Microsoft 远程桌面」应用,背后原因有哪些?