0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务。
而且它参数量小,本地跑,运行快。
以前的那些nlp任务都可以用这种万金油来微调。
比如文章提取,文章样式整理,数据格式转换,文章校验,快递信息提取等。
你可能会说我为什么不用传统的nlp来干? 主要是现在的llm模型,从训练到部署已经非常的流水线了,不会深度学习的人也能训练一个并部署,这个流水线简单到,真的只需要处理数据集而已。
整个过程你甚至不需要写…。
{dede:pagebreak/}
英特尔的衰落,是因为真正做事的工程师被挖了?还是公司战略出问题?
为什么现在键盘轴体不用颜色命名了,全是些莫名其妙的名字,看不懂到底是什么?
指挥大规模军团作战很消耗脑力吗?
如何看待贾玲、沙溢、贾冰、杨天真、范湉湉均瘦身成功?为什么明星想瘦就瘦普通人却很难?
国内为什么那么多人黑 WordPress ?
在办公室用机械键盘是什么心里?
各位前端大触们,一般怎么定颜色的?
正常人吃治疗抑郁症的药会变快乐吗?
用紫砂壶泡茶真的比别的茶具泡出来的茶更有味道吗?
IntelliJ IDEA 中有什么让你相见恨晚的技巧?
英特尔的衰落,是因为真正做事的工程师被挖了?还是公司战略出问题?
postgresql也很强大,为何在中国大陆,mysql成为主流,postgresql屈居二线呢?
台湾什么时候统一?统一了对普通老百姓有什么影响?
目前最具性价比的全栈路线是啥?
普通人需要10bit或者8抖10的显示器吗?
中国大陆的苹果手机被阉割了哪些部分?