免费阅读
返回
菜单
上一章查看最新章节下一章

第137章 方案顺利通过验证

作品:裁员后,我成了科技教父作者:辰小序
如果本章错误,请点击报错10秒纠正

“老婆,你先带着女儿玩一会儿,我去书房处理点儿工作,就一会儿!”思路涌来,郝成回到家不工作的承诺又要食言了。

“十点!”宁荟能怎么样呢,还不是得由着他。

“用不了,最多一个小时!”郝成伸出一根手指指着灯:“我保证!”

“德性!”宁荟笑骂了一句,心里也是感叹:忙点就忙点吧,至少比起去年,这看起来开朗了许多。

……

今天确实不费什么脑筋,因为相关的知识早就在从前整理过了,只是当初没有重视。

来到书房,稍微翻一下之前记录下来的东西,郝成的思如泉涌,一下子就全都冒了出来。

如果说模型的训练提升是在做加法,让模型变得更大更强,那裁切、量化、蒸馏就是在做减法。

很多人可能会有疑问,做减法,那不是让模型变得更弱了吗?

理论确实是这样,但有时候,弱不弱的其实不是特别重要,只要使对了劲儿,一样能造的嗷嗷叫,发挥很大的作用。

比如,有些神经元节点的权重非常小,对模型加载信息的影响微乎其微,切掉它们,精度不会降太多,但却能大大的减少资源消耗。

还有,像小沙这样全量全知全能的模型,其部署和每一次的相应运算推理,都需要消耗较大的算力资源。但事实上,每一次都是确有必要的吗?

显然并不是!

就拿小沙现在应用最广的软件开发能力来说,它就只需要精准需求的理解以及代码编写能力就够了,至于慢慢在增强的情感映射、主观判断等能力映射这些,那就完全没有必要!

不仅消耗了更多的算力,还拖慢了相应速度。

而且即便是需要的部分,也可以分层去处置:

还是拿软件开发能力来说,最粗略的,那就可以分为两部分:一部分是需求理解,另一部分是根据需求去做开发。

而这第二部分,那就只需要一个“软件开发”的行业模型就够了。

所以,先在输入端就将用户需求分解,然后将小沙按需裁切为软件开发、法律服务、安全服务等小模型,根据分解的需求去调用其中一个,或者几个。

就比如之前被视为经典案例的小沙第一次庭审,那次的应对也不过是需要三个基础能力:语义理解、法律服务、软件开发能力。

只有极少数的情况,才需要去动用小沙的全量模型。

即便需要全量模型,全程

…。。
   本章没完,请点击下—页继续阅读!如果被转码了请退出转码或者更换浏揽器即可。
  温馨提示:亲爱的读者,如果你觉得本站还好,为了避免丢失和转马,请勿依赖搜索访问,建议你使用[华为刘揽器]或[Firefox火狐刘揽器]访问并收蔵【文坛书院】 m.1went.net。我们将会持续为你更新,还建议你注册会员使用书架功能追书阅读更方便。
上一页 123下一页
上一章查看目录下一章
临时书架加入书签回顶部↑

看了《裁员后,我成了科技教父》的书友还喜欢看

狱医
作者:破空
简介: 三年前,他为女友怒而伤人,因故意伤人锒铛入狱。三年后归来,家遇变故,大哥大嫂车祸罹难...
更新时间:2026-03-04 20:40:47
最新章节:第1493章 他真是自己父亲吗?
我在唐朝当神仙
作者:青木有信
简介: “弟子李白,愿随仙人学仙问道,真心不悔!”

“丹丘生,孟夫...
更新时间:2026-03-04 21:00:00
最新章节:第555章 岑参开始打听(+3)
天才小师姐她偏要当废物
作者:狗肠
简介: 【有cp,男主烬渊】白琳发现自己竟然是宗门团宠小师妹的对照组。

...
更新时间:2026-03-04 21:11:25
最新章节:云灵界番外24:我道侣不爱我了
婴儿的我,获得大器晚成逆袭系统
作者:语成
简介: 大周太子杨承重生到一岁婴儿时期,大器晚成逆袭系统早到了五百年。

...
更新时间:2026-03-04 20:33:43
最新章节:第一卷 第930章 混乱污染
封疆悍卒
作者:宿言辰
简介: 大乾末年,四面楚歌。北有狼戎铁骑南下劫掠,南有流民四起匪盗横行。

...
更新时间:2026-03-04 21:23:35
最新章节:第1374章,秘密通道
我的心动老板娘
作者:火烧风
简介: 和穷人谈钱,和富人谈感情,不信邪的我被践踏的遍体鳞伤...直到老板娘出现,我才发现我...
更新时间:2026-03-04 21:05:00
最新章节:第一千五百四十七章 意外
书名:

本站若有图片广告属于第三方接入,非本站所为,广告内容与本站无关,不代表本站立场,请谨慎阅读。

Copyright © 2020 文坛书院 All Rights Reserved.kk

SiteMap