免费阅读
返回
菜单
上一章查看最新章节下一章

第109章 OpenAI最近有点儿跳,得限制一下!

作品:裁员后,我成了科技教父作者:辰小序
如果本章错误,请点击报错10秒纠正

郝成请了一顿饭,何钢吃了满肚子的心事。

饭局刚刚一结束,他就立刻回到酒店,联系上了于东。

“老何,我咋发现你每次一去临州,都会变得这么慌慌张张的呢?”于东甚至调侃上了。

“你先别忙,听我说。”

何钢仔细的将郝成在车上的话简单跟于东复述了一遍,而后总结道:“可不要看这东西是郝成在扯闲篇,是在泛泛而谈大路的概念,是没有透露任何AI训练方法的。

“但实际上,他这个泛泛而谈,跟我们一大群人去聊天,他不一样!”

“我知道,他已经训练出小沙了,他的大路概念那是正确的概念。”于东长长的呼了口气:“从这泛泛而谈中或许能找到方向。

“但光听这些也没有用啊!”思索了很久,于东也是无奈道:“你说的所有的东西,我只能总结出三个字‘类似人’,而这种方向,团队早就考虑过了。

“但现在的问题不是方向,是方法,我们没有找到任何的方法。唯一的好消息是,我们以传统方式训练AI的成本也大大的降低了,效率却大大的提高了。”

于东说的这个倒是实情,不仅仅是华为、抖音、腾讯甚至OpenAI,训练AI的成本都降低了。

究其原因,也很简单,他们让小沙帮他们做数据清洗、标定和反馈。

数据清洗原本是一个非常复杂且繁琐的工作,也是训练AI非常关键的步骤,数据清洗的质量越高,AI训练的质量也就越高。

以往,这个工作都是由人工来实现的,也有用AI来做的,但是效果就会很差,往往会投喂一些垃圾数据,造成模型被污染,进而产生一些低级错误。

而现在有了小沙,这项工作可以更快速的进行,准确率甚至不比人工清洗差。

而更关键的一个问题,以往GPT类的模型,是RLHF,也就是基于人类反馈的强化学习。

怎么做的呢:就是先预训练一个语言模型,然后做微调。

微调怎么调呢:就是你问一个问题,语言模型给你回答,然后人工给这些回答进行排名,然后获得一个有质量排序的数据集,用这个数据集反过来再去微调相关的模型参数,一遍又一遍循环往复,然后答案就会越来越接近人想要的。

而现在,小沙代替了人工的这个步骤。

RLHF模型先前被认为不可能无限提高,其中最重要的一个原因就是,随着参数越来越多,数据量越来越大

…。。
   本章没完,请点击下—页继续阅读!如果被转码了请退出转码或者更换浏揽器即可。
  温馨提示:亲爱的读者,如果你觉得本站还好,为了避免丢失和转马,请勿依赖搜索访问,建议你使用[华为刘揽器]或[Firefox火狐刘揽器]访问并收蔵【文坛书院】 m.1went.net。我们将会持续为你更新,还建议你注册会员使用书架功能追书阅读更方便。
上一页 123下一页
上一章查看目录下一章
临时书架加入书签回顶部↑

看了《裁员后,我成了科技教父》的书友还喜欢看

我的设定在你之上!
作者:东山余雨
简介: 【1.00版本,我们为世界增添了

“光”这一设定,于是便有...
更新时间:2026-03-04 20:40:25
最新章节:请假条(3月4日)
四合院:截胡秦京茹后,我躺平了
作者:半山三叔
简介: 穿越四合院,陈飞只想躺平过日子。谁知绑定

“躺平人生系统”...
更新时间:2026-03-04 21:11:15
最新章节:第160章 二叔出现问题了
穿成囚禁残疾将军的恶毒女配后
作者:自由之上
简介: 【甜宠治愈+养崽+灵泉空间+脾气火爆的富家千金vs傲娇倔强的少年将军】
更新时间:2026-03-04 20:22:50
最新章节:第45章厮杀
冲喜娇妻有空间,捡个糙汉宠上天
作者:黑色幕帏
简介: 种田+经商+宠夫宠上天的文文)娘家不爱,舍,婆家要我陪葬,弃,只有身边那个围着她不停...
更新时间:2026-03-04 20:51:00
最新章节:第一百七十章 皇帝暴毙
每日一卦,我搜山打猎粮满仓
作者:大威天龙
简介: 【饥荒打猎】【种田争霸】【美女后宫】

穿越王朝末年,正值饥...
更新时间:2026-03-04 21:27:29
最新章节:第一卷 第241章 大败
炼神鼎
作者:秋月梧桐
简介: “秦玄,我要你助我修行!”

“要多久?”

更新时间:2026-03-04 18:53:13
最新章节:第一卷 第2217章 圣药的下落
书名:

本站若有图片广告属于第三方接入,非本站所为,广告内容与本站无关,不代表本站立场,请谨慎阅读。

Copyright © 2020 文坛书院 All Rights Reserved.kk

SiteMap