羽郑重的点了点头。
“我相信你会,我同样相信,你们会为华国文艺界带来一些新的气象。每一代人有每一代人的任务,过往的事情,也是时代的产物,苛责没有意义。
只不过,从现在开始,做好你要做的事,不要辜负了老天给你的天赋,以及群众对你的期待。”老先生说着,拍了拍徐希羽的肩膀。
“您放心,我会的。”徐希羽再次重复了一下自己的答案。
“走吧,看看下一个项目。”老先生说着还把手臂拉远,眯着眼睛的看了看手表。
此时,已经快12点了。
从9点到现在,3个小时里,他看了看地星集团过往的成绩,未来的规划,甚至还玩了一会《西游:后传》。
包括薇古的一些东西,他也看了。
现在,看完《流浪蓝星》这个压轴项目,就只剩MOSS-550A这个大轴了。
该说不说,托《流浪蓝星》里的MOSS的福。
当前来参观的老先生以及随同人员们,看到这个也叫MOSS的AI的时候,兴致瞬间就来了。
但随着高文的介绍和测试,众人的表情,纷纷变得严肃了起来。
尤其是刚刚对着徐希羽好一番交代的老先生,摆手打断道:“小高,你等一下。
你是说,你们团队用了国外团队十分之一的成本,训练出了水平差不多的AI模型?”
“对。”高文点了点头,在看徐希羽一眼后,他用着尽量通俗的措辞继续道:“不过十分之一只是一个相对粗略的计算。
目前,我们正在和徐总共同训练MOSS-550B和Wei-550B。用于训练的芯片是英伟达H100的阉割版H800。
由于我们的架构比较优秀,所以,我们实现了处理每万亿个Token,也就是AI能够处理的最小数据单元,只需要18万个小时的GPU运算时间。
我们现在有2048块GPU同时运算,所以,处理这些数据,只需要天。而我们整个预训练阶段需要处理的数据,预计需要花费万小时。
加上,上下文长度扩展的19万小时,以及后训练的5千小时,我们550B完整训练,只需要花费万GPU小时,也就是两个月左右。
因此,现在每块英伟达H800GPU的租赁价格大概是每小时2美元,这代表着,我们550B的总训练成本,只需要万美元。
不过这个成本仅包括我们的官方训练时的成本。不包括与架构、算法或数据的先前研究和消融实验相关的成本。
而作为对比,和我们同水平的ChatGPT-4的训练成本,需要超过1亿美元,因此,如果仅仅是算这个,他们的成本,是我们的十八倍。”
该说不说,即便是高文已经尽量通俗了,可听讲的人当中,有9成还是没怎么听懂。
不过没听懂没关系,作为领导,最大的能力就是抓住核心。
而高文刚刚的核心其实就四个:更低的算力阉割版的芯片、更好的架构、更低的价格、同等的水平。
当这四个关键组合起来,老先生的眼睛直接亮了。
熟。
这味道太熟了。
这些年,在其他行业,老先生曾无数次见证过类似的说法,更低的成本,同等的水平;同等的成本,更高的水平。
这代表什么?
这代表在AI这个领域,国外没能卡住咱的脖子啊!
想到这里,老先生表情严肃道:“小高,这里也没有外人,有什么话我就直说了。”
“您说。”
“你刚刚说的这些,有没有夸大其词?我也是从年轻时候过来的,我也理解年轻人想要做出一番成就的心态。
但咱们做事情,还是要实事求是。当然,这并不是说怀疑你,我不说这个MOSS真的达到了你说的那样。
即便是只做到了一半,不对,即便连一半都没做到,只要是能证明这条路可行,那你也是大功一件,值得赞赏。”
好家伙,这话一出,高文汗-->>
本章未完,点击下一页继续阅读