帕斯卡时代是里程碑式的硬件突破,特斯拉产品线的p100,半精度计算性能即便对比2019年9月才发售的2080ti,基本上都不落下风。
甚至于16G的显存,它还胜过2080ti的11G不少。
存储器的带宽,732Gb每秒,远超2080ti的616Gb。
cUdA核心更是数倍于当代游戏旗舰,980ti。
要知道2080ti可是19年Rtx游戏系列的旗舰产品,比帕斯卡要更加新的图灵框架。
但回过头来去对比三四年前的计算产品线旗舰,仍旧没有什么优势。从这一点上就可以看出,老黄的确早就已经把游戏玩家玩弄于股掌之中了。
手头的牙膏这么一大根,想挤多少就挤多少。
将广大游戏玩家彻底当做了橡皮泥,想捏成什么形状就捏成什么形状,随心所欲。
“不过p100强归强,贵也是真特么贵啊...”即便是提前筹备了如此多钱的孟繁岐,看这一台服务器的价格也觉得头皮发麻。
因为贵也就算了,不买还不行。
这东西对孟繁岐来说是刚需,一笔订单就能下得孟繁岐心头滴血。
“台积电的16nm工艺13年底初次成功,一直到今年,才满足了量产的条件。贵是贵了点,但这是最新的工艺!”钱都花了,只能安慰一下自己:“别家真的想买现在还买不到呢!”
黄仁勋p100的产能短时间内上不去,除了自身的原因之外,与台积电也有很大的关系。
为了搭配特斯拉p100显卡,英伟达推出了针对人工智能领域的专用服务器,英伟达dGx1。双路英特尔至强处理器,8卡特斯拉p100,外加7tb的固态硬盘。
这在目前的时间点,可以说是笑傲群雄。黄仁勋号称是要以一敌百,对比传统的cpU服务器来说,这一台的确能顶两百多台。
售价也是高的离谱,13万美元,折下来八十万元左右。
“p100的售价不是才三四万吗?怎么一整套八卡的服务器要八十万?要是这么算起来,其中8张p100的价格占比,岂不是还不到一半。”唐璜从p100价格公布开始就已经在算公司要花多少钱了。
却没想到,这个价格再乘二也不够。
“买了8卡的p100,其他的料也差不了,配套的其他设备跟不上,显卡的钱就算是白花了。”孟繁岐说着这话,总觉得这番场景有些熟悉。
回想了一下,当初让唐璜赞助比赛用主机设备的时候,他也是这个想法,这番论调。
“没听老黄说嘛,买的多,省得才多。你小子就不适合当老板,太抠门。不舍得花钱,怎么赚到更多?”孟繁岐这番话最多三分是说给唐璜的,剩下的全都是在催眠自己。
因为单这样的服务器,孟繁岐至少就得消费一千多个,光是设备就得一两个亿美金起步。
未来如果大规模商用,恐怕还得再买两三千个。
除了购买服务器的费用,场地搭建,供电供网等其他乱七八糟的东西,价格恐怕也不会比这个数字低多少。
更得要配套的人力,甚至以后每天的设备运行都是巨额的支出。
这样算下去,孟繁岐这一年来在谷歌薅出来的羊毛,剩下来的部分基本上全都得投入在这个超算中心里面了。
可以说,这里彻底建成之后,孟繁岐的流动资金就基本上消耗殆尽了。
他得要在非常短时间内,使用这般强大的计算能力,迅速开展几个能变现盈利的AI项目,否则耽搁久了,他就得负债或者融资进来。
“唉...还是蹭大公司的计算资源舒服啊!自己出来另立山头,几百人的吃喝拉撒都得我操心。”过惯了舒坦日子,肩上猛然多了这么些责任,孟繁岐感到非常不习惯。
“你得去把公司避税的一整套流程做一做,什么开曼群岛,爱尔兰什么的。自己开公司,这些事情做不做,税率差了十来个百分点呢。”韩辞大概猜到了孟繁岐的心理负担,在一旁出言提醒道。
“各种控股套娃嘛,我知道,马上安排。”孟繁岐大概知道这里面的套路,无非就是注册这些小地方的公司,然后把自己的主要公司和业务全额控股了。
如此可以规避一些地区的税收政策。
再详细他也就没有研究了,这种专业的事情还是交给专业人士去做。
整套设备贵是贵了点,不过对比在谷歌白嫖的同样数量泰坦显卡,加速效果也是非常明显的。
原本25小时才能完成的计算,现在仅需要2小时,期望加速倍率大约12.5倍。
“也就是说,我在去年这个时候一万张泰坦算到今年,和我现在买一万张p100去算一个月进展几乎是差不多的。”
25个小时对比2小时,效果不够明显,但将这个时间差拉到全年的水平上去看,差距就显得尤为夸张了。
一年两年做不完的事情,现在四五周就能拿下,其意义和价值不可同日而语。
硬件水准需要飞升一次,便是孟繁岐为何要在谷歌先呆一年的主要原因,单干早了实在不划算。
没有帕斯卡架构的新系列,真正的大模型根本做不出来,光是实验都得做两年多。
孟繁岐根据现在的情况估算,自己用最新的帕斯卡架构,做出300亿参数大小的chatGpt,恐怕都得两三个月左右。
换算成之前的设备,至少得干到16年中旬去。
他一直在等待这个时间节点,否则自己组超算中心就显得有些太亏了。
如今总算是等到了。
“这几乎可以说是我有史以来最大的一笔消费了!”孟繁岐知道英伟达下一代的V100,A100显卡更新至少要等个两年四年,因而这阵子对p100的订购没有丝毫手软。
万张起订,在线下单。
毕竟两年多的时间太久,着实等不得了。这个时候拿到第一批p100是性价比最高的选择。
老黄给他的几个交付流程,最后两批服务器都快安排到明年了。
并且,比起谷歌这样的金主大公司,孟繁岐还有一层大股东加上开发顾问的身份。
他利用自己的先进技术和人工智能的学界地位,提前帮助英伟达确立了硬件设备的设计方向。
应该支持什么样的计算操作比较好?什么样的运算行为会在未来的人工智能界占据主流?
黄仁勋相信,世界上可能没人比孟繁岐更加清楚这些事情。这里面的价值,也是难以估量的。
圈外人谁又能够想象,在t方法绽放光芒之前,英伟达就已经在遵从孟繁岐的建议,专门在硬件设备上开始优化注意力方法内的关键操作了呢?
单凭这两层关系,孟繁岐拿货的价格自然就远远低于其他大科技公司。
刷脸就能打折,不是说说。
“这感觉真爽啊,第一个拿到最先进的计算服务器,花的还是内部价。”15年5月,孟繁岐正式重组了closeAI,在硅谷盘下了一栋楼。
热度如日中天的ai.也正式归入closeAI门下,这家名字与openAI针锋相对的公司正式出现在公众视野当中。
黄仁勋则大秀肌肉,运来了一台dGx1服务器,自己亲自抱着来到了closeAI的办公楼。
“得亏这款服务器用的不是pcIE接口的显卡,否则8张p100塞进去,机箱大得老黄也抱不起来。”
孟繁岐也感叹于英伟达的精妙设计,前世的他职级水平根本用不上英伟达的旗舰款服务器,8张A100想用一两天,都得排队半周。
如今看到这款dGx1,顿时感到一种金属的科技美感,精致而优雅。
它与玩家们熟悉的全塔主机机箱大小其实没有差太多倍,一改往常臃肿服务器的画风,并没有大家想象的那么庞大。
机箱的正面显得有些窄,大约是四个风扇竖直叠放的面积,这甚至比正常的全塔机箱面积还稍微小一些。
不过顺着正面向后望去,整个箱体显得异常的狭长,就像是键盘一样,厚度和宽度并不突出,但从左到右的整体长度则显得尤为夸张。
在这样不大的空间当中,英伟达塞进去了8张性能夸张的旗舰显卡,实现了4路网络互联。
512G的系统内存,4个2tb的固态硬盘,总体的热设计功耗达到3.2千瓦。
dGx1这款产品的推出,引发了相当多人的关注,毕竟这是首个专门针对AI计算的专用服务器。
许多人原本对英伟达的了解非常有限,仅限于四五千的游戏显卡产品。
而今,老黄却突然从裤裆里掏出一个8核弹发射井,价值直逼百万元,这让许多游戏玩家瞠目结舌。
这就像是你印象中的快餐店,在疯狂星期四,v我50之余,突然就推出了一款黄金只因,售价一千元。
任是谁看到,都会大吃一惊。
《dGx1无疑是人工智能领域的黄金标准》
媒体对这次的计算系列产品大加吹捧。
不论是英伟达的新品,p100显卡,还是整体的服务器方案,dGx1。
在此时的世间,根本找不到能与之相比拟的替代产品。
像是孟繁岐这样熟悉AI计算方式的人倒还好,觉得p100也就是大几倍乃至十倍的加速。
那种习惯了传统cpU服务器的人,只要用过一次dGx1,就再也忘不掉了。
【我原本要快一年才能算完的东西,现在只需要一天半???我之前到底在做什么??】
强大的速度对比之下,让许多人感到了极度的空虚。
一下子都不知道自己工作的意义到底是什么了。
【我平时在做的事情,就算是做一辈子,还不够人家现在两三个月计算的量...我到底在做什么?】
这就是算力革命的美丽所在,就像是多年前,人们为了算圆周率小数点后10位可能需要付出一生。
计算设备和方式更新迭代之后,只需要几个月就能算到小数点后一百万位。
而dGx1这样的服务器...孟繁岐正在一台一台不要钱一样地往closeAI的机房里搬。
黄仁勋抱来的那一台,则是英伟达历史上的第一台dGx1。
具有很强的象征意义。
“超级计算机dGx1,这是我们三千多人花费了接近三年时间才研发出来的轻量化小型超算,所以你看到它的体积已经不再像过去那样庞大。”
“我的评价是,秒杀英特尔!”
私下里,黄仁勋非常爽朗地展现着自己对这款服务器的信心,以及爆杀了英特尔的舒爽。
“你手里订单压到多少了?”dGx1一台难求,黄仁勋不仅给了孟繁岐第一批订单,还专门抱来了第一台dGx1,孟繁岐的心情也一片大好。
“马上两百多家公司了,按这个趋势下去,两年后恐怕都卖不完。”黄仁勋喜笑颜开,他曾经以为,想要达成这个效果,那得是渐进式的。
得需要两三次的迭代,却没想到直接一飞冲天。
在眼前的第一台dGx1超算上,身着皮衣的黄仁勋附身留下了如下文字。
【致孟繁岐与closeAI团队】
【为了计算和人类的未来,我捐出世界上第一台dGx1】
在场的核心技术人员们纷纷在上面签名留念,其中不乏许多华国人。
例如陈曦,他是加州伯克利的博士,被孟繁岐拉来closeAI做研究。
再比如范麟熙,他如今在英伟达做人工智能研究。他的老师,就是将孟繁岐与唐璜两人拉来斯坦福的李飞飞。
在AI的发展历程当中,从来都不缺少华国人的身影。
只是回顾这个时间点国内的发展历程,总会让人感觉微妙。
15年初到16年底,三大一线城市房价突然暴涨。
就在一两周前,330新政出台,鼓励大家购房去库存。
孟繁岐看到这则消息,猛地有那么一瞬间,又回到了重生前扛着房贷的那个状态当中。
“这两个月只能到第一批,差不多两百多台,后面的那些还得再缓缓,实在是赶不过来了。”黄仁勋说这话的时候也有些不好意思,这个速度比之前他承诺给孟繁岐的要慢了不少。
“两百多台也有小两千张了,短期内差不多够用。”孟繁岐其实订这么多卡,心中也没底到底多少才够用。
但他知道想要的人太多,宁可多订,不敢少买。
一千七八百张,前期获得关键模型是够用了,支撑用户使用还差了不少。
孟繁岐知道黄仁勋如今压力很大,手头订单多到一百来家公司在排队。
想要一口气全部到位,的确不大现实。
如果真的想要商业化chatGpt,所需要的GpU数量至少超过四万张,这个数量孟繁岐急也急不来。
一台dGx1所占的空间不大,但第一批两百多台全部组装完成之后,机房中密密麻麻的指示灯和连接线,给人的感觉还是相当震撼的。
一眼望去...这就是差不多二十亿元。
“咱们...真的需要这么恐怖的计算能力吗?”震撼的同时,高昂的价格也给了closeAI所有员工不小的压力。
“当然需要,这还远远不够呢。”
孟繁岐摇了摇头,在心中想着:“差不多是时候给他们搓一个chatGpt出来了。”