台下的诸多学生当中,只有路易斯和韩辞能够跟上他的节奏,这还是因为两人都提前对这些内容有了了解。
并且韩辞根本就不是斯坦福计算机院的,虽然走了李飞飞的邀请,但她来读的仍旧是应用数学。这丫头只是来蹭课的。
“注意力函数可以描述为:将一个查询和一组键值对映射到输出的操作,其中查询、键、值和输出均为向量,输出被计算为值的加权和。其中每一个值的权重是由一个注意力函数来计算的,该函数以查询向量和键向量作为输入。”
“而我提出的缩放点积注意力,如书的287页所示。输入由三部分组成,维度为dk的查询向量和键向量,以及维度为dv的值向量。我们将单个查询值和所有的键一起计算内积,然后大小缩放根号dk,最后对内积结果做softmax函数以获得值的权重。”
“...”
这一系列操作是t方法的基础,自然也是Gpt和bERt方法的基本构成部分。
如果想要理解这几个月发生的一切,什么AI潜伏,AI医生,就必须要理解许多这样的操作。此乃是AI生成内容,AI大模型时代最为重要的核心原理,当然要着重讲解。
只是同学们却不知晓,听得那是头昏脑涨,生不如死。
按这种讲解方式,即便是罗德教授,也难以在短时间内将内容消化。
他最开始还时不时地在手边的白纸上做些记录和演算,但很快就感觉有些不对劲了。
不少同学在下面开始用手机拍摄板书,但仔细看了一会却发觉似乎意义不大。
绝大部分的内容其实这本新教材上已经有了。
现在的问题并不是这群高材生无法理解推导的过程,而是他们对各个步骤的意义知之甚少。
不理解为什么这里要做类似的操作和变换,即便能够理解式子推导的过程,几轮下来也被枯燥的数理给淹没了。
说白了就是没有一个主线,没有清晰的目的性。
“式二经过演化....得到式三,这个我好像看明白了。emmm后面怎么又有一长串推导,式六....我好像理解了。等下,刚刚的式二是什么来着?”
虽然能够理解,却不知道为什么要理解,直观感觉上都是无意义的高密度信息。
几十分钟下来,人就彻底晕了。
“好了好了,讲课的确是一门学问,不能由着你这样来。”不得已,罗德教授及时叫停,再继续下去,今天这节课的时间就算是浪费了。
“您看,我就说我没法讲吧。”见罗德教授发声叫停,孟繁岐喜出望外,他也感觉不大自在。
“谁说没法讲,我是说不能由着你随便讲。今天你既然已经站上了这个讲台,那就必须讲出对得起这个讲台的课!”罗德教授怎可能善罢甘休,他怀疑这小子是故意把内容搞得这么难的。
讲得这么快作甚?赶着投胎啊?罗德教授今天是要吃定这小子了,要么他负责讲后面的这些内容,要么这小子乘早别来这堂课。
“现在开始,我来安排章节内容,你来负责讲述,不得超出我的指定范围。什么时候让台下的同学们都听明白了,我们再进入下一个章节。”罗德教授坐在讲台的侧边,扶了扶眼镜,迅速把书往回翻了几十页。
“我们今天别的都不管了,就先把残差这个概念彻底搞清楚。”
“太好了!”同学们欢欣雀跃,说实话,最开始他们也怀疑过听不懂到底是不是自己的问题。
现在看罗德教授的表情,怕是他也没有搞明白。
既然连教授都听不明白,那大家都一脸懵就合理了,谁也别说谁。
“同学们都记一下,从现在开始,孟同学讲的所有AI新时代内容,期末都重点考察。”同学们高兴了还没有三秒钟,罗德教授就笑着图穷匕见了。
这些内容我讲是不讲了,但是考试却都是重点哦!
教室里瞬间从刚才的欢欣雀跃变成一片哀嚎。
“救命啊...就他刚刚那个讲法,我能听懂个鬼啊。”
“罗德教授,你不能这么残忍!”
讲台上罗德教授一直笑眯眯的,同学们的感觉却是冷汗直冒。
除了mmp,他们什么都不想讲。
“所以同学们,如果听不懂应该怎么做?应该提问啊!”罗德教授循循善诱:“不管他讲得怎么样,你只要没搞懂,你就一直问,问到你明白为止。一切问题不就迎刃而解了吗?”
“额...教授的话似乎有那么一些道理哈。”刚刚堕入绝望的同学们顿时感觉自己看到了希望的曙光。
“坏事了,这下我只能彻底远离这几门AI相关的课程了。”孟繁岐从未感觉哪一节课如此漫长过。
台下的同学们在罗德教授的诱导之下个个都是问题宝宝,不管孟繁岐说了多么基础的知识,也总有人追根溯源想问个明白。
问到后来,由于问题过于本质,导致孟繁岐也有些搞不明白情况了。
就像是伱一直写同一个字,然后再盯着同一个字猛看。
不用两分钟,你就会感觉自己似乎都不认识这个字了。
孟繁岐此刻的感受便是如此。
课后,孟繁岐与来上了这门课的小团体三人,找了一家餐厅歇息。
“我觉得罗德教授就是想把我折磨走。”在他看来,如此细致密集的盘问,显然已经影响到正常的课程进度了。
如果这些问题都一一作答,并且给大家都讲明白,那这点课时肯定是不够用的。
“哈哈哈,他这就是阳谋,已经明摆着骑到你脸上了,要我说咱们还是避其锋芒算了。这东西都是你写的,那还有什么好去上课的。”跳级成性的路易斯平日里最烦这种浪费时间的操作,在他看来,如果东西差不多明白了,就是时候和同学们说拜拜了。
孟繁岐看着路易斯明显过于年轻的面庞,心说我若是真的能有你们的那种天才倒是方便多了。
“我倒是觉得你应该继续讲课讲下去。”韩辞从今天的课程过半之后,话就很少了,一直一副若有所思的样子,似乎是有了什么新的想法。
“我在上课的时候注意到了一些有趣的现象,这可能对我们公司的发展至关重要。”这里韩辞所说的公司,自然就是目前已经成立的空壳closeAI,暂时只是给几个人发发工资用的。
不过大家也都清楚,孟繁岐脱离谷歌之后,closeAI就会很快重组,并有大动作。
在此前几人的规划当中,会以更加先进的Gpt文本大模型,和扩散制图模型两者为核心产品进行营收。
但问题也同时产生了,这两件事情都需要非常强大的算力支撑,对现金流的需求是极其巨大的。
孟繁岐脱离谷歌之后,就不再有免费的设备可用,需要自己组件超算中心。
此外,孟繁岐还需要继续研发其他新技术,与此同时又要支撑这些新服务,未免有些捉襟见肘。
想要维持健康的现金流,这些事业就需要徐徐图之,无法太快推进。
若想要迅速推出产品,齐头并进,就免不了需要大额负债或者将大量的股权出让,这在现阶段是肯定没必要的,很容易受制于人。
“我们似乎一直以来都忽略了一个拥有庞大受众的领域,并且这个领域向来都是最赚钱的领域之一。”韩辞想到了一个很好的赚钱法子,并且完全摆脱了算力的限制。