已经成名的孟繁岐,如今在研发技术又或者是写作论文的时候,是否具备理论解释已经不在考虑的范围当中。
在这个比较特殊的领域,算法的实际效果和应用范围才是他关注的重点。
虽然学界接受这一现象可能还需要一定的时间。
但这已经不是孟繁岐关心的事情了,在人工智能技术上面,他一直都是实践派。
结构重参数化虽然在数学上反直觉,但实际的效果确实相当惊艳。
它的主要提升来自两方面,一当然是分支合并带来的提升,原本复杂的支路在推理的时候被合并了起来,节约了计算量。
二却是来自一般人想不到的性能提升。
结构的重参数化,既然可以合并复杂分支,那为什么不在训练的时候,把分支设计得更加复杂一点呢?
反正最后都可以合并起来。
遵循这个思路,重参数化还允许相同的最终结构,通过复杂训练的方式获得更高的性能。
作为最终的结果,重参数化在轻量级网络上,大概取得了1.8倍左右的速度提升。
这个数字看起来没有先前8-9倍那么夸张,但这是在已经优化的高速网络上取得的结果。
在已经优化得很好的结果之上,继续优化的难度当然是更大的,同样是一秒钟的速度提升,后面的那一秒含金量当然不可与前面的同日而语。
就像是百米长跑,原本只能30秒跑完,提升一秒没什么大不了的。
可若是你能跑到10秒左右,再快一秒那可就不得了了,博尔特看了都得给你跪下。
博尔特跪不跪下不知道,马斯克确实是差点跪下了。
他上次与孟繁岐的沟通,一定程度上算是鸡同鸭讲。
从相当程度上,他只是在单纯客观地分析一个现实情况,那就是目前的模型计算量,对特斯拉来说很难负担。
后来特斯拉初版的自动驾驶还是使用了传感器,就是因为计算量负担不起,马斯克也不得不向现实低头。
如果要说他原本的计划,其实是打算从硬件方面解决这个问题的,没有指望孟繁岐能够继续优化。
面对已经比较夸张的提升,马斯克怎么也想不到,还能有什么手段可以继续简化模型的结构。
可偏偏孟繁岐就做到了,而且一共也没用到多久的时间。
不仅精简了计算量,甚至还删掉了网络的分支,现在连内存容量也给他省了下来。
“我..我不得不说,我被你的技术实力所折服,这让我太惊讶了。”视频当中,马斯克罕见地露出了笑容,言语之间稍微有一些口吃。
私底下,他是个没那么外向的人,说话的时候,如果有强烈的情绪,经常会有些口吃反复的现象。
“我原本只是在进行分析,确认当前的主要难点到底在哪里,完全没有想过你把它当成了一个任务,并且完成得这么好。”
“我还以为那是来自钢铁侠的高要求呢。”孟繁岐听到这里最开始两眼一黑,敢情自己自作多情了。
但早些继续推动网络的轻量化倒也不是坏事,一方面能加速人工智能技术落地,另一方面也会转移大家的视线,使得业界专注于小模型,而不大会发现大模型的威力。
“并且,如果你想要打造纯视觉自动驾驶系统,优化得再好的小模型也只是门槛中的门槛罢了,距离成型还差很远。”
孟繁岐这话倒也不是危言耸听,目前他为特斯拉打造的骨干网络,也只是尽量减小他们的计算成本罢了。
撑死了也就是自家停车场测一测检测效果的级别,想要上路测试都比较吃力。
“你在这方面有什么建议吗?”马斯克先前两次与孟繁岐的交流,主要以特斯拉方的优化需求为主,他还没有正式地就整体的算法系统和孟繁岐交流过。
不是因为别的,单纯是觉得孟繁岐太年轻了。即便他见过不少少年天才,但也不至于到20岁就能参与到他特斯拉那么大一个车辆公司的自动驾驶算法系统设计当中来的。
但经历了两次算法的更新之后,他感觉自己太过傲慢了。
对方的算法实力实在远超他的想象。
马斯克不是一个要面子的人,尤其是在这种专业领域技术领域。
他察觉过来不对劲之后,马上询问请教。
“计算机视觉今年热度不低,做一些智能操作还算是可以,可要说到与车辆这种传统的重工业结合,势必要与图形学融合。”
“骨干网络只是第一步,3d的障碍物空间分析,如何从多个摄像头构建精确的鸟瞰图,甚至于真实场景的仿真模拟都会是难题。”
使用摄像头识别出图像内的车辆,行人,障碍物等物体,只是第一步中的第一步,自动驾驶的难题实在太多。
3d分析,是为了确认平面图像上的物体距离车辆的距离。
构建鸟瞰图,有上帝视角,才方便规划车辆的行进路径,避开其他车辆行人。
至于真实场景的模拟,则是为了专门训练针对一些奇葩的场景。
比如大卡车横在马路中央,这种正常情况下很难收集的情况,却是一定要针对处理的问题。
否则到时候,算法说,嚯,路中央有个大卡车,这你也没教过我怎么做啊,还在犹豫的时候,已经直接一头创了上去。
那就要了人命了。
“而且我个人觉得,即便摄像头装满八个十个,前视广角,前视中焦,前视长焦,左右再来两颗侧向前视,翼子板侧向后视,屁股上再装一个后视鱼眼。”
“终究还是有很大的缺陷的,最大的问题还是对四维数据的获取有很大困难,不靠毫米波雷达这样的设备,纯依靠算法的情况下准确获取其他车辆的速度信息实在是一个大难题。”
“我倒不是说特斯拉做不到,作为AI算法工程师,我当然还是希望用纯视觉算法的形式来解决问题,只是不知道目前特斯拉所能承担的计算能力大概能到多少topS(每秒一万亿次操作)?”
“我想,应该不足10topS吧?恐怕5topS都勉强。”
“.....确实。”马斯克抿了抿嘴,心说好家伙,这小子是把自己的底裤都给看穿了啊....
他原本以为,孟繁岐只是一个算法天才,属于实验室内称王称霸的那种。
技术能力没得说,但未必和他一样,了解工业生产中的那些难点。
如今看来,他对总体系统的把握也相当不得了,要知道现在特斯拉的自动驾驶方案完全还没有对外发布过任何消息。
在自己没有透露任何内部情报的情况下,能够基本看穿他的想法和总体情况,对几个比较麻烦的地方也有提前预判。
不管是摄像头的设计和方案,还是接下来的几个主要里程碑,都被完完全全看透了。
尤其是对特斯拉硬件计算能力的估算,这别说是看到底裤了,就是底裤里面也被看光光啦!