都在夸端到端,到底有哪些缺點(diǎn)?
Myautotime | 10-28
19797
端到端催熟了智能駕駛體驗(yàn),處于智駕領(lǐng)域絕對(duì)頭部領(lǐng)先身位的小鵬汽車成功翻身,足以證明端到端的巨大優(yōu)點(diǎn)。
但是,被國(guó)內(nèi)車企吹上天的端到端也有一些不容忽視的缺點(diǎn)。
01
萬(wàn)事萬(wàn)物大都既有優(yōu)點(diǎn)也有缺點(diǎn),很多東西都是一把雙刃劍!
端到端重構(gòu)了自動(dòng)駕駛的技術(shù)棧,算法的全面AI化,使得數(shù)據(jù)成為驅(qū)動(dòng)自動(dòng)駕駛模型迭代的基礎(chǔ)養(yǎng)料。
從此,自動(dòng)駕駛系統(tǒng)在一定程度上擺脫了傳統(tǒng)范式下有多少人工就有多少智能的尷尬,也杜絕了算法工程師有意無(wú)意埋一些bug的做法。
天道昭昭,人心可鑒,在裁員四起、人心惶惶的大背景下,理解一下程序員們養(yǎng)bug自重的無(wú)奈吧。
在給定參數(shù)量和模型架構(gòu)的前提下,自動(dòng)駕駛模型的能力完全取決于訓(xùn)練的數(shù)據(jù)規(guī)模有多大、數(shù)據(jù)的質(zhì)量有多高、分布性有多么豐富。
在規(guī)則+算法的范式下,自動(dòng)駕駛系統(tǒng)尚有部分知識(shí)來(lái)自于人工設(shè)定的規(guī)則,到了完全轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng)的端到端范式之后,自動(dòng)駕駛系統(tǒng)全面模型化,系統(tǒng)壓縮的所有駕駛知識(shí)完全來(lái)自訓(xùn)練數(shù)據(jù)。
這就意味著,到了端到端時(shí)代,自動(dòng)駕駛系統(tǒng)訓(xùn)練的數(shù)據(jù)規(guī)模比海量更加海量了。
iPhone大屏化之后,宣稱“Bigger than bigger”,比逼格更逼格,華為引入全向防撞系統(tǒng)之后,宣稱“比安全更安全”,大家借此體會(huì)一下啥叫比海量更海量吧。
隨著智駕里程的增長(zhǎng)以及自動(dòng)駕駛系統(tǒng)能力的提升,訓(xùn)練的數(shù)據(jù)量當(dāng)然也會(huì)不斷增長(zhǎng)。
如果非要刻舟求劍的話,蔚來(lái)截至今年4月份的視頻訓(xùn)練量為1,000萬(wàn)個(gè)clips,小鵬截至今年9月份的視頻訓(xùn)練量為2,000萬(wàn)個(gè)clips,特斯拉那么恐怖的訓(xùn)練算力,至少5,000萬(wàn)個(gè)clips。
以上說(shuō)的只是訓(xùn)練素材的數(shù)量單位,還得考慮訓(xùn)練頻次和模型的迭代速度。
就跟學(xué)霸們通過(guò)反復(fù)刷題提升成績(jī)一樣,模型也是通過(guò)反復(fù)地訓(xùn)練這些數(shù)據(jù),才把駕駛知識(shí)訓(xùn)練到模型的參數(shù)里面的。
特斯拉每天迭代一個(gè)小版本,假設(shè)需要訓(xùn)練20個(gè)頻次,每天就得訓(xùn)練10億個(gè)clips!
02
科學(xué)分析有兩種方式:定量分析和定性分析。
比海量更海量屬于定性分析,它可以給你一種模模糊糊的感覺(jué),你盡可以根據(jù)自己的立場(chǎng)宣泄對(duì)端到端或褒或貶的情緒,不過(guò),最終還是得進(jìn)行定量分析,用真實(shí)的數(shù)據(jù)做嚴(yán)謹(jǐn)?shù)膶?duì)比。
看數(shù)據(jù),特斯拉每天用5,000萬(wàn)個(gè)clips訓(xùn)練模型20個(gè)輪次,相當(dāng)于訓(xùn)練10億個(gè)clips,訓(xùn)練算力有限,F(xiàn)SD模型迭代的速度就會(huì)減慢,特斯拉將“訓(xùn)練算力”推高到100E的核心原因就在這里。
這個(gè)100E其實(shí)不只包括訓(xùn)練算力,還包括推理算力,更為準(zhǔn)確的說(shuō)法是訓(xùn)推一體的AI算力。
隨著數(shù)據(jù)標(biāo)注工具推理能力的增加,過(guò)去主要依靠人工實(shí)現(xiàn)的數(shù)據(jù)標(biāo)注工作逐漸得以自動(dòng)化實(shí)現(xiàn),數(shù)據(jù)標(biāo)注效率大大提升了。
不過(guò),和模型需要一遍又一遍地訓(xùn)練一樣,訓(xùn)練素材的精標(biāo)結(jié)果也需要一遍一遍地刷出來(lái),其結(jié)果就是,自動(dòng)駕駛數(shù)據(jù)閉環(huán)中的自動(dòng)標(biāo)注過(guò)程需要消耗的推理算力也大大增加了。
也就是說(shuō),目前的自動(dòng)駕駛數(shù)據(jù)閉環(huán)消耗的絕不僅僅是訓(xùn)練算力,還包括推理算力,模型訓(xùn)練階段消耗訓(xùn)練算力,訓(xùn)練之前的數(shù)據(jù)標(biāo)注消耗推理算力,用的是不同的服務(wù)器。
之所以還在繼續(xù)沿用訓(xùn)練算力這么一個(gè)術(shù)語(yǔ),主要原因是是歷史沿襲的約定俗成,而且大部分人還沒(méi)有及時(shí)更新認(rèn)知。
和分模塊時(shí)代主要在感知層面打標(biāo)簽不同的是,到了決策層也要模型化當(dāng)然也要做數(shù)據(jù)標(biāo)注的端到端時(shí)代,視頻訓(xùn)練片段的數(shù)據(jù)標(biāo)注工作大大增加了。
這就意味著,端到端視頻訓(xùn)練片段的數(shù)據(jù)標(biāo)注工作量非常巨大。
特斯拉買英偉達(dá)H100做訓(xùn)練,自家的Dojo做推理,玩的那叫一個(gè)溜!
而本土車企不只是訓(xùn)練算力不足,捉襟見(jiàn)肘的推理算力更是被端到端需要的海量數(shù)據(jù)標(biāo)注工作打了個(gè)措手不及!
03
最近大火的《黑神話 悟空》告訴我們一個(gè)深刻的道理;人生在世,最可怕的就是執(zhí)念。
自動(dòng)駕駛領(lǐng)域就有一撥人,始終心懷消滅激光雷達(dá)的執(zhí)念。
他們始終認(rèn)為,隨著視覺(jué)神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)的增加、參數(shù)的加大、模型的優(yōu)化,最終可以消滅激光雷達(dá)。
端到端方案出現(xiàn)之后,由于消除了大量的冗余模塊,實(shí)現(xiàn)了計(jì)算資源的集約化使用,端到端自動(dòng)駕駛系統(tǒng)的參數(shù)量得以翻番。
視覺(jué)神經(jīng)網(wǎng)絡(luò)能力迎來(lái)大幅度提升,他們更是覺(jué)得拿到了尚方寶劍,認(rèn)為攝像頭可以將激光雷達(dá)斬于馬下了。
其實(shí),端到端和純視覺(jué)與多傳感器融合之爭(zhēng)沒(méi)有什么關(guān)聯(lián)關(guān)系,即便是傳統(tǒng)的分模塊方案,拿掉激光雷達(dá)后,也可以拿節(jié)省下來(lái)的計(jì)算資源提高視覺(jué)神經(jīng)網(wǎng)絡(luò)的參數(shù)量和性能上限。
之所以說(shuō)端到端不排斥激光雷達(dá),落腳點(diǎn)還是在安全上面。
激光雷達(dá)可以提供感知冗余,提升自動(dòng)駕駛系統(tǒng)的安全,傳統(tǒng)端到端方案中的規(guī)劃控制網(wǎng)絡(luò)也需要規(guī)則兜底,來(lái)彌補(bǔ)安全下限低的缺點(diǎn)。
一個(gè)是感知冗余,一個(gè)是規(guī)控冗余,想一想,這里面是不是有個(gè)大哥不說(shuō)二哥的道理。
技術(shù)的發(fā)展存在蹺蹺板效應(yīng),上限高固然是端到端方案的優(yōu)點(diǎn),下限低也是它的缺點(diǎn)。
正如Mobileye揭示的那樣,端到端方案在常規(guī)場(chǎng)景下具備更加優(yōu)雅不慫、淡定從容的駕駛風(fēng)格,可以實(shí)現(xiàn)更加舒適的駕駛體驗(yàn),但在非常規(guī)場(chǎng)景下,這種優(yōu)雅不慫很可能轉(zhuǎn)成急躁冒動(dòng),帶來(lái)安全風(fēng)險(xiǎn)。
華為在它的分段式端到端網(wǎng)絡(luò)中,加入了與其PDP預(yù)測(cè)決策規(guī)劃網(wǎng)絡(luò)并行的本能安全網(wǎng)絡(luò),很好地詮釋了“安全就是最大的豪華”的理念。
比亞迪也在它的分段式端到端方案BAS3.0中加入了類人類安全網(wǎng)絡(luò),端到端負(fù)責(zé)詩(shī)與遠(yuǎn)方,類人類安全網(wǎng)提供安全兜底保障。
如果說(shuō)數(shù)據(jù)訓(xùn)練和標(biāo)注工作量巨大是甜蜜的煩惱的話,安全下限低便是端到端真正的缺點(diǎn)了。
在更好的訓(xùn)練范式出現(xiàn)之前,以規(guī)則代碼或安全網(wǎng)絡(luò)兜底是不可避免的中間階段,某些車企的OneModel端到端聽(tīng)聽(tīng)就得了,切莫當(dāng)真!