版權聲明:此文源自廠(chǎng)家供稿,如需轉載請尊重版權并保留出處。內容若存有質(zhì)量疑問(wèn)請立即與本網(wǎng)聯(lián)系,商用車(chē)之家將盡快處理并予以回應。
——歡迎到訪(fǎng)! 專(zhuān)業(yè)商用車(chē)網(wǎng)絡(luò )媒體 為您服務(wù)!
作為世界第一大商用車(chē)市場(chǎng),中國商用車(chē)市場(chǎng)正處于轉型升級的關(guān)鍵時(shí)期。近年來(lái),無(wú)論是相關(guān)政策法規的出臺,還是技術(shù)、方案的革新,商用車(chē)行業(yè)的發(fā)展始終圍繞著(zhù)保障安全和提高效率的核心主題。
10月28日,元橡科技CTO任杰出席商用車(chē)安全大講堂線(xiàn)上交流會(huì ),從綜合立體視覺(jué)解決方案價(jià)值亮點(diǎn)及未來(lái)啟發(fā)的角度,分享和探討高性?xún)r(jià)比商用車(chē)智駕系統研發(fā)量產(chǎn)實(shí)踐。(以下為部分交流內容整理。)
關(guān)于商用車(chē)的安全與效率,我們在關(guān)注什么?
相比于乘用車(chē)而言,商用車(chē)既作為一種交通運輸工具,也是我們日常經(jīng)濟活動(dòng)中重要的生產(chǎn)資料。提高商用車(chē)的安全與效率,具體來(lái)說(shuō),我們可以延展出一些關(guān)鍵詞,比如“節能環(huán)?!?、“物流與交通設計”、“智慧城市”……以及我們重點(diǎn)關(guān)注的“智能駕駛主動(dòng)安全”這一領(lǐng)域。
在商用車(chē)的營(yíng)運過(guò)程中,普遍存在的一些隱患和問(wèn)題包括:
l 司機易疲勞駕駛,工作環(huán)境惡劣
l 容易造成司機盲區,產(chǎn)生安全事故
l 商用車(chē)質(zhì)量慣性大,提速慢,司機駕駛習慣勻速,節省油耗
l 急剎車(chē)對商用車(chē)司機造成嚴重安全傷害
l ……
而現有的商用車(chē)智能駕駛系統仍存在著(zhù)較大的“漏報”和“誤報”的局限性?!奥﹫蟆币簿褪墙鼇?lái)常常見(jiàn)諸報端的一些事故,比如撞上前方側翻車(chē)輛等;“誤報”則是感知系統會(huì )把一些不存在或沒(méi)有風(fēng)險的目標錯誤地識別,例如把地面上的一些畫(huà)、幻影當成是真正的行人,從而產(chǎn)生了不必要的規避。
在漏報和誤報之間取得均衡,提升整個(gè)智能駕駛系統的上限,是業(yè)內孜孜不倦追求的一個(gè)目標,因為人類(lèi)社會(huì )駕駛場(chǎng)景里面還存在太多的長(cháng)尾效應,太多目前常規的系統還不能克服的一些困難。
漏報(撞上前方側翻車(chē)輛)丨來(lái)自互聯(lián)網(wǎng)公開(kāi)資料
誤報(道路平面上的虛假行人)丨來(lái)自互聯(lián)網(wǎng)公開(kāi)資料
從場(chǎng)景規模和難度上我們把智能駕駛系統分成幾大層次:
i. 其一就是規模小一點(diǎn)、難度也低一點(diǎn)的封閉場(chǎng)景,比如港口、礦區無(wú)人駕駛;
ii. 再往前,我們現在有很多物流企業(yè),包括乘用車(chē)也已經(jīng)在推進(jìn)高速場(chǎng)景的NOA等等,當然,這種智能駕駛系統里也都存在著(zhù)上述所提到的一些局限性;
iii. 而到最后,我們真正希望推動(dòng)的是在人類(lèi)社會(huì )生活中更主要的一些場(chǎng)景,比如城市道路上,是不是能夠有更好的系統去輔助人類(lèi)司機,替代人類(lèi)去完成一些艱苦的工作。這就要求系統具備強大的理解場(chǎng)景的能力和細節把握的能力,要求系統感知的信息足夠稠密和高效。
這是智能駕駛發(fā)展和演進(jìn)的趨勢,而為了更好地解決當前智能駕駛的局限,面向未來(lái)更高階的智能駕駛發(fā)展趨勢,元橡科技始終專(zhuān)注推動(dòng)“綜合立體視覺(jué)”解決方案。
為什么是綜合立體視覺(jué)解決方案?
雙目立體視覺(jué)是人眼仿生學(xué),它基于三角測量原理,通過(guò)視差和距離之間的反比關(guān)系,對周?chē)h(huán)境能得到一個(gè)三維的感知。而我們提出的“綜合立體視覺(jué)”的概念,在雙目相機感知傳感器的基礎上,還要配合大腦中樞,把立體視覺(jué)和AI充分結合起來(lái),去達到一種高效能的感知和處理能力。
元橡科技雙目立體視覺(jué)的特點(diǎn):低成本&高性能
l 深度圖與RGB圖天然對齊
l 立體信息可識別對象,降低對樣本量和硬件算力要求
l 全類(lèi)型對象檢測,降低長(cháng)尾效應風(fēng)險
l 局部可見(jiàn)障礙物、模糊目標均能測量
l 百米檢測誤差小于5%,不依賴(lài)地面
l 拓展性強,如限高、限寬、地形檢測
l 圖像分辨率提高,小目標識別性能倍增,算力基本增加不大
和目前大家比較熟知的一些傳感器(激光雷達、4D毫米波等)對比,元橡雙目相機的立體視覺(jué)成像所包含信息的豐富程度是非常高的,我們常說(shuō)一圖勝千言,這是雙目相機非常擅長(cháng)并且應該發(fā)揮作用的地方,而從精準度上來(lái)講,雙目立體視覺(jué)測距性能已經(jīng)非??焖俚乇平す饫走_的性能。
高性?xún)r(jià)比的優(yōu)勢,決定了雙目立體視覺(jué)系統成為實(shí)現商用車(chē)安全與效率平衡的可行性方案。
元橡自研的Deep Fusion架構很大程度上提高了系統魯棒性和安全閉環(huán)保障。Deep Fusion框架融合視差和AI能力,可以實(shí)現目標類(lèi)型的“N+1”,真正做到全類(lèi)型障礙物檢測,大大降低長(cháng)尾效應的影響。
Deep Fusion特點(diǎn):
l 有效結合圖像與視差信息,準確描述障礙物3D屬性
l 較低的算力需求下實(shí)現更遠的檢測能力
l 全類(lèi)型障礙物的檢出能力
l 提升融合毫米波能力:融合需要的目標空間位置和類(lèi)別屬性同時(shí)具備
其中“N+1”目標類(lèi)型,“N”指車(chē)輛、行人、自行車(chē)、交通標識等指定多類(lèi)型檢測目標,通常用AI語(yǔ)義處理分析,而“1”則是指一些通用障礙物,比如樹(shù)叢、柵欄,以及路面施工鐵板等不知道什么時(shí)候出現的未知類(lèi)型。對于這些,我們人類(lèi)有很好的感知和避障能力,但目前的很多系統,尤其是單目系統,就很難去很好地識別。
元橡綜合立體視覺(jué)解決方案
所以這也就是我們?yōu)槭裁聪Mo業(yè)界推薦綜合立體視覺(jué)解決方案,因為我們看到了在這些方面上,我們提出的“N+1”完備目標檢測新范式具有更好的泛化性、通用性,可以應用到更多的實(shí)際場(chǎng)景。比如商用車(chē)的限高,車(chē)身較高的商用車(chē)在通過(guò)一些橋梁、山區涵洞的時(shí)候如果發(fā)生刮蹭,帶來(lái)的經(jīng)濟損失是非常大的,通過(guò)雙目相機可以去做高度可通過(guò)性的檢測,相類(lèi)似的還有通過(guò)狹窄通道時(shí)的限寬預警等。立體視覺(jué)技術(shù)在諸如此類(lèi)的場(chǎng)景需求上已經(jīng)有了一些很好的應用,落地之后也得到了比較好的反饋。通過(guò)提前給到司機輔助性的信息和警告,可以有效避免一些刮蹭事故和經(jīng)濟損失。
高性?xún)r(jià)比商用智能駕駛的未來(lái)啟發(fā)
首先,目前在乘用車(chē)上有兩方面很強烈的趨勢,一是高分辨率,二是大角度周身環(huán)繞。我們認為,未來(lái)在乘用車(chē)先行的技術(shù)帶動(dòng)下,商用車(chē)也會(huì )往這個(gè)趨勢去應用和發(fā)展。
目前可能1M、2M的分辨率是主流,后期分辨率會(huì )變得越來(lái)越高?,F在乘用車(chē)有很多新的旗艦車(chē)型開(kāi)始上8M的前視,甚至是周視的設備,在周視環(huán)繞感知的傳感器方案里,視覺(jué)是起到非常大的作用的。如果我們把車(chē)看成是泛機器人,有了比較好的感知傳感器,它就有了很好的視野、觸覺(jué)等感官,這樣它就可以更智能地去做一些決策和判斷,來(lái)更安全、快速、高效地完成運輸任務(wù)。
而從今年特斯拉的AI Day展示的Tesla Occupancy Networks看,它基于車(chē)身一圈的傳感器,通過(guò)占有網(wǎng)格的神經(jīng)網(wǎng)絡(luò )和大量的數據訓練而得到一種相對比較直觀(guān)的視覺(jué)效果。其實(shí)類(lèi)似的這種三維感知的能力元橡很早之前也就能做到了,我們并不需要那么多復雜的傳感器陣列,只是通過(guò)簡(jiǎn)單的雙目立體視覺(jué),同時(shí)也不需要那么大量的數據積累和數據閉環(huán)訓練、標注維護。在三維環(huán)境感知方面,立體視覺(jué)的空間表達更精細,顆粒度更細,精準度也更好,這也是立體視覺(jué)高性?xún)r(jià)比和高性能的體現。
Tesla Occupancy Networks丨來(lái)自互聯(lián)網(wǎng)公開(kāi)資料
元橡高性?xún)r(jià)比的“Occupancy grid map”空間表達
高分辨率視覺(jué)傳感器、大角度視場(chǎng)角(FOV)以及周身環(huán)繞感知能力將成為未來(lái)商用車(chē)智能駕駛系統的重中之重,是我們對于未來(lái)工作的展望和啟發(fā)。
總體來(lái)講,對于商用車(chē)發(fā)展的思考,我們始終認為是“安全第一”,在保障社會(huì )運轉和人身安全的基礎之上,再去提高運輸效率,通過(guò)科技賦能,輔助司機改善工作環(huán)境,減輕勞動(dòng)強度,規避分心和盲區等因素導致的安全隱患。元橡科技將致力于綜合立體視覺(jué)解決方案,從更好的感知出發(fā),實(shí)現更好的決策,更好的執行,最終得到更好的安全和效率。