4月11日,技術(shù)氛圍拉滿的第八屆HAOMO AI DAY如約而至。
(相關(guān)資料圖)
這次,毫末發(fā)布業(yè)了內(nèi)首個(gè)自動(dòng)駕駛生成式大模型DriveGPT,并把它命名為雪湖·海若。同時(shí),毫末宣布推出的重感知、不依賴高精地圖的城市NOH已開啟泛化測試,將最先落地北京、上海、保定等城市,2024年有序落地100城。商業(yè)化層面,毫末也獲得了3家車企的定點(diǎn)合同。
拿下三大主機(jī)廠定點(diǎn)合同
現(xiàn)階段對高階智能駕駛企業(yè)而言,最重要的就是商業(yè)落地能力,只有商業(yè)化閉環(huán)完成,才能帶來源源不斷的海量數(shù)據(jù)加以訓(xùn)練和不斷迭代。
這一點(diǎn)上,毫末智行董事長張凱深有感觸,張凱表示,2023年是非常關(guān)鍵的一年。城市導(dǎo)航輔助進(jìn)入到真實(shí)用戶覆蓋和多城市落地的比拼。乘用車行泊一體將迎來前裝量產(chǎn)潮,末端物流自動(dòng)配送車在商超、快遞等場景迎來爆發(fā),2023年將在這些場景實(shí)現(xiàn)可持續(xù)商業(yè)化閉環(huán)。
在行業(yè)全面發(fā)力、更多產(chǎn)品落地的背景下,毫末HPilot整體已搭載近20款車型。用戶輔助駕駛行駛里程突破4000萬公里。首款搭載HPilot3.0的新 摩卡DHT-PHEV( 參數(shù)丨 圖片)即將重磅上市,第二款搭載毫末HPilot3.0的車型魏牌藍(lán)山也將在今年發(fā)布。
毫末自動(dòng)駕駛數(shù)據(jù)智能體系MANA的學(xué)習(xí)時(shí)長已經(jīng)超56萬小時(shí),相當(dāng)于人類司機(jī)6.8萬年。毫末DriveGPT雪湖·海若,已經(jīng)完成基于4000萬公里駕駛數(shù)據(jù)的訓(xùn)練,參數(shù)規(guī)模達(dá)1200億。
發(fā)布會(huì)上,張凱向外界公布了毫末6P開放合作的重要進(jìn)展,目前已與3家主機(jī)廠簽署定點(diǎn)合同,相關(guān)項(xiàng)目正在交付中。
毫末DriveGPT雪湖·海若發(fā)布 參數(shù)規(guī)模1200億
發(fā)布會(huì)上,毫末智行CEO顧維灝向外界講解了毫末自動(dòng)駕駛生成式大模型DriveGPT雪湖·海若,并做了部分展示。
顧維灝表示,毫末DriveGPT雪湖·海若通過引入駕駛數(shù)據(jù)建立RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù),對自動(dòng)駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化。它的最終目標(biāo)是實(shí)現(xiàn)端到端自動(dòng)駕駛。
“現(xiàn)階段DriveGPT主要用于解決自動(dòng)駕駛的認(rèn)知決策問題,參數(shù)規(guī)模達(dá)已經(jīng)達(dá)到1200億,預(yù)訓(xùn)練階段引入4000萬公里量產(chǎn)車駕駛數(shù)據(jù),RLHF階段引入5萬段人工精選的困難場景接管Clips。”
顧維灝進(jìn)一步介紹到,DriveGPT雪湖·海若的底層模型采用GPT生成式預(yù)訓(xùn)練大模型,與ChatGPT使用自然語言進(jìn)行輸入與輸出不同,DriveGPT輸入是感知融合后的文本序列,輸出是自動(dòng)駕駛場景文本序列,即將自動(dòng)駕駛場景Token化,形成“Drive Language”,最終完成自車的決策規(guī)控、障礙物預(yù)測以及決策邏輯鏈的輸出等任務(wù)。
具體到實(shí)現(xiàn)過程,DriveGPT雪湖·海若在預(yù)訓(xùn)練階段通過引入量產(chǎn)駕駛數(shù)據(jù),訓(xùn)練初始模型,再通過引入駕駛接管Clips數(shù)據(jù)完成反饋模型(Reward Model)的訓(xùn)練,然后再通過強(qiáng)化學(xué)習(xí)的方式,使用反饋模型去不斷優(yōu)化迭代初始模型,形成對自動(dòng)駕駛認(rèn)知決策模型的持續(xù)優(yōu)化。
同時(shí),DriveGPT雪湖·海若還會(huì)根據(jù)輸入端的提示語以及毫末CSS自動(dòng)駕駛場景庫的決策樣本去訓(xùn)練模型,讓模型學(xué)習(xí)推理關(guān)系,從而將完整駕駛策略拆分為自動(dòng)駕駛場景的動(dòng)態(tài)識(shí)別過程,完成可理解、可解釋的推理邏輯鏈生成。
發(fā)布會(huì)現(xiàn)場,毫末宣布DriveGPT雪湖·海若首發(fā)車型是新摩卡DHT-PHEV,即將量產(chǎn)上市。
顧維灝表示,有了DriveGPT雪湖·海若的加持,車輛行駛會(huì)更安全,動(dòng)作更人性、更絲滑,并有合理的邏輯告訴駕駛者,車輛為何選擇這樣的決策動(dòng)作。對于普通用戶來說,車輛越來越像老司機(jī),用戶對智能產(chǎn)品的信任感會(huì)更強(qiáng),理解到車輛的行為都是可預(yù)期、可理解的。
目前,毫末DriveGPT雪湖·海若已正式對外開放,開啟對限量首批客戶的合作,北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院、高通、火山引擎、華為云、京東科技、四維圖新、魏牌新能源、英特爾等已經(jīng)加入。
單幀圖片標(biāo)注成本降到0.5元
具體到應(yīng)有場景,毫末DriveGPT雪湖·海若會(huì)先探索四大能力,智能駕駛、駕駛場景識(shí)別、駕駛行為驗(yàn)證、困難場景脫困。
當(dāng)前,毫末在使用數(shù)據(jù)過程中,逐步建立起一套基于4D Clips駕駛場景識(shí)別方案,具備極高性價(jià)比。在行業(yè)上,給出正確的標(biāo)注結(jié)果,一張圖片需要約5元;如果使用DriveGPT雪湖·海若的場景識(shí)別服務(wù),一張圖片的價(jià)格將下降到0.5元。單幀圖片整體標(biāo)注成本僅相當(dāng)于行業(yè)的1/10。
顧維灝介紹,毫末在2023年1月發(fā)布的智算中心MANA OASIS(雪湖· 綠洲),算力優(yōu)化等層面升級(jí)了三大能力,進(jìn)一步支持DriveGPT雪湖·海若的算力。
毫末與火山引擎全新搭建了“全套大模型訓(xùn)練保障框架”,實(shí)現(xiàn)了異常任務(wù)分鐘級(jí)捕獲和恢復(fù)能力,可以保證千卡任務(wù)連續(xù)訓(xùn)練數(shù)個(gè)月沒有任何非正常中斷,有效保證了大模型訓(xùn)練穩(wěn)定性;
毫末研發(fā)出以真實(shí)數(shù)據(jù)回傳為核心的增量學(xué)習(xí)技術(shù),并將其推廣到了大模型訓(xùn)練,構(gòu)建了一個(gè)大模型持續(xù)學(xué)習(xí)系統(tǒng),自主研發(fā)任務(wù)級(jí)彈性伸縮調(diào)度器,分鐘級(jí)調(diào)度資源,集群計(jì)算資源利用率達(dá)到95%;
MANA OASIS通過提升數(shù)據(jù)吞吐量來降本增效,滿足Transformer大模型訓(xùn)練效率,通過引入火山引擎提供的Lego算子庫實(shí)現(xiàn)算子融合,端到端吞吐提升84%。
MANA架構(gòu)視覺感知再次升級(jí)
據(jù)顧維灝介紹,MANA的視覺感知能力持續(xù)提升,一方面可同時(shí)學(xué)習(xí)三維空間結(jié)構(gòu)和圖片紋理,并將純視覺測距精度超過了超聲波雷達(dá),BEV方案也擁有了更強(qiáng)的通用性和適配性;另一方面可實(shí)現(xiàn)單趟和多趟純視覺NeRF三維重建,道路場景更逼真,肉眼幾乎看不出差異。通過NeRF進(jìn)行場景重建后,可以編輯合成真實(shí)環(huán)境難以收集到的Corner Case。
基于更強(qiáng)的視覺感知能力,毫末也開始驗(yàn)證使用魚眼相機(jī)代替超聲波雷達(dá)進(jìn)行測距,以滿足泊車要求。
毫末把視覺BEV感知框架引入到了車端魚眼相機(jī),做到了在15米范圍內(nèi)達(dá)到30cm的測量精度,2米內(nèi)精度高于10cm的視覺精度效果。泊車場景使用純視覺測距來取代超聲波雷達(dá),將進(jìn)一步降低整體智駕成本。
這幾年高階智能駕駛在技術(shù)、政策、商業(yè)化上都取得了快速進(jìn)展,雖然毫末成立到現(xiàn)在還不足三年半,但其已經(jīng)舉辦了8屆AI DAY,每一次都會(huì)帶來高密度的技術(shù)輸出,這背后是毫末對技術(shù)的堅(jiān)定投入,是對AI改變?nèi)祟惓鲂械暮V定,也是對自動(dòng)駕駛行業(yè)的熱愛,毫末速度也早已經(jīng)成為汽車智能化產(chǎn)業(yè)賽道的一個(gè)樣板。
關(guān)鍵詞:
Copyright (C) 1999-20120 www.tvvgv780.cn, All Rights Reserved
版權(quán)所有 環(huán)球快報(bào)網(wǎng) | 京ICP備2022018928號(hào)-24聯(lián)系我們:315 541 185@qq.com