国产无码免费,人妻口爆,国产V在线,99中文精品7,国产成人无码AA精品一,制度丝袜诱惑av,久久99免费麻辣视频,蜜臀久久99精品久久久久久酒店
        訂閱
        糾錯
        加入自媒體

        IJCA2019公開協調ADAS新方法:隨機對抗性模仿學習

        2019-05-18 09:20
        智車科技IV
        關注


        最小二乘損失函數(3)對決策邊界兩側遠離標準軌跡的采樣軌跡進行懲罰。

        該方法可以用公式(4)表示。

        公式(5)表示對抗模仿學習與隨機對抗模仿學習RAIL的隨機參數空間搜索之間的關系。

        圖3中實驗的目的是為了展示樣品的效率。為了評估效率,實驗考慮了平均車速、換道次數、超車次數、縱向獎勵和橫向獎勵,如圖3和圖4所示。

        由表1可以看出,兩層政策的平均車速和平均超車統計量最高,分別為70.38km/h和45.04。這是因為基于蓋爾的框架和基于與環境交互的策略優化,經過訓練的策略有時可以獲得比專業人類駕駛員更高的性能。另一方面,單層策略的性能提高了90%。這是因為單層不足以正確處理高維觀測。上述,BC試圖將專業演示過程中的1步偏差誤差最小化。因此,由于訓練和測試之間的分布不匹配,單層策略表現出不理想的性能。

        在圖4中,使用縱向補償來分析環境補償。縱向補償與速度成正比;因此,歸一化結果與圖3a所示的平均速度相同。為了評估行動決策的敏感性,使用了橫向補償。在變道完成之前,車輛可以根據觀察改變決策。由于換道過程中橫向獎勵是連續發生的,因此在換道過程中頻繁的換道會導致換道過程中獎勵的減少。在圖4b中,兩層策略在最后一種情況下獲得了較大的橫向獎勵。然而,兩層策略比專家策略顯示了更多的車道變化。這是因為兩層策略不太可能在操作期間更改決策。另一方面,單層策略比專家策略更能顯示頻繁的換道。因為單層策略經常更改其決策,單層策略獲得最小的橫向補償。BC表示換道次數最少。然而,經過培訓的策略比RAIL培訓的單層策略獲得了更大的回報。變道數量明顯小于單層策略;從而使訓練后的策略比單層策略獲得更大的橫向回報。

        通過圖3c的實驗,模擬專家論證,測量合適的決策。為了獲得與專家相似的超車次數,仿真過程中的換道點和決策應與專家相似。在圖3c中,兩層策略相比之下,顯示了預期的性能。此外,決策點和操作與專家相似。然而,單層策略比專家策略顯示的接管數量要少。這是因為平均速度較低,并且根據觀察做出了不合適的換道決定。

        綜上所述,驗證了RAIL方法提高了平均速度,減少了不必要的變道次數。這就意味著RAIL方法政策方向是正確的。實驗結果表明,兩層策略取得了與駕駛專家相似的性能。

        <上一頁  1  2  
        聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

        發表評論

        0條評論,0人參與

        請輸入評論內容...

        請輸入評論/評論長度6~500個字

        您提交的評論過于頻繁,請輸入驗證碼繼續

        暫無評論

        暫無評論

          人工智能 獵頭職位 更多
          掃碼關注公眾號
          OFweek人工智能網
          獲取更多精彩內容
          文章糾錯
          x
          *文字標題:
          *糾錯內容:
          聯系郵箱:
          *驗 證 碼:

          粵公網安備 44030502002758號

          主站蜘蛛池模板: 庆阳市| A片网| 人人干干| 风流老熟女一区二区三区| 51久久| 三级片久久| 泾川县| 熟女视频在线观看| 好色综合| 成人国产综合| 麻豆熟妇乱妇熟色A片在线看| 久久99人妻无码精品一区| 国精产品一区一区二区三区mba| 午夜三级福利| 人妖TS丝袜脚交| 象州县| 91在线观看| 石榴AV| 3P免费视频| 普兰店市| 国产天天操| 奉贤区| 中文字幕人妻综合另类| 亚欧女AV| 国产亚洲av| 亚洲av综合网| 66精品人妻| 汉川市| 丝袜制服无码国产| 蜜桃久久久| 1024国产基地| 男同色色| 漳浦县| 天堂无码在线| 国产精品18| 扬中市| 天天综合久久| 91视频在线观看18| 丰满熟妇高潮一二三区| 91在线视频观看| 久久国产劲爆∧v内射|