モービルアイ ー エンドツーエンド(E to E)は万能ではない!
AV開発では、従来はカメラなどが認識した物体のラベリングとマップとの照合、レーンの把握や運動体の位置予測、自車の走行軌跡プランニングなどの行程に分けてアルゴリズムを組む方法でした。
これが、画像の入力をニューラルネットワークが機械学習・深層学習して次の運転操作をアウトプットするE to Eのトランスフォーマーに取って代わられつつあるわけですが、そんな魔法の玉手箱のようなことができてしまうのか、と理系に弱い筆者などは首を傾げてしまいます。ましてやこの魔法は、あらゆる運転状況の理解や操作判断を生成AIと同様にテキスト(言語)を介して行なっているというのは、正直驚き以外の何者でもありません。
ところで、今回のCESで生成AIやE to Eのトランスフォーマーが万能ではないと主張していたのが、ADAS(先進運転支援システム)の老舗であるイスラエルのテック企業モービルアイです。同社の創業者でありCEOのアムノン・シャシュア氏は8日の講演で、E to Eで動画を読み込ませて学習させると、「日常的だが間違っている動作(common yet incorrect)」をそのまま学習してしまうリスクがあると指摘しました。
例えば、停止するときに何度もブレーキングしてローリングストップする人間の運転癖や、急な割り込みといった操作です。また、いわゆる滅多に起こらないエッジケース、ロングテールと言われる希少な状況に対応できない可能性があります。
例えば、2本のタイヤが同時にパンクするという場面は、「想定しうるリスク(reasonable risk)」だが、赤ちゃんが高速道路に横たわっているという状況は「想定し難いリスク(unreasonable risk)」であり、これをE to Eで学習することは困難だとシャシュア氏は言います。
大人が酔っ払って道で寝てしまい轢かれてしまう事故は稀ではありませんが、高速道路を想定した場合、そこに横たわっている物体が赤ちゃんであることは、20世紀100年間を通しても多分例がないだろうと同氏は言います。そのようなエッジケースにも対応して、より完全な自動運転に到達するにはE to Eのみではダメで、別途学習が必要になります。トランフォーマーが対応に苦慮する「想定し難いリスク」を定義し、システムを教育する手法を組み合わる「複合AI(Compound AI)」をモービルアイは採用するというわけです。
さらに、夜間でも遠くまで検知できるイメージレーダーやライダー(LiDAR)といったセンサー類のモーダル化、認識システムの冗長性(モービルアイの場合は、プライマリー(P)、ガーディアン(G)、フォールバック(F)の3種類を用意)が安全性(precision)を100%に近づけるには不可欠であるとシャシュア氏は言います。(後編へ続く)
●著者プロフィール
丸田 靖生(まるた やすお)1960年山口県生まれ。京都大学卒業後、東洋工業(現マツダ)入社。海外広報課、北米マツダ(デトロイト事務所)駐在をへて、1996年に日本ゼネラルモーターズに転じ、サターンやオペルの広報・マーケティングに携わる。2004年から2021年まで、フォルクスワーゲングループジャパン、アウディジャパンの広報責任者を歴任。現在、広報・コミュニケーションコンサルタントとして活動中。著書に「広報の極意−混迷の時代にこそ広報が活躍できる」(2022年ヴイツーソリューション)がある。