電子情報通信学会ITS研究会で1件発表

2026年3月3日に、中部国際空港・セントレア会議室で開催される、電子情報通信学会ITS研究会で、下記の発表を行います。
本研究では、視覚言語モデル(VLM)であるLLaVA-1.5-7Bが実際の運転場面においてどのように運転助言を生成するかを、統計的手法を用いて定量的に分析しています。
分析には、米国の大規模自然運転データセットSHRP2から抽出した危険予兆場面983フレームを使用し、状況認識(Stage A)と運転助言生成(Stage B)の二段階に分けてモデルの判断過程を詳しく調べています。
その結果、LLaVAの運転助言は自身の状況認識と高い一貫性を持つ一方で、他車のブレーキランプなど視覚的に目立つ合図に強く依存する「顕著性バイアス(saliency bias)」を持つことが明らかになりました。このバイアスにより、複数車両が絡む複雑な場面や車線変更を伴う状況では助言の品質が体系的に低下することが確認されています。
本研究の成果は、VLMを用いた運転支援システムの信頼性向上に向けた課題を定量的に示しており、今後の安全なAI運転支援技術の設計に重要な知見を提供するものです。
大規模視覚言語モデルLLaVAの運転助言能力に関する定量的分析 ~ 実環境における自然運転データを用いた評価 ~ Conference 電子情報通信学会ITS研究会, vol. 125, no. 380, 2026.


