دید کلی
تخمین عمق از تصاویر RGB دید از جلو در وسایل نقلیه خودران یک امر مهم و بحرانی است که اهمیت فراوانی در افزایش ایمنی و کارایی در فناوری خودرانی دارد. توانایی درک دقیق ساختار سهبعدی محیط اطراف، وسایل نقلیه را قادر میسازد تا تصمیمات آگاهانه بگیرند، در مواجهه با حالات پیچیده جاده بهینه عمل کنند و ایمنی مسافران و عابران پیاده را تضمین کنند.
این امر به عنوان یکی از موارد مهم به کارکردهای مختلف وسیله نقلیه خودران، شامل جلوگیری از برخورد، برنامهریزی مسیر و شناسایی اشیاء، میپردازد. با تجزیه و تحلیل عمق از دوربینهای روبرو، وسایل نقلیه میتوانند به دقت فواصل را اندازهگیری کنند، موانع را پیشبینی کنند و طرح فضایی اطراف را به صورت بلادرنگ استخراج کنند.
اما با وجود پیشرفتهای قابل توجه، چالشهایی در تخمین دقیق عمق از تصاویر RGB باقی مانده است. تنوع و پیچیدگی حالات واقعی، تغییرات در شرایط نورپردازی و نیاز به درک دقیق عمق در فواصل مختلف، موانع مهمی را ایجاد میکنند. برای حل این چالشها و گسترش حدود تخمین عمق در وسایل نقلیه خودران، مجموعه داده ای جدیدی بهطور خاص برای این هدف تدارک دیده شده است.
مجموعه داده مورد استفاده برای چالش تخمین عمق، با استفاده از شبیهساز CARLA تولید شده است که بهطور دقیق طراحی شده است تا حالات رانندگی واقعی با آرایهای گسترده از شرایط را شبیهسازی کند. این شبیهساز نیز به شرایط جوی متفاوت، حالات نورپردازی و زمینشناسی مختلف توجه دارد. هدف از این کار، چالش مدلهای تخمین عمق موجود را با ارائه آنها با آرایهای جامع از حالاتی که پیچیدگیهای محیطهای واقعی رانندگی را تقلید میکنند، است.
هدف اصلی این مجموعه داده سفارشی، تشویق نوآوری و پیشرفت در الگوریتمهای تخمین عمق بهطور خاص برای وسایل نقلیه خودران است. با بهرهگیری از این مجموعه داده، پژوهشگران و توسعهدهندگان میتوانند از پایداری، دقت و قابلیتهای عمومی مدل های خود را در یک محیط گستردهتر و چالش برانگیز آزمایش کنند.
چالش ارائه شده توسط این مجموعه داده ، شرکتکنندگان را به بررسی رویکردهای نوآورانه ترغیب میکند که میتوانند از تکنیک های به روز بینایی کامپیوتر، یادگیری ماشین و شبکههای عصبی عمیق بهرهمند شوند تا مدلی با بهترین دقت ممکن را توسعه دهند. هدف از این چالش، ارزیابی نه تنها دقت پیشبینی عمق بلکه همچنین قابلیت تطبیق مدلها در حالتهای متنوع واقعی، و در نهایت گسترش حدود آنچه که در تخمین عمق از تصاویر RGB دید از جلو برای وسایل نقلیه خودران قابل دستیابی است، می باشد.
چالش
دیتاست
مجموعه داده ارائه شده شامل تصاویر RGB دید از جلو همراه با تخمینهای عمق به عنوان اهداف است. این حالات شامل یک طیف گسترده از محیطهای شبیهسازی شده است که برای وسایل نقلیه خودران بسیار حیاتی هستند، از جمله خیابانهای شهری، جادههای بزرگراهی، جادههای روستایی، شرایط آب و هوایی نامساعد و موارد دیگر. هدف این مجموعه داده، شبیهسازی چالشهای واقعی در حالتهای متنوع رانندگی است.
دامنه چالش
شرکتکنندگان دعوت شدهاند تا مدلهایی را که قادر به تولید ماتریسهای دقیق عمق به طور کامل بر اساس تصویر RGB ورودی هستند، ارسال کنند. مخزن GitHub شامل کدهای اساسی برای هم آموزش و هم آزمایش است که به عنوان یک نقطه شروع برای شرکتکنندگان عمل میکند.
معیارهای ارزیابی
مدلهای ارسال شده بر اساس معیارهای مختلفی ارزیابی جامع میشوند:
- خطای مطلق میانگین (MAE)
- ریشه میانگین مربعات خطا (RMSE)
- خطای نسبی مطلق (AbsRel)
- امتیاز F
- دقت
- کاملیت
- امتیاز F برای بازسازی نقطهای
برندگان بر اساس عملکرد مدلهایشان با توجه به معیار ارزیابی انتخاب خواهند شد. علاوه بر این، تیم هایی که عملکرد برتری داشته باشند، تحسین خواهند شد.
توسعه
این چالش یک طیف گستردهتری از روشها را فراتر از مدلهای خودنظارتی شامل میشود. شرکتکنندگان میتوانند رویکردهای نظارتشده، نظارتشده به طور ضعیف، چند وظیفهای و سایر روشهای نوآورانه را بررسی کنند. شرط اصلی این است که مدلها باید با استفاده تنها از یک تصویر ورودی، پیشبینی نقشه عمق نهایی را ایجاد کنند.
آخرین مهلت ارسال مقالات:
1402/11/04اعلام نتایج داوري مقالات:
1402/11/26انتشار نسخه نهایی:
1402/12/01روزهای برگزاری کنفرانس:
1402/12/161402/12/17
دبیرخانه سیزدهمین کنفرانس ملی و سومین کنفرانس بینالمللی بینایی ماشین و پردازش تصویر ایران: کرج دانشگاه خوارزمی، دانشکده فنی و مهندسی، معاونت پژوهشی دانشکده فنی و مهندسی
مسئول دبیرخانه: آقای مهندس هیوا سلکی
تلفن: (2612) 02634579600 تلفن دبیرخانه: (2612) 02634579600
پست الکترونیکی: mvip2024@khu.ac.ir وب سایت : https://mvip2024.khu.ac.ir/