会议论文(已发布)

米兰体育官网 综合数据和 W-Net 架构的深度和语义分割

详情

引用

Swingler K、Rumble T、Goutcher R、Hibbard P、Donoghue M 和 Harvey D (2024) 综合数据和 W-Net 架构的深度和语义分割。见:第 1 卷。第 16 届神经计算理论与应用国际会议,葡萄牙波尔图,2024 年 11 月 20 日至 2024 年 11 月 22 日。 SCITEPRESS - 科学技术出版物,第 413-422 页。 https://doi.org/10.5220/0012877500003837

摘要
单目像素级深度估计需要一种算法来标记图像中的每个像素及其距相机的估计距离。这项任务比双目深度估计更具挑战性,双目深度估计使用两个相距较小距离的相机。将深度估计与像素级语义分割相结合的算法显示出改进的性能,但提出了需要在像素级使用类标签和深度值进行注释的数据集的实际挑战。本文提出了一种新的卷积神经网络架构,能够同时进行单目深度估计和语义分割,并展示了如何使用计算机游戏技术生成的合成数据来训练此类模型。该算法在分割任务上的准确率超过 98%,在深度估计任务上的准确率超过 88%。

状态已发布
资助者国防科技实验室
发布日期30/11/2024
在线发布日期30/11/2024
网址http://hdl.handle.net/1893/36844
发布商SCITEPRESS - 科学技术出版物
ISBN9789897587214
会议第十六届神经计算理论与应用国际会议
会议地点葡萄牙波尔图
日期

人 (5)

马克·多诺霍博士

马克·多诺霍博士

技术专家(认知)(FNS),心理学

罗斯·古彻博士

罗斯·古彻博士

心理学副教授

丹·哈维先生

丹·哈维先生

心理学研究员

保罗·希巴德教授

保罗·希巴德教授

心理学教授,心理学

凯文·斯温格勒教授

凯文·斯温格勒教授

计算机科学教授

文件 (1)