发文章
发文工具
撰写
网文摘手
文档
视频
思维导图
随笔
相册
原创同步助手
其他工具
图片转文字
文件清理
AI助手
留言交流
选自 arXiv
声音在物体定位中会起到非常重要的作用,人们甚至可以利用自身对声音的感知来定位视线范围内的物体。在本文中,来自 MIT 计算机科学与人工智能实验室、MIT-IBM 沃森人工智能实验室团队的研究者提出了一套利用无标记的视听数据来自监督学习的算法,仅依靠立体音频和摄像机元数据就可以在视觉参考坐标系中定位移动的车辆。
论文:https:///pdf/1910.11760.pdf
项目链接:http://sound-track.csail./
来自: 西北望msm66g9f > 《培训》
0条评论
发表
请遵守用户 评论公约
从视音角度看多模态学习的过去与未来
视音模态的一致性不仅为多模态识别任务提供了基础,还使得用借助某一模态增强另一模态信号成为可能。图2:视音提升任务4跨模态感知。认...
机器视觉之外,机器人的感知补全计划
机器视觉之外,机器人的感知补全计划。围绕机器触觉,机器人可以实现灵活的物体感知、抓握推举等各种动作。现在除了在我们熟知的机器视...
【泡泡图灵智库】看听:多模态融合机器人场景辨识
【泡泡图灵智库】看听:多模态融合机器人场景辨识。(2) 通过对视觉数据的训练,对VGG16模型进行有监督的转移学习,再加上工程化的一系...
【智能座舱】智能座舱中多模态交互设计
【智能座舱】智能座舱中多模态交互设计。什么是智能座舱与多模态交互。目前智能座舱的模态包括视觉、听觉、触觉、嗅觉,对应的模态在智...
分割一切模型SAM首篇全面综述:28页、200 篇参考文献
SAM 模型概览。此外参考文献 [143] 利用现有遥感目标检测数据集和以数据为中心的机器学习模型 SAM,构建了一个大规模遥感图像分割数据集...
模型的跨界:我拿Transformer去做目标检测,结果发现效果不错
模型的跨界:我拿Transformer去做目标检测,结果发现效果不错。具体来说,研究者在 COCO 目标检测数据集上将 DETR 与 Faster R-CNN 基线...
听觉记忆不如视觉和触觉记忆牢固
据美国《大西洋月刊》报道,我们都会遇到这样的情况,当别人口头上告诉我们一件事时,我们经常会忘得一干二净。与此同时,对听觉、触觉...
知荐 | 自动驾驶中的感知定位优化策略(二)
基于视觉传感器运动估计定位策略基于视觉方案的传感器定位策略主要是利用摄像头搭载到车辆前端或侧端检测环境信息,以便计算车辆运动。...
基于环视相机的视觉SLAM在自动泊车系统上的应用
准确的区域地图将有助于自动泊车,以更有效地泊车,这可以通过视觉SLAM方法实现,该方法构建泊车区地图,后期可用于重定位。在本文中,...
微信扫码,在手机上查看选中内容