3DV 2017国际会议第二日回顾

2017-10-11 19:56:04.0

20171011日上午9003DV国际会议正式迈入了第二天的日程。3DV前两日汇聚了多位特邀专家报告、口头报告和短报告、海报、厂商展览等精彩内容,现在让我们一起回顾这些精彩记录吧。


特邀专家报告

高文:Online visual processing for 3D reconstruction, SLAM, and object recognition

中国工程院院士、北京大学教授高文老师给我们带来关于视觉处理、三维重建以及移动搜索方面的讲座。首先,高文老师介绍了视觉处理中如何计算特征点。传统方法就是用引用过万的SIFT特征,特征选择和聚合也可以极大提高准确率,特征经过压缩后可以减少很多存储。



随后高文老师介绍了他们的MPEG压缩算法的相关工作。MPEG也可以用于点云压缩。之后高老师讲述了用深度学习与传统算法结合的方法,提高了搜索准确率。之后,高老师给我们介绍了SLAM(及时定位与地图构建)方面的相关工作。

SLAM有许多挑战包括实时高精度的要求以及缺乏特征的场景等。高老师团队提出的USB特征有着更快更精确的特点。最后,高老师介绍了三维重建方面的工作, 给我们展示了其团队对北京大学扫描重建的结果。高老师团队专注特征的表达和压缩,以后会解决更多的挑战!这个领域还有许多问题需要解决。 相信高老师团队会给我们带来更多优秀工作!

 

权龙:Computer Vision, Visual Learning, and 3D Reconstruction: Modeling the world with drones and smartphones!

香港科技大学终身教授权龙充满激情地给我们介绍了他在人工智能、计算机视觉、3D视觉重建等方面的思考和研究。权龙教授认为从AI的角度看,相比于语音和文字,视觉大约占所有信息的80%,所以更为重要,AI的演变主要来自于计算机视觉。权龙教授带我们简单地回顾了一下AI的发展历史,从1998年到201215年的时间里,AI一直没有很大的变化;但是在这沉默的15年中,计算硬件有了巨大的提升,GPU也在科学研究中得到了广泛的应用,这带来了AI近几年迅猛的发展。

在对计算机视觉的理解上,权龙教授认为计算机视觉就是对基本视觉特征的搜索,而特征则是图像重构和识别的基础。这方面通过使用深度学习的方法已经有了非常优秀的效果,但是仍有许多不足有待改进。例如在识别方面,它仍然只能完成特定任务、不能像人一样理解图像。在重构方面,则还面临着诸如如何在两张图中找到相同事物、相关特征或像素等,如何去除不需要事物(例如天空)等问题。

接下来,权龙教授介绍了现代三维重建管道的内容,并相应地提出了深度三维重建的概念——包括对传统上特征检测和匹配、来自运动的结构、多视角立体等方面的改进。此外,权龙教授还给我们展示了Altiture.com3D重建出的几个demos,效果非常惊人。


Davide ScaramuzzaRobust, Visual-Inertial State Estimation: from Frame-based to Event-based Cameras

昨日下午的特邀报告同样十分精彩,苏黎世联邦工学院机器人与视觉实验室主任Davide Scaramuzza 主要研究视觉惯性状态估计, 基于视觉的飞行机器人导航、端到端学习以及时间驱动视觉。他的目标是制造快速的、轻量的、全自动的飞行机器人,并将其用于搜救工作中。要实现这个目标,实际上需要解决计算机视觉中的几个重要挑战:高动态场景、高速运动、少纹理、运动模糊等问题。

Davide从视觉惯性状态估计的问题展开:当2帧间overlap大于30%时,稀疏的估计比稠密和版稠密能够更快收敛。Divide团队还改进了四旋翼飞行器系统,能够进行不需要gps的快速巡航以及自动实时稠密的重建。之后,他介绍了基于事件的相机模型,其革命性的地方在于,能够稳健低延迟处理高速运动和高动态场景。


 


口头报告、短报告、海报概览

GraphMatch: Efficient Large Scale Graph Construction for Structure from Motion

文章提出了一种类似图像匹配的方法,可有效的用于大规模运动恢复结构问题(Structurefrom Motion, SfM)中。不同于现有解决SFM问题中,使用词汇表(Voc)来避免蛮力搜索并快速构建匹配图的方法。本文研究人员提出的GraphMatch方法,不需要在预处理阶段构建繁杂的词汇表,通过两方面的先验数据检测相似的图相对,更高效匹配图像。先验数据一方面来自与对任意两幅图像的Fisher vector即似然函数的梯度向量评估所得数据,另一方面基于对底层匹配图中顶点之间的图像距离评估所得。进过研究人员的实验证明,GraphMatch方法与其他相似的图像匹配算法相比更加有效。这无疑是在解决计算机视觉大规模运动恢复结构问题方向的又一重大突破。

 

 

Line-based Robust SfM with Little Image Overlap

相比于前文所述可应用于SFM的图像匹配问题的全新解决思路,本文考虑到通常的结构运动(SFM)技术需要至少三焦点重叠摄像机标定和重建场景的问题,提出了基于直线共面假设的新方法,估计共享一个相机的两个独立焦距校准相对尺度。实验表明,虽然会以相对不精确为代价,但是这种方法可以校准之前无法处理的数据集,具有更广泛的适用性。对于每一位奋斗在科研一线的研究人员,解决问题永远没有最好的解决方法,只有更好的方法。

 

ControllableVariation Synthesis for Surface Motion Capture

本文解决了自动捕获四维模型微变的问题,特别是在多视角下对运动人体形态的捕获。微变是实现真实运动的一个重要组成部分,然而今年的动画网格数据集和制作工具却缺乏这种丰富性,对此,研究人员提出了新的解决方法。建立了嵌入多个低纬形态的动力学模型,并利用蒙特卡罗马尔科夫链MCMC抽样获得表现运动轨迹的模型组。

Cascaded Scene Flow Predictionusing Semantic Segmentatio

该报告带来了一种新的从一对3D相机给出的两个连续帧中同时估计被观测场景中物体的形状和运动的方法。他们的方法综合考量了分割、形状、运动、光流场等可用因素,通过优化对整体的目标函数,取得精准的语义场景流估计。通过在KITTI数据集中的验证,他们的方法确实精准而有效。

Staticand Dynamic Objects Analysis as a 3D Vector Field

Jiang Cansen等人则在中提出了一种新的场景分析方法,该方法具有三个卓著贡献:首先,可以有效地检测物体的运动;第二,提供了一种质量较高的物体运动分割方法;第三,可以较好地生成静态地图和刚性物体。他们的方法在拥挤环境中的精准机器人定位和自动驾驶等方面有着十分广阔的发展前景。



厂商展台概览(1)

百度:百度机器人

在本次会议上百度展出了一套软硬件一体的视觉解决方案,机器人视觉SDK同时具有导航定位和物体识别功能,双目摄像头获取的图像经过深度神经网络,可以精准完成的障碍物检测。此外,这一机器人视觉解决方案连接百度云端API,可以快速准确地进行人脸识别、身份识别、物体识别和文字识别。这样完备的机器人视觉解决方案可以说是为机器人提供了一双慧眼。

 

 

光珀智能:ToF传感器

光珀智能带来了他们的ToF传感器产品,GP001A-16适用于户外使用,其提供的RGBD信息能为三维数据分析提供精准的数据支持。而GP003与传统的机械扫描式激光雷达相比,具有全固态、无移动部件、可靠性和抗震性能高的优势,在运行过程中不依赖于环境光照明,成像距离可达几百米。可应用到安防监控、汽车自动驾驶、机器人导航、三维建模、虚拟/增强现实、人机交互、机器人3D视觉等多种领域。


商汤科技:移动AR应用

商汤科技展示了能实时三维重建并添加AR效果的移动端应用。特色部分是AR的阴影和遮挡效果,在应用场景中,虚拟物体在移动过程中能够被实物遮挡,虚拟物体的阴影也会随着其移动和光线变化而变化和移动。此外,商汤科技还展出了基于人脸关键点定位的技术,可适应大角度侧脸、表情变化、遮挡、模糊、明暗变化等各种实际环境。


 

纵目科技:智能辅助驾驶系统

纵目科技在本次会议中,纵目科技主要展出了ZM-2D/3D环视系统和实时道路监测系统的相关技术。2D/3D 360°全景泊车系统首先收集车身前后左右四个鱼眼相机中采集的视频,然后在环视系统中对采集的视频进行畸变校正和视角变换后,拼接出完整的全景视频输出到车内屏幕。


阿丘科技:智能分拣系统

阿丘科技的SmartPicker智能分拣系统依托于3D物体识别和深度学习等技术,能够实现对任意摆放的工业产品进行检测识别以及姿态估计。该系统能使机械臂自主完成规划和抓取操作,自动完成识别分拣相关任务。


清影技术:多目慧眼

清影机器视觉技术展示的多目慧眼通用式三维即时视觉传感技术,该技术的核心部分是与相机硬件特殊结构相结合的一整套通用计算方法,由三维立体相机采集三维数据,通过专用的高速数据处理器进行计算处理解算出景物的三维坐标及其表面纹理特征。



晚宴:举杯共饮,携手前行

11号的晚宴上,本次3DV的主席陈宝权教授为大家致辞。陈老师首先欢迎了来自各个国家的参会人员。

随后,陈老师对这次3DV的主办方,山东大学交叉研究中心(IRC)进行了介绍。在介绍中我们了解到,IRC团队是一个年轻,向上,充满激情和活力的和谐团队。团队有着良好的研究氛围和浓厚的文化气氛。作为主办方,IRC的老师和同学们付出了辛勤的劳动,保证了大家良好的与会体验。

陈老师与联合主办方未来影像高精尖创新中心(AICFVE)的总体部副主任王春水一同介绍了未来影像高精尖创新中心。AICFVE是由北京电影学院联合国内外高校,研究机构,知名企业建立的,具备雄厚的科研实力。以未来影像创造为目标,AICFVE正在相关研究的道路上摸索前行。

之后,本次的两家赞助商,光珀智能和地平线机器人分别对自身的发展历程,公司现状和科研情况进行了介绍。两家公司同为新兴的科技公司,都具备十分良好的发展潜力,也为科研向工业应用的转化做出了相应的贡献。

席间觥筹交错,来自不同国家的研究者们举杯畅饮,互相介绍自己的研究成果。陈老师和王老师也来到大家中间,与大家畅聊彼此的见闻和与会感受。欢乐时光总如白驹过隙,一晃而过。宴会之后,意犹未尽的研究者们继续着自己的话题,在这次学术的盛会上,没有国界的隔阂,也没有民族的不同,有的是相同的研究精神和科研目标,或许这也正是3DV这样的学术盛会其魅力之所在。