天空中翱翔的海鸥从稀薄的空气中消失,沙漠中的背包客在行走时蒸发。这些需要电影制片人完成的视频效果再次被人工智能所"学"。
最近,欧洲计算机视觉国际会议(ECCV)开发了一种人工智能视频处理算法,它可以从视频图像中删除移动物体,同时保持移动边界的清晰性。
这项名为"光流-边缘引导视频完成"(Flow-edgeGuidedVideoCompletion)的研究由美国弗吉尼亚理工学院(Virginia Institute Of Technology)和Facebook进行。该研究的主要作者是美国弗吉尼亚理工大学计算机工程专业的博士生。
目前,高正从弗吉尼亚理工大学助理教授贾宾黄那里学习计算机摄影和计算机视觉,专注于图像/视频处理和视觉场景理解。
骑马的运动员和马一起消失
在高湛和他的同事们的研究成果中,各种运动物体,如摆动秋千、运动员骑马、海上帆船等,都消失在没有痕迹的视频中,肉眼看不到人造的编辑痕迹。
这项研究的另一位作者贾秉黄在社交媒体上透露,该算法可以无缝地删除物体、水印或在随机视频中拓宽视野。该算法也是人工智能科学家、图灵奖得主扬勒村推荐的。
高湛等人在本文中介绍,这是一种基于光流的视频完成算法。视频完成(视频完成)的任务是用新合成的内容填充给定的时空区域。它有许多应用,例如修复(去除划痕)、视频编辑、特效工作流(删除不想要的对象)、删除水印和标志以及视频稳定性。
对于视频完成任务,困难在于新生成的内容需要无缝地嵌入到视频中,而变化应该尽可能不被发现。几年前,业界的一般方法是基于补丁的合成技术。然而,这些方法合成速度通常较慢,合成新内容的能力有限,只能对视频中现有的补丁进行重新组合。
后来,出现了一种基于学习的技术,它可以达到更合理的综合效果,但由于对视频的高内存要求,存在一个解决问题。
那个在喷泉边旋转跳舞的女孩在起飞后消失了.
作者认为,最成功的视频完成方法是基于光流技术,它可以合成颜色和光流,沿着光流轨迹传输颜色,以改善视频的时间相干性,从而减少存储问题,实现高分辨率输出。
这项新的研究还采用了一种基于光流的方法。作者说,以前的光流完成方法往往无法保持移动边界的清晰性,它们开发的方法首先提取并完成运动物体的边缘,然后以光流边缘作为完成光流的指南。因为这种方法并不能填充视频中所有缺失的区域,所以研究人员引入了非局部光流,这样视频内容就可以在移动的边界上传播。
作者认为,可视化和定量的结果都表明,它们的方法比最新的算法具有更好的性能。它们还指出,该方法的速度为0.12fps(FramesPerSecond,每秒传输帧),这与其他基于光流的方法相似,而且运行速度慢是一个很大的缺点。