集微网 · 2021年03月19日

【专利解密】小米便捷、智能化3D图像合成方案

【嘉勤点评】小米发明的3D图像合成方案,通过检测拍摄终端的运动轨迹,当拍摄终端的轨迹满足预设条件时,就获取拍摄终端在运动过程中拍摄到的图像,并且利用这些图像生成目标景物的3D图像。

集微网消息,随着科技的发展,3D技术越来越多的应用于我们的生活中,如3D拍摄、3D扫描、3D打印等使用场景,但是由于3D拍摄需要挑选合适的拍摄位置以及对于图像进行帧合成,因此该技术也有许多的限制。

例如,单机位单镜头拍摄3D照片时,该方案是模拟人眼通过不同的角度对一个物体拍两张照片,通过一定的算法合成一张3D照片,这样虽然可以得到3D图像,但是操作方式复杂、焦点容易误判,且需要用户手持拍摄设备很稳。

其实3D摄影最常用在电影拍摄中,有时候会有这样的镜头运动方式,以某个物体作为焦点或圆心,机器围绕其转动。这样一来,在摄像机记录的很多素材中,都符合3D合成的要求,因此需要一种智能化的合成技术,能够较为便捷地利用摄像机记录的素材生成3D图像。

为此,小米在2015年9月2日申请了一项名为“3D图像合成方法及装置”的发明专利(申请号:201510556372.7),申请人为小米科技有限责任公司。

根据该专利目前公开的资料,让我们一起来看看这项3D图像合成方案吧。
image

如上图,为该专利中发明的3D图像生成的场景示意图,其中包括拍摄终端1和被拍摄物体2,当人体的左右眼观察被拍摄物体时,两个眼睛的观看角度相对于被拍摄物体是不同的,这样人在用双眼观看时就会看到被拍摄物体的立体图像。

为了利用拍摄终端实现同样的效果,需要在A、B两个位置采用与人眼类似的角度对被拍摄物体分别进行拍摄,然后两个位置上拍摄得到的两张图像进行3D合成,就可以得到被拍摄物体的3D图像,当人眼在观看其成像时,就能感受到立体变化。

image

如上图,为这种3D图像合成方法的流程图,首先需要检测拍摄终端在拍摄目标景物时运动的轨迹是否具有3D合成的基础,例如判断拍摄终端是否在一个平面内运动,以及判断拍摄终端是否平稳移动,这些都是能够获取质量较好3D图像的关键。

其次,在拍摄终端运动过程中至少拍摄两张图像,否则流程结束,因为至少要需要两张图像才可以获取到3D图像,接着,就利用这两张图像生成目标景物的3D图像。

与现有的3D图像合成图像方案不同的是,该方案无需用户根据经验在目标景物周围选择不同的拍摄地点,可以减少用户在选择拍摄地点的尝试次数,以及避免在拍摄地点拍照得到的图像在后期无法合成3D图像的问题,从而提高3D图像合成的成功率。
image

如上图,为上述流程中具体获得至少两张图像的方案流程图,如果要获取目标物体的图像,首先需要获取一段运动时拍摄得到的视频,然后从中提取帧图像,例如可以提取不相邻的至少两帧图像。其后,对提取到的帧图像内容进行图像识别,得到识别结果后,查找提取到的帧图像中焦点相同且拍摄角度不同的两帧图像。

以上就是小米发明的3D图像合成方案,该方案通过检测拍摄终端的轨迹,当拍摄终端的轨迹满足预设条件时,就获取拍摄终端在运动过程中拍摄到的两张图像,并且利用这两张图像生成目标景物的3D图像。这样的方案可以减少用户在选择拍摄地点的尝试次数,还可以提高3D图像合成的成功率。

关于嘉勤

深圳市嘉勤知识产权服务有限公司由曾在华为等世界500强企业工作多年的知识产权专家、律师、专利代理人组成,熟悉中欧美知识产权法律理论和实务,在全球知识产权申请、布局、诉讼、许可谈判、交易、运营、标准专利协同创造、专利池建设、展会知识产权、跨境电商知识产权、知识产权海关保护等方面拥有丰富的经验。

(校对/holly)

推荐阅读
关注数
12739
内容数
1029
从专利出发,浅析一切关于柔性屏、折叠屏、10倍光学变焦技术等有趣的前沿技术
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息