【专利解密】小米便捷、智能化3D图像合成方案

【嘉勤点评】小米发明的3D图像合成方案，通过检测拍摄终端的运动轨迹，当拍摄终端的轨迹满足预设条件时，就获取拍摄终端在运动过程中拍摄到的图像，并且利用这些图像生成目标景物的3D图像。

集微网消息，随着科技的发展，3D技术越来越多的应用于我们的生活中，如3D拍摄、3D扫描、3D打印等使用场景，但是由于3D拍摄需要挑选合适的拍摄位置以及对于图像进行帧合成，因此该技术也有许多的限制。

例如，单机位单镜头拍摄3D照片时，该方案是模拟人眼通过不同的角度对一个物体拍两张照片，通过一定的算法合成一张3D照片，这样虽然可以得到3D图像，但是操作方式复杂、焦点容易误判，且需要用户手持拍摄设备很稳。

其实3D摄影最常用在电影拍摄中，有时候会有这样的镜头运动方式，以某个物体作为焦点或圆心，机器围绕其转动。这样一来，在摄像机记录的很多素材中，都符合3D合成的要求，因此需要一种智能化的合成技术，能够较为便捷地利用摄像机记录的素材生成3D图像。

为此，小米在2015年9月2日申请了一项名为“3D图像合成方法及装置”的发明专利（申请号：201510556372.7），申请人为小米科技有限责任公司。

根据该专利目前公开的资料，让我们一起来看看这项3D图像合成方案吧。

如上图，为该专利中发明的3D图像生成的场景示意图，其中包括拍摄终端1和被拍摄物体2，当人体的左右眼观察被拍摄物体时，两个眼睛的观看角度相对于被拍摄物体是不同的，这样人在用双眼观看时就会看到被拍摄物体的立体图像。

为了利用拍摄终端实现同样的效果，需要在A、B两个位置采用与人眼类似的角度对被拍摄物体分别进行拍摄，然后两个位置上拍摄得到的两张图像进行3D合成，就可以得到被拍摄物体的3D图像，当人眼在观看其成像时，就能感受到立体变化。

如上图，为这种3D图像合成方法的流程图，首先需要检测拍摄终端在拍摄目标景物时运动的轨迹是否具有3D合成的基础，例如判断拍摄终端是否在一个平面内运动，以及判断拍摄终端是否平稳移动，这些都是能够获取质量较好3D图像的关键。

其次，在拍摄终端运动过程中至少拍摄两张图像，否则流程结束，因为至少要需要两张图像才可以获取到3D图像，接着，就利用这两张图像生成目标景物的3D图像。

与现有的3D图像合成图像方案不同的是，该方案无需用户根据经验在目标景物周围选择不同的拍摄地点，可以减少用户在选择拍摄地点的尝试次数，以及避免在拍摄地点拍照得到的图像在后期无法合成3D图像的问题，从而提高3D图像合成的成功率。

如上图，为上述流程中具体获得至少两张图像的方案流程图，如果要获取目标物体的图像，首先需要获取一段运动时拍摄得到的视频，然后从中提取帧图像，例如可以提取不相邻的至少两帧图像。其后，对提取到的帧图像内容进行图像识别，得到识别结果后，查找提取到的帧图像中焦点相同且拍摄角度不同的两帧图像。

以上就是小米发明的3D图像合成方案，该方案通过检测拍摄终端的轨迹，当拍摄终端的轨迹满足预设条件时，就获取拍摄终端在运动过程中拍摄到的两张图像，并且利用这两张图像生成目标景物的3D图像。这样的方案可以减少用户在选择拍摄地点的尝试次数，还可以提高3D图像合成的成功率。

关于嘉勤

深圳市嘉勤知识产权服务有限公司由曾在华为等世界500强企业工作多年的知识产权专家、律师、专利代理人组成，熟悉中欧美知识产权法律理论和实务，在全球知识产权申请、布局、诉讼、许可谈判、交易、运营、标准专利协同创造、专利池建设、展会知识产权、跨境电商知识产权、知识产权海关保护等方面拥有丰富的经验。

（校对/holly）