LiveVideoStack · 2023年08月10日 · 广东

对话咔嚓剪辑金邦飞 | 如果把我的人生类比成播放器去开发与设计...

策划、编辑 | Aris Wang受访对象 | 咔嚓剪辑出品人:金邦飞

七月底的上海,潮湿又燥热,笔者在一家远离市中心的星巴克见到金邦飞,但店里实在吵闹,金老师只好带我换到隔壁汉堡王餐厅进行当天的采访对话。他穿着一身黑色简洁的休闲服装,看上去质朴、憨厚,和他做的咔嚓剪辑具备类似的气质。金邦飞是浙江人,今年50岁,在上海读完大学后便一直留在这里。算下来,这是他投身多媒体音视频工作的第24年

金邦飞是多媒体领域的一位技术老兵,2000年便加入敏递软件负责DVD的研发,后来跳到视龙担任CTO,参与了一系列播放器的规划、研发与测试,并也是他职业生涯首次担任管理岗位。

在访谈时,他回忆说:“当时正处在WinMobile时期,实际做多媒体的人也不多,像HTC、LG、摩托罗拉、诺基亚是主要客户。到了2008年,进入安卓时期,不过当时安卓里面的引擎播放器内核非常弱,文件类型不能很好支持,性能也差,我们当时就赶上这个时期,帮助他们完善多媒体功能。”由此,命运的齿轮开始转动,自研框架,开发播放器引擎贯穿了金邦飞的整个职业生涯。

至今,多媒体的发展史大约有40年的时间,这40年里, 一代代技术人不断投身于多媒体事业的汪洋。其中,包括LiveVideoStack此次采访的金邦飞、此前采访过的张贤国、陆其明、赵军等深耕该领域的技术老兵。我们以此持续关注多媒体技术标杆的时代故事。

透过这些人物群体,每个人都有其个性下的共性,也保留着时代的痕迹——并非每个带着光环登场的技术老兵都最终成功,甚至其中遗憾更多,但他们的成长轨迹才是属于多媒体圈子故事中最迷人的部分

以下是金邦飞的讲述:

A. 做事情做到极致

如果把自己的人生当作一款产品去开发和设计

回忆我的职业生涯,其实一直专注在多媒体领域。

我最初其实做过一段时间的管理,此前做CTO的时候带过一百来号人,但后来发现,还是单纯做技术更开心

说起我的读书经历,我大学学的并不是计算机,是机械设计,但是大部分时间放在了自学计算机上。大概1998年左右的时候,我正式进入到计算机行业。我是从2000年开始进入多媒体领域,当时去了敏递软件,负责DVD/VCD工具开发,也是在这里认识的陆其明。

图为金邦飞和陆其明出品的《Direct show》

随后2005年,我又跳到了视龙担任CTO,负责公司研发部门,在当时的WinMobile时期,HTC是公司的最大客户。到了2008年,随着安卓自身的播放器越来越完善,公司的业务转向和内容提供商合作,期间用过DirectShow,基于OMX开放播放器,后来自研框架,开发播放器引擎。

2016年,我跳到了七牛云担任技术专家,本职工作依然是开发视频播放器SDK,印象深刻,DAU最高的时候有2亿。2019年,我又来到了B站,也是负责开发视频播放器SDK,在后来开始负责开发视频编辑器引擎,底层的数据结构、素材管理、解码、渲染等都需要非常熟悉FFmpeg、以及各个显卡的硬件解码、编码、渲染。后来,产品必剪PC端已经上线,性能和功能十分接近剪映,但又保有B站的特色。

因为合同到期,今年四月,我选择了离开B站。但总结过去这些年的工作经历,我始终秉承“把产品做到极致”的信念带入到每一份工作当中。

出于一直以来对写技术代码的兴趣爱好,我开始自己写了一套视频编辑软件的demo,也就是现在的咔嚓剪辑。当然,也是认为视频编辑器工具有很好的发展前景。

我对于做技术的价值观念是,如果在当下竞争这么激烈的市场,产品做不到NO.1,那其实就会思考是否真的有意义。我对于技术的高要求态度一直如此,对于咔嚓剪辑也是如此。

如果把我的人生当作一款产品设计和研发的话,我其实认为自我设计和人生设计大同小异,产品的生命周期如同个人的成长发展周期一样,不同阶段需要不同的设计和调整。

自己还是小白的时候,疯狂汲取营养是第一要务;长身体的时候,抓住一切机会让自己学习和成长;羽翼渐丰之时,适当对外联系可以扩展自己的社交圈与资源层;功名成就之际,是否有第二增长点吸引着你继续前进。

像打磨产品一样打磨自己,不断优化和迭代,让自己的人生从1.0升级到2.0。

在我看来,人生做的最成功和最有意义的事情两者并不能画上等号,成功与职业、物质财富会挂钩,能对自己的生活质量有所改善,但是意义层面,更多的是精神上面的满足和慰藉。

做咔嚓剪辑是我认为最有意义的事情,这款产品能帮助一些群体解决某类问题,这让我从心里上获得成就感。

当然,做咔嚓剪辑之前的二十几年公司打工经历,确实让自己先有了生活保障,才能去做自己想做的事情。

B. 一款不卷商业不卷投资的产品

没有很渴望成功

我从来没有将自己定义为一个创业者。

正是出于个人兴趣爱好来做咔嚓剪辑,索性我也没有成立公司,从设计到研发亲力亲为,一个人搞定了。很坦白的说,我现在没有收入来源,毕竟咔嚓剪辑这款产品还处于打磨阶段,还在继续完善。不过基于过去工作经验积攒下来的收入,我还不用有太多物质层面的担心。

不卷商业,不卷投资,也没有办公室,我从来没有将自己定义为一个创业者,我只是基于自己的爱好驱动,在做自己感兴趣的技术。从内心出发,我做咔嚓剪辑的确不是抱着功利的心态去做的,也没有说很渴望成功。

50多岁,能All in做自己想做的东西,已经知足。

所以过去几个月,我的确没有思考过该如何运营推广咔嚓剪辑这款产品,这也是目前遇到的最大困难。至于是否扩充人手从工作室开始做起,我想未来会有所计划,到时,我来主要负责技术,搭建起市场、产品等部门,大家一起来把这款产品做好,我想也不错。

如果说研发咔嚓剪辑的灵感源动力,那可能是和很多朋友吃饭聊出来的,也有很多次,早上五点钟醒来,脑子突然闪过特别好的一个产品功能,立马就用代码把它实现了。可能是突然想到一个可以极大提升咔嚓性能的方法,也有可能是突然想到一个新的产品模块功能。

在回答你这个问题之前,我对于人生目标和产品目标感觉没有太大野心。年轻的时候钱是第一位,在后来,自己心态也发生改变,到了这个年龄,我的人生目标就是身体健康,生活开心。产品目标了话,则希望咔嚓剪辑能被越来越多人看见,被使用。

目前咔嚓剪辑是免费提供给C端用户的,未来我希望能够根据用户的不断反馈,进而开发出更多新的功能和迭代升级。能够吸引到更多B端企业的眼光,给这类群体提供SDK开发能力,来完善他们的产业链,再从B端客户得以实现产品的盈利。

目前B端企业已经包含国内耳熟能详的TMT巨头、初创的直播、AIGC公司,他们底层也是需要一个视频编辑的引擎在里面,他们来产生草稿,我可以帮他修改草稿

把底层的技术服务于这些企业,确实是接下来可以实现商业化的手段。

的确,目前企业自己做SDK的难度还是比较大的,这背后牵扯到物力、人力的投入,如果说某家互联网公司去开发SDK。鉴于我过去的实践案例。没有几千万、半年至一年的实践,实际很难做出一个视频编辑引擎。

但换成我自己去做,可能只需要花费几十万、一个月的时间就可以做出一套SDK,并且对于一些初创公司来说,也不太可能花如此高昂的成本去自己开发。

C. 有剪映在了,为什么还要做咔嚓?

不和剪映直接抗衡

我被大家问过最多的一个问题:国内已经有剪映视频剪辑软件的存在了,你为什么还要做咔嚓?

我的回答很统一,到现在还没变:咔嚓剪辑不跟剪映直接抗衡,和剪映只是一个补充。剪映没有开发出来的,咔嚓剪辑就去要开发它。

当然,剪映毕竟是上千人的团队共同开发而成,这点我确实无法直面竞争。但其他差异化方面,咔嚓剪辑可以在十几年前的老电脑上面跑起来,产品运行速度对电脑性能依赖度很低;另外,咔嚓剪辑的流畅度方面,我也觉得不输剪映,这是用户的真实反馈。

在产品模块的实际使用中,用户做视频剪辑的时候会翻来覆去移动自己想要的那一振,咔嚓剪辑可以做到一秒钟拉动十几来帧的画面,这点我觉得是要比剪映做的好的地方。

不可否认,个人和企业不同场景之下做出的产品天差地别,企业里面几百个人共同推动产品的落地,但只要涉及一个内容上的修改,流程则会受到很大影响,变慢或者停滞不前;但如果是个人开发者,就像我,当一个idea突然灵光乍现,那就直接改完事了,所以我的有些优化就可以做的更好。

我前几天刚提到的,因为产品的UI框架是我自己写的,完美结合底层引擎,所以关键帧之间的白线会紧紧跟随鼠标移动而移动。但据我所知,剪映的关键帧已经向左或者向右拉出去好多,那根白线才会慢慢跟过来,可能会对用户体验打些折扣。

不过实现这个目标也挺难,前提是必须自研一套UI框架,但如果是使用市面上开源的播放器框架,是很难做得到的,这是做编辑器一大技术难点。

如果让我再重新设计开发咔嚓剪辑,或者任意一种产品的话,我会认为重新评估用户需求是整个流程中最重要的阶段。

因为在前期开发时,我踩过“自嗨”的坑,闭门造车开发出了一些交互功能,但实际上用户并不需要,反而觉得繁琐。即便我自己认为这款产品很酷炫,但背离了用户的真实需求。所以假设重做,第一步肯定会是了解目前用户最想要的需求有哪些,然后开发时来反推这些需求,重新设计这个架构。

让我想想我走偏路的实际例子。之前我写了一个视频轨道变速功能的代码,觉得很酷,可以直接拉出来非常直观,甚至我还吐槽其他剪辑产品在这方面没有我做的好。但后来发现,基本没有用户在视频轨道上去用这个变速功能,一是这功能在模块里藏的比较深,需要开关打开才可以,二是用户不习惯,还是认为像剪映那样的习惯。

的确,曲线变速的精确到每一帧有多长时间,对于用户来说没有什么必要,用户只是希望简单易用的效果,所以,我最后还是加了类似剪映这样的交互模式,把这个变速功能就隐藏起来了。

毕竟,咔嚓剪辑存在的意义是要解决用户的痛点,这是我做产品的核心理念。

D. 谈谈愿景与未来

浏览器直接当作视频编辑器 多媒体的前世、今生、未来

针对目前客户端播放数据量越来越大,我写了一个浏览器版本的视频编辑器,意思是浏览器可以直接被当作视频编辑器,免去用户安装,打开浏览器就可以直接进行视频编辑。而且,现在电脑上安装的软件越来越少了,好像只剩下了浏览器。因为浏览器能够完成的事情越来越多,有它就够了。 另外现在网上下载的软件不安全,可能会中毒。视频编辑器作为一个重度使用工具,用户对性能,流畅度要求很高,目前很少有纯前端的网页版视频编辑器。所有的云剪辑都是先上传视频文件,后端转码后(分辨率变小)再编辑。上传耗时,担心隐私,视频模糊等,用户体验很差。咔嚓的界面和内核都是跨平台的,网页版本只是重新编译而已。所以和本地安装软件差不多。不需要上传视频,功能和本地的一模一样。这样用户只要打开网页就可以和本地软件一样的使用体验。

视频编辑器新的玩法我认为还有很多,基于现在火热的AIGC、元宇宙里的触感,可以作为特效功能,加到视频编辑器里。这样,内容创作者在创造视频的时候,就会生成有触感的视频,未来玩法还有很多,比如视频素材支持嗅觉、触觉,都有可能,不仅是眼睛,涉及到人的鼻子、嘴巴、皮肤等感官的功能体验都有可能。

虽然咔嚓剪辑现在还很小,但我对做剪辑产品的愿景还是很宏大的,你看,这么多年过来了。所谓的AI、3D还远未到我们认为成熟的水平,3D可能到了全息才真正成为3D。不管怎样,人对于体验的追求是无穷无尽的追求,大有可为。

人接收信息主要来自于眼睛,耳朵,也就是视频,音频。可以说有人就有多媒体了。很长很长一段时间,多媒体来自于现实空间(比如戏剧表演)。随着技术的发展,后来有了广播,电视。后来就是音视频文件,再后来就是流媒体。以后可能全息投影,再现现实场景。多媒体不管怎么发展,目的一直没有变,让人的接收信息更清晰,更舒服,更真实。

聊到最后,一个惊喜的得知是——金邦飞在年轻时,有一段“不为人知”的“创业”经历。

“2000年的时候,还没有智能机,只有彩信,不过得要两毛钱,我当时开发了一个软件——疯狂短信,只需要一毛钱就可以把歌曲、图片发送出去。不过,可惜还是失败了。当时我就是个纯粹的技术男,脑子里思考的是要发送的图片、铃声哪里来,索性我就提供一个绘图工具软件,甚至我还研究过五线谱。但我当时忘了一件重要的事,有多少用户真的懂五线谱、还会用工具画出图片来。虽然这个想法很好,一毛钱就实现了,但缺陷在于没有了解用户。我当时还开发过一个背单词软件,确实做了很多东西,到最后都失败了,那个时候我28岁。”

“疯狂短信本来有机会做出来的,技术都搞清楚了,可是不懂推广,错过了一次机会,后来心有不甘,当然过去很多年,现在肯定释怀了。”金邦飞笑了笑说。

过往不恋,纵情向前。

Hi,LVS最近重新对公号原创内容栏目做了思考,未来我们希望通过此栏目发现多媒体生态当下的新变化,痛点以及如何推动行业持续繁荣发展,将会产出更多原创深度报道文章。

如果你对多媒体圈子好奇,或战斗在行业发展前线,愿意分享自己的洞察和思考,尤其是有选题线索来爆料、寻求报道,欢迎联络笔者。WeChat:XinWell0709 Email:aris.wang@livevideostack.com

点击“阅读原文”
跳转LiveVideoStackCon 2023 深圳站 官网,了解更多信息

推荐阅读
关注数
4162
内容数
363
分享音视频相关技术干货、产品研究与行业趋势
目录
极术微信服务号
关注极术微信号
实时接收点赞提醒和评论通知
安谋科技学堂公众号
关注安谋科技学堂
实时获取安谋科技及 Arm 教学资源
安谋科技招聘公众号
关注安谋科技招聘
实时获取安谋科技中国职位信息