本文是论文‘Mitsuba 2: A Retargetable Forward and Inverse Renderer’的读后感(review)。
之前我们介绍了CPU,Cache,主要在原理上理解如何充分调用CPU的性能(Why),接着又学习了SIMD技术,算是在编程层面上发挥CPU的并行计算能力(How)。今天,我们来一个不那么复杂的,谈一下如何使用性能分析工具,发现程序的Hotspot(Where),毕竟,工欲善其事必先利其器。
The power wall 目前,运算速度提升30%,则需要两倍的电压和发热,并且这种设计思路无法满足移动设备,也不可能长久
真空中光速为299,792,458米/秒,目前,Intel的i7频率可以达到4GHz,简单换算一下,可以得出结论:光(电流)在一个Cycle内移动的距离约为0.075米。显然,目前的内存条的芯片(反正两面。约为3.75cm)大大超过了这个长度,换句话说,理论上,在一个Cycle内内存条上总有一个位置是我们无法触摸。
严格讲我不是CS专业,不清楚CS本科是否需要学习CPU架构。或者说,在这个软件高度集成的时代,软件工程师有必要掌握这些细节吗?我的答案是:学以致用的角度,不需要;如果你专注于性能优化,则有借鉴意义。
Rendering Equation如上图,我们对比一下同一个场景中,有无participating media的区别,右侧没有时,采样空间是场景的整个表面O(N^2),而在左侧,采样空间是场景中任意一点O(N^3),这反应了VRE的计算量。积分求解该公式告诉我们,L是直射光,1次反弹,2次反弹,N次反弹等所有光路的累加,路径越短,贡献通常越大,也告...
刚刚看了‘Path Tracing in Production’,里面提到了Weta digital的Manuka材质系统,在这里总结一下,算是对之前Material小结的一个补充。
材质就是用来描述光线和物质之间的相互作用。如果一个物体材质是纯镜面的,或者是纯粗糙的,我们可以用镜面反射和漫反射,但如果介于两者之间(glossy),如下图,左边为diffuse和specular,而右边为glossy的效果。就需要更复杂的模型来模拟光和物体的作用。
每周极术社区行业技术热点,市场趋势等分享。
订阅极术社区线上线下活动,包括技术沙龙,赠书活动,开发板申请等
含极术社区WebinarPPT下载及回放,线下活动技术干货PPT,欢迎关注
Arm相关的技术博客,提供最新Arm技术干货,欢迎关注