人脸识别不稀奇,但你听过猪脸识别吗?
其实这个概念由来已久,甚至丝毫不逊于人脸识别的发展。如果说手机让人脸识别这项技术走进千家万户的话,那猪脸识别其实也在同期开始逐步被众多养殖场所采用。时至今日,猪脸识别、音频识别已经有了非常成熟的技术架构与应用体系,甚至帮助了不少养殖企业解决日常饲养、病患管理等问题。
“猪脸识别主要是为了实现大群饲养中猪只个体无应激快速识别,为了跟后面的饲养管理结合起来。利用现代化的技术手段,如音频或图像,对动物的生产过程进行自动监测与管理是目前精准农业的一个重要手段,比如基于音视频自动检测是否有猪生病,如果有病患要挑出来特殊对待,这是工业化养殖的发展方向”,在谈到猪脸识别技术的应用场景时,中国农业大学网络技术中心的副主任兼总工程师劳凤丹介绍说。
或许在人类看来,每一头猪的相貌都差不多,除了特定的花纹或者花色,很难进行明显的区分——更重要的是,猪的生长周期在110天到120天左右,这个过程中的外貌变化可以用翻天覆地来形容,而猪猪们的每一个动作、每一个阶段体型的变化也会对识别带来许多困难。幸好,每一头猪都有属于自己的贯穿于整个生长周期的特征点,例如,眼睛的位置,头部的骨宽、骨量等,随着近期人工智能技术的兴起,基于卷积神经网络等技术对这些信息进行数据量化即可精准识别出每一头猪。
当然识别只是手段并不是目的。在劳凤丹看来,如今的智慧农业不再是单纯将农产品、畜牧产品的价值发挥到最大。例如在保证猪肉正常供给的前提下,如何科学、安全、有效地提升猪肉口感也非常重要——“土猪为什么那么香?因为它肌肉内的脂肪含量相对较高。肌内脂肪含量的提升很艰难,传统的肌内脂肪含量测定,需要对种猪进行屠宰后测定,无法对种猪进行留种选育,只能通过后裔或同胞测定选种,导致估计育种值准确性偏低、世代间隔长、遗传进展缓慢。为实现活猪测定的目的,需要通过现代化的、跟AI算法结合起来的额外方法来进行活猪测定,而动物不像工业化产品,不听和听不懂人话,饲养环境对各类传感器的腐蚀性强,所以智慧农业很有意思的同时也相当有挑战性。
当然这种方式并不是一蹴而就的,而是需要大量的科研实践。目前中国农业大学相关研究团队,除了在猪种的选择上有所取舍之外,也针对饲养因素加以改造,比如降低猪舍的腐蚀性、侧重对畜禽体态声音翻译,再就是尊重个体差异。目前这些工作都在有条不紊地开展,即利用数字化技术为智慧农业发展提供支撑。
因此,负责校级计算平台建设与管理的劳凤丹也尤其重视IT基础设施与系统架构设计,尤其看中挖掘数据背后隐藏的价值。从2021年项目启动之日起,中国农业大学就非常重视存储性能,并将高算存储配比保持在20%左右,这样一方面保证了相对充足的数据存储空间,另一方面也为数据的分析与利用提供了强大的算力支撑。该项目投入使用后,不少教师都反馈在同等处理器条件下,新系统的运行流畅、数据处理能力强、这也是对存储能力的最好肯定。
当然速度也只是新系统最明显的优势,更重要的是校级计算平台的建设解决了不少教师对底层软硬件系统配置的苦恼,将老师从复杂的设备配置管理中解脱出来,专注于自身的科研领域;与此同时,校级计算平台的出现解决了“数据不出校”的问题,校园网让数据传输得更快、存储更安全,自然也就受到了教师们的广泛欢迎。
其实类似中国农业大学这样的案例还不少,比如在苏州大学基础医学与生物学学院特聘教授李玉梅也遇到了数据应用的难题。作为生物医学领域的专家,李玉梅打交道最多的就是所谓的“高通量数据”,比如大家都熟悉的DNA测试就是其中的一种。这些数据的样本量极大,每天的基因测序都可以产生大约6TB的数据,而如何妥善存储和利用这些数据也是李玉梅最为头疼的问题。
浪潮分布式存储总经理姜乐果则提供了一套行之有效的解决方案。作为一名存储行业深耕多年的“老兵”,姜乐果深谙生物基因研究对于数据的依赖程度,甚至他曾经为清华大学的科研进行过28台摄像头、每秒30帧照片、72小时不间断的数据采集工作,具备丰富的行业应用经验。面对这些海量数据的存储与应用要求,姜乐果表示浪潮存储可以提供包括SSD、HDD、全闪在内的多种存储解决方案,满足不同场景需求。
姜乐果同时谈到,作为分布式存储的主流,浪潮也推出了最新一代的AS13000G7存储平台。该平台秉承了“极致存储 智慧有数”理念,在保持一贯稳定可靠的基础上,以“多合一”融合架构为核心,实现极致性能和极致容量,为智慧计算筑牢数据基础设施,加速释放数据要素的价值。比如在硬件方面,AS13000G7一套存储架构可以支持通用型、高密型、性能型等多种产品形态,满足不同业务场景需要;而在软件方面,则能够以一套存储支持多云接口协议、多种数据应用,实现一份数据多协议互访互通,这样彻底解决了以往数据与架构的“孤岛”问题,实现了向下、向前兼容,更符合高校存储升级的大趋势。
与此同时,在教师们最关心的性能层面,AS13000G7存储平台也基于最新一代x86处理器,支持PCIe 5.0高速总线、DDR5高速缓存,搭载自研NVMe SSD;在此基础上,推动盘控协同算法优化,通过CPU专核专用、智能协议卸载和RDMA协议、分区管理等技术实现盘控协同,相较上一代产品性能提升40%,空间利用率达到94%以上。
AI大模型是当下非常火爆的一个话题,李玉梅教授也听到在实际的检测中,尤其是对于癌症检测,如果能够早发现早治疗,就能大大降低患者的痛苦和负担,但这些检测都需要AI技术的加持:“比如有一些突变或者基因的表达量,癌症病人和正常病人是不一样的。假如我们有几百或者上千个癌症病人的样本,再有对照的正常人的样本,就可以提取、转换这些信息,最后训练一个机器学习或者深度学习模型。用这个模型来检测,用无创的方式去检测新的病人”。
当然李玉梅也提到,如今限制AI训练的除了数据之外,就是算法和存储压力——一个是算力,就是计算上面会有要求,或者算法背后就是很大的数据量,计算需求就很高了。再就是存储,因为现在测序的价格比较低,数据量越测越多,对存储的花费,要求也就上来了。对此,姜乐果则表示浪潮存储的融合技术可以很好解决数据备份与自由流动的问题,并可以帮助高校实现灵活的数据扩展,通过更快、更大的存储介质降低成本,提升效率。
我们总说“科技向善”,在数字中国的大趋势下,各大高校、科研单位和企业所做的,无论是面向农业应用的猪脸识别还是面向生物基因的AI检测,本质上都是让算力、数据真正发挥价值,也代表了传统行业的新应用场景,是真正意义上的数字化转型。在多方共同努力下,我们的生活正在朝着越来越便捷、越来越舒适的方向发展,而科技也正在提升大众的生活水平,促进我们整个社会稳步向前。