通过人工智能 (AI) 从大规模数字化数据集中提取信息在规模和变化速度上都是前所未有的。新的数据捕获源包括数字成像、GPS 定位和移动、高分辨率生物标记和生物传感器、实时自动捕获市场和环境数据。澳大利亚羊毛行业是评估此类新表型对盈利能力和先进农业系统影响的理想选择。该项目对人工智能(尤其是深度学习)的实用性进行了初步评估,以准确预测图像、生物标记和动物传感器输出的性能结果。我们开发了一种半自动化系统,该系统能够在田间/院子条件下拍摄高分辨率图像并将其链接到动物电子识别 (EID)。该系统还允许半自动记录体重。使用该系统,我们使用 4 个摄像机角度(即正面、顶部和背面)从 4072 只绵羊创建了 1,482,041 幅图像的图像库。所有绵羊在拍摄图像时都称重,并根据面部覆盖(1-5)、颈部皱纹(1-5)和身体皱纹(1-5)进行主观评分,并识别为 EID。使用图像子集,我们将数字信息应用于深度学习分析管道,特别是使用卷积神经网络 (CNN) 分析。使用 Keras (https://keras.rstudio.com) 和 Tensorflow (https://www.tensorflow.org) 开发模型。将数据细分为训练集、评估集和独立测试集,以预测 AI 预测相应表型的能力。使用侧面和顶部摄像头,预测算法可以分别以 86% 和 87% 的准确率预测体重,并且没有偏差。顶部和侧面摄像头的信息相结合,准确率为 89%。对于面部识别,AI 经过训练可以检测每只羊的头部形状和身体形状,只要羊来自相同的训练和测试集,准确率为 99%。使用每只羊的面部和身体图像的随机子集,AI 算法可以以 94% 和 98% 的准确率将匿名面部和身体图像与羊 EID 匹配,当同时使用面部和身体信息时,准确率为 99.7%。但是,当 5 个月后测试同一只羊的图像时,准确率会大大降低(<10%),除非两个时间点的图像都包含在训练数据集中(准确率提高到 90-98%)。使用皱纹评分的全量表(1-5)预测准确率较低,为 38%-58%。这表明,在面部识别的初始训练中,需要从同一只羊那里获取非常大的数据集,并随着时间的推移不断重复,以检测每只羊独特的生物特征。一旦建立了这样的初始训练数据集,面部识别就可以应用于新的人群。对于颈部和身体皱纹,AI 管道能够将动物分配到高皱纹或低皱纹类别,准确率为 73%-90%,具体取决于预测的相机角度和皱纹特征。AI 预测与手动评分的准确率相匹配,高和低皱纹评分的准确率为 98%-99%,扩展的 1-5 级皱纹评分的准确率为 57%-60%。对于面部遮盖评分,在 2 和 3 之间划分的初始分类器显示的结果略好于随机结果。这在很大程度上取决于种群中面部遮盖数据的分布,其中 87% 的动物被分配到中心类别,不到 1% 的动物属于极端类别。这没有为 AI 算法的训练和验证提供任何能力。为了测试 AI 在描述面部遮盖分数方面的实用性,ML 分类器经过训练可以区分面部遮盖分数 2 和 4。当从图像中裁剪出多个区域时,分类器的预测能力得到证明,准确率为 87%。使用更平衡的数据集,其中每个面部遮盖分数都得到同等代表,很可能区分所有 5 个面部遮盖分数。对生物传感器和生物标记技术的范围及其与深度学习 AI 技术相结合时对绵羊产业定义表型的可能效用进行了审查。全球在该领域的投资成果可能会转移到绵羊产业,并将加速数字化数据量的涌现,其中大多数数据都适合人工智能和深度学习管道。在生物传感器领域,动物加速度计和地理定位设备最有前景。在生物标记领域,基因组学被认为具有最大的潜在直接优势,因为样本可以在早期采集,不受生理状态的影响,并且可以从单个样本中为几乎所有性状提供表型和遗传预测值。大规模蛋白质组学(包括免疫学)和代谢组学研究都具有广阔的未来,因为它们与生理(生产/疾病)状态密切相关,并且适合通过人工智能进行大规模分析,并且可能为复杂性状提供低成本的表型分析,尤其是与动物生物传感器结合时。
主要关键词