实验条件(例如,比较在不同离子强度下稳定的化合物是没有意义的)。接下来,将结构上的数据(来自二维图像)转换为已知恒定长度的向量(特征向量)。将矢量数据发送到机器学习模型并输出结果。数据。一切的基础。通常他们谈论大数据,但其数量取决于数据的纯度、方法和期望的结果。通常,在图 1.2 中,数据位于这个金字塔的底部。数据是指事实、信号、测量值,通常是非结构化的东西。数据通常不是原生的、异构的且格式不方便。在这些数据“沼泽”可以被使用之前,它必须经过组织数据、添加上下文、元数据、给这些数据添加标签、清理数据、严格检查数据等过程。简而言之,数据需要经过极其彻底的处理才能使用。