人工智能 (AI) 在行为健康领域的应用引起了人们对使用机器学习 (ML) 技术识别人们个人数据模式的兴趣,目的是检测甚至预测抑郁症、躁郁症和精神分裂症等疾病。本文通过对三个自然语言处理 (NLP) 训练数据集的情境分析,研究了人工智能介导的行为健康背后的数据科学实践和设计叙述。通过将数据集视为与特定社会世界、话语和基础设施安排密不可分的社会技术系统,我们发现数据集构建和基准测试的技术项目(行为健康领域人工智能研究的当前重点)与行为健康的社会复杂性之间存在一些不一致。我们的研究通过阐明无序数据集的敏感概念,为日益增长的人工智能系统关键 CSCW 文献做出了贡献,该概念旨在有效地扰乱行为健康领域中人工智能/机器学习应用的主导逻辑,并支持研究人员和设计师反思他们在这个新兴且敏感的设计领域中的角色和责任。