随着移动设备成为人类存在和活动的代理,移动运营商收集的数据集(即呼叫详细记录(CDRS))被公认为是研究人类行为的常见工具,在多种研究中和行业中,社会学[1],例如,流行病学[2],运输[3],交通[3],[4](CF>)图1a)。CDR描述了与操作员网络交互的每个移动设备生成的时期和地理参考事件类型(例如,呼叫,SMS,数据)(参见表I)。 它们包括城市,地区或乡村地区,通常涵盖长期(月或数年);当今,没有其他技术提供同等的人均精确范围。 然而,现实世界中CDR对研究的剥削面临许多局限性(参见 §ii)。 首先,可访问性:CDRS数据集未公开可用,施加了严格的移动运营商协议。 第二,可用性:CDR通常以汇总形式(即分组的迁移率流和粗时空信息)提供,限制了相关分析的精确性。 第三,隐私:即使是匿名化的CDR,CDRS描述了用户习惯的敏感信息,这使他们的共享性硬化[5]。 第四,灵活性:限制访问CDRS的限制了高级研究,需要在人口规模,持续时间或地理覆盖范围内进行数据丰富。 本文介绍了实施CDR的自动生成,以解决上述挑战。表I)。它们包括城市,地区或乡村地区,通常涵盖长期(月或数年);当今,没有其他技术提供同等的人均精确范围。然而,现实世界中CDR对研究的剥削面临许多局限性(参见§ii)。首先,可访问性:CDRS数据集未公开可用,施加了严格的移动运营商协议。第二,可用性:CDR通常以汇总形式(即分组的迁移率流和粗时空信息)提供,限制了相关分析的精确性。第三,隐私:即使是匿名化的CDR,CDRS描述了用户习惯的敏感信息,这使他们的共享性硬化[5]。第四,灵活性:限制访问CDRS的限制了高级研究,需要在人口规模,持续时间或地理覆盖范围内进行数据丰富。本文介绍了实施CDR的自动生成,以解决上述挑战。尤其是(1)我们通过建立这种生成的痕迹的范围并描述它如何为研究进展提供新的途径,详细介绍了这种解决方案的动机,(2)我们通过提出相关要求和挑战来分享对现实CDR生成的可行性研究。
主要关键词