1 资料来源:Desjardins,J.(2019),世界经济论坛与 Visual Capitalist 合作,预测到 2025 年,每日数据产量将达到 463 EB。1 EB 等于 1 万亿兆字节。
未来:LHC 和 CERN 实验的持续升级和整合计划将导致未来几年 ICT 需求大幅增加,超出预期,在固定投资预算下,存储和计算能力的预期增长幅度达数倍。LHC 的继任者高亮度 LHC 计划于 2027 年左右上线。到那时,实验将收集比以前多 10 倍的物理事件(每年约 EB 量级),这些事件的处理将更加复杂。使用现有的计算硬件投资来存储和分析这些事件将非常具有挑战性。在此背景下,将于 2020 年为建立新的 CERN 数据中心准备招标。还研究和开发了以下列出的其他几种解决方案。
人工智能 (AI) 一直占据着新闻头条,尤其是像 GPT-4 这样的大型语言模型甚至吸引了普通互联网用户的想象力,更不用说技术爱好者了。这些解决方案有可能改变企业的定义、工作的意义,并降低经营成本。与此同时,世界正在以惊人的速度产生数据。世界经济论坛 1 的一项研究估计,到 2025 年,我们每天将产生 463 EB 的数据。作为背景,那是 463 后面跟着 18 个零!或者正如作者所说,“字节数是可观测宇宙中恒星数量的 40 倍”。当然,在同一时间段内不太可能发生的是,人类会突然进化到考虑所有可用数据、计算概率并做出最佳操作选择。这并不是说人类变得可以牺牲。远非如此,我们具有高度调整的能力来识别模式 2 、理解抽象关系和概括。例如,我们不需要数百或数千个训练样本就能知道被网络钓鱼攻击的用户是组织的首席财务官。我们马上就能认出这个名字,我们的直觉会主导下一步补救措施。那么,对于人工智能工具来说,当前的任务就是提供正确的信息,使运营商能够做出最终带来最有利业务结果的决策。
诊断病理学通过数字化经历了重大变革和飞跃,一方面,数字化使得决策过程不时发生重大变化,另一方面,工作流程也发生重大变化,因此内部人员的职位描述也发生了重大变化 [ 1 , 2 ]。所有这些一方面对工作组织产生了重要影响,另一方面对参与活动的人员的培训也产生了重要影响,必须让他们做好准备,做出必要的改变,以适应不断变化的职位描述和与工具(光学/机电一体化/信息学)的交互,这些工具的更新速度越来越快,并且逐渐能够越来越多地与电子健康和移动健康相结合 [ 1 – 6 ]。我们正在从幻灯片的物理存储系统转向虚拟幻灯片(即电子幻灯片或数字幻灯片)的虚拟存储 [ 3 ]。诸如物理存储空间组织等旧问题正在让位于诸如物理(保守)数据安全和网络安全等新问题。现在,关于幻灯片存档和多存档的讨论越来越少,而关于电子幻灯片需要多少 PB 或 EB 的讨论越来越多。变化如此之快,以至于有人开始问一个决定性的问题:我们今天所知道的显微镜是否仍然需要?我们毫无疑问可以强调,迄今为止,诊断病理学经历了两次重要的革命。诊断病理学领域的重大创新首先涉及 1980 年免疫组织化学的引入,其次是 2010 年左右用于癌症诊断的下一代测序的引入。第一次革命涉及数字病理学的引入,因此引入了从电子切片到采集系统(摄像机或扫描仪)以及归档系统、数字病理学的图片存档和通信系统 (PACS) 的关键元素 [ 3 ]。
大数据或海量数据是指一组非常庞大和复杂的数据集,使用现有的数据库管理工具或传统的数据处理应用程序很难处理这些数据。大数据源于对现有大型数据集的后续分析以及软件日志和信息传感移动设备(如相机和全球定位系统)的捕获。亚马逊等电子商务零售商可以利用过去的互联网浏览历史记录中的数据,向特定客户提供有针对性的个性化广告。随着新技术的出现以及数据收集、处理和存储成本的不断下降,数据收集量呈指数级增长;每天大约有 2.5 x 1018 EB 的新数据被创建。1 除了大数据中巨大的信息量之外,这些数据收集工作还增加了分析师可获得的信息广度,同时缩短了数据收集与后续分析之间的延迟。例如,密歇根大学的研究人员现在使用 Twitter 帖子的文本搜索来构建劳动力市场活动(如失业和招聘信息)的社交媒体指数,这种工具在预测招聘趋势方面比专家的共识预测要准确得多,而且几乎是实时可用的。大数据伦理是一个相当新的新兴领域,它已经开始解决与大数据相关的一些挑战,其中许多挑战是“应该”的。