详细内容或原文请订阅后点击阅览
科学家创造了一种新的有效方法来计算独特物体的数量
一种新算法为复杂问题提供了简单的解决方案。
来源:安全实验室新闻频道一种新算法为复杂问题提供了简单的解决方案。
使用随机性帮助一组科学家开发了一种简单的算法来评估数据流中的大量独特对象。
简单算法想象一下被派往雨林进行野生动物普查。每次看到动物,就拍张照片。您的相机会记录拍摄的总数,但您只对尚未出现在画面中的独特动物的数量感兴趣。获得这个号码的最佳方法是什么?伊利诺伊理工学院的计算机科学家兰斯·福特瑙指出,显而易见的解决方案需要记住每一种动物,并将每一种新动物与名单上已有的动物进行比较。然而,如果有数千条记录,这种方法就会变得复杂。
例如,如果 Facebook 想要统计每天访问该网站的唯一用户数量,即使他们在不同时间从多个设备进行访问,情况就会变得更加复杂。这里我们谈论的是一个可以达到数十亿条目的列表。
科学家最近描述了一种新方法,可以粗略地计算长列表中的唯一条目,并且只需要记住少量条目。该算法适用于每次出现一个项目的任何列表,无论是语音中的单词、传送带上的货物还是高速公路上的汽车。
算法CVM 算法以其创始人印度统计研究所的 Sourav Chakraborty、内布拉斯加大学林肯分校的 Vinodchandran Variam 和多伦多大学的 Kuldeep Meela 命名,代表着朝着解决科学家们所关注的独特元素问题迈出的重要一步。已经奋斗了40多年。这个问题涉及找到一种有效跟踪元素流并估计唯一元素数量的方法。
在第三轮中,为了保存一个单词,您需要连续三个头,在第四轮中 - 四个,依此类推。