万条关键词检索结果

在短短几个小时内就吞噬了超过1000万条鱼。这是世界上最大的捕食活动

More than 10 million fish devoured in just a few hours. It’s the world’s largest predation event

声音成像显示在史诗般的喂养疯狂中杀死了数百万鱼。

俄罗斯董事会 - 地球系统ACAR在2024年传递了超过2800万条消息

Российская система «борт—земля» ACARS доставила в 2024 году более 28 миллионов сообщений

KA-32A11M的稳定性提高,可以输送高达4000升水和400升火泡沫

加密消息服务被拦截,执法部门阅读了 230 万条消息

Encrypted messaging service intercepted, 2.3 million messages read by law enforcement

当局能够拦截 Matrix 消息服务的流量并监控犯罪活动三个月。

1000 万条鱼:海洋学家见证海洋历史上最大规模的进食狂潮

10 Million Fish: Oceanographers Witness the Greatest Feeding Frenzy in Ocean History

在挪威,人们观察到鳕鱼吞食数百万条毛鳞鱼,揭示了受环境压力影响的显著捕食者-猎物动态。“数量越多越安全”这句话在某些情况下可能是正确的,但科学家发现,成群结队的鱼不一定能一起生存。相反,更大的鱼群可能成为更诱人的目标 [...]

短短几个小时内就有超过 1000 万条鱼被吞食。这是世界上最大的掠食事件

More than 10 million fish devoured in just a few hours. It’s the world’s largest predation event

声波成像显示数百万条鱼在史诗般的疯狂进食中死亡。

34万条诉由:版权人攻击互联网巨头

340 000 причин для иска: правообладатели атакуют интернет-гиганта

互联网提供商因无所作为而受到音乐唱片公司的攻击。

首百万条被泄露的 Ticketmaster 记录免费发布

First million breached Ticketmaster records released for free

一名网络犯罪分子免费提供来自 Ticketmaster 漏洞的 100 万条数据记录,称 Ticketmaster 拒绝付款

4000 万条信息告诉我们关于家长与教师沟通的什么

What 40 Million Messages Tell Us About Parent-Teacher Communication

说到做到:消息应用程序几乎无处不在,无论是帮助我们在社交媒体上发送表情包还是向客户服务投诉。一个...

Shaip 为一家领先的财富 500 强公司提供了 700 多万条话语

Shaip delivered 7M+ Utterances for a leading Fortune 500 company

收集并转录了超过 22,000 小时的音频数据以训练多语言数字助理。美国肯塔基州路易斯维尔,2022 年 8 月 1 日:Shaip 为一家美国跨国计算机技术公司提供了超过 22,000 小时的音频数据,以使用来自全球的 13 多种语言训练他们的多语言数字助理。超过 700 万条话语 [...]

2024 年 31 个国家的选举前,社交媒体帖子出现两极分化

Social media posts were polarised leading up to elections in 31 countries in 2024

意大利研究人员分析了去年新闻媒体和政党发布的 400 多万条 Facebook 帖子,并表示右倾组织更关注政治、宗教和移民,而左倾组织则更多地关注教育、健康和技术。他们表示,他们研究了 2024 年举行选举的 31 个国家的 508 家新闻机构和 336 个政党的社交媒体参与度,发现在讨论最多的话题上,人们特别倾向于政治两极。作者表示,左倾或右倾组织在话题上的这种两极分化并不是绝对的,因为他们发现左派和右派在一些问题上有共同点。

2024 年选举年的全球社交媒体参与趋势揭晓

Global social media engagement trends revealed for 2024 election year

对新闻机构和政党在 2024 年发布的 400 多万条 Facebook 帖子的分析,突显了包括许多国家选举在内的一年中全球社交媒体参与趋势和政治两极分化。

四分之三的 Facebook“分享”来自没有读过这个故事的人,尤其是那些极端的内容

3 in 4 Facebook 'shares' are by people who haven't read the story, especially the extreme stuff

美国对 2017 年至 2020 年期间分享的 3500 多万条 Facebook 帖子进行了分析,发现“未点击的分享”(未阅读文章的人分享的文章)占所有转发链接的 75% 左右,极端内容或证实用户先前政治立场的内容所占比例甚至更高。他们研究的大多数未读分享文章(76-82%)来自保守派新闻来源,而自由派分享的内容占他们未读内容的 14.25%。专家们得出结论,这表明,在 Facebook 上疯传的新闻往往是基于用户对标题和简短广告的肤浅解读,而不是他们链接到的较长内容,这对社交媒体平台的设计具有影响,如果他们希望在网上促进知情的政治话语。

研究人员表示,社交媒体用户可能不会阅读此标题以外的内容

Social media users probably won’t read beyond this headline, researchers say

宾夕法尼亚州立大学的研究人员分析了 2017 年至 2020 年期间在社交媒体平台上分享了数十亿次的 3500 多万条包含链接的公开帖子,发现大约 75% 的分享都是在发帖人没有先点击链接的情况下进行的。其中,来自两极的政治内容比政治中立内容的分享频率更高,且没有点击。

优化 PySpark 中的数据处理性能

Optimizing the Data Processing Performance in PySpark

PySpark 技术和策略解决常见的性能挑战:实践演练Apache Spark 近年来凭借其强大的分布式数据处理能力成为领先的分析引擎之一。PySpark 是 Spark 的 Python API,通常用于个人和企业项目以解决数据挑战。例如,我们可以使用 PySpark 高效地实现时间序列数据的特征工程,包括提取、提取和可视化。然而,尽管它能够处理大型数据集,但在极端数据分布和复杂的数据转换工作流等各种情况下仍然会出现性能瓶颈。本文将研究使用 Databricks 上的 PySpark 进行数据处理时的各种常见性能问题,并介绍各种微调策略以实现更快的执行速度。照片由 Veri Ivanova

约翰霍普金斯大学推出仪表板来跟踪竞选支出

Johns Hopkins launches dashboard to track campaign spending

数百万条竞选财务记录可通过新的仪表板获得,该仪表板在全国两大政党报告的六百万条支出记录中部署了机器学习

快餐和含糖饮料是社交媒体上谈论食品和饮料时的“热门话题”

Fast food and sugary drinks are 'hot topics' when talking food and beverage on social media

对提及食品和饮料产品的社交媒体帖子进行分析发现,快餐店和含糖饮料最为常见,一年中数百万条帖子覆盖数十亿用户。这项国际研究发现,大量社交媒体正在将不健康饮食正常化,研究团队认为,可能需要制定政策来保护数字食品环境中的年轻人。该团队调查了 2020 年加拿大用户生成的社交媒体帖子的频率和覆盖面,方法是确定分享率最高的 40 个食品品牌,然后在 X(以前的 Twitter)、Reddit、Tumblr 和 Youtube 上搜索普通用户对它们的提及。在 2020 年期间,这些品牌被提及了 16,851,990 次,覆盖用户估计有 42,244,995,156 名。帖子数量和覆盖率最高的食品类别是快餐

右倾政治人物助长网络仇恨

Right-leaning political figures fuel online hate

研究人员开发了一种新方法,使用一种适用于多个数据集的机器学习模型,可以更准确、更一致地自动检测社交媒体平台上的仇恨言论。该模型在 Twitter(现为 X)、Reddit、Gab 和新纳粹论坛 Stormfront 等平台的八个仇恨言论数据集上进行了训练。然后,该模型在一个独特的数据集上进行了测试,该数据集包含 15 位美国公众人物的 30 万条推文,这些公众人物包括前总统、保守派政客、极右翼阴谋论者、媒体评论员和被认为非常进步的左翼代表。分析显示,辱骂和充满仇恨的推文,通常带有厌女症和仇视伊斯兰教的情绪,主要来自右翼人士。具体来说,在 5299 条辱骂性帖子中,有 5093 条是由右翼人士发

方法

Methodology

Twitter 数据的收集和分析 本报告中的 Twitter 分析基于 2023 年 3 月 8 日至 4 月 27 日收集的 480 万条推文。此过程涉及在收集期间每 30 分钟收集一批 3,000 条新推文,使用Twitter 流 API。这导致了[…]后方法论的样本首先出现在皮尤研究中心。