推荐引用 推荐引用 Seth, Rinkle;Priyadarshini, Pragya;Sharma, Rushil;Rastogi, Vrinda;Dwivedi, Yash;以及 Gupta, Asheesh,“使用 KAFKA 的应用程序的蓝绿部署策略”,技术披露共享,(2023 年 10 月 12 日)https://www.tdcommons.org/dpubs_series/6318
分布式系统正在在IT组织中广泛采用。这些系统中的监视故障,包括松散的耦合应用程序,很麻烦,需要手动关注。本研究重点是在运行Kafka的沙箱中实现异常检测,以自动检测故障。用于训练和测试模型,“混乱工程”用于将受控故障注入系统。由于沙盒当前不在负载下,因此创建了负载模拟器以模拟五种不同的方案:恒定负载,线性增加负载,线性减小负载,正弦负载和现实生活中的场景负载。该研究还研究了从5、10到未来30分钟的各种预测范围上预测指标的能力。预测模型显示出不同的性能结果,具体取决于沙箱上的当前负载和预测度量,因为一些指标显示出较高的波动性,从而导致预测性能较差。总体而言,增加预测范围会导致预测较差,但在合理的利润率之内。该研究得出的结论是,CPU使用度量对于现实生活中的模拟以及所有模型的正弦载荷表现最佳。对于线性增加,消费者组滞后的指标对于所有型号都是最好的。该度量在线性减少载荷期间也对LSTM表现最好。但是,KNN最好的指标是网络错误增加和内存使用量。隔离森林的最佳指标是主题偏移。在整体模型性能方面,KNN是现实生活模拟和线性增加负载的最佳选择。对于持续的模拟,Kafka延迟是LSTM和KNN的最佳指标,而网络错误最适合隔离林。隔离森林最适合正弦,线性减少和恒定模拟。该研究还得出结论,与常规负载模拟相比,沙盒中的混乱工程能够注入足够的误差,以使模型对负载的反应不同。本研究中引入的新方法提供了一种方法,用于使用混乱工程在测试环境中建立机器学习模型,而无需生产数据或现实生活中的使用。
使用电动汽车作为燃烧发动机的替代方案,对锂离子电池的新制造技术的需求不断增长。在这种情况下,Fraunhofer FFB研究所启动了实验室基础研究电池生产的构建。为了有效地研究制造过程,需要一个高度数字化的环境,使研究人员可以访问与过程相关的数据。工厂具有由各种软件组成的信息技术体系结构,无论是外包还是内部开发,它们不本质地支持它们之间的通信。这创造了能够连接这些系统的灵活通信体系结构的需求。该建议涉及通过可编程连接器访问的Publish-Subscribe类型的中央事件分布平台的应用。对现有解决方案的分析导致了Redpanda通信平台的选择,而对于开发的连接,Redpanda Connect的使用,为不同的通信技术提供了灵活性。接下来,将系统集成建模并应用于工厂的系统之一。通信和部署体系结构的建模遵循统一的建模语言标准,并使用Docker对应用程序进行了容器。该解决方案导致工厂分析过程的自动化有了显着改善,从而使研究人员能够以提高效率和准确性进行活动。此外,它证明了将应用到其他工厂系统的可行性,从而实现了制造环境集成和数字化的目标。通过这种集成,工厂不仅可以增强系统之间的信息交换,而且还提供了更敏捷和透明的工作流程。
在这一期的 Radar 中,我们讨论了几个主题(其中一些最终未能入选),在这些主题中,团队正在使用工具来适应 Kafka。其中一些工具允许使用更传统的 Kafka 接口(例如 ksqlDB、Confluent Kafka REST Proxy 和 Nakadi),而其他一些工具则旨在提供额外的服务,例如 GUI 前端和业务流程插件。我们怀疑,工具如此丰富的部分根本原因是 Kafka 某些部分的潜在复杂性,以及需要将其适应现有架构和流程的组织中越来越普遍的存在。一些团队最终将 Kafka 视为下一代企业服务总线——“便利的滑坡”主题的一个例子——但其他团队使用 Kafka 来提供对发生的业务事件的通用访问。这些组织认识到,有时更容易拥有一个在边缘进行适应的集中式基础设施,并尝试通过精心的设计和治理来避免蔓延。无论如何,它表明 Kafka 继续朝着批量异步发布/订阅消息传递的事实标准的方向发展。
机器学习工程师|创始人2月。2021 - Present • ECA : [ONGOING] Building Enterprise Coding Assistant, a developer tooling that integrates seamlessly with existing workspace apps and leveraging Generative AI (LLMs) makes software development much more efficient Full-stack development of the application (Svelte, Tailwind, Python, Docker, Kubernetes, CI/CD, OIDC support, Event-driven architec- ture) • MN资产管理:[正在进行的]进行数据枢纽,以提供数据驱动的体系结构,使各种应用程序Spark,Kafka,Kubernetes,kubernetes,airfflow,aws•ABN AMRO银行:建立数据科学家将其模型带到生产Kafka,Azure Cloud Managed Services(Active Directory等)的平台),气流,kubernetes•deribit:帮助,加密世界中最大的衍生品交换之一,发现使用ML的恶意交易。使用Google BigQuery,ML引擎和DataFlow分析超过1000亿行的行•BITVAVO:为荷兰加密货币现场交换的BigData解决方案工作,以便为他们提供有关客户的见解。为他们的数据管道技术堆栈奠定基础:Kafka,BigQuery,Python,Kubernetes,CI/CD•Neurololytics:AI平台的MLOPS和建筑设计
1. 简介 让我们考虑一个涉及消息传递系统的示例,每当一个用户向另一个用户发送消息时,例如用户 1 向用户 2 发送消息,该消息就会存储在用户 2 的数据库中。执行此操作后,需要执行几个任务: 通知用户 2。 如果用户 2 在过去 24 小时内未阅读消息,则向用户 2 发送电子邮件。 更新分析中的相关指标。 但是,我们不希望消息的发送者等待这些任务完成。 此外,如果上述任何任务失败,都不应意味着消息本身未能成功发送。 我们如何才能立即取得成功? 为了满足这些要求,我们使用持久队列。 持久队列是持久的,这意味着数据被写入硬盘以确保不会丢失。 持久队列在称为 pub-sub(发布订阅)的模型上工作,例如 apache Kafka。 Kafka 在内部使用 Zookeeper,Zookeeper 为
云基础设施:OpenStack、K8s、OpenShift 代码存储库、容器注册表、GitOps、Agile Infra 监控:Open Search、Kafka、Grafana、InfluxDB、Kibana 文档存储库//Web:Indico、Drupal、WordPress 分析:HTCondor、Slurm、Jupyter Notebooks、Apache Spark
关键技能 Temenos T24 发布 R17 和 R22、Core、FT、LD、TF、Statements、Delivery、TAFJ。设计工作室、Python、Java 扩展框架、IRIS、集成框架。Apex、LWC、Flows、Salesforce REST API、集成(Xero、Dropbox)、VisualForce。Kotlin、Spring Framework、微服务、BPMN、Camunda BPMS、Apache Kafka、Docker、Git、SoapUI、PostgreSQL、Swagger API、IBM MQ。数据迁移。
为了提高水果和蔬菜行业的可追溯性效率和安全性,本文提出了一种基于多链区块链技术的优化模型。首先,对水果和蔬菜行业的供应链信息进行了分析,该信息的可追溯性代码和产品信息来自供应链的各个阶段。接下来,基于区块链技术建立了可信赖的可追溯性优化模型。最后,使用HyperLeDger Fabric实现了VFSC的信息可追溯性系统,并提出了改进的Kafka负载平衡算法来提高消息传输效率。仿真结果表明,当数据记录数量超过1000时,多链可追溯性模型就查询效率而言优于传统的单链区块链模型。在区块链上部署了10000个数据记录后,与传统的单链模型相比,多链模型的效率提高了90%以上。
版权所有 © 2020 Dell Inc. 或其子公司。保留所有权利。Dell、EMC 和其他商标是 Dell Inc. 或其子公司的商标。Apache ® 、Kafka ® 、Spark ® 和 Hadoop ® 是 Apache 软件基金会的商标。StreamSets ® 及其相关标志和商标是 StreamSets Inc. 的注册商标。 Cloudera ® 是 Cloudera 的商标或商业外观。Greenplum 是 Pivotal Software, Inc. 在美国和其他国家/地区的商标。Kubernetes ® 是 Linux 基金会的注册商标。VMware ® 产品受 http://www.vmware.com/go/patents 上列出的一项或多项专利保护。VMware ® 是 VMware, Inc. 在美国和/或其他司法管辖区的注册商标或商标。PixStor™ 是 Arcapix Holdings 的商标。BeeGFS ® 是 Fraunhofer‑Gesellschaft zur Förderung der angewandten Forschung e.V. 的注册商标。NVIDIA ® 是 NVIDIA Corporation 在美国和其他国家/地区的注册商标。其他商标可能是其各自所有者的财产。于美国出版 12/20 解决方案简介 HPC‑ALGORTHMC‑TRD‑SB‑101