空间和时间数据库:时间数据库:时间数据库的概述-TSQL2,TSQL2,空间数据库 - 空间数据类型 - 空间关系 - 空间数据结构 - 空间访问方法 - 空间访问方法 - 空间DB DB实现:分布式数据库,体系结构和设计:集中式数据库与非集中数据库,均质和异质DDBM,功能和体系结构,分布式数据库设计,DDBMS中的查询处理。Basics Introduction to NoSQL : Characteristics of NoSQL, NoSQL Storage types, Advantages and Drawbacks, NoSQL Products Interfacing and interacting with NoSQL: Storing Data In and Accessing Data from MongoDB, Redis, HBase and Apache Cassandra, Language Bindings for NoSQL Data Stores Understanding the storage architecture: Working with Column Oriented Databases, HBase Distributed Storage Architecture, Document商店内部。案例研究
深入了解数据结构和数据操作。了解监督和无监督学习模型,包括线性回归、逻辑回归、聚类、降维、K-NN 和管道。使用 SciPy 包及其子包(包括 Integrate、Optimize、Statistics、IO 和 Weave)执行科学和技术计算。使用 NumPy 和 Scikit-Learn 获得数学计算方面的专业知识。掌握推荐引擎和时间序列建模的概念。理解机器学习的原理、算法和应用。了解人工智能在不同领域的各种用例中的应用,如客户服务、金融服务、医疗保健等。实现经典的人工智能技术,如搜索算法、神经网络和跟踪。学习如何应用人工智能技术解决问题,并解释当前人工智能技术的局限性。设计和构建自己的智能代理,并应用它们创建实际的人工智能项目,包括游戏、机器学习模型、逻辑约束满足问题、基于知识的系统、概率模型、代理决策功能等。了解 TensorFlow 的概念、主要功能、操作和执行管道。掌握卷积神经网络、循环神经网络、训练深度网络和高级接口等高级主题。使用 Tableau 分析数据并熟练构建交互式仪表板 了解 Hadoop 生态系统的不同组件,并学习使用 HBase、其架构和数据存储,了解 HBase 和 RDBMS 之间的区别,并使用 Hive 和 Impala 进行分区。了解 MapReduce 及其特性,并学习如何使用 Sqoop 和 Flume 提取数据。使用最流行的库 Python 的自然语言工具包 (NLTK) 了解自然语言处理的基础知识。
• 在 2019 年至 2022 年连续四年被斯坦福大学评为世界前 2% 科学家之一。 • H 指数 = 35 • 精通大数据分析、数据科学、物联网、云计算和网络安全, • 8 年计算机科学和医疗保健跨学科环境的工作和研究经验。 • 8 年计算机科学教学经验。 • 精通计算机编程、统计分析和数据分析。 • 具有使用多节点 Hadoop 分布式文件系统 (HDFS)、MapReduce、Hive、HBase、Python 进行大数据分析的经验。 • 具有书籍章节、科学和拨款写作的经验。 • 语言:英语和泰米尔语流利。 • 国籍:印度永久居民。
数据以不同的形式和速度出现,这就是为什么Cloudera根据其特征提供了正确的机制来摄入,存储和查询数据的原因。Apache Nifi和Apache Flink提供流摄取和处理框架,而Hive LLAP和Impala为仓库提供了分析引擎。对于文本和非结构化数据,SOLR帮助索引和查询它,HBase为实时应用程序提供了动力。这就是为什么将数据可视化设计为通过在所有这些数据源中浮出视觉分析来汇总和驱动增强分析的原因。在单个仪表板或应用程序中,用户可以从数据仓库中引入饼图,该表显示了Solr Collection的片段搜索结果,并且已部署的ML模型的预测结果。此外,由于数据可视化建立在Cloudera上,因此数据消费者可以在任何公共云,本地或混合部署中轻松访问和可视化其数据。
经验丰富的专业人士,具有很强的分析和编程技能。我们的 SW 工程机会将使您成为一支熟练的软件开发人员团队的一员,该团队利用最新技术创建独特的软件解决方案,为作战人员提供支持。直接接触客户有助于在您设计和开发应用程序并看到它们在工作场所应用/使用时更好地了解他们的需求。我们主要使用基于 Microsoft 的技术;但是,我们也使用各种版本的 Linux 来实现特殊目的。我们开发基于客户端的应用程序,如 C#、Python 和 R。我们还使用 Java 或 ASP.NET 开发 Web 应用程序。我们使用最先进的技术,包括 NoSQL 数据库 (MongoDB、HBase、Solr) Hadoop 分布式文件系统 (HDFS)、并行处理、分布式计算、ArcGIS、提取、转换和加载 (ETL) 技术、自然处理语言、DevOps、持续集成/持续开发 (CI/CD)、容器化 .NET Core、SQL Server 数据库 (MS SQL、MariaDB) 和 SQL Server Integration Services。此外,我们正在使用 Docker 容器和其他云原生技术扩展到云开发,同时扩展到 AI/ML 功能。职责