语言:Python,Java,C,C ++,JavaScript技术领域:深度学习,强化学习,自然语言处理,完整的堆栈开发数据库:MySQL,Sqlite,Sqlite,MongoDB,MongoDB,PostgreSQL工具和服务: django,react,node.js
Python和C ++是我最常用的语言。我也有C#,Java,C和Matlab的经验。机器学习:Pytorch,Scikit-Learn和ML.Net。量子:量子网络模拟器NetSquid,量子开发SDK Qiskit和量子机学习库Torchquantum。GPU编程:CUDA和NUMBA。软件定义的无线电:GNU无线电。数据库:MySQL和SQLite。凸优化:Or-Tools和Cvxpy。
摘要:信用卡在当今的数字经济中起着至关重要的作用,并且它们的用法最近增长了,伴随着信用卡欺诈的相应增加。机器学习(ML)算法已用于信用卡欺诈检测。但是,信用卡持有人的动态购物模式和类不平衡问题使ML分类器难以实现最佳性能。为了解决这个问题,本文提出了一种可靠的深入学习方法,该方法由长期记忆(LSTM)和门控复发单元(GRU)神经网络组成,作为基础学习者在堆叠集合框架中,并以多层次的perceptron(MLP)作为元学习者。同时,使用混合综合少数族裔过采样技术和编辑的最近的邻居(Smote-enn)方法来平衡数据集中的类别分布。实验结果表明,将拟议的深度学习合奏与Smote-enn方法相结合,分别达到了1.000和0.997的敏感性和特异性,这比文献中其他广泛使用的ML分类器和方法优于其他广泛使用的ML分类器和方法。接下来,我们介绍了高级集合模型,包括堆叠和投票分类器,对原始和Smote-enn数据集进行评估。此外,具有SQLite集成的烧瓶框架可以使用户注册,签名和测试增强了项目功能和用户交互。索引术语 - 信用卡,深度学习,集合学习,欺诈检测,机器学习,神经网络。
Washington NASA Space Grant Seattle, WA Research Software Engineer March 2022 – Present • Awarded NASA Space Grant to build a global database of Southern Ocean phytoplankton species composition to combat climate change • Importing, cleaning, and merging ~15 datasets using Python, SQLite, and web API's • Publishing Python Jupyter notebook for geospatial data visualization and supporting oceanography/earth data科学用例•使用无监督的机器学习预测浮游植物物种的组成,以确定物种与生物生产和空气海洋二氧化碳的关系和空气 - 2022年7月7月2022年7月7日至2022年8月•指导〜90 〜90个高中生的Java/java/exporment covients covients covients seater/averient covients seater seettter• heat map of cases using TypeScript and ArcGIS maps to track COVID-19 spread precisely in UW buildings • Reached semi-final round of the hackathon PrismNotes ( www.prismnotes.com ) Seattle, WA Founder/Developer January 2019 – June 2021 • Built PrismNotes app to reduce test anxiety and combat mental health issues for students by providing a notes organization tool to create digital notebooks from handwritten notes.•使用Java,Microsoft的计算机视觉API和JSON数据在Android Studio中开发•使用OpenCV预处理和Tesseract OCR构建了高级图像搜索
*应与之相对应:电子邮件:avi.maayan@mssm.edu摘要摘要Gene表达式Omnibus(GEO)是转录组学和其他OMICS数据集的主要开放生物医学研究存储库。目前,它包含来自世界各地许多生物医学研究实验室收集的数万研究中的数百万个基因表达样品。虽然地理存储库的用户可以搜索描述用于查找相关数据集的研究的元数据,但当前没有任何方法或资源可以促进在数据级别上对GEO进行全局搜索。为了解决这一缺点,我们开发了Rummageo,这是一种WebServer应用程序,可实现基因表达签名搜索沉积在GEO中的大量人和小鼠RNA-Seq研究。为了开发搜索引擎,我们从ArchS4可获得的均匀对齐的GEO研究中对样本条件进行了离线自动识别。然后,我们计算出差异表达特征,以从这些研究中提取基因集。总共rummageo目前包含135,264个人和158,062个小鼠基因集,这些基因集从23,395个地理研究中提取。接下来,我们分析了Rummageo数据库的内容,以识别统计模式并执行各种全局分析。Rummageo数据库的内容作为签名搜索,PubMed搜索和元数据搜索功能提供了网络服务器搜索引擎。总的来说,Rummageo为生物医学研究社区提供了前所未有的资源,为许多未来的研究提供了假设的产生。Rummageo搜索引擎可从以下网站获得:https://rummageo.com/。引言基因表达综合(GEO)包含数以万计的转录组学研究,以及由RNA-Seq 1收集的超过200万个全基因组基因表达样品。这种大规模的转录组学谱分析涵盖了许多生物,疾病,药物治疗,遗传扰动,例如敲除,敲低和跨组织,细胞类型和细胞系的基因过表达。在GEO中的此转录组学数据可能很难搜索和重复使用,因为它主要是以RAW FASTQ文件格式提供的,并且有关每项研究条件的元数据,并且每项研究中的样本在格式中不一致,并遵循不同的命名约定2。通过标准化和重组地理元数据,已经进行了多次尝试,以使地理研究更好地搜索。例如,QeometAdb提供了一个R软件包和随附的SQLite数据库以在本地查询GEO数据集,从而提高了查询速度和Geo Metadata 3的可访问性。同样,Regeo使用自然语言处理(NLP)技术来提取时间点和疾病