高级数据科学家和生物信息学家 Intelligencia AI,希腊雅典 2023 年 - 分子特性(ADMET)预测;临床试验结果预测;癌症治疗反应预测;生物医学知识图谱 机器学习研究员 Insilico Medicine,阿联酋(远程) 2023 年 分子特性(ADMET)预测;梯度提升;循环神经网络 (RNN);不确定性量化;软件设计 高级机器学习工程师/技术主管 Deeplab,希腊雅典 2020 年 - 2022 年 使用图神经网络 (GNN) 进行早期药物发现的虚拟筛选 研发主管;项目管理(2 名机器学习工程师);研究实习生监督(5 名培训生);资金获取(NVIDIA 加速器计划 ∼ 20,000 欧元);JEDI Billion Molecules 抗击 COVID-19 竞赛(入围团队);传播(1 项专利申请;2 篇出版物);研究与实验(模型训练和数据管理);软件开发;与利益相关者的演示和交流 基于 EEG 的脑机接口 (BCI) 和深度神经网络 研发主管;算法团队工程管理(4 名 ML 工程师);项目管理;软件设计和架构 研究助理(博士后) 英国纽卡斯尔大学工程学院 2018–2020 上肢肌电假肢控制的运动和机器学习 研究助理(博士后) 英国爱丁堡大学信息学院 2017–2018 深度学习应用于密码学 软件工程师 英国爱丁堡大学社会与政治科学学院 2013–2016 神经政治研究中 fMRI 实验的软件设计和开发 助教/实验室演示者 英国爱丁堡大学信息学院 2013–2017 ML 与模式识别;概率建模与推理;入门应用 ML;数据挖掘与探索;神经计算研究助理 英国南安普顿大学声音与振动研究所 (ISVR) 2012 用于人工耳蜗用户降噪和增强语音清晰度的 ML 算法
神经影像技术的最新进步引发了人们对了解感兴趣的解剖区域(ROI)之间复杂相互作用的越来越兴趣,形成了大脑网络,这些网络在各种临床任务中起着至关重要的作用,例如神经疗法发现和疾病诊断。近年来,图形神经网络(GNN)已成为分析网络数据的强大工具。然而,由于数据获取和监管限制的复杂性,大脑网络研究的规模仍然有限,并且通常仅限于当地机构。这些局限性极大地挑战了GNN Mod-捕获有用的神经电路模式并提供强大的下游性能。作为一个分布式机器学习范式,联邦学习(FL)通过在没有数据共享的情况下启用跨本地机构(即客户)的协作学习,为解决资源限制和隐私问题提供了有希望的解决方案。虽然在最近的FL文献中已经广泛研究了数据性质问题,但跨机构的大脑网络分析提出了独特的数据异质性挑战,也就是说,跨局部神经模仿研究的不一致的ROI ROI分析系统以及不同的预测性神经回路模式。为此,我们提出了FedBrain,这是一个基于GNN的个性化FL框架,考虑了大脑网络数据的独特属性。与现有的FL策略相比,我们的方法表现出了更高和更合适的性能,展示了其在基于跨机构连接的大脑成像分析中的强大潜力和概括性。具体而言,我们提出了一种联合地图集地图映射机制,以克服不同ROI图集系统引起的大脑网络的特征和结构异质性,以及由临床先验知识指导的聚类方法,以解决有关不同患者群体的不同预测性神经电路模式,神经模仿的模态和临床临床胜于现象。该实施可在此处获得。
MSC(COMPSC)2024-25提供的课程列表(以下列表未完成)Comp7103。数据挖掘(6个学分)数据挖掘是从大量数据中自动发现统计有趣且可能有用的模式。该课程的目标是研究当今用于数据挖掘和在线分析处理的主要方法。主题包括数据挖掘体系结构;数据预处理;采矿协会规则;分类;聚类;在线分析处理(OLAP);数据挖掘系统和语言;高级数据挖掘(Web,空间和时间数据)。comp7104。高级数据库系统(6个学分)该课程将研究数据库系统中的一些高级主题和技术,重点关注数据库系统设计和算法的各个方面,以及用于结构化数据的大数据处理。传统主题包括查询优化,物理数据库设计,事务管理,崩溃恢复,并行数据库。该课程还将调查选定领域的一些最新发展,例如NOSQL数据库和基于SQL的关系(结构化)数据的大数据管理系统。comp7106。大数据管理(6个学分)该课程将研究大数据中的一些高级主题和技术。它还将调查大数据管理和可扩展数据科学的特定领域的最新发展和进展。主题包括但不限于:大数据库管理技术,空间数据管理和空间网络,数据质量和不确定数据库,TOP-K查询,图形和文本数据库以及数据分析。comp7107。comp7108。复杂数据类型的管理(6个学分)课程研究不是简单标量的数据类型的管理和分析。这种复杂的数据类型包括空间数据,多维数据,时间序列数据,时间和时空数据,稀疏的多维矢量,设置值数据,字符串和序列,同质和异构图形,知识基础图,知识基础图,地理文字和地理 - 地理和地理数据。对于每种数据类型,我们将学习流行的查询和分析任务,以及用于主内存和磁盘的存储和索引方法。网络数据分析(6个学分)在数据时代,许多现实世界应用程序最能以网络表示。这种观点至关重要,因为分析这些网络可以发现有价值的见解,提取有趣的信息并做出明智的决定。现代技术已大大提高了我们访问大量数据,简化和降低存储成本的能力。了解数据的重要性对于应对各种挑战,例如交通拥堵,金融网络欺诈检测以及在社交网络中的错误信息的传播,仅举几例。因此,开发可以解决这些挑战的高级工具的必要性越来越多,并且进一步了解数据的重要性比以往任何时候都更加必要。这些技术的示例可以是机器学习技术(例如,使用GNN对不同的问题进行建模)和自然语言处理(NLP)技术(文本预处理和情感分析)。