摘要算法偏见是教育环境中机器学习模型中的主要问题。但是,它尚未在亚洲学习环境中进行彻底研究,并且只有有限的工作才考虑了基于区域(亚国家)背景的算法偏见。作为解决这一差距的一步,本文研究了菲律宾一所大型大学的5,986名学生的人口,并根据学生的区域背景调查了算法偏见。大学在广泛领域的在线课程中使用了画布学习管理系统(LMS)。在三个学期的典范上,我们收集了4870万个学生在画布中活动的日志记录。我们使用这些日志来训练从LMS活动中预测学生成绩的二进制分类模型。表现最佳的模型达到0.75,加权F1得分为0.79。随后,我们根据学生区域检查了偏见的数据。使用三个指标进行评估:AUC,加权F1得分和MADD在所有人口组中均显示出一致的结果。因此,在年级预测中对特定学生群体没有观察到不公平。
●您的建议如何响应评估标准(请参见下文); ●您对项目的假设; ●您已经确定并采取适当的缓解措施的风险; ●有关您的费用的信息; ●提出的实施时间表; ●过去工作的例子; ●来自其他类似客户的参考; ●标准C40 CV模板中提议的关键人员的简历●您需要使项目取得成功所需的任何其他支持,包括第三方或C40员工需要的任何输入; ●提出了与C40的合作伙伴关系,包括(适用)项目治理和管理,关键人员,关键角色和责任以及问题的升级程序。
1 弗莱堡大学医学中心骨科和创伤外科系,弗莱堡大学医学院,弗莱堡 79108,德国;sara.uelkuemen@hotmail.de(S.Ü.);pm.obid@gmail.com(PO);gernotmichaellang@gmail.com(GML)2 洛雷托医院脊柱外科系,弗莱堡 79100,德国;frank.hassel@rkk-klinikum.de(FH);alisia.zink@gmail.com(AZ)3 帕拉塞尔苏斯医科大学实验神经再生研究所、脊髓损伤和组织再生中心萨尔茨堡(SCI-TReCS),奥地利 5020 萨尔茨堡; s.couillard-despres@pmu.ac.at 4 海德堡大学医院口腔颌面外科系,69120 海德堡,德国;veronika.shavlokhova@med.uni-heidelberg.de 5 奥地利组织再生集群,1200 维也纳,奥地利 6 医学情报与信息学,慕尼黑工业大学医学院 Rechts der Isar 医学中心,81675 慕尼黑,德国;martin.boeker@tum.de * 通信地址:babak.saravi@jupiter.uni-freiburg.de
Layton,D。“ Chatgpt - 我们如何到达今天的位置 - GPT开发的时间表。” https://medium.com/@dlaytonj2/chatgpt-how-we-we-got-to-wher-we-we-are-today-a-timeline-timeline-fppt-development-f7a35dcc660e(2023)。Lubbad,M。“ GPT-4参数:无限制指南NLP的游戏规则改变者。”https://mlubbad.medium.com/the-ultimate-guide-to-gpt-4-parameters-verything-nything-to-to-to-to-to-to-about-about-about-about-about-about-nlps-changer-changer-109b87678555a(2023)。Shree,P。“开放AI GPT模型的旅程。”https://medium.com/walmartglobaltech/the-journey-open-open-ai-gpt-models-32d95b7b7fb2(2020)。
是否有不同的神经网络,接受过各种视觉任务的培训,共享一些共同的表示?在本文中,我们证明了我们在具有不同体系结构,不同任务(生成和歧视本地)以及不同类型的监督(班级监督,私人文本,文本监督,自学,自我求职,自我求助)的一系列模型中称为“ Rosetta神经元”的存在。我们提出了一种用于挖掘跨多种流行视觉模型的Rosetta神经元词典的算法:类监督 - Resnet50,Dino-Resnet50,Dino-Vit,Mae,Mae,Clip-Resnet50,Big-Gan,Big- Gan,stylegan-gangan-2,stylegan-xl。我们的发现表明,某些视觉概念和结构在自然世界中固有地植根于自然界,并且可以通过不同的模型来学习,而不论特定的任务或体系结构,并且不使用语义标签。,由于我们的分析中包含的生成模型,我们可以直接可视化共享概念。Rosetta神经元促进了模型对模型翻译,实现了各种基于反转的操作,包括跨级比对,变化,放大等,而无需进行专业培训。
我们研究了深层生成模型对即将到来的计算机视觉模型中潜在社会偏见的影响。互联网目睹了a-a-a-a-aford图像的涌入,因此对可能伴随的固有偏见产生了担忧,这可能导致有害内容的分离。本文探讨了如果将生成的图像用作未来模型的训练数据,是否会发生有害的反馈回路,导致偏差。我们通过逐步将可可和CC3M数据集中的原始图像替换为通过稳定的差异生成的图像来进行模拟。修改后的数据集用于训练OpenCLIP和图像字幕模型,我们根据质量和偏差进行评估。与期望相反,我们的发现表明,在训练期间引入产生的图像并不能统一扩大偏见。相反,观察到跨特定任务的偏置缓解实例。我们进一步阐述了可能影响这些现象的因素,例如图像生成中的伪像(例如,模糊的面孔)或原始数据集中的预先偏见。
A. 互联网 互联网的发展可以说是过去 60 年中最重大的工程成就,如今它将数十亿人彼此连接在一起,并将他们与数十亿台设备连接在一起,能够快速交换不同格式的数字信息。互联网建立在 19 世纪初电报的基础之上。如此复杂的系统,不断被修改和添加,被如此多的人用于关键服务,怎么会表现得如此出色?互联网协议套件 [3] 是其主要构建模块之一,它将互联网抽象为四层。从下往上,这些层称为链路层、网络层、传输层和应用层。每一层都提供连接机器和人的服务。特定层的服务被上一层的服务使用,反过来也使用下一层的服务。