摘要。ChatGPT 以其对提示生成详细、原创和准确响应的能力震惊了世界。然而,虽然它为以前被认为无法解决的问题提供了解决方案,但它也引入了新的问题。其中一个问题就是被称为幻觉的现象,即生成的内容无意义或与提供的源内容不符。在这项工作中,我们提出了 SenticNet 8,这是一个利用常识知识表示和分层注意力网络集合的神经符号 AI 框架,旨在缓解情感计算背景下的一些问题。特别是,我们专注于情绪分析、性格预测和自杀意念检测的任务。结果表明,SenticNet 8 在所有四个基线(即:词袋、word2vec、RoBERTa 和 ChatGPT)上均表现出卓越的准确率。此外,与这些基线不同的是,SenticNet 8 也是完全可解释、值得信赖和可说明的。
I. 引言基于神经网络的方法,特别是深度学习,是人工智能研究的一个新兴领域,并且在我们进入数字时代时成功处理了不断增长的数据量。如今,基于神经网络的方法不仅用于识别物体和识别关键词等低级认知任务,而且还被部署在各种工业信息系统中,以协助高级决策。在自然语言处理领域,过去十年有两个里程碑:一个是word2vec [1],这是一组从大型数据集中学习词嵌入(单词的向量表示)的神经模型;一个是基于GPT的最新模型[2],它将强化学习与生成式转换器相结合,以实现多轮端到端对话。虽然这些基于神经网络的模型可以对数据集进行高度准确的预测并生成类似人类的话语,但它们对数据的内部特征和表示却几乎没有提供任何理解。随后,许多问题和担忧都源于这个黑箱问题。由于其中一些问题和担忧也与情绪分析有关,我们在下面列出了其中五个:
大型企业面临着实现可持续发展目标(SDG)的关键当务之急,尤其是目标13,该目标着重于打击气候变化及其影响。减轻气候变化的效果,减少企业范围3(供应链排放)至关重要,因为它占总排放库存的90%以上。但是,跟踪范围3的排放证明了挑战,因为必须从数千个上游和下游供应商那里收集数据。为了应对上述挑战,我们提出了一个首个框架,该框架使用适应域的NLP基础模型来估算范围3的范围3排放,该框架将金融交易用作购买商品和服务的代理。我们将提出的框架的性能与最先进的文本分类模型(例如TF-IDF,Word2Vec和零射击学习)进行了比较。我们的结果表明,适应领域的基础模型优于最先进的文本挖掘技术,并且表现效果以及主题专家(SME)。拟议的框架可以加速企业量表的范围3估计,并有助于采取适当的气候行动以实现SDG 13。
摘要:响应现代生活的忙碌速度,越来越需要智能手机网络应用程序来简化餐食的准备。我们的项目旨在通过开发由计算机视觉和机器学习等技术提供动力的复杂食谱建议系统来满足这一需求。主要目的是简化用户的烹饪体验,这些用户经常发现自己不确定自己在手头上烹饪的食材。通过利用计算机视觉技术,我们的系统可以准确识别用户可用的成分。然后使用机器学习算法对此信息进行处理,以生成量身定制的食谱建议。这种方法消除了对大量进餐计划或手动食谱搜索的需求,从而节省了用户的宝贵时间和精力。为了解决这个问题,我们准备了一个成分数据集,其中包含15个食品成分类别的图像12,558张图像。Yolov8对象检测模型用于检测和分类食品成分。此外,推荐系统是使用机器学习构建的。最后,我们的准确度为96%,这是令人印象深刻的。关键字:对象检测,Yolov8,FastApi,TF-IDF,Word2Vec。
研究人员已经开始利用 Twitter 提供的新的地理定位信息来源,提供关于各种空间视角的见解,包括本地化人格特质和心脏病的地理差异(Eichstaedt 等人,2015 年;Obschonka 等人,2019 年)。同样,语言学分析利用社交媒体的大数据来揭示区域语言差异(Grieve 等人,2018 年)。本研究应用大数据分析来探索创新地理中的无形要素。我们将从美国专利商标局收集的人均专利空间聚类(Pat_Cap)与反映社交媒体讨论和围绕技术创新相关主题的“热议”的新变量进行比较。这个变量被标记为 InnoTech_Tw,基于 2014 年美国各县 8.9 亿条地理编码推文中约 89 亿个单词的语料库(有关该数据集的更多信息,请参阅 Grieve 等人,2018 年)。它被定义为美国每个县所有单词的相对频率之和,按它们与创新和技术这两个术语的余弦相似度加权,通过将 word2vec 算法应用于 300 万个单词的 300 维向量数据集而获得,该数据集在约 100 个语料库上进行训练
高维计算代表了一种相对不同的方法来接近人工intel-intel-ligence,而不是成为主流。它专注于使用连接范式与一组简单的代数操作的使用,以形成一个强大的框架来表示观察。在本文中,我们展示了这些代数操作如何用于为超维语言模型构建并行算法。我们首先提出一个问题,即从工程和科学的角度来看,为什么这是有用的。然后,我们展示了如何构建DI设并行算法来回答这些问题的每个问题。一种算法着重于将数据分配给DI设工人,以最大程度地减少运行时,而另一种算法则侧重于分布不同的嵌入技术,以便在大脑启发的过程中进行并行学习。这两种算法都能够实现出色的效率,但是将数据分配到多个工人的算法是最有效的。我们将这些方法与流行的Word2Vec模型进行了比较,并显示它们如何在用于测试单词嵌入的原始指标之一(TOEFL测试)上胜过它们。最后,我们描述了我们对未来工作的愿景,特别是使用算法与语言和视觉的联合超二维模型并行学习多模式嵌入。
摘要 — 及时识别对域生成算法 (DGA) 域的 DNS 查询在减轻恶意软件传播及其潜在影响方面起着至关重要的作用,尤其是在阻止协调的僵尸网络活动方面。我们推出了 Dom2Vec,这是一种创新方法,通过利用仅从 DNS 查询中观察到的域名中派生的词典特征来快速检测 DGA 生成的域。Dom2Vec 利用词嵌入将从域名中提取的标记映射到高度富有表现力的表示中。然后将这些表示与基于声誉的域名评分系统相结合,该系统利用 n-gram 与白名单域列表相关的共现频率。域嵌入、声誉分数和从域名派生的其他有意义的词典特征的融合为 AI/ML 驱动的 DGA 检测提供了强大的域名表示。通过对包含 25 个不同 DGA 域系列的数据集进行实验评估,我们证明 Dom2Vec 明显优于当前最先进的 DGA 检测和分析方法,将我们之前基于信誉评分的检测系统提高了至少 30%,误报率低于 1%。索引术语 —DGA 检测、Word2Vec、TF-IDF、n-gram、词典分析、DNS、机器学习。
背景与目标:近年来,由于基因表达水平的潜在临床应用,预测基因表达水平至关重要。在此背景下,Xpresso 和其他基于卷积神经网络和 Transformer 的方法首次被提出用于此目的。然而,所有这些方法都使用标准的独热编码算法嵌入数据,从而产生非常稀疏的矩阵。此外,该模型没有考虑基因表达过程中最重要的转录后调控过程。方法:本文提出了 Transformer DeepLncLoc,一种通过处理基因启动子序列来预测 mRNA 丰度(即基因表达水平)的新方法,将该问题作为回归任务进行管理。该模型利用基于 Transformer 的架构,引入 DeepLncLoc 方法执行数据嵌入。由于 DeepLncloc 基于 word2vec 算法,因此它避免了稀疏矩阵问题。结果:该模型包含了与 mRNA 稳定性和转录因子相关的转录后信息,与最先进的方法相比,其性能显著提高。Transformer DeepLncLoc 的 R 2 评估指标达到 0.76,而 Xpresso 的 R 2 评估指标为 0.74。结论:Transformer 方法中的多头注意力机制适用于对 DNA 位置之间的相互作用进行建模,从而克服了循环模型。最后,在管道中整合转录因子数据可显著提高预测能力。
Dharma,Eddy Muntina,F。LumbanGaol,H。Leslie,H。S。Warnars和B. Soewito。“ Word2Vec,Glove和FastText之间的准确性比较涉及卷积神经网络(CNN)文本分类。” J理论Appl Inf Technol 100,No。2(2022):349-359。Wang,Jie,Bingxin Xu和Yujie Zu。 “基于方面的情感分析的深度学习”。在2021年国际机器学习与智能系统工程会议(MLISE),pp。 267-271。 IEEE,2021。 Zadeh,Amir,Minghai Chen,Soujanya Poria,Erik Cambria和Louis-Philippe Morency。 “用于多模式分析的张量融合网络。” Arxiv预印型ARXIV:1707.07250(2017)。 al Amrani,Yassine,Mohamed Lazaar和Kamal Eddine El Kadiri。 “基于情感分析的基于媒介的随机森林和支持媒介的混合方法。” Procedia计算机科学127(2018):511-520。 santos,法蒂玛·C·卡里利奥。 2023。 “虚假发现自动检测中的人工智能:主题分析”新闻和媒体4,第1期。 2:679-687。 https://doi.org/10.3390/journalmedia4020043 Siddiqua,Umme Aymun,Abu Nowshed Chy和Masaki Aono。 “使用基于注意力的神经集成模型进行推文立场检测。”在计算语言学协会北美分会2019年会议论文集:人类语言技术,第1卷(长篇小说),第1卷, 1868-1873。 2019。Wang,Jie,Bingxin Xu和Yujie Zu。“基于方面的情感分析的深度学习”。在2021年国际机器学习与智能系统工程会议(MLISE),pp。267-271。IEEE,2021。Zadeh,Amir,Minghai Chen,Soujanya Poria,Erik Cambria和Louis-Philippe Morency。“用于多模式分析的张量融合网络。” Arxiv预印型ARXIV:1707.07250(2017)。al Amrani,Yassine,Mohamed Lazaar和Kamal Eddine El Kadiri。“基于情感分析的基于媒介的随机森林和支持媒介的混合方法。” Procedia计算机科学127(2018):511-520。santos,法蒂玛·C·卡里利奥。2023。“虚假发现自动检测中的人工智能:主题分析”新闻和媒体4,第1期。2:679-687。 https://doi.org/10.3390/journalmedia4020043 Siddiqua,Umme Aymun,Abu Nowshed Chy和Masaki Aono。 “使用基于注意力的神经集成模型进行推文立场检测。”在计算语言学协会北美分会2019年会议论文集:人类语言技术,第1卷(长篇小说),第1卷, 1868-1873。 2019。2:679-687。 https://doi.org/10.3390/journalmedia4020043 Siddiqua,Umme Aymun,Abu Nowshed Chy和Masaki Aono。“使用基于注意力的神经集成模型进行推文立场检测。”在计算语言学协会北美分会2019年会议论文集:人类语言技术,第1卷(长篇小说),第1卷,1868-1873。2019。
最近,生成式机器学习模型的输出质量得到了一定程度的提高,开辟了新的使用途径。这种质量的提高导致了商业生成平台的出现,用户可以在其中创建任意的文本和图像提示,以便快速生成大量图像。这些图像有时用作完成的创意结果,有时用作进一步手动编辑或设计构思的基础。从手动草图到图像编辑器和 3D 渲染,各种传统的可视化方法每天都在建筑设计中使用。建筑师很快就对生成方法产生了兴趣,正如 AEC 杂志 (2022) 的特别版所反映的那样。这项新技术在公众中得到了广泛讨论,从其具体用例到其开发方式的伦理以及它将带来哪些变化。在本文中,我们希望利用 Midjourney 平台的开放性以定量方式分析当前的建筑用例和功能。我们通过多种方法分析了 5800 万个查询,包括 word2vec 等 NLP 方法。我们考虑了这些模型背后的相关技术部分,并将研究它们如何使现在和将来的建筑师受益。图像生成模型的当前技术基础是所谓的扩散方法。Sohl-Dickstein 等人(2015 年)首次引入了正向扩散,它会逐步破坏图像中的结构化信息,而反向扩散则试图重新生成丢失的信息。然而,由于原始图像信息已被破坏,反向扩散至少部分起作用
