评估文本是正面还是负面分析,是许多学科的广泛应用。自动化方法使得可以快速,复制且高度准确地编码几乎无限量的文本。与机器学习和大型语言模型(LLM)方法相比,基于词典的方法可能会牺牲一些性能,但是作为交换,它们提供了普遍性和独立性,同时至关重要地提供了识别阶段级别的可能性。我们使用Multilexscaled展示了Lexica的强劲性能,这种方法平均在许多广泛使用的通用词典中平均价值。我们通过一系列不同域的基准数据集对其进行验证,将性能与机器学习和LLM替代方案进行了比较。此外,我们通过对9/11英国后的穆斯林媒体报道进行分析来说明识别细粒情感水平的价值,即穆斯林的媒体报道,二氧化价指标会产生有关后9/11震动的性质不同(和错误的)结论,以及在宽阔的外观和大小写的范围内和大小之间的覆盖。可以在线上使用用于应用MultileXscaled的代码。
最先进的脑转文本系统在使用神经网络直接从脑信号解码语言方面取得了巨大成功。然而,目前的方法仅限于小型封闭词汇表,这对于自然交流来说是远远不够的。此外,大多数高性能方法都需要来自侵入式设备的数据(例如 ECoG)。在本文中,我们将问题扩展到开放词汇表脑电图 (EEG) 到文本序列到序列解码和自然阅读任务中的零样本句子情感分类。我们假设人类大脑充当特殊的文本编码器,并提出了一个利用预训练语言模型(例如 BART)的新框架。我们的模型在 EEG 到文本解码中获得了 40.1% 的 BLEU-1 分数,在基于零样本 EEG 的三元情感分类中获得了 55.6% 的 F1 分数,这明显优于监督基线。此外,我们表明,我们提出的模型可以处理来自各种主题和来源的数据,一旦有足够的数据,就显示出高性能开放词汇脑转文本系统的巨大潜力。该代码已在 https://github.com/MikeWangWZHL/EEG-To-Text 上公开供研究使用。
摘要。社交网络的快速增长产生了前所未有的用户生成数据,这为文本挖掘提供了绝佳的机会。情感分析是文本挖掘的重要组成部分,试图通过其内容和结构来了解作者对文本的看法。此类信息对于确定大量人的整体意见特别有价值。其实用性的示例正在预测票房销售或股票价格。用户生成的数据最容易访问的来源之一是Twitter,这使得其大多数用户数据通过其数据访问API免费获得。这项研究将预测Twitter上与股票相关的推文的情感价值,并证明这种情感与公司在实时流媒体环境中的股票价格的转移之间存在相关性。本研究数据范围从2018年到2024年。该研究表明,除一家公司以外,几乎所有公司的错误百分比均小于5%。在说明误差百分比小于5的地方,那么准确性很高,并且预测价格更准确。
在欧盟,ESI 的上升是由零售商、消费者以及服务业和行业经理(程度较小)信心增强所推动的,而建筑业信心保持稳定。在欧盟最大的经济体中,法国(+2.6)的 ESI 显著改善,意大利(+1.5)和德国(+0.9)的 ESI 改善程度较小。荷兰(-0.7)和西班牙(-0.4)的 ESI 恶化,波兰(+0.3)基本保持稳定。行业信心小幅改善(+0.3),自去年秋季以来基本保持平稳。虽然经理们的生产预期下降,但更少的经理认为成品库存过多/高于正常水平,这表明需求增加,他们对当前整体订单水平的评估也变得不那么悲观。在未进入信心指标的问题中,经理们对过去 3 个月生产变化和出口订单变化的评估有所改善。服务业信心也小幅上升(+0.4),因为管理者的需求预期有所回升,而他们对过去需求和过去商业状况的评估基本保持稳定。消费者信心继续复苏(+0.6),这要归功于消费者对家庭过去和预期财务状况的看法逐渐乐观,以及对本国总体经济状况的预期略有好转。消费者进行大宗采购的意愿保持稳定。零售贸易信心小幅反弹(+0.7),这得益于对过去商业状况的评估更加乐观,以及对库存充足性的看法有所改善。零售商的商业预期基本保持稳定。建筑业信心保持稳定(±0.0),因为建筑商的就业预期仅小幅好转,他们对订单水平的评估基本保持不变。建筑经理表示需求不足是限制建筑活动的一个因素,占比为 10%。
摘要 - 在线金融新闻的多种来源会影响市场的变动和交易者的决策。这强调了对准确的情感分析的必要性,除了拥有适当的算法交易技术之外,还需要做出更好的知情交易决策。标准词典的情感方法已经证明了他们在协助财务决策方面的权力。但是,众所周知,它们遭受与上下文灵敏度和单词顺序相关的问题。大型语言模型(LLM)也可以在这种情况下使用,但它们不是特定于金融的,并且倾向于需要大量的计算资源。为了促进特定于财务的LLM框架,我们介绍了一种基于Llama 2 7b基础模型的新方法,以便从其生成性质和综合语言操纵中受益。这是通过在一小部分监督财务情感分析数据上微调Llama2 7b模型来实现的,以共同处理金融词汇和环境的复杂性,并进一步为其提供基于神经网络的决策机制。这样的生成器分类器计划(称为Finllama)不仅受过培训,不仅是为了对情感造成分类,而且还量化了其实力,从而为交易者提供了对金融新闻文章的细微洞察力。补充这一点,通过洛拉(Lora)进行参数有效的微调实现,优化了可训练的参数,从而最大程度地降低了计算和内存需求,而无需牺牲准确性。索引术语 - 大语言模型,财务,情感分析,算法交易,参数有效的微调仿真结果证明了拟议中的Finllama提供了增强投资组合管理决策和增加市场收益的框架的能力。这些结果基于Finllama建造高回报投资组合的能力,即使在动荡的时期和不可预测的市场事件中,也表现出增强的弹性。
摘要 - 这项研究探讨了扩展现实(XR)产品,特别关注Apple Vision Pro,以阐明消费者的看法和这些创新技术的基本社会动态。这项研究深入研究了扩展现实(XR)产品,专门针对Apple Vision Pro,旨在了解消费者的看法和围绕这些创新技术的社会动态。通过利用情绪分析和社交网络分析(SNA)以及Crisp-DM和SVM算法,本研究为XR社区内的情感模式,网络结构和影响力因素提供了全面的见解。采用多方面的方法来实现研究目标。情感分析和SNA剖析情感模式和XR社区内的网络结构。CRISP-DM框架指导研究过程,确保系统的数据分析和解释。SVM算法对观点进行了分类,提供了一个强大的分析框架,以了解消费者对XR产品的情感。分析对XR消费者的看法和社会动态产生了重大见解。计算出的网络指标,包括密度为0.000124,不存在互惠,集中度为0.001331和模块化值为0.999000,XR社区中关键网络动态的启示。检查经常使用的单词在XR话语中揭示了普遍的主题,为理解消费者的情感提供了宝贵的背景。相比,具有SMOTE的SVM的精度为81.82%,精度为97.58%。此外,对SVM算法的评估表明了值得称赞的性能指标,而SVM没有SMOTE的准确率为84.33%,精度为84.67%,召回99.28%,F_Measure的召回率为91.39%。这项研究为XR产品的消费景观提供了宝贵的见解,主要关注Apple Vision Pro。通过结合情感分析,SNA和既定方法,该研究对XR社区内的消费者看法和社会动态提供了细微的理解。这些发现为战略决策提供了依据,并为XR技术的进步做出了贡献,为情感分析技术在理解消费者情感方面的功效提供了宝贵的见解。
摘要 - 本研究探讨了在产品评论的背景下,用于情感分析的Web爬行技术和机器学习算法的整合。随着电子商务平台和用户生成的内容的指数增长,了解消费者对产品的情感已越来越有价值。该研究提出了一种创新的方法,该方法结合了基于硒的网络爬网,从在线来源收集广泛的产品评论,并利用随机的森林分类器进行情感分析。研究方法涉及数据收集,预处理,模型培训和情感预测。通过这种合并的方法,该研究证明了该模型在各种产品评论范围内分类情感的功效。本文讨论了这种方法在协助业务方面的重要性,以大规模理解客户的反馈,从而促进明智的决策并增强用户体验。调查结果强调了这种方法的潜力,可以从在线平台上获得的大量非结构化数据中提取有价值的见解。索引术语 - RFC,TF-IDF,情感分析,Web crawler
摘要 近年来,人工智能研究已显示出造福人类和社会的巨大潜力。尽管人工智能在分类和模式识别任务中的表现往往优于人类,但它在需要常识推理的复杂任务(如自然语言理解)方面仍然举步维艰。在这种情况下,当前人工智能模型的主要限制是:依赖性、可重复性、可信度、可解释性和可解释性。在本文中,我们提出了一个基于常识的神经符号框架,旨在克服情绪分析背景下的这些问题。具体而言,我们采用无监督和可重复的亚符号技术(如自回归语言模型和核方法)来构建可信的符号表示,将自然语言转换为一种原始语言,从而以完全可解释和可说明的方式从文本中提取极性。
阅读时,我们的眼睛通过一系列注视和高速扫视浏览文本,以提取视觉信息。这一过程使大脑能够获得意义,例如关于书面文本中表达的情绪或情感价。大脑在自然阅读过程中如何提取单个单词的情感在很大程度上是未知的。这是由于自然成像的挑战,这导致研究人员之前采用高度控制、定时的逐字呈现缺乏生态效度的定制阅读材料。在这里,我们旨在评估自然阅读英语句子时词语情绪处理的电神经相关性。我们使用了一个公开的数据集,包括同步脑电图 (EEG)、眼动追踪记录和 400 个句子中的 7129 个单词的词级语义注释(苏黎世认知语言处理语料库;Hollenstein 等人,2018 年)。我们计算了注视相关电位 (FRP),即与注视开始时间锁定的诱发电反应。对从视觉和运动诱发活动中清除的 FRP 进行一般线性混合模型分析,结果显示,在注视开始后 224 – 304 毫秒间隔内,左中和右后电极簇中的积极和消极情绪条件之间存在地形差异。包括单词、短语和句子级情绪预测因子的额外分析显示,单词级情绪的 FRP 差异相同,但短语和句子级情绪没有额外的 FRP 差异。此外,从情绪匹配的 40 次试验平均 FRP 中对单词情绪(积极或消极)进行分类的解码分析显示平均准确率为 0.60(95% 置信区间:[0.58, 0.61])。控制分析排除了这些结果是基于眼球运动或语言特征的差异而不是词语情绪。我们的研究结果扩展了以前的研究,表明词汇语义刺激的情感价会在自然阅读过程中对单词注视产生快速的电神经反应。这些结果为在生态有效条件下识别词汇语义处理的神经过程提供了重要的一步,并可用于改进自然语言处理的计算机算法。
摘要 - 情绪分析在理解公众情绪方面起着至关重要的作用,尤其是在数字通信领域,因为每天都会产生大量的文本数据。本研究深入探讨了情绪分类模型,即朴素贝叶斯分类器 (NBC) 和支持向量机 (SVM),在情绪分析任务中经常遇到的不平衡数据集中的有效性。采用比较分析方法,以来自在线平台的机器人酒店评论数据集作为评估的基础。NBC 和 SVM 模型都经过训练和评估,使用和不使用合成少数过采样技术 (SMOTE),以纠正类别不平衡。性能评估依赖于关键指标,包括准确度、召回率、精确度、f 测量和曲线下面积 (AUC) 来衡量模型的有效性。研究结果表明,SVM 在准确率(SVM:76.88%,NBC:67.43%)、精确率(SVM:92.03%,NBC:86.87%)、召回率(SVM:58.88%,NBC:41.00%)、f 值(SVM:71.78%,NBC:55.63%)和 AUC(SVM:0.907,NBC:0.961)方面均优于 NBC。引入 SMOTE 后,两种模型的性能均显著提升,尤其是在解决类别不平衡问题方面。虽然 NBC 在精确率和召回率指标上表现更为均衡,但 SVM 在情感分类任务中展现出更高的准确率和预测能力。这些发现强调了算法选择和预处理技术在优化情感分析性能方面的关键作用,从而为从业者和研究人员提供了宝贵的见解。