摘要 - 主题建模是一种广泛使用的技术,用于从未标记的文本数据中提取隐藏的模式,从而促进了各种功能,例如文档组织,内容建议和检索。尽管传统上应用于英语文本,但主题建模最近在其他语言中获得了吸引力,包括孟加拉语,这是由于孟加拉语内容在线的日益增长的驱动而驱动。最近的研究已将某些主题建模方法应用于孟加拉语,但其在绩效方面的有效性尚未得到充分影响。本文介绍了Bert-LDA(一种混合主题建模的方法),应用于孟加拉新闻语料库,其中包括从在线孟加拉新闻门户收集的各种类别的文章。潜在的dirichlet分配(LDA)是一个概率模型,将每个文档表示为主题的混合,而Bert-LDA则利用了Bert上下文嵌入的语义丰富,结合了LDA的强大主题建模功能。通过整合两种方法的优势,我们的方法旨在提高本伽利文本主题建模的性能。实验结果表明,所提出的BERT-LDA模型始终优于各种评估指标的传统主题建模技术,从而在从孟加拉语文本数据中提取有意义的见解方面有了重大改进。
抽象的语法校正校正(GEC)工具,由先进的生成人工智能(AI)提供动力,在用户输入中有效地纠正了语言的不准确性。但是,它们通常在提供基本的自然语言解释方面缺乏,这些解释是学习语言并获得对语法规则的更深入的理解。在低资源语言(例如孟加拉语)中对这些工具的探索有限。在这样的语言中,革命错误说明(GEE)系统不仅应正确句子,而且还应提供错误的解释。这种综合方法可以帮助语言学习者寻求提高能力。我们的工作介绍了一个现实世界中的多域数据集,该数据集来自孟加拉语扬声器,具有不同的义务水平和语言复杂性。此数据集可作为GEE系统的评估基准标记,允许他们使用上下文信息来生成有意义的解释和高质量的更正。Various generative pre-trained large language models (LLMs), in- cluding GPT-4 Turbo, GPT-3.5 Turbo, Text-davinci-003, Text-babbage- 001, Text-curie-001, Text-ada-001, Llama-2-7b, Llama-2-13b, and Llama-2-70b, are assessed against human experts for performance comparison.我们的研究强调了自动部署孟加拉人GEE的当前最新生成预培训的LLM的局限性。主张进行人干预,我们的发现提议合并手动检查以解决语法错误并提高反馈质量。这种方法提出了一种更合适的策略,以重新确定孟加拉语的GEC工具,并阐明了语言学习的教育方面。
我们比较了开放量和封闭式LLM的性能,例如Llama-3和GPT-4与跨孟加拉语下流任务的微调编码器模型,包括翻译,摘要,汇总,释义,问答,提示和自然语言的推流。我们的发现表明,尽管LLM通常在执行任务方面表现出色,但它们在重新制定孟加拉语脚本生成的任务中的表现却是不明智的。关键挑战包括现有LLM对孟加拉脚本的效率低下,从而导致计算成本增加和潜在的性能退化。加法 - 我们重点介绍了通常用于孟加拉NLP任务的机器翻译数据集中的偏差。我们得出的结论是,孟加拉国面向的LLM非常需要,但是该领域通常缺乏为降低一个高效模型所需的高质量预科和指导调整数据集。*
01 Md. Jahidul Islam 先生,电力部门联合秘书。02 Md. Mofijul Islam 先生,总经理(副总工程师,主管),BPDB 商业运营总经理办公室,达卡。03 Md. Jabed Hossain 先生,项目总监(监理工程师,主管),BPDB 库米拉和迈门辛区配电预付费计量项目,达卡。04 Jakia Najnin Panna 女士,主任(监理工程师,主管),BPDB 培训与职业发展局,达卡。05 Anwarul Maruf 先生,副总监(执行工程师),BPDB 系统规划局,达卡。06 Md. Farhad Hossain 先生,执行工程师,BPDB 商业运营总经理办公室,达卡。 07 SM Niamul Haque 先生,副主任(执行工程师),BPDB 预付费计量系统理事会,达卡。08 Md. Bokul Islam 先生,副主任(执行工程师),BPDB 设计与检查-II 理事会,达卡。09 Md. Sarower Murshed 先生,副主任(执行工程师,主管),BPDB 采购理事会,达卡。10 Md. Touhidul Islam 先生,执行工程师(主管),BPDB Halishohor 销售与分销部,吉大港。
在编制航空情报包时,我们已注意确保其中包含的信息准确完整,但如发现任何错误或遗漏,以及与综合航空信息包有关的任何通信,请提交孟加拉民航局空中交通管理处航空信息服务主任(ATM),总部(新大楼),4 楼,库尔米托拉,达卡 - 1229,孟加拉国。电话 +880 2 -41091031,手机:+8801894903151,电子邮件:adaishq@caab.gov.bd
(咨询服务 — 公司选择) 国家:印度 项目:妇女赋权和包容性社会保护计划(西孟加拉邦建设包容性社会保护行动的国家能力 - WBSPO) 贷款编号/信贷编号/赠款编号/世界银行项目 ID:P172144 任务标题:项目管理单位 (PMU) 的选择 参考编号:EOI/2024/PMU/WBSPO for P172144dated 09.01.2024 世界银行通过 1.25 亿美元的贷款业务支持西孟加拉邦政府。该计划将持续到 2025 年,旨在加强西孟加拉邦建立一个包容和高效的社会保护体系的能力,从而增强弱势群体的权能。PforR 计划将通过支持政府扩大两个成果领域的州一级现有干预措施来实现这一目标。结果领域 1:加强对贫困和弱势家庭的现金转移支付:制定国家政策框架和统一交付系统(“Jai Bangla”)的工具,采用数字化机制,旨在向弱势和贫困家庭统一提供社会养老金,扩大覆盖面,改善国家计划的支出基准,并通过将信息技术与一线案例管理相结合,改善公民访问,以帮助降低当前计划的交付成本,并为各州未来的计划规划和财政整顿做好准备。成果领域 2:促进和扩大针对妇女和弱势群体的针对性服务:(a)建立和运营一个跨部门机构/平台,由妇女和儿童发展和社会福利部牵头,财政部、私营部门领导人和民间社会等相关政府利益攸关方参与,解决该州女性劳动力议程中的领导和协调真空问题,通过制定公共-私营-民间社会伙伴关系的监管和治理规范来提高妇女的劳动力参与率,每年审查影响职业妇女的制约因素和国家干预措施的有效性,