科技领域瞬息万变,特别是在大数据、人工智能的浪潮下,一些国家出台了诸多科技政策来推动科技发展。通过对科技政策文本的分析挖掘,可以看到各国科技政策的重点布局、重点领域和发展脉搏。与学术论文不同,科技政策文本不带有关键词,需要从大量长篇科技政策文本中提取关键词。科技政策文本既会涉及科技项目、创新机制、成果转化、产业支持、科技奖励、科技管理与配置,也会涉及其他具体的科技内容,如研究前沿、高新技术、行业共性技术、颠覆性技术等。
对于现代世界和我们目前的文明来说,第一台可编程数字计算机的发明发生在 20 世纪 40 年代,这是一台基于数学推理的机器,这些知识和想法启发了一些科学家认真考虑构建人工智能。现代世界还知道,英国博学者艾伦图灵在 1950 年提出了决策科学、人工智能和机器解决现实世界问题的概念。第一个商用、数字和可编程机器人是由 Geroge Devol 于 1954 年制造的,人工智能研究领域成立于 1956 年夏天在达特茅斯学院举行的一次研讨会上。但现代世界并不知道人工智能 (AI) 的起源可以追溯到 8000 到 11000 年前,印度古代圣贤们创造了具有智慧或意识的人工智能神话、故事和传言。现代人工智能的种子是由古典哲学家种下的,他们试图将人类思维过程描述为符号的机械操作。这项工作最终通过知识和思想达到了顶峰,这些知识和思想关于我们今天所见证的许多技术进步已经在印度教的圣书中得到阐述,例如《罗摩衍那》、《摩诃婆罗多》、《薄伽梵歌》、《吠陀经》和《奥义书》,据信这些圣书写于 5000 至 8000 年前(公元前 3000 年 - 公元前 6000 年)。这些不仅是印度文明的神圣史诗,也是印度存在的证据。用人类存在的最古老语言“梵语”写成的古印度文本的内容从现代科学的角度来看也被视为“自然语言”。奥义书和 Advaita Siddhanta 中存在的现代科学元素以及玛雅的本质类似于现代科学意识。这种意识进一步用于理解人类的心理过程和对其进行建模的方法,为人工智能的自然语言理解领域做出贡献。吠陀概念对于有效领导和人工智能(AI)的未来是合适的,也是必要的。这个概念是将人造机器与吠陀经文中描述的意识形态结合起来,用更好的机器构建一个更美好、更智能的世界。自然语言处理具有自然语言输入和输出,可提供更好的人机界面。本文探讨了人工智能概念的起源及其在古印度文献和其他技术描述中的存在,并提供了现代科学证据;还回顾了梵语作为计算机可能的自然语言输入。
Asriani Abbas 4 哈桑努丁大学 印尼文学研究项目 文化科学系,望加锡,印尼 摘要——机器翻译作为人工智能 (AI) 的使用不断增加,世界上最受欢迎的翻译工具是谷歌翻译 (GT)。该工具不仅用于通过翻译学习和获取外语信息,而且还被用作医院、机场和购物中心互动和交流的媒介。本文旨在探讨机器翻译在翻译法语-印尼语烹饪文本 (食谱) 中的准确性。烹饪文本样本取自互联网。研究结果表明,GT 中机器翻译的符号模型是通过强调源语言和目标语言的概念 (所指) 的等价性,从源语言的能指 (形式) 翻译成目标语言的能指 (形式)。GT 有助于通过单词、短语和句子翻译现有的法语-印尼语烹饪文本概念。烹饪文本机器翻译中遇到的一个问题是文化等值。GT 机器翻译无法准确识别源语言和目标语言的文化背景,因此结果是直译的形式。但是,可以通过从一种语言到另一种语言的单词、短语和句子细化文化等价物的翻译来提高 GT 的准确性。
知识共享 (CC) 开放许可为每个人(从个人作者到政府和机构)提供了一种简单、标准化的方式来授予其创作作品的版权许可。CC 许可允许创作者保留版权,同时允许其他人根据许可条款复制、分发和使用其作品。CC 许可确保作者获得其作品的荣誉(署名),在全球范围内工作,并且只要适用的版权有效,该许可就一直有效。CC 许可不会影响法律授予受版权保护的创作作品用户的自由(例如合理使用权)。7
本研究基于多篇文本中呈现的信息,考察了本科生在学习复杂且有争议的话题(即美国的大规模监禁)时的策略使用情况。在多篇文本学习综合框架的指导下,本研究指导学生在学习多篇文本时采用三种策略使用形式之一。具体来说,要求学生识别文本中的相关和重要信息(即文本内处理),在文本之间建立关系或联系(即文本间处理),或识别文本中容易或难以理解的信息(即元认知处理)。除了收到指导他们参与这些处理模式的任务指令外,还为学生提供了一个突出显示工具来支持他们的策略使用(例如,在文本内处理条件下,允许将重要和相关信息标记为绿色)。这种突出显示工具还使研究人员能够收集学生显性策略使用的日志数据。研究发现,学生根据其分配的处理条件表现出不同的策略使用模式。此外,研究发现,学生使用针对多种文本的策略可以预测多种文本任务的表现。
语音识别是计算语言学的一个重要领域[CRS05、CFL13]。多年来,研究人员已经开发出各种技术和工具来识别口语中的单词和短语[JM14、BMG∗16、HM15a]。最近,人工智能技术,特别是深度学习网络,已经具有革命性,因为它们超越了以前的方法,并且在语音转文本的结果中带来了高质量和低错误率[HDY∗12、MLJ∗14]。许多大公司已经使用深度学习模型提供基于云的语音转文本服务,例如微软[Mic]、谷歌[Goo19]等。来自多个领域的用户都渴望将这些人工智能工具用于实际应用,如进行实地调查和收集用户意见 [BZK12、HM15b、Muh15]。然而,转录结果仍然存在一系列实际问题,包括:(1)完整的语音被识别为一组片段,这些片段通常不能代表说话者的自然句子或段落;(2)音频识别错误不可避免,且质量差异很大;(3)语音识别算法给出的单词和片段的置信度得分有时不能反映出真实的误识别概率。这些问题已经阻碍了语音转文本工具的更广泛使用 [KRS17]。领域科学家在收集来自多个说话者的长音频时面临着有效完成以下任务的挑战:
按照解释学的思路,我们提出了一种通过从给定文本中提取相关模式来进行风格表征的知识发现过程,重点是风格的句法维度。这个知识发现过程包括两个主要步骤,一个顺序模式挖掘步骤,然后应用一些兴趣度度量。特别是,提取给定长度的所有可能的句法模式被提出作为在探索性场景中提取有趣特征的一种特别有用的方法。显然,模式的激增和人类难以理解大量结果是这种方法的主要障碍。因此,我们在这种情况下使用兴趣度度量来处理和减少如此大量的模式,以识别最相关的模式。我们建议对三种提出的兴趣度测量方法进行实验评估并报告结果,每种方法都基于不同的理论语言学和统计背景。