大型语言模型 (LLM) 越来越多地用于生成各种用例中的文本,包括新闻文章。鉴于这些 LLM 可能用于大规模生成虚假信息的潜在恶意性质,为此类 AI 生成的文本构建有效的检测器非常重要。鉴于新 LLM 开发的激增,获取监督检测器的标记训练数据是一个瓶颈。但是,可能有大量未标记的文本数据可用,而没有关于它来自哪个生成器的信息。在这项工作中,我们解决了这个数据问题,即检测 AI 生成的新闻文本,并将问题构建为无监督领域自适应任务。这里的域是不同的文本生成器,即LLM,我们假设我们只能访问标记的源数据和未标记的目标数据。我们开发了一个对比域自适应框架,称为 ConDA,它将标准域自适应技术与对比学习的表示能力相结合,以学习对最终无监督检测任务有效的域不变表示。我们的实验证明了我们框架的有效性,平均性能提升了 31 .与最佳表现基线相比提高了 7%,在 0 .全监督检测器的 8% 范围内。我们所有的代码和数据都可以在这里找到。
2 安装 7 2.1 快速入门 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.1 PEP 517 源代码构建 . . . . . . . . . . . . . . . 9 2.4.2 直接 Setuptools 源代码构建 . . . . . . . . . . . . . . . . 9 2.5 在 Windows 上安装 . . . . . . . . . . . . . . .................................................................................................................................................................10 2.6 验证安装....................................................................................................................................................................10 2.7 检查版本信息....................................................................................................................................................11
2 安装 7 2.1 快速入门 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.1 PEP 517 源代码构建 . . . . . . . . . . . . . . . . 9 2.4.2 直接 Setuptools 源代码构建 . . . . . . . . . . . . . . . . . 9 2.5 在 Windows 上安装 . . . . . . . . . . . . . .................................................................................................................................................................................10 2.6 验证安装....................................................................................................................................................................................10 2.7 检查版本信息....................................................................................................................................................................11
2 安装 7 2.1 快速入门 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.1 PEP 517 源代码构建 . . . . . . . . . . . . . . . . 9 2.4.2 直接 Setuptools 源代码构建 . . . . . . . . . . . . . . . . . 9 2.5 在 Windows 上安装 . . . . . . . . . . . . . .................................................................................................................................................................................10 2.6 验证安装....................................................................................................................................................................................10 2.7 检查版本信息....................................................................................................................................................................................11
2 安装 7 2.1 快速入门 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.4.1 PEP 517 源代码构建 . . . . . . . . . . . . . . . . 9 2.4.2 直接 Setuptools 源代码构建 . . . . . . . . . . . . . . . . . 9 2.5 在 Windows 上安装 . . . . . . . . . . . . . .................................................................................................................................................................................10 2.6 验证安装....................................................................................................................................................................................10 2.7 检查版本信息....................................................................................................................................................................11
3 下载 5 3.1 源代码 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ................. ... ..................................................................................................................................................................6 3.2.3 Mac OS.....................................................................................................................................................................................................6 3.2.4 Android.....................................................................................................................................................................................................6 3.2.4 Android.....................................................................................................................................................................................................................6 3.2.5 Android..................................................................................................................................................................................................................... 6 3.2.5 跨平台软件包管理器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 。 。 。 。 。 。 。 。 。 。 。 。 8 3.2.5.3 包装。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 8 3.3 容器。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 8 3.4 文档。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 8
图表 图 1. Cogent NGS Immune Profiler 分析工作流程。 ........................................................................................................... 7 图 2. immunity_profiler 目录的可视化图,包括文件和文件夹。 ................................................................................ 9 图 3. 如何验证操作系统的 Java 版本 ...................................................................................................................... 10 图 4. 显示成功检查基本 Conda 环境的 Linux 命令行屏幕截图 ............................................................................. 10 图 5. cogentip -h 命令的输出。 ......................................................................................................................... 13 图 6. cogentip report -h 命令的输出。 ........................................................................................................... 17 图 7. 示例 umi_group_sizes_frequency。.png 图。................................................................ 18 图 8. 示例 umi_cutoffs.template.csv 文件内容。...................................................................................... 19 图 9. test_input / 中的文件夹结构和文件。............................................................................................. 25 图 10. test_output/ 文件夹中的文件夹结构和文件......................................................................................... 26
摘要 动机 在序列中寻找概率基序是注释假定转录因子结合位点 (TFBS) 的常见任务。有用的基序表示包括位置权重矩阵 (PWM)、双核苷酸 PWM (di-PWM) 和隐马尔可夫模型 (HMM)。双核苷酸 PWM 结合了 PWM 的简单性(矩阵形式和累积评分函数),但也加入了基序中相邻位置之间的依赖关系(不同于忽略任何依赖关系的 PWM)。例如,为了表示结合位点,HOCOMOCO 数据库提供了来自实验数据的 di-PWM 基序。目前,两个程序 SPRy-SARUS 和 MOODS 可以在序列中搜索 di-PWM。结果 我们提出了一个 Python 包 dipwmsearch,它为这项任务提供了一种原创且高效的算法(它首先枚举 di-PWM 的匹配词,然后立即在序列中搜索它们,即使它包含 IUPAC 代码)。用户可以通过 Pypi 或 conda 轻松安装,使用文档化的 Python 界面和可重复使用的示例脚本,从而顺利使用 di-PWM。可用性和实施:dipwmsearch 可在 https://pypi.org/project/dipwmsearch/ 和 https://gite.lirmm.fr/rivals/dipwmsearch/ 下根据 Cecill 许可获得。
动机:基因组数据的准确分类学分配在各种生物数据库中至关重要。近年来提交的基因组迅速增加,确保精确的分类对于维持数据库完整性很重要。标签错误的基因组可能会使研究人员混淆,阻碍分析并产生错误的结果。因此,对于计算有效的工具的迫切需要,可以确保将数据存储到基因组数据库中的准确分类分类。结果:在这里,我们介绍了基于NCBI和GTDB分类法的原核基因组的质量控制和分类分类工具。我们针对NCBI分类学分配了DFAST_QC的表现,显示出与它们的高度一致性。我们的结果表明,DFAST_QC与NCBI分类学分类达到了很高的一致性。可用性和实现:dfast_qc在Python中实现,并且可以作为Web服务(https://dfast.ddbj.nig.ac.ac.jp/dqc)和独立命令行工具提供。源代码可在GPLV3许可证下获得:https://github.com/nigyta/dfast_qc,并且Conda软件包也可从Bioconda获得。GitHub(https://github.com/mohamed-elmanzalawi/dfast_qc_benchmark)公开可用用于基准测试过程的数据和脚本。联系人:yt@nig.ac.jp补充信息:补充数据可在BioInformatics Online获得。