完整的作者列表:王,金阳;加利福尼亚大学伯克利分校,材料科学与工程; E O Lawrence Berkeley国家实验室,本恩;加利福尼亚大学伯克利分校,材料科学与工程Kim,Hyunchul;加利福尼亚大学伯克利分校,材料科学田,Yaosen;加利福尼亚大学伯克利分校,材料科学与工程;劳伦斯·伯克利国家实验室,材料科学Ceder,Gerbrand;加利福尼亚大学伯克利分校,材料科学与工程;劳伦斯·伯克利国家实验室,材料科学系金,海耶姆;劳伦斯·伯克利国家实验室,物质科学部
3:00 – 3:15 休息 3:15 通过将脊柱散热器与 21700 电池集成来优化 PPR 电池组中的重量能量密度 David Petrushenko:NASA、Jesus E. Trillo、Eric C. Darcy、Paul T. Coman、Ralph E. White、Zoran M. Bilc 3:45 锂离子电池热失控的被动预防 Vijay Devarakonda:Analytical Scientific Products、Nikhil Devarakonda 4:15 21700 锂离子电池侧壁破裂表征 Jesus Trillo:NASA、Eric C. Darcy、David Petrushenko、Zoran M. Bilc 4:45 导致 BiFeO3 形成的前体反应途径:从文本挖掘和化学反应网络分析中获得的见解 Viktoriia Baibakova:劳伦斯伯克利国家实验室、Kevin Cruse、Michael泰勒、卡罗琳·M·萨特-费拉、格布兰德·塞德尔、阿努巴夫·贾恩和塞缪尔·布劳
• 贝叶斯叶片尖端定时 (BTT):Dawie Diamond、Stephan Heyns 教授和 Johannes Oberholster(工程、建筑环境和 IT) • BTT 瞬时共振:Dawie Diamond、Stephan Heyns 教授和 Johannes Oberholster(工程、建筑环境和 IT) • BBT 减少采样方法:Dawie Diamond、Stephan Heyns 教授和 Johannes Oberholster(工程、建筑环境和 IT) • 环形热解装置(吸热装置和过程):Mike Heydenrych 教授(工程、建筑环境和 IT) • 粉煤灰基覆层瓷砖:Elsabé Kearsley 教授、Stuart Grant Hofmeyer(工程、建筑环境和 IT) • 海鸥配置:Reinhard Joachim Huyssen(工程、建筑环境和 IT) • 平面机制:Douw Gerbrand Marx(工程、建筑环境和 IT) • 电气保护系统及其方法:Patrick Manditerza、Ramesh Bansal 教授(工程、建筑环境和 IT)• 识别基因突变的方法和试剂盒:Michael Pepper 教授、Cheryl Stewart、Green Robin 和 Masekela Refiloe(健康科学)• Myrsine 皮肤护理:Namrita Lall 教授(自然和农业科学)• 芳香蜡菊的抗癌活性(芳香蜡菊提取物和成分可用于预防和治疗皮肤癌):Namrita Lall 教授和 Danielle Berrington(自然和农业科学)• 为什么要耐受压力:Don Cowan 教授和 Jasmin Mertens 博士(自然和农业科学)
B2003041391 WILD FIG ESTATE B2003041393 PHATHISWA 建筑 B2003041394 BIAMAR 出口 B2003041396 TN STOFILE 建筑 B2003041397 CAPSTIN 国际贸易 B2003041399 SIZIMISELE 鸡禽 B2003041400 CHOCHI-MANE 开发项目 B2003041401 CANSOPH 维护 B2003041402 THOBOSI 进出口 B2003041403 NKON'WANE 管道 B2003041405 BALA CLAN 建筑 B2003041407 TRUE MOTIVES 1256 B2003041408 TO NDANANI 家禽养殖场 B2003041409 KGOTHO 商业企业 B2003041410 ELLIOTT 设计投资 B2003041412 MPHEDISENG 商业企业 B2003041413 GUGU 贸易 B2003041415 THE BLANKET 工厂车间 B2003041416 DROSS SA 金属 B2003041417 ZIMISELENI 制作 B2003041418 MASHAKAZI 安全 B2003041419 GROW UP TUCK SHOP B2003041421 TRUE MOTIVES 1257 B2003041422 MAHOWA清洁卫生企业服务 B2003041423 UMKHAMBATHI 制造企业 B2003041424 ZACKS 咨询 B2003041425 ZIYAAD 电子 B2003041426 MM MOTAUNG 和 SONS 建筑物建造 B2003041427 SN 检查 B2003041429 ZIBAMBELENI 属性 B2003041431 ADHESION MARKETING B2003041432 MIDVAAL 汽车玻璃 B2003041433 MOLLY'S SHUTTLE 和项目 B2003041436 MAKGOBANE 多项目B2003041437 EMELITE BUSINESS ENTERPRISES B2003041438 SHELL CASE 1033 B2003041439 DARRYL BORNSTEIN B2003041441 K-MASH CIVIL CONSTRUCTION B2003041443 GAME PLUS IMPEX B2003041445 NOKWAKHVA CLEANING SERVICES B2003041446 GENIUS IT SOLUTIONS B2003041448 LETSOLO MANYANA AND ASSOCIATES B2003041450 PANSY SHELL INVESTMENTS (NO 30) B2003041451 MAXOSA MILILE ROAD AND BUILDING CONSTRUCTION B2003041452 SHELL CASE 1035 B2003041453 精密涂装承包商 B2003041458 SAKHILE PROMOTIONS B2003041459 DE LA COUR FASHION INTERNATIONAL B2003041464 GERBRAND VAN DER WALT 拖车服务 B2003041465 INDOMITABLE TRADERS B2003041470 MAHLATJI THABA-NKGOKOLO TRADING B2003041472 GA-MOGASHOA 砖瓦厂 B2003041473 SPHERE CATERING EQUIPMENT B2003041474 TANGIBLE TRADING B2003041476 CENTRAL HIGH TRADING 297 B2003041478 ROWAN TREE 1029 B2003041479 风景路线贸易 103 B2003041481 CEC 建筑与维护 B2003041482 YODA MUSIC B2003041483 风景路线贸易 102 B2003041485 DC 技能开发与服务 B2003041486 OPTIMUS 解决方案 B2003041487 ELLZAN 技术
预测性逆合合成一直是有机化学的长期目标,13 - 16,使用深神网络取得了明显的进步。17,18通过大量的有机反应(例如Scifinder 19和Reaxys)的商业数据库的可用性,这些机器学习成功得到了实现。目前尚不存在20种无机材料合成反应的商业数据库。但是,由于文献中已经有成千上万的成功材料综合报告,因此发表论文的文本挖掘合成食谱可以提供广泛的专家知识来源,以培训机器学习模型,以实现预测性无机材料合成。在2016年至2019年之间,I‡是劳伦斯·伯克利国家实验室Gerbrand Ceder研究小组的博士后研究员,并参加了31 782固体合成食谱的文本挖掘21和35 675基于解决方案的合成食谱22。在这里,我在尝试构建机器学习(ML)模型以从该数据集构建机器学习模型(ML)模型的回顾性帐户。顺便说一句,这个故事遵循Gartner的“炒作周期”,23,它通过(1)技术触发,(2)inded期望的峰值,(3)幻灭谷,(4)启蒙运动的斜坡,以及(5)生产力的平稳。这里的观点是我自己的,不一定是我的合着者在文本挖掘出版物中共享的。在这里,我们首先审查用于构建文本开采食谱数据库的自然语言处理策略。然后,我们根据数据科学的“ 4 Vs”评估了数据集,并表明数据集的数量,品种,真实性和速度的限制。尽管其中一些局限性源于文本挖掘中的技术问题,但我们认为这些局限性主要源于化学家过去如何探索和合成材料的社会,文化和人为偏见。24我们表明,在此文本挖掘数据集上训练的机器学习模型成功地捕获了化学家对材料合成的看法,但并没有对如何最好地合成新颖材料的实质性新的指导见解。另一方面,我们发现该数据集中最有趣的食谱实际上是异常的配方,即在固态合成中违反常规直觉的配方。这些异常的食谱也相对罕见,这意味着它们在uence回归或分类模型中不会显着。通过手动检查一些异常食谱,我们就固态反应的进行方式以及如何选择增强反应动力学和靶材料的选择性的前体提出了一个新的机械假设。这一假设推动了一系列高可见性的后续研究,25 - 28在经验上验证了我们假设的机制,这些机制是从文本开采的文献数据集中收集的。
[1] Takahiro Arima、Tomoko Okuma 和 Tatsuya Dewa。从技术文档中提取材料信息以探索新应用。自然语言处理协会第 29 届年会论文集,第 512-515 页,2023 年。[2] Annemarie Friedrich、Heike Adel、Federico Tomazic、Johannes Hingerl、Renou Benteau、Anika Marusczyk 和 Lukas Lange。SOFC-exp 语料库和神经方法在材料科学领域的信息提取。在计算语言学协会第 58 届年会论文集,第 1255-1268 页。ACL,2020 年。[3] Shu Huang 和 Jacqueline M. Cole。使用飞行数据提取器自动生成的电池材料数据库。科学数据,第 5 卷7,第1号,第2052-4463页,2020年。[4] Fabrizio Gilardi、Meysam Alizadeh和Maël Kubli。Chatgpt在文本注释任务中的表现优于众包工作者。美国国家科学院院刊,第120卷,第30期,第e2305016120页,2023年。[5] Tom Brown、Benjamin Mann、Nick Ryder、Melanie Subbiah、Jared D Kaplan、Prafulla Dhariwal、Arvind Neelakantan、Pranav Shyam、Girish Sastry、Amanda Askell、Sandhini Agarwal、Ariel Herbert-Voss、Gretchen Krueger、Tom Henighan、Rewon Child、Aditya Ramesh、Daniel Ziegler、 Jeffrey Wu、Clemens Winter、Chris Hesse、Mark Chen、Eric Sigler、Mateusz Litwin、Scott Gray、Benjamin Chess、Jack Clark、Christopher Berner、Sam McCandlish、Alec Radford、Ilya Sutskevser 和 Dario Amodei。语言模型是少样本学习器。载于《神经信息处理系统进展》,第 33 卷,第 1877-1901 页。Curran Associates, Inc.,2020 年。[6] Md Tahmid Rahman Laskar、M Saiful Bari、Mizanur Rahman、Md Amran Hossen Bhuiyan、Shafiq Joty 和 Jimmy Huang。在基准数据集上对 ChatGPT 进行系统研究和全面评估。载于《计算语言学协会研究结果:ACL 2023》,第 1877-1901 页。 431–469。ACL,2023 年 7 月。[7] Bart lomiej Koptyra、Anh Ngo、Lukasz Radli´nski 和 Jan Koco´n。Clarin-emo:使用人类注释和 chatgpt 训练情绪识别模型。在国际计算科学会议上,第 365–379 页。Springer,2023 年。[8] Taiki Watanabe、Akihiro Tamura、Takashi Ninomiya、Takuya Makino 和 Tomoya Iwakura。使用化合物释义进行化学命名实体识别的多任务学习。在 2019 年自然语言处理经验方法会议和第 9 届国际自然语言处理联合会议 (EMNLP-IJCNLP) 的论文集上,第 6244–6249 页。ACL,2019 年。[9] Amalie Trewartha、Nicholas Walker、Haoyan Huo、Sanghoon Lee、Kevin Cruse、John Dagdelen、Alexander Dunn、Kristin A. Persson、Gerbrand Ceder 和 Anubhav Jain。量化领域特定预训练在材料科学命名实体识别任务中的优势。Patterns,第 3 卷,第 4 期,第 100488 页,2022 年。[10] Gupta Tanishq、Zaki Mohd 和 NM Krishnan。Matscibert:用于文本挖掘的材料领域语言模型