您的位置首页 >精选知识 >

该奖项为不依赖人类的信息提取奠定了新基础

导读 考虑到来自生物医学、农业和制造业等开放领域的数百万篇研究论文和报告,人类不可能跟上所有的发现。不断出现的世界事件提出了类似的挑战,

考虑到来自生物医学、农业和制造业等开放领域的数百万篇研究论文和报告,人类不可能跟上所有的发现。

不断出现的世界事件提出了类似的挑战,因为如果不查看数千篇文章,就很难跟踪它们,甚至更难对其进行分析。

为了解决在这些情况下依赖人类努力的问题, 计算机科学系助理教授、 Sanghani 人工智能和数据分析中心 的核心教员 Lifu Huang正在研究机器学习如何在不依赖人类的情况下提取信息。依靠人类。

在他获得国家科学基金会教师早期职业发展 (CAREER) 奖支持的研究中 ,Huang 正在开发新范式,通过将现有资源和本体从旧领域转移到新领域,从任何领域或场景的文本中提取事件知识,无需人工需要努力。这与现有的事件提取方法形成对比,后者在很大程度上依赖于为特定领域或场景定制的有限事件类型的人工标记数据。

“我们提出的技术可用于分析数百万篇研究论文和报告,并将它们转化为结构化知识,使用户无需查看数百万篇文章即可回答他们可能遇到的任何问题,加快他们发现新模式或知识的速度。研究,并促进将现有文献整合到他们的研究中,”黄说。

对于新出现的事件,政府机构将能够更有效地跟踪它们,根据结构化知识对其进行分析,而无需查看数千篇文章,并通知关键人员,以便他们做出更快更好的决策。

黄的研究的另一个重要贡献是它能够帮助保护当地的历史。

“世界上 7,000 种语言中约有一半濒临灭绝,并有灭绝的危险。数据中记录的文化知识和历史事件对当地社区很有价值。借助该项目中提出的技术,我们可以识别这些社区中所有有意义的文化/历史事件,并将它们存储或记录到特定于社区的历史书中,”黄说。

他说,这些只是好处的几个例子。最终目标是将适用性扩展到几乎所有领域。

Huang的两个博士。学生 Minqian Liu 和 Sijia Wang正在与他一起进行该项目。

CAREER 奖成立于 1995 年,是美国国家科学基金会最负盛名的奖项,旨在支持有潜力成为研究和教育领域的学术榜样并引领其组织使命取得进展的早期职业教师。

作为奖励的一部分,Huang 计划通过与 工程多样性增强中心合作来扩大他的教育范围。他将为来自不同代表性不足群体的大学预科生设计实践学习活动,这些学生参加一年一度的成熟夏令营系列,包括面向 50 名初中和高中女生的 C-Tech2 计划,其中三分之二来自弗吉尼亚。具体来说,他正在开发两到三个小时的交互式自然语言处理课程。

Huang 还将参加为 来自马丁斯维尔、里士满、威廉王子县和富兰克林市的 50 名初中和高中学生举办的 VT 工程卓越 计划。

2021年以来,黄在全国范围内招收各类本科生作为暑期实习生。在他的直接建议和他的研究生的指导下,实习生参与了自然语言处理和开放世界事件提取方面正在进行的研究项目,并接受了机器学习应用研究的基本技能培训。他们还有机会在研究会议和研讨会上发表和展示他们的研究成果。

“与具有这些不同能力的本科生一起工作,我可以利用我的 CAREER 项目中开发的技术和工具来解释在现实世界应用的背景下自动文本理解的挑战,”黄说。“我相信这些项目有助于吸引越来越多的高中生尽早进入 STEM 和计算机科学领域,从长远来看,可以更好地为他们接受高等教育或 STEM 工作机会做好准备。”

标签:

免责声明:本文由用户上传,如有侵权请联系删除!