现在只要登录一个网站,就可以获得24000多份关于冠状病毒的研究文献。对于正在研究SARS-CoV-2的科学家来说,这是一个很好的工具。
当地时间3月16日,美国多家研究机构的研究人员联合发布了一个关于冠状病毒的开放研究数据库,其中收录了来自同行评议期刊、非同行评议预印论文网站如biorxiv、medrxiv等的论文。目前,该数据库涵盖了sars-cov-2 (SARS-CoV-2)、新冠肺炎(疾病的学名)和冠状病毒群。换句话说,这个数据库包含了几乎最完整的与SARS-CoV-2相关的科学文献。同时,这个数据集可以实时更新,可以发表更多的研究论文。
据了解,该数据库是应白宫科学和技术政策办公室的要求,通过三个组织的合作完成的。其中,国立卫生研究院的国家医学图书馆(nlm)提供对现有科学出版物的访问;微软利用其文档规划算法帮助查找相关论文;艾伦人工智能研究所(ai2)是一家非营利组织,提供将研究论文从网页转换为pdf格式的算法处理能力。目前,该数据库可以在ai2的语义学者网站上找到。
语义学者类似于Google的学术搜索功能。它是一种结合自然语言处理和计算机视觉的新型学术搜索引擎。但与Google学术搜索相比,语义学者更准确、简洁、清晰,其搜索结果会显示作者、方法、数据、引文等关键信息,使科学家更容易快速评价每篇论文。
值得一提的是,ai2还使用了elmo、bert等最新的自然语言模型来描述论文之间的相似性。同时,数据库有了新的功能,可以帮助研究人员根据自己的兴趣创建个性化的研究摘要。
对于科学家来说,他们正在争分夺秒地研究SARS-CoV-2,以便找到防止其传播的方法和治疗方法。有了这个数据库,所有的研究文档将被收集在一个地方,这将使研究人员更容易使用自然语言处理算法来挖掘文档。Ostp还公开呼吁人工智能研究人员开发文本和数据挖掘新技术,称这将有助于医学界更快地整理大量研究信息。(本文来自《The Paper》,更多原创信息请下载《The Paper》app)新闻推荐
“至高公主”号游轮的中国工作人员安全离开美国
据新华社电中国驻旧金山总领事馆15日表示,“至高公主”号游轮11名中国籍工作人员14日晚安全离开美国。此前,9人持有美国绿...