解决志愿者招聘问题:临床试验中的人工智能
原始:喜欢阅读的Fudan青年
青年补充剂是由Fudan青年学术思想中心生产的:它分为SIWEI,研究理论,世界,阅读,专栏,相同的文本,诗歌和灯笼的八列,以讨论诸如历史,时事和时事和诸如与你一起艺术。
这本书必须在同一篇文章中,并听到更多疑问。同一篇文章翻译了许多领域中出色的外语文章,以打破您的语言障碍并提供新的观点和观点。
“”
招募临床志愿者一直困扰着困扰美国医学试验的研究人员。这太时了,可以为他们带来进展。他们之间可能没有良好的沟通方式。最近,一些项目试图通过全面使用大数据和算法来加速临床试验的进步。那些没有测试的人变得可能成为可能。
“
原始作者:Marcus Woo
原始标题:人工智能审判
来自2019年9月26日的“自然”
Fudan年轻记者Duan Xuzhang Xiao Shufang翻译
Fudan Young Reporter He Benhua编辑
▲原始插图:Totto Renna/图片来源“ Nature”杂志
招募临床志愿者一直困扰着困扰美国医学试验的研究人员。这太时了,可以为他们带来进展。他们之间可能没有良好的沟通方式。最近,一些项目试图通过全面使用大数据和算法来加速临床试验的进步。那些没有测试的人变得可能成为可能。
凯文·休斯(Kevin Hughes)迫切需要志愿者。 1994年,波士顿马萨诸塞州综合医院的乳腺癌外科医生进行了临床试验。他们希望探索使用他莫昔芬的药物和手术后的放射治疗。效力。尽管这很普遍,但其有效性仍然值得怀疑,尤其是对于那些老年妇女而言。
研究人员试图发现患有某些类型的乳腺肿瘤的患者已有70多年的历史,并且患有某些类型的乳腺肿瘤。在美国,约有40,000名妇女符合测试标准,她们打算从中收集636人。尽管没有多少636人,但足以容纳临床实验。但是,征求志愿者花了五年时间。志愿者招标是临床实验的困境之一。 “在许多情况下,医学研究效率极低,”加利福尼亚州拉霍亚的拉霍亚说。这是对2000年1月至2019年4月的临床试验成功率调查的调查,该调查显示,大约12%的药物临床实验最终成功。大多数临床实验失败的原因是,他们没有阐明医疗措施,研究设计存在或资金短缺或参与者退出道路的有效性或安全性。无法招募足够多的志愿者也失败了临床实验。在实验,输入和复制数据中,统计参与者的剂量也有大量无效因素,例如延迟和不准确。
为了提高临床试验的成功率,学术和制药行业的研究人员将注意力转移到了AI上。在输入大量人类健康数据后,AI有可能帮助临床试验,扩展治疗方法并节省大量资金。 “临床实验的改进将取得重大进展。”休斯说。
▲临床实验/图片来源成功率的统计量“自然”杂志
了解人类语言
休斯(Hughes)领先的这项测试就是一个成功的例子。尽管放射治疗的额外步骤降低了乳腺癌的复发率,但它不会影响患者的总体存活率。至少对于老年妇女,额外的支出和放射治疗带来的风险可能会超过该疗法本身的好处。随后的研究得出相同的结论。休斯说,如果他和他的同事可以更快地招募人员,他们也许可以更快得出结论,以便他们早些时候通知女性患者。此外,研究人员可以转变为需要解决的其他问题。
招聘通常是测试中最耗时的步骤。 2016年的一项研究表明,在长期搜索后,在国家癌症研究所的国家临床测试网络的癌症试验中,他仍然无法招募所需的患者人数的一半,或者因为志愿者的注册太少,他只是放弃了考试。据估计,有20%的癌症患者适合类似的实验,但实际上参与了5%以上。纽约哥伦比亚大学的一名生物学信息家Chunhua Weng说:“志愿者招募是临床试验的第一个障碍。”
许多人希望AI改变这种困境。 AI,自然语言处理(NLP)的分支,使计算机能够分析手写和口头单词。如果您在医学中使用它,该技术可以搜索算法来搜索医生给患者写的笔记和病理报告,并找出适合参加特定临床试验的人。
一个挑战是上述文件的内容是多种形式的自由形式,并且不会成为框架。有价值的信息可能含糊不清,需要某些背景知识和背景才能理解。例如,医生可以以多种方式描述相同的概念,可以称为心肌梗塞,心肌梗塞或简单的“ MI”。但是,NLP算法还可以学习研究人员注释的样本。经过这样的培训,他们有能力选择同义词,然后利用自己的知识来解释那些没有准备好的病历。
人们正在努力更好地解释临床试验。测试中包含或不包含的标准通常以普通文本的格式编写。因此,如果医院想收集适合患者数据库中测试的人,他们必须首先将这些标准转化为数据库可以通过标准化和编码的问题表所理解的内容。 Weng Chunhua和她的同事开发了一种名为“ Criteria2Query”的资源开放网络工具。通过使用NLP,研究人员和经理可以进行数据库检索,而无需掌握数据库查询语言。
▲开源网站标准2Query便利研究人员搜索数据库搜索数据库
图片来源“自然”杂志
AI还可以帮助患者自己找到临床试验。养成习惯,人们依靠医生告诉他们他们适合他们的参与。 Clinicaltrics.gov列出了美国和209个国家 /地区的患者进行的多达300,000个研究项目。除了大规模的大范围之外,专业选择标准还使公众难以理解。 “太复杂了,”哥伦比亚大学和生物学家的一所大学爱德华·肖特利夫(Edward Shortliffe)。
为了帮助患者了解选择标准系统,Weng Chunhua和她的同事创建了另一个称为“ dquest”的资源开放网络工具。该软件在临床试验上读取实验,并使用流行文本来表达其问题,例如“您的BMI是什么?”测试用户的资格。初步评估表明,在50个问题后,该工具可以滤除60%不符合测试要求的用户,准确率超过60%。
商业利益
Weng Chunhua的工具也有很大的改进空间。机器算法依赖大量学习。为了发展其潜力,AI需要大量有效的数据。但是,标签数据的重要特征(这对于训练NLP算法是必需的)是很耗时的。旺川说:“学术界面临的主要问题之一是数据和人力非常有限。”
相比之下,工业具有更大的克服这些障碍的能力。在过去的几年中,他们进行了许多活动。例如,纽约市的一家数字保健公司开发了一种软件,可帮助人们找到实验参与者。许多专注于医疗保健的公司使用它来寻找参与者。帕萨迪纳(Pasadena)的人工智能测试招聘公司“ Deep 6 AI”开发的另一个软件是由加利福尼亚州开发的。人员用于找到实验对象。他们在一小时内发现了16名合适的参与者,传统方法只能在六个月内找到两个人。
在另一项由明尼苏达州罗切斯特市梅奥诊所(IBM)的“临床试验匹配系统的沃森(Watson for Clinical Trial)匹配系统”的另一项试点研究中,每月每月每月平均注册人数增加了80%。该系统提供了IBM的Watson Super Computer的动机。尽管许多计划尚未取得成果,但这是将参与者与临床试验相匹配的重要一步。今年3月,IBM与Health Quest Systems(Health Quest Systems)签署了一项协议。利润网络将使用IBM测试匹配系统来帮助他们的实验。
尽管这些技术中的大多数看起来很有吸引力,但它们仍然有局限性。哥伦比亚大学的生物医学信息家Neomie Elhadad说:“它们并不像谣言那样神奇。”
例如,为了训练NLP算法,需要手动完成大量数据标记,到目前为止,还没有替换方法。 “没有NLP发动机可以理解医生获得的所有临床记录。”埃尔哈德(Elhad)指出,医疗领域和AI之间的差异太大了。 “我们都在努力工作,但是我们必须让AI了解所有临床文件,我们还有很长的路要走。”
并非每个人都认为花在寻找测试人员的努力是值得的。辉瑞制药公司Craig Lipset的前总监说:“猜测患者的匹配。即使人工智能算法比传统算法更快地识别合适的人,或者发现可能被省略的人,但使用第三方工具的研究人员必须根据不违反隐私政策来应对挑战和个人联系。
但是,一些调查人员认为,这些系统的部署将获得可观的回报。 2014年,世界上有86%的临床实验参与者是白人。 2019年的一项研究发现,即使遗传数据占世界总人口的16%,遗传数据也来自欧洲。 AI驱动的患者匹配算法可以为有需要的任何人提供参与的机会,从而组成一个更多元化的实验组,而不仅仅是训练那些了解相应的医生或生活在大型健康实验机构附近的人,实验。埃尔哈德说:“这确实使医学变得平等。”
优化设计
AI也可以用于设计临床实验。每个临床试验遵循详细的实验步骤。在实验过程中需要修改的任何问题都可能导致数月的延迟,并增加成本数十万美元的成本。本质“如果步骤正确,那么如果步骤正确,则药物开发将更快,更便宜。”
设计实验时,研究人员通过多种来源获得信息,包括比较实验,临床数据和调节信息。人工智能不仅可以更快地处理这些问题,而且还可以比人们检查更多的数据。 “这是使用AI的机会。”
在加利福尼亚州圣地亚哥建造的“试验”,将其人工智能工具描述为设计更好的测试解决方案的数据驱动指南。它使用NLP和其他人工智能技术来收集和分析公共数据,例如期刊论文和药物标签,以及与公司合作的药物或医疗设备公司拥有的私人数据。从这些数据中,公司的软件可以帮助客户确定计划实验的各个方面,例如严格的选择标准,这可能会影响成本,时间或参与者等因素。 “我们想看看哪种成功标准与哪种相关。”公司首席科学家戴维·福格尔(David Fogel)。
例如,如果患者想测试治疗糖尿病的药物,并调整最小糖化血红蛋白(用于诊断糖尿病的血友病)参加测试,则可能导致不同的测试结果。如果合格的标准太低,则可能难以检测到药物的改善。但是,如果阈值太高,则可能没有足够的参与者资格。借助人工智能算法回顾文献和实验过程可以使研究人员能够快速计算整个人群的糖尿病数据并确定适当的水平。
人工智能软件最终不仅提供了指导。 “最终目标是让机器编写初步的实验步骤。”
即使是设计良好的测试解决方案,也要求参与者遵循说明。一个简单的错误,例如在正确的时间忘记药物,可能会威胁到研究结果的准确性。纽约的数据分析公司“ AICURE”正在开发可能的解决方案。它提供了一个平台,使人们可以录制使用智能手机服药的视频。通过使用计算机视觉算法分析这些图像,“ AICURE”软件可以识别患者和药丸,并确认是否根据处方服用。对精神分裂症患者的一项研究表明,根据处方,约有90%的使用“ AICURE”平台的患者进行了,并且72%的患者经常监测药物期间的定期监测。该公司表示,该软件甚至可以区分人们的面部表情并跟踪他们对治疗的反应,这可以指导治疗过程。
寻求验证
通常,在临床试验中,医疗领域的医疗领域中许多功能都被夸大了。 “这些事情中的大多数发生在理论领域,Toper说。这导致了这一领域的重大挑战:如何证明人工智能技术确实可以改善测试。”验证是关键,“李·帕塔特说,”我们说,“我们说,“我们说,”我们说,“我们说,”我们说,“我们说,”我们说,我们说, “我们说,”我们说,“我们说,“我们说,“我们说,“我们说,”我们说,“我们说,”我们说,“我们说,”说:“我们说,”我们说,“我们说,”我们说,“我们说,“我们说,”我们说,“我们说,”我们说,“我们说,” “我们说,”我们说,“我们说,“我们说,“我们说,“我们说,”我们说,“我们说,”我们说,“我们说,”说:“我们说。您需要知道它具有能力。我们需要向监管机构展示证据,以使他们有信心。 “
但是,除了少量的试点研究和案例研究外,对人工智能如何改善临床试验的评估很少。 Toper说,更先进的人工智能技术,例如用于医学图像分析的技术,缺乏严格和大型实验。承诺和证明之间仍然存在很大的差距。他说:“我希望我们可以在不久的将来填补这一空白。”
企业正在采取行动评估其AI性能。例如,“试验”的首席执行官兼联合创始人金·沃尔波尔(Kim Walpole)表示,他们正试图提高定量技术的测试设计程度。她希望这些信息能使Trics.AI计算该软件可以节省潜在客户的金钱和时间。
旺·春豪(Weng Chunhua)说,问题是缺乏评估人工智能工具的共享系统。尽管她的患者匹配软件是开放资源,但大多数公司仍然使用自己的工具以标准化的方式比较和评估这些技术。
如果这些技术能够发挥其潜力,其影响将是巨大的。休斯说,即使是随机测试 - 临床试验模型 - 可能已经过时了。如果可获得数亿人的数据,并且人工智能工具可以准确分析这些数据,那么像他的乳腺癌测试一样不需要招募任何人的研究 - 这些数据已经存在。
测试疗法可能仍需要控制。但是,即使这样,具有庞大数据集(例如健康电子产品)的人工智能系统也可能模拟人们对治疗的反应。 Toper表示,虚拟临床试验的这种性质可以避免用于制药公司的大规模现实实验。这样的模拟在很大程度上是理论上的,但是我们可以在某些统计模型中找到起点,例如,这些统计模型用于模拟虚拟患者,这些患者模拟了不规则的心跳到血液稀释药物。
休斯预测,在批准药物后,电子健康记录将显示更广泛的人口反应,无论是否虚拟,它将取代原始测试。随着人工智能系统和数据有效性的持续发展,在随机测试的框架之外可能会发生更多的临床研究。休斯说:“人工智能的真正可能性是废除临床试验。”
微信编辑 QIN SIJING
早期选择
对话Liang Yongan:大学生写作的无限可能性
当文字现实时:在线文学中的福丹感受
原始标题:“解决志愿者招聘证明:临床测试中的人工智能”