我们邀请了一些年轻科学家来描述人工智能或者机器学习方法在研究中的案例,以及它们宽泛的影响和使用它们时会面临的挑战。我们从中挑选了一些,展示给读者。 ——Jennifer Sills 言论1 医疗机器人 医疗机器人逐渐被应用于复杂医疗介入领域,包括微创手术等。在外科手术中引入机器人,可以提高自动化的程度,使得全天候、高效率、高精度医疗成为可能,同时使得病人的住院时间短、恢复快。外科医生因而不再需要全程参与手术过程,他们不容易感到疲劳,可以连续执行手术任务,减少了病人等待的时间。这些新颖的技术和机器可以大大增强病人的疗效。 最大的担忧是如何解决(或者预防)在一个手术过程中遇到的技术困难。外科相关的伦理问题和损失也需要解决。这些机器需要具备感知和决策能力才能执行外科手术,这同时也伴随着社会、道德和临床后果。程序人员将面临这样一个困境:如何帮助人工智能工具来处理与任务关联的固有道德责任。此外,机器人能像人类一样熟练进行手术吗?如果因为判断失误导致手术失败,谁将承担责任?在我们允许医疗机器人实际开展手术之前,上述疑问必须得到很好的解答。 ——新加坡国立大学,生物医学工程系 Mrinal Musib 言论2 无人机与动植物调查 机器学习技术和轻型无人机是革命性的环境监测手段。在过去,调查植物和野生动物地区的现状需要进行广泛的人工调查。现在,无人机可以到达人类难以到达的地方,并根据高分辨率影像快速捕捉到植被类型、面积和野生动物数,以及它们的活动等信息。这些新技术获得的结果可能比传统的地面观测更加精确。 ——中国林业科学研究院,荒漠化研究所 Feng Wang 言论3 人工智能与实验记录 2016年的一项合作教会计算机如何识别实验程序,该算法从积累了40年的超过15万份专利文件中提取100万个独特的化学反应。根据这些材料,科学家可以观察合成化学产品的化学反应和性质的变化趋势。简单地说,分子在变得越来越大。在这之前,相关材料的提取全靠手工,因此可以提取的数目非常有限。 机器学习的最大挑战在于数据清洗。大多数实验室数据是非结构化的,使得我们无法对它们直接进行数据挖掘和机器学习。大多数学术(以及部分工业)实验室依旧依赖于纸质记录方式而非电子化记录,而且对于某种现象的描述用词也因人而异。因此实验报告模板化有利于后期我们从中挖掘知识。 ——诺华生物医学研究所,NIBR信息学 Michael A. Tarselli 言论4 人工智能与现代教育 近来机器学习被应用于大学生科学教育的研究,用来分析学生的写作能力。在该项研究中,学生们首先回答问题,并由专家们给学生的回答打分评估。专家的评估之后被用于训练机器学习模型,来预测专家给新的学生的回答的打分情况。根据这个模型,老师就可以根据学生的文字来判断他们对科学概念的理解程度。 ——密歇根州立大学,创建干细胞研究所 Rachel Yoho 言论5 医疗模型参数优化 精心设计的机器学习算法可用于预测癌症患者。但是,为了使临床预测模型工作,研究者需要微调算法参数。在过去,选择优化参数需要具备试验和错误、生物医学领域知识和模型设计方面的创造力。随着近期参数自动优化技术的发展,我们可以将参数优化过程应用于机器学习算法,从而促进精准药物研究的发展。 机器学习方法并不遵守“garbage in, garbage out”的准则。机器学习模型的适用性往往依赖于训练数据的可代表性。在扭曲的训练数据上发展的模型往往精度低、偏差大。 ——哈佛药学院,生物医学信息学系 Kun-Hsing Yu 言论6 农作物产量 植物生物学家使用基于机器学习的软件来预测蛋白质之间的作用,寻找它们的作用机理,从而在干旱期增加农作物产量。 机器学习的一个潜在问题是所有程序都会自动化,导致一些实验室的职能不再需要。 ——莫雷洛丝州自治大学,基础和应用科学研究院 Rigoberto Medina Andrés 言论7 基因测序 一个典型的癌症病人基因突变编目、测序实验,将产生TB级的数据。这类研究对肿瘤生物学意义重大。然而,在这样的大数据集中,将可用信号和噪声分离是一个巨大的挑战。机器学习提供了一条新的路径,可以有序地剔除噪声。 但是,机器学习模型的黑箱属性使得误差更难判别。因此,研究人员需要充分警惕,确保在训练模型的过程中使用高质量、注释完整的数据。 ——达纳法伯癌症研究所,癌症生物学 Noah F. Greenwald 言论8 物种分类 精确、快速的物种分类在生态学、生态系统保护和公众教育中至关重要。然而,大多数人对物种形态学了解不深,因而无法做出很好的决策。使用人工智能及其它数据收集技术,人们可以使用电脑或者移动设备来准确辨别物种。人工智能系统同时也可以服务于实时发现入侵或者珍贵物种。 然而,这些应用被限制于输入图像或者音频的质量,而且当需要进行基因分析才能辨别的时候往往无法适用。 ——中国检疫检验科学研究院,植物检疫研究所 Xubin Pan 言论9 天文规则 在天文学领域,机器学习方法是时域调查的核心。帕洛马天文台是一个很好的例子,它在一台小天文望远镜上使用了宽幅相机,能够把观测到的感兴趣的物体转给另一个专用的望远镜来跟进观测。在时域研究中,时间以秒为计,因此如果持续地依靠专门的研究员来执行上述跟进的判别将会非常耗时耗力。帕洛马天文台使用机器学习方法,在大数据集中可以辨别出研究人员感兴趣的瞬态,并且自动触发跟进。 机器学习方法的主要挑战是获取好的训练数据集。由于实验调查的设计大不相同,机器学习需要通过微调来适应不同的调查案例。因此在调查的初期,人工分类必不可少。幸运的是,大众科学家在标记数据方面提供了巨大的帮助。 ——日本国家天文台,斯巴鲁望远镜 Chien-Hsiu Lee 言论10 无人机与火灾救援 基于智能化的无人机技术,火灾安全研究者研发了专门的无人机来获得火灾现场的实时图像和监测数据,用于紧急救援的实时决策。借助于无人机,救火人员可以克服恶劣天气的影响,研究人员可以观察火势的动态变化,并确保救火人员的人身安全。 然而,这些机器的故障风险很高,不准确的数据会促使将降火人员置于危险境地。 ——湖南工学院,安全与环境工程学院 Jian Zhang 言论11 病患程度鉴别 确定良性和恶性损伤的区别对全世界所有医生都是一个考验。今年早期,斯坦福大学的研究者发展了一套深度学习算法,可以进行皮肤癌准确分类。这种自动化的分类可以提高精准损伤分类的一致性、敏感性和特异性。除此之外,基于这套算法开发的手机应用可以用于低成本、通用性的医疗诊断。 但是对于这样的一个手机应用来说,迫在眉睫的挑战是确保终端用户对技术的准确运用。不充分的成像或者低频的创伤跟踪记录会导致恶性皮肤癌的误诊。 ——昆士兰医药研究伯格霍弗医学研究所 Ken Dutton-Regester 言论12 临床试验招募 人工智能解释临床数据的能力可以革命性地推动临床试验招募的发展。临床试验招募有许多需要考虑的因素,将病人和优化试验进行配对是其中的一项挑战。招募研究者所需数目的试验参与者是另一项挑战。人工智能可以解决这个问题,它能够从大量医疗记录和临床试验中分析数据,促进参与者招募。在临床研究中使用人工智能的一项风险是从医生到机器的转变中,相应的影响、权力和问责的转变。目前来看,临床人工智能还有待于进一步开发,不过病人可以首先开始通过机器听取看病意见。这可能有负面的影响:人工智能技术是基于数学算法开发的,没有医生纵观全局的能力,同时所能考虑的量化因素也较少,比如病人的生活习惯和饮食等。 ——温哥华综合医院,外科 Jake Wyatt Johnston 言论13 气体监测 开发决策树算法可以帮助我们更精准地探测复杂混合气体,这项技术可以应用于环境空间监测和油气田调查。 使用决策树时的一大风险是在建“树”初期的错误计算会影响最终决策。决策树需要大量参数,并且每个参数需要优化。然而,决策树算法的过复杂化会导致过拟合,缺乏可推广的普适性。 ——开罗美国大学,环境工程 Icell Mahmoud Sharafeldin |
|