GSK组织GeneDisco挑战赛,探索体外基因实验的广阔设计空间
GSK在其官方网站上发布了GeneDisco挑战赛,2022年3月31日提交截止。以下是简要内容。
介绍
利用CRISPR技术等进行基因干预的体外细胞实验,是早期药物发现和靶点验证的一个重要步骤,有助于评估关于生物机制和疾病病理之间因果关系的初步假设。由于有数十亿个潜在的假设需要测试,体外遗传实验的实验设计空间极其巨大,而现有的实验能力(即使是在世界最大的研究机构)与这个生物假设空间的大小相比也是相形见绌。机器学习方法,如主动学习和强化学习,可以通过整合各种信息来源的先验知识,以及根据现有数据推断出实验设计空间中尚未开发的区域,帮助优化探索巨大的生物空间。
GeneDisco挑战赛是一个机器学习社区挑战赛,用于评估批量主动学习算法,以探索遗传扰动实验中庞大的实验设计空间。遗传扰动实验,例如使用CRISPR技术扰动基因组,是早期药物发现(包括靶点发现和靶点验证)的一个重要组成部分。GeneDisco挑战赛是与ICLR-22的Machine Learning for Drug Discovery workshop联合举办的。
要了解更多,请看关于GeneDisco基准的arXiv预印本。
挑战赛任务
The GeneDisco challenge由两个子任务组成。
任务1--最大限度地提高靶点发现率。为干预性实验选择基因靶点,以最大限度地提高有趣靶点的发现率("靶点发现率")。
任务2--最大限度地提高模型性能。为干预性实验选择基因靶点,以便使在所选数据上训练的机器学习模型的性能最大化。
每项任务都将被独立打分和奖励。对于每项任务,将向参与者提供公共开发数据集,参与者可以使用这些数据集来开发和评估他们的方法。这些任务将在一个独立的实验数据集(挑战赛参与者不可见)的私人排行榜上进行评分,以确定挑战赛的获胜者。
奖金
我们将向获胜团队颁发总额为20000英镑的奖金。
任务1 - 最大化靶点发现率
第1名 5000英镑
第2名 3000英镑
第3名 2000英镑
任务2 - 最大化模型性能
第1名 5000英镑
第2次 3000英镑
第3名 2000英镑
提交说明
要准备提交,请使用
https://github.com/genedisco/genedisco-starter 提供的启动库。
进一步的提交细节在上述资料库的README中提供。比赛时间安排
2022年1月31日 - 开始提交
2022年2月、3月--提交时间
2022年3月31日--提交截止日期
2022年4月29日--在ICLR-22的Machine Learning for Drug Discovery workshop上宣布获奖者。
赞助商
葛兰素史克公司(GSK)是一家以科学为主导的全球医疗保健公司,其特殊目的是通过帮助人们做得更多、感觉更好、活得更久来提高人类生活质量。每天,我们通过发现、开发和生产创新药物、疫苗和消费者保健产品,帮助改善世界各地数百万人的健康。我们正在建立一个以我们的价值观和期望为基础的更强大的目标和绩效文化--这样我们就能共同为病人和消费者带来非凡的影响。
GSK.ai使用人工智能来发现变革性药物。人工智能是解释基因数据集的关键,因此我们可以理解细胞的"语言",开发出成功概率更高的药物。组织者
Andrew Jesson, Oxford University
Arash Mehrjou, GSK.ai
Ashkan Soleymani, MIT
Ece Özkan Elsen, ETH Zurich
Pascal Notin, Oxford University
Patrick Schwab, GSK.ai
Sonali Parbhoo, Imperial College London
Stefan Bauer, KTH Stockholm, GSK.ai, CIFAR Azrieli Global Scholar
Yarin Gal, Oxford University
参考资料https://www.gsk.ai/genedisco-challenge/--------- End ---------
感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或 姓名-学校-职务/研究方向。