查看原文
其他

QB期刊 | 展望:ChatGPT赋能生物信息学初学者

QB编辑部 QB期刊 2024-04-15

随着大数据科学的发展及学科交叉融合研究新范式的兴起,众多从事生物学和医学基础研究的学生及工作人员对生物信息学分析的依赖越来越强,但他们相对薄弱的编程基础成为了学习生信的巨大障碍。近期,大型语言模型聊天机器人ChatGPT对人们生活带来了巨大的冲击。它除了具有让人印象深刻的自然语言理解能力外,这个聊天机器人还具有很强编程能力。例如它懂多种编程语言,能写代码,并且还可以纠正代码。因此聊天机器人对促进生信初学者具有很大的赋能作用。然而ChatGPT的响应在很大程度上依赖于我们给它所输入的提示(prompts)。在学习生信的过程中,如何给ChatGPT制定有效的提示对于获得准确的结果显得尤其至关重要。

近日,美国西弗吉尼亚大学的胡钢清教授、李秉新教授、李新教授,亚利桑那州州立大学的刘莉教授和德克萨斯大学埃尔帕索分校的冯自峰教授团队共同提出了一种名为OPTIMAL的学习模型用于辅助生物信息学的学习及教育。该模型于2023年3月29日在线发表于Quantitative Biology期刊上(点击文末“阅读原文”下载PDF全文)。同期美国密苏里大学哥伦比亚分校的许东教授对该模型给出了深入的点评并进一步展望了ChatGPT在生信领域中的应用(点击这里阅读原文)。


全文概要

在OPTIMAL模型中,学生通过迭代的方式和聊天机器人进行交互,从而一步步地优化提示(如图1)。

图1. OPTIMAL模型架构


在教学案例中,聊天机器人根据上一步的提示生成代码。学生测试代码,评估结果,并把结果反馈给机器人去更新代码。这个过程持续进行直到得到预期结果。为了验证该模型的有效性,研究人员将其应用于三个生物信息学案例,包括深度测序数据分析、系统发育推断以及计算机视觉中的稳健圆拟合。为了验证模型的扩展性,研究人员还将它应用于经济学和金融学数据分析案例(如图2)。

图2. OPTIMAL模型的数据分析结果展示

 

作者提到在运用OPTIMAL模型时需要提前设定聊天机器人的角色,比如扮演资深的生信专家且熟练指定编程语言。初学者则需要理解数据分析中的关键概念和步骤,以及具有执行命令和阅读代码参考手册的能力。和聊天机器人的迭代交互一方面可以克服学生对编程的惧怕,另一方面还可以培养学生的批判性思维能力。后者显得尤为重要,因为聊天机器人提供的信息不一定是准确的,有时候甚至是具有误导性的。

运用OPTIMAL模型时还需要考虑聊天机器人输出结果的多样性。对同一组提示在不同时间下,聊天机器人可能会给出不同的解决方案,有些甚至是不成功的。在课堂上需要考虑控制这种不确定性来保证教学的顺利进行。同时需要鼓励学生去探索这种多样性。深究背后的机理能促进学生的批判性思维及发散性思维。另外一个现实的问题是模型的迭代不一定会快速收敛。在这个时候需要高级的编程知识或者高阶的提示来协助。初学者需要提前知道这些可能性,有效克服在学习过程中碰到的困难,从而有效寻求解决方案。

最后,文章作者提到尽管OPTIMAL模型对于促进生信教育具有潜在的优势,其在改善传统授课教学成果上的绩效还需进一步评估。考虑到对聊天机器人产生依赖会阻碍学生的能力增长,作者认为聊天机器人更适合作为传统授课的辅助而非替代。这对于初学者在打基础的时候尤其重要。

总之,OPTIMAL模型代表了聊天机器人辅助生信教学的一项令人兴奋的进步。生物或医学背景的初学者可以视聊天机器人为激励者来克服对编程的惧怕,视聊天机器人为助教来学习各样生信技能,视聊天机器人为实习生来培养批判性思维。另外,基于聊天机器人的这种学习方式可以自然而然地从课堂内延伸到课堂外,进而成为一种终身学习的体验。

QB期刊介绍

     Quantitative Biology (QB)期刊是由清华大学、北京大学、高教出版社联合创办的全英文学术期刊。QB主要刊登生物信息学、计算生物学、系统生物学、理论生物学和合成生物学的最新研究成果和前沿进展,并为生命科学与计算机、数学、物理等交叉研究领域打造一个学术水平高、可读性强、具有全球影响力的交叉学科期刊品牌。 

    QB期刊目前已被ESCI, Scopus, CSCD等国内外重要数据库收录。Citescore2021=4.6,2023年将获得第一个影响因子(IF)。

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存