查看原文
其他

把R当成你的翻译器

Y叔叔 YuLabSMU 2024-03-27

写了个小函数,调用了百度翻译,这样我可以在R终端用来查查单词,把它当成是个简易版本的词典。当然最主要的是,你可以批量去干点啥。比如上图例子中,我把画图的KEGG通路换成中文的,过于简单了。

我们可以画一下中英文的对照版本,其实翻译得还是不错的。这样子,你在组会讲PPT的时候,用个中文的,讲起来方便,我时常也看到中文期刊文章以及学位论文里用中文的,如果你要这么干,那现在就简单太多了。就算你不用中文的图,你写毕业论文对着图解说,你还是会翻译一下英文条目,然后后面的叙述中,就使用中文了。所以工具虽简单,但堪称神器,因为它可以在R里对接各种东西。我们虽不缺个翻译软件,但场景对接起来,太累。

比如基因的名字,你要写中文名,是不是很头大?有这个翻译神器,信手拈来啊。上面的例子中,我就用基因ID检索基因名称,再翻译成中文,如丝顺滑!

其中有个基因叫 forkhead box M1,被翻译成“叉头箱M1”,有小伙伴说太生硬了。那么我们来检索一下cnki,因为cnki有大量的中文论文,而中文论文的摘要是中英文对照的,所以它就拥有了大量专业词汇的中英文对照语料。专业词汇的翻译我拿不准,就会去查它。

反正翻译得差不多,真的是差不多。

要说生硬,我就问你们知不知道什么叫蛇果,英语是Red delicious apple,被音译为红地厘蛇果,简称就变成了蛇果。我书读得少,你们不要骗我。没有最生硬,只有更生硬。生硬起来还挺装逼!

好了,我本来是写着玩儿的,但大家热情太高涨,一下子就把每月免费的检索额度给干光了。所以现在这个函数,检索报错了,所以大家要是想用,一种情况是我忍痛给百度充钱,第二种是大家自己去注册,每个人用自己的账号,各用各的,应该够用。

然后你只需要在你的R session里跑一次set_translate_option()把appid和key给传进去,你就能用自己的了。

细心的小伙伴会发现,包名已经变成了fanyi。没错,我把功能剥离出来,打了个新包,已经在cran上了。

然后我还开了个issue,有兴趣的小伙伴可以练练手。比如说有道,金山都可以实现一下。

用起来还是挺爽的,比如单细胞找了marker之后,用clusterProfiler::bitr去转gene name(本文第三张图),再翻成中文,有个表格对照着看一下,强过你一个个基因去搜索。起码你可以初步看一下对吧,然后再去进一步搜索感兴趣的。试想一下,bitr这一操作给换一下,比如对接个GeneCars,或者是别的数据库,然后拉回来一个基因的描述,再来个中文对照,一做完marker genes,出来一个表,先对照着看一下,得省多少时间。最后的最后,写毕业论文,记得引用,因为还有一个原因,就是这些东西翻成中文,确实经常看到蛮生硬的直译,你引用了,可以说这锅就由工具来背

最近iScience出了一个文章,就说emoji里的物种,丰富度不够,应该增加它的生物多样性,让我们可以来画tree of life。

还给了画图的代码,不过我下载不下来,我非常怀疑是用ggtree和emojifont来画的,毕竟我在2015年就开始这么干了,也在twitter和公众号里宣传了一下,而且毕竟要用R,还这么丝滑地画这样的图,我实在是想不出还有别的工具可以干。但是这篇文章没有引用ggtree,没有引用ggtree没有引用ggtree!!!

像这样子的东西,也能发一篇文章!!!我在想,写个翻译R包岂不是更应该发一篇!而且不单单是针对中文社区嘛,可以翻其它语言,对接一下像上面提到的marker genes的解读啥的,然后再有大家写毕业论文、发非英文文章啥的,进行引用的加持,想必可能会是一个爆款

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存