当前位置:首页|资讯|ChatGPT|谷歌|百度

ChatGPT+数据分析=程序员?

作者:生信小院发布时间:2023-02-14


一 起因

最近,虽然稍微谈了一下ChatGPT的大火,但是并未涉及到大家所关心的核心问题,即如果未来,如果ChatGPT所代表的生成式达到了我们人类所能接受的精度时,我们应该怎么办(这一部分会在后面思考后以另一篇推文的形式展示出来)。

笔者最近使用ChatGPT时的确被他高效的回答震撼到。我们之前做问题的检索的时候,google、Bing和百度所能给的只是问题的相关解。然后,看似互联网给了许多相关解,但是这些相关解充斥着无用的信息和广告,这会导致我们在查找唯一的正确解的时候浪费大量的时间和精力。另外,有些正确解可能需要对许多相关解进行一定程度的综合理解才能给出。

而ChatGPT则尝试将相关解整合成他所能理解的正确解传递给我们。虽然,目前这种正确解有较大的概率出错。但是,如果在近未来的某个时刻,这种出错的概率就像很早之前的Imagenet挑战比赛中,突然低到某一阈值,那么这个世界该是如何变化。
当然,关注公众号的大多数读者都是生信分析的爱好者,从事人员,更应该了解ChatGPT对于我们的影响。下面我就以常见的转录分析为例,看看如何使用ChatGPT实现最最基础的流程。

二 起因

那么对于一个数据的分析而言。我们可以分为以下几步问问题
2.1 数据的质控及其评价

这里的话可以看出,可能问题过于简单,ChatGPT所给的答案只是简单的基因表达量的质控(可能更多的算分析吧)

2.2 转录组数据常用的分析思路

这种答案网上应该一抓一大把,没有绝对的正确与对错之分
2.3 针对其中的一种我们询问如何使用代码进行分析

总体还是体现了差异表达分析的思想,但是p值是怎么算出来

2.4 针对差异表达基因进行富集分析,或者功能分类

额,怎么说呢,看起来像是正确的,有需要的小伙伴可以尝试尝试测试一下代码,看看是否可行(原谅笔者的懒)

2.5 结果解读

回答似是而非,看似说了很多,但是又好像没有说

2.6 文献收集

这些文献还是有点老,看来提问的时候还是应该加上时间限制

2.7 论文写作

我们选取nature论文中一句话来让ChatGPT来翻译(含三个版本)


哈哈,这里可能需要英语比较好的读者来品鉴了,对于我而言,看起来还行,可以自己改改就用了。

2.8 论文投稿


不得不说,ChatGPT果然是厉害,推荐的期刊水平都不低

2.9 返修

这个回答很官方,既让审稿人高兴了,也让我们的意见得以表达,点个赞。
三 惯例小结

不得不说,ChatGPT对于数据分析的入门学习者而言,绝对是非常友好的。贴心的问题解答,高效的代码生成,都为数据的上手提供了绝佳的辅助。

但是,如果ChatGPT再发展发展,生信工程师们该如何应对呢(目前的水平还无法做到取代,只能提高效率)?

四 公众号其他资源(方便读者使用)

本公众号开发的相关软件,Multi-omics Hammer软件和Multi-omics Visual软件欢迎大家使用。

Multi-omics Hammer软件下载地址:

https://github.com/wangjun258/Multi-omics-Hammer

Multi-omics Visual软件下载地址:https://github.com/wangjun258/Multi_omics_Visual/releases/tag/Multi_omics_Visual_v1.03

PS:因为本软件是用python脚本撰写,调用了部分依赖包,用户首次使用需要安装python以及对应的包,安装之后便可永久使用。

下面是本号在其他平台的账户,也欢迎大家关注并多提意见。

简书:WJ的生信小院

公众号:生信小院

博客园:生信小院

最后,也欢迎各位大佬能够在本平台上:1传播和讲解自己发表的论文;2:发表对某一科研领域的看法;3:想要达成的合作或者相应的招聘信息;4:展示自己以寻找博后工作或者博士就读的机会;5:博导提供博后工作或者博士攻读机会,都可以后台给笔者留言。希望本平台在进行生信知识分享的同时,能够成为生信分析者的交流平台,能够实现相应的利益互补和双赢(不一定能实现,但是梦想总得是有的吧)。

五 每日一图(源自Stable-diffuse创作)  



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1