saisaitian / TCMR

Other
1 stars 0 forks source link

Step6:目前有待完成的功能 #9

Open ShixiangWang opened 3 years ago

ShixiangWang commented 3 years ago

@saisaitian 我简单优化了一些代码,你有空可以 check 下看有没有问题。另外我发现有的 ss_ 函数结果每次都会有点略微的不同。

saisaitian commented 3 years ago

好嘞,你能告诉一下是哪个ss开头的吗?

ShixiangWang commented 3 years ago

我看到 ss_CoreGx 有这种情况,就是 p 值会有略微改变,其他的你也可以检查下。

saisaitian commented 3 years ago

好的,我会在仔细检查一下代码逻辑的,保证不会出错

saisaitian commented 3 years ago

image 不好意思,翔哥,前面两周在家隔离,我今天运行了代码,发现这个代码运行报错,还想请教你一下

ShixiangWang commented 3 years ago

好 我有空看看哈 最近回复会比较慢

ShixiangWang commented 3 years ago

@saisaitian 这个问题是由于 windows 无法调用并行导致的,我修改了下将 windows 只调用 1 个 cpu 计算。后续有时间找一个统一的方式解决一些并行计算的问题。

ShixiangWang commented 3 years ago

是不是目前主要是 构建小分子调控差异表达基因网络 和 GSVA 没有实现了?

ShixiangWang commented 3 years ago

目前 check 有错误喔,你检查看看

image

saisaitian commented 3 years ago

GSVA我可以实现,就是小分子调控差异表达基因网络,我目前还不知道怎么做,就是网络可视化我还不会,另外还想增加一个转录因子富集分析

ShixiangWang commented 3 years ago

小分子调控差异表达基因网络 你想做的是这种吗?http://yulab-smu.top/clusterProfiler-book/chapter12.html#gene-concept-network 转录因子富集分析应该需要知道药物靶向的 Motif 才能做吧?

ShixiangWang commented 3 years ago

https://mp.weixin.qq.com/s/r7Z9DkkEmDVBjTL8n9pWFg 这篇文章提到的信息好像有点用处

saisaitian commented 3 years ago

今天刚给领导完成把国自然重点提交了,这段时间耽搁了,不好意思

ShixiangWang commented 3 years ago

没事,这个课题我没有相关研究背景,需要你主要推动它,我打辅助。

saisaitian commented 3 years ago

又增加了两个函数分别是 gene_dot和enrichtf分别展示感兴趣的基因在不同药物之间的logFc程度和感兴趣基因的转录因子富集分析,分别产生如下图形 image image

另外gsva目前觉得没必要做了,主要的函数就这些了,ss_Corex还需要你加速一下,代码还是挺慢的

ShixiangWang commented 3 years ago

我有空看一下

ShixiangWang commented 3 years ago

image

目前 DESCRIPTION 文件下 imports 的包过多,如果用的较少的包可以考虑移除,相关内容可以阅读 R 包开发那本书。

ShixiangWang commented 3 years ago

目前那个函数没法加速,我看了下几分钟的任务也不太影响。

目前最重要的问题是函数的逻辑比较乱,我生成了 pkgdown 网站(点击 docs/index.html),你可以看目前有多少个函数,理一下他们的功能层次关系。

image

函数本身的文档推荐保持一致。

saisaitian commented 3 years ago

师兄,主要是目前那个函数,当我运行的是100个小分子的数据,就会变得很慢,这个地方有点担心,我的测试数据使用到了是3个小分子数据,可能就需要几分钟了

saisaitian commented 3 years ago

image 这里你可以看到,背景数据只用了3个,实际上是含有100多个的数据

ShixiangWang commented 3 years ago

我知道,我4核运行大概 30 秒。问题不大,代码本身目前我检查过也没有特别能显著减少运行时间的地方。

ShixiangWang commented 3 years ago

做科研分析,时间不是最重要的,功能才是。你确保功能没问题,大家能清晰地知道整个(包)分析该怎么做,这些是核心。一个 R 函数跑很久的也很多,这里目前也没有特别值得优化的地方。而且我已经把CPU核数指定写出来的,用户的电脑性能强自然也能加速。

saisaitian commented 3 years ago

整体的函数已经写完了,下一步写一个document吗?

ShixiangWang commented 3 years ago

你可以写一个 vignette 说明下整体上这个包的功能和基本用法。

saisaitian commented 3 years ago

最近在写帮助文档的时候,我在check之后,总出现如下错误,不知道该如何解决,但是在单独运行是没错误的,整的有点郁闷,麻烦抽空帮忙看一下 image 另外note需要注意吗?

ShixiangWang commented 3 years ago

我有空看下,最近外出了,过几天才回上海。

ShixiangWang commented 3 years ago

我现在看看

ShixiangWang commented 3 years ago

@saisaitian 我check后没有看到与你完全一样的问题,我这边check了一下,你再试一试。

saisaitian commented 3 years ago

我目前进一步增加了几个函数,可以完成化合物的相似性分析,药物signature分析以及药物理化性质分析,应该说算是完全了

ShixiangWang commented 3 years ago

可以的,你有空可以分几类总结下功能特性。然后也整理出它的hightlights。 后面可以一起在安装、使用等方面再优化下。

ShixiangWang commented 3 years ago

仓库设置里面可以打开 pages,这样方面随时浏览器看下看目前的文档情况。也可以根据它整理分组下功能函数,规整下逻辑。

image

saisaitian commented 3 years ago

好的  

田赛赛 海军军医大学药学系 Tel:13764132684

 

------------------ 原始邮件 ------------------ 发件人: "Shixiang @.>; 发送时间: 2021年8月4日(星期三) 下午5:05 收件人: @.>; 抄送: @.>; @.>; 主题: Re: [saisaitian/TCMR] Step6:目前有待完成的功能 (#9)

仓库设置里面可以打开 pages,这样方面随时浏览器看下看目前的文档情况。也可以根据它整理分组下功能函数,规整下逻辑。

— You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or unsubscribe. Triage notifications on the go with GitHub Mobile for iOS or Android.

saisaitian commented 3 years ago

image 为啥我的是这个样子?点击了update,好像还要付费 image

ShixiangWang commented 3 years ago

额。那算了吧。以后公开再弄这个。

本地看看 docs/index.html 应该会有目前全部的函数,你有空分组整理下。 有什么需要帮忙和建议的和我说下。

saisaitian commented 3 years ago

好嘞,谢谢翔哥

saisaitian commented 3 years ago

最后还有一个函数可能需要你帮忙,我现在是简单计算了两个药物的协同得分,现在是我想要计算出最佳的药物组合对,我现在不知道如何实现,这里有个参考链接 image 文章是:Renoprotective Effect of Combined Inhibition of Angiotensin-Converting Enzyme and Histone Deacetylase

我这个代码是synergy.R,需要你帮助一下

ShixiangWang commented 3 years ago

好的 我看看

saisaitian commented 3 years ago

函数我写出来了,刚才又重新更新了一下

ShixiangWang commented 3 years ago

可以的 👍 。

目前包开发方面一个是太大了,另外就是函数命名组织可能还是得优化下。这两点接下来一周我抽空弄一下。 工具开发方面这两个是重点,非常影响用户体验。

学术价值方面,目前你主要确认下分析功能没有问题,到位就行了,性能/可视化等等后面还可以慢慢优化。 后面写文章的话需要你自己整理一些亮点出来看看,毕竟我没有相关的背景。

ShixiangWang commented 3 years ago

@saisaitian 我对全部的函数名的设定进行了重构和文件规整,这样更具备一致性。 你有空仔细检查下看有遗漏的没有,以及是否造成一些了代码异常的替换。

我接下来对数据的加载进行重构和优化,花时间把大的数据迁移出包,单独放到其他地方(https://zenodo.org/),看能不能把包的大小压缩到10MB以内。

ShixiangWang commented 3 years ago

这个 https://github.com/saisaitian/TCMR/blob/wsx/tcga.disease.Rdata 有什么特别的作用吗?我看你放在根目录下。如果是想作为内置数据的话,需要放到 data/ 然后添加文档。保存的文件名和实际存储的对象名也不一样。发现data已经有了,我直接删除掉。

saisaitian commented 3 years ago

好的

saisaitian commented 3 years ago

为啥我没看到修改的地方? 26EDC473

ShixiangWang commented 3 years ago

你需要切换分支 https://github.com/saisaitian/TCMR/tree/wsx

你如果是在命令行使用git的话

git checkout wsx
git pull
ShixiangWang commented 3 years ago

我没有直接合并修改到主分支,怕有其他一些问题。

你切换到 wsx 分支后检查问题,做一些必要的调整,进行commit。觉得没有问题了就合并 https://github.com/saisaitian/TCMR/pull/10

另外一种方法是你先点击合并我的修改,然后在现在的主分支下检查和修改。

saisaitian commented 3 years ago

你太厉害了,我看到了,你的代码太工整了,学到了

saisaitian commented 3 years ago

师兄,想问一下名字的重构都是自己手动完成的吗?我觉得你名字起的都很好

ShixiangWang commented 3 years ago

我看了你的vignette,根据函数的大体功能重新思考设计的。然后用下面的命令批量一个一个改掉之前的函数名。

sed -i "" "s/old_name/new_name/g" `grep "old_name" -rl ./*`
saisaitian commented 3 years ago

image 问一个别的问题,很奇怪,我一直登不上去,账号密码都没错

ShixiangWang commented 3 years ago

不清楚,你网页版本退出登陆试试? 这个可能是这个软件问题也可能是你激活了非网页软件需要使用 token?