rosebaesj / AD_Microbiome_R

Data belongs to AMSRC, Kyung Hee University
1 stars 0 forks source link

LEfSe #2

Closed rosebaesj closed 2 years ago

rosebaesj commented 2 years ago

빈칸 등등이 생기던 문제

rosebaesj commented 2 years ago

해결됨!! tax_glom으로 같은 species를 묶으면 되는 것이었다

rosebaesj commented 2 years ago

그런데 tax 와 tip 중 어느것을 사용해야할지는 여전히 고민 거리 LEfSeOTU

LEfSeOTUtip

rosebaesj commented 2 years ago

관련해서 heatmap, correlation 등도 species 단위에서 볼 것인지 ASV 단위에서 볼 것인지 확정해야할듯

rosebaesj commented 2 years ago
Screen Shot 2022-06-02 at 2 55 02 PM

왜 S보다 G에서 더 개수가 많은거지? 잘 이해가 안감..... 뭔가 un specified, un classified 이런것들의 차이를 잘 이해해야할 것 같음. 자동으로 sum이 되는게 아닌것 같음...

하지만 또 graph 나오는 것은 비슷해 보임

rosebaesj commented 2 years ago

해결됨. tax_glom을 g로 한 후에 lefse를 돌리는 경우 genus level에서 유의미했던 것들이 species level에서도 똑같은 이름으로 유의미하게 나옴! 즉 duplicate 된것. 그래서 그런 것이었당.

따라서 tax_genus 결과에서 에서 진행하면 안될 것 같음 ASV로 하는게 얼추 맞기는 한듯?

추가적으로 기본 run_lefse lda cutoff = 2

rosebaesj commented 2 years ago

아니었음 species 로 tax_glom 하면 species가 비어있는 경우 아얘 누락 됨. 일단 lefse는 asv 단위에서 하는게 맞는듯 아니면 otu 등

합이 1이 되는 상태에서 하는게 맞음.

rosebaesj commented 2 years ago

Lefse 한다음 cBacilli cBacilli_ cBacilli 이렇게 나오는건 c__Bacilli 뒤에 NA 인 것들인데 표기 할수 있는게 없어서 대체하여 이렇게 나타나는 것

완전히 같은 이름이 나올 수도 있는가...? 이런 경우가 생길 수 있다면 asv number로 나타내야 할 것 같은데 그건 아닌듯 asv 숫자 빼고 완전히 같은 애들은 합쳐지는 듯?

rosebaesj commented 2 years ago

그냥 돌리면 ASV 단위인지 species 단위인지 구별이 안감. 그 상위 level은 다 구별이 감.

species 단위에서 다른 것들을 번호를 매겨야하나?

s__uncultured 같은 경우는 종이 다른 걸수도 있는데 asv, species 가 구별이 되어야 하지 않을까?

rosebaesj commented 2 years ago

lefse run을 none으로 설정하면 asv level에서만 분석이 진행됨. -> 50개 Species로 설정하면 species 단위에서 합치고, NA인 경우에도 상위단계 같은것 끼리 합쳐서 그 것에 언더바를 해서 나옴

all 로 설정하면 모든 level에서 나오는데..... 만약 species, genus 다 유의미하면 어떻게? genus에서 더 asv값이 높아지는 경우에만 나오는 것 같다. 즉 상위단계에서 lda값이 더 커지는 경우 상위단계만 출력하는듯 그래서 all의 lda 값의 최솟값이 더 큼.

rosebaesj commented 2 years ago

그렇다면 lda 값이 level 별로 같은것.....? 은 사실상 최하위 level만 나오면 되는 것 아닌가?? 예를들어 pBacteroidota, cBacteroidia, oBacteroidales 의 경우 결국 lda 값은 oBacteroidales와 모두 동일함. 이런 경우에는 o__Bacteroidales 만 나타내면 되는 것 아닌가?

cBacilli__, cBacilli__, cBacilli 도 마찬가지

확실히 table을 먼저 추출해서 한번 조정을 해야하는듯?

rosebaesj commented 2 years ago

의뢰했을 때는 genus와 family 만 보내주심 여쭤보면 어느 단계인지는 연구 목적에 맞게