如何使用 scanpy 读取 raw_matrix下的文件？

zhoutianrui-tongji commented 3 weeks ago

我已经跑完流程，得到了raw_matrix文件夹，我现在想自己进行从头的质控以及后续一系分析。但是我是进行了很多尝试使用 scanpy 读取总是会报错？不知道是否支持？

lishuangshuang0616 commented 3 weeks ago

https://github.com/MGI-tech-bioinformatics/DNBelab_C_Series_HT_scRNA-analysis-software/blob/version2.0/doc/io.md

import pandas as pd
import scipy.io
import anndata
from scipy.sparse import csr_matrix

def read_anndata_C4(path):   
    mat = scipy.io.mmread(os.path.join(path, "matrix.mtx.gz")).astype("float32")
    mat = mat.transpose()
    mat = csr_matrix(mat)
    adata = anndata.AnnData(mat,dtype="float32")
    genes = pd.read_csv(os.path.join(path, "features.tsv.gz"), header=None, sep='\t')
    var_names = genes[0].values
    var_names = anndata.utils.make_index_unique(pd.Index(var_names))
    adata.var_names = var_names
    adata.var['gene_symbols'] = genes[0].values
    adata.obs_names = pd.read_csv(os.path.join(path, "barcodes.tsv.gz"), header=None)[0].values
    adata.var_names_make_unique()
    return adata

adata =  read_anndata_C4('raw_matrix')

zhoutianrui-tongji commented 2 weeks ago

好的，谢谢！

zhoutianrui-tongji commented 2 weeks ago

您好，我现在有一批 bulk RNA-seq 样本，请问有类似这个软件，但是是针对 bulk RNA-seq 的产品吗？ @lishuangshuang0616

lishuangshuang0616 commented 2 weeks ago

bulk RNA-seq的分析流程可能需要您自己搭建了，或者在github找一些相关的。我这边并没有关注这块。

MGI-tech-bioinformatics / DNBelab_C_Series_HT_scRNA-analysis-software

如何使用 scanpy 读取 raw_matrix下的文件？ #100