Open zhoutianrui-tongji opened 3 weeks ago
import pandas as pd
import scipy.io
import anndata
from scipy.sparse import csr_matrix
def read_anndata_C4(path):
mat = scipy.io.mmread(os.path.join(path, "matrix.mtx.gz")).astype("float32")
mat = mat.transpose()
mat = csr_matrix(mat)
adata = anndata.AnnData(mat,dtype="float32")
genes = pd.read_csv(os.path.join(path, "features.tsv.gz"), header=None, sep='\t')
var_names = genes[0].values
var_names = anndata.utils.make_index_unique(pd.Index(var_names))
adata.var_names = var_names
adata.var['gene_symbols'] = genes[0].values
adata.obs_names = pd.read_csv(os.path.join(path, "barcodes.tsv.gz"), header=None)[0].values
adata.var_names_make_unique()
return adata
adata = read_anndata_C4('raw_matrix')
好的,谢谢!
您好,我现在有一批 bulk RNA-seq 样本,请问有类似这个软件,但是是针对 bulk RNA-seq 的产品吗? @lishuangshuang0616
bulk RNA-seq的分析流程可能需要您自己搭建了,或者在github找一些相关的。 我这边并没有关注这块。
我已经跑完流程,得到了raw_matrix文件夹,我现在想自己进行从头的质控以及后续一系分析。但是我是进行了很多尝试使用 scanpy 读取总是会报错?不知道是否支持?