heiniglab / scPower-Cell-Atlas

0 stars 0 forks source link

Database Number Mismatch #22

Open Cem-Gulec opened 8 months ago

Cem-Gulec commented 8 months ago

Dataset instance sayılarında bir uyuşmazlık var.

Örneğin: 3 "10x 3' v2_prostate gland_smooth muscle cell of prostate", 2 "10x 3' v3_prostate gland_luminal cell of prostate epithelium", 2 "10x 3' v2_prostate gland_luminal cell of prostate epithelium", 2 "10x 3' v2_prostate gland_fibroblast of connective tissue of prostate", 2 "10x 3' v2_urethra_fibroblast of connective tissue of prostate", 2 "10x 3' v2_urethra_smooth muscle cell of prostate", 2 "10x 3' v3_urethra_fibroblast of connective tissue of prostate", şu id_to_name'e sahip instancelar gamma_linear_fits, disp_fun_estimations gibi sonuçları tıpatıp aynı olmasına rağmen aynı primary_key'le farklı dataset_body_specific'e sahipler.

  1. Bunlar neden farklı dataset_body_specific'e sahipler?
  2. Bu ve bunun gibi aynı primary key durumlarındaki instance'ları uçurmalı mıyım?
  3. Tekrar en baştan her şeyi bir count et -> https://github.com/Cem-Gulec/Helmholtz-Workspace/blob/main/Data-Descriptor/Cell-Level/scPower-wrapper/results/README.md buradaki her bir dataset için cellCount > 50 limitini geçebilen kaçar instance var? Bunların toplamını database row sayısıyla karşılaştır.