Open hypotheses opened 3 years ago
ใช่ครับ จะมี SNPs บางตัวทีเป็น monoallelic ใน EAS น่ะครับ ผมคิดว่าจะหา proxy SNPs ตัวทีเป็น monoallelic ใน EAS ดูเพิ่มใน related population กับเราที่สุดอย่าง South Asian ไปด้วยน่ะครับ เพราะบางตัวมี allele สองตัวใน South asian น่ะครับ
SNPs ที่ report ว่า not biallelic จะเป็น deletion น่ะครับ LDlink มันเลย detect ไม่ได้ เช่น 5:52679539 . ผมนับดูเรามีอยู่ 10 ตัวน่ะครับ คิดว่าเราอาจจะต้อง exclude ออก
ได้ครับ เดี๋ยวผมจะ filter โดยอิงจาก RegulomeDB score (เลือก proxy ที่่ มี score น้อย ที่สุด) กับ allele frequency เฉลี่ย (เลือก proxy ที่่ allele frequncy น้อย ที่สุด) ให้นะครับ
ตอนนี้ผมหาproxy SNPs โดยใช้ East Asian กับ South Asian เป็น reference นะครับ ดูเหมือนว่าจะสามารถ detect SNPs ได้เพิ่มขึ้นเป็น 301 ตัวนะครับ มี 12 ตัวที่ detect ไม่ได้ ( 3 ตัวเป็น monoallelic ส่วนอีก 9 ตัวไม้ใช่่ SNPs นะครับ)
ผมแพลนว่าจะหา proxy SNPs ที่ดีที่สุดต่อโดยใช้ set ของ proxy SNPs ที่มาจาก East Asian กับ South Asian ไปนะครับ
ไฟล์ SNPs not found ตอนนี้ ที่มันโชว์ว่าเป็น monoallelic หมายถึง SNP จาก reference paper เป็น monoallelic ใน EAS เหรอครับ แล้วอันที่เขียนว่า not biallelic นี่มันคือมีมากกว่า 2 alleles หรือหมายความว่ายังไงเหรอครับ
สำหรับตัวที่หาเจอหลาย proxy snps ถ้า max(R2) มีหลายตัว เราเลือกจาก Allele freuqncy เฉลี่ย ใน Asian population ได้มั้ยครับ รวม East & South Asian เข้าด้วยกัน แต่อาจจะต้องไปดึงข้อมูล allele frequency มาเพิม่