Vicky123wzy / RetroScan

MIT License
3 stars 0 forks source link

Need help regarding Retroscan Pipeline run #4

Open ausswal opened 1 year ago

ausswal commented 1 year ago

Hi I am using the Sorghum bicolor genome obtained from Phytozome database for retrogene prediction using retroscan pipeline. When I ran the pipeline, I got an error - "failed to extract protein sequences and CDS sequences, please check the gffread software or input file". As I have checked the test_gff file provided in example it has a line mentioning "protein" in the third column which gff does not have. Most of the gff files downloaded from databases like ncbi, ensemble does not have any lines with protein information. I have pasted my gff file for consideration. Please suggest how to solve this error.

gff-version 3

assembly-version v5.0

assembly-site JGI

annot-version v5.1

annot-site JGI

species Sorghum bicolor

Chr01 phytozomev13 gene 22085 23338 . + . ID=Sobic.001G000100.v5.1;Name=Sobic.001G000100;ancestorIdentifier=Sobic.001G000100.v3.2 Chr01 phytozomev13 mRNA 22085 23338 . + . ID=Sobic.001G000100.1.v5.1;Name=Sobic.001G000100.1;pacid=54122645;longest=1;ancestorIdentifier=Sobic.001G000100.1.v3.2;Parent=Sobic.001G000100.v5.1 Chr01 phytozomev13 five_prime_UTR 22085 22405 . + . ID=Sobic.001G000100.1.v5.1.five_prime_UTR.1;Parent=Sobic.001G000100.1.v5.1;pacid=54122645 Chr01 phytozomev13 CDS 22406 23071 . + 0 ID=Sobic.001G000100.1.v5.1.CDS.1;Parent=Sobic.001G000100.1.v5.1;pacid=54122645 Chr01 phytozomev13 three_prime_UTR 23072 23338 . + . ID=Sobic.001G000100.1.v5.1.three_prime_UTR.1;Parent=Sobic.001G000100.1.v5.1;pacid=54122645 Chr01 phytozomev13 gene 31590 35375 . - . ID=Sobic.001G000200.v5.1;Name=Sobic.001G000200;ancestorIdentifier=Sobic.001G000200.v3.2 Chr01 phytozomev13 mRNA 31590 35375 . - . ID=Sobic.001G000200.1.v5.1;Name=Sobic.001G000200.1;pacid=54120116;longest=1;ancestorIdentifier=Sobic.001G000200.1.v3.2;Parent=Sobic.001G000200.v5.1 Chr01 phytozomev13 CDS 34958 35056 . - 0 ID=Sobic.001G000200.1.v5.1.CDS.1;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 five_prime_UTR 35057 35375 . - . ID=Sobic.001G000200.1.v5.1.five_prime_UTR.1;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 CDS 34776 34871 . - 0 ID=Sobic.001G000200.1.v5.1.CDS.2;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 CDS 34472 34575 . - 0 ID=Sobic.001G000200.1.v5.1.CDS.3;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 CDS 34092 34363 . - 1 ID=Sobic.001G000200.1.v5.1.CDS.4;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 CDS 33733 33855 . - 2 ID=Sobic.001G000200.1.v5.1.CDS.5;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 CDS 33549 33637 . - 2 ID=Sobic.001G000200.1.v5.1.CDS.6;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 CDS 33350 33455 . - 0 ID=Sobic.001G000200.1.v5.1.CDS.7;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 CDS 33144 33241 . - 2 ID=Sobic.001G000200.1.v5.1.CDS.8;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 CDS 32347 32607 . - 0 ID=Sobic.001G000200.1.v5.1.CDS.9;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 CDS 32104 32187 . - 0 ID=Sobic.001G000200.1.v5.1.CDS.10;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 three_prime_UTR 31590 31965 . - . ID=Sobic.001G000200.1.v5.1.three_prime_UTR.1;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 CDS 31966 31986 . - 0 ID=Sobic.001G000200.1.v5.1.CDS.11;Parent=Sobic.001G000200.1.v5.1;pacid=54120116 Chr01 phytozomev13 gene 43890 44492 . - . ID=Sobic.001G000300.v5.1;Name=Sobic.001G000300;ancestorIdentifier=Sobic.001G000300.v3.2 Chr01 phytozomev13 mRNA 43890 44492 . - . ID=Sobic.001G000300.3.v5.1;Name=Sobic.001G000300.3;pacid=54117269;longest=1;Parent=Sobic.001G000300.v5.1 Chr01 phytozomev13 CDS 43890 44492 . - 0 ID=Sobic.001G000300.3.v5.1.CDS.1;Parent=Sobic.001G000300.3.v5.1;pacid=54117269 Chr01 phytozomev13 gene 44828 63076 . - . ID=Sobic.001G000400.v5.1;Name=Sobic.001G000400;ancestorIdentifier=Sobic.001G000400.v3.2 Chr01 phytozomev13 mRNA 44849 63073 . - . ID=Sobic.001G000400.4.v5.1;Name=Sobic.001G000400.4;pacid=54121765;longest=1;ancestorIdentifier=Sobic.001G000400.4.v3.2;Parent=Sobic.001G000400.v5.1 Chr01 phytozomev13 CDS 62646 62851 . - 0 ID=Sobic.001G000400.4.v5.1.CDS.1;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 five_prime_UTR 62852 63073 . - . ID=Sobic.001G000400.4.v5.1.five_prime_UTR.1;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 62322 62442 . - 1 ID=Sobic.001G000400.4.v5.1.CDS.2;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 57879 57961 . - 0 ID=Sobic.001G000400.4.v5.1.CDS.3;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 57336 57420 . - 1 ID=Sobic.001G000400.4.v5.1.CDS.4;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 56957 57247 . - 0 ID=Sobic.001G000400.4.v5.1.CDS.5;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 56792 56882 . - 0 ID=Sobic.001G000400.4.v5.1.CDS.6;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 55761 56661 . - 2 ID=Sobic.001G000400.4.v5.1.CDS.7;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 55490 55650 . - 1 ID=Sobic.001G000400.4.v5.1.CDS.8;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 55275 55378 . - 2 ID=Sobic.001G000400.4.v5.1.CDS.9;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 54986 55151 . - 0 ID=Sobic.001G000400.4.v5.1.CDS.10;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 54756 54893 . - 2 ID=Sobic.001G000400.4.v5.1.CDS.11;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 54447 54553 . - 2 ID=Sobic.001G000400.4.v5.1.CDS.12;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 54018 54350 . - 0 ID=Sobic.001G000400.4.v5.1.CDS.13;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 53611 53901 . - 0 ID=Sobic.001G000400.4.v5.1.CDS.14;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 53420 53503 . - 0 ID=Sobic.001G000400.4.v5.1.CDS.15;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 47069 47202 . - 0 ID=Sobic.001G000400.4.v5.1.CDS.16;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 46500 46727 . - 1 ID=Sobic.001G000400.4.v5.1.CDS.17;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 46216 46387 . - 1 ID=Sobic.001G000400.4.v5.1.CDS.18;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 45522 45776 . - 0 ID=Sobic.001G000400.4.v5.1.CDS.19;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 three_prime_UTR 44849 45152 . - . ID=Sobic.001G000400.4.v5.1.three_prime_UTR.1;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 CDS 45153 45428 . - 0 ID=Sobic.001G000400.4.v5.1.CDS.20;Parent=Sobic.001G000400.4.v5.1;pacid=54121765 Chr01 phytozomev13 mRNA 44828 63076 . - . ID=Sobic.001G000400.1.v5.1;Name=Sobic.001G000400.1;pacid=54121766;longest=0;ancestorIdentifier=Sobic.001G000400.1.v3.2;Parent=Sobic.001G000400.v5.1 Chr01 phytozomev13 CDS 62646 62851 . - 0 ID=Sobic.001G000400.1.v5.1.CDS.1;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 five_prime_UTR 62852 63076 . - . ID=Sobic.001G000400.1.v5.1.five_prime_UTR.1;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 62322 62442 . - 1 ID=Sobic.001G000400.1.v5.1.CDS.2;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 57879 57961 . - 0 ID=Sobic.001G000400.1.v5.1.CDS.3;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 57336 57420 . - 1 ID=Sobic.001G000400.1.v5.1.CDS.4;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 56957 57247 . - 0 ID=Sobic.001G000400.1.v5.1.CDS.5;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 56792 56882 . - 0 ID=Sobic.001G000400.1.v5.1.CDS.6;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 55761 56661 . - 2 ID=Sobic.001G000400.1.v5.1.CDS.7;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 55490 55650 . - 1 ID=Sobic.001G000400.1.v5.1.CDS.8;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 55275 55378 . - 2 ID=Sobic.001G000400.1.v5.1.CDS.9;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 54986 55151 . - 0 ID=Sobic.001G000400.1.v5.1.CDS.10;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 54768 54893 . - 2 ID=Sobic.001G000400.1.v5.1.CDS.11;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 54447 54553 . - 2 ID=Sobic.001G000400.1.v5.1.CDS.12;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 54018 54350 . - 0 ID=Sobic.001G000400.1.v5.1.CDS.13;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 53611 53901 . - 0 ID=Sobic.001G000400.1.v5.1.CDS.14;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 53420 53503 . - 0 ID=Sobic.001G000400.1.v5.1.CDS.15;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 47069 47202 . - 0 ID=Sobic.001G000400.1.v5.1.CDS.16;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 46500 46727 . - 1 ID=Sobic.001G000400.1.v5.1.CDS.17;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 46216 46387 . - 1 ID=Sobic.001G000400.1.v5.1.CDS.18;Parent=Sobic.001G000400.1.v5.1;pacid=54121766 Chr01 phytozomev13 CDS 45522 45776 . - 0 ID=Sobic.001G000400.1.v5.1.CDS.19;Parent=Sobic.001G000400.1.v5.1;pacid=54121766

wuxiaopei0509 commented 9 months ago

I am faced with the same problem now, do you have solved the issue ? looking forward to your reply !