LiLabAtVT / DeepTE

Neural network classification of TE
BSD 3-Clause "New" or "Revised" License
86 stars 7 forks source link

A much different result with the example_data #8

Closed zhangrengang closed 4 years ago

zhangrengang commented 4 years ago

Hi, I run the command:

python3 ../DeepTE.py -d working_dir1 -o output_dir1 -i input_test.fasta -sp P -m_dir ../models/Plants_model/

The following is the count of result:

      1 ClassII_DNA_CACTA       ClassII_DNA_Harbinger_MITE
      1 ClassII_DNA_CACTA       ClassII_DNA_Mutator_nMITE
      2 ClassII_DNA_CACTA       ClassII_DNA_TcMar_nMITE
      1 ClassII_DNA_CACTA       ClassI_LTR_Copia
     15 ClassII_DNA_CACTA       ClassI_LTR_Gypsy
      1 ClassII_DNA_CACTA       ClassI_nLTR_LINE_I
      1 ClassII_DNA_Harbinger   ClassII_DNA_Harbinger_MITE
      3 ClassII_DNA_Harbinger   ClassII_DNA_hAT_MITE
      1 ClassII_DNA_Harbinger   ClassII_DNA_Mutator_nMITE
      2 ClassII_DNA_Harbinger   ClassII_DNA_TcMar_MITE
      1 ClassII_DNA_Harbinger   ClassII_DNA_TcMar_nMITE
     14 ClassII_DNA_Harbinger   ClassI_LTR_Gypsy
      2 ClassII_DNA_Harbinger   ClassI_nLTR_SINE_tRNA
      1 ClassII_DNA_hAT ClassII_DNA_CACTA_nMITE
      3 ClassII_DNA_hAT ClassII_DNA_Harbinger_MITE
      2 ClassII_DNA_hAT ClassII_DNA_Harbinger_nMITE
      2 ClassII_DNA_hAT ClassII_DNA_hAT_MITE
      3 ClassII_DNA_hAT ClassII_DNA_hAT_nMITE
      1 ClassII_DNA_hAT ClassII_DNA_Mutator_MITE
      3 ClassII_DNA_hAT ClassII_DNA_Mutator_nMITE
      1 ClassII_DNA_hAT ClassII_DNA_TcMar_MITE
      5 ClassII_DNA_hAT ClassII_DNA_TcMar_nMITE
      2 ClassII_DNA_hAT ClassI_LTR_Copia
     35 ClassII_DNA_hAT ClassI_LTR_Gypsy
      1 ClassII_DNA_hAT ClassI_nLTR_LINE_I
      3 ClassII_DNA_Mutator     ClassII_DNA_Harbinger_nMITE
      2 ClassII_DNA_Mutator     ClassII_DNA_hAT_nMITE
      3 ClassII_DNA_Mutator     ClassII_DNA_Mutator_nMITE
      1 ClassII_DNA_Mutator     ClassII_DNA_TcMar_MITE
      1 ClassII_DNA_Mutator     ClassII_DNA_TcMar_nMITE
     14 ClassII_DNA_Mutator     ClassI_LTR_Gypsy
      1 ClassII_DNA_P   ClassII_DNA_Mutator_nMITE
      2 ClassII_DNA_P   ClassI_LTR_Gypsy
      2 ClassII_DNA_TcMar       ClassII_DNA_Harbinger_MITE
      2 ClassII_DNA_TcMar       ClassII_DNA_Harbinger_nMITE
      2 ClassII_DNA_TcMar       ClassII_DNA_hAT_MITE
      6 ClassII_DNA_TcMar       ClassII_DNA_hAT_nMITE
      1 ClassII_DNA_TcMar       ClassII_DNA_Mutator_MITE
      7 ClassII_DNA_TcMar       ClassII_DNA_Mutator_nMITE
      2 ClassII_DNA_TcMar       ClassII_DNA_TcMar_MITE
      6 ClassII_DNA_TcMar       ClassII_DNA_TcMar_nMITE
     25 ClassII_DNA_TcMar       ClassI_LTR_Gypsy
      1 ClassII_DNA_TcMar       ClassI_nLTR_SINE_tRNA
      1 ClassIII_Helitron       ClassII_DNA_Harbinger_nMITE
      1 ClassIII_Helitron       ClassII_DNA_hAT_nMITE
      5 ClassIII_Helitron       ClassII_DNA_Mutator_nMITE
      1 ClassIII_Helitron       ClassII_DNA_TcMar_nMITE
     11 ClassIII_Helitron       ClassI_LTR_Gypsy
      1 ClassI_LTR_Copia        ClassII_DNA_CACTA_nMITE
      3 ClassI_LTR_Copia        ClassII_DNA_Harbinger_MITE
      2 ClassI_LTR_Copia        ClassII_DNA_Harbinger_nMITE
     15 ClassI_LTR_Copia        ClassII_DNA_hAT_MITE
      3 ClassI_LTR_Copia        ClassII_DNA_hAT_nMITE
      7 ClassI_LTR_Copia        ClassII_DNA_Mutator_nMITE
      7 ClassI_LTR_Copia        ClassII_DNA_TcMar_MITE
      3 ClassI_LTR_Copia        ClassII_DNA_TcMar_nMITE
      1 ClassI_LTR_Copia        ClassI_LTR_Copia
    263 ClassI_LTR_Copia        ClassI_LTR_Gypsy
      3 ClassI_LTR_Copia        ClassI_nLTR_DIRS
      1 ClassI_LTR_Copia        ClassI_nLTR_SINE_tRNA
      6 ClassI_LTR_Gypsy        ClassII_DNA_CACTA_nMITE
      7 ClassI_LTR_Gypsy        ClassII_DNA_Harbinger_MITE
     17 ClassI_LTR_Gypsy        ClassII_DNA_hAT_MITE
     10 ClassI_LTR_Gypsy        ClassII_DNA_hAT_nMITE
     19 ClassI_LTR_Gypsy        ClassII_DNA_Mutator_nMITE
     15 ClassI_LTR_Gypsy        ClassII_DNA_TcMar_MITE
     23 ClassI_LTR_Gypsy        ClassII_DNA_TcMar_nMITE
      3 ClassI_LTR_Gypsy        ClassI_LTR_Copia
    394 ClassI_LTR_Gypsy        ClassI_LTR_Gypsy
      2 ClassI_LTR_Gypsy        ClassI_nLTR_DIRS
      1 ClassI_LTR_Gypsy        ClassI_nLTR_SINE_tRNA
      7 ClassI_nLTR_DIRS        ClassI_LTR_Gypsy
      4 ClassI_nLTR_LINE_I      ClassI_LTR_Gypsy
      1 ClassI_nLTR_LINE_L1     ClassII_DNA_hAT_nMITE
      2 ClassI_nLTR_LINE_L1     ClassII_DNA_Mutator_nMITE
      1 ClassI_nLTR_LINE_L1     ClassII_DNA_TcMar_MITE
      1 ClassI_nLTR_LINE_L1     ClassII_DNA_TcMar_nMITE
     27 ClassI_nLTR_LINE_L1     ClassI_LTR_Gypsy
      1 ClassI_nLTR_PLE ClassII_DNA_Harbinger_MITE
      1 ClassI_nLTR_PLE ClassII_DNA_TcMar_nMITE
     11 ClassI_nLTR_PLE ClassI_LTR_Gypsy
      1 ClassI_nLTR_SINESL      ClassII_DNA_hAT_MITE
      1 ClassI_nLTR_SINESL      ClassII_DNA_TcMar_MITE
      1 ClassI_nLTR_SINESL      ClassI_LTR_Copia
      1 ClassI_nLTR_SINESL      ClassI_LTR_Gypsy
      2 ClassI_nLTR_SINE_tRNA   ClassII_DNA_Harbinger_MITE
      3 ClassI_nLTR_SINE_tRNA   ClassII_DNA_hAT_MITE
      1 ClassI_nLTR_SINE_tRNA   ClassII_DNA_TcMar_nMITE
      1 ClassI_nLTR_SINE_tRNA   ClassI_LTR_Copia
      1 ClassI_nLTR_SINE_tRNA   ClassI_LTR_Gypsy

It is much different with the example result (e.g. too many ClassI_LTR_Copia was classified to ClassI_LTR_Gypsy):

      5 ClassII_DNA_CACTA       ClassII_DNA_CACTA_MITE
     15 ClassII_DNA_CACTA       ClassII_DNA_CACTA_nMITE
      1 ClassII_DNA_CACTA       ClassII_DNA_TcMar_nMITE
     14 ClassII_DNA_Harbinger   ClassII_DNA_Harbinger_MITE
      9 ClassII_DNA_Harbinger   ClassII_DNA_Harbinger_nMITE
      1 ClassII_DNA_Harbinger   ClassIII_Helitron
     20 ClassII_DNA_hAT ClassII_DNA_hAT_MITE
     39 ClassII_DNA_hAT ClassII_DNA_hAT_nMITE
      1 ClassII_DNA_Mutator     ClassII_DNA_hAT_nMITE
      3 ClassII_DNA_Mutator     ClassII_DNA_Mutator_MITE
     20 ClassII_DNA_Mutator     ClassII_DNA_Mutator_nMITE
      1 ClassII_DNA_P   ClassII_DNA_P_MITE
      2 ClassII_DNA_P   ClassII_DNA_P_nMITE
      1 ClassII_DNA_TcMar       ClassII_DNA_Harbinger_nMITE
      2 ClassII_DNA_TcMar       ClassII_DNA_hAT_nMITE
      9 ClassII_DNA_TcMar       ClassII_DNA_TcMar_MITE
     42 ClassII_DNA_TcMar       ClassII_DNA_TcMar_nMITE
      1 ClassIII_Helitron       ClassII_DNA_Mutator_nMITE
      1 ClassIII_Helitron       ClassII_DNA_TcMar_nMITE
     17 ClassIII_Helitron       ClassIII_Helitron
      2 ClassI_LTR_Copia        ClassII_DNA_CACTA_nMITE
      4 ClassI_LTR_Copia        ClassII_DNA_Harbinger_MITE
      1 ClassI_LTR_Copia        ClassII_DNA_Harbinger_nMITE
      2 ClassI_LTR_Copia        ClassII_DNA_hAT_MITE
      1 ClassI_LTR_Copia        ClassII_DNA_hAT_nMITE
      2 ClassI_LTR_Copia        ClassII_DNA_Mutator_MITE
      9 ClassI_LTR_Copia        ClassII_DNA_TcMar_MITE
      1 ClassI_LTR_Copia        ClassII_DNA_TcMar_nMITE
    281 ClassI_LTR_Copia        ClassI_LTR_Copia
      4 ClassI_LTR_Copia        ClassI_LTR_Gypsy
      1 ClassI_LTR_Copia        ClassI_nLTR_LINE_I
      1 ClassI_LTR_Copia        ClassI_nLTR_SINE_tRNA
      3 ClassI_LTR_Gypsy        ClassII_DNA_CACTA_nMITE
      4 ClassI_LTR_Gypsy        ClassII_DNA_Harbinger_MITE
      5 ClassI_LTR_Gypsy        ClassII_DNA_Harbinger_nMITE
      7 ClassI_LTR_Gypsy        ClassII_DNA_hAT_MITE
      9 ClassI_LTR_Gypsy        ClassII_DNA_hAT_nMITE
      2 ClassI_LTR_Gypsy        ClassII_DNA_Mutator_MITE
      3 ClassI_LTR_Gypsy        ClassII_DNA_Mutator_nMITE
     10 ClassI_LTR_Gypsy        ClassII_DNA_TcMar_MITE
      6 ClassI_LTR_Gypsy        ClassII_DNA_TcMar_nMITE
    442 ClassI_LTR_Gypsy        ClassI_LTR_Gypsy
      1 ClassI_LTR_Gypsy        ClassI_nLTR_DIRS
      2 ClassI_LTR_Gypsy        ClassI_nLTR_LINE_I
      1 ClassI_LTR_Gypsy        ClassI_nLTR_LINE_L1
      2 ClassI_LTR_Gypsy        ClassI_nLTR_SINE_tRNA
      7 ClassI_nLTR_DIRS        ClassI_nLTR_DIRS
      3 ClassI_nLTR_LINE_I      ClassI_nLTR_LINE_I
      1 ClassI_nLTR_LINE_I      ClassI_nLTR_PLE
     32 ClassI_nLTR_LINE_L1     ClassI_nLTR_LINE_L1
      1 ClassI_nLTR_PLE ClassII_DNA_hAT_nMITE
     12 ClassI_nLTR_PLE ClassI_nLTR_PLE
      3 ClassI_nLTR_SINESL      ClassI_nLTR_SINESL
      1 ClassI_nLTR_SINESL      ClassI_nLTR_SINE_tRNA
      8 ClassI_nLTR_SINE_tRNA   ClassI_nLTR_SINE_tRNA

How to repeat the example result?

zhangrengang commented 4 years ago

It seems to be because the package versions. When I use the identical versions with installed by conda, the essentially same result as the example is got:

      5 ClassII_DNA_CACTA       ClassII_DNA_CACTA_MITE
     16 ClassII_DNA_CACTA       ClassII_DNA_CACTA_nMITE
     14 ClassII_DNA_Harbinger   ClassII_DNA_Harbinger_MITE
      9 ClassII_DNA_Harbinger   ClassII_DNA_Harbinger_nMITE
      1 ClassII_DNA_Harbinger   ClassIII_Helitron
     20 ClassII_DNA_hAT ClassII_DNA_hAT_MITE
     39 ClassII_DNA_hAT ClassII_DNA_hAT_nMITE
      3 ClassII_DNA_Mutator     ClassII_DNA_Mutator_MITE
     21 ClassII_DNA_Mutator     ClassII_DNA_Mutator_nMITE
      1 ClassII_DNA_P   ClassII_DNA_P_MITE
      2 ClassII_DNA_P   ClassII_DNA_P_nMITE
      1 ClassII_DNA_TcMar       ClassII_DNA_Harbinger_nMITE
      9 ClassII_DNA_TcMar       ClassII_DNA_TcMar_MITE
     44 ClassII_DNA_TcMar       ClassII_DNA_TcMar_nMITE
      1 ClassIII_Helitron       ClassII_DNA_hAT_nMITE
      1 ClassIII_Helitron       ClassII_DNA_Mutator_nMITE
     17 ClassIII_Helitron       ClassIII_Helitron
      2 ClassI_LTR_Copia        ClassII_DNA_CACTA_nMITE
      7 ClassI_LTR_Copia        ClassII_DNA_Harbinger_MITE
      2 ClassI_LTR_Copia        ClassII_DNA_hAT_MITE
      2 ClassI_LTR_Copia        ClassII_DNA_hAT_nMITE
      2 ClassI_LTR_Copia        ClassII_DNA_Mutator_MITE
      6 ClassI_LTR_Copia        ClassII_DNA_TcMar_MITE
      1 ClassI_LTR_Copia        ClassII_DNA_TcMar_nMITE
    281 ClassI_LTR_Copia        ClassI_LTR_Copia
      4 ClassI_LTR_Copia        ClassI_LTR_Gypsy
      1 ClassI_LTR_Copia        ClassI_nLTR_LINE_I
      1 ClassI_LTR_Copia        ClassI_nLTR_SINE_tRNA
      3 ClassI_LTR_Gypsy        ClassII_DNA_CACTA_nMITE
      2 ClassI_LTR_Gypsy        ClassII_DNA_Harbinger_MITE
      4 ClassI_LTR_Gypsy        ClassII_DNA_Harbinger_nMITE
     10 ClassI_LTR_Gypsy        ClassII_DNA_hAT_MITE
     11 ClassI_LTR_Gypsy        ClassII_DNA_hAT_nMITE
      2 ClassI_LTR_Gypsy        ClassII_DNA_Mutator_MITE
      3 ClassI_LTR_Gypsy        ClassII_DNA_Mutator_nMITE
      9 ClassI_LTR_Gypsy        ClassII_DNA_TcMar_MITE
      5 ClassI_LTR_Gypsy        ClassII_DNA_TcMar_nMITE
    442 ClassI_LTR_Gypsy        ClassI_LTR_Gypsy
      1 ClassI_LTR_Gypsy        ClassI_nLTR_DIRS
      2 ClassI_LTR_Gypsy        ClassI_nLTR_LINE_I
      1 ClassI_LTR_Gypsy        ClassI_nLTR_LINE_L1
      2 ClassI_LTR_Gypsy        ClassI_nLTR_SINE_tRNA
      7 ClassI_nLTR_DIRS        ClassI_nLTR_DIRS
      3 ClassI_nLTR_LINE_I      ClassI_nLTR_LINE_I
      1 ClassI_nLTR_LINE_I      ClassI_nLTR_PLE
     32 ClassI_nLTR_LINE_L1     ClassI_nLTR_LINE_L1
      1 ClassI_nLTR_PLE ClassII_DNA_hAT_nMITE
     12 ClassI_nLTR_PLE ClassI_nLTR_PLE
      3 ClassI_nLTR_SINESL      ClassI_nLTR_SINESL
      1 ClassI_nLTR_SINESL      ClassI_nLTR_SINE_tRNA
      8 ClassI_nLTR_SINE_tRNA   ClassI_nLTR_SINE_tRNA