[meme] logos der interaction sites

Hi @MatthiasHerrmann

hier mal die Punkte zum meme-logo bau

wir extrahieren aus allen sequenzen, in denen wir einen CM Hit haben
- im 5' UTR : -30 bis +10 bzgl. CDS anfang
- im 5' CDS : +20 bis +60
- im 3' UTR : -25 bis +5 bzgl. CM hit anfang (allerdings vom langen CM... für die kurzen CMs müsste man das entsprechend verschieben)
- im 3' UTR : +5 bis +35 bzgl. CM hist start

ggf. kannst du für die sequenzen erstmal einen phylogenetischen baum rechnen, um zu sehen, ob du wilde outlier dabei hast. dazu gibts zB ein tool vom clustalw package, aber weiss nicht, wie robust/nett das ist. ist nur erstmal eine idee. ggf. einfach alle reinstopfen und dann im meme output nochmal überlegen, ob man das brauchen kann.

du könntest die virus class in den FASTA header jeder sequenz inkludieren, ala >MBFV-NC_..., dann kann man die ggf. einfacher "sortieren" bzw. einordnen, wenn man den phylogenetischen baum oder die meme daten anschaut.
in meme ggf ausschalten, dass er auf dem komplementären strang sucht. das wär quatsch
grundlegend erwarten/suchen wir EIN motiv pro subsequenz, aber ggf. schiessen uns da (gerade im 3' UTR) konservierte strukturmotive dazwischen, sodass du da ggf. noch mehr zulassen/suchen musst, um auch ein motiv inder zielregion zu finden
motivlänge 10-15 nt
.. ?

Die Grenzen der subsequenzen sind jetzt erstmal ziemlich ad hoc. Kann man auch gern noch anpassen, wenn man bedarf sieht.

Grüße, Martin

MatthiasHerrmann / Long_Range_RNA_Interactions

[meme] logos der interaction sites #11