Open martin-raden opened 8 months ago
hab nochmal über die sequenzmotive nachgedacht.
es wäre gut (und wichtig) die positionierung der motive (on average) zu wissen (zB bzgl CDS oder CM start), um entscheiden zu können, ob das motiv in der interaktionsstelle liegt und wenn ja wo.
Hi @MatthiasHerrmann
hier mal die Punkte zum meme-logo bau
ggf. kannst du für die sequenzen erstmal einen phylogenetischen baum rechnen, um zu sehen, ob du wilde outlier dabei hast. dazu gibts zB ein tool vom clustalw package, aber weiss nicht, wie robust/nett das ist. ist nur erstmal eine idee. ggf. einfach alle reinstopfen und dann im meme output nochmal überlegen, ob man das brauchen kann.
du könntest die virus class in den FASTA header jeder sequenz inkludieren, ala
>MBFV-NC_...
, dann kann man die ggf. einfacher "sortieren" bzw. einordnen, wenn man den phylogenetischen baum oder die meme daten anschaut.in meme ggf ausschalten, dass er auf dem komplementären strang sucht. das wär quatsch
grundlegend erwarten/suchen wir EIN motiv pro subsequenz, aber ggf. schiessen uns da (gerade im 3' UTR) konservierte strukturmotive dazwischen, sodass du da ggf. noch mehr zulassen/suchen musst, um auch ein motiv inder zielregion zu finden
motivlänge 10-15 nt
.. ?
Die Grenzen der subsequenzen sind jetzt erstmal ziemlich ad hoc. Kann man auch gern noch anpassen, wenn man bedarf sieht.
Grüße, Martin