The-Sequence-Ontology / SO-Ontologies

Collect of SO Ontologies
Creative Commons Attribution 4.0 International
92 stars 37 forks source link

text mining synonyms [sf#126] #126

Closed srynobio closed 9 years ago

srynobio commented 9 years ago

Reported by eilbeck on 2008-10-28 21:14 UTC Hello everybody,

I am considering using the OBO ontology synonyms as a dictionary for text mining. However, since the SO uses underscores for the main label it is necessary to translate these to spaces before adding the label to the dictionary. I am aware that this a very trivial step, but for completeness I would like to propose adding a synonym without underscores directly into the SO where applicable.

Regards,

Tore Eriksson

srynobio commented 9 years ago

Commented by eilbeck on 2008-11-18 22:10 UTC Tab delim file of terms with no synonyms Attached file syn_suggestions2.txt:

SO:0000002  sequence_secondary_structure    y   

SO:0000004 interior_coding_exon y
SO:0000005 satellite_DNA y
SO:0000007 read_pair n read-pair SO:0000010 protein_coding n protein-coding SO:0000011 non_protein_coding n non protein-coding SO:0000018 linkage_group y
SO:0000020 RNA_internal_loop y
SO:0000021 asymmetric_RNA_internal_loop y
SO:0000022 A_minor_RNA_motif y
SO:0000025 symmetric_RNA_internal_loop n A-minor RNA motif SO:0000026 RNA_junction_loop y
SO:0000028 base_pair y
SO:0000030 sugar_edge_base_pair y
SO:0000032 DNA_aptamer y
SO:0000033 RNA_aptamer y
SO:0000039 match_part y
SO:0000040 genomic_clone y
SO:0000041 sequence_operation y
SO:0000042 pseudogene_attribute y
SO:0000044 pseudogene_by_unequal_crossing_over y
SO:0000053 mutation_affecting_regulatory_region y
SO:0000059 nuclease_binding_site y
SO:0000060 compound_chromosome_arm y
SO:0000062 deficient_intrachromosomal_transposition y
SO:0000063 deficient_interchromosomal_transposition y
SO:0000065 free_chromosome_arm y
SO:0000067 gene_to_gene_feature y
SO:0000069 inside_intron y
SO:0000070 inside_intron_antiparallel y
SO:0000071 inside_intron_parallel y
SO:0000073 five_prime_three_prime_overlap n five prime-three prime overlap SO:0000074 five_prime_five_prime_overlap n five prime-five prime overlap SO:0000075 three_prime_three_prime_overlap n three prime-three prime overlap SO:0000078 polycistronic_transcript y
SO:0000079 dicistronic_transcript y
SO:0000080 operon_member y
SO:0000083 macronuclear_sequence y
SO:0000084 micronuclear_sequence y
SO:0000087 nuclear_gene y
SO:0000089 kinetoplast_gene y
SO:0000090 plastid_gene y
SO:0000091 apicoplast_gene y
SO:0000093 chromoplast_gene y
SO:0000094 cyanelle_gene y
SO:0000095 leucoplast_gene y
SO:0000096 proplastid_gene y
SO:0000097 nucleomorph_gene y
SO:0000098 plasmid_gene y SO:0000099 proviral_gene y SO:0000100 endogenous_retroviral_gene y SO:0000102 expressed_sequence_match y SO:0000103 clone_insert_end y SO:0000105 chromosome_arm y SO:0000107 sequencing_primer y SO:0000111 transposable_element_gene y SO:0000118 transcript_with_translational_frameshift y SO:0000122 RNA_sequence_secondary_structure y SO:0000123 transcriptionally_regulated y SO:0000124 transcriptionally_constitutive y SO:0000125 transcriptionally_induced y SO:0000126 transcriptionally_repressed y SO:0000127 silenced_gene y SO:0000128 gene_silenced_by_DNA_modification y SO:0000131 translationally_regulated y SO:0000133 epigenetically_modified y SO:0000135 maternally_imprinted y SO:0000136 paternally_imprinted y SO:0000137 allelically_excluded y SO:0000138 gene_rearranged_at_DNA_level y SO:0000139 ribosome_entry_site y SO:0000142 DNA_sequence_secondary_structure y SO:0000143 assembly_component y SO:0000145 recoded_codon y SO:0000162 splice_site y SO:0000166 enhancer_bound_by_factor y SO:0000177 cross_genome_match y SO:0000179 clone_insert_start y SO:0000181 translated_nucleotide_match y SO:0000184 U2_intron y SO:0000189 non_LTR_retrotransposon y SO:0000191 interior_intron y SO:0000195 coding_exon y SO:0000196 five_prime_exon_coding_region y SO:0000197 three_prime_exon_coding_region y SO:0000201 interior_exon y SO:0000210 tRNA_primary_transcript y SO:0000211 alanine_tRNA_primary_transcript y SO:0000212 arginine_tRNA_primary_transcript y SO:0000213 asparagine_tRNA_primary_transcript y SO:0000214 aspartic_acid_tRNA_primary_transcript y SO:0000215 cysteine_tRNA_primary_transcript y SO:0000216 glutamic_acid_tRNA_primary_transcript y SO:0000217 glutamine_tRNA_primary_transcript y SO:0000218 glycine_tRNA_primary_transcript y SO:0000219 histidine_tRNA_primary_transcript y SO:0000220 isoleucine_tRNA_primary_transcript y SO:0000221 leucine_tRNA_primary_transcript y SO:0000222 lysine_tRNA_primary_transcript y SO:0000223 methionine_tRNA_primary_transcript y SO:0000224 phenylalanine_tRNA_primary_transcript y SO:0000225 proline_tRNA_primary_transcript y SO:0000226 serine_tRNA_primary_transcript y SO:0000227 threonine_tRNA_primary_transcript y SO:0000228 tryptophan_tRNA_primary_transcript y SO:0000229 tyrosine_tRNA_primary_transcript y SO:0000230 valine_tRNA_primary_transcript y SO:0000231 snRNA_primary_transcript y SO:0000232 snoRNA_primary_transcript y SO:0000233 mature_transcript y SO:0000237 transcript_attribute y SO:0000239 flanking_region y SO:0000240 chromosome_variation y SO:0000241 internal_UTR y SO:0000242 untranslated_region_polycistronic_mRNA y SO:0000248 sequence_length_variation y SO:0000250 modified_RNA_base_feature y SO:0000255 rRNA_small_subunit_primary_transcript y SO:0000277 bound_by_factor y SO:0000278 transcript_bound_by_nucleic_acid y SO:0000279 transcript_bound_by_protein y SO:0000280 engineered_gene y SO:0000281 engineered_foreign_gene y SO:0000282 mRNA_with_minus_1_frameshift y SO:0000283 engineered_foreign_transposable_element_gene y SO:0000285 foreign_gene y SO:0000287 fusion_gene y SO:0000288 engineered_fusion_gene y SO:0000293 engineered_foreign_repetitive_element y SO:0000298 recombination_feature y SO:0000299 specific_recombination_site y SO:0000300 recombination_feature_of_rearranged_gene y SO:0000301 vertebrate_immune_system_gene_recombination_feature y SO:0000305 modified_base_site y SO:0000306 methylated_base_feature y SO:0000312 experimentally_determined y SO:0000314 direct_repeat y SO:0000317 cDNA_clone y SO:0000319 stop_codon y SO:0000320 intronic_splice_enhancer y SO:0000321 mRNA_with_plus_1_frameshift y SO:0000322 nuclease_hypersensitive_site y SO:0000325 rRNA_large_subunit_primary_transcript y SO:0000326 SAGE_tag y SO:0000329 mRNA_with_plus_2_frameshift y SO:0000330 conserved_region y SO:0000332 coding_conserved_region y SO:0000333 exon_junction y SO:0000335 mRNA_with_minus_2_frameshift y SO:0000337 RNAi_reagent y SO:0000339 recombination_hotspot y SO:0000342 site_specific_recombination_target_region y SO:0000344 splice_enhancer y SO:0000347 nucleotide_match y SO:0000348 nucleic_acid y SO:0000349 protein_match y SO:0000351 synthetic_sequence y SO:0000353 sequence_assembly y SO:0000354 group_1_intron_homing_endonuclease_target_region y SO:0000355 haplotype_block y SO:0000361 FRT_flanked y SO:0000362 invalidated_by_chimeric_cDNA y SO:0000363 floxed_gene y SO:0000364 transposable_element_flanking_region y SO:0000366 insertion_site y SO:0000368 transposable_element_insertion_site y SO:0000370 small_regulatory_ncRNA y SO:0000371 conjugative_transposon y SO:0000372 enzymatic_RNA y SO:0000373 recombinationally_inverted_gene y SO:0000378 DsrA_RNA y SO:0000379 GcvB_RNA y SO:0000380 hammerhead_ribozyme y SO:0000381 group_IIA_intron y SO:0000382 group_IIB_intron y SO:0000383 MicF_RNA y SO:0000384 OxyS_RNA y
SO:0000385 RNase_MRP_RNA y
SO:0000386 RNase_P_RNA y
SO:0000387 RprA_RNA y
SO:0000388 RRE_RNA y
SO:0000389 spot_42_RNA n spot-42 RNA SO:0000390 telomerase_RNA y
SO:0000400 sequence_attribute y
SO:0000401 gene_attribute y
SO:0000404 vault_RNA y
SO:0000405 Y_RNA y
SO:0000410 protein_binding_site y
SO:0000412 restriction_fragment y
SO:0000413 sequence_difference y
SO:0000414 invalidated_by_genomic_contamination y
SO:0000415 invalidated_by_genomic_polyA_primed_cDNA y
SO:0000416 invalidated_by_partial_processing y SO:0000433 non_LTR_retrotransposon_polymeric_tract y SO:0000434 target_site_duplication y SO:0000439 inverted_ring_chromosome y SO:0000443 polymer_attribute y SO:0000444 three_prime_noncoding_exon y SO:0000446 UTR_intron y SO:0000447 five_prime_UTR_intron y SO:0000448 three_prime_UTR_intron y SO:0000449 random_sequence y SO:0000451 gene_with_polyadenylated_mRNA y SO:0000455 gene_with_mRNA_with_frameshift y SO:0000456 recombinationally_rearranged_gene y SO:0000457 interchromosomal_duplication y SO:0000459 gene_with_trans_spliced_transcript y SO:0000461 inversion_derived_bipartite_deficiency y SO:0000462 pseudogenic_region y SO:0000463 encodes_alternately_spliced_transcripts y SO:0000464 decayed_exon y SO:0000465 inversion_derived_deficiency_plus_duplication y SO:0000468 golden_path_fragment y SO:0000472 tiling_path y SO:0000473 negatively_autoregulated y SO:0000474 tiling_path_fragment y SO:0000475 positively_autoregulated y SO:0000476 contig_read y SO:0000480 tiling_path_clone y SO:0000492 D_gene_recombination_feature y SO:0000499 virtual_sequence y SO:0000500 Hoogsteen_base_pair y SO:0000501 reverse_Hoogsteen_base_pair y SO:0000507 pseudogenic_exon y SO:0000512 inversion_derived_deficiency_plus_aneuploid y SO:0000516 pseudogenic_transcript y SO:0000545 recoding_pseudoknot y SO:0000546 designed_sequence y SO:0000547 inversion_derived_bipartite_duplication y SO:0000548 gene_with_edited_transcript y SO:0000549 inversion_derived_duplication_plus_aneuploid y SO:0000550 aneuploid_chromosome y SO:0000553 polyA_site y SO:0000562 nonamer_of_recombination_feature_of_vertebrate_immune_system_gene y SO:0000563 vertebrate_immune_system_gene_recombination_spacer y SO:0000567 inversion_derived_aneuploid_chromosome y SO:0000568 bidirectional_promoter y SO:0000571 miRNA_encoding y SO:0000573 rRNA_encoding y SO:0000575 scRNA_encoding y SO:0000578 snoRNA_encoding y
SO:0000579 edited_transcript_feature y
SO:0000580 methylation_guide_snoRNA_primary_transcript y
SO:0000582 rRNA_cleavage_snoRNA_primary_transcript y
SO:0000585 C_D_box_snoRNA_encoding n C/D box snoRNA encoding SO:0000587 group_I_intron y
SO:0000588 autocatalytically_spliced_intron y
SO:0000589 SRP_RNA_primary_transcript y
SO:0000595 C_D_box_snoRNA_primary_transcript n C/D box snoRNA primary transcript SO:0000596 H_ACA_box_snoRNA_primary_transcript y
SO:0000603 group_II_intron y
SO:0000604 editing_block y
SO:0000605 intergenic_region y
SO:0000606 editing_domain y
SO:0000607 unedited_region y
SO:0000608 H_ACA_box_snoRNA_encoding y
SO:0000609 oligo_U_tail y
SO:0000610 polyA_sequence y
SO:0000612 polypyrimidine_tract y
SO:0000613 bacterial_RNApol_promoter y
SO:0000614 bacterial_terminator y
SO:0000615 terminator_of_type_2_RNApol_III_promoter y
SO:0000616 transcription_end_site y
SO:0000617 RNApol_III_promoter_type_1 y
SO:0000619 A_box n A-box SO:0000620 B_box n B-box SO:0000621 RNApol_III_promoter_type_3 y
SO:0000622 C_box n C-box SO:0000623 snRNA_encoding y
SO:0000626 chromosomal_regulatory_element y
SO:0000628 chromosomal_structural_element y
SO:0000629 five_prime_open_reading_frame y
SO:0000630 upstream_AUG_codon y SO:0000631 polycistronic_primary_transcript y SO:0000632 monocistronic_primary_transcript y SO:0000638 transcribed_spacer_region y SO:0000639 internal_transcribed_spacer_region y SO:0000640 external_transcribed_spacer_region y SO:0000641 tetranucleotide_repeat_microsatellite_feature y SO:0000642 SRP_RNA_encoding y SO:0000644 antisense_RNA y SO:0000645 antisense_primary_transcript y SO:0000656 stRNA_encoding y SO:0000657 repeat_region y SO:0000659 tmRNA_encoding y SO:0000662 spliceosomal_intron y SO:0000663 tRNA_encoding y SO:0000664 introgressed_chromosome_region y SO:0000665 monocistronic_transcript y SO:0000666 mobile_intron y SO:0000668 EST_match y SO:0000669 sequence_rearrangement_feature y SO:0000670 chromosome_breakage_sequence y SO:0000671 internal_eliminated_sequence y SO:0000672 macronucleus_destined_segment y SO:0000675 canonical_splice_site y SO:0000676 canonical_three_prime_splice_site y SO:0000677 canonical_five_prime_splice_site y SO:0000681 aberrant_processed_transcript y SO:0000683 exonic_splice_enhancer y SO:0000684 nuclease_sensitive_site y SO:0000686 translocation_element y SO:0000687 deletion_junction y SO:0000688 golden_path y SO:0000689 cDNA_match y SO:0000690 gene_with_polycistronic_transcript y SO:0000692 gene_with_dicistronic_transcript y SO:0000693 gene_with_recoded_mRNA y SO:0000697 gene_with_stop_codon_read_through y SO:0000698 gene_with_stop_codon_redefined_as_pyrrolysine y SO:0000701 possible_base_call_error y SO:0000702 possible_assembly_error y SO:0000703 experimental_result_region y SO:0000705 tandem_repeat y SO:0000706 trans_splice_acceptor_site y SO:0000708 SL1_acceptor_site y SO:0000709 SL2_acceptor_site y SO:0000710 gene_with_stop_codon_redefined_as_selenocysteine y SO:0000711 gene_with_mRNA_recoded_by_translational_bypass y SO:0000712 gene_with_transcript_with_translational_frameshift y SO:0000713 DNA_motif y SO:0000714 nucleotide_motif y SO:0000715 RNA_motif y SO:0000717 reading_frame y SO:0000718 blocked_reading_frame y SO:0000720 foreign_transposable_element y SO:0000721 gene_with_dicistronic_primary_transcript y SO:0000726 repeat_unit y SO:0000729 intein_containing y SO:0000733 feature_attribute y SO:0000734 exemplar_mRNA y SO:0000735 sequence_location y SO:0000736 organelle_sequence y SO:0000737 mitochondrial_sequence y SO:0000738 nuclear_sequence y SO:0000739 nucleomorphic_sequence y SO:0000740 plastid_sequence y SO:0000743 apicoplast_sequence y SO:0000744 chromoplast_sequence y SO:0000745 chloroplast_sequence y SO:0000746 cyanelle_sequence y SO:0000747 leucoplast_sequence y SO:0000748 proplastid_sequence y SO:0000749 plasmid_location y SO:0000750 amplification_origin y SO:0000751 proviral_location y SO:0000752 gene_group_regulatory_region y SO:0000753 clone_insert y SO:0000754 lambda_vector y SO:0000755 plasmid_vector y SO:0000769 tmRNA_coding_piece y SO:0000770 tmRNA_acceptor_piece y SO:0000772 genomic_island y SO:0000773 pathogenic_island y SO:0000774 metabolic_island y SO:0000775 adaptive_island y SO:0000776 symbiosis_island y SO:0000777 pseudogenic_rRNA y SO:0000778 pseudogenic_tRNA y SO:0000779 engineered_episome y SO:0000786 reagent_attribute y SO:0000796 transgenic_transposable_element y SO:0000797 natural_transposable_element y SO:0000798 engineered_transposable_element y SO:0000799 engineered_foreign_transposable_element y SO:0000800 assortment_derived_duplication y SO:0000801 assortment_derived_deficiency_plus_duplication y SO:0000802 assortment_derived_deficiency y SO:0000803 assortment_derived_aneuploid y SO:0000805 engineered_foreign_region y SO:0000807 engineered_tag y SO:0000808 validated_cDNA_clone y SO:0000809 invalidated_cDNA_clone y SO:0000810 chimeric_cDNA_clone y SO:0000811 genomically_contaminated_cDNA_clone y SO:0000812 polyA_primed_cDNA_clone y SO:0000813 partially_processed_cDNA_clone y SO:0000815 mini_gene y SO:0000816 rescue_gene y SO:0000817 wild_type y SO:0000818 wild_type_rescue_gene y SO:0000819 mitochondrial_chromosome y SO:0000820 chloroplast_chromosome y SO:0000821 chromoplast_chromosome y SO:0000822 cyanelle_chromosome y SO:0000823 leucoplast_chromosome y SO:0000824 macronuclear_chromosome y SO:0000825 micronuclear_chromosome y SO:0000828 nuclear_chromosome y SO:0000829 nucleomorphic_chromosome y SO:0000830 chromosome_part y SO:0000831 gene_member_region y SO:0000833 transcript_region y SO:0000834 mature_transcript_region y SO:0000835 primary_transcript_region y SO:0000836 mRNA_region y SO:0000837 UTR_region y SO:0000838 rRNA_primary_transcript_region y SO:0000840 repeat_component y SO:0000841 spliceosomal_intron_region y SO:0000842 gene_component_region y
SO:0000847 tmRNA_region y
SO:0000851 CDS_region y
SO:0000852 exon_region y
SO:0000861 capped_primary_transcript y
SO:0000862 capped_mRNA y
SO:0000863 mRNA_attribute y
SO:0000866 minus_1_frameshift y
SO:0000867 minus_2_frameshift y
SO:0000868 plus_1_frameshift y
SO:0000869 plus_2_framshift y
SO:0000870 trans_spliced n trans-spliced SO:0000871 polyadenylated_mRNA y
SO:0000872 trans_spliced_mRNA n trans-spliced mRNA SO:0000873 edited_transcript y
SO:0000874 edited_transcript_by_A_to_I_substitution y
SO:0000875 bound_by_protein y SO:0000876 bound_by_nucleic_acid y SO:0000877 alternatively_spliced y SO:0000882 codon_redefined y SO:0000884 stop_codon_redefined_as_pyrrolysine y SO:0000885 stop_codon_redefined_as_selenocysteine y SO:0000886 recoded_by_translational_bypass y SO:0000887 translationally_frameshifted y SO:0000888 maternally_imprinted_gene y SO:0000889 paternally_imprinted_gene y SO:0000890 post_translationally_regulated_gene y SO:0000891 negatively_autoregulated_gene y SO:0000892 positively_autoregulated_gene y SO:0000894 silenced_by_DNA_modification y SO:0000895 silenced_by_DNA_methylation y SO:0000896 translationally_regulated_gene y SO:0000897 allelically_excluded_gene y SO:0000898 epigenetically_modified_gene y SO:0000899 nuclear_mitochondrial y SO:0000901 unequally_crossed_over y SO:0000903 endogenous_retroviral_sequence y SO:0000904 rearranged_at_DNA_level y SO:0000906 independently_known y SO:0000907 supported_by_sequence_similarity y SO:0000908 supported_by_domain_match y SO:0000909 supported_by_EST_or_cDNA y SO:0000911 predicted_by_ab_initio_computation y SO:0000913 cloned_cDNA_insert y SO:0000914 cloned_genomic_insert y SO:0000915 engineered_insert y SO:0000916 edit_operation y SO:0000917 insert_U y SO:0000918 delete_U y
SO:0000919 substitute_A_to_I y
SO:0000920 insert_C y
SO:0000921 insert_dinucleotide y
SO:0000922 substitute_C_to_U y
SO:0000923 insert_G y
SO:0000924 insert_GC y
SO:0000925 insert_GU y
SO:0000926 insert_CU y
SO:0000927 insert_AU y
SO:0000928 insert_AA y
SO:0000929 edited_mRNA y
SO:0000930 guide_RNA_region y
SO:0000931 anchor_region y
SO:0000932 pre_edited_mRNA n pre-edited mRNA SO:0000934 miRNA_target_site y
SO:0000935 edited_CDS y SO:0000936 vertebrate_immunoglobulin_T_cell_receptor_rearranged_segment y SO:0000938 vertebrate_immunoglobulin_T_cell_receptor_rearranged_gene_cluster y SO:0000939 vertebrate_immune_system_gene_recombination_signal_feature y SO:0000940 recombinationally_rearranged y SO:0000941 recombinationally_rearranged_vertebrate_immune_system_gene y SO:0000949 dif_site y SO:0000951 eukaryotic_terminator y SO:0000954 DNA_chromosome y SO:0000955 double_stranded_DNA_chromosome y SO:0000956 single_stranded_DNA_chromosome y SO:0000957 linear_double_stranded_DNA_chromosome y SO:0000958 circular_double_stranded_DNA_chromosome y SO:0000959 linear_single_stranded_DNA_chromosome y SO:0000960 circular_single_stranded_DNA_chromosome y SO:0000961 RNA_chromosome y SO:0000962 single_stranded_RNA_chromosome y SO:0000963 linear_single_stranded_RNA_chromosome y SO:0000964 linear_double_stranded_RNA_chromosome y SO:0000965 double_stranded_RNA_chromosome y SO:0000966 circular_single_stranded_RNA_chromosome y SO:0000967 circular_double_stranded_RNA_chromosome y SO:0000968 sequence_replication_mode y SO:0000969 rolling_circle y SO:0000970 theta_replication y SO:0000971 DNA_replication_mode y SO:0000972 RNA_replication_mode y SO:0000975 minicircle_gene y SO:0000977 anchor_binding_site y SO:0000979 gRNA_encoding y SO:0000981 rho_dependent_bacterial_terminator y SO:0000982 rho_independent_bacterial_terminator y SO:0000983 strand_attribute y SO:0000986 topology_attribute y SO:0000991 genomic_DNA y SO:0000992 BAC_cloned_genomic_insert y SO:0000994 consensus_region y SO:0000995 consensus_mRNA y SO:0000996 predicted_gene y SO:0000997 gene_fragment y SO:0000998 recursive_splice_site y SO:0000999 BAC_end y SO:0001003 solo_LTR y SO:0001004 low_complexity y SO:0001005 low_complexity_region y SO:0001007 cryptic_prophage y SO:0001014 intron_domain y SO:0001017 silent_mutation y SO:0001020 mutation_affecting_copy_number y SO:0001022 inversion_breakpoint y SO:0001025 polymorphic_sequence_variant y SO:0001029 direction_attribute y SO:0001032 mitochondrial_DNA y SO:0001033 chloroplast_DNA y SO:0001036 arginyl_tRNA y SO:0001038 extrachromosomal_mobile_genetic_element y SO:0001039 integrated_mobile_genetic_element y SO:0001040 integrated_plasmid y SO:0001046 IRLinv_site y SO:0001047 IRRinv_site y SO:0001048 inversion_site_part y SO:0001050 repeat_fragment y SO:0001051 nested_region y SO:0001052 nested_repeat y SO:0001053 nested_transposon y SO:0001054 transposon_fragment y SO:0001055 transcriptional_cis_regulatory_region y SO:0001056 splicing_regulatory_region y SO:0001058 promoter_targeting_sequence y SO:0001059 sequence_alteration y SO:0001060 sequence_variant y SO:0001172 tRNA_region y SO:0001178 pyrrolysine_tRNA_primary_transcript y SO:0001187 pseudouridylation_guide_snoRNA y SO:0001194 R_GNA y SO:0001196 S_GNA y SO:0001203 RNA_polymerase_promoter y SO:0001204 Phage_RNA_Polymerase_Promoter y SO:0001205 SP6_RNA_Polymerase_Promoter y SO:0001206 T3_RNA_Polymerase_Promoter y SO:0001207 T7_RNA_Polymerase_Promoter y SO:0001213 group_III_intron y SO:0001214 noncoding_region_of_exon y SO:0001215 coding_region_of_exon y SO:0001216 endonuclease_spliced_intron y SO:0001217 protein_coding_gene y SO:0001218 transgenic_insertion y SO:0001220 silenced_by_RNA_interference y SO:0001221 silenced_by_histone_modification y SO:0001222 silenced_by_histone_methylation y SO:0001223 silenced_by_histone_deacetylation y SO:0001225 gene_silenced_by_histone_modification y SO:0001226 gene_silenced_by_histone_methylation y SO:0001227 gene_silenced_by_histone_deacetylation y SO:0001237 amino_acid y SO:0001239 minor_TSS y SO:0001241 encodes_alternate_transcription_start_sites y
SO:0001243 miRNA_primary_transcript_region y
SO:0001244 pre_miRNA n pre-miRNA SO:0001245 miRNA_stem y
SO:0001246 miRNA_loop y
SO:0001247 synthetic_oligo y
SO:0001251 STS_map y
SO:0001253 sonicate_fragment y
SO:0001257 homing_endonuclease_binding_site y
SO:0001258 octamer_motif y
SO:0001259 apicoplast_chromosome y
SO:0001260 sequence_collection y
SO:0001261 overlapping_feature_set y
SO:0001262 overlapping_EST_set y
SO:0001264 gRNA_gene y
SO:0001265 miRNA_gene y
SO:0001266 scRNA_gene y SO:0001267 snoRNA_gene y SO:0001268 snRNA_gene y SO:0001269 SRP_RNA_gene y SO:0001270 stRNA_gene y SO:0001271 tmRNA_gene y SO:0001272 tRNA_gene y SO:0001273 modified_adenosine y SO:0001274 modified_inosine y SO:0001275 modified_cytidine y SO:0001276 modified_guanosine y SO:0001277 modified_uridine y SO:0001383 histone_binding_site y SO:0001385 modified_amino_acid_feature y SO:0001408 cleaved_for_gpi_anchor_region y SO:0001409 biomaterial_region y SO:0001410 experimental_output_artefact y SO:0001411 biological_region y SO:0001412 topologically_defined_region y SO:0001413 translocation_breakpoint y SO:0001414 insertion_breakpoint y SO:0001415 deletion_breakpoint y SO:0005836 regulatory_region y SO:0005841 methylation_guide_snoRNA y SO:0005843 rRNA_cleavage_RNA y SO:0005847 cassette_array_member y SO:0005848 gene_cassette_member y SO:0005849 gene_subarray_member y SO:0005850 primer_binding_site y SO:0005851 gene_array y SO:0005852 gene_subarray y SO:0005853 gene_cassette y SO:0005854 gene_cassette_array y SO:0005855 gene_group y SO:0005856 selenocysteine_tRNA_primary_transcript y SO:0005858 syntenic_region y SO:0100002 molecular_contact_region y SO:0100008 alpha_beta_motif y SO:0100010 no_output y SO:0100011 cleaved_peptide_region y SO:0100019 catalytic_motif y SO:0100020 DNA_contact y SO:0100021 polypeptide_conserved_region y SO:1000004 partially_characterised_change_in_DNA_sequence y SO:1000005 complex_substitution y SO:1000007 uncharacterised_change_in_nucleotide_sequence y SO:1000008 point_mutation y SO:1000010 pyrimidine_transition y SO:1000011 C_to_T_transition y SO:1000012 C_to_T_transition_at_pCpG_site y SO:1000013 T_to_C_transition y SO:1000014 purine_transition y SO:1000015 A_to_G_transition y SO:1000016 G_to_A_transition y SO:1000018 pyrimidine_to_purine_transversion y SO:1000019 C_to_A_transversion y SO:1000020 C_to_G_transversion y SO:1000021 T_to_A_transversion y SO:1000022 T_to_G_transversion y SO:1000023 purine_to_pyrimidine_transversion y SO:1000024 A_to_C_transversion y SO:1000025 A_to_T_transversion y SO:1000026 G_to_C_transversion y SO:1000027 G_to_T_transversion y SO:1000028 intrachromosomal_mutation y SO:1000031 interchromosomal_mutation y SO:1000033 nucleotide_deletion y SO:1000034 nucleotide_insertion y SO:1000035 nucleotide_duplication y SO:1000038 intrachromosomal_duplication y SO:1000039 direct_tandem_duplication y SO:1000040 inverted_tandem_duplication y SO:1000042 compound_chromosome y SO:1000043 Robertsonian_fusion y SO:1000046 pericentric_inversion y SO:1000047 paracentric_inversion y SO:1000048 reciprocal_chromosomal_translocation y SO:1000049 mutation_affecting_transcript y SO:1000050 mutation_causing_no_change_in_transcript y SO:1000052 mutation_affecting_complex_change_in_transcript y SO:1000054 mutation_affecting_coding_sequence y SO:1000055 mutation_causing_initiator_codon_change_in_transcript y SO:1000056 mutation_causing_amino_acid_coding_codon_change_in_transcript y SO:1000057 mutation_causing_synonymous_codon_change_in_transcript y SO:1000059 mutation_causing_missense_codon_change_in_transcript y SO:1000060 mutation_causing_conservative_missense_codon_change_in_transcript y SO:1000061 mutation_causing_nonconservative_missense_codon_change_in_transcript y SO:1000062 mutation_causing_nonsense_codon_change_in_transcript y SO:1000063 mutation_causing_terminator_codon_change_in_transcript y SO:1000064 mutation_affecting_reading_frame y SO:1000066 plus_1_frameshift_mutation y SO:1000067 minus_1_frameshift_mutation y SO:1000068 plus_2_frameshift_mutation y SO:1000069 minus_2_frameshift_mutation y SO:1000070 mutation_affecting_transcript_processing y SO:1000071 mutation_affecting_splicing y SO:1000072 splice_donor_mutation y SO:1000073 splice_acceptor_mutation y SO:1000074 cryptic_splice_activator_mutation y SO:1000075 mutation_affecting_editing y SO:1000076 mutation_affecting_transcription y SO:1000078 mutation_decreasing_rate_of_transcription y SO:1000079 mutation_affecting_transcript_sequence y SO:1000080 mutation_increasing_rate_of_transcription y SO:1000081 mutation_affecting_rate_of_transcription y SO:1000082 mutation_affecting_transcript_stability y SO:1000083 mutation_increasing_transcript_stability y SO:1000084 mutation_decreasing_transcript_stability y SO:1000085 mutation_affecting_level_of_transcript y SO:1000086 mutation_decreasing_level_of_transcript y SO:1000087 mutation_increasing_level_of_transcript y SO:1000088 mutation_affecting_translational_product y SO:1000089 mutation_causing_no_change_of_translational_product y SO:1000090 mutation_causing_uncharacterised_change_of_translational_product y SO:1000091 mutation_causing_partially_characterised_change_of_translational_product y SO:1000092 mutation_causing_complex_change_of_translational_product y SO:1000093 mutation_causing_amino_acid_substitution y SO:1000094 mutation_causing_conservative_amino_acid_substitution y SO:1000095 mutation_causing_nonconservative_amino_acid_substitution y SO:1000096 mutation_causing_amino_acid_insertion y SO:1000097 mutation_causing_amino_acid_deletion y SO:1000098 mutation_causing_polypeptide_truncation y SO:1000099 mutation_causing_polypeptide_elongation y SO:1000102 mutation_affecting_level_of_translational_product y SO:1000103 mutation_decreasing_level_of_translation_product y SO:1000104 mutation_increasing_level_of_translation_product y SO:1000105 mutation_affecting_polypeptide_amino_acid_sequence y SO:1000110 frame_restoring_mutation y SO:1000112 mutation_causing_no_3D_structural_change y SO:1000113 mutation_causing_uncharacterised_3D_structural_change y SO:1000114 mutation_causing_partially_characterised_3D_structural_change y SO:1000115 mutation_causing_complex_3D_structural_change y SO:1000116 mutation_causing_conformational_change y SO:1000117 mutation_affecting_polypeptide_function y SO:1000119 mutation_causing_inactive_ligand_binding_site y SO:1000120 mutation_causing_inactive_catalytic_site y SO:1000121 mutation_causing_polypeptide_localization_change y SO:1000126 mutation_affecting_transcript_secondary_structure y SO:1000127 mutation_causing_compensatory_transcript_secondary_structure_mutation y SO:1000134 mutation_causing_polypeptide_fusion y SO:1000141 chromosome_fission y SO:1000142 dexstrosynaptic_chromosome y SO:1000143 laevosynaptic_chromosome y SO:1000144 free_duplication y SO:1000146 complex_chromosomal_mutation y SO:1000150 cyclic_translocation y SO:1000170 uncharacterised_chromosomal_mutation y SO:1000173 tandem_duplication y SO:1000175 partially_characterised_chromosomal_mutation y SO:1000177 mutation_causing_uncharacterised_change_in_transcript y SO:1000179 mutation_causing_partially_characterised_change_in_transcript y SO:1000180 mutation_affecting_gene_structure y SO:1000181 mutation_causing_gene_fusion y SO:1000182 chromosome_number_variation y SO:1000183 chromosome_structure_variation y SO:1000184 mutation_causes_exon_loss y SO:1000185 mutation_causes_intron_gain y SO:1000186 cryptic_splice_donor_activation y SO:1001186 cryptic_splice_acceptor_activation y SO:1001187 alternatively_spliced_transcript y SO:1001188 encodes_1_polypeptide y SO:1001189 encodes_greater_than_1_polypeptide y SO:1001190 encodes_different_polypeptides_different_stop y SO:1001191 encodes_overlapping_peptides_different_start y SO:1001192 encodes_disjoint_polypeptides y SO:1001193 encodes_overlapping_polypeptides_different_start_and_stop y SO:1001195 encodes_overlapping_peptides y SO:1001197 dicistronic_primary_transcript y SO:1001217 member_of_regulon y SO:1001246 CDS_independently_known y SO:1001247 orphan_CDS y SO:1001249 CDS_supported_by_domain_match_data y SO:1001251 CDS_supported_by_sequence_similarity_data y SO:1001254 CDS_predicted y SO:1001259 CDS_supported_by_EST_or_cDNA_data y SO:1001261 recoded_mRNA y SO:1001262 minus_1_translationally_frameshifted y SO:1001263 plus_1_translationally_frameshifted y SO:1001264 mRNA_recoded_by_translational_bypass y SO:1001265 mRNA_recoded_by_codon_redefinition y SO:1001271 archaeal_intron y SO:1001273 CTG_start_codon y SO:1001274 SECIS_element y SO:1001277 three_prime_recoding_site y SO:1001279 three_prime_stem_loop_structure y SO:1001280 five_prime_recoding_site y SO:1001281 flanking_three_prime_quadruplet_recoding_signal y SO:1001282 UAG_stop_codon_signal y SO:1001283 UAA_stop_codon_signal y SO:1001285 UGA_stop_codon_signal y SO:1001286 three_prime_repeat_recoding_signal y SO:1001287 distant_three_prime_recoding_signal y SO:1001288 stop_codon_signal y SO:3000000 gene_segment y

srynobio commented 9 years ago

Commented by eilbeck on 2008-11-18 22:10 UTC Hi Tore I am now back from maternity leave - at least part time. I think adding the synonyms is a good idea for completeness of the ontology. I have looked at all the terms where there is currently no synonym (There are 770). I have listed those where the replacement of underscores with spaces works and when it doesn't, for example if a hyphen is more appropriate. If no-one disagrees I will add these to the ontology.

I have also looked at the the terms that have at least one synonym but this does not correspond to the term with spaces instead of underscores. There were 566 of this kind. I will also add exact synonyms with spaces to these terms where appropriate.

--Karen File Added: syn_suggestions2.txt

srynobio commented 9 years ago

Commented by eilbeck on 2008-12-03 00:00 UTC Hi Tore, I just added 1217 new synonyms to SO. Hopes this helps with your text mining. Cheers, Karen

srynobio commented 9 years ago

Updated by eilbeck on 2008-12-03 00:00 UTC