ISMsm4
- Family ISL3
- Group
Isoform Synonym(s)
Accession number | Transposition | Origin | Host |
---|---|---|---|
NC_008596 | ND | Mycobacterium smegmatis | Mycobacterium smegmatis MC2 155 |
DNA section
IS Length : 1458 bp
Ends
IR Length : 24/30
IRL : GGCTCTTCGCACTTGATAGGGGTCTGGTGTTGTCCGACGTTGTGTCGTGT
IRR : GGCTCTTCGCAGTTAGCAGTGGCGTTGGTGCCGGCTGGGTGTGACTCGTC
Insertion site
Left flank | Direct repeat | Right flank | DR Length |
---|---|---|---|
TCGCTGGCGG | TGTTTATC | ATCGCCTCAG | 8 |
GCCGACTACG | GGTTTGAA | CTAACTCCTC | 8 |
TTTTGTTGGT | GTTAAACA | GAAGGTCCGC | 8 |
TTCCGGCCCA | CCTATCTA | CGGGTGCGCG | 8 |
DNA sequence
GGCTCTTCGCACTTGATAGGGGTCTGGTGTTGTCCGACGTTGTGTCGTGTCGGTGATTGATTAGGGGTCCGCGCCCCTGTGAGCTGGGTGTTCTTCAGGC
ATCCAGGACAAGGAACGCGGACCATGGTTGACGGTAGTTCACTGCTGCTCGATCTCGACGGTGTGGTCGTCGAATCGGTGCAGCGCCTCGAGGACGGCAC
CCGGTTGGTGCAGGTGCTCACCGCCCCCCAGTGGGTCGGGATCTGCCCCGAATGCGGGGAACGCTCCACCAGGTCGAAAGGCTGGGTACAGACCGGACCC
CGCGACGTTGTGGTGGGTCCGGACCGCCCGATACTGCGCTGGCGTAAGCGAAAGTGGTTGTGCCCCAGCACGGTCTGTACGCGCAAGGTGTTCACCGAGT
CGGTGCCCGGAATCCCGGCGCGGGCGCGGGTAACACCGCGGGCCAAGGCGACGATGGCCACTGCGGTGCTCGACGAGGACCGTTCGGTGGCCGCGGTGGC
CGGGCAGTACCGCTGCGGCTGGCACACCGTGCACGACGAAGTCATCGCCACCGCCGAGGACGCCCTGGCCGGCGAGCTGGCGCCGGTGGCGGTGCTCGGC
ATCGACGAGACCCGACGCGGTAAGGCCAAATGGGAACACAACCCGGTACTCGGGCGGCGGGTATGGGTGGATCGCTGGGACACCGGACTGGTCGACATCA
CCGGCGATCAAGGCCTCCTTGGCCAGGTCAACGGCCGCACCTCGGCGGCAGTGATCGACTGGCTCGCTGGCCAGGACCCTGACTGGCGGGCCGCAATCAC
CCACGTAGCCATCGACCTGTCCCCGGCCTATGCCCGGGTGGCTCGCGAAGCACTGCCGCACGCGATCCTGATCGCCGACCGGTTCCACCTGGTCAAGAAA
GCCAACGACATGGTTGATGCGGTGCGCCGCCGGGTCACCTGGACCCAACGGGGCCGGCGCGGCCGCAAGGCCGATGTCGAGTGGATCAACCGCCGCCGCC
TGCTGCGCGGCTCCGAGCGGCTCACCGCAGACCAACGCGCCACGTTGTTCGCCAAGCTGCTCTCCGCCGACCCCAACCAGGACATCGCCGCGGCCTGGAT
CGCCAAAGAACTGCTGCGCGACCTGCTTTCCTGCGCCGACCGCGGCGGGTTGCGCTACGAGATCACGACCGCCCTGGACCGGTTCTACCGTTTCTGCGCG
GCCTGCACAGTGCCCGAAGTGATCCGACTGGCCCGCACCATCGAGACCTGGCAGGCCCCCATCATCGCCGCCCTGCAGACCGGCCTGTCCAACGCCCGCA
CCGAAGGCTACAACCGCATCGTCAAACACGTCGGGCGCATCGCCTTCGGCTTCCGCAATCCTGAGAACCAACGCCGCCGAGTACGGTGGGCCTGCACTCG
CCGATCACGACGAGTCACACCCAGCCGGCACCAACGCCACTGCTAACTGCGAAGAGCC
ATCCAGGACAAGGAACGCGGACCATGGTTGACGGTAGTTCACTGCTGCTCGATCTCGACGGTGTGGTCGTCGAATCGGTGCAGCGCCTCGAGGACGGCAC
CCGGTTGGTGCAGGTGCTCACCGCCCCCCAGTGGGTCGGGATCTGCCCCGAATGCGGGGAACGCTCCACCAGGTCGAAAGGCTGGGTACAGACCGGACCC
CGCGACGTTGTGGTGGGTCCGGACCGCCCGATACTGCGCTGGCGTAAGCGAAAGTGGTTGTGCCCCAGCACGGTCTGTACGCGCAAGGTGTTCACCGAGT
CGGTGCCCGGAATCCCGGCGCGGGCGCGGGTAACACCGCGGGCCAAGGCGACGATGGCCACTGCGGTGCTCGACGAGGACCGTTCGGTGGCCGCGGTGGC
CGGGCAGTACCGCTGCGGCTGGCACACCGTGCACGACGAAGTCATCGCCACCGCCGAGGACGCCCTGGCCGGCGAGCTGGCGCCGGTGGCGGTGCTCGGC
ATCGACGAGACCCGACGCGGTAAGGCCAAATGGGAACACAACCCGGTACTCGGGCGGCGGGTATGGGTGGATCGCTGGGACACCGGACTGGTCGACATCA
CCGGCGATCAAGGCCTCCTTGGCCAGGTCAACGGCCGCACCTCGGCGGCAGTGATCGACTGGCTCGCTGGCCAGGACCCTGACTGGCGGGCCGCAATCAC
CCACGTAGCCATCGACCTGTCCCCGGCCTATGCCCGGGTGGCTCGCGAAGCACTGCCGCACGCGATCCTGATCGCCGACCGGTTCCACCTGGTCAAGAAA
GCCAACGACATGGTTGATGCGGTGCGCCGCCGGGTCACCTGGACCCAACGGGGCCGGCGCGGCCGCAAGGCCGATGTCGAGTGGATCAACCGCCGCCGCC
TGCTGCGCGGCTCCGAGCGGCTCACCGCAGACCAACGCGCCACGTTGTTCGCCAAGCTGCTCTCCGCCGACCCCAACCAGGACATCGCCGCGGCCTGGAT
CGCCAAAGAACTGCTGCGCGACCTGCTTTCCTGCGCCGACCGCGGCGGGTTGCGCTACGAGATCACGACCGCCCTGGACCGGTTCTACCGTTTCTGCGCG
GCCTGCACAGTGCCCGAAGTGATCCGACTGGCCCGCACCATCGAGACCTGGCAGGCCCCCATCATCGCCGCCCTGCAGACCGGCCTGTCCAACGCCCGCA
CCGAAGGCTACAACCGCATCGTCAAACACGTCGGGCGCATCGCCTTCGGCTTCCGCAATCCTGAGAACCAACGCCGCCGAGTACGGTGGGCCTGCACTCG
CCGATCACGACGAGTCACACCCAGCCGGCACCAACGCCACTGCTAACTGCGAAGAGCC
Protein section
ORF number : 1
ORF 1
Length | Begin | End | Strand | Fusion ORF | |
---|---|---|---|---|---|
1368 bp | 455 aa | 79 | 1446 | + | No |
Chemistry : Unknow
ORF sequence :
MSWVFFRHPGQGTRTMVDGSSLLLDLDGVVVESVQRLEDGTRLVQVLTAPQWVGICPECGERSTRSKGWVQTGPRDVVVGPDRPILRWRKRKWLCPSTVC
TRKVFTESVPGIPARARVTPRAKATMATAVLDEDRSVAAVAGQYRCGWHTVHDEVIATAEDALAGELAPVAVLGIDETRRGKAKWEHNPVLGRRVWVDRW
DTGLVDITGDQGLLGQVNGRTSAAVIDWLAGQDPDWRAAITHVAIDLSPAYARVAREALPHAILIADRFHLVKKANDMVDAVRRRVTWTQRGRRGRKADV
EWINRRRLLRGSERLTADQRATLFAKLLSADPNQDIAAAWIAKELLRDLLSCADRGGLRYEITTALDRFYRFCAACTVPEVIRLARTIETWQAPIIAALQ
TGLSNARTEGYNRIVKHVGRIAFGFRNPENQRRRVRWACTRRSRRVTPSRHQRHC
TRKVFTESVPGIPARARVTPRAKATMATAVLDEDRSVAAVAGQYRCGWHTVHDEVIATAEDALAGELAPVAVLGIDETRRGKAKWEHNPVLGRRVWVDRW
DTGLVDITGDQGLLGQVNGRTSAAVIDWLAGQDPDWRAAITHVAIDLSPAYARVAREALPHAILIADRFHLVKKANDMVDAVRRRVTWTQRGRRGRKADV
EWINRRRLLRGSERLTADQRATLFAKLLSADPNQDIAAAWIAKELLRDLLSCADRGGLRYEITTALDRFYRFCAACTVPEVIRLARTIETWQAPIIAALQ
TGLSNARTEGYNRIVKHVGRIAFGFRNPENQRRRVRWACTRRSRRVTPSRHQRHC
Blast result :
Comments
ISMsm4 is 76% aa similar to IS204.
References
1] Fleischmann,R.D., Dodson,R.J., Haft,D.H., Merkel,J.S., Nelson,W.C. and Fraser,C.M. (2006) Direct Submission GenBank.