Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: AWUE01010185.1 Corchorus olitorius cultivar O-4 contig10217, whole genome shotgun sequence
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 2207
ACGTcount: A:0.35, C:0.15, G:0.16, T:0.34
Found at i:967 original size:333 final size:332
Alignment explanation
Indices: 1--2207 Score: 2403
Period size: 333 Copynumber: 6.7 Consensus size: 332
* * *
1 GCAGAACTAAGTCGGGGCCCTGGAACGCGTTTTTAGCAAAAAA-CGTGATGGTTAGTACACGATT
1 GCAGAACTGAGTCAGGGCCCTGAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGATT
* * * * *
65 TCGGCTAAAATTTTGCAAAAAATGACCTGAAAAATTTTTCCTCATTTTTTTTGTCTAAAATAATC
66 TCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCA-ATTTTTAG-CTAAAATACTC
* * * ** * * * *
130 GTGTAATTTATATAATTTAACTCCGAAATGATTGGAGGACTTTTCACGCTTTTCATATCGTTTTT
129 ATGTAATATATATAATTCAACTCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCG--TTT
* * * *
195 TTTAATATTTTTTTCAGAGTTAATTTCTAATTAAATCGAAACAAGATTCAGATGCTCGTAAAAAC
192 TTT-CTA-CTTTTTCCGAATTAATTTCTAATTAAATCGAAACAAGATTCAGATGCTCGTAAAAAC
* *
260 AAATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAGTATAGATATTTCAAGGAGTCTCGA
255 AAATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGA
325 CGCCGAAAATCAT
320 CGCCGAAAATCAT
* * *
338 GCAGAACTGAGCCAGGG-CATCGAAACGCGTTTTTAGCAATAAATC--G-T-G---GTACACGAT
1 GCAGAACTGAGTCAGGGCCCT-GAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGAT
* * * * *
395 TTCAGCTAAAATTTTGCAAAAAATGACCCGAAAAATTTTTTCCTCAATTTTTTGTATAAAATAAT
65 TTCGGCTAAAATTTTGCAAAAAATGACCCGAAAAA-TATTTCCTCAATTTTTAG-CTAAAATACT
* * * * * *
460 CATGTAATTTATATAATTTAACTCCAAAATGATTGGAGGATTTTTCACGCTTTTCATATCG-TTT
128 CATGTAATATATATAATTCAACTCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCGTTTT
* * * *
524 TTCATTAATTTTTTCGAATTAATTTCTAATTAAATCGAAACAAGATTCAGATACTCGTAAAGACA
193 TTC--TACTTTTTCCGAATTAATTTCTAATTAAATCGAAACAAGATTCAGATGCTCGTAAAAACA
589 AATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGAC
256 AATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGAC
654 GCCGAAAATCAT
321 GCCGAAAATCAT
* * *
666 GCAGAACTGAGTCGGGGTCCCTG-AACGCGTTTTTAGCAAAAAATCGTGATGGTTAATAAACGAT
1 GCAGAACTGAGTCAGGG-CCCTGAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGAT
* * * * *
730 TTCAGCTAAAATTTTGCAAAAATTGACCCGTAAGATATTTCCTCAATTTTTAGCAAAAATACTCA
65 TTCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCAATTTTTAGCTAAAATACTCA
* * *
795 TAG-AGATATATATAATTCAACGTCAAAAAT-ATTGAAGGGTTTTTTACTCTTCTAATATCGTTT
130 T-GTA-ATATATATAATTCAAC-TCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCGTTT
* * * *
858 TTTCTACTTTTTCCGAATTAATTTCAAATTAAATTGAAATAAGATAT-AGCTGCTCGTAAAAACA
192 TTTCTACTTTTTCCGAATTAATTTCTAATTAAATCGAAACAAGAT-TCAGATGCTCGTAAAAACA
*
922 AATTCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGAC
256 AATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGAC
*
987 GCCGAAAATCAC
321 GCCGAAAATCAT
*
999 GCAGAACTGAGTCGGGGTCCC-GAAACGCGTTTTTAGCAAAAAATC--G-T-G-T-GTACACGAT
1 GCAGAACTGAGTCAGGG-CCCTGAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGAT
* **
1057 TTCGGCTAAAATTTTGCAAAAATTGACCCGAAAGGTATTTCCTCAATTTTTAGCTAAAATACTCA
65 TTCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCAATTTTTAGCTAAAATACTCA
* * * * *
1122 TGCAGATATATATAATTCAACGCCAAAAAT-ATTGAAGGGTTTTTTACGCTTCTAATATCATTTT
130 TGTA-ATATATATAATTCAAC-TCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCGTTTT
* * * * * * * *
1186 TCCAACTTTTTCCGAATTAATTTCTATTTAAGTTGAAACAATATAT-ACATGCTCGTAAAAAAAA
193 TTCTACTTTTTCCGAATTAATTTCTAATTAAATCGAAACAAGAT-TCAGATGCTCGTAAAAACAA
* * * * * *
1250 ATTCTTAAAT-C----TGGCTGAGATTTCATTATATGAATATGGATATTTGAACGAGTCTCGATG
257 ATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGACG
1310 CCGAAAATCAT
322 CCGAAAATCAT
* * * *
1321 GCAGAACTGAGT-AAGGCCCCGAAACGCGTTTTTAGGAAAAAAATTGTGATGGTTAGTACACGAT
1 GCAGAACTGAGTCAGGGCCCTGAAACGCGTTTTTA-GCAAAAAATCGTGATGGTTAGTACACGAT
* * * * * *
1385 TTCAGCTAAAATTCTGCAAAAAATGATCC-TAAAATTTTTCCTCAATTTTT-GCCTAATATACTC
65 TTCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCAATTTTTAG-CTAAAATACTC
* * * * * * * *
1448 GTGTAATATATATAATTTAACTCCAAAATGATTGGAGGACTTTTCACACTTTTCATATCG-TTTT
129 ATGTAATATATATAATTCAACTCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCGTTTTT
* *
1512 TCATTAATTTTTCCGAATTAAATTCTAATTAAATCGAAACAAGATTCAGATGCTCGTAAAAACAA
194 TC--TACTTTTTCCGAATTAATTTCTAATTAAATCGAAACAAGATTCAGATGCTCGTAAAAACAA
** * * * * * * ** *
1577 AAACTTAAATGGAATTTGGCTGAAATTTGACTAGATGAATGTAGATACTTGAAATAGTCTCGAAG
257 ATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGACG
1642 CCGAAAATCAT
322 CCGAAAATCAT
*
1653 GCAGAACTGAGTCAGTGCCAC-GAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGAT
1 GCAGAACTGAGTCAGGGCC-CTGAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGAT
* * * * *
1717 TACGGCTAAAATTTTGCAAAAATTGACACGAAAGATATTTCCTCAATTTTTAGCTGAAATACTCA
65 TTCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCAATTTTTAGCTAAAATACTCA
* * * * * *
1782 TAG-AGTTATATATAATTCAACGCCAGAAAT-ATTGAAGGGTTTTTTATGCTTCTAATATCGTTT
130 T-GTA-ATATATATAATTCAAC-TCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCGTTT
* * * * *
1845 TTCCTACTTTCTCCGAATTAATTTCTAA-TAAAGTTGAAATAAGATAT-AGACGCTCGTAAAAAC
192 TTTCTACTTTTTCCGAATTAATTTCTAATTAAA-TCGAAACAAGAT-TCAGATGCTCGTAAAAAC
*
1908 AAATCCTGAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGA
255 AAATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGA
*
1973 TGCCGAAAATCAT
320 CGCCGAAAATCAT
* * * *
1986 GCAGAACTGAGTCAGGGCCCCGAAATGTGTTTTTAGCAAAAAAAAATCGTGATGGTTAGTACACA
1 GCAGAACTGAGTCAGGGCCCTGAAACGCGTTTTTAGC---AAAAAATCGTGATGGTTAGTACACG
* * * * * * *
2051 ATTTCGGCTAAAATTCTGTAAAAAATTATCCGAAAAAT-TTTCCTCTA-TTTTCGCCTAAAATTC
63 ATTTCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCAATTTTTAG-CTAAAATAC
* * * * * *
2114 TC-GGTTAATATATATAATTTC-ACTCCAAAATGATTGGAGGACTTTTCACTCGTT-TCATATCG
127 TCATG-TAATATATATAA-TTCAACTCAAAAATGATTGAAGGATTTTTCACGC-TTCTAATATCG
* * *
2176 -TTTTTCATTAATTTTTCGGTATTAATTTCTAA
189 TTTTTTC--TACTTTTTCCGAATTAATTTCTAA
Statistics
Matches: 1599, Mismatches: 210, Indels: 124
0.83 0.11 0.06
Matches are distributed among these distances:
320 3 0.00
321 16 0.01
322 74 0.05
324 1 0.00
325 12 0.01
326 42 0.03
327 280 0.18
328 203 0.13
329 4 0.00
330 4 0.00
331 119 0.07
332 129 0.08
333 381 0.24
334 133 0.08
335 106 0.07
336 57 0.04
337 34 0.02
338 1 0.00
ACGTcount: A:0.35, C:0.15, G:0.16, T:0.34
Consensus pattern (332 bp):
GCAGAACTGAGTCAGGGCCCTGAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGATT
TCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCAATTTTTAGCTAAAATACTCAT
GTAATATATATAATTCAACTCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCGTTTTTTC
TACTTTTTCCGAATTAATTTCTAATTAAATCGAAACAAGATTCAGATGCTCGTAAAAACAAATCC
TTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGACGCCGA
AAATCAT
Done.