Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWUE01010130.1 Corchorus olitorius cultivar O-4 contig10162, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 2646
ACGTcount: A:0.35, C:0.14, G:0.18, T:0.33


Found at i:1282 original size:645 final size:641

Alignment explanation

Indices: 6--1559 Score: 2123 Period size: 645 Copynumber: 2.4 Consensus size: 641 1 AATCG * * 6 AAATTTTTTTTTCTGAATCTTTTGCCACAATACTTAGAATAAATATACAATTCAATGCCAAAAAG 1 AAATTTTTTTTTCTGAATCTTTTGCCACAATACTCAGAA-AAATATA-AATTCAACGCCAAAAAG * * 71 ATTGACGAGTTTTTCACGCTTCTAATATCATTTTTCCATTTTTTAGGAATT-ATTCTCTATTTAA 64 ATTGACGGGCTTTTCACGCTTCTAATATCATTTTTCCA-TTTTTAGGAATTAATT-TCTATTTAA * * 135 ATCGAAACAAGATTCATATGCTCGTAAAAACAAATCCTTATATCCAATGTGGCTGGGATTTGGAT 127 ATCGAAATAAGATTCAGATGCTCGTAAAAACAAATCCTTATATCCAATGTGGCTGGGATTTGGAT * * * 200 AGAAGAATATAGATATTTCAAGAAGACTTTACGCCAAAACTCATGCAAAACTGAGTCGGGGATCC 192 AGAAGAATATAGATATTTCAAGAAGTCTTTACGCCAAAAATCATGCAAAACTGAGTCGGGGACCC * * * 265 GGAACGTGTTTTTAACAAAAAACAGTGATGGTCGATGTCGGCTAAAATTTTGTAAAAACTGACCC 257 GGAACGCGTTTTTAACAAAAAACCGTGAT-GTCGATGTCAGCTAAAATTTTGTAAAAACTGACCC * 330 AAAAAATTTATCCTCAATTTTTTTGCCACAATAGTCAGGAACAATATATAATTCAATGCAAAAAA 321 AAAAAATTTATCCTCAATTTTTTTGCCACAATAGTCAGGAACAATATATAATTAAATGCAAAAAA 395 AAAATGAAGGGTTTTTCACGATTCTAATATCGTTTTTCCATTTTTTCAGTTTATTACAAAATAAA 386 AAAATGAAGGGTTTTTCACGATTCTAATATCGTTTTTCCATTTTTTCAGTTTATTACAAAATAAA * * * 460 TCGAAAAAAAATTTAGATGCTCGTAAAAACTATCCCTTAACTCAAATGTAGCTGAGACATGGTTA 451 GCGAAAAAAAATTTAGATGCTCATAAAAAC-ATCCCTTAAATCAAATGTAGCTGAGACATGGTTA * * 525 GATGAATATAGATATTTCAAGGAGTCTTTTTGCCAAAAATATTTAAAACGAGCTGGGGCCGCGAA 515 GATGAATATAGATATTACAAGGAGTCTTTTTGCCAAAAATATTCAAAACGAGCTGGGGCCGCGAA * 590 ACGCGTTTTTAGCCCAAAAACCGTGATGGTTAGTACACAATTTAGGCTAAAAACTGAGTCAA 580 ACACGTTTTTAGCCCAAAAACCGTGATGGTTAGTACACAATTTAGGCTAAAAACTGAGTCAA * 652 AAATTGTTTTTTCTGAAATCTTTTGCCACAATACTCAGAAAAGATATATAATTCAACGCCAAAAA 1 AAATTTTTTTTTCTG-AATCTTTTGCCACAATACTCAGAAAA-ATATA-AATTCAACGCCAAAAA * * 717 GATTGACGGGCTTTTCATGCTTCTAATATCATTTTTCCA-TTTGAGGAATTAATTTCTATTTAAA 63 GATTGACGGGCTTTTCACGCTTCTAATATCATTTTTCCATTTTTAGGAATTAATTTCTATTTAAA * * 781 TCGAAATAAGATTCAGATGCTCGTAAAAACAAATCCTTATATCCAATGTGACTGGGATTTGGATC 128 TCGAAATAAGATTCAGATGCTCGTAAAAACAAATCCTTATATCCAATGTGGCTGGGATTTGGATA * * * 846 GAAGAATATAGATATTTTAAGAAGTCTTTACGCCAAAAATCATACAAAACTGAGCCGGGGACCCG 193 GAAGAATATAGATATTTCAAGAAGTCTTTACGCCAAAAATCATGCAAAACTGAGTCGGGGACCCG * 911 GAACGCGTTTTTAACAAAAAAACCGTGATGTACACGATTTCAGCTAAAATTTTGTAAAAACTGAC 258 GAACGCGTTTTTAAC-AAAAAACCGTGATGT---CGATGTCAGCTAAAATTTTGTAAAAACTGAC * * 976 CCAAAAAATTTATTCTCAATTTTTTTGCCACAATAGTCAGGAACAATATATGATTAAATGC-AAA 319 CCAAAAAATTTATCCTCAATTTTTTTGCCACAATAGTCAGGAACAATATATAATTAAATGCAAAA * * * * 1040 AAAAAATGAAGGGTTTTTCACGCTTCTAATATCGTTTTTCCATTTTTTCAGTTTATTTCTAATTA 384 AAAAAATGAAGGGTTTTTCACGATTCTAATATCGTTTTTCCATTTTTTCAGTTTATTACAAAATA * * * * * * 1105 AAGCGAAACAAGATTTAGATGCTCATAAACAA-A-CCCTTAAATCAATTGTGGTTGAGACTTGGT 449 AAGCGAAAAAAAATTTAGATGCTCATAAA-AACATCCCTTAAATCAAATGTAGCTGAGACATGGT * 1168 TAGATGAATATAGATATTACAAGGAGTCTTTTTGCCAAAAATATTCAAAACTGAGCTGGGGCCTC 513 TAGATGAATATAGATATTACAAGGAGTCTTTTTGCCAAAAATATTCAAAAC-GAGCTGGGGCCGC ** * * 1233 GAAACACGTTTTTAGCCCCCAAACGGTGATGGTTAGTA-ACGAA-TTAGGCTAAAAACTGAGTCG 577 GAAACACGTTTTTAGCCCAAAAACCGTGATGGTTAGTACAC-AATTTAGGCTAAAAACTGAGTCA 1296 A 641 A ** * 1297 ATTTTTTTTTTTCTGAAT-TTTT-------TGC-C------------A--CAACG--AAAAAGAT 1 AAATTTTTTTTTCTGAATCTTTTGCCACAATACTCAGAAAAATATAAATTCAACGCCAAAAAGAT * * 1337 TGACGGGCTTTTCACGCTTCTAATATCATTTTTCAATTTTTTCGGAATTAATTTCTATTTAAATC 66 TGACGGGCTTTTCACGCTTCTAATATCATTTTTCCA-TTTTTAGGAATTAATTTCTATTTAAATC * * * * * * * 1402 GAAATAAGATTCAGATGCTCATAAAAACAAATCGTTAAATCGAATATGGCTGGGATTTGGTTTGA 130 GAAATAAGATTCAGATGCTCGTAAAAACAAATCCTTATATCCAATGTGGCTGGGATTTGGATAGA * * * * 1467 TA-AATATAGATATTTCAAGGAGTCTTTACAACAGAAAAAT-ATGCAAAACTGAGTCGGGGAGCC 195 -AGAATATAGATATTTCAAGAAGTCTTTAC-GC-CAAAAATCATGCAAAACTGAGTCGGGGACCC * * 1530 GGAACACGTTTTTAGCAAAAAACCGTGATG 257 GGAACGCGTTTTTAACAAAAAACCGTGATG 1560 GTTAGTACAC Statistics Matches: 822, Mismatches: 71, Indels: 57 0.87 0.07 0.06 Matches are distributed among these distances: 617 42 0.05 619 126 0.15 620 36 0.04 621 7 0.01 635 1 0.00 636 2 0.00 643 4 0.00 644 3 0.00 645 264 0.32 646 80 0.10 647 168 0.20 648 89 0.11 ACGTcount: A:0.36, C:0.16, G:0.16, T:0.32 Consensus pattern (641 bp): AAATTTTTTTTTCTGAATCTTTTGCCACAATACTCAGAAAAATATAAATTCAACGCCAAAAAGAT TGACGGGCTTTTCACGCTTCTAATATCATTTTTCCATTTTTAGGAATTAATTTCTATTTAAATCG AAATAAGATTCAGATGCTCGTAAAAACAAATCCTTATATCCAATGTGGCTGGGATTTGGATAGAA GAATATAGATATTTCAAGAAGTCTTTACGCCAAAAATCATGCAAAACTGAGTCGGGGACCCGGAA CGCGTTTTTAACAAAAAACCGTGATGTCGATGTCAGCTAAAATTTTGTAAAAACTGACCCAAAAA ATTTATCCTCAATTTTTTTGCCACAATAGTCAGGAACAATATATAATTAAATGCAAAAAAAAAAT GAAGGGTTTTTCACGATTCTAATATCGTTTTTCCATTTTTTCAGTTTATTACAAAATAAAGCGAA AAAAAATTTAGATGCTCATAAAAACATCCCTTAAATCAAATGTAGCTGAGACATGGTTAGATGAA TATAGATATTACAAGGAGTCTTTTTGCCAAAAATATTCAAAACGAGCTGGGGCCGCGAAACACGT TTTTAGCCCAAAAACCGTGATGGTTAGTACACAATTTAGGCTAAAAACTGAGTCAA Found at i:1988 original size:7 final size:7 Alignment explanation

Indices: 1976--2264 Score: 210 Period size: 7 Copynumber: 41.9 Consensus size: 7 1966 AAAAAATGAA 1976 GGTTTAG 1 GGTTTAG 1983 GGTTTAG 1 GGTTTAG 1990 GG-TTAG 1 GGTTTAG 1996 GGTTTAGG 1 GGTTTA-G 2004 GGTTTAG 1 GGTTTAG * 2011 TGTTTAG 1 GGTTTAG 2018 GG-TTAG 1 GGTTTAG * * 2024 GTTTTAA 1 GGTTTAG 2031 GGTTTAG 1 GGTTTAG 2038 GGTTTTA- 1 GG-TTTAG 2045 GG-TTAG 1 GGTTTAG 2051 GGTTTAG 1 GGTTTAG 2058 GG-TTAG 1 GGTTTAG * 2064 GGTTTATT 1 GGTTTA-G ** 2072 TCTAATTAAATCG 1 GGT--TT--A--G ***** 2085 AAACAAG 1 GGTTTAG 2092 GGTTTAG 1 GGTTTAG 2099 GGTTTAG 1 GGTTTAG * 2106 GG-TTAT 1 GGTTTAG * 2112 GGTTTAT 1 GGTTTAG 2119 GG-TTAG 1 GGTTTAG 2125 GG-TTAG 1 GGTTTAG * 2131 GGGTTAG 1 GGTTTAG * 2138 GGTTTAT 1 GGTTTAG * 2145 GTTTTAG 1 GGTTTAG 2152 GGTTTAG 1 GGTTTAG 2159 GG-TTAG 1 GGTTTAG * 2165 GGTTTAA 1 GGTTTAG 2172 GG-TTAG 1 GGTTTAG 2178 GGTTTATG 1 GGTTTA-G 2186 GGTTTAG 1 GGTTTAG 2193 GGTTTAG 1 GGTTTAG 2200 GG-TTAG 1 GGTTTAG * 2206 GGTTTAA 1 GGTTTAG 2213 GG-TTAG 1 GGTTTAG 2219 GGTTTAG 1 GGTTTAG * 2226 TGTTTA- 1 GGTTTAG 2232 GGTTTAG 1 GGTTTAG 2239 GGTTTAG 1 GGTTTAG * 2246 GGTTGAG 1 GGTTTAG 2253 GG-TTAG 1 GGTTTAG 2259 GGTTTA 1 GGTTTA 2265 TTTCTAATTA Statistics Matches: 224, Mismatches: 36, Indels: 44 0.74 0.12 0.14 Matches are distributed among these distances: 5 3 0.01 6 67 0.30 7 131 0.58 8 19 0.08 9 1 0.00 10 2 0.01 12 1 0.00 ACGTcount: A:0.18, C:0.01, G:0.38, T:0.42 Consensus pattern (7 bp): GGTTTAG Found at i:1997 original size:13 final size:13 Alignment explanation

Indices: 1979--2264 Score: 209 Period size: 13 Copynumber: 20.8 Consensus size: 13 1969 AAATGAAGGT 1979 TTAGGGTTTAGGG 1 TTAGGGTTTAGGG 1992 TTAGGGTTTAGGGG 1 TTAGGGTTTA-GGG * 2006 TTTAGTGTTTAGGG 1 -TTAGGGTTTAGGG * * 2020 TTAGGTTTTAAGGT 1 TTAGGGTTT-AGGG 2034 TTAGGGTTTTA-GG 1 TTAGGG-TTTAGGG 2047 TTAGGGTTTAGGG 1 TTAGGGTTTAGGG *** 2060 TTAGGGTTTATTTCTAA 1 TTAGGGTTTA----GGG ***** 2077 TTAAATCGAAACAAGGG 1 TT--A--GGGTTTAGGG 2094 TTTAGGGTTTAGGG 1 -TTAGGGTTTAGGG * * 2108 TTATGGTTTATGG 1 TTAGGGTTTAGGG 2121 TTAGGG-TTAGGGG 1 TTAGGGTTTA-GGG ** 2134 TTAGGGTTTATGTT 1 TTAGGGTTTA-GGG 2148 TTAGGGTTTAGGG 1 TTAGGGTTTAGGG * 2161 TTAGGGTTTAAGG 1 TTAGGGTTTAGGG 2174 TTAGGGTTTATGGG 1 TTAGGGTTTA-GGG 2188 TTTAGGGTTTAGGG 1 -TTAGGGTTTAGGG * 2202 TTAGGGTTTAAGG 1 TTAGGGTTTAGGG * 2215 TTAGGGTTTAGTGT 1 TTAGGGTTTAG-GG 2229 TTA-GGTTTAGGG 1 TTAGGGTTTAGGG * 2241 TTTAGGGTTGAGGG 1 -TTAGGGTTTAGGG 2255 TTAGGGTTTA 1 TTAGGGTTTA 2265 TTTCTAATTA Statistics Matches: 213, Mismatches: 39, Indels: 42 0.72 0.13 0.14 Matches are distributed among these distances: 12 8 0.04 13 124 0.58 14 51 0.24 15 22 0.10 16 1 0.00 17 2 0.01 18 2 0.01 19 1 0.00 21 2 0.01 ACGTcount: A:0.19, C:0.01, G:0.38, T:0.42 Consensus pattern (13 bp): TTAGGGTTTAGGG Found at i:2001 original size:20 final size:20 Alignment explanation

Indices: 1979--2264 Score: 177 Period size: 20 Copynumber: 13.5 Consensus size: 20 1969 AAATGAAGGT 1979 TTAGGGTTTAGGG-TTAGGG 1 TTAGGGTTTAGGGTTTAGGG * 1998 TTTAGGGGTTTAGTGTTTAGGG 1 -TTA-GGGTTTAGGGTTTAGGG * * 2020 TTAGGTTTTAAGGTTTAGGG 1 TTAGGGTTTAGGGTTTAGGG 2040 TTTTA-GG-TTAGGGTTTAGGG 1 --TTAGGGTTTAGGGTTTAGGG *** ** 2060 TTAGGGTTTATTTCTAATTAAATCGAAA 1 TTAGGGTTTA-GGGT--TT--A--G-GG ** 2088 CAAGGGTTTAGGGTTTAGGG 1 TTAGGGTTTAGGGTTTAGGG * * 2108 TTATGGTTTATGGTTAGGGTTAGGGG 1 TTAGGGTTTA--G---GGTTTA-GGG * * 2134 TTAGGGTTTATGTTTTAGGG 1 TTAGGGTTTAGGGTTTAGGG * 2154 TTTAGGG-TTAGGGTTTAAGG 1 -TTAGGGTTTAGGGTTTAGGG 2174 TTAGGGTTTATGGGTTTAGGG 1 TTAGGGTTTA-GGGTTTAGGG * 2195 TTTAGGG-TTAGGGTTTAAGG 1 -TTAGGGTTTAGGGTTTAGGG * * 2215 TTAGGGTTTAGTGTTTAGGT 1 TTAGGGTTTAGGGTTTAGGG * 2235 TTAGGGTTTAGGGTTGAGGG 1 TTAGGGTTTAGGGTTTAGGG 2255 TTAGGGTTTA 1 TTAGGGTTTA 2265 TTTCTAATTA Statistics Matches: 204, Mismatches: 37, Indels: 50 0.70 0.13 0.17 Matches are distributed among these distances: 18 3 0.01 19 14 0.07 20 101 0.50 21 37 0.18 22 16 0.08 23 3 0.01 25 8 0.04 26 12 0.06 27 2 0.01 28 8 0.04 ACGTcount: A:0.19, C:0.01, G:0.38, T:0.42 Consensus pattern (20 bp): TTAGGGTTTAGGGTTTAGGG Done.