Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01014713.1 Corchorus capsularis cultivar CVL-1 contig14734, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 27721
ACGTcount: A:0.32, C:0.18, G:0.19, T:0.31

Warning! 1 characters in sequence are not A, C, G, or T


Found at i:9352 original size:38 final size:38

Alignment explanation

Indices: 9310--9460 Score: 252 Period size: 38 Copynumber: 4.0 Consensus size: 38 9300 GGCTGTGCAT * * * 9310 AGTGGACTCGCGCCTCAGGGGGTTAAACTGATGGTAAG 1 AGTGGACCCGTGCCTCAGGGGGTTAAACTGTTGGTAAG 9348 AGTGGACCCGTGCCTCAGGGGGTTAAACTGTTGGTAAG 1 AGTGGACCCGTGCCTCAGGGGGTTAAACTGTTGGTAAG 9386 AGTGGACCCGTGCCTCAGGGGGTTAAACTGTTGGTAAG 1 AGTGGACCCGTGCCTCAGGGGGTTAAACTGTTGGTAAG * 9424 AGTGGACCCGTGCCTCA-GGGGTT-AACTGTTGGCAAG 1 AGTGGACCCGTGCCTCAGGGGGTTAAACTGTTGGTAAG 9460 A 1 A 9461 TTGTGATTGT Statistics Matches: 109, Mismatches: 4, Indels: 2 0.95 0.03 0.02 Matches are distributed among these distances: 36 13 0.12 37 6 0.06 38 90 0.83 ACGTcount: A:0.22, C:0.19, G:0.36, T:0.23 Consensus pattern (38 bp): AGTGGACCCGTGCCTCAGGGGGTTAAACTGTTGGTAAG Found at i:9470 original size:6 final size:6 Alignment explanation

Indices: 9459--9483 Score: 50 Period size: 6 Copynumber: 4.2 Consensus size: 6 9449 CTGTTGGCAA 9459 GATTGT GATTGT GATTGT GATTGT G 1 GATTGT GATTGT GATTGT GATTGT G 9484 GTGCAGCCTG Statistics Matches: 19, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 6 19 1.00 ACGTcount: A:0.16, C:0.00, G:0.36, T:0.48 Consensus pattern (6 bp): GATTGT Found at i:23449 original size:37 final size:36 Alignment explanation

Indices: 23366--23652 Score: 344 Period size: 37 Copynumber: 7.8 Consensus size: 36 23356 AAAGCGATTA * ** 23366 AAGAACTTAACTCAGGAAAATTAAGTAAAAGCAGTT 1 AAGAACTTAATTCAGGGCAATTAAGTAAAAGCAGTT * * 23402 AAGAACTTAATTCACGACAATTAAGTAAAAGCAGGTT 1 AAGAACTTAATTCAGGGCAATTAAGTAAAAGCA-GTT * 23439 AAGAACTTAATTCAAGGCAATTAAGTAAAGAGCAGTT 1 AAGAACTTAATTCAGGGCAATTAAGTAAA-AGCAGTT * 23476 AAAAACTTAATTCAGGGCAATTAAGTAAAGAGCAGTT 1 AAGAACTTAATTCAGGGCAATTAAGTAAA-AGCAGTT 23513 AAGAACTTAATTCAGGGCAATTAAGTAAAAGCAGTT 1 AAGAACTTAATTCAGGGCAATTAAGTAAAAGCAGTT * * * * 23549 AAGGTACTTAATTCAGGGTAATTAAGTAAAGGCAATT 1 AA-GAACTTAATTCAGGGCAATTAAGTAAAAGCAGTT * * * 23586 AGAGGACTTAATTCAGGGTAATTAAG-AAAAGCAATT 1 A-AGAACTTAATTCAGGGCAATTAAGTAAAAGCAGTT * * * 23622 CGAA-ATCTTAATTCAGGGTAATTAAGAAAAA 1 --AAGAACTTAATTCAGGGCAATTAAGTAAAA 23653 TAAACACAGT Statistics Matches: 228, Mismatches: 16, Indels: 13 0.89 0.06 0.05 Matches are distributed among these distances: 36 68 0.30 37 154 0.68 38 6 0.03 ACGTcount: A:0.46, C:0.10, G:0.19, T:0.25 Consensus pattern (36 bp): AAGAACTTAATTCAGGGCAATTAAGTAAAAGCAGTT Found at i:23675 original size:45 final size:45 Alignment explanation

Indices: 23624--24055 Score: 624 Period size: 45 Copynumber: 9.6 Consensus size: 45 23614 AAGCAATTCG * 23624 AAATCTTAATTCAGGGTAATTAAGAAAAATAAACACAGTCAGTCA 1 AAATCTTAATTCAGGGTAATTAAGAAAAGTAAACACAGTCAGTCA * * * 23669 AAATCTTAATTAAGGGTAATTAAGAAAAGTAAACACATTCAGTTA 1 AAATCTTAATTCAGGGTAATTAAGAAAAGTAAACACAGTCAGTCA * * * * * * 23714 AAGTCTGAATTCAGGATAATTAAGAAAAGCAACCATAGTCAGTCA 1 AAATCTTAATTCAGGGTAATTAAGAAAAGTAAACACAGTCAGTCA 23759 AAATCTTAATTCAGGGTAATTAAGAAAAGTAAACACAGTCAGTCA 1 AAATCTTAATTCAGGGTAATTAAGAAAAGTAAACACAGTCAGTCA 23804 AAATCTTAATTCAGGGTAATTAAGAAAAGTAAACACAG-CTAGTCA 1 AAATCTTAATTCAGGGTAATTAAGAAAAGTAAACACAGTC-AGTCA * 23849 AAATCTTAATTCAGGGTAATTAAGAAAAGTAAACACAGTCAGTTA 1 AAATCTTAATTCAGGGTAATTAAGAAAAGTAAACACAGTCAGTCA * * * * 23894 AAGTCTTAATTCAGGGTAATTAAGAAAAGCAACCATAGTCAGTCA 1 AAATCTTAATTCAGGGTAATTAAGAAAAGTAAACACAGTCAGTCA * 23939 AAATCTTAAATCAGGGTAATTAAGAAAAGTAAACACAGTCAGTCA 1 AAATCTTAATTCAGGGTAATTAAGAAAAGTAAACACAGTCAGTCA * * 23984 AAGTCTTAATTCAGGGTAATTAAGAAAAAG-AAA-ACA--CAGTTA 1 AAATCTTAATTCAGGGTAATTAAG-AAAAGTAAACACAGTCAGTCA 24026 AAGA-CTTAATTCAGGGTAATTAAGTAAAAG 1 AA-ATCTTAATTCAGGGTAATTAAG-AAAAG 24056 AAGGTAAAGA Statistics Matches: 348, Mismatches: 35, Indels: 11 0.88 0.09 0.03 Matches are distributed among these distances: 42 32 0.09 44 4 0.01 45 306 0.88 46 6 0.02 ACGTcount: A:0.47, C:0.12, G:0.16, T:0.25 Consensus pattern (45 bp): AAATCTTAATTCAGGGTAATTAAGAAAAGTAAACACAGTCAGTCA Found at i:24064 original size:36 final size:38 Alignment explanation

Indices: 23983--24066 Score: 91 Period size: 42 Copynumber: 2.2 Consensus size: 38 23973 ACAGTCAGTC * * 23983 AAAGTCTTAATTCAGGGTAATTAAGAAAAAGAAAACACAGTT 1 AAAGACTTAATTCAGGGTAATTAAGAAAAAG---A-ACAGGT * 24025 AAAGACTTAATTCAGGGTAATTAAGTAAAAG-A-AGGT 1 AAAGACTTAATTCAGGGTAATTAAGAAAAAGAACAGGT 24061 AAAGAC 1 AAAGAC 24067 AAGCACAAAC Statistics Matches: 39, Mismatches: 3, Indels: 6 0.81 0.06 0.12 Matches are distributed among these distances: 36 9 0.23 37 1 0.03 42 29 0.74 ACGTcount: A:0.50, C:0.08, G:0.19, T:0.23 Consensus pattern (38 bp): AAAGACTTAATTCAGGGTAATTAAGAAAAAGAACAGGT Found at i:24120 original size:41 final size:40 Alignment explanation

Indices: 24059--24277 Score: 220 Period size: 41 Copynumber: 5.6 Consensus size: 40 24049 GTAAAAGAAG * * 24059 GTAAAGACAAGCACAAACTTAATTTCAAGAAAGGAAATTAG 1 GTAAAGACAAGCACAGACTTAATTTCAAG-AAGGAAATTAA * * * 24100 GTAAGGACAAGCAAAGACTTAA-TTC-AG--GGTAATTAA 1 GTAAAGACAAGCACAGACTTAATTTCAAGAAGGAAATTAA * * * 24136 GTAAAGAAAAGCACAGATTTAATTTCAAGGAAGGAAATTAG 1 GTAAAGACAAGCACAGACTTAATTTCAA-GAAGGAAATTAA * * * 24177 GTAAGGACAAGCACAGACTTGA-TTC-AG--GGTAATTAA 1 GTAAAGACAAGCACAGACTTAATTTCAAGAAGGAAATTAA * * * 24213 GTAAAGAAAAACACAGACTTAATTTCAAGGAAGAAAATTAA 1 GTAAAGACAAGCACAGACTTAATTTCAA-GAAGGAAATTAA * 24254 GTAAAGACAAGCACAGATTTAATT 1 GTAAAGACAAGCACAGACTTAATT 24278 CAGGGTAATT Statistics Matches: 142, Mismatches: 26, Indels: 20 0.76 0.14 0.11 Matches are distributed among these distances: 36 50 0.35 37 6 0.04 38 3 0.02 39 5 0.04 40 6 0.04 41 72 0.51 ACGTcount: A:0.48, C:0.11, G:0.20, T:0.21 Consensus pattern (40 bp): GTAAAGACAAGCACAGACTTAATTTCAAGAAGGAAATTAA Found at i:24140 original size:77 final size:77 Alignment explanation

Indices: 24059--24294 Score: 373 Period size: 77 Copynumber: 3.1 Consensus size: 77 24049 GTAAAAGAAG * * * * 24059 GTAAAGACAAGCACAAACTTAATTTCAAGAAAGGAAATTAGGTAAGGACAAGCAAAGACTTAATT 1 GTAAAGAAAAGCACAGACTTAATTTCAAGGAAGGAAATTAGGTAAGGACAAGCACAGACTTAATT 24124 CAGGGTAATTAA 66 CAGGGTAATTAA * * 24136 GTAAAGAAAAGCACAGATTTAATTTCAAGGAAGGAAATTAGGTAAGGACAAGCACAGACTTGATT 1 GTAAAGAAAAGCACAGACTTAATTTCAAGGAAGGAAATTAGGTAAGGACAAGCACAGACTTAATT 24201 CAGGGTAATTAA 66 CAGGGTAATTAA * * * * * 24213 GTAAAGAAAAACACAGACTTAATTTCAAGGAAGAAAATTAAGTAAAGACAAGCACAGATTTAATT 1 GTAAAGAAAAGCACAGACTTAATTTCAAGGAAGGAAATTAGGTAAGGACAAGCACAGACTTAATT 24278 CAGGGTAATTAA 66 CAGGGTAATTAA 24290 GTAAA 1 GTAAA 24295 TTAGCAAAGA Statistics Matches: 146, Mismatches: 13, Indels: 0 0.92 0.08 0.00 Matches are distributed among these distances: 77 146 1.00 ACGTcount: A:0.48, C:0.11, G:0.20, T:0.22 Consensus pattern (77 bp): GTAAAGAAAAGCACAGACTTAATTTCAAGGAAGGAAATTAGGTAAGGACAAGCACAGACTTAATT CAGGGTAATTAA Found at i:24432 original size:37 final size:37 Alignment explanation

Indices: 24387--24473 Score: 165 Period size: 37 Copynumber: 2.4 Consensus size: 37 24377 AACTTAACCC 24387 AAGGGGATTAAGTAGAGTTAAGAACTTAATTCCAAGG 1 AAGGGGATTAAGTAGAGTTAAGAACTTAATTCCAAGG 24424 AAGGGGATTAAGTAGAGTTAAGAACTTAATTCCAAGG 1 AAGGGGATTAAGTAGAGTTAAGAACTTAATTCCAAGG * 24461 AAGGGAATTAAGT 1 AAGGGGATTAAGT 24474 TAGGGACTTG Statistics Matches: 49, Mismatches: 1, Indels: 0 0.98 0.02 0.00 Matches are distributed among these distances: 37 49 1.00 ACGTcount: A:0.41, C:0.07, G:0.28, T:0.24 Consensus pattern (37 bp): AAGGGGATTAAGTAGAGTTAAGAACTTAATTCCAAGG Found at i:24556 original size:36 final size:36 Alignment explanation

Indices: 24516--24703 Score: 254 Period size: 36 Copynumber: 5.2 Consensus size: 36 24506 CAAGTTAGAG * 24516 ACTTAATTCAGGGTAATTAAGTAGCGTCAATAAAGA 1 ACTTAATTCAGGGTAATTAAGTAGAGTCAATAAAGA * * 24552 ACTTAATTCAGGGTAATTAAGTTGAGTCAAGT-TAGA 1 ACTTAATTCAGGGTAATTAAGTAGAGTCAA-TAAAGA * * 24588 GACTTAATTCAGGGTAATTAAGTAGCGCCAATAAAGA 1 -ACTTAATTCAGGGTAATTAAGTAGAGTCAATAAAGA * * 24625 ACTTAATTCAGGGTAACTAAGTCGAGTCAATAAAGA 1 ACTTAATTCAGGGTAATTAAGTAGAGTCAATAAAGA * * 24661 ACTTAATTCAGGATAAATAAGT-GAAGTCAATAAAGA 1 ACTTAATTCAGGGTAATTAAGTAG-AGTCAATAAAGA 24697 ACTTAAT 1 ACTTAAT 24704 CTAAAAAGAG Statistics Matches: 135, Mismatches: 13, Indels: 8 0.87 0.08 0.05 Matches are distributed among these distances: 35 1 0.01 36 103 0.76 37 31 0.23 ACGTcount: A:0.42, C:0.11, G:0.19, T:0.28 Consensus pattern (36 bp): ACTTAATTCAGGGTAATTAAGTAGAGTCAATAAAGA Found at i:24584 original size:73 final size:73 Alignment explanation

Indices: 24503--24703 Score: 300 Period size: 73 Copynumber: 2.8 Consensus size: 73 24493 AAGGGAATCA 24503 AGTCAAGTTAGAGACTTAATTCAGGGTAATTAAGTAGCGTCAATAAAGAACTTAATTCAGGGTAA 1 AGTCAAGTTAGAGACTTAATTCAGGGTAATTAAGTAGCGTCAATAAAGAACTTAATTCAGGGTAA * * 24568 TTAAGTTG 66 CTAAGTCG * 24576 AGTCAAGTTAGAGACTTAATTCAGGGTAATTAAGTAGCGCCAATAAAGAACTTAATTCAGGGTAA 1 AGTCAAGTTAGAGACTTAATTCAGGGTAATTAAGTAGCGTCAATAAAGAACTTAATTCAGGGTAA 24641 CTAAGTCG 66 CTAAGTCG * * * * 24649 AGTCAA--TAAAGAACTTAATTCAGGATAAATAAGT-GAAGTCAATAAAGAACTTAAT 1 AGTCAAGTTAGAG-ACTTAATTCAGGGTAATTAAGTAG-CGTCAATAAAGAACTTAAT 24704 CTAAAAAGAG Statistics Matches: 118, Mismatches: 8, Indels: 5 0.90 0.06 0.04 Matches are distributed among these distances: 71 5 0.04 72 37 0.31 73 76 0.64 ACGTcount: A:0.42, C:0.11, G:0.20, T:0.27 Consensus pattern (73 bp): AGTCAAGTTAGAGACTTAATTCAGGGTAATTAAGTAGCGTCAATAAAGAACTTAATTCAGGGTAA CTAAGTCG Done.