Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01013270.1 Corchorus capsularis cultivar CVL-1 contig13291, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 28112
ACGTcount: A:0.31, C:0.20, G:0.17, T:0.32


Found at i:613 original size:15 final size:15

Alignment explanation

Indices: 580--613 Score: 50 Period size: 15 Copynumber: 2.3 Consensus size: 15 570 TAACAGAATT * 580 AAAAGTGAATAAGAC 1 AAAAGTGAATAAGAA * 595 AAAAGTGAGTAAGAA 1 AAAAGTGAATAAGAA 610 AAAA 1 AAAA 614 TTACCGAGAG Statistics Matches: 17, Mismatches: 2, Indels: 0 0.89 0.11 0.00 Matches are distributed among these distances: 15 17 1.00 ACGTcount: A:0.65, C:0.03, G:0.21, T:0.12 Consensus pattern (15 bp): AAAAGTGAATAAGAA Found at i:2190 original size:35 final size:35 Alignment explanation

Indices: 2146--2773 Score: 573 Period size: 35 Copynumber: 18.7 Consensus size: 35 2136 AGCAATAAGT 2146 AACTCTAATTCAGGGTAATTAAGTAGTTCAGTAATC 1 AACT-TAATTCAGGGTAATTAAGTAGTTCAGTAATC * * 2182 AACTTAATTCAGGGTAATTAAGTAATTCAGTTAGT- 1 AACTTAATTCAGGGTAATTAAGTAGTTCAG-TAATC 2217 AACTTAATTCAGGGTAATT-A--AG-T-AGT--TC 1 AACTTAATTCAGGGTAATTAAGTAGTTCAGTAATC * * 2245 AACTTAATTCAGGGTAATTAAATGAG-TCAATAATC 1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAATC * 2280 AACTTAATTCAGGGTAATTAAGTGAG-TCAATAATC 1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAATC * * 2315 AACTTAATTCAGGGTAATTAAGTAATTCAGTTAGT- 1 AACTTAATTCAGGGTAATTAAGTAGTTCAG-TAATC 2350 AACTTAATTCAGGGTAATTAAGTAGTTC---AA-C 1 AACTTAATTCAGGGTAATTAAGTAGTTCAGTAATC * * 2381 -TC-TAATTCAGGGTAATTAAGTGAG-TCAATAATC 1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAATC * * 2414 AACTTAATTCAGGGTAATTAAGTAATTCAGTTAGT- 1 AACTTAATTCAGGGTAATTAAGTAGTTCAG-TAATC 2449 AACTTAATTCAGGGTAATTAAGTAGTTC---AA-C 1 AACTTAATTCAGGGTAATTAAGTAGTTCAGTAATC * * 2480 -TC-TAATTCAGGGTAATTAAGTGAGTT-AATAAGT- 1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAA-TC * * * 2513 AACTTAATTCAGGGTAATTAAGTAATTCAATGAGT- 1 AACTTAATTCAGGGTAATTAAGTAGTTCAGT-AATC * 2548 AACTTAATTCAGGGTAATTAAGTGAG-TCGGTAATC 1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAATC * * 2583 AACTTAATTCAGGGTAACTAAGTAAG-TCAATAATC 1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAATC * * * 2618 AACCTTAATTCAAGGTAATTAAGTAATTCAGTTAGT- 1 AA-CTTAATTCAGGGTAATTAAGTAGTTCAG-TAATC * ** * 2654 AACTTAGTTCAGGAAAATTAAGTAAG-GCAG---T- 1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAATC * * 2685 AACTTAATTCAGGGTAATTAAGGAATTCAGTAATC 1 AACTTAATTCAGGGTAATTAAGTAGTTCAGTAATC 2720 AACTTAATTCAGGGTAATTAAG--G--CAGTGAA-C 1 AACTTAATTCAGGGTAATTAAGTAGTTCAGT-AATC 2751 AACTTAATTCAGGGTAATTAAGT 1 AACTTAATTCAGGGTAATTAAGT 2774 GTAGTAAGAA Statistics Matches: 500, Mismatches: 47, Indels: 94 0.78 0.07 0.15 Matches are distributed among these distances: 27 1 0.00 28 19 0.04 29 42 0.08 30 11 0.02 31 53 0.11 32 10 0.02 33 3 0.01 34 11 0.02 35 307 0.61 36 40 0.08 37 3 0.01 ACGTcount: A:0.39, C:0.11, G:0.18, T:0.33 Consensus pattern (35 bp): AACTTAATTCAGGGTAATTAAGTAGTTCAGTAATC Found at i:2412 original size:99 final size:99 Alignment explanation

Indices: 2278--2773 Score: 650 Period size: 99 Copynumber: 5.0 Consensus size: 99 2268 GAGTCAATAA 2278 TCAACTTAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAGTAATTC 1 TCAACTTAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAGTAATTC 2343 AGTTAGTAACTTAATTCAGGGTAATTAAGT-AGT 66 AGTTAGTAACTTAATTCAGGGTAATTAAGTAAGT 2376 TCAACTCTAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAGTAATT 1 TCAACT-TAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAGTAATT 2441 CAGTTAGTAACTTAATTCAGGGTAATTAAGT-AGT 65 CAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGT * 2475 TCAACTCTAATTCAGGGTAATTAAGTGAGTTAATAAGT-AACTTAATTCAGGGTAATTAAGTAAT 1 TCAACT-TAATTCAGGGTAATTAAGTGAGTCAATAA-TCAACTTAATTCAGGGTAATTAAGTAAT * * * 2539 TCAATGAGTAACTTAATTCAGGGTAATTAAGTGAGTCGGT 64 TCAGTTAGTAACTTAATTCAGGGTAATTAAGT-A---AGT * * * 2579 AATCAACTTAATTCAGGGTAACTAAGTAAGTCAATAATCAACCTTAATTCAAGGTAATTAAGTAA 1 --TCAACTTAATTCAGGGTAATTAAGTGAGTCAATAATCAA-CTTAATTCAGGGTAATTAAGTAA * ** 2644 TTCAGTTAGTAACTTAGTTCAGGAAAATTAAGTAAG- 63 TTCAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGT * * * 2680 GCAGTAACTTAATTCAGGGTAATTAAG-GAATTCAGTAATCAACTTAATTCAGGGTAATTAAG-- 1 TC---AACTTAATTCAGGGTAATTAAGTG-AGTCAATAATCAACTTAATTCAGGGTAATTAAGTA * * ** 2742 --GCAGTGAACAACTTAATTCAGGGTAATTAAGT 62 ATTCAGTTAGTAACTTAATTCAGGGTAATTAAGT 2774 GTAGTAAGAA Statistics Matches: 356, Mismatches: 27, Indels: 31 0.86 0.07 0.07 Matches are distributed among these distances: 97 25 0.07 98 6 0.02 99 184 0.52 100 1 0.00 101 19 0.05 102 33 0.09 104 3 0.01 105 29 0.08 106 56 0.16 ACGTcount: A:0.39, C:0.11, G:0.18, T:0.33 Consensus pattern (99 bp): TCAACTTAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAGTAATTC AGTTAGTAACTTAATTCAGGGTAATTAAGTAAGT Found at i:2467 original size:134 final size:135 Alignment explanation

Indices: 2138--2773 Score: 682 Period size: 134 Copynumber: 4.7 Consensus size: 135 2128 GGTGAATCAG * 2138 CAATAAGTAACTCTAATTCAGGGTAATTAAGTAGTTCAGTAATCAACTTAATTCAGGGTAATTAA 1 CAATAA-TAACT-TAATTCAGGGTAATTAAGTAATTCAGTAATCAACTTAATTCAGGGTAATTAA * 2203 GTAATTCAGTTAGTAACTTAATTCAGGGTAATTAAGTAGTTC-A--ACTTAATTCAGGGTAATTA 64 GTAATTCAGTTAATAACTTAATTCAGGGTAATTAAGTAGTTCAACTACTTAATTCAGGGTAATTA * * 2265 AATGAGT 129 AGTAAGT * * * 2272 CAATAATCAACTTAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAG 1 CAATAAT-AACTTAATTCAGGGTAATTAAGTAATTCAGTAATCAACTTAATTCAGGGTAATTAAG * 2337 TAATTCAGTTAGTAACTTAATTCAGGGTAATTAAGTAGTTCAACT-C-TAATTCAGGGTAATTAA 65 TAATTCAGTTAATAACTTAATTCAGGGTAATTAAGTAGTTCAACTACTTAATTCAGGGTAATTAA * 2400 GTGAGT 130 GTAAGT * 2406 CAATAATCAACTTAATTCAGGGTAATTAAGTAATTCAGTTAGT-AACTTAATTCAGGGTAATTAA 1 CAATAAT-AACTTAATTCAGGGTAATTAAGTAATTCAG-TAATCAACTTAATTCAGGGTAATTAA * * * * 2470 GTAGTTCA---ACT--C-TAATTCAGGGTAATTAAGTGAGTTAATAAGTAACTTAATTCAGGGTA 64 GTAATTCAGTTAATAACTTAATTCAGGGTAATTAAGT-AGTT--CAACT-ACTTAATTCAGGGTA * 2529 ATTAAGTAATT 125 ATTAAGTAAGT * * * * * 2540 CAATGAGTAACTTAATTCAGGGTAATTAAGTGAGTCGGTAATCAACTTAATTCAGGGTAACTAAG 1 CAAT-AATAACTTAATTCAGGGTAATTAAGTAATTCAGTAATCAACTTAATTCAGGGTAATTAAG * * * * * * ** 2605 TAAGTCA-ATAATCAACCTTAATTCAAGGTAATTAAGTAATTCAGTTAGTAACTTAGTTCAGGAA 65 TAATTCAGTTAAT-AA-CTTAATTCAGGGTAATTAAGTAGTTCA---ACT-ACTTAATTCAGGGT * 2669 AATTAAGTAAGG 124 AATTAAGTAAGT * * 2681 C---AGTAACTTAATTCAGGGTAATTAAGGAATTCAGTAATCAACTTAATTCAGGGTAATTAAG- 1 CAATAATAACTTAATTCAGGGTAATTAAGTAATTCAGTAATCAACTTAATTCAGGGTAATTAAGT * * * 2742 ---GCAGTGAACAACTTAATTCAGGGTAATTAAGT 66 AATTCAGTTAATAACTTAATTCAGGGTAATTAAGT 2774 GTAGTAAGAA Statistics Matches: 436, Mismatches: 42, Indels: 50 0.83 0.08 0.09 Matches are distributed among these distances: 128 19 0.04 129 5 0.01 131 5 0.01 132 20 0.05 133 99 0.23 134 176 0.40 135 6 0.01 136 2 0.00 137 55 0.13 138 1 0.00 140 4 0.01 141 44 0.10 ACGTcount: A:0.39, C:0.11, G:0.18, T:0.33 Consensus pattern (135 bp): CAATAATAACTTAATTCAGGGTAATTAAGTAATTCAGTAATCAACTTAATTCAGGGTAATTAAGT AATTCAGTTAATAACTTAATTCAGGGTAATTAAGTAGTTCAACTACTTAATTCAGGGTAATTAAG TAAGT Found at i:2712 original size:66 final size:66 Alignment explanation

Indices: 2378--2772 Score: 322 Period size: 66 Copynumber: 5.8 Consensus size: 66 2368 TAAGTAGTTC * * * 2378 AACTCTAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAGTAATTCA 1 AACT-TAATTCAGGGTAATTAAGTAAGGC---AAT-AACTTAATTCAGGGTAATTAAGGAATTCA 2443 GTTAGT 61 GTTAGT * * * 2449 AACTTAATTCAGGGTAATTAAGT-A-G--TTCAACTCTAATTCAGGGTAATTAAGTGAGTT-AAT 1 AACTTAATTCAGGGTAATTAAGTAAGGCAAT-AACT-TAATTCAGGGTAATTAAG-GAATTCAGT * 2509 AAGT 63 TAGT ** * 2513 AACTTAATTCAGGGTAATTAAGTAATTCAATGAGTAACTTAATTCAGGGTAATTAAGTG-AGTC- 1 AACTTAATTCAGGGTAATTAAGTAAGGC-A--A-TAACTTAATTCAGGGTAATTAAG-GAATTCA * * 2576 GGTAAT 61 GTTAGT * * * * 2582 CAACTTAATTCAGGGTAACTAAGTAAGTCAATAATCAACCTTAATTCAAGGTAATTAAGTAATTC 1 -AACTTAATTCAGGGTAATTAAGTAAGGC---AAT-AA-CTTAATTCAGGGTAATTAAGGAATTC 2647 AGTTAGT 60 AGTTAGT * ** * * 2654 AACTTAGTTCAGGAAAATTAAGTAAGGCAGTAACTTAATTCAGGGTAATTAAGGAATTCAG-TAA 1 AACTTAATTCAGGGTAATTAAGTAAGGCAATAACTTAATTCAGGGTAATTAAGGAATTCAGTTAG 2718 T 66 T ** * 2719 CAACTTAATTCAGGGTAATTAAGGCAGTG-AACAACTTAATTCAGGGTAATTAAG 1 -AACTTAATTCAGGGTAATTAAGTAAG-GCAATAACTTAATTCAGGGTAATTAAG 2773 TGTAGTAAGA Statistics Matches: 266, Mismatches: 38, Indels: 45 0.76 0.11 0.13 Matches are distributed among these distances: 63 6 0.02 64 46 0.17 65 7 0.03 66 70 0.26 67 3 0.01 68 2 0.01 69 5 0.02 70 68 0.26 71 53 0.20 72 6 0.02 ACGTcount: A:0.39, C:0.11, G:0.18, T:0.32 Consensus pattern (66 bp): AACTTAATTCAGGGTAATTAAGTAAGGCAATAACTTAATTCAGGGTAATTAAGGAATTCAGTTAG T Found at i:5954 original size:40 final size:40 Alignment explanation

Indices: 5910--6022 Score: 129 Period size: 40 Copynumber: 2.8 Consensus size: 40 5900 TTTTATTAAT * * 5910 TTCCAAAAGTTTTCTCTTGG-ATTTCTAAAAAACATTTGCA 1 TTCCAAAAGTCTTCTCTTGGAATTACT-AAAAACATTTGCA *** 5950 TTCCAAAAGTCTTCTCTTGGAATTACTAAAAACATTTATT 1 TTCCAAAAGTCTTCTCTTGGAATTACTAAAAACATTTGCA * * * 5990 TTCCAAAAATCTTCTCTTTGAATTGCTTAAAAA 1 TTCCAAAAGTCTTCTCTTGGAATTAC-TAAAAA 6023 ACGTTCTTTT Statistics Matches: 63, Mismatches: 8, Indels: 3 0.85 0.11 0.04 Matches are distributed among these distances: 40 52 0.83 41 11 0.17 ACGTcount: A:0.35, C:0.18, G:0.08, T:0.40 Consensus pattern (40 bp): TTCCAAAAGTCTTCTCTTGGAATTACTAAAAACATTTGCA Found at i:7347 original size:20 final size:20 Alignment explanation

Indices: 7325--7361 Score: 67 Period size: 20 Copynumber: 1.9 Consensus size: 20 7315 ACCCTTTGTT 7325 TTTTTC-GTATTTTTTGAGC 1 TTTTTCTGTATTTTTTGAGC 7344 TTTTTCTGTATTTTTTGA 1 TTTTTCTGTATTTTTTGA 7362 CTGTTAAAAG Statistics Matches: 17, Mismatches: 0, Indels: 1 0.94 0.00 0.06 Matches are distributed among these distances: 19 6 0.35 20 11 0.65 ACGTcount: A:0.11, C:0.08, G:0.14, T:0.68 Consensus pattern (20 bp): TTTTTCTGTATTTTTTGAGC Found at i:9865 original size:24 final size:25 Alignment explanation

Indices: 9834--9892 Score: 93 Period size: 24 Copynumber: 2.3 Consensus size: 25 9824 GATTCTAATA 9834 CAAATTAATATGATATGATTG-ATG 1 CAAATTAATATGATATGATTGAATG 9858 CAAATTAATATGATATGATTGTAATG 1 CAAATTAATATGATATGATTG-AATG 9884 CAAAATTAA 1 C-AAATTAA 9893 AAAGGACTAA Statistics Matches: 32, Mismatches: 0, Indels: 3 0.91 0.00 0.09 Matches are distributed among these distances: 24 21 0.66 26 4 0.12 27 7 0.22 ACGTcount: A:0.46, C:0.05, G:0.14, T:0.36 Consensus pattern (25 bp): CAAATTAATATGATATGATTGAATG Found at i:20462 original size:23 final size:23 Alignment explanation

Indices: 20436--20502 Score: 56 Period size: 23 Copynumber: 3.2 Consensus size: 23 20426 CAATTTTATT 20436 AATTTCCAAAAGTCTTCTCTTGG 1 AATTTCCAAAAGTCTTCTCTTGG * * * 20459 AATTACTAAAA-AC-T-T-TT-- 1 AATTTCCAAAAGTCTTCTCTTGG * 20476 ATTTTCCAAAAGTCTTCTCTTGG 1 AATTTCCAAAAGTCTTCTCTTGG 20499 AATT 1 AATT 20503 GCTTAAATAG Statistics Matches: 30, Mismatches: 8, Indels: 12 0.60 0.16 0.24 Matches are distributed among these distances: 17 8 0.27 18 1 0.03 19 3 0.10 20 2 0.07 21 3 0.10 22 1 0.03 23 12 0.40 ACGTcount: A:0.31, C:0.18, G:0.09, T:0.42 Consensus pattern (23 bp): AATTTCCAAAAGTCTTCTCTTGG Found at i:21652 original size:25 final size:26 Alignment explanation

Indices: 21593--21653 Score: 72 Period size: 26 Copynumber: 2.3 Consensus size: 26 21583 ACAAATTAAC 21593 AATAAATAACCCAAAGCCCAAATAAGT 1 AATAAATAA-CCAAAGCCCAAATAAGT * 21620 AATGAAATAA-CAAAGCCCAAA-GAGT 1 AAT-AAATAACCAAAGCCCAAATAAGT 21645 AACTAAATA 1 AA-TAAATA 21654 TCAGGCCCAA Statistics Matches: 31, Mismatches: 1, Indels: 6 0.82 0.03 0.16 Matches are distributed among these distances: 25 10 0.32 26 12 0.39 27 3 0.10 28 6 0.19 ACGTcount: A:0.57, C:0.18, G:0.10, T:0.15 Consensus pattern (26 bp): AATAAATAACCAAAGCCCAAATAAGT Found at i:22518 original size:22 final size:24 Alignment explanation

Indices: 22464--22528 Score: 89 Period size: 22 Copynumber: 2.8 Consensus size: 24 22454 CACTAAAAAA * 22464 AAAAAAAAGATTTGTTCACAGCAGG 1 AAAAAAAAG-TTTGTTCACACCAGG * 22489 AAAAAAAAGTTAGTTCACACCA-G 1 AAAAAAAAGTTTGTTCACACCAGG 22512 -AAAAAAAGTTTGTTCAC 1 AAAAAAAAGTTTGTTCAC 22529 CAGCCACCAA Statistics Matches: 37, Mismatches: 3, Indels: 3 0.86 0.07 0.07 Matches are distributed among these distances: 22 16 0.43 23 1 0.03 24 11 0.30 25 9 0.24 ACGTcount: A:0.49, C:0.14, G:0.15, T:0.22 Consensus pattern (24 bp): AAAAAAAAGTTTGTTCACACCAGG Found at i:22930 original size:15 final size:16 Alignment explanation

Indices: 22910--22942 Score: 50 Period size: 17 Copynumber: 2.1 Consensus size: 16 22900 TTATTTATGC 22910 TGTTTAT-TTTAATAT 1 TGTTTATATTTAATAT 22925 TGTTTATAATTTAATAT 1 TGTTTAT-ATTTAATAT 22942 T 1 T 22943 AATTTATTTG Statistics Matches: 16, Mismatches: 0, Indels: 2 0.89 0.00 0.11 Matches are distributed among these distances: 15 7 0.44 17 9 0.56 ACGTcount: A:0.30, C:0.00, G:0.06, T:0.64 Consensus pattern (16 bp): TGTTTATATTTAATAT Found at i:27800 original size:21 final size:22 Alignment explanation

Indices: 27760--27808 Score: 82 Period size: 21 Copynumber: 2.2 Consensus size: 22 27750 TGTAATCTAA 27760 TATGTTTTAGTAGTTTTTAGTTT 1 TATG-TTTAGTAGTTTTTAGTTT 27783 TATGTTTAGTAG-TTTTAGTTT 1 TATGTTTAGTAGTTTTTAGTTT 27804 TATGT 1 TATGT 27809 ATGTTCTGTA Statistics Matches: 26, Mismatches: 0, Indels: 2 0.93 0.00 0.07 Matches are distributed among these distances: 21 14 0.54 22 8 0.31 23 4 0.15 ACGTcount: A:0.18, C:0.00, G:0.18, T:0.63 Consensus pattern (22 bp): TATGTTTAGTAGTTTTTAGTTT Done.