Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01006486.1 Corchorus capsularis cultivar CVL-1 contig06507, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 25805
ACGTcount: A:0.29, C:0.19, G:0.20, T:0.33


Found at i:3208 original size:33 final size:32

Alignment explanation

Indices: 3166--3310 Score: 121 Period size: 33 Copynumber: 4.4 Consensus size: 32 3156 AGCTAAAGGA * 3166 TCATATGGCCGGTTGTGGCCGGGCATGGCCGA-G 1 TCATGTGGCCGG-TGTGGCCGGGCATGGCC-ATG 3199 TCATGTGGCCTGGTGTGGCCGGGCATGGCCATG 1 TCATGTGGCC-GGTGTGGCCGGGCATGGCCATG ** ** 3232 TCGCGTGGCCGGTGATGGCCGGGCATCTCCATG 1 TCATGTGGCCGGTG-TGGCCGGGCATGGCCATG *** * * * 3265 TCGCATGGCCGGTGTTGCGCGGGCATGTCCAAG 1 TCATGTGGCCGGTGTGGC-CGGGCATGGCCATG ** 3298 TCGCGTGGCCGGT 1 TCATGTGGCCGGT 3311 CACTTATGCT Statistics Matches: 98, Mismatches: 10, Indels: 8 0.84 0.09 0.07 Matches are distributed among these distances: 32 8 0.08 33 88 0.90 34 2 0.02 ACGTcount: A:0.10, C:0.27, G:0.41, T:0.22 Consensus pattern (32 bp): TCATGTGGCCGGTGTGGCCGGGCATGGCCATG Found at i:3251 original size:66 final size:65 Alignment explanation

Indices: 3171--3310 Score: 158 Period size: 66 Copynumber: 2.1 Consensus size: 65 3161 AAGGATCATA * ** * 3171 TGGCCGGTTGTGGCCGGGCATGGCCGA-GTCATGTGGCCTGGTGTGGC-CGGGCATGGCCATGTC 1 TGGCCGG-TGTGGCCGGGCATCGCC-ATGTCACATGGCC-GGTGTGGCGCGGGCATGGCCAAGTC 3234 GCG 63 GCG * * * * 3237 TGGCCGGTGATGGCCGGGCATCTCCATGTCGCATGGCCGGTGTTGCGCGGGCATGTCCAAGTCGC 1 TGGCCGGTG-TGGCCGGGCATCGCCATGTCACATGGCCGGTGTGGCGCGGGCATGGCCAAGTCGC 3302 G 65 G 3303 TGGCCGGT 1 TGGCCGGT 3311 CACTTATGCT Statistics Matches: 63, Mismatches: 8, Indels: 6 0.82 0.10 0.08 Matches are distributed among these distances: 65 10 0.16 66 53 0.84 ACGTcount: A:0.09, C:0.27, G:0.43, T:0.21 Consensus pattern (65 bp): TGGCCGGTGTGGCCGGGCATCGCCATGTCACATGGCCGGTGTGGCGCGGGCATGGCCAAGTCGCG Found at i:9630 original size:42 final size:42 Alignment explanation

Indices: 9582--9664 Score: 103 Period size: 42 Copynumber: 2.0 Consensus size: 42 9572 CATGGGACAC * * * 9582 CGCACGGGACATCGCACAAGCCATCCGGCCACAACCGGCCAT 1 CGCACGGGACAACGCACAAGCCAACCGGACACAACCGGCCAT * *** 9624 CGCACGGGCCAACGCATGCGCCAACCGGACACAACCGGCCA 1 CGCACGGGACAACGCACAAGCCAACCGGACACAACCGGCCA 9665 CTTGACCCTT Statistics Matches: 34, Mismatches: 7, Indels: 0 0.83 0.17 0.00 Matches are distributed among these distances: 42 34 1.00 ACGTcount: A:0.27, C:0.43, G:0.25, T:0.05 Consensus pattern (42 bp): CGCACGGGACAACGCACAAGCCAACCGGACACAACCGGCCAT Found at i:14082 original size:33 final size:33 Alignment explanation

Indices: 14045--14109 Score: 94 Period size: 33 Copynumber: 2.0 Consensus size: 33 14035 ACTTAATATG * 14045 AGTGTTGTTTGCAATGGCACTAAATCTGTTTTA 1 AGTGTTGTTTGCAATGACACTAAATCTGTTTTA ** * 14078 AGTGTTGTTTGTGATGATACTAAATCTGTTTT 1 AGTGTTGTTTGCAATGACACTAAATCTGTTTT 14110 GGATGCTAAT Statistics Matches: 28, Mismatches: 4, Indels: 0 0.88 0.12 0.00 Matches are distributed among these distances: 33 28 1.00 ACGTcount: A:0.23, C:0.09, G:0.22, T:0.46 Consensus pattern (33 bp): AGTGTTGTTTGCAATGACACTAAATCTGTTTTA Found at i:14165 original size:33 final size:33 Alignment explanation

Indices: 14128--14243 Score: 205 Period size: 33 Copynumber: 3.5 Consensus size: 33 14118 ATTGTGATGA 14128 AAATAATTCTGTTTTGGTTGATCATAGCATTGC 1 AAATAATTCTGTTTTGGTTGATCATAGCATTGC 14161 AAATAATTCTGTTTTGGTTGATCATAGCATTGC 1 AAATAATTCTGTTTTGGTTGATCATAGCATTGC * ** 14194 AAATAATTCTGTTTTGGTTGATTATAGCATTAA 1 AAATAATTCTGTTTTGGTTGATCATAGCATTGC 14227 AAATAATTCTGTTTTGG 1 AAATAATTCTGTTTTGG 14244 GTGAAAAAAA Statistics Matches: 80, Mismatches: 3, Indels: 0 0.96 0.04 0.00 Matches are distributed among these distances: 33 80 1.00 ACGTcount: A:0.29, C:0.09, G:0.17, T:0.44 Consensus pattern (33 bp): AAATAATTCTGTTTTGGTTGATCATAGCATTGC Found at i:15991 original size:35 final size:34 Alignment explanation

Indices: 15911--16402 Score: 561 Period size: 35 Copynumber: 14.1 Consensus size: 34 15901 TTCTAACTAA * * * 15911 ACTTAATTACCCTGAATTAAATTGCTTA-TTACTT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGA-TT 15945 ACTTAATTACCCTGAATTAAGTTGATTACTGATT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGATT * 15979 GACTTAATTACCCTGATTTAAGTTGATTACTGAATT 1 -ACTTAATTACCCTGAATTAAGTTGATTACTG-ATT * * 16015 CCTTAATTACCCTGAATT-AGTTGATTACTGACTC 1 ACTTAATTACCCTGAATTAAGTTGATTACTGA-TT * * 16049 ACTTAATTACCCTGAATTAAGTT-ATTGC--CTT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGATT ** * * 16080 ACTTAATTTTCCTGAACTAAGTT-ACTAACTGAATT 1 ACTTAATTACCCTGAATTAAGTTGA-TTACTG-ATT * 16115 ACTTAATTACCCTGAATTAAGGTTCATTACTGACTT 1 ACTTAATTACCCTGAATTAA-GTTGATTACTGA-TT * 16151 ACTTAATTACCCTGAATTAAGTTGATTACAGATT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGATT 16185 CACTTAATTACCCTGAATTAAGTTGATTACTGAATT 1 -ACTTAATTACCCTGAATTAAGTTGATTACTG-ATT * 16221 ATTTAATTACCCTGAATTAAGTT-ATTACTGAATT 1 ACTTAATTACCCTGAATTAAGTTGATTACTG-ATT 16255 ACTTAATTACCCTGAATTAAGTT-ATTAACTGACCTT 1 ACTTAATTACCCTGAATTAAGTTGATT-ACTGA--TT * * 16291 ACTCAATTACCCTGAATTAAGTTAATTACTGAATT 1 ACTTAATTACCCTGAATTAAGTTGATTACTG-ATT * 16326 ACTTAATTACCCTGAATTAAGTTGCTTATTACTGACTC 1 ACTTAATTACCCTGAATTAAGTTG---ATTACTGA-TT * 16364 ACTTAATTACCCTGAATTAAGCT-ACTTACTGACTT 1 ACTTAATTACCCTGAATTAAGTTGA-TTACTGA-TT 16399 ACTT 1 ACTT 16403 CACTTACTTA Statistics Matches: 402, Mismatches: 32, Indels: 47 0.84 0.07 0.10 Matches are distributed among these distances: 31 22 0.05 32 2 0.00 33 1 0.00 34 102 0.25 35 175 0.44 36 64 0.16 37 6 0.01 38 30 0.07 ACGTcount: A:0.32, C:0.18, G:0.10, T:0.40 Consensus pattern (34 bp): ACTTAATTACCCTGAATTAAGTTGATTACTGATT Found at i:16031 original size:18 final size:18 Alignment explanation

Indices: 16008--16066 Score: 52 Period size: 18 Copynumber: 3.4 Consensus size: 18 15998 AAGTTGATTA 16008 CTGAATTCCTTAATTACC 1 CTGAATTCCTTAATTACC ** * 16026 CTGAATTAGTTGATTA-- 1 CTGAATTCCTTAATTACC * 16042 CTG-ACTCACTTAATTACC 1 CTGAATTC-CTTAATTACC 16060 CTGAATT 1 CTGAATT 16067 AAGTTATTGC Statistics Matches: 29, Mismatches: 8, Indels: 7 0.66 0.18 0.16 Matches are distributed among these distances: 15 2 0.07 16 9 0.31 18 16 0.55 19 2 0.07 ACGTcount: A:0.29, C:0.22, G:0.10, T:0.39 Consensus pattern (18 bp): CTGAATTCCTTAATTACC Found at i:16166 original size:206 final size:209 Alignment explanation

Indices: 15911--16384 Score: 701 Period size: 206 Copynumber: 2.3 Consensus size: 209 15901 TTCTAACTAA * * 15911 ACTTAATTACCCTGAATTAAATTGC-TTA-TTACTTACTTAATTACCCTGAATTAAGTTGATTAC 1 ACTTAATTACCCTGAATTAAGTTGCATTACTGACTTACTTAATTACCCTGAATTAAGTTGATTAC * * * * 15974 TGATTGACTTAATTACCCTGATTTAAGTTGATTACTGAATTCCTTAATTACCCTGAATT-AGTTG 66 AGATTCACTTAATTACCCTGAATTAAGTTGATTACTGAATTACTTAATTACCCTGAATTAAGTT- * * ** 16038 ATTACTGACTCACTTAATTACCCTGAATTAAGTTA-T-TG-CCTTACTTAATTTTCCTGAACTAA 130 ATTACTGAATCACTTAATTACCCTGAATTAAGTTATTATGACCTTACTCAATTACCCTGAACTAA * 16100 GTTACTAACTGAATT 195 GTTAATAACTGAATT 16115 ACTTAATTACCCTGAATTAAGGTT-CATTACTGACTTACTTAATTACCCTGAATTAAGTTGATTA 1 ACTTAATTACCCTGAATTAA-GTTGCATTACTGACTTACTTAATTACCCTGAATTAAGTTGATTA * 16179 CAGATTCACTTAATTACCCTGAATTAAGTTGATTACTGAATTATTTAATTACCCTGAATTAAGTT 65 CAGATTCACTTAATTACCCTGAATTAAGTTGATTACTGAATTACTTAATTACCCTGAATTAAGTT * * 16244 ATTACTGAATTACTTAATTACCCTGAATTAAGTTATTAACTGACCTTACTCAATTACCCTGAATT 130 ATTACTGAATCACTTAATTACCCTGAATTAAGTTATT-A-TGACCTTACTCAATTACCCTGAACT * 16309 AAGTTAATTACTGAATT 193 AAGTTAATAACTGAATT * 16326 ACTTAATTACCCTGAATTAAGTTGCTTATTACTGACTCACTTAATTACCCTGAATTAAG 1 ACTTAATTACCCTGAATTAAGTTGC--ATTACTGACTTACTTAATTACCCTGAATTAAG 16385 CTACTTACTG Statistics Matches: 242, Mismatches: 16, Indels: 15 0.89 0.06 0.05 Matches are distributed among these distances: 204 21 0.09 205 5 0.02 206 121 0.50 207 5 0.02 210 5 0.02 211 54 0.22 213 31 0.13 ACGTcount: A:0.32, C:0.18, G:0.10, T:0.40 Consensus pattern (209 bp): ACTTAATTACCCTGAATTAAGTTGCATTACTGACTTACTTAATTACCCTGAATTAAGTTGATTAC AGATTCACTTAATTACCCTGAATTAAGTTGATTACTGAATTACTTAATTACCCTGAATTAAGTTA TTACTGAATCACTTAATTACCCTGAATTAAGTTATTATGACCTTACTCAATTACCCTGAACTAAG TTAATAACTGAATT Found at i:16293 original size:140 final size:139 Alignment explanation

Indices: 15911--16402 Score: 633 Period size: 140 Copynumber: 3.5 Consensus size: 139 15901 TTCTAACTAA * * * 15911 ACTTAATTACCCTGAATTAAATTGCTTATTACTTACTTAATTACCCTGAATTAAGTTGA-TTACT 1 ACTTAATTACCCTGAATTAAGTTGATTATGACTTACTTAATTACCCTGAATTAAGTT-ACTTACT * * * * 15975 G-ATTGACTTAATTACCCTGATTTAAGTTGATTACTGAATTCCTTAATTACCCTGAATT-AGTTG 65 GAATT-ACTTAATTACCCTGAATTAAGTTCATTACTGACTTACTTAATTACCCTGAATTAAGTTG * 16038 ATTACTGACTC 129 ATTACTGATTC * ** * * 16049 ACTTAATTACCCTGAATTAAGTT-A-T-TGCCTTACTTAATTTTCCTGAACTAAGTTACTAACTG 1 ACTTAATTACCCTGAATTAAGTTGATTATGACTTACTTAATTACCCTGAATTAAGTTACTTACTG 16111 AATTACTTAATTACCCTGAATTAAGGTTCATTACTGACTTACTTAATTACCCTGAATTAAGTTGA 66 AATTACTTAATTACCCTGAATTAA-GTTCATTACTGACTTACTTAATTACCCTGAATTAAGTTGA * 16176 TTACAGATTC 130 TTACTGATTC * * 16186 ACTTAATTACCCTGAATTAAGTTGATTACTGAATTATTTAATTACCCTGAATTAAGTTA-TTACT 1 ACTTAATTACCCTGAATTAAGTTGATTA-TGACTTACTTAATTACCCTGAATTAAGTTACTTACT * 16250 GAATTACTTAATTACCCTGAATTAAGTT-ATTAACTGACCTTACTCAATTACCCTGAATTAAGTT 65 GAATTACTTAATTACCCTGAATTAAGTTCATT-ACTGA-CTTACTTAATTACCCTGAATTAAGTT * 16314 AATTACTGAATT- 128 GATTACTG-ATTC * * 16326 ACTTAATTACCCTGAATTAAGTTGCTTATTACTGACTCACTTAATTACCCTGAATTAAGCTACTT 1 ACTTAATTACCCTGAATTAAGTTG---ATTA-TGACTTACTTAATTACCCTGAATTAAGTTACTT * 16391 ACTGACTTACTT 62 ACTGAATTACTT 16403 CACTTACTTA Statistics Matches: 310, Mismatches: 29, Indels: 24 0.85 0.08 0.07 Matches are distributed among these distances: 134 1 0.00 135 48 0.15 136 34 0.11 137 37 0.12 138 26 0.08 139 9 0.03 140 84 0.27 141 27 0.09 143 31 0.10 144 13 0.04 ACGTcount: A:0.32, C:0.18, G:0.10, T:0.40 Consensus pattern (139 bp): ACTTAATTACCCTGAATTAAGTTGATTATGACTTACTTAATTACCCTGAATTAAGTTACTTACTG AATTACTTAATTACCCTGAATTAAGTTCATTACTGACTTACTTAATTACCCTGAATTAAGTTGAT TACTGATTC Found at i:16414 original size:44 final size:40 Alignment explanation

Indices: 16113--16505 Score: 232 Period size: 35 Copynumber: 10.6 Consensus size: 40 16103 ACTAACTGAA * 16113 TTACTTAATTACCCTGAATTAAGGTT-C--A-TTAC-TGAC 1 TTACTTAATTACCCTGAATTAA-GTTACTGACTTACTTCAC ** 16149 TTACTTAATTACCCTGAATTAAG-T--TGA-TTAC-AGA- 1 TTACTTAATTACCCTGAATTAAGTTACTGACTTACTTCAC * * 16183 TTCACTTAATTACCCTGAATTAAG-T--TGA-TTAC-TGAA 1 TT-ACTTAATTACCCTGAATTAAGTTACTGACTTACTTCAC * * * 16219 TTATTTAATTACCCTGAATTAAG-T--T-A-TTAC-TGAA 1 TTACTTAATTACCCTGAATTAAGTTACTGACTTACTTCAC * * * 16253 TTACTTAATTACCCTGAATTAAGTTATTAACTGA---C-C 1 TTACTTAATTACCCTGAATTAAGTTACTGACTTACTTCAC * * * 16289 TTACTCAATTACCCTGAATTAAGTTA---A-TTAC-TGAA 1 TTACTTAATTACCCTGAATTAAGTTACTGACTTACTTCAC * * * 16324 TTACTTAATTACCCTGAATTAAGTTGCTTA-TTAC-TGAC 1 TTACTTAATTACCCTGAATTAAGTTACTGACTTACTTCAC * 16362 TCACTTAATTACCCTGAATTAAGCTACTTACTGACTTACTTCAC 1 TTACTTAATTACCCTGAATTAAG----TTACTGACTTACTTCAC * * * 16406 TTACTTAATTACCCTTAATTAAGTTACTGACTTAATTTAC 1 TTACTTAATTACCCTGAATTAAGTTACTGACTTACTTCAC * * * * 16446 TTACTTAATTACCCTTAATCAA-AT-C-GAC-TA-TTGAC 1 TTACTTAATTACCCTGAATTAAGTTACTGACTTACTTCAC * 16481 TTGCTTAATTACCCTGAATTAAGTT 1 TTACTTAATTACCCTGAATTAAGTT 16506 GCTTATTACT Statistics Matches: 306, Mismatches: 29, Indels: 44 0.81 0.08 0.12 Matches are distributed among these distances: 32 2 0.01 33 1 0.00 34 34 0.11 35 109 0.36 36 52 0.17 37 4 0.01 38 32 0.10 39 3 0.01 40 36 0.12 42 5 0.02 43 4 0.01 44 24 0.08 ACGTcount: A:0.33, C:0.19, G:0.09, T:0.40 Consensus pattern (40 bp): TTACTTAATTACCCTGAATTAAGTTACTGACTTACTTCAC Found at i:25017 original size:21 final size:21 Alignment explanation

Indices: 24984--25032 Score: 55 Period size: 21 Copynumber: 2.3 Consensus size: 21 24974 AAAAATTGTA ** 24984 GCTT-CTTGGAAATGGCTCTT 1 GCTTCCTTGGAAATCCCTCTT * 25004 GCTTCCTTTGAAATCCCTCTT 1 GCTTCCTTGGAAATCCCTCTT 25025 GCATTCCT 1 GC-TTCCT 25033 AAAGCATTGA Statistics Matches: 24, Mismatches: 3, Indels: 2 0.83 0.10 0.07 Matches are distributed among these distances: 20 4 0.17 21 15 0.62 22 5 0.21 ACGTcount: A:0.14, C:0.29, G:0.16, T:0.41 Consensus pattern (21 bp): GCTTCCTTGGAAATCCCTCTT Done.