Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01016213.1 Corchorus capsularis cultivar CVL-1 contig16234, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 26867
ACGTcount: A:0.33, C:0.18, G:0.18, T:0.32

Warning! 3 characters in sequence are not A, C, G, or T


Found at i:2124 original size:33 final size:33

Alignment explanation

Indices: 2078--2198 Score: 188 Period size: 33 Copynumber: 3.7 Consensus size: 33 2068 ACTTTTTTTT * * 2078 AATGCTATAATCAACCAAAACACAATTATTTGC 1 AATGCTATGATCAACCAAAACAAAATTATTTGC * 2111 AATGCTATGATCAACCAAAACAAAATTTTTTGC 1 AATGCTATGATCAACCAAAACAAAATTATTTGC * * * 2144 AATGCTATGATCAACCAAAGCAGAATTATTTAC 1 AATGCTATGATCAACCAAAACAAAATTATTTGC 2177 AATGCTATGATCAACCAAAACA 1 AATGCTATGATCAACCAAAACA 2199 GATTTGTTTT Statistics Matches: 80, Mismatches: 8, Indels: 0 0.91 0.09 0.00 Matches are distributed among these distances: 33 80 1.00 ACGTcount: A:0.45, C:0.20, G:0.09, T:0.26 Consensus pattern (33 bp): AATGCTATGATCAACCAAAACAAAATTATTTGC Found at i:2228 original size:66 final size:66 Alignment explanation

Indices: 2089--2233 Score: 168 Period size: 66 Copynumber: 2.2 Consensus size: 66 2079 ATGCTATAAT * * * * 2089 CAACCAAAACACAATTATTTGCAATGCTATGATCAACCAAAACAAAATTTTTTGCAATGCTATGA 1 CAACCAAAACAGAATTATTTACAATGCTATGATCAACCAAAACAAAATTTTTTGCAATACAATGA * 2154 T 66 G * * * 2155 CAACCAAAGCAGAATTATTTACAATGCTATGATCAACCAAAAC-AGATTTGTTTTC-ATCACAAT 1 CAACCAAAACAGAATTATTTACAATGCTATGATCAACCAAAACAAAATTT-TTTGCAAT-ACAAT * 2218 TAG 64 GAG * 2221 CATCCAAAACAGA 1 CAACCAAAACAGA 2234 TTTAGTATCA Statistics Matches: 66, Mismatches: 11, Indels: 4 0.81 0.14 0.05 Matches are distributed among these distances: 65 7 0.11 66 59 0.89 ACGTcount: A:0.43, C:0.21, G:0.10, T:0.27 Consensus pattern (66 bp): CAACCAAAACAGAATTATTTACAATGCTATGATCAACCAAAACAAAATTTTTTGCAATACAATGA G Found at i:2263 original size:33 final size:33 Alignment explanation

Indices: 2226--2330 Score: 131 Period size: 33 Copynumber: 3.2 Consensus size: 33 2216 ATTAGCATCC 2226 AAAACAGATTTAGTATCATCACAAACAACACTT 1 AAAACAGATTTAGTATCATCACAAACAACACTT * ** * 2259 AAAACAGATTTAGTGTCATTGCAAACAACACTC 1 AAAACAGATTTAGTATCATCACAAACAACACTT ** * 2292 AAATTAGGTTTAGTATCATCACAAACAACA-TCT 1 AAAACAGATTTAGTATCATCACAAACAACACT-T 2325 AAAACA 1 AAAACA 2331 CTCTTTGCAA Statistics Matches: 58, Mismatches: 13, Indels: 2 0.79 0.18 0.03 Matches are distributed among these distances: 32 1 0.02 33 57 0.98 ACGTcount: A:0.47, C:0.20, G:0.09, T:0.25 Consensus pattern (33 bp): AAAACAGATTTAGTATCATCACAAACAACACTT Found at i:14165 original size:30 final size:29 Alignment explanation

Indices: 14131--14233 Score: 94 Period size: 30 Copynumber: 3.7 Consensus size: 29 14121 GACCTTTTTA 14131 TTTGGTGCCAAAAAAAAACCCTTGTTCCCT 1 TTTGGTGCCAAAAAAAAACCCTTGTT-CCT 14161 TTTGGTGCC-----AAAACCCTTGTT-CT 1 TTTGGTGCCAAAAAAAAACCCTTGTTCCT * 14184 TTATTG-GCCAAAAAAAAACCCCTTGTTCCT 1 TT-TGGTGCCAAAAAAAAA-CCCTTGTTCCT * * 14214 TTTGTTTGCAAAAAAAAAAC 1 TTTG-GTGCCAAAAAAAAAC 14234 ATTGTTTCTT Statistics Matches: 59, Mismatches: 4, Indels: 20 0.71 0.05 0.24 Matches are distributed among these distances: 23 7 0.12 24 2 0.03 25 12 0.20 28 4 0.07 29 9 0.15 30 14 0.24 31 11 0.19 ACGTcount: A:0.32, C:0.23, G:0.13, T:0.32 Consensus pattern (29 bp): TTTGGTGCCAAAAAAAAACCCTTGTTCCT Found at i:16494 original size:20 final size:19 Alignment explanation

Indices: 16448--16495 Score: 51 Period size: 20 Copynumber: 2.4 Consensus size: 19 16438 TAAAATTATC * 16448 AATTAAAAAGAAAGCAATTA 1 AATT-AAAAGAAAGCAAGTA * 16468 AACTTAAAATAAAGCAAAGTA 1 AA-TTAAAAGAAAGC-AAGTA 16489 AATTAAA 1 AATTAAA 16496 TCTAAATCTA Statistics Matches: 24, Mismatches: 2, Indels: 4 0.80 0.07 0.13 Matches are distributed among these distances: 20 16 0.67 21 8 0.33 ACGTcount: A:0.65, C:0.06, G:0.08, T:0.21 Consensus pattern (19 bp): AATTAAAAGAAAGCAAGTA Found at i:17243 original size:12 final size:12 Alignment explanation

Indices: 17226--17264 Score: 55 Period size: 11 Copynumber: 3.4 Consensus size: 12 17216 ACACCCTTAG 17226 GAAAAACTAGAA 1 GAAAAACTAGAA 17238 GAAAAACTAG-A 1 GAAAAACTAGAA * 17249 GAAAAA-TAGAG 1 GAAAAACTAGAA 17260 GAAAA 1 GAAAA 17265 GAAATTGTGG Statistics Matches: 25, Mismatches: 1, Indels: 3 0.86 0.03 0.10 Matches are distributed among these distances: 10 3 0.12 11 12 0.48 12 10 0.40 ACGTcount: A:0.67, C:0.05, G:0.21, T:0.08 Consensus pattern (12 bp): GAAAAACTAGAA Found at i:20060 original size:42 final size:42 Alignment explanation

Indices: 19984--20073 Score: 103 Period size: 42 Copynumber: 2.1 Consensus size: 42 19974 GCGGGCTAGC * * 19984 GCGGCAGTGATCGGTCTTGGCCGGGCATAGGGCAC-GGATGGA 1 GCGGCAGTGATCGGGCTTGGCCGGGAATAGGGCACAGG-TGGA * * * 20026 GCGGCAGTTATCGGGCTTGGCCTGGAAT-GAGGCACAGGTGGT 1 GCGGCAGTGATCGGGCTTGGCCGGGAATAG-GGCACAGGTGGA 20068 GCGGCA 1 GCGGCA 20074 TTGGCCGGTT Statistics Matches: 41, Mismatches: 5, Indels: 4 0.82 0.10 0.08 Matches are distributed among these distances: 41 1 0.02 42 38 0.93 43 2 0.05 ACGTcount: A:0.17, C:0.21, G:0.44, T:0.18 Consensus pattern (42 bp): GCGGCAGTGATCGGGCTTGGCCGGGAATAGGGCACAGGTGGA Found at i:20960 original size:24 final size:25 Alignment explanation

Indices: 20928--20975 Score: 62 Period size: 24 Copynumber: 1.9 Consensus size: 25 20918 AGTTACACTG * 20928 AATTAACTTGATT-ACCAAATTACC 1 AATTAACTTAATTAACCAAATTACC * 20952 AATTTACTTAATTACACCAAATTA 1 AATTAACTTAATTA-ACCAAATTA 20976 ACTTGTTTAC Statistics Matches: 20, Mismatches: 2, Indels: 2 0.83 0.08 0.08 Matches are distributed among these distances: 24 11 0.55 26 9 0.45 ACGTcount: A:0.44, C:0.19, G:0.02, T:0.35 Consensus pattern (25 bp): AATTAACTTAATTAACCAAATTACC Found at i:20967 original size:43 final size:43 Alignment explanation

Indices: 20915--21079 Score: 206 Period size: 43 Copynumber: 3.8 Consensus size: 43 20905 TATCAAATTG * * * 20915 CTTAGTTACACTGAATTAACTTGATTACCAAATTACCAATTTA 1 CTTAATTACACCGAATTAACTTGTTTACCAAATTACCAATTTA * * 20958 CTTAATTACACCAAATTAACTTGTTTACTAAATTACCAATTTA 1 CTTAATTACACCGAATTAACTTGTTTACCAAATTACCAATTTA * ** 21001 CTTAATTACACCGAATTAAGTTGTTTACCAGGTTACCAATTTA 1 CTTAATTACACCGAATTAACTTGTTTACCAAATTACCAATTTA * * * * 21044 CTTAATCATACCGAATTAAGTCT-TTTACTAAATTAC 1 CTTAATTACACCGAATTAACT-TGTTTACCAAATTAC 21080 TTAATTTAAT Statistics Matches: 106, Mismatches: 15, Indels: 2 0.86 0.12 0.02 Matches are distributed among these distances: 43 105 0.99 44 1 0.01 ACGTcount: A:0.36, C:0.19, G:0.07, T:0.38 Consensus pattern (43 bp): CTTAATTACACCGAATTAACTTGTTTACCAAATTACCAATTTA Found at i:21113 original size:99 final size:99 Alignment explanation

Indices: 20992--21240 Score: 392 Period size: 99 Copynumber: 2.5 Consensus size: 99 20982 TTACTAAATT ** * 20992 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAGGTTACCAATTTACTTAATCATACCG 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACCAATTTACTTAATCACACCG * 21057 AATTAAGTCT-TTTACTAAATTACTTAATTTAATC 66 AATTAAGT-TGTTTACCAAATTACTTAATTTAATC * ** * 21091 ACCAATTTACTTAATTATACCGAATTAAGTTGTTTGTCAAATTACCAATTTACTTAATTACACCG 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACCAATTTACTTAATCACACCG 21156 AATTAAGTTGTTTACCAAATTACTTAATTTAATC 66 AATTAAGTTGTTTACCAAATTACTTAATTTAATC * 21190 ACCAATTTACTTAATTACACCGAATTAAGTTGCTTACCAAATTACCTAATT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACC-AATT 21241 ACACCGAATC Statistics Matches: 136, Mismatches: 12, Indels: 3 0.90 0.08 0.02 Matches are distributed among these distances: 98 1 0.01 99 131 0.96 100 4 0.03 ACGTcount: A:0.36, C:0.18, G:0.07, T:0.39 Consensus pattern (99 bp): ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACCAATTTACTTAATCACACCG AATTAAGTTGTTTACCAAATTACTTAATTTAATC Found at i:21139 original size:43 final size:43 Alignment explanation

Indices: 21091--21572 Score: 263 Period size: 43 Copynumber: 11.0 Consensus size: 43 21081 TAATTTAATC * ** 21091 ACCAATTTACTTAATTATACCGAATTAAGTTGTTTGTCAAATT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATT 21134 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTAAT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACC-----A---AA--T--T * 21189 CACCAATTTACTTAATTACACCGAATTAAGTTGCTTACCAAATT 1 -ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATT * 21233 A-C------C-TAATTACACCGAATCAAGTTG---A-----TT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATT * * ** 21260 ACCAATTTACTTAATTACATCGATTTAAGTTGCCTACCAAATT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATT 21303 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTAAT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACC-----A---AA--T--T * 21358 CACCAATTTACTTAATTACACCTAATTAAGTTGTTTACC----- 1 -ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATT * 21397 A--AA-TTACTTAATTACACCGAATCAAGTTG--------ATT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATT * 21429 ACCAATTTATTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTAAT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACC-----A---AA--T--T * * 21484 CACCAATTTACTTAATTACACCTAATTAAGTTGCTTACCAAATT 1 -ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATT 21528 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATT 21571 AC 1 AC 21573 TTAATTACAC Statistics Matches: 348, Mismatches: 22, Indels: 138 0.69 0.04 0.27 Matches are distributed among these distances: 27 3 0.01 28 1 0.00 32 2 0.01 34 3 0.01 35 86 0.25 36 3 0.01 38 2 0.01 42 1 0.00 43 115 0.33 44 2 0.01 46 2 0.01 48 6 0.02 51 7 0.02 53 3 0.01 55 3 0.01 56 109 0.31 ACGTcount: A:0.37, C:0.19, G:0.07, T:0.38 Consensus pattern (43 bp): ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATT Found at i:21195 original size:56 final size:56 Alignment explanation

Indices: 21134--21409 Score: 278 Period size: 56 Copynumber: 4.9 Consensus size: 56 21124 TTGTCAAATT 21134 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTAATC 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTAATC * * 21190 ACCAATTTACTTAATTACACCGAATTAAGTTGCTTACCAAATTACCTAA-TT-A-C 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTAATC ** * * * * ** * * *** * 21243 ACCGAATCAAGTTGATT--ACC-AATTTACTTAATTACATCGATTTAAGTTGCCT-ACCAAATT 1 ACC-AATTTACTTAATTACACCGAATTAAGTTGTTTAC--C-A---AA-TTACTTAATTTAATC 21303 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTAATC 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTAATC * 21359 ACCAATTTACTTAATTACACCTAATTAAGTTGTTTACCAAATTACTTAATT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATT 21410 ACACCGAATC Statistics Matches: 176, Mismatches: 29, Indels: 30 0.75 0.12 0.13 Matches are distributed among these distances: 51 11 0.06 52 3 0.02 53 5 0.03 54 11 0.06 55 6 0.03 56 103 0.59 57 3 0.02 58 5 0.03 59 11 0.06 60 4 0.02 61 3 0.02 62 11 0.06 ACGTcount: A:0.37, C:0.19, G:0.06, T:0.38 Consensus pattern (56 bp): ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTAATC Found at i:21229 original size:35 final size:35 Alignment explanation

Indices: 21190--21353 Score: 184 Period size: 35 Copynumber: 4.5 Consensus size: 35 21180 TAATTTAATC 21190 ACCAATTTACTTAATTACACCGAATTAAGTTGCTT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGCTT * * * * 21225 ACCAAATTACCTAATTACACCGAATCAAGTTGATT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGCTT * * 21260 ACCAATTTACTTAATTACATCGATTTAAGTTGCCTACCAAATT 1 ACCAATTTACTTAATTACACCGAATTAAGTTG-----C---TT * 21303 ACCAATTTACTTAATTACACCGAATTAAGTTGTTT 1 ACCAATTTACTTAATTACACCGAATTAAGTTGCTT * 21338 ACCAAATTACTTAATT 1 ACCAATTTACTTAATT 21354 TAATCACCAA Statistics Matches: 107, Mismatches: 14, Indels: 16 0.78 0.10 0.12 Matches are distributed among these distances: 35 75 0.70 43 32 0.30 ACGTcount: A:0.37, C:0.20, G:0.07, T:0.36 Consensus pattern (35 bp): ACCAATTTACTTAATTACACCGAATTAAGTTGCTT Found at i:21269 original size:99 final size:95 Alignment explanation

Indices: 20992--21444 Score: 368 Period size: 99 Copynumber: 4.9 Consensus size: 95 20982 TTACTAAATT ** * * * * 20992 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAGGTTACCAATTTACTTAATCATACCG 1 ACCAATTTACTTAATTACACCGAATTAA--TGTTTGTCA--TTACCAAATTACCTAATTACACCG * * 21057 AATTAAGTCT-TTTACTAAATTACTTAATTTAATC 62 AATCAAGT-TGTTTACCAAATTACTTAATTTAATC * * * 21091 ACCAATTTACTTAATTATACCGAATTAAGTTGTTTGTCAAATTACCAATTTACTTAATTACACCG 1 ACCAATTTACTTAATTACACCGAATTAA--TGTTTGTC--ATTACCAAATTACCTAATTACACCG * 21156 AATTAAGTTGTTTACCAAATTACTTAATTTAATC 62 AATCAAGTTGTTTACCAAATTACTTAATTTAATC 21190 ACCAATTTACTTAATTACACCGAATTAA-G-TTG-C-TTACCAAATTACCTAATTACACCGAATC 1 ACCAATTTACTTAATTACACCGAATTAATGTTTGTCATTACCAAATTACCTAATTACACCGAATC * * 21251 AAGTTGATTACCAATTTACTTAA-TT-A-C 66 AAGTTGTTTACCAAATTACTTAATTTAATC * * * * * * * 21278 ATCGATTTA---AGTTGCCTACC--A--AA----T-T-AC---CAATTTACTTAATTACACCGAA 1 ACCAATTTACTTAATT-AC-ACCGAATTAATGTTTGTCATTACCAAATTACCTAATTACACCGAA * 21327 TTAAGTTGTTTACCAAATTACTTAATTTAATC 64 TCAAGTTGTTTACCAAATTACTTAATTTAATC * * 21359 ACCAATTTACTTAATTACACCTAATTAA-G-TTGT--TTACCAAATTACTTAATTACACCGAATC 1 ACCAATTTACTTAATTACACCGAATTAATGTTTGTCATTACCAAATTACCTAATTACACCGAATC * * * 21420 AAGTTGATTACCAATTTATTTAATT 66 AAGTTGTTTACCAAATTACTTAATT 21445 ACACCGAATT Statistics Matches: 299, Mismatches: 32, Indels: 54 0.78 0.08 0.14 Matches are distributed among these distances: 78 42 0.14 79 2 0.01 80 1 0.00 81 9 0.03 82 3 0.01 83 3 0.01 84 4 0.01 85 4 0.01 86 3 0.01 87 3 0.01 88 9 0.03 89 2 0.01 90 2 0.01 91 90 0.30 94 1 0.00 95 3 0.01 96 1 0.00 98 1 0.00 99 115 0.38 101 1 0.00 ACGTcount: A:0.36, C:0.18, G:0.07, T:0.38 Consensus pattern (95 bp): ACCAATTTACTTAATTACACCGAATTAATGTTTGTCATTACCAAATTACCTAATTACACCGAATC AAGTTGTTTACCAAATTACTTAATTTAATC Found at i:21303 original size:169 final size:169 Alignment explanation

Indices: 21091--21600 Score: 699 Period size: 169 Copynumber: 3.0 Consensus size: 169 21081 TAATTTAATC * ** 21091 ACCAATTTACTTAATTATACCGAATTAAGTTGTTTGTCAAATTACCAATTTACTTAATTACACCG 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACCAATTTACTTAATTACACCG 21156 AATTAAGTTGTTTACCAAATTACTTAATTTAATCACCAATTTACTTAATTACACCGAATTAAGTT 66 AATTAAGTTGTTTACCAAATTACTTAATTTAATCACCAATTTACTTAATTACACCGAATTAAGTT * * 21221 GCTTACCAAATTACCTAATTACACCGAATCAAGTTGATT 131 GTTTACCAAATTACTTAATTACACCGAATCAAGTTGATT * * ** 21260 ACCAATTTACTTAATTACATCGATTTAAGTTGCCTACCAAATTACCAATTTACTTAATTACACCG 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACCAATTTACTTAATTACACCG * 21325 AATTAAGTTGTTTACCAAATTACTTAATTTAATCACCAATTTACTTAATTACACCTAATTAAGTT 66 AATTAAGTTGTTTACCAAATTACTTAATTTAATCACCAATTTACTTAATTACACCGAATTAAGTT 21390 GTTTACCAAATTACTTAATTACACCGAATCAAGTTGATT 131 GTTTACCAAATTACTTAATTACACCGAATCAAGTTGATT * * * 21429 ACCAATTTATTTAATTACACCGAATTAAGTTGTTTACCAAATTA-C--TTAATTTAA-T-CACC- 1 ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACCAATTTACTTAATTACACCG * * * * * * ** * * 21488 AATTTACTTAATTACACCTAATTAAGTTGCTTACCAAATTACCAATTTACTTAATTACACCGAAT 66 AATTAAGTT-GTT-TACCAAATT-ACTTAATT---TAATCACCAATTTACTTAATTACACCGAAT * * 21553 TAAGTTGTTTACCAAATTACTTAATTACACTGAATTAAGTTGATT 125 TAAGTTGTTTACCAAATTACTTAATTACACCGAATCAAGTTGATT 21598 ACC 1 ACC 21601 CACTGATTTA Statistics Matches: 305, Mismatches: 30, Indels: 12 0.88 0.09 0.03 Matches are distributed among these distances: 163 7 0.02 164 6 0.02 165 8 0.03 166 12 0.04 168 1 0.00 169 271 0.89 ACGTcount: A:0.37, C:0.18, G:0.07, T:0.38 Consensus pattern (169 bp): ACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACCAATTTACTTAATTACACCG AATTAAGTTGTTTACCAAATTACTTAATTTAATCACCAATTTACTTAATTACACCGAATTAAGTT GTTTACCAAATTACTTAATTACACCGAATCAAGTTGATT Found at i:21395 original size:126 final size:123 Alignment explanation

Indices: 21295--21529 Score: 400 Period size: 126 Copynumber: 1.9 Consensus size: 123 21285 TAAGTTGCCT 21295 ACCAA-ATTACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTAATC 1 ACCAAGATTACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTAATC * 21359 ACCAATTTACTTAATTACACCTAATTAAGTTGTTTACCAAATTACTTAATTACACCGA 66 ACCAATTTACTTAATTACACCTAATTAAGTTGTTTACCAAATTACTGAATTACACCGA * * 21417 ATCAAGTTGATTACCAATTTATTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTA 1 ACCAA---GATTACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTA * 21482 ATCACCAATTTACTTAATTACACCTAATTAAGTTGCTTACCAAATTAC 63 ATCACCAATTTACTTAATTACACCTAATTAAGTTGTTTACCAAATTAC 21530 CAATTTACTT Statistics Matches: 106, Mismatches: 3, Indels: 4 0.94 0.03 0.04 Matches are distributed among these distances: 122 4 0.04 126 102 0.96 ACGTcount: A:0.38, C:0.19, G:0.06, T:0.38 Consensus pattern (123 bp): ACCAAGATTACCAATTTACTTAATTACACCGAATTAAGTTGTTTACCAAATTACTTAATTTAATC ACCAATTTACTTAATTACACCTAATTAAGTTGTTTACCAAATTACTGAATTACACCGA Found at i:21398 original size:35 final size:35 Alignment explanation

Indices: 21359--21600 Score: 193 Period size: 35 Copynumber: 7.1 Consensus size: 35 21349 TAATTTAATC * * 21359 ACCAATTTACTTAATTACACCTAATTAAGTTGTTT 1 ACCAAATTACTTAATTACACCGAATTAAGTTGTTT * * 21394 ACCAAATTACTTAATTACACCGAATCAAGTTGATT 1 ACCAAATTACTTAATTACACCGAATTAAGTTGTTT * * 21429 ACCAATTTATTTAATTACACCGAATTAAGTTGTTT 1 ACCAAATTACTTAATTACACCGAATTAAGTTGTTT * * ** 21464 ACCAAATTACTTAATTTAATCACC-AATTTACTTAATT 1 ACCAAATTACTTAA-TT-A-CACCGAATTAAGTTGTTT ** * * 21501 A-C-ACCTAATTAAGTTGCTTACC--A--AA-----TT 1 ACCAAATTACTTAA-TTAC--ACCGAATTAAGTTGTTT * 21528 ACCAATTTACTTAATTACACCGAATTAAGTTGTTT 1 ACCAAATTACTTAATTACACCGAATTAAGTTGTTT * * 21563 ACCAAATTACTTAATTACACTGAATTAAGTTGATT 1 ACCAAATTACTTAATTACACCGAATTAAGTTGTTT 21598 ACC 1 ACC 21601 CACTGATTTA Statistics Matches: 164, Mismatches: 27, Indels: 32 0.74 0.12 0.14 Matches are distributed among these distances: 26 3 0.02 27 3 0.02 28 5 0.03 29 7 0.04 30 2 0.01 32 1 0.01 33 1 0.01 34 1 0.01 35 123 0.75 36 3 0.02 37 11 0.07 38 4 0.02 ACGTcount: A:0.37, C:0.18, G:0.07, T:0.38 Consensus pattern (35 bp): ACCAAATTACTTAATTACACCGAATTAAGTTGTTT Found at i:21677 original size:47 final size:48 Alignment explanation

Indices: 21625--21836 Score: 217 Period size: 47 Copynumber: 4.5 Consensus size: 48 21615 AATTGCTAAT ** * 21625 TTACTGA-TTACTATTACCGTAACTCTGATTAATCCCTTTTTACTTAA 1 TTACTGATTTACTATTACATTGACTCTGATTAATCCCTTTTTACTTAA * * * * 21672 TTACTGATTTACTGATTACTATT-A--C--ATTGA-CTCCTTAATTACTGAT 1 TTACTGATTTACT-ATTAC-ATTGACTCTGATTAATC-CCTT-TTTACTTAA * * 21718 TTACT-AATTACTATTACATTGACTCTGATTAATCTC-TTTTACTTAA 1 TTACTGATTTACTATTACATTGACTCTGATTAATCCCTTTTTACTTAA * 21764 TTACTGATTTACTATTACATTGACTCTGATTAATCTCTTTTTACTTAA 1 TTACTGATTTACTATTACATTGACTCTGATTAATCCCTTTTTACTTAA 21812 TTACTGATTTACTGATTACTATTGA 1 TTACTGATTTACT-ATTAC-ATTGA 21837 ACTTAATTGC Statistics Matches: 137, Mismatches: 13, Indels: 27 0.77 0.07 0.15 Matches are distributed among these distances: 43 3 0.02 44 7 0.05 45 14 0.10 46 23 0.17 47 39 0.28 48 33 0.24 49 12 0.09 50 6 0.04 ACGTcount: A:0.28, C:0.17, G:0.07, T:0.47 Consensus pattern (48 bp): TTACTGATTTACTATTACATTGACTCTGATTAATCCCTTTTTACTTAA Found at i:21711 original size:38 final size:38 Alignment explanation

Indices: 21667--21742 Score: 143 Period size: 38 Copynumber: 2.0 Consensus size: 38 21657 TCCCTTTTTA * 21667 CTTAATTACTGATTTACTGATTACTATTACATTGACTC 1 CTTAATTACTGATTTACTAATTACTATTACATTGACTC 21705 CTTAATTACTGATTTACTAATTACTATTACATTGACTC 1 CTTAATTACTGATTTACTAATTACTATTACATTGACTC 21743 TGATTAATCT Statistics Matches: 37, Mismatches: 1, Indels: 0 0.97 0.03 0.00 Matches are distributed among these distances: 38 37 1.00 ACGTcount: A:0.30, C:0.18, G:0.07, T:0.45 Consensus pattern (38 bp): CTTAATTACTGATTTACTAATTACTATTACATTGACTC Found at i:21720 original size:93 final size:91 Alignment explanation

Indices: 21612--21781 Score: 259 Period size: 93 Copynumber: 1.8 Consensus size: 91 21602 ACTGATTTAA * * * 21612 CTTAATTGCTAATTTACTGATTACTATTACCGTAACTCTGATTAATCCCTTTTTACTTAATTACT 1 CTTAATTACTAATTTACTAATTACTATTACAGTAACTCTGATTAATCCC-TTTTACTTAATTACT 21677 GATTTACTGATTACTATTACATTGACTC 65 GATTTACT-ATTACTATTACATTGACTC * * * * 21705 CTTAATTACTGATTTACTAATTACTATTACATTGACTCTGATTAATCTCTTTTACTTAATTACTG 1 CTTAATTACTAATTTACTAATTACTATTACAGTAACTCTGATTAATCCCTTTTACTTAATTACTG 21770 ATTTACTATTAC 66 ATTTACTATTAC 21782 ATTGACTCTG Statistics Matches: 70, Mismatches: 7, Indels: 2 0.89 0.09 0.03 Matches are distributed among these distances: 91 5 0.07 92 23 0.33 93 42 0.60 ACGTcount: A:0.29, C:0.18, G:0.06, T:0.46 Consensus pattern (91 bp): CTTAATTACTAATTTACTAATTACTATTACAGTAACTCTGATTAATCCCTTTTACTTAATTACTG ATTTACTATTACTATTACATTGACTC Found at i:22844 original size:51 final size:51 Alignment explanation

Indices: 22678--22896 Score: 241 Period size: 50 Copynumber: 4.3 Consensus size: 51 22668 AAACTTTAAT * * * 22678 TCAAAGGTGACA-TTTTA-TTCCCAAATTACTTAAAAAAGATTCAATCTTTTAT 1 TCAAAGGTGACATTTTTACTT-ACTAATTAC-TAAAAAA-ATTCAATCTTTTAC * * * * ** * 22730 TCAAATGTTACATCTTTATTTACTAATTACTCTAAAAA-TCAATCTTTTGC 1 TCAAAGGTGACATTTTTACTTACTAATTACTAAAAAAATTCAATCTTTTAC * 22780 TCAAAGGTGACATTTTTACTTACTAATTACTAAAAAAATTCAAACTTTTAC 1 TCAAAGGTGACATTTTTACTTACTAATTACTAAAAAAATTCAATCTTTTAC * * 22831 CCAAAGGTGACATTTTTACTTACTAATTACT--AAGAATTCAATCTTTTAC 1 TCAAAGGTGACATTTTTACTTACTAATTACTAAAAAAATTCAATCTTTTAC * * 22880 CCAAAGATGACATTTTT 1 TCAAAGGTGACATTTTT 22897 TATTTAAGTT Statistics Matches: 143, Mismatches: 21, Indels: 9 0.83 0.12 0.05 Matches are distributed among these distances: 49 32 0.22 50 42 0.29 51 41 0.29 52 15 0.10 53 11 0.08 54 2 0.01 ACGTcount: A:0.37, C:0.17, G:0.07, T:0.39 Consensus pattern (51 bp): TCAAAGGTGACATTTTTACTTACTAATTACTAAAAAAATTCAATCTTTTAC Found at i:22858 original size:101 final size:102 Alignment explanation

Indices: 22678--22896 Score: 259 Period size: 101 Copynumber: 2.2 Consensus size: 102 22668 AAACTTTAAT * * ** * * 22678 TCAAAGGTGACA-TTTTATTCCCAAATTACTTAAAAAAGATTCAATCTTTTATTCAAATGTTACA 1 TCAAAGGTGACATTTTTATTCACAAATTACTTAAAAAAGATTCAAACTTTTACCCAAAGGTGACA * * 22742 TCTTTATTTACTAATTACTCTAA-AAATCAATCTTTTGC 66 TCTTTACTTACTAATTA--CTAAGAAATCAATCTTTTAC * 22780 TCAAAGGTGACATTTTTACTT-ACTAATTAC-TAAAAAA-ATTCAAACTTTTACCCAAAGGTGAC 1 TCAAAGGTGACATTTTTA-TTCACAAATTACTTAAAAAAGATTCAAACTTTTACCCAAAGGTGAC * * 22842 ATTTTTACTTACTAATTACTAAGAATTCAATCTTTTAC 65 ATCTTTACTTACTAATTACTAAGAAATCAATCTTTTAC * * 22880 CCAAAGATGACATTTTT 1 TCAAAGGTGACATTTTT 22897 TATTTAAGTT Statistics Matches: 101, Mismatches: 13, Indels: 8 0.83 0.11 0.07 Matches are distributed among these distances: 99 4 0.04 100 28 0.28 101 36 0.36 102 19 0.19 103 12 0.12 104 2 0.02 ACGTcount: A:0.37, C:0.17, G:0.07, T:0.39 Consensus pattern (102 bp): TCAAAGGTGACATTTTTATTCACAAATTACTTAAAAAAGATTCAAACTTTTACCCAAAGGTGACA TCTTTACTTACTAATTACTAAGAAATCAATCTTTTAC Found at i:24278 original size:38 final size:35 Alignment explanation

Indices: 24199--24268 Score: 115 Period size: 35 Copynumber: 2.0 Consensus size: 35 24189 GGGAGAGCTT * 24199 TATTTTGTCTCCATGTGTGATGTGTGTTGTTGAAG 1 TATTTTGTCTCCATGTATGATGTGTGTTGTTGAAG 24234 TATTTTGTCTCCATGTATG-TGTGTGTGTGTTGAAG 1 TATTTTGTCTCCATGTATGATGTGTGT-TGTTGAAG 24269 GGTGATTTTG Statistics Matches: 33, Mismatches: 1, Indels: 2 0.92 0.03 0.06 Matches are distributed among these distances: 34 7 0.21 35 26 0.79 ACGTcount: A:0.14, C:0.09, G:0.29, T:0.49 Consensus pattern (35 bp): TATTTTGTCTCCATGTATGATGTGTGTTGTTGAAG Found at i:25648 original size:90 final size:92 Alignment explanation

Indices: 25371--25699 Score: 470 Period size: 92 Copynumber: 3.6 Consensus size: 92 25361 ATCCTTTGAA * * * 25371 GAAAATCTACTGCACCGAGCTTACCGAATTCTAATATTTGAAGAAATAATGCACCGCATTAACTT 1 GAAAATCTGCTGCACCGAGCTCACCGAATTCCAATATTTGAAGAAATAATGCACCGCATTAACTT 25436 GATTCACCGAATCACCTTGAACTGTTT 66 GATTCACCGAATCACCTTGAACTGTTT * * 25463 GAAAATGTGCTGCACCGAGCTTACCGAATTCCAATATTTGAAGAAATAATGCACCGCATTAACTT 1 GAAAATCTGCTGCACCGAGCTCACCGAATTCCAATATTTGAAGAAATAATGCACCGCATTAACTT * * 25528 GATTCACTGAATCACCTTGAACTATTT 66 GATTCACCGAATCACCTTGAACTGTTT * * * 25555 GAAAATGTGCTGCACCGAGCTCACCGAA-TCCAA-CTTTGAAGAAATAATGCACCACATTAACTT 1 GAAAATCTGCTGCACCGAGCTCACCGAATTCCAATATTTGAAGAAATAATGCACCGCATTAACTT ** * 25618 GATTCACCGAATC-CTCCAGAACTGTCT 66 GATTCACCGAATCAC-CTTGAACTGTTT * * * 25645 GAAAATCTGCTGCACCGAGCTCACCGAATT-CGA-CTTTGAAGAAATAAGGCACCGC 1 GAAAATCTGCTGCACCGAGCTCACCGAATTCCAATATTTGAAGAAATAATGCACCGC 25700 CTCTGTAGAC Statistics Matches: 218, Mismatches: 17, Indels: 6 0.90 0.07 0.02 Matches are distributed among these distances: 89 1 0.00 90 97 0.44 91 6 0.03 92 114 0.52 ACGTcount: A:0.33, C:0.25, G:0.16, T:0.26 Consensus pattern (92 bp): GAAAATCTGCTGCACCGAGCTCACCGAATTCCAATATTTGAAGAAATAATGCACCGCATTAACTT GATTCACCGAATCACCTTGAACTGTTT Found at i:25864 original size:28 final size:27 Alignment explanation

Indices: 25804--25866 Score: 72 Period size: 27 Copynumber: 2.3 Consensus size: 27 25794 GGGGCATTTT * * ** 25804 GGTCATTTGCATGTACAGGGGCATTTT 1 GGTCATTTGCATATACAGGAGCATTGA * 25831 GGTCATTTGCATATTCAGAGAGCATTGA 1 GGTCATTTGCATATACAG-GAGCATTGA 25859 GGTCATTT 1 GGTCATTT 25867 TGAGTCCACT Statistics Matches: 30, Mismatches: 5, Indels: 1 0.83 0.14 0.03 Matches are distributed among these distances: 27 16 0.53 28 14 0.47 ACGTcount: A:0.22, C:0.14, G:0.27, T:0.37 Consensus pattern (27 bp): GGTCATTTGCATATACAGGAGCATTGA Found at i:25982 original size:25 final size:24 Alignment explanation

Indices: 25949--26003 Score: 65 Period size: 24 Copynumber: 2.2 Consensus size: 24 25939 GCACTTTTAG ** 25949 CATTGTAGTATATTCCATTGCATTTT 1 CATT-TAGTA-ATTCCACAGCATTTT * 25975 CATTTAGTAATTTCACAGCATTTT 1 CATTTAGTAATTCCACAGCATTTT 25999 CATTT 1 CATTT 26004 TATAATTTAG Statistics Matches: 26, Mismatches: 3, Indels: 2 0.84 0.10 0.06 Matches are distributed among these distances: 24 17 0.65 25 5 0.19 26 4 0.15 ACGTcount: A:0.25, C:0.16, G:0.09, T:0.49 Consensus pattern (24 bp): CATTTAGTAATTCCACAGCATTTT Done.