Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01008427.1 Corchorus capsularis cultivar CVL-1 contig08448, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 26833
ACGTcount: A:0.32, C:0.17, G:0.20, T:0.32


Found at i:2453 original size:30 final size:30

Alignment explanation

Indices: 2417--2479 Score: 101 Period size: 30 Copynumber: 2.1 Consensus size: 30 2407 TCGCACGGGA * 2417 CATCGCAC-GAGCCATCTGGCCACAACCGGC 1 CATCGCACGGA-CCATCCGGCCACAACCGGC 2447 CATCGCACGGACCATCCGGCCACAACCGGC 1 CATCGCACGGACCATCCGGCCACAACCGGC 2477 CAT 1 CAT 2480 TCGATCCATT Statistics Matches: 31, Mismatches: 1, Indels: 2 0.91 0.03 0.06 Matches are distributed among these distances: 30 29 0.94 31 2 0.06 ACGTcount: A:0.24, C:0.44, G:0.22, T:0.10 Consensus pattern (30 bp): CATCGCACGGACCATCCGGCCACAACCGGC Found at i:8522 original size:30 final size:29 Alignment explanation

Indices: 8488--8563 Score: 89 Period size: 30 Copynumber: 2.5 Consensus size: 29 8478 TCGCACGGGA * 8488 CATCGCACGAGCCATCCAGCCGCAACCGAC 1 CATCGCACG-GCCATCCAGCCACAACCGAC * * 8518 CATCGCACGGACCATCCGGCCACAACCGGC 1 CATCGCACGG-CCATCCAGCCACAACCGAC * 8548 CATCGTACGGGCCATC 1 CATCGCAC-GGCCATC 8564 GCACGGACCA Statistics Matches: 40, Mismatches: 4, Indels: 4 0.83 0.08 0.08 Matches are distributed among these distances: 29 1 0.03 30 37 0.93 31 2 0.05 ACGTcount: A:0.24, C:0.45, G:0.22, T:0.09 Consensus pattern (29 bp): CATCGCACGGCCATCCAGCCACAACCGAC Found at i:11629 original size:6 final size:6 Alignment explanation

Indices: 11620--11652 Score: 57 Period size: 6 Copynumber: 5.5 Consensus size: 6 11610 AAAGCAAAGC * 11620 AAATCT AAATCT AAATCT AAATCC AAATCT AAA 1 AAATCT AAATCT AAATCT AAATCT AAATCT AAA 11653 GCAGATTATA Statistics Matches: 25, Mismatches: 2, Indels: 0 0.93 0.07 0.00 Matches are distributed among these distances: 6 25 1.00 ACGTcount: A:0.55, C:0.18, G:0.00, T:0.27 Consensus pattern (6 bp): AAATCT Found at i:11664 original size:12 final size:13 Alignment explanation

Indices: 11649--11693 Score: 74 Period size: 13 Copynumber: 3.5 Consensus size: 13 11639 AATCCAAATC 11649 TAAAGCAGATT-A 1 TAAAGCAGATTAA * 11661 TAAAGCAAATTAA 1 TAAAGCAGATTAA 11674 TAAAGCAGATTAA 1 TAAAGCAGATTAA 11687 TAAAGCA 1 TAAAGCA 11694 AACAATAATT Statistics Matches: 30, Mismatches: 2, Indels: 1 0.91 0.06 0.03 Matches are distributed among these distances: 12 10 0.33 13 20 0.67 ACGTcount: A:0.56, C:0.09, G:0.13, T:0.22 Consensus pattern (13 bp): TAAAGCAGATTAA Found at i:11700 original size:25 final size:25 Alignment explanation

Indices: 11649--11701 Score: 81 Period size: 25 Copynumber: 2.1 Consensus size: 25 11639 AATCCAAATC * 11649 TAAAGCAGATTATAAAGCAAATTAA 1 TAAAGCAGATTATAAAGCAAATCAA 11674 TAAAGCAGATTAATAAAGCAAA-CAA 1 TAAAGCAGATT-ATAAAGCAAATCAA 11699 TAA 1 TAA 11702 TTAAAAAGCA Statistics Matches: 26, Mismatches: 1, Indels: 2 0.90 0.03 0.07 Matches are distributed among these distances: 25 16 0.62 26 10 0.38 ACGTcount: A:0.58, C:0.09, G:0.11, T:0.21 Consensus pattern (25 bp): TAAAGCAGATTATAAAGCAAATCAA Found at i:17293 original size:33 final size:31 Alignment explanation

Indices: 17200--17330 Score: 134 Period size: 30 Copynumber: 4.3 Consensus size: 31 17190 CGGCCACTTG 17200 ACCGGCCATCGCAT-GG-A-CCAACCGGCCACA 1 ACCGGCCATCGCATGGGCATCC--CCGGCCACA 17230 ACCGGCCATCGCAT-GG-A-CCAACCGGCCACA 1 ACCGGCCATCGCATGGGCATCC--CCGGCCACA 17260 ACCGGCCATCGCATGGGGCATCGCCCGGCCACA 1 ACCGGCCATCGCAT-GGGCATC-CCCGGCCACA * 17293 ACCGGCCATCGCATTGGGCATCCGC-G-CACA 1 ACCGGCCATCGCA-TGGGCATCCCCGGCCACA 17323 ACCGGCCA 1 ACCGGCCA 17331 ATGGATCCTT Statistics Matches: 94, Mismatches: 1, Indels: 12 0.88 0.01 0.11 Matches are distributed among these distances: 30 56 0.60 31 1 0.01 32 4 0.04 33 30 0.32 34 2 0.02 35 1 0.01 ACGTcount: A:0.23, C:0.43, G:0.26, T:0.08 Consensus pattern (31 bp): ACCGGCCATCGCATGGGCATCCCCGGCCACA Found at i:17330 original size:30 final size:30 Alignment explanation

Indices: 17200--17306 Score: 160 Period size: 30 Copynumber: 3.5 Consensus size: 30 17190 CGGCCACTTG 17200 ACCGGCCATCGCATGGACCAACCGGCCACA 1 ACCGGCCATCGCATGGACCAACCGGCCACA 17230 ACCGGCCATCGCATGGACCAACCGGCCACA 1 ACCGGCCATCGCATGGACCAACCGGCCACA * ** 17260 ACCGGCCATCGCATGGGGCATCGCCCGGCCACA 1 ACCGGCCATCGCAT--GG-ACCAACCGGCCACA 17293 ACCGGCCATCGCAT 1 ACCGGCCATCGCAT 17307 TGGGCATCCG Statistics Matches: 71, Mismatches: 3, Indels: 3 0.92 0.04 0.04 Matches are distributed among these distances: 30 44 0.62 32 2 0.03 33 25 0.35 ACGTcount: A:0.23, C:0.43, G:0.25, T:0.08 Consensus pattern (30 bp): ACCGGCCATCGCATGGACCAACCGGCCACA Found at i:21199 original size:36 final size:36 Alignment explanation

Indices: 21079--21204 Score: 108 Period size: 36 Copynumber: 3.5 Consensus size: 36 21069 CGCTACGTCA ** * * * * 21079 ACCCTGAATTAAGTTCTTCATTGACCCGAATTAAAT 1 ACCCTGAATTAAGCCCTTTATTGACCCTACTTAATT *** * ** * 21115 ACCCTGAATTAAATTCTTTATTGGCTTTACATAATT 1 ACCCTGAATTAAGCCCTTTATTGACCCTACTTAATT * * 21151 ACCCTAAATTAAGCCCTTTATTGACGCTACTTAATT 1 ACCCTGAATTAAGCCCTTTATTGACCCTACTTAATT 21187 ACCCTGAATTAAGTCCCT 1 ACCCTGAATTAAG-CCCT 21205 GACTTGACTT Statistics Matches: 71, Mismatches: 18, Indels: 1 0.79 0.20 0.01 Matches are distributed among these distances: 36 67 0.94 37 4 0.06 ACGTcount: A:0.31, C:0.23, G:0.10, T:0.37 Consensus pattern (36 bp): ACCCTGAATTAAGCCCTTTATTGACCCTACTTAATT Found at i:21220 original size:32 final size:32 Alignment explanation

Indices: 21172--21250 Score: 124 Period size: 32 Copynumber: 2.5 Consensus size: 32 21162 AGCCCTTTAT * 21172 TGACGCTACTTAATTACCCTGAATTAAGTCCC 1 TGACTCTACTTAATTACCCTGAATTAAGTCCC * 21204 TGACT-TGACTTAATTACCCTGAGTTAAGTCCC 1 TGACTCT-ACTTAATTACCCTGAATTAAGTCCC 21236 TGACTCTACTTAATT 1 TGACTCTACTTAATT 21251 TCCTTCCCTG Statistics Matches: 43, Mismatches: 2, Indels: 4 0.88 0.04 0.08 Matches are distributed among these distances: 31 1 0.02 32 41 0.95 33 1 0.02 ACGTcount: A:0.27, C:0.25, G:0.13, T:0.35 Consensus pattern (32 bp): TGACTCTACTTAATTACCCTGAATTAAGTCCC Found at i:21269 original size:37 final size:37 Alignment explanation

Indices: 21188--21347 Score: 93 Period size: 37 Copynumber: 4.4 Consensus size: 37 21178 TACTTAATTA * 21188 CCCTG-AATTAAGTCCCTGACT-TGACTTAA--T--TA 1 CCCTGAAATTAAGTCCCTGACTCT-ACTTAATTTCCTT * 21220 CCCTG-AGTTAAGTCCCTGACTCTACTTAATTTCCTT 1 CCCTGAAATTAAGTCCCTGACTCTACTTAATTTCCTT * * ** * 21256 CCCTGAAATTAAGTGCTTTTC-CTTACCTAATTTCCTT 1 CCCTGAAATTAAGTCCCTGACTC-TACTTAATTTCCTT * * * * * 21293 CCTTGAAATTAAGTATGTGCTTTACTTTACTTAATTTCCTT 1 CCCTGAAATT-A--A-GTCCCTGACTCTACTTAATTTCCTT * 21334 CCTTGAAATTAAGT 1 CCCTGAAATTAAGT 21348 TTGTGCTTTA Statistics Matches: 104, Mismatches: 12, Indels: 19 0.77 0.09 0.14 Matches are distributed among these distances: 32 26 0.25 33 1 0.01 34 1 0.01 36 7 0.07 37 34 0.33 38 2 0.02 40 2 0.02 41 31 0.30 ACGTcount: A:0.24, C:0.24, G:0.11, T:0.41 Consensus pattern (37 bp): CCCTGAAATTAAGTCCCTGACTCTACTTAATTTCCTT Found at i:21313 original size:41 final size:41 Alignment explanation

Indices: 21246--21601 Score: 551 Period size: 41 Copynumber: 8.8 Consensus size: 41 21236 TGACTCTACT * * * 21246 TAATTTCCTTCCCTGAAATTAA----GTGCTTTTCCTTACC 1 TAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACC * * 21283 TAATTTCCTTCCTTGAAATTAAGTATGTGCTTTACTTTACT 1 TAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACC * * * 21324 TAATTTCCTTCCTTGAAATTAAGTTTGTGCTTTAATTTACT 1 TAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACC * 21365 TAATTTCCTTCGTTGAAATTAAGTCTGTGCTTTACTTTACC 1 TAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACC * * 21406 TAATTTCCTACCTTGAAATTAAGTCTGTGCTTTACTTTACT 1 TAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACC * 21447 TAATTTCCTTCCTTGAAATTAAGTCTATGCTCTT-CTTTACC 1 TAATTTCCTTCCTTGAAATTAAGTCTGTGCT-TTACTTTACC * 21488 TAATTTCCTTCCTTGAAATTAAGTTTGTGCTTTACTTTACC 1 TAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACC 21529 TAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACC 1 TAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACC 21570 TAATTTCCTTCCTTGAAATTAAGTCTGTGCTT 1 TAATTTCCTTCCTTGAAATTAAGTCTGTGCTT 21602 GTCTGTTTTT Statistics Matches: 294, Mismatches: 19, Indels: 8 0.92 0.06 0.02 Matches are distributed among these distances: 37 21 0.07 40 2 0.01 41 269 0.91 42 2 0.01 ACGTcount: A:0.23, C:0.20, G:0.10, T:0.47 Consensus pattern (41 bp): TAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACC Found at i:21660 original size:123 final size:118 Alignment explanation

Indices: 21254--21656 Score: 433 Period size: 123 Copynumber: 3.3 Consensus size: 118 21244 CTTAATTTCC * * 21254 TTCCCTGAAATTAAGTGCTTTTC-C--TTACCTAATTTCCTTCCTTGAAATTAAGTATGTGCTTT 1 TTCCTTGAAATTAAGT-CTTTTCTCTTTTACCTAATTTCCTTCCTTGAAATTAAGTCTGTGCTTT * * 21316 ACTTTACTTAATTTCCTTCCTTGAAATTAAGTTTGTGCTT-TAATTTACTTAAT 65 ACTTTACTTAATTTCCTTCCTTGAAATTAAGTCTGTGCTTCTTATTTACTTAAT * * * * 21369 TTCCTTCGTTGAAATTAAGTCTGTGCTTTACTTTACCTAATTTCCTACCTTGAAATTAAGTCTGT 1 TT-C--C-TTGAAATTAAGTCTTTTCTCT--TTTACCTAATTTCCTTCCTTGAAATTAAGTCTGT * * * 21434 GCTTTACTTTACTTAATTTCCTTCCTTGAAATTAAGTCTATGC-TCTTCTTTACCTAATTT 60 GCTTTACTTTACTTAATTTCCTTCCTTGAAATTAAGTCTGTGCTTCTTATTTACTTAA--T * * 21494 CCTTCCTTGAAATTAAGT-TTGTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCTGTG 1 --TTCCTTGAAATTAAGTCTT-TTCTCT--TTTACCTAATTTCCTTCCTTGAAATTAAGTCTGTG * * 21558 CTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCTGTGCTTGTCTGTTTTTACTTAAT 61 CTTTACTTTACTTAATTTCCTTCCTTGAAATTAAGTCTGTGC-T-TCT-TATTTACTTAAT * * 21619 TTCCATG-AATTAAGTCTTTTACTGCTTTTACTTAATTT 1 TTCCTTGAAATTAAGTCTTTT-CT-CTTTTACCTAATTT 21657 TCCTGAATTA Statistics Matches: 245, Mismatches: 21, Indels: 37 0.81 0.07 0.12 Matches are distributed among these distances: 115 2 0.01 116 1 0.00 118 5 0.02 119 11 0.04 122 22 0.09 123 185 0.76 124 2 0.01 125 2 0.01 126 4 0.02 127 11 0.04 ACGTcount: A:0.23, C:0.19, G:0.10, T:0.48 Consensus pattern (118 bp): TTCCTTGAAATTAAGTCTTTTCTCTTTTACCTAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTA CTTTACTTAATTTCCTTCCTTGAAATTAAGTCTGTGCTTCTTATTTACTTAAT Found at i:21676 original size:37 final size:37 Alignment explanation

Indices: 21608--22991 Score: 513 Period size: 37 Copynumber: 36.9 Consensus size: 37 21598 GCTTGTCTGT * * 21608 TTTTACTTAATTTCCATGAATTAAGT-CTTTTACTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * * 21644 TTTTACTTAATTTTCCTGAATTAACTCATTTTACTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * ** * 21681 TTTAACTTAATTACCGTGAATTAAGTCCTTTAGTTGT 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * 21718 TTTTACTTAATTTCCCTGAATCAAGTCCTTTAACTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * 21755 TTTTACATAATTACCCTGAATTAAGTCCTTTGACTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * 21792 TGTTACTTAATTACCATGAATTAAGTCCTTTAACTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * 21829 TTTTATTTAATTACCCTGAATTAAGTCCTTTAACTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * 21866 TGTTACTTAATTACCATGAATTAAGTCCTTTAACTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * 21903 TTTTACTTAATTTCCCTGAATTAAGCCCTTTAATTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * 21940 TTTTACTTAATTTCCCTAAATTAAGCCCTTT-ATTG- 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * * * 21975 TTTTACTTAATCT-CTTGTTAGATTAAGTTCTTT-ATTGA 1 TTTTACTTAATTTCCCTG--A-ATTAAGTCCTTTAACTGC * * * * 22013 TTCTACTTAATTACCCTGAATTAAGTTCTTT-ATTGAC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTG-C *** * * * * 22050 -CCGACTTAATTACCCTGAATTAAATTCTTT-ATTGGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACT-GC * * * * 22086 -TTTACATAATTACCCTGAATGAAGCCCTTTATTAAC-GC 1 TTTTACTTAATTTCCCTGAATTAAGTCC--T-TTAACTGC * 22124 ---TACTTAATTACCCTGAATTAAGTCC-----CTGAC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTG-C * * * * 22154 -TTGACTTAATTACCTTGAATTAAGTCC-CTAACT-C 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * *** * 22188 TACTAAATTTGCTTCCCTGAAATTAAGTGCTTT---T-C 1 T-TTTACTTAATTTCCCTG-AATTAAGTCCTTTAACTGC * * * *** * 22223 -TTTACCTAATTTCCTTCCTTAAAATTAAGT-ATGTTCTTTAC 1 TTTTACTTAATTT-C--CC-T-GAATTAAGTCCT-TTAACTGC * * * 22264 -ATTACTTAATTTTCTTCCTTGAAATTAAGT--TTGT-GCT-T 1 TTTTACTTAA-TTTC--CC-TG-AATTAAGTCCTT-TAACTGC * * * * * 22302 TACTTTACTTAATTTTCTTCCTTCAAATTTAGT-CTGT-GCT-T 1 T--TTTACTTAA-TTTC--CC-T-GAATTAAGTCCTTTAACTGC * 22343 TACTTTACCTAATTTCCTACCATGAAATTAAGT-C--T-A-TGC 1 T--TTTACTTAATTT-C--CC-TG-AATTAAGTCCTTTAACTGC * * * * 22382 TTTACATTACTTAATTTCCTTCCTTGAAATTAAGT-ATGT-GCT-T 1 -TT---TTACTTAATTT-C--CC-TG-AATTAAGTCCTTTAACTGC * * * * 22425 TACTTTACCTAATTTCCTTCCTTGAAATTAAGT-CTGT-GCT-T 1 T--TTTACTTAATTT-C--CC-TG-AATTAAGTCCTTTAACTGC * * * 22466 TACTTTACCTAATTTCCTTCCTTGAAATTAAGT--TTGT-TCT-T 1 T--TTTACTTAATTT-C--CC-TG-AATTAAGTCCTT-TAACTGC * * ** ** 22507 TTCCTTACCTAATTTCCTTCCTTGAAATTAAGTCAGTGCTTGTCTAT 1 TT--TTACTTAATTT-C--CC-TG-AATTAAGTC-CT--TTAACTGC * * 22554 TTTTACTTAATTTCCATGAATTAAGT-CTTTTACTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * 22590 TTTTACTTAATTTTCCTGAATTAAGTCATTTTACTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * 22627 TTTTACTTAATTTCCATGAATTAAGTCCTTTAGCTGT 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * 22664 TTTTACTTAATTTCCCTGAATCAAGTCCTTTAACTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * 22701 TTTGACCTAATTACCCTGAATTAAGTCCTTTGAA-TGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTT-AACTGC * * * 22738 TGTTACTT-ATATACCATGAATTAAGTCCTTTAACTGC 1 TTTTACTTAAT-TTCCCTGAATTAAGTCCTTTAACTGC * * * 22775 TTTTACTTAATTACCCTGAATTAAGTCCTTTGACTGA 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * * 22812 TGTTACTTAATTACCATGAATTAAGTCCTTTAATTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * * 22849 TTTTATTTAATTTCCCTGAATTAAGCCCTTTAATTGC 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC * * 22886 TTTTACTTAATTTCCCTGAATTAAG-CTCTTTTATTG- 1 TTTTACTTAATTTCCCTGAATTAAGTC-CTTTAACTGC * ** * * * * 22922 TTTTACTTAATCTCTTTTTAGATTAAGTTCTTT-ATTGA 1 TTTTACTTAATTTC-CCTGA-ATTAAGTCCTTTAACTGC * * * 22960 TTCTACTTAATTACCCTGAATTAAGTTCTTTA 1 TTTTACTTAATTTCCCTGAATTAAGTCCTTTA 22992 TTGATCCGAC Statistics Matches: 1104, Mismatches: 169, Indels: 149 0.78 0.12 0.10 Matches are distributed among these distances: 28 1 0.00 29 1 0.00 30 1 0.00 32 23 0.02 33 5 0.00 34 4 0.00 35 14 0.01 36 188 0.17 37 562 0.51 38 42 0.04 39 9 0.01 40 17 0.02 41 208 0.19 42 6 0.01 43 1 0.00 44 4 0.00 45 11 0.01 46 4 0.00 47 3 0.00 ACGTcount: A:0.26, C:0.19, G:0.09, T:0.46 Consensus pattern (37 bp): TTTTACTTAATTTCCCTGAATTAAGTCCTTTAACTGC Found at i:21685 original size:18 final size:18 Alignment explanation

Indices: 21635--21692 Score: 53 Period size: 19 Copynumber: 3.1 Consensus size: 18 21625 GAATTAAGTC * 21635 TTTTACTGCTTTTACTTAA 1 TTTTACTGCTTTAAC-TAA * ** * 21654 TTTTCCTGAATTAACTCA 1 TTTTACTGCTTTAACTAA 21672 TTTTACTGCTTTAACTTAA 1 TTTTACTGCTTTAAC-TAA 21691 TT 1 TT 21693 ACCGTGAATT Statistics Matches: 29, Mismatches: 9, Indels: 2 0.73 0.22 0.05 Matches are distributed among these distances: 18 14 0.48 19 15 0.52 ACGTcount: A:0.24, C:0.17, G:0.05, T:0.53 Consensus pattern (18 bp): TTTTACTGCTTTAACTAA Found at i:22097 original size:72 final size:72 Alignment explanation

Indices: 21996--22144 Score: 201 Period size: 72 Copynumber: 2.1 Consensus size: 72 21986 CTCTTGTTAG * * * ** * 21996 ATTAAGTTCTTTATTGATTCTACTTAATTACCCTGAATTAAGTTCTTTATTGACCCGACTTAATT 1 ATTAAATTCTTTATTGATTCTACATAATTACCCTGAATGAAGCCCTTTATTAACCCGACTTAATT 22061 ACCCTGA 66 ACCCTGA * * * 22068 ATTAAATTCTTTATTGGCTT-TACATAATTACCCTGAATGAAGCCCTTTATTAACGCTACTTAAT 1 ATTAAATTCTTTATT-GATTCTACATAATTACCCTGAATGAAGCCCTTTATTAACCCGACTTAAT 22132 TACCCTGA 65 TACCCTGA 22140 ATTAA 1 ATTAA 22145 GTCCCTGACT Statistics Matches: 67, Mismatches: 9, Indels: 2 0.86 0.12 0.03 Matches are distributed among these distances: 72 64 0.96 73 3 0.04 ACGTcount: A:0.30, C:0.19, G:0.09, T:0.41 Consensus pattern (72 bp): ATTAAATTCTTTATTGATTCTACATAATTACCCTGAATGAAGCCCTTTATTAACCCGACTTAATT ACCCTGA Found at i:22281 original size:41 final size:41 Alignment explanation

Indices: 22214--22547 Score: 461 Period size: 41 Copynumber: 8.1 Consensus size: 41 22204 CTGAAATTAA * * * 22214 GTGCTTTTCTTTACCTAATTTCCTTCCTTAAAATTAAGTAT 1 GTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCT * * * * * 22255 GTTCTTTACATTACTTAATTTTCTTCCTTGAAATTAAGTTT 1 GTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCT * * * * 22296 GTGCTTTACTTTACTTAATTTTCTTCCTTCAAATTTAGTCT 1 GTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCT * * 22337 GTGCTTTACTTTACCTAATTTCCTACCATGAAATTAAGTCT 1 GTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCT * * * * 22378 ATGCTTTACATTACTTAATTTCCTTCCTTGAAATTAAGTAT 1 GTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCT 22419 GTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCT 1 GTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCT * 22460 GTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTTT 1 GTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCT * * * * 22501 GTTCTTTTCCTTACCTAATTTCCTTCCTTGAAATTAAGTCA 1 GTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCT 22542 GTGCTT 1 GTGCTT 22548 GTCTATTTTT Statistics Matches: 258, Mismatches: 35, Indels: 0 0.88 0.12 0.00 Matches are distributed among these distances: 41 258 1.00 ACGTcount: A:0.23, C:0.20, G:0.09, T:0.48 Consensus pattern (41 bp): GTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCT Found at i:22910 original size:946 final size:947 Alignment explanation

Indices: 21079--23074 Score: 3476 Period size: 946 Copynumber: 2.1 Consensus size: 947 21069 CGCTACGTCA * * * 21079 ACCCTGAATTAAGTTCTTCATTGACCCGAATTAAATACCCTGAATTAAATTCTTTATTGGCTTTA 1 ACCCTGAATTAAGTTCTTTATTGACCCGACTTAATTACCCTGAATTAAATTCTTTATTGGCTTTA * * 21144 CATAATTACCCTAAATTAAGCCCTTTATTGACGCTACTTAATTACCCTGAATTAAGTCCCTGACT 66 CATAATTACCCTGAATGAAGCCCTTTATTGACGCTACTTAATTACCCTGAATTAAGTCCCTGACT * * * 21209 TGACTTAATTACCCTGAGTTAAGTCCCTGACTCTACTTAATTTCCTTCCCTGAAATTAAGTGCTT 131 TGACTTAATTACCCTGAATTAAGTCCCTAACTCTACTAAATTTCCTTCCCTGAAATTAAGTGCTT * * 21274 TTCCTTACCTAATTTCCTTCCTTGAAATTAAGTATGTGCTTTACTTTACTTAATTTCCTTCCTTG 196 TTCCTTACCTAATTTCCTTCCTTAAAATTAAGTATGTGCTTTACATTACTTAATTTCCTTCCTTG * * 21339 AAATTAAGTTTGTGCTTTAATTTACTTAATTTCCTTCGTTGAAATTAAGTCTGTGCTTTACTTTA 261 AAATTAAGTTTGTGCTTTAATTTACTTAATTTCCTTCCTTCAAATTAAGTCTGTGCTTTACTTTA * * * 21404 CCTAATTTCCTACCTTGAAATTAAGTCTGTGCTTTACTTTACTTAATTTCCTTCCTTGAAATTAA 326 CCTAATTTCCTACCATGAAATTAAGTCTATGCTTTACATTACTTAATTTCCTTCCTTGAAATTAA * * 21469 GTCTATGCTCTTCTTTACCTAATTTCCTTCCTTGAAATTAAGTTTGTGCTTTACTTTACCTAATT 391 GTATATGCTCTTCTTTACCTAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACCTAATT * * 21534 TCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCTGTG 456 TCCTTCCTTGAAATTAAGTCTGTGCTTTACCTTACCTAATTTCCTTCCTTGAAATTAAGTCAGTG * 21599 CTTGTCTGTTTTTACTTAATTTCCATGAATTAAGTCTTTTACTGCTTTTACTTAATTTTCCTGAA 521 CTTGTCTATTTTTACTTAATTTCCATGAATTAAGTCTTTTACTGCTTTTACTTAATTTTCCTGAA * * 21664 TTAACTCATTTTACTGCTTTAACTTAATTACCGTGAATTAAGTCCTTTAGTTGTTTTTACTTAAT 586 TTAACTCATTTTACTGCTTTAACTTAATTACCATGAATTAAGTCCTTTAGCTGTTTTTACTTAAT * * 21729 TTCCCTGAATCAAGTCCTTTAACTGCTTTTACATAATTACCCTGAATTAAGTCCTTTGACTGCTG 651 TTCCCTGAATCAAGTCCTTTAACTGCTTTGACATAATTACCCTGAATTAAGTCCTTTGAATGCTG * 21794 TTACTTAATTACCATGAATTAAGTCCTTTAACTGCTTTTATTTAATTACCCTGAATTAAGTCCTT 716 TTACTTAATTACCATGAATTAAGTCCTTTAACTGCTTTTACTTAATTACCCTGAATTAAGTCCTT * 21859 TAACTGCTGTTACTTAATTACCATGAATTAAGTCCTTTAACTGCTTTTACTTAATTTCCCTGAAT 781 TAACTGATGTTACTTAATTACCATGAATTAAGTCCTTTAACTGCTTTTACTTAATTTCCCTGAAT 21924 TAAGCCCTTTAATTGCTTTTACTTAATTTCCCTAAATTAAGC-CCTTTATTGTTTTACTTAATCT 846 TAAGCCCTTTAATTGCTTTTACTTAATTTCCCTAAATTAAGCTCCTTTATTGTTTTACTTAATCT 21988 CTTGTTAGATTAAGTTCTTTATTGATTCTACTTAATT 911 CTTGTTAGATTAAGTTCTTTATTGATTCTACTTAATT 22025 ACCCTGAATTAAGTTCTTTATTGACCCGACTTAATTACCCTGAATTAAATTCTTTATTGGCTTTA 1 ACCCTGAATTAAGTTCTTTATTGACCCGACTTAATTACCCTGAATTAAATTCTTTATTGGCTTTA * 22090 CATAATTACCCTGAATGAAGCCCTTTATTAACGCTACTTAATTACCCTGAATTAAGTCCCTGACT 66 CATAATTACCCTGAATGAAGCCCTTTATTGACGCTACTTAATTACCCTGAATTAAGTCCCTGACT * * 22155 TGACTTAATTACCTTGAATTAAGTCCCTAACTCTACTAAATTTGCTTCCCTGAAATTAAGTGCTT 131 TGACTTAATTACCCTGAATTAAGTCCCTAACTCTACTAAATTTCCTTCCCTGAAATTAAGTGCTT * * * 22220 TTCTTTACCTAATTTCCTTCCTTAAAATTAAGTATGTTCTTTACATTACTTAATTTTCTTCCTTG 196 TTCCTTACCTAATTTCCTTCCTTAAAATTAAGTATGTGCTTTACATTACTTAATTTCCTTCCTTG * * * 22285 AAATTAAGTTTGTGCTTTACTTTACTTAATTTTCTTCCTTCAAATTTAGTCTGTGCTTTACTTTA 261 AAATTAAGTTTGTGCTTTAATTTACTTAATTTCCTTCCTTCAAATTAAGTCTGTGCTTTACTTTA 22350 CCTAATTTCCTACCATGAAATTAAGTCTATGCTTTACATTACTTAATTTCCTTCCTTGAAATTAA 326 CCTAATTTCCTACCATGAAATTAAGTCTATGCTTTACATTACTTAATTTCCTTCCTTGAAATTAA * 22415 GTATGTGCT-TTACTTTACCTAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACCTAAT 391 GTATATGCTCTT-CTTTACCTAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACCTAAT * * * 22479 TTCCTTCCTTGAAATTAAGTTTGTTCTTTTCCTTACCTAATTTCCTTCCTTGAAATTAAGTCAGT 455 TTCCTTCCTTGAAATTAAGTCTGTGCTTTACCTTACCTAATTTCCTTCCTTGAAATTAAGTCAGT 22544 GCTTGTCTATTTTTACTTAATTTCCATGAATTAAGTCTTTTACTGCTTTTACTTAATTTTCCTGA 520 GCTTGTCTATTTTTACTTAATTTCCATGAATTAAGTCTTTTACTGCTTTTACTTAATTTTCCTGA * * * 22609 ATTAAGTCATTTTACTGCTTTTACTTAATTTCCATGAATTAAGTCCTTTAGCTGTTTTTACTTAA 585 ATTAACTCATTTTACTGCTTTAACTTAATTACCATGAATTAAGTCCTTTAGCTGTTTTTACTTAA * 22674 TTTCCCTGAATCAAGTCCTTTAACTGCTTTGACCTAATTACCCTGAATTAAGTCCTTTGAATGCT 650 TTTCCCTGAATCAAGTCCTTTAACTGCTTTGACATAATTACCCTGAATTAAGTCCTTTGAATGCT 22739 GTTACTT-ATATACCATGAATTAAGTCCTTTAACTGCTTTTACTTAATTACCCTGAATTAAGTCC 715 GTTACTTAAT-TACCATGAATTAAGTCCTTTAACTGCTTTTACTTAATTACCCTGAATTAAGTCC * * * 22803 TTTGACTGATGTTACTTAATTACCATGAATTAAGTCCTTTAATTGCTTTTATTTAATTTCCCTGA 779 TTTAACTGATGTTACTTAATTACCATGAATTAAGTCCTTTAACTGCTTTTACTTAATTTCCCTGA * * 22868 ATTAAGCCCTTTAATTGCTTTTACTTAATTTCCCTGAATTAAGCTCTTTTATTGTTTTACTTAAT 844 ATTAAGCCCTTTAATTGCTTTTACTTAATTTCCCTAAATTAAGCTCCTTTATTGTTTTACTTAAT * 22933 CTCTTTTTAGATTAAGTTCTTTATTGATTCTACTTAATT 909 CTCTTGTTAGATTAAGTTCTTTATTGATTCTACTTAATT * * ** 22972 ACCCTGAATTAAGTTCTTTATTGATCCGACCTAATTAAACTGAATTAAATTCTTTATTGGCTTTA 1 ACCCTGAATTAAGTTCTTTATTGACCCGACTTAATTACCCTGAATTAAATTCTTTATTGGCTTTA 23037 CATAATTACCCTGAATGAAGCCCTTTATTGACGCTACT 66 CATAATTACCCTGAATGAAGCCCTTTATTGACGCTACT 23075 AGGTTCAATG Statistics Matches: 993, Mismatches: 54, Indels: 5 0.94 0.05 0.00 Matches are distributed among these distances: 945 4 0.00 946 834 0.84 947 155 0.16 ACGTcount: A:0.26, C:0.20, G:0.10, T:0.45 Consensus pattern (947 bp): ACCCTGAATTAAGTTCTTTATTGACCCGACTTAATTACCCTGAATTAAATTCTTTATTGGCTTTA CATAATTACCCTGAATGAAGCCCTTTATTGACGCTACTTAATTACCCTGAATTAAGTCCCTGACT TGACTTAATTACCCTGAATTAAGTCCCTAACTCTACTAAATTTCCTTCCCTGAAATTAAGTGCTT TTCCTTACCTAATTTCCTTCCTTAAAATTAAGTATGTGCTTTACATTACTTAATTTCCTTCCTTG AAATTAAGTTTGTGCTTTAATTTACTTAATTTCCTTCCTTCAAATTAAGTCTGTGCTTTACTTTA CCTAATTTCCTACCATGAAATTAAGTCTATGCTTTACATTACTTAATTTCCTTCCTTGAAATTAA GTATATGCTCTTCTTTACCTAATTTCCTTCCTTGAAATTAAGTCTGTGCTTTACTTTACCTAATT TCCTTCCTTGAAATTAAGTCTGTGCTTTACCTTACCTAATTTCCTTCCTTGAAATTAAGTCAGTG CTTGTCTATTTTTACTTAATTTCCATGAATTAAGTCTTTTACTGCTTTTACTTAATTTTCCTGAA TTAACTCATTTTACTGCTTTAACTTAATTACCATGAATTAAGTCCTTTAGCTGTTTTTACTTAAT TTCCCTGAATCAAGTCCTTTAACTGCTTTGACATAATTACCCTGAATTAAGTCCTTTGAATGCTG TTACTTAATTACCATGAATTAAGTCCTTTAACTGCTTTTACTTAATTACCCTGAATTAAGTCCTT TAACTGATGTTACTTAATTACCATGAATTAAGTCCTTTAACTGCTTTTACTTAATTTCCCTGAAT TAAGCCCTTTAATTGCTTTTACTTAATTTCCCTAAATTAAGCTCCTTTATTGTTTTACTTAATCT CTTGTTAGATTAAGTTCTTTATTGATTCTACTTAATT Done.