Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01010526.1 Corchorus capsularis cultivar CVL-1 contig10547, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 42010
ACGTcount: A:0.34, C:0.18, G:0.17, T:0.31


Found at i:1423 original size:43 final size:43

Alignment explanation

Indices: 1362--1448 Score: 174 Period size: 43 Copynumber: 2.0 Consensus size: 43 1352 CCTGATTTTA 1362 GTGGTTGAGTTTACCAACGGGTGGAGCAGTGTAGCGAGGACTC 1 GTGGTTGAGTTTACCAACGGGTGGAGCAGTGTAGCGAGGACTC 1405 GTGGTTGAGTTTACCAACGGGTGGAGCAGTGTAGCGAGGACTC 1 GTGGTTGAGTTTACCAACGGGTGGAGCAGTGTAGCGAGGACTC 1448 G 1 G 1449 AACTTGAGAC Statistics Matches: 44, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 43 44 1.00 ACGTcount: A:0.21, C:0.16, G:0.40, T:0.23 Consensus pattern (43 bp): GTGGTTGAGTTTACCAACGGGTGGAGCAGTGTAGCGAGGACTC Found at i:3021 original size:147 final size:150 Alignment explanation

Indices: 2861--3139 Score: 431 Period size: 147 Copynumber: 1.9 Consensus size: 150 2851 AATTTGGAAA * * * 2861 AAAATTGAAAAAACGATGTTAGAATCGTGAAAAGCCCGCCAATATTTTTAGCATTGAATTATATA 1 AAAATTGAAAAAACGATGTTAGAATCATGAAAAGCCCACAAATATTTTTAGCATTGAATTATATA * 2926 TTTTTTCTG-GATATTGTGGCAAAAAATTAAGAAAAA-CTTATCGAG-CAGTTTTTAGACGAAAT 66 TTTTTTCTGAG-TATTGTGGAAAAAAATTAAGAAAAACCTTATCGAGTCAGTTTTTAGACGAAAT 2988 CGTGTATAATCCATCAAAAAG 130 CGTGTATAATCCATCAAAAAG * * 3009 AAAA-TGAAAAAACGATGTTAGAATCATGAAAAGCCCATAAATATTTTTGGCATTGAATTATATA 1 AAAATTGAAAAAACGATGTTAGAATCATGAAAAGCCCACAAATATTTTTAGCATTGAATTATATA * * * * 3073 TTTTTTCTGAGTATTGTGGAAAAAAATTAAGAAAAACCTTTTCGGGTCCGTTTTTAGCCGAAATC 66 TTTTTTCTGAGTATTGTGGAAAAAAATTAAGAAAAACCTTATCGAGTCAGTTTTTAGACGAAATC 3138 GT 131 GT 3140 ATACCAACCA Statistics Matches: 118, Mismatches: 10, Indels: 5 0.89 0.08 0.04 Matches are distributed among these distances: 147 88 0.75 148 12 0.10 149 18 0.15 ACGTcount: A:0.39, C:0.12, G:0.16, T:0.32 Consensus pattern (150 bp): AAAATTGAAAAAACGATGTTAGAATCATGAAAAGCCCACAAATATTTTTAGCATTGAATTATATA TTTTTTCTGAGTATTGTGGAAAAAAATTAAGAAAAACCTTATCGAGTCAGTTTTTAGACGAAATC GTGTATAATCCATCAAAAAG Found at i:3739 original size:321 final size:319 Alignment explanation

Indices: 3004--4171 Score: 1671 Period size: 320 Copynumber: 3.6 Consensus size: 319 2994 TAATCCATCA * * * * 3004 AAAAGAAAATGAAAAAACGATGTTAGAATCATGAAAAGCCCATAAATATTTTTGGCATTGAATTA 1 AAAA-AAAATGAAAAAA--ATGTTAGAATCGTGAAAAGCCCGTCAATATTTTTGACATTGAATTA * * * * 3069 TATATTTTTTCTGAGTATTGTGGAAAAAAATTAAGAAAAACCTTTTCGGGTCCGTTTTTAGCCGA 63 TATATTTTCTCGGAGTATTGTGGCAAAAAATTAAGAAAAACCTTTTCGGGTCAGTTTTTAGCCGA * * * * * * 3134 AATCGTATACCAACCATCACGGTTTTTGGCTAAAACACGCGTTCTGGAACCCCGACTTAAATTTG 128 AATCATGTACTAACCATCACGGTTTTTGGCTAAAA-ACGCGTTCTGGAGCCCCGACTCAATTTTG * * * * * * * * 3199 CATGAATTTTGGCACAAAGACTCCTTCAAATATCTATATTCATCCAACTAAATATCAGCCACATT 192 CATGATTTTTGACACAAAGGCTCCTTCAAATATCTGTATTCATCGAACCAACTGTCAGCCACATT * * 3264 GGATACAAGGATTTGTTTTTACTAGT-TTCTAAATCTTGTTCGATTTAATTAGAAATTAGTTCGG 257 -GATATAAGGATTTGTTTTTACTAGTATT-TGAATCTTGTTCGATTTAATTAGAAATTAGTTCGG * * 3328 AAAAAAAATTAAAAAAAAATGTTAGAATCGTGAAAAGCCCGTCAATATTTTTGACA-TAAATTAT 1 AAAAAAAA-T-GAAAAAAATGTTAGAATCGTGAAAAGCCCGTCAATATTTTTGACATTGAATTAT ** 3392 ATATTTTCTCGGAGTATTACGGCAAAAAATTAAGAAAAACCTTTTCGGGTCAGTTTTTAGCCGAA 64 ATATTTTCTCGGAGTATTGTGGCAAAAAATTAAGAAAAACCTTTTCGGGTCAGTTTTTAGCCGAA * * 3457 ATCATGTACTAACCATCACGGTTTTTGGCTAAAAACGCGTTCTAGAGCCCCGGCTCAATTTTGCA 129 ATCATGTACTAACCATCACGGTTTTTGGCTAAAAACGCGTTCTGGAGCCCCGACTCAATTTTGCA * 3522 TGATTTTTGACACAAAGGCTCCTTCAAATATCTGTAATCATCGAACCAACTGTCAGCCACATTGC 194 TGATTTTTGACACAAAGGCTCCTTCAAATATCTGTATTCATCGAACCAACTGTCAGCCACATTG- * * 3587 ATATAGGGATTTGTTTTTACGAGTATTTGAATCTTGTTTCGATTTAATTAGAAATTAGTTCGG 258 ATATAAGGATTTGTTTTTACTAGTATTTGAATCTTG-TTCGATTTAATTAGAAATTAGTTCGG * ** 3650 AAAAAAAATTAAAAAAATGTTAGAATCGTGAAAAGGTCGTCAATATTTTTGACATTGAATTATAT 1 AAAAAAAATGAAAAAAATGTTAGAATCGTGAAAAGCCCGTCAATATTTTTGACATTGAATTATAT 3715 ATTTTCTCGGAGTATTGTGGCAAAAAATTAAGAAAAACCTTTTCGGGTCAGTTTTTAGCCGAAAT 66 ATTTTCTCGGAGTATTGTGGCAAAAAATTAAGAAAAACCTTTTCGGGTCAGTTTTTAGCCGAAAT 3780 CATGTACTAA-CATCACGGTTTTTGGCTAAAAACGCGTTCTGGAGCCCCGACTCAATTTTGCATG 131 CATGTACTAACCATCACGGTTTTTGGCTAAAAACGCGTTCTGGAGCCCCGACTCAATTTTGCATG * * * 3844 ATTTTCGACACAAAGGCTCCTTCAAATATCTGTTTTCATCGAAGCAACTGTCAGCCACATTTGAT 196 ATTTTTGACACAAAGGCTCCTTCAAATATCTGTATTCATCGAACCAACTGTCAGCCACA-TTGAT * * 3909 ATAAGGATTTATTTTTACTAGTATTTGAATCTTGTTCGATTTAATTAGAAATTAATTCGG 260 ATAAGGATTTGTTTTTACTAGTATTTGAATCTTGTTCGATTTAATTAGAAATTAGTTCGG * * * * * * 3969 -AAAAAAATGAAAAATGATATTAGAAGCGTGAAAAGCGCGTCAATCTTTTTGGCATTGAATTATA 1 AAAAAAAATGAAAAA-AATGTTAGAATCGTGAAAAGCCCGTCAATATTTTTGACATTGAATTATA * * * * 4033 TAATTTT-TCAGAGTATTGTAGGCAAAAAATTAAGAAAAACCTTTTCAGTTTAGTTTTTAGCCGA 65 T-ATTTTCTCGGAGTATTGT-GGCAAAAAATTAAGAAAAACCTTTTCGGGTCAGTTTTTAGCCGA * ** * 4097 AATCGTGTTTTAACCATCACGGTTTTTGGCTAAAAAACGCGTTCTGGAGCCCCGGCTCAATTTTG 128 AATCATGTACTAACCATCACGGTTTTTGGCT-AAAAACGCGTTCTGGAGCCCCGACTCAATTTTG 4162 CATGATTTTT 192 CATGATTTTT 4172 TGCGTTGAAA Statistics Matches: 766, Mismatches: 66, Indels: 26 0.89 0.08 0.03 Matches are distributed among these distances: 318 13 0.02 319 79 0.10 320 239 0.31 321 212 0.28 322 174 0.23 323 38 0.05 324 5 0.01 325 6 0.01 ACGTcount: A:0.34, C:0.16, G:0.17, T:0.34 Consensus pattern (319 bp): AAAAAAAATGAAAAAAATGTTAGAATCGTGAAAAGCCCGTCAATATTTTTGACATTGAATTATAT ATTTTCTCGGAGTATTGTGGCAAAAAATTAAGAAAAACCTTTTCGGGTCAGTTTTTAGCCGAAAT CATGTACTAACCATCACGGTTTTTGGCTAAAAACGCGTTCTGGAGCCCCGACTCAATTTTGCATG ATTTTTGACACAAAGGCTCCTTCAAATATCTGTATTCATCGAACCAACTGTCAGCCACATTGATA TAAGGATTTGTTTTTACTAGTATTTGAATCTTGTTCGATTTAATTAGAAATTAGTTCGG Found at i:3955 original size:641 final size:646 Alignment explanation

Indices: 3004--4171 Score: 1766 Period size: 641 Copynumber: 1.8 Consensus size: 646 2994 TAATCCATCA * 3004 AAAAGAAAATGAAAAAACGATGTTAGAATCATGAAAAGCCCATAAATATTTTTGGCATTGAATTA 1 AAAAGAAAATGAAAAAAC-ATGTTAGAATCATGAAAAGCCCATAAATATTTTTGACATTGAATTA * * * 3069 TATATTTTTTCTGAGTATTGTGGAAAAAAATTAAGAAAAACCTTTTCGGGTCCGTTTTTAGCCGA 65 TATATTTTCTCGGAGTATTGTGGAAAAAAATTAAGAAAAACCTTTTCGGGTCAGTTTTTAGCCGA * * 3134 AATCGTATACCAACCATCACGGTTTTTGGCTAAAACACGCGTTCTGGAACCCCGACTTAAATTTG 130 AATCATATACCAACCATCACGGTTTTTGGCTAAAACACGCGTTCTGGAACCCCGACTCAAATTTG * 3199 CATGAATTTTGGCACAAAGACTCCTTCAAATATCTATATTCATCCAACTAAATATCAGCCACATT 195 CATGAATTTTGACACAAAGACTCCTTCAAATATCTATATTCATCCAACTAAATATCAGCCACATT * * 3264 GGATACAAGGATTTGTTTTTACTAGTTTCTAAATCTTGTTCGATTTAATTAGAAATTAGTTCGGA 260 GGATACAAGGATTTATTTTTACTAGTTTCTAAATCTTGTTCGATTTAATTAGAAATTAATTCGG- * * 3329 AAAAAAATTAAAAAAAAATGTTAGAATCGTGAAAAGCCCGTCAATATTTTTGACA-TAAATTATA 324 AAAAAAA-TAAAAAAAAATATTAGAAGCGTGAAAAGCCCGTCAATATTTTTGACATTAAATTATA * * 3393 T-ATTTTCTCGGAGTA-T-TACGGCAAAAAATTAAGAAAAACCTTTTCGGGTCAGTTTTTAGCCG 388 TAATTTT-TCAGAGTATTGTA-GGCAAAAAATTAAGAAAAACCTTTTCAGGTCAGTTTTTAGCCG 3455 AAATCATGTACTAACCATCACGGTTTTTGGCT-AAAAACGCGTTCTAGAGCCCCGGCTCAATTTT 451 AAATCATGTACTAACCATCACGGTTTTTGGCTAAAAAACGCGTTCTAGAGCCCCGGCTCAATTTT 3519 GCATGATTTTTGACACAAAGGCTCCTTCAAATATCTGTAATCATCGAACCAACTGTCAGCCACAT 516 GCATGATTTTTGACACAAAGGCTCCTTCAAATATCTGTAATCATCGAACCAACTGTCAGCCACAT 3584 TGCATATAGGGATTTGTTTTTACGAGTATTTGAATCTTGTTTCGATTTAATTAGAAATTAGTTCG 581 TGCATATAGGGATTTGTTTTTACGAGTATTTGAATCTTGTTTCGATTTAATTAGAAATTAGTTCG 3649 G 646 G * * ** * * 3650 AAAA-AAAATTAAAAAA-ATGTTAGAATCGTGAAAAGGTCGTCAATATTTTTGACATTGAATTAT 1 AAAAGAAAATGAAAAAACATGTTAGAATCATGAAAAGCCCATAAATATTTTTGACATTGAATTAT * 3713 ATATTTTCTCGGAGTATTGTGGCAAAAAATTAAGAAAAACCTTTTCGGGTCAGTTTTTAGCCGAA 66 ATATTTTCTCGGAGTATTGTGGAAAAAAATTAAGAAAAACCTTTTCGGGTCAGTTTTTAGCCGAA * * * * 3778 ATCATGTACTAA-CATCACGGTTTTTGGCTAAAA-ACGCGTTCTGGAGCCCCGACTCAATTTTGC 131 ATCATATACCAACCATCACGGTTTTTGGCTAAAACACGCGTTCTGGAACCCCGACTCAAATTTGC * * * * * * 3841 ATG-ATTTTCGACACAAAGGCTCCTTCAAATATCTGTTTTCATCGAAGC-AACTGTCAGCCACAT 196 ATGAATTTT-GACACAAAGACTCCTTCAAATATCTATATTCATCCAA-CTAAATATCAGCCACAT * * * 3904 TTGATATAAGGATTTATTTTTACTAGTATT-TGAATCTTGTTCGATTTAATTAGAAATTAATTCG 259 TGGATACAAGGATTTATTTTTACTAGT-TTCTAAATCTTGTTCGATTTAATTAGAAATTAATTCG * ** * * * * 3968 GAAAAAAATGAAAAATGATATTAGAAGCGTGAAAAGCGCGTCAATCTTTTTGGCATTGAATTATA 323 GAAAAAAATAAAAAAAAATATTAGAAGCGTGAAAAGCCCGTCAATATTTTTGACATTAAATTATA * * 4033 TAATTTTTCAGAGTATTGTAGGCAAAAAATTAAGAAAAACCTTTTCAGTTTAGTTTTTAGCCGAA 388 TAATTTTTCAGAGTATTGTAGGCAAAAAATTAAGAAAAACCTTTTCAGGTCAGTTTTTAGCCGAA * ** * 4098 ATCGTGTTTTAACCATCACGGTTTTTGGCTAAAAAACGCGTTCTGGAGCCCCGGCTCAATTTTGC 453 ATCATGTACTAACCATCACGGTTTTTGGCTAAAAAACGCGTTCTAGAGCCCCGGCTCAATTTTGC 4163 ATGATTTTT 518 ATGATTTTT 4172 TGCGTTGAAA Statistics Matches: 468, Mismatches: 46, Indels: 20 0.88 0.09 0.04 Matches are distributed among these distances: 639 39 0.08 640 28 0.06 641 207 0.44 642 68 0.15 643 111 0.24 645 11 0.02 646 4 0.01 ACGTcount: A:0.34, C:0.16, G:0.17, T:0.34 Consensus pattern (646 bp): AAAAGAAAATGAAAAAACATGTTAGAATCATGAAAAGCCCATAAATATTTTTGACATTGAATTAT ATATTTTCTCGGAGTATTGTGGAAAAAAATTAAGAAAAACCTTTTCGGGTCAGTTTTTAGCCGAA ATCATATACCAACCATCACGGTTTTTGGCTAAAACACGCGTTCTGGAACCCCGACTCAAATTTGC ATGAATTTTGACACAAAGACTCCTTCAAATATCTATATTCATCCAACTAAATATCAGCCACATTG GATACAAGGATTTATTTTTACTAGTTTCTAAATCTTGTTCGATTTAATTAGAAATTAATTCGGAA AAAAATAAAAAAAAATATTAGAAGCGTGAAAAGCCCGTCAATATTTTTGACATTAAATTATATAA TTTTTCAGAGTATTGTAGGCAAAAAATTAAGAAAAACCTTTTCAGGTCAGTTTTTAGCCGAAATC ATGTACTAACCATCACGGTTTTTGGCTAAAAAACGCGTTCTAGAGCCCCGGCTCAATTTTGCATG ATTTTTGACACAAAGGCTCCTTCAAATATCTGTAATCATCGAACCAACTGTCAGCCACATTGCAT ATAGGGATTTGTTTTTACGAGTATTTGAATCTTGTTTCGATTTAATTAGAAATTAGTTCGG Found at i:4905 original size:26 final size:26 Alignment explanation

Indices: 4843--4984 Score: 169 Period size: 26 Copynumber: 5.5 Consensus size: 26 4833 CCAACATGTC * 4843 CCCTACTGAATATGTAACTATATG-G 1 CCCTACTGAATATGCAACTATATGAG * * * * 4868 GCCTATTGAATATGCAACTAAATGGG 1 CCCTACTGAATATGCAACTATATGAG * * ** 4894 CCCTATTGAATATGCAATTATATGTC 1 CCCTACTGAATATGCAACTATATGAG 4920 CCCTACTGAATATGCAACTATATGAG 1 CCCTACTGAATATGCAACTATATGAG * 4946 CCTTACTGAATATGCAACTATATGAG 1 CCCTACTGAATATGCAACTATATGAG * * 4972 CCTTAATGAATAT 1 CCCTACTGAATAT 4985 ACGTTTATAT Statistics Matches: 101, Mismatches: 15, Indels: 1 0.86 0.13 0.01 Matches are distributed among these distances: 25 20 0.20 26 81 0.80 ACGTcount: A:0.34, C:0.19, G:0.15, T:0.32 Consensus pattern (26 bp): CCCTACTGAATATGCAACTATATGAG Found at i:4956 original size:52 final size:52 Alignment explanation

Indices: 4843--7184 Score: 2110 Period size: 52 Copynumber: 46.0 Consensus size: 52 4833 CCAACATGTC * * * * * 4843 CCCTACTGAATATGTAACTATATG-GGCCTATTGAATATGCAACTAAATGGG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * ** 4894 CCCTATTGAATATGCAATTATATGTCCCCTACTGAATATGCAACTATATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * *** 4946 CCTTACTGAATATGCAACTATATGAGCCTTAATGAATATACGTTTATATG-G 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * 4997 CCC--C----TA--CAACTACATGAGCCCTACTGAATATGCACCTATATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * * 5041 CCCTACTGAATATGCAACTACATGAACTCTACTGAATATGCAACAAAATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * * 5093 CCATACTGAATATGCGACTATATGAGGCCTACTG-A-ATGCGACTACATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * 5143 CCCTACTG-A-ATG-AGACTACAAGAGCCCTACTGAATATGCAACTACAAGAG 1 CCCTACTGAATATGCA-ACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * * * 5193 -CCT--T-ACTATGCGACTACATGAGCCTTACTGAATATGCGACTACATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * * * ** 5241 CTCTACTGATTATGCGACTACATGAGCCCTACTGAATTTGGAACTATATGTC 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * ** ** 5293 CCCTACTGAATATGCAACTATATGAGCGCTACT-AGATATGCAACTGCATGTT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGA-ATATGCAACTATATGAG * * * * * * 5345 CCCAACTGAATATGAAACTACATAAGCCCTACTGAATATGCAACTACATAAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * ** * * * 5397 CGCTACTGAATAGGTAACTATATGTTCCCAATTGAATATGCGACTATATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * 5449 CCCTACTGAATATGCAACCATATG-GCCCCTACTGAAAATGCAACTACATGAG 1 CCCTACTGAATATGCAACTATATGAG-CCCTACTGAATATGCAACTATATGAG * * 5501 CCCTACTAAATATGCAACTACATGAGCCCTACTGAATATGCAACTATATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * 5553 CCATATTGAATATGCAACTACATGAGCCCAACTGAATATGCAACTATATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * ** 5605 TCTTGCTGAATATGCGTCTATATG-GCCCATACTGAATATGCAACTATATG-G 1 CCCTACTGAATATGCAACTATATGAGCCC-TACTGAATATGCAACTATATGAG * * 5656 CCCCTACTGAATATGCAACTATATGAGCCCTACTGATTATGCAACTACATGAG 1 -CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * 5709 CCCTACTGAATATGCAACTACATGAGCCCTATTGAATAAGCAAATATATATGCAACTACATGAG 1 CCCTACTGAATATGCAACTATATGAGCCC---T-ACT--G-----A-ATATGCAACTATATGAG * * * * * * * 5773 CCTTATTGAATAAGCAACTATATGAGCCATATTGAATATGTAACTACATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * * 5825 CTCTACTGAATATACAACTACATG-GACCCTACTGAATATGCAACTAAACGAG 1 CCCTACTGAATATGCAACTATATGAG-CCCTACTGAATATGCAACTATATGAG * * * * 5877 CCTTACTGAATATGCGACTATATGA-CCCACACTGAATATGCGACTATATGAG 1 CCCTACTGAATATGCAACTATATGAGCCC-TACTGAATATGCAACTATATGAG * * * * 5929 CTCTACTG-A-ATGCGACTATATGAGCCCTACCT-AATATGCGACTATATTAG 1 CCCTACTGAATATGCAACTATATGAGCCCTA-CTGAATATGCAACTATATGAG * * * 5979 CCCTACCT-AATATGCGACTATATGAGTCCTACTGAATATGCAACTACATGAG 1 CCCTA-CTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * 6031 CCCTACTGAATATGCAACTACATGAGTCTTACTGAATATGCAACTACATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * 6083 CCTTACTGAATATGCAACTACATGAGCCCTACTGAATATGCAACTATATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * 6135 CCCTACTGAATATG---C---A--A-CCCTACTGAATATGCAACTACATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * 6178 CCTTACTTAATATGCAACTACT-TGAGCCCTACTGAATACGCAACTATATGAG 1 CCCTACTGAATATGCAACTA-TATGAGCCCTACTGAATATGCAACTATATGAG * * 6230 CCCTACTGAATATGCAACTATAAG-GCCCCTACTGAATATGCAACTACATGAG 1 CCCTACTGAATATGCAACTATATGAG-CCCTACTGAATATGCAACTATATGAG * * ** 6282 CCCTACTGAATATGCAACTATACATATGAACCCTACTGAATATGCAAATATATGTT 1 CCCTACTGAATATGCAAC--T--ATATGAGCCCTACTGAATATGCAACTATATGAG * ** 6338 CGCTACTGAATATGCAACTATATGTCCCCTACTGAATATGCAACTATATG-G 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * 6389 CCCCTACTGAATATGCAACTACATGAGCCCTACTGAATATGCAACTACATGAG 1 -CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * 6442 CCCTACTGAATATACAACTACATGAGCTCTACTGAATATGCAACTACATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * 6494 CCCTACTGAATATGCAACTAAATGAGCCTTACTGAATATGCGACTATATG-G 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * * * 6545 CCCAAACTGAATATGCGACTATATGAGCCCTATTG-A-ATGCTACTACATGAT 1 CCC-TACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * 6596 CCCTAC--------CGACTATATG-GTCCCTACT-AGATATGCGACTATATGAG 1 CCCTACTGAATATGCAACTATATGAG-CCCTACTGA-ATATGCAACTATATGAG * * * * * 6640 CCCTATTG-A-ATGCTACTACATGATCCCTAC--------CGACTATATG-G 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * 6681 TCCCTACTGAATATGCGACTATATGAGCCCTACTGAATATG---C---A--A- 1 -CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * 6725 CCTTACTGAATATGCAACTATATGGGCCCTACTGAATATG---C-A-AT--- 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * 6769 -CCTATTGAATATGCATCTACATGAGCCCTACTGAATATGCAACTATATGAG 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * 6820 CCTTACTGAATATGCGACTATATG-GCCCCTACTGAATATGCAACTATA--AG 1 CCCTACTGAATATGCAACTATATGAG-CCCTACTGAATATGCAACTATATGAG * * * * 6870 TCCCATAATGAATATGCAACTACATGAGTCCTACTGAATATGCAATTATATG-G 1 -CCC-TACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * 6923 CCCCTACTGAATATGCAACTACATGAGCCCTACTGAATATGCAACTATATG-G 1 -CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG ** 6975 TCCCTACTGAATATGCAACTATATGCCCCCTACTGAATATGCAACTATATGAG 1 -CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * * * 7028 TCCTATTGAAAATGCAAACTATATGAGTCCTACTGAAAATGCAACTATAT-AT 1 CCCTACTGAATATGC-AACTATATGAGCCCTACTGAATATGCAACTATATGAG * 7080 CTCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAG 1 C-CCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG * * * * * 7133 CCCTACTGAAAATGTAACTAAAAGATGGCCCTACTGAACAT-CAACTATATGA 1 CCCTACTGAATATGCAACTATATGA--GCCCTACTGAATATGCAACTATATGA 7185 TGTAAATGAC Statistics Matches: 1895, Mismatches: 279, Indels: 232 0.79 0.12 0.10 Matches are distributed among these distances: 41 2 0.00 42 33 0.02 43 140 0.07 44 41 0.02 45 2 0.00 46 5 0.00 47 2 0.00 48 55 0.03 49 10 0.01 50 99 0.05 51 63 0.03 52 1267 0.67 53 69 0.04 54 15 0.01 55 1 0.00 56 45 0.02 58 2 0.00 60 2 0.00 61 1 0.00 63 1 0.00 64 40 0.02 ACGTcount: A:0.34, C:0.23, G:0.15, T:0.27 Consensus pattern (52 bp): CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTATATGAG Found at i:4995 original size:78 final size:78 Alignment explanation

Indices: 4843--7184 Score: 2135 Period size: 78 Copynumber: 30.7 Consensus size: 78 4833 CCAACATGTC * * * * * * 4843 CCCTACTGAATATGTAACTATATG-GGCCTATTGAATATGCAACTAAATGGGCCCTATTGAATAT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT * ** 4907 GCAATTATATGTC 66 GCAACTATATGAG * * * * 4920 CCCTACTGAATATGCAACTATATGAGCCTTACTGAATATGCAACTATATGAGCCTTAATGAATAT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT * *** 4985 ACGTTTATATG-G 66 GCAACTATATGAG * * * 4997 CCC--C----TA--CAACTACATGAGCCCTACTGAATATGCACCTATATGAGCCCTACTGAATAT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT * * 5054 GCAACTACATGAA 66 GCAACTATATGAG * * * * * * * 5067 CTCTACTGAATATGCAACAAAATGAGCCATACTGAATATGCGACTATATGAGGCCTACTG-A-AT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT * * 5130 GCGACTACATGAG 66 GCAACTATATGAG * * * * 5143 CCCTACTG-A-ATG-AGACTACAAGAGCCCTACTGAATATGCAACTACAAGAG-CCT--T-ACTA 1 CCCTACTGAATATGCA-ACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATA * * 5201 TGCGACTACATGAG 65 TGCAACTATATGAG * * * * * * * 5215 CCTTACTGAATATGCGACTACATGAGCTCTACTGATTATGCGACTACATGAGCCCTACTGAATTT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT * ** 5280 GGAACTATATGTC 66 GCAACTATATGAG * * ** * 5293 CCCTACTGAATATGCAACTATATGAGCGCTACT-AGATATGCAACTGCATGTTCCCAACTGAATA 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGA-ATATGCAACTACATGAGCCCTACTGAATA * * * 5357 TGAAACTACATAAG 65 TGCAACTATATGAG * * * * * * ** * * 5371 CCCTACTGAATATGCAACTACATAAGCGCTACTGAATAGGTAACTATATGTTCCCAATTGAATAT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT * 5436 GCGACTATATGAG 66 GCAACTATATGAG * * * 5449 CCCTACTGAATATGCAACCATATG-GCCCCTACTGAAAATGCAACTACATGAGCCCTACTAAATA 1 CCCTACTGAATATGCAACTATATGAG-CCCTACTGAATATGCAACTACATGAGCCCTACTGAATA * 5513 TGCAACTACATGAG 65 TGCAACTATATGAG * * * 5527 CCCTACTGAATATGCAACTATATGAGCCATATTGAATATGCAACTACATGAGCCCAACTGAATAT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT 5592 GCAACTATATGAG 66 GCAACTATATGAG * * * ** * 5605 TCTTGCTGAATATGCGTCTATATG-GCCCATACTGAATATGCAACTATATG-GCCCCTACTGAAT 1 CCCTACTGAATATGCAACTATATGAGCCC-TACTGAATATGCAACTACATGAG-CCCTACTGAAT 5668 ATGCAACTATATGAG 64 ATGCAACTATATGAG * * * 5683 CCCTACTGATTATGCAACTACATGAGCCCTACTGAATATGCAACTACATGAGCCCTATTGAATAA 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCC---T-ACT-- * 5748 GCAAATATATATGCAACTACATGAG 60 G-----A-ATATGCAACTATATGAG * * * * * * * 5773 CCTTATTGAATAAGCAACTATATGAGCCATATTGAATATGTAACTACATGAGCTCTACTGAATAT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT * * 5838 ACAACTACATG-G 66 GCAACTATATGAG * * * * * * 5850 ACCCTACTGAATATGCAACTAAACGAGCCTTACTGAATATGCGACTATATGA-CCCACACTGAAT 1 -CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCC-TACTGAAT * 5914 ATGCGACTATATGAG 64 ATGCAACTATATGAG * * * * * 5929 CTCTACTG-A-ATGCGACTATATGAGCCCTACCT-AATATGCGACTATATTAGCCCTACCT-AAT 1 CCCTACTGAATATGCAACTATATGAGCCCTA-CTGAATATGCAACTACATGAGCCCTA-CTGAAT * 5990 ATGCGACTATATGAG 64 ATGCAACTATATGAG * * * * 6005 TCCTACTGAATATGCAACTACATGAGCCCTACTGAATATGCAACTACATGAGTCTTACTGAATAT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT * 6070 GCAACTACATGAG 66 GCAACTATATGAG * * * 6083 CCTTACTGAATATGCAACTACATGAGCCCTACTGAATATGCAACTATATGAGCCCTACTGAATAT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT 6148 G---C---A--A- 66 GCAACTATATGAG * * * * * 6152 CCCTACTGAATATGCAACTACATGAGCCTTACTTAATATGCAACTACTTGAGCCCTACTGAATAC 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT 6217 GCAACTATATGAG 66 GCAACTATATGAG * 6230 CCCTACTGAATATGCAACTATAAG-GCCCCTACTGAATATGCAACTACATGAGCCCTACTGAATA 1 CCCTACTGAATATGCAACTATATGAG-CCCTACTGAATATGCAACTACATGAGCCCTACTGAATA * 6294 TGCAACTATACATATGAA 65 TGCAAC--T--ATATGAG * ** * * ** 6312 CCCTACTGAATATGCAAATATATGTTCGCTACTGAATATGCAACTATATGTCCCCTACTGAATAT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT 6377 GCAACTATATG-G 66 GCAACTATATGAG * 6389 CCCCTACTGAATATGCAACTACATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATA 1 -CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATA * * 6454 TACAACTACATGAG 65 TGCAACTATATGAG * * * * 6468 CTCTACTGAATATGCAACTACATGAGCCCTACTGAATATGCAACTAAATGAGCCTTACTGAATAT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT * 6533 GCGACTATATG-G 66 GCAACTATATGAG * * * * * 6545 CCCAAACTGAATATGCGACTATATGAGCCCTATTG-A-ATGCTACTACATGATCCCTAC------ 1 CCC-TACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATA * 6602 --CGACTATATG-G 65 TGCAACTATATGAG * * * * 6613 TCCCTACT-AGATATGCGACTATATGAGCCCTATTG-A-ATGCTACTACATGATCCCTAC----- 1 -CCCTACTGA-ATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAAT * 6670 ---CGACTATATG-G 64 ATGCAACTATATGAG * 6681 TCCCTACTGAATATGCGACTATATGAGCCCTACTGAATATGCAAC--C-T------TACTGAATA 1 -CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATA * 6737 TGCAACTATATGGG 65 TGCAACTATATGAG * * 6751 CCCTACTGAATATG---C-A-AT----CCTATTGAATATGCATCTACATGAGCCCTACTGAATAT 1 CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT 6807 GCAACTATATGAG 66 GCAACTATATGAG * * * * 6820 CCTTACTGAATATGCGACTATATG-GCCCCTACTGAATATGCAACT--ATAAGTCCCATAATGAA 1 CCCTACTGAATATGCAACTATATGAG-CCCTACTGAATATGCAACTACATGAG-CCC-TACTGAA * 6882 TATGCAACTACATGAG 63 TATGCAACTATATGAG * * 6898 TCCTACTGAATATGCAATTATATG-GCCCCTACTGAATATGCAACTACATGAGCCCTACTGAATA 1 CCCTACTGAATATGCAACTATATGAG-CCCTACTGAATATGCAACTACATGAGCCCTACTGAATA 6962 TGCAACTATATG-G 65 TGCAACTATATGAG ** * * * * 6975 TCCCTACTGAATATGCAACTATATGCCCCCTACTGAATATGCAACTATATGAGTCCTATTGAAAA 1 -CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATA 7040 TGCAAACTATATGAG 65 TGC-AACTATATGAG * * * * 7055 TCCTACTGAAAATGCAACTATAT-ATCTCCTACTGAATATGCAACTATATGAGCCCTACTGAATA 1 CCCTACTGAATATGCAACTATATGAGC-CCTACTGAATATGCAACTACATGAGCCCTACTGAATA * 7119 TGCAACTACATGAG 65 TGCAACTATATGAG * * * * * * 7133 CCCTACTGAAAATGTAACTAAAAGATGGCCCTACTGAACAT-CAACTATATGA 1 CCCTACTGAATATGCAACTATATGA--GCCCTACTGAATATGCAACTACATGA 7185 TGTAAATGAC Statistics Matches: 1894, Mismatches: 259, Indels: 222 0.80 0.11 0.09 Matches are distributed among these distances: 60 15 0.01 61 3 0.00 62 1 0.00 63 1 0.00 64 2 0.00 65 1 0.00 66 1 0.00 67 2 0.00 68 105 0.06 69 175 0.09 70 10 0.01 71 3 0.00 72 26 0.01 73 6 0.00 74 68 0.04 75 7 0.00 76 100 0.05 77 60 0.03 78 1058 0.56 79 92 0.05 80 18 0.01 81 2 0.00 82 70 0.04 84 2 0.00 86 2 0.00 87 1 0.00 89 1 0.00 90 62 0.03 ACGTcount: A:0.34, C:0.23, G:0.15, T:0.27 Consensus pattern (78 bp): CCCTACTGAATATGCAACTATATGAGCCCTACTGAATATGCAACTACATGAGCCCTACTGAATAT GCAACTATATGAG Found at i:5046 original size:26 final size:26 Alignment explanation

Indices: 5003--7184 Score: 1253 Period size: 26 Copynumber: 83.4 Consensus size: 26 4993 ATGGCCCCTA 5003 CAACTACATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * 5029 CACCTATATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * 5055 CAACTACATGAACTCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * * 5081 CAACAAAATGAGCCATACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * * 5107 CGACTATATGAGGCCTACTG-A-ATG 1 CAACTACATGAGCCCTACTGAATATG * 5131 CGACTACATGAGCCCTACTG-A-ATG 1 CAACTACATGAGCCCTACTGAATATG * 5155 -AGACTACAAGAGCCCTACTGAATATG 1 CA-ACTACATGAGCCCTACTGAATATG * * 5181 CAACTACAAGAG-CCT--T-ACTATG 1 CAACTACATGAGCCCTACTGAATATG * * 5203 CGACTACATGAGCCTTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * * 5229 CGACTACATGAGCTCTACTGATTATG 1 CAACTACATGAGCCCTACTGAATATG * * 5255 CGACTACATGAGCCCTACTGAATTTG 1 CAACTACATGAGCCCTACTGAATATG * * ** 5281 GAACTATATGTCCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * 5307 CAACTATATGAGCGCTACT-AGATATG 1 CAACTACATGAGCCCTACTGA-ATATG * ** * 5333 CAACTGCATGTTCCCAACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * 5359 AAACTACATAAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * * 5385 CAACTACATAAGCGCTACTGAATAGG 1 CAACTACATGAGCCCTACTGAATATG * * ** * * 5411 TAACTATATGTTCCCAATTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * 5437 CGACTATATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * * 5463 CAACCATATG-GCCCCTACTGAAAATG 1 CAACTACATGAG-CCCTACTGAATATG * 5489 CAACTACATGAGCCCTACTAAATATG 1 CAACTACATGAGCCCTACTGAATATG 5515 CAACTACATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * * 5541 CAACTATATGAGCCATATTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * 5567 CAACTACATGAGCCCAACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * * * 5593 CAACTATATGAGTCTTGCTGAATATG 1 CAACTACATGAGCCCTACTGAATATG ** * 5619 CGTCTATATG-GCCCATACTGAATATG 1 CAACTACATGAGCCC-TACTGAATATG * 5645 CAACTATATG-GCCCCTACTGAATATG 1 CAACTACATGAG-CCCTACTGAATATG * * 5671 CAACTATATGAGCCCTACTGATTATG 1 CAACTACATGAGCCCTACTGAATATG 5697 CAACTACATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * 5723 CAACTACATGAGCCCTATTGAATAAG 1 CAACTACATGAGCCCTACTGAATATG * * * * 5749 CAAATATAT-ATGCAACTACATGAGCCTTATTG 1 CAACTACATGA-GC-CCTAC-TGA---ATA-TG * ** 5781 -AA-TA-A-GCAACTATA-TGAGCCATATTGAATATG 1 CAACTACATG-AGCCCTACT--G--A-A-----TATG * * * 5813 TAACTACATGAGCTCTACTGAATATA 1 CAACTACATGAGCCCTACTGAATATG 5839 CAACTACATG-GACCCTACTGAATATG 1 CAACTACATGAG-CCCTACTGAATATG * * * 5865 CAACTAAACGAGCCTTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * * 5891 CGACTATATGA-CCCACACTGAATATG 1 CAACTACATGAGCCC-TACTGAATATG * * * 5917 CGACTATATGAGCTCTACTG-A-ATG 1 CAACTACATGAGCCCTACTGAATATG * * 5941 CGACTATATGAGCCCTACCT-AATATG 1 CAACTACATGAGCCCTA-CTGAATATG * * * 5967 CGACTATATTAGCCCTACCT-AATATG 1 CAACTACATGAGCCCTA-CTGAATATG * * * 5993 CGACTATATGAGTCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG 6019 CAACTACATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * 6045 CAACTACATGAGTCTTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * 6071 CAACTACATGAGCCTTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG 6097 CAACTACATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * 6123 CAACTATATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG *** * 6149 CAACCCTAC-TGAATATGCAACT-ACATGA-G 1 CAA--CTACATG-A-GCCCTACTGA-AT-ATG * * 6178 CCTTACTTA-AT-ATGCAACTACT---TGA-G 1 -C-AAC-TACATGA-GC-CCTACTGAAT-ATG * * * * 6204 C-CCTAC-TGAATACGCAACT--ATATG 1 CAACTACATG-A-GCCCTACTGAATATG * *** * * 6228 -AGCCCTAC-TGAATATGCAACT--ATAAGG 1 CA--ACTACATG-A-GCCCTACTGAAT-ATG ** *** * 6255 CCCCTAC-TGAATATGCAACT-ACATGA-G 1 CAACTACATG-A-GCCCTACTGA-AT-ATG * * 6282 C-CCTAC-TGA---ATA-TGCAACTAT- 1 CAACTACATGAGCCCTACTG-AA-TATG * * 6303 --AC-ATATGAACCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * ** * 6326 CAAATATATGTTCGCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * ** 6352 CAACTATATGTCCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * 6378 CAACTATATG-GCCCCTACTGAATATG 1 CAACTACATGAG-CCCTACTGAATATG 6404 CAACTACATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * 6430 CAACTACATGAGCCCTACTGAATATA 1 CAACTACATGAGCCCTACTGAATATG * 6456 CAACTACATGAGCTCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG 6482 CAACTACATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * 6508 CAACTAAATGAGCCTTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * * 6534 CGACTATATG-GCCCAAACTGAATATG 1 CAACTACATGAGCCC-TACTGAATATG * * * 6560 CGACTATATGAGCCCTATTG-A-ATG 1 CAACTACATGAGCCCTACTGAATATG * * * 6584 CTACTACATGATCCCTACCGACTATATGG 1 CAACTACATGAGCCCTACTGA--ATAT-G * * * 6613 TCCCTACTAGAT-ATG--CGACT--ATATG 1 ---CAACTACATGA-GCCCTACTGAATATG * * * * * 6638 -AGCCCTA-TTGAATGCTACTACATG-ATCCCTAC 1 CA--ACTACATG-A-GC-CCTAC-TGAAT--AT-G * * 6670 CGACTATATG-GTCCCTACTGAATATG 1 CAACTACATGAG-CCCTACTGAATATG * * 6696 CGACTATATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG *** * 6722 CAACCTTAC-TGAATATGCAACT--ATATGGG 1 CAA-C-TACATG-A-GCCCTACTGAATAT--G * * ** * 6751 CCCTACTGAATATGCAATCCTATTGAATATG 1 --CAACT--ACATG-AGCCCTACTGAATATG * 6782 CATCTACATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * 6808 CAACTATATGAGCCTTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * 6834 CGACTATATG-GCCCCTACTGAATATG 1 CAACTACATGAG-CCCTACTGAATATG * * 6860 CAACT--ATAAGTCCCATAATGAATATG 1 CAACTACATGAG-CCC-TACTGAATATG * 6886 CAACTACATGAGTCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * 6912 CAATTATATG-GCCCCTACTGAATATG 1 CAACTACATGAG-CCCTACTGAATATG 6938 CAACTACATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * 6964 CAACTATATG-GTCCCTACTGAATATG 1 CAACTACATGAG-CCCTACTGAATATG * ** 6990 CAACTATATGCCCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * * * * 7016 CAACTATATGAGTCCTATTGAAAATG 1 CAACTACATGAGCCCTACTGAATATG * * * 7042 CAAACTATATGAGTCCTACTGAAAATG 1 C-AACTACATGAGCCCTACTGAATATG * * 7069 CAACTATAT-ATCTCCTACTGAATATG 1 CAACTACATGAGC-CCTACTGAATATG * 7095 CAACTATATGAGCCCTACTGAATATG 1 CAACTACATGAGCCCTACTGAATATG * 7121 CAACTACATGAGCCCTACTGAAAATG 1 CAACTACATGAGCCCTACTGAATATG * * * * 7147 TAACTAAAAGATGGCCCTACTGAACAT- 1 CAACTACATGA--GCCCTACTGAATATG * 7174 CAACTATATGA 1 CAACTACATGA 7185 TGTAAATGAC Statistics Matches: 1754, Mismatches: 263, Indels: 277 0.76 0.11 0.12 Matches are distributed among these distances: 19 1 0.00 20 5 0.00 21 3 0.00 22 24 0.01 23 16 0.01 24 91 0.05 25 36 0.02 26 1355 0.77 27 79 0.05 28 41 0.02 29 33 0.02 30 14 0.01 31 20 0.01 32 17 0.01 33 8 0.00 34 3 0.00 35 6 0.00 36 2 0.00 ACGTcount: A:0.34, C:0.24, G:0.15, T:0.27 Consensus pattern (26 bp): CAACTACATGAGCCCTACTGAATATG Found at i:5208 original size:22 final size:22 Alignment explanation

Indices: 5128--5221 Score: 80 Period size: 22 Copynumber: 4.0 Consensus size: 22 5118 GGCCTACTGA * * 5128 ATGCGACTACATGAGCCCTACT 1 ATGCGACTACAAGAGCCTTACT * * 5150 GAATGAGACTACAAGAGCCCTACTGAAT 1 --ATGCGACTACAAGAG-CCT--T-ACT * 5178 ATGCAACTACAAGAGCCTTACT 1 ATGCGACTACAAGAGCCTTACT * 5200 ATGCGACTACATGAGCCTTACT 1 ATGCGACTACAAGAGCCTTACT 5222 GAATATGCGA Statistics Matches: 57, Mismatches: 9, Indels: 10 0.75 0.12 0.13 Matches are distributed among these distances: 22 22 0.39 23 1 0.02 24 13 0.23 25 5 0.09 26 13 0.23 27 1 0.02 28 2 0.04 ACGTcount: A:0.33, C:0.27, G:0.18, T:0.22 Consensus pattern (22 bp): ATGCGACTACAAGAGCCTTACT Found at i:5760 original size:38 final size:38 Alignment explanation

Indices: 5718--5795 Score: 138 Period size: 38 Copynumber: 2.1 Consensus size: 38 5708 GCCCTACTGA 5718 ATATGCAACTACATGAGCCCTATTGAATAAGCAAATAT 1 ATATGCAACTACATGAGCCCTATTGAATAAGCAAATAT * * 5756 ATATGCAACTACATGAGCCTTATTGAATAAGCAACTAT 1 ATATGCAACTACATGAGCCCTATTGAATAAGCAAATAT 5794 AT 1 AT 5796 GAGCCATATT Statistics Matches: 38, Mismatches: 2, Indels: 0 0.95 0.05 0.00 Matches are distributed among these distances: 38 38 1.00 ACGTcount: A:0.41, C:0.18, G:0.13, T:0.28 Consensus pattern (38 bp): ATATGCAACTACATGAGCCCTATTGAATAAGCAAATAT Found at i:6157 original size:17 final size:17 Alignment explanation

Indices: 6135--6169 Score: 70 Period size: 17 Copynumber: 2.1 Consensus size: 17 6125 ACTATATGAG 6135 CCCTACTGAATATGCAA 1 CCCTACTGAATATGCAA 6152 CCCTACTGAATATGCAA 1 CCCTACTGAATATGCAA 6169 C 1 C 6170 TACATGAGCC Statistics Matches: 18, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 17 18 1.00 ACGTcount: A:0.34, C:0.31, G:0.11, T:0.23 Consensus pattern (17 bp): CCCTACTGAATATGCAA Found at i:6643 original size:68 final size:68 Alignment explanation

Indices: 6534--6718 Score: 320 Period size: 68 Copynumber: 2.7 Consensus size: 68 6524 ACTGAATATG * 6534 CGACTATATGG-CCCAAACTGAATATGCGACTATATGAGCCCTATTGAATGCTACTACATGATCC 1 CGACTATATGGTCCC-TACTGAATATGCGACTATATGAGCCCTATTGAATGCTACTACATGATCC 6598 CTAC 65 CTAC 6602 CGACTATATGGTCCCTACT-AGATATGCGACTATATGAGCCCTATTGAATGCTACTACATGATCC 1 CGACTATATGGTCCCTACTGA-ATATGCGACTATATGAGCCCTATTGAATGCTACTACATGATCC 6666 CTAC 65 CTAC * 6670 CGACTATATGGTCCCTACTGAATATGCGACTATATGAGCCCTACTGAAT 1 CGACTATATGGTCCCTACTGAATATGCGACTATATGAGCCCTATTGAAT 6719 ATGCAACCTT Statistics Matches: 112, Mismatches: 2, Indels: 6 0.93 0.02 0.05 Matches are distributed among these distances: 67 1 0.01 68 107 0.96 69 4 0.04 ACGTcount: A:0.29, C:0.26, G:0.17, T:0.28 Consensus pattern (68 bp): CGACTATATGGTCCCTACTGAATATGCGACTATATGAGCCCTATTGAATGCTACTACATGATCCC TAC Found at i:7235 original size:37 final size:36 Alignment explanation

Indices: 7181--7273 Score: 104 Period size: 37 Copynumber: 2.6 Consensus size: 36 7171 CATCAACTAT * 7181 ATGATGTAAATGACCCTACTAAAACC-GAACTAGATAG 1 ATGATGCAAATGACCCTACTAAAACCAG-ACTAGAT-G * * 7218 ATGATGCAAATGGCCCTAGTAAAACCAGACT--A-G 1 ATGATGCAAATGACCCTACTAAAACCAGACTAGATG * 7251 ATGATGCAGATGACCCTACTAAA 1 ATGATGCAAATGACCCTACTAAA 7274 CTTTGGAATA Statistics Matches: 49, Mismatches: 6, Indels: 6 0.80 0.10 0.10 Matches are distributed among these distances: 33 21 0.43 35 1 0.02 37 26 0.53 38 1 0.02 ACGTcount: A:0.41, C:0.20, G:0.18, T:0.20 Consensus pattern (36 bp): ATGATGCAAATGACCCTACTAAAACCAGACTAGATG Found at i:7984 original size:12 final size:12 Alignment explanation

Indices: 7967--7991 Score: 50 Period size: 12 Copynumber: 2.1 Consensus size: 12 7957 AAGAGAATGA 7967 ACCAAAAGAAAG 1 ACCAAAAGAAAG 7979 ACCAAAAGAAAG 1 ACCAAAAGAAAG 7991 A 1 A 7992 GAGAAAAAAA Statistics Matches: 13, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 12 13 1.00 ACGTcount: A:0.68, C:0.16, G:0.16, T:0.00 Consensus pattern (12 bp): ACCAAAAGAAAG Found at i:8473 original size:131 final size:131 Alignment explanation

Indices: 8239--8516 Score: 547 Period size: 131 Copynumber: 2.1 Consensus size: 131 8229 ATAACAGAAT * 8239 TGAAAAGGTTCAAAGCGTACTAACCATGACAAATAAACAAAGAAAGTTGCAGAATATAAGAAAGT 1 TGAAAAGGTACAAAGCGTACTAACCATGACAAATAAACAAAGAAAGTTGCAGAATATAAGAAAGT 8304 CTATCAAAGATTCAAGCTTACTAACCATGATAATCAGAATGTGGACAAATACAGCAACAAAATCA 66 CTATCAAAGATTCAAGCTTACTAACCATGATAATCAGAATGTGGACAAATACAGCAACAAAATCA 8369 G 131 G 8370 TGAAAAGGTACAAAGCGTACTAACCATGACAAATAAACAAAGAAAGTTGCAGAATATAAGAAAGT 1 TGAAAAGGTACAAAGCGTACTAACCATGACAAATAAACAAAGAAAGTTGCAGAATATAAGAAAGT 8435 CTATCAAAGATTCAAGCTTACTAACCATGATAATCAGAATGTGGACAAATACAGCAACAAAATCA 66 CTATCAAAGATTCAAGCTTACTAACCATGATAATCAGAATGTGGACAAATACAGCAACAAAATCA 8500 G 131 G 8501 TGAAAAGGTACAAAGC 1 TGAAAAGGTACAAAGC 8517 ATGCTTCACA Statistics Matches: 146, Mismatches: 1, Indels: 0 0.99 0.01 0.00 Matches are distributed among these distances: 131 146 1.00 ACGTcount: A:0.49, C:0.16, G:0.17, T:0.19 Consensus pattern (131 bp): TGAAAAGGTACAAAGCGTACTAACCATGACAAATAAACAAAGAAAGTTGCAGAATATAAGAAAGT CTATCAAAGATTCAAGCTTACTAACCATGATAATCAGAATGTGGACAAATACAGCAACAAAATCA G Found at i:8893 original size:3 final size:3 Alignment explanation

Indices: 8881--8918 Score: 67 Period size: 3 Copynumber: 12.7 Consensus size: 3 8871 AAACAAAAAA * 8881 AAC AAA AAC AAC AAC AAC AAC AAC AAC AAC AAC AAC AA 1 AAC AAC AAC AAC AAC AAC AAC AAC AAC AAC AAC AAC AA 8919 TATCCGAAAC Statistics Matches: 33, Mismatches: 2, Indels: 0 0.94 0.06 0.00 Matches are distributed among these distances: 3 33 1.00 ACGTcount: A:0.71, C:0.29, G:0.00, T:0.00 Consensus pattern (3 bp): AAC Found at i:13053 original size:11 final size:11 Alignment explanation

Indices: 13037--13065 Score: 51 Period size: 11 Copynumber: 2.7 Consensus size: 11 13027 GCAAGAGAGA 13037 AAACAGAAAAG 1 AAACAGAAAAG 13048 AAACAGAAAAG 1 AAACAGAAAAG 13059 AAA-AGAA 1 AAACAGAA 13066 TATCCTTACC Statistics Matches: 18, Mismatches: 0, Indels: 1 0.95 0.00 0.05 Matches are distributed among these distances: 10 4 0.22 11 14 0.78 ACGTcount: A:0.76, C:0.07, G:0.17, T:0.00 Consensus pattern (11 bp): AAACAGAAAAG Found at i:16432 original size:14 final size:14 Alignment explanation

Indices: 16415--16442 Score: 56 Period size: 14 Copynumber: 2.0 Consensus size: 14 16405 GACATATAAC 16415 AATCAGATTTCACA 1 AATCAGATTTCACA 16429 AATCAGATTTCACA 1 AATCAGATTTCACA 16443 GCCTTATAAT Statistics Matches: 14, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 14 14 1.00 ACGTcount: A:0.43, C:0.21, G:0.07, T:0.29 Consensus pattern (14 bp): AATCAGATTTCACA Found at i:19135 original size:31 final size:32 Alignment explanation

Indices: 19072--19142 Score: 90 Period size: 32 Copynumber: 2.2 Consensus size: 32 19062 TCAGGAGGGT ** * 19072 AAATTGTCCTCGATTTGAAAAGTCCATGGGAC 1 AAATTGTCCTAAATTTGAAAAGTCAATGGGAC * 19104 AAATTGTCCTAAATTTGAAAA-TTAATGGGAC 1 AAATTGTCCTAAATTTGAAAAGTCAATGGGAC * 19135 AAGTTGTC 1 AAATTGTC 19143 AGGATTTGAA Statistics Matches: 34, Mismatches: 5, Indels: 1 0.85 0.12 0.03 Matches are distributed among these distances: 31 15 0.44 32 19 0.56 ACGTcount: A:0.35, C:0.14, G:0.20, T:0.31 Consensus pattern (32 bp): AAATTGTCCTAAATTTGAAAAGTCAATGGGAC Found at i:21354 original size:2 final size:2 Alignment explanation

Indices: 21341--21380 Score: 71 Period size: 2 Copynumber: 20.0 Consensus size: 2 21331 GAGTCAATTA * 21341 AT AT AG AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT 1 AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT 21381 CTTGGCCCCT Statistics Matches: 36, Mismatches: 2, Indels: 0 0.95 0.05 0.00 Matches are distributed among these distances: 2 36 1.00 ACGTcount: A:0.50, C:0.00, G:0.03, T:0.47 Consensus pattern (2 bp): AT Found at i:28894 original size:119 final size:119 Alignment explanation

Indices: 28683--28920 Score: 449 Period size: 119 Copynumber: 2.0 Consensus size: 119 28673 ATCTATATAT * * 28683 GTAGAAATTCCATTCAATCCCATCAAGCATTTTACCATGTAACACAAATCGGGCACCATCTTATG 1 GTAGAAATTCCATACAATCCCATCAAGCATTTTACCATGTAACACAAATCAGGCACCATCTTATG 28748 ACAAAAAATTTGGCCTCACAATGTTGTGCAAAGCCAAAGTAAGCATTAACCTAA 66 ACAAAAAATTTGGCCTCACAATGTTGTGCAAAGCCAAAGTAAGCATTAACCTAA 28802 GTAGAAATTCCATACAATCCCATCAAGCATTTTACCATGTAACACAAATCAGGCACCATCTTATG 1 GTAGAAATTCCATACAATCCCATCAAGCATTTTACCATGTAACACAAATCAGGCACCATCTTATG * 28867 ACAAAAAATTTGGCCTCACAATGTTGTGCAAAGCCAAGGTAAGCATTAACCTAA 66 ACAAAAAATTTGGCCTCACAATGTTGTGCAAAGCCAAAGTAAGCATTAACCTAA 28921 CATGTCCTTA Statistics Matches: 116, Mismatches: 3, Indels: 0 0.97 0.03 0.00 Matches are distributed among these distances: 119 116 1.00 ACGTcount: A:0.38, C:0.24, G:0.13, T:0.25 Consensus pattern (119 bp): GTAGAAATTCCATACAATCCCATCAAGCATTTTACCATGTAACACAAATCAGGCACCATCTTATG ACAAAAAATTTGGCCTCACAATGTTGTGCAAAGCCAAAGTAAGCATTAACCTAA Found at i:35707 original size:11 final size:11 Alignment explanation

Indices: 35691--35751 Score: 52 Period size: 11 Copynumber: 5.2 Consensus size: 11 35681 AACATATATG 35691 ATATATTTTAA 1 ATATATTTTAA 35702 ATATATTTATATA 1 ATATATTT-TA-A * 35715 AAATATATTTATA 1 ATATAT-TTTA-A * 35728 ATATA-TATAA 1 ATATATTTTAA 35738 TATATATTTTAA 1 -ATATATTTTAA 35750 AT 1 AT 35752 TTTATTTATT Statistics Matches: 41, Mismatches: 4, Indels: 10 0.75 0.07 0.18 Matches are distributed among these distances: 10 1 0.02 11 18 0.44 12 6 0.15 13 14 0.34 14 2 0.05 ACGTcount: A:0.49, C:0.00, G:0.00, T:0.51 Consensus pattern (11 bp): ATATATTTTAA Found at i:35736 original size:15 final size:14 Alignment explanation

Indices: 35691--35735 Score: 53 Period size: 13 Copynumber: 3.4 Consensus size: 14 35681 AACATATATG 35691 ATATATTT-TAAAT 1 ATATATTTATAAAT 35704 ATAT-TTATATAAA- 1 ATATATT-TATAAAT 35717 ATATATTTAT-AAT 1 ATATATTTATAAAT 35730 ATATAT 1 ATATAT 35736 AATATATATT Statistics Matches: 28, Mismatches: 0, Indels: 8 0.78 0.00 0.22 Matches are distributed among these distances: 12 4 0.14 13 18 0.64 14 6 0.21 ACGTcount: A:0.49, C:0.00, G:0.00, T:0.51 Consensus pattern (14 bp): ATATATTTATAAAT Done.