Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWUE01012734.1 Corchorus olitorius cultivar O-4 contig12767, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 34946
ACGTcount: A:0.32, C:0.19, G:0.19, T:0.29


Found at i:10348 original size:24 final size:24

Alignment explanation

Indices: 10321--10477 Score: 201 Period size: 24 Copynumber: 6.6 Consensus size: 24 10311 GAAAATCACA * * 10321 CGGCCACATTGTGGTCATGAGATT 1 CGGCCACATAGTGGTCGTGAGATT 10345 CGGCCACATAGTGGTCGTGAGATT 1 CGGCCACATAGTGGTCGTGAGATT * * 10369 CAGCCACATAGTGGTCGTGGGATT 1 CGGCCACATAGTGGTCGTGAGATT * 10393 CGGCGACAT-GATGGTCGTGAGATT 1 CGGCCACATAG-TGGTCGTGAGATT * * * 10417 CGGCCACATGGTGGCCGGGAGATT 1 CGGCCACATAGTGGTCGTGAGATT * 10441 CGGCCACATAGTGGTCGAGAGATT 1 CGGCCACATAGTGGTCGTGAGATT * 10465 CGACC-CATAGTGG 1 CGGCCACATAGTGG 10478 CCGTTAGAAA Statistics Matches: 117, Mismatches: 14, Indels: 5 0.86 0.10 0.04 Matches are distributed among these distances: 23 9 0.08 24 107 0.91 25 1 0.01 ACGTcount: A:0.21, C:0.22, G:0.34, T:0.23 Consensus pattern (24 bp): CGGCCACATAGTGGTCGTGAGATT Found at i:11271 original size:218 final size:218 Alignment explanation

Indices: 10893--11327 Score: 825 Period size: 218 Copynumber: 2.0 Consensus size: 218 10883 GAAAGGGATC * 10893 TTGTCGGAAGCCTTGGTTATATAAGCAGACATACCTCAAACGTTGAAAGCCCCTCTCCGGACACC 1 TTGTCGGAAGCCTTGGTTATATAAGCAAACATACCTCAAACGTTGAAAGCCCCTCTCCGGACACC * 10958 CCCTTCCCCTGCGGAAATACAAACCTCTCTCTTAAGAGATGCATACTTTTGTTTGATCAACTTTG 66 CCCTTCCCCTGCGGAAATACAAACCTCTCTCTTAAGAGATGCATACTTTTGTTTGATCAACCTTG 11023 TCGTTCAATTTCCTTTCCTTGTCTTTTAATTTCAATCTTGCGTTTCTCACTTTCAAGTTGTAATC 131 TCGTTCAATTTCCTTTCCTTGTCTTTTAATTTCAATCTTGCGTTTCTCACTTTCAAGTTGTAATC 11088 CTGTTATTACAATCTAGTGAAAT 196 CTGTTATTACAATCTAGTGAAAT * * 11111 TTGTCGGAAGCCTTGGTTATATAAGCAAACATACCTCCAATGTTGAAAGCCCCTCTCCGGACACC 1 TTGTCGGAAGCCTTGGTTATATAAGCAAACATACCTCAAACGTTGAAAGCCCCTCTCCGGACACC * 11176 CCCTTCCCCTGCGGAAATACAAACCTCTCTCTTCAGAGATGCATACTTTTGTTTGATCAACCTTG 66 CCCTTCCCCTGCGGAAATACAAACCTCTCTCTTAAGAGATGCATACTTTTGTTTGATCAACCTTG 11241 TCGTTCAATTTCCTTTCCTTGTCTTTTAATTTCAATCTTGCGTTTCTCACTTTCAAGTTGTAATC 131 TCGTTCAATTTCCTTTCCTTGTCTTTTAATTTCAATCTTGCGTTTCTCACTTTCAAGTTGTAATC 11306 CTGTTATTACAATCTAGTGAAA 196 CTGTTATTACAATCTAGTGAAA 11328 CTTTACTCTT Statistics Matches: 212, Mismatches: 5, Indels: 0 0.98 0.02 0.00 Matches are distributed among these distances: 218 212 1.00 ACGTcount: A:0.24, C:0.26, G:0.14, T:0.36 Consensus pattern (218 bp): TTGTCGGAAGCCTTGGTTATATAAGCAAACATACCTCAAACGTTGAAAGCCCCTCTCCGGACACC CCCTTCCCCTGCGGAAATACAAACCTCTCTCTTAAGAGATGCATACTTTTGTTTGATCAACCTTG TCGTTCAATTTCCTTTCCTTGTCTTTTAATTTCAATCTTGCGTTTCTCACTTTCAAGTTGTAATC CTGTTATTACAATCTAGTGAAAT Found at i:14190 original size:24 final size:24 Alignment explanation

Indices: 14158--14314 Score: 251 Period size: 24 Copynumber: 6.5 Consensus size: 24 14148 AAAATCACAT 14158 GGCCACATAGTGGTCGTGAGATTC 1 GGCCACATAGTGGTCGTGAGATTC 14182 GGCCACATAGTGGTCGTGAGATTC 1 GGCCACATAGTGGTCGTGAGATTC 14206 GGCCACATAGTGGTCGTGAGATTC 1 GGCCACATAGTGGTCGTGAGATTC * * * 14230 GGCGACATGGTGGTCGTGAGATTT 1 GGCCACATAGTGGTCGTGAGATTC * * 14254 GGCCACATGGTGGTCGGGAGATTC 1 GGCCACATAGTGGTCGTGAGATTC * 14278 GGCCACATAGTGGTCGAGAGATTC 1 GGCCACATAGTGGTCGTGAGATTC * 14302 GACCACATAGTGG 1 GGCCACATAGTGG 14315 CTGTTAGAAA Statistics Matches: 124, Mismatches: 9, Indels: 0 0.93 0.07 0.00 Matches are distributed among these distances: 24 124 1.00 ACGTcount: A:0.21, C:0.20, G:0.36, T:0.24 Consensus pattern (24 bp): GGCCACATAGTGGTCGTGAGATTC Found at i:17356 original size:218 final size:217 Alignment explanation

Indices: 16972--17408 Score: 784 Period size: 218 Copynumber: 2.0 Consensus size: 217 16962 GAAAGGGATC * * * 16972 TTGTCGGAAGCCTTGGTTATATAAGCAGACATACCTCCAACGTTGAAATCCCCTCTCCGAACACC 1 TTGTCGAAAGCCTTGGTTATACAAGCAGACATACCTCCAACGTTGAAAGCCCCTCTCCGAACACC * * 17037 CCTTCCCCTGTGGAAATACAAACCTCTCTCTTAAGAGATGCATACTTTTGTTTGATCAACCTTGT 66 CCTTCCCCTGCGGAAATACAAACCTCTCTCTTAAGAGATGCATACTTTTGTTCGATCAACCTTGT 17102 CGTTCAATTTCCTTTCCTTGTCTTTTAATTTCAATCTTGAGTTTCTCACTTTCAAGTTGTAATCC 131 CGTTCAATTTCCTTTCCTTGTCTTTTAATTTCAATCTTGAGTTTCTCACTTTCAAGTTGTAATCC 17167 TGTTATTACAATCTAGTGAAAT 196 TGTTATTACAATCTAGTGAAAT 17189 TTGTCGAAAGCCTTGGTTATACAAGCAGACATACCTCCAACGTTGAAAGCCCCTCTCCGAACACC 1 TTGTCGAAAGCCTTGGTTATACAAGCAGACATACCTCCAACGTTGAAAGCCCCTCTCCGAACA-C * 17254 CCCTTCCCCTGCGGAAATACAAACCTCTCTCTTCAGAGATGCATACTTTTGTTCGATCAACCTTG 65 CCCTTCCCCTGCGGAAATACAAACCTCTCTCTTAAGAGATGCATACTTTTGTTCGATCAACCTTG * * 17319 TCGTTCAATTTCCTTTCCTTGTCTTTTAATTTCAATCTTGCGTTTCTTACTTTCAAGTTGTAATC 130 TCGTTCAATTTCCTTTCCTTGTCTTTTAATTTCAATCTTGAGTTTCTCACTTTCAAGTTGTAATC * 17384 CTGTTATTGCAATCTAGTGAAAT 195 CTGTTATTACAATCTAGTGAAAT 17407 TT 1 TT 17409 TACTCTTTCC Statistics Matches: 210, Mismatches: 9, Indels: 1 0.95 0.04 0.00 Matches are distributed among these distances: 217 60 0.29 218 150 0.71 ACGTcount: A:0.24, C:0.26, G:0.14, T:0.36 Consensus pattern (217 bp): TTGTCGAAAGCCTTGGTTATACAAGCAGACATACCTCCAACGTTGAAAGCCCCTCTCCGAACACC CCTTCCCCTGCGGAAATACAAACCTCTCTCTTAAGAGATGCATACTTTTGTTCGATCAACCTTGT CGTTCAATTTCCTTTCCTTGTCTTTTAATTTCAATCTTGAGTTTCTCACTTTCAAGTTGTAATCC TGTTATTACAATCTAGTGAAAT Found at i:19159 original size:24 final size:24 Alignment explanation

Indices: 19132--19177 Score: 65 Period size: 24 Copynumber: 1.9 Consensus size: 24 19122 AGAAACCTAG * 19132 AGAAAAGAAAGAGAAGGAAATATC 1 AGAAAAGAAAGAGAAGAAAATATC * * 19156 AGAAAAGGAGGAGAAGAAAATA 1 AGAAAAGAAAGAGAAGAAAATA 19178 GCTGGCGGAG Statistics Matches: 19, Mismatches: 3, Indels: 0 0.86 0.14 0.00 Matches are distributed among these distances: 24 19 1.00 ACGTcount: A:0.63, C:0.02, G:0.28, T:0.07 Consensus pattern (24 bp): AGAAAAGAAAGAGAAGAAAATATC Found at i:20295 original size:36 final size:35 Alignment explanation

Indices: 20199--21284 Score: 697 Period size: 36 Copynumber: 30.0 Consensus size: 35 20189 TATGCATCCA * * 20199 TAAAGCAGTCAAAGACTTAATTCAGGGTAATTAAG 1 TAAAGTAGTCAAAGACTTAATTCAGGGAAATTAAG 20234 TAAAAGT-GATCAGTAAAGACTTAATTCAGGGAAATTAAG 1 T-AAAGTAG-TC---AAAGACTTAATTCAGGGAAATTAAG * 20273 TAAGAGTAGTCAAAGACTTAATTCAGGGTAATTAAG 1 TAA-AGTAGTCAAAGACTTAATTCAGGGAAATTAAG ** * * 20309 TAAACACAGTCAAAGACTTAATTCAAGGTAATTAAG 1 TAAA-GTAGTCAAAGACTTAATTCAGGGAAATTAAG * * 20345 TAAACATAGTCAAAGACTTAATTCAGGGTAATTAAG 1 TAAA-GTAGTCAAAGACTTAATTCAGGGAAATTAAG * * 20381 TAAAAGTATTCAAAGACTTAATTCAAGGAAATTAAG 1 T-AAAGTAGTCAAAGACTTAATTCAGGGAAATTAAG * 20417 TAAAAGTAATCAGTAAAGACTTAATTCAGGGAAATTAAG 1 T-AAAGTAGTC---AAAGACTTAATTCAGGGAAATTAAG * * * 20456 TAAGAGTAGTCGAAGACTTAATTCAGGGTAATCAAG 1 TAA-AGTAGTCAAAGACTTAATTCAGGGAAATTAAG ** * 20492 TAAACACAGTCAAAGACTTAATTC-GAGGTAATTAAG 1 TAAA-GTAGTCAAAGACTTAATTCAG-GGAAATTAAG * * * * 20528 TAAAGGCAATCAAAGACCTAATTCAGGGTAATTAAG 1 TAAA-GTAGTCAAAGACTTAATTCAGGGAAATTAAG * 20564 TAAAAGTAGTCAAAAACTTAATTCAGGGAAATTAAG 1 T-AAAGTAGTCAAAGACTTAATTCAGGGAAATTAAG * * * 20600 TAAAAGTAATCAGTAAAGATTTAATTCAAGGAAATTAAG 1 T-AAAGTAGTC---AAAGACTTAATTCAGGGAAATTAAG * * * 20639 TAAGAGCAGTCAAAGACTTAATTTAGGGTAATTAAG 1 TAA-AGTAGTCAAAGACTTAATTCAGGGAAATTAAG ** * * 20675 TAAACACAGTCAAAGACTTAATTCAAGGTAATTAAG 1 TAAA-GTAGTCAAAGACTTAATTCAGGGAAATTAAG * * * 20711 TAAAGGCAATCAAAGACTTAATTCAGGGTAATTAAG 1 TAAA-GTAGTCAAAGACTTAATTCAGGGAAATTAAG * ** 20747 TAAA-TCAAG-CAAAGACTTAATTTCAAGGAAATTGGG 1 TAAAGT--AGTCAAAGACTTAA-TTCAGGGAAATTAAG ** * * 20783 TAAGAACAAG-CAAAGACTTAATTTCAAGGAAATTAGG 1 T-A-AAGTAGTCAAAGACTTAA-TTCAGGGAAATTAAG * * * 20820 TAAAATCAAG-CACAGACTTAATTCAGGGTAATTAAG 1 TAAAGT--AGTCAAAGACTTAATTCAGGGAAATTAAG *** * 20856 TAAA-TCAAAGAAAGACTTAATTTCAAGGAAATTAAG 1 TAAAGT-AGTCAAAGACTTAA-TTCAGGGAAATTAAG * * 20892 TAAA-TCAAG-CAAAGACTTAATTTCAAGGAAATTAGG 1 TAAAGT--AGTCAAAGACTTAA-TTCAGGGAAATTAAG ** * * * 20928 TAAGAACAAG-AAAAGACTTAATTTCAAGGAAATTAGG 1 T-A-AAGTAGTCAAAGACTTAA-TTCAGGGAAATTAAG * * * 20965 TAAAATCAAG-CAAAGACTTAATTTCAAGGAAATTAGG 1 TAAAGT--AGTCAAAGACTTAA-TTCAGGGAAATTAAG * ** * 21002 TAAAATCAAG-CACCGACTTAATTCAGGGTAATTAAG 1 TAAAGT--AGTCAAAGACTTAATTCAGGGAAATTAAG ** ** * 21038 TAAA-TCAAACAAAGACTTAATTTCAAAGAAATTAGG 1 TAAAGT-AGTCAAAGACTTAA-TTCAGGGAAATTAAG ** * * 21074 TAAGAACAAG-CAAAGACTTGATTC-GAGGAAATTAGG 1 T-A-AAGTAGTCAAAGACTTAATTCAG-GGAAATTAAG * ** * * 21110 TAAAAGCAAACAAAGACTTAATTTAGGGAAATTAGG 1 T-AAAGTAGTCAAAGACTTAATTCAGGGAAATTAAG * * 21146 TAAAAATCAGTCAAAGACTTAATTCAAGGAAATTAAG 1 T-AAAGT-AGTCAAAGACTTAATTCAGGGAAATTAAG ** * * 21183 TAAAG-AGTCAAA-A-AAAATTCTGGGTAATTAAG 1 TAAAGTAGTCAAAGACTTAATTCAGGGAAATTAAG * * 21215 T--AG-AGTCAATAAACTTAATTC-GAGGTAATTAAG 1 TAAAGTAGTCAA-AGACTTAATTCAG-GGAAATTAAG * * 21248 TAAAGTCAAT-AAAGAACTTAATTCAGGGTAATTAAG 1 TAAAGT-AGTCAAAG-ACTTAATTCAGGGAAATTAAG 21284 T 1 T 21285 GGGGACATTA Statistics Matches: 877, Mismatches: 117, Indels: 113 0.79 0.11 0.10 Matches are distributed among these distances: 30 8 0.01 31 1 0.00 32 17 0.02 33 17 0.02 34 9 0.01 35 47 0.05 36 508 0.58 37 167 0.19 38 13 0.01 39 89 0.10 40 1 0.00 ACGTcount: A:0.47, C:0.10, G:0.18, T:0.25 Consensus pattern (35 bp): TAAAGTAGTCAAAGACTTAATTCAGGGAAATTAAG Found at i:20359 original size:72 final size:71 Alignment explanation

Indices: 20205--21194 Score: 781 Period size: 72 Copynumber: 13.6 Consensus size: 71 20195 TCCATAAAGC * 20205 AGTCAAAGACTTAATTCAGGGTAATTAAGTAAAAGTGATCAGT-AAAGACTTAATTCAGGGAAAT 1 AGTCAAAGACTTAATTCAGGGTAATTAAGT-AAA---A-CAGTCAAAGACTTAATTCAAGGAAAT * 20269 TAAGTAAGA-GT 61 TAAGTAA-ACAT * 20280 AGTCAAAGACTTAATTCAGGGTAATTAAGTAAACACAGTCAAAGACTTAATTCAAGGTAATTAAG 1 AGTCAAAGACTTAATTCAGGGTAATTAAGTAAA-ACAGTCAAAGACTTAATTCAAGGAAATTAAG 20345 TAAACAT 65 TAAACAT * * 20352 AGTCAAAGACTTAATTCAGGGTAATTAAGTAAAAGTATTCAAAGACTTAATTCAAGGAAATTAAG 1 AGTCAAAGACTTAATTCAGGGTAATTAAGTAAAA-CAGTCAAAGACTTAATTCAAGGAAATTAAG 20417 TAAA-AGT 65 TAAACA-T * * ** * * * * 20424 AATCAGTAAAGACTTAATTCAGGGAAATTAAGTAAGAGTAGTCGAAGACTTAATTCAGGGTAATC 1 AGTC---AAAGACTTAATTCAGGGTAATTAAGTAA-AACAGTCAAAGACTTAATTCAAGGAAATT * 20489 AAGTAAACAC 62 AAGTAAACAT * * * * * 20499 AGTCAAAGACTTAATTC-GAGGTAATTAAGTAAAGGCAATCAAAGACCTAATTCAGGGTAATTAA 1 AGTCAAAGACTTAATTCAG-GGTAATTAAGTAAA-ACAGTCAAAGACTTAATTCAAGGAAATTAA 20563 GTAAA-AGT 64 GTAAACA-T * * * 20571 AGTCAAAAACTTAATTCAGGGAAATTAAGTAAAAGTAATCAGT-AAAGATTTAATTCAAGGAAAT 1 AGTCAAAGACTTAATTCAGGGTAATTAAGT--AA--AA-CAGTCAAAGACTTAATTCAAGGAAAT 20635 TAAGTAAGAGC-- 61 TAAGTAA-A-CAT * * 20646 AGTCAAAGACTTAATTTAGGGTAATTAAGTAAACACAGTCAAAGACTTAATTCAAGGTAATTAAG 1 AGTCAAAGACTTAATTCAGGGTAATTAAGTAAA-ACAGTCAAAGACTTAATTCAAGGAAATTAAG 20711 TAAAGGCA- 65 TAAA--CAT * ** 20719 A-TCAAAGACTTAATTCAGGGTAATTAAGTAAATCAAG-CAAAGACTTAATTTCAAGGAAATTGG 1 AGTCAAAGACTTAATTCAGGGTAATTAAGTAAAAC-AGTCAAAGACTTAA-TTCAAGGAAATTAA 20782 GTAAGAACA- 64 GT-A-AACAT * * * * * * 20791 AG-CAAAGACTTAATTTCAAGGAAATTAGGTAAAATCAAG-CACAGACTTAATTCAGGGTAATTA 1 AGTCAAAGACTTAA-TTCAGGGTAATTAAGTAAAA-C-AGTCAAAGACTTAATTCAAGGAAATTA * 20854 AGTAAATCAA 63 AGTAAA-CAT * * * 20864 AG--AAAGACTTAATTTCAAGGAAATTAAGTAAATCAAG-CAAAGACTTAATTTCAAGGAAATTA 1 AGTCAAAGACTTAA-TTCAGGGTAATTAAGTAAAAC-AGTCAAAGACTTAA-TTCAAGGAAATTA * 20926 GGTAAGAACA- 63 AGT-A-AACAT * * * * 20936 AG-AAAAGACTTAATTTCAAGGAAATTAGGTAAAATCAAG-CAAAGACTTAATTTCAAGGAAATT 1 AGTCAAAGACTTAA-TTCAGGGTAATTAAGTAAAA-C-AGTCAAAGACTTAA-TTCAAGGAAATT * 20999 AGGTAAA-AT 62 AAGTAAACAT ** * ** * 21008 CAAG-CACCGACTTAATTCAGGGTAATTAAGTAAATCAAACAAAGACTTAATTTCAAAGAAATTA 1 --AGTCAAAGACTTAATTCAGGGTAATTAAGTAAAACAGTCAAAGACTTAA-TTCAAGGAAATTA * 21072 GGTAAGAACA- 63 AGT-A-AACAT * * * ** * * * 21082 AG-CAAAGACTTGATTC-GAGGAAATTAGGTAAAAGCAAACAAAGACTTAATTTAGGGAAATTAG 1 AGTCAAAGACTTAATTCAG-GGTAATTAAGTAAAA-CAGTCAAAGACTTAATTCAAGGAAATTAA * 21145 GTAAAAAT 64 GTAAACAT * * * 21153 CAGTCAAAGACTTAATTCAAGGAAATTAAGT-AAAGAGTCAAA 1 -AGTCAAAGACTTAATTCAGGGTAATTAAGTAAAACAGTCAAA 21195 AAAAATTCTG Statistics Matches: 779, Mismatches: 84, Indels: 108 0.80 0.09 0.11 Matches are distributed among these distances: 70 3 0.00 71 53 0.07 72 385 0.49 73 123 0.16 74 67 0.09 75 141 0.18 76 7 0.01 ACGTcount: A:0.47, C:0.11, G:0.18, T:0.25 Consensus pattern (71 bp): AGTCAAAGACTTAATTCAGGGTAATTAAGTAAAACAGTCAAAGACTTAATTCAAGGAAATTAAGT AAACAT Found at i:20515 original size:183 final size:180 Alignment explanation

Indices: 20207--21284 Score: 1132 Period size: 183 Copynumber: 6.0 Consensus size: 180 20197 CATAAAGCAG * * * * 20207 TCAAAGACTTAATTCAGGGTAATTAAGTAAAAGTGATCAGTAAAGACTTAATTCAGGGAAATTAA 1 TCAAAGACTTAATTCAAGGAAATTAAGTAAAAGTAATCAGTAAAGACTTAATTCAAGGAAATTAA 20272 GTAAGAGTAGTCAAAGACTTAATTCAGGGTAATTAAGTAAACACAGTCAAAGACTTAATTCAAGG 66 GTAA-AGTAGTC-AAGACTTAATTCAGGGTAATTAAGTAAACACAGTCAAAGACTTAATTCAAGG * 20337 TAATTAAGTAAA-CATAGTCAAAGACTTAATTCAGGGTAATTAAGTAAAAGTAT 129 TAATTAAGTAAAGCA-A-TCAAAGACTTAATTCAGGGTAATTAAGTAAAAGTAA * 20390 TCAAAGACTTAATTCAAGGAAATTAAGTAAAAGTAATCAGTAAAGACTTAATTCAGGGAAATTAA 1 TCAAAGACTTAATTCAAGGAAATTAAGTAAAAGTAATCAGTAAAGACTTAATTCAAGGAAATTAA * * 20455 GTAAGAGTAGTCGAAGACTTAATTCAGGGTAATCAAGTAAACACAGTCAAAGACTTAATTCGAGG 66 GTAA-AGTAGTC-AAGACTTAATTCAGGGTAATTAAGTAAACACAGTCAAAGACTTAATTCAAGG * * 20520 TAATTAAGTAAAGGCAATCAAAGACCTAATTCAGGGTAATTAAGTAAAAGTAG 129 TAATTAAGTAAA-GCAATCAAAGACTTAATTCAGGGTAATTAAGTAAAAGTAA * * * 20573 TCAAAAACTTAATTCAGGGAAATTAAGTAAAAGTAATCAGTAAAGATTTAATTCAAGGAAATTAA 1 TCAAAGACTTAATTCAAGGAAATTAAGTAAAAGTAATCAGTAAAGACTTAATTCAAGGAAATTAA * * 20638 GTAAGAGCAGTCAAAGACTTAATTTAGGGTAATTAAGTAAACACAGTCAAAGACTTAATTCAAGG 66 GTAA-AGTAGTC-AAGACTTAATTCAGGGTAATTAAGTAAACACAGTCAAAGACTTAATTCAAGG 20703 TAATTAAGTAAAGGCAATCAAAGACTTAATTCAGGGTAATTAAGT-AAA-TCAA 129 TAATTAAGTAAA-GCAATCAAAGACTTAATTCAGGGTAATTAAGTAAAAGT-AA * ** * 20755 GCAAAGACTTAATTTCAAGGAAATTGGGT--AAG-AA-CAAGCAAAGACTTAATTTCAAGGAAAT 1 TCAAAGACTTAA-TTCAAGGAAATTAAGTAAAAGTAATC-AGTAAAGACTTAA-TTCAAGGAAAT * * * 20816 TAGGTAAAATCAAG-CACAGACTTAATTCAGGGTAATTAAGTAAATCAAAG--AAAGACTTAATT 63 TAAGTAAAGT--AGTCA-AGACTTAATTCAGGGTAATTAAGTAAA-CACAGTCAAAGACTTAA-T * * * * * * * 20878 TCAAGGAAATTAAGTAAATCAAGCAAAGACTTAATTTCAAGGAAATTAGGTAAGAA-CAA 123 TCAAGGTAATTAAGTAAAGCAATCAAAGACTTAA-TTCAGGGTAATTAAGTAA-AAGTAA ** * * * 20937 GAAAAGACTTAATTTCAAGGAAATTAGGTAAAA-TCA--AGCAAAGACTTAATTTCAAGGAAATT 1 TCAAAGACTTAA-TTCAAGGAAATTAAGTAAAAGTAATCAGTAAAGACTTAA-TTCAAGGAAATT * * * * 20999 AGGTAAAATCAAG-CACCGACTTAATTCAGGGTAATTAAGTAAATCA-A-ACAAAGACTTAATTT 64 AAGTAAAGT--AGTCA-AGACTTAATTCAGGGTAATTAAGTAAA-CACAGTCAAAGACTTAA-TT * * * * * * * * * 21061 CAAAGAAATTAGGTAAGAACAAGCAAAGACTTGATTC-GAGGAAATTAGGTAAAAGCAA 124 CAAGGTAATTAAGTAA-AGCAATCAAAGACTTAATTCAG-GGTAATTAAGTAAAAGTAA * * * * 21119 ACAAAGACTTAATTTAGGGAAATTAGGT-AAA--AATCAGTCAAAGACTTAATTCAAGGAAATTA 1 TCAAAGACTTAATTCAAGGAAATTAAGTAAAAGTAATCAGT-AAAGACTTAATTCAAGGAAATTA *** * * * * 21181 AGTAAAG-AGTCAA-AAAAAATTCTGGGTAATTAAGT----AGAGTCAATAAACTTAATTCGAGG 65 AGTAAAGTAGTCAAGACTTAATTCAGGGTAATTAAGTAAACACAGTCAA-AGACTTAATTCAAGG 21240 TAATTAAGTAAAGTCAAT-AAAGAACTTAATTCAGGGTAATTAAGT 129 TAATTAAGTAAAG-CAATCAAAG-ACTTAATTCAGGGTAATTAAGT 21285 GGGGACATTA Statistics Matches: 792, Mismatches: 71, Indels: 73 0.85 0.08 0.08 Matches are distributed among these distances: 172 1 0.00 173 6 0.01 174 37 0.05 175 8 0.01 177 18 0.02 178 2 0.00 179 4 0.01 180 42 0.05 181 116 0.15 182 187 0.24 183 365 0.46 184 4 0.01 185 2 0.00 ACGTcount: A:0.47, C:0.10, G:0.18, T:0.25 Consensus pattern (180 bp): TCAAAGACTTAATTCAAGGAAATTAAGTAAAAGTAATCAGTAAAGACTTAATTCAAGGAAATTAA GTAAAGTAGTCAAGACTTAATTCAGGGTAATTAAGTAAACACAGTCAAAGACTTAATTCAAGGTA ATTAAGTAAAGCAATCAAAGACTTAATTCAGGGTAATTAAGTAAAAGTAA Found at i:20973 original size:19 final size:19 Alignment explanation

Indices: 20951--21011 Score: 61 Period size: 19 Copynumber: 3.3 Consensus size: 19 20941 AGACTTAATT 20951 TCAAGGAAATTAGGTAAAA 1 TCAAGGAAATTAGGTAAAA * * ** ** 20970 TCAAGCAAA-GACTTAATT 1 TCAAGGAAATTAGGTAAAA 20988 TCAAGGAAATTAGGTAAAA 1 TCAAGGAAATTAGGTAAAA 21007 TCAAG 1 TCAAG 21012 CACCGACTTA Statistics Matches: 29, Mismatches: 12, Indels: 2 0.67 0.28 0.05 Matches are distributed among these distances: 18 12 0.41 19 17 0.59 ACGTcount: A:0.49, C:0.10, G:0.18, T:0.23 Consensus pattern (19 bp): TCAAGGAAATTAGGTAAAA Found at i:23456 original size:20 final size:20 Alignment explanation

Indices: 23431--23471 Score: 73 Period size: 20 Copynumber: 2.0 Consensus size: 20 23421 AAAAAGACCA 23431 CCAATTTGCAAATCAAATGC 1 CCAATTTGCAAATCAAATGC * 23451 CCAATTTGTAAATCAAATGC 1 CCAATTTGCAAATCAAATGC 23471 C 1 C 23472 TTGTATTTTC Statistics Matches: 20, Mismatches: 1, Indels: 0 0.95 0.05 0.00 Matches are distributed among these distances: 20 20 1.00 ACGTcount: A:0.39, C:0.24, G:0.10, T:0.27 Consensus pattern (20 bp): CCAATTTGCAAATCAAATGC Found at i:28486 original size:25 final size:25 Alignment explanation

Indices: 28452--28500 Score: 89 Period size: 25 Copynumber: 2.0 Consensus size: 25 28442 AATTTGCATA * 28452 GCATTGTTATACTTCATGGTAGATG 1 GCATTGTTATACTACATGGTAGATG 28477 GCATTGTTATACTACATGGTAGAT 1 GCATTGTTATACTACATGGTAGAT 28501 TAGAGATTTG Statistics Matches: 23, Mismatches: 1, Indels: 0 0.96 0.04 0.00 Matches are distributed among these distances: 25 23 1.00 ACGTcount: A:0.27, C:0.12, G:0.22, T:0.39 Consensus pattern (25 bp): GCATTGTTATACTACATGGTAGATG Done.