Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01011241.1 Corchorus capsularis cultivar CVL-1 contig11262, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 39330
ACGTcount: A:0.33, C:0.17, G:0.17, T:0.33


Found at i:7 original size:2 final size:2

Alignment explanation

Indices: 1--34 Score: 68 Period size: 2 Copynumber: 17.0 Consensus size: 2 1 AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT 1 AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT 35 TGTCTAACTC Statistics Matches: 32, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 2 32 1.00 ACGTcount: A:0.50, C:0.00, G:0.00, T:0.50 Consensus pattern (2 bp): AT Found at i:2073 original size:6 final size:6 Alignment explanation

Indices: 2062--2089 Score: 56 Period size: 6 Copynumber: 4.7 Consensus size: 6 2052 TTATACCATC 2062 TTTTTA TTTTTA TTTTTA TTTTTA TTTT 1 TTTTTA TTTTTA TTTTTA TTTTTA TTTT 2090 AAAAAGTTAA Statistics Matches: 22, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 6 22 1.00 ACGTcount: A:0.14, C:0.00, G:0.00, T:0.86 Consensus pattern (6 bp): TTTTTA Found at i:2434 original size:40 final size:39 Alignment explanation

Indices: 2390--2470 Score: 128 Period size: 40 Copynumber: 2.1 Consensus size: 39 2380 TGACCCTCCT 2390 ATAATTAAGGAAATG-AATTAAATCCAGGTTTAGCCCCCTA 1 ATAATTAAGGAAA-GAAATTAAATCCAGGTTTAG-CCCCTA * 2430 ATAATTAAGGTAAGAAATTAAATCCAGGTTTAGCCCCTA 1 ATAATTAAGGAAAGAAATTAAATCCAGGTTTAGCCCCTA 2469 AT 1 AT 2471 TTAAATATGG Statistics Matches: 39, Mismatches: 1, Indels: 3 0.91 0.02 0.07 Matches are distributed among these distances: 39 9 0.23 40 30 0.77 ACGTcount: A:0.41, C:0.16, G:0.15, T:0.28 Consensus pattern (39 bp): ATAATTAAGGAAAGAAATTAAATCCAGGTTTAGCCCCTA Found at i:8766 original size:20 final size:18 Alignment explanation

Indices: 8734--8771 Score: 58 Period size: 20 Copynumber: 2.0 Consensus size: 18 8724 TTGATATCGT 8734 TTTCTTTTTTTTTGTTTA 1 TTTCTTTTTTTTTGTTTA 8752 TTTCATTTTTATTTTGTTTA 1 TTTC-TTTTT-TTTTGTTTA 8772 CGTTGCGGTA Statistics Matches: 18, Mismatches: 0, Indels: 2 0.90 0.00 0.10 Matches are distributed among these distances: 18 4 0.22 19 5 0.28 20 9 0.50 ACGTcount: A:0.11, C:0.05, G:0.05, T:0.79 Consensus pattern (18 bp): TTTCTTTTTTTTTGTTTA Found at i:9411 original size:30 final size:29 Alignment explanation

Indices: 9377--9435 Score: 73 Period size: 29 Copynumber: 2.0 Consensus size: 29 9367 ATACCATACA * * 9377 GGTCCCTCTACTTACAAAAAGGATCAATTT 1 GGTCCCCCTAC-TACAAAAACGATCAATTT * * 9407 GGTCCCCCTACTATAAAAACTATCAATTT 1 GGTCCCCCTACTACAAAAACGATCAATTT 9436 AAGTTCTATA Statistics Matches: 25, Mismatches: 4, Indels: 1 0.83 0.13 0.03 Matches are distributed among these distances: 29 15 0.60 30 10 0.40 ACGTcount: A:0.34, C:0.25, G:0.10, T:0.31 Consensus pattern (29 bp): GGTCCCCCTACTACAAAAACGATCAATTT Found at i:10273 original size:69 final size:69 Alignment explanation

Indices: 10147--10278 Score: 176 Period size: 69 Copynumber: 1.9 Consensus size: 69 10137 TTGCTTGAAA * * * 10147 TGCATGGTCTTTATATGTAATTTTAGCATTTCAATGTAATTAATGATGCTCCTACCATTTTTTCC 1 TGCATGGTCTTTATATGTAATTTTAGCATTTCAATGTAATCAATGATACTCCCACCATTTTTTCC 10212 TTAG 66 TTAG * * * * * 10216 TGCATTGTCTTTATATGTAATTTTAGCA-TTGAGATGTAATCAGTGGTATTCCCACCATTTTTT 1 TGCATGGTCTTTATATGTAATTTTAGCATTTCA-ATGTAATCAATGATACTCCCACCATTTTTT 10279 TTTTCCTTAG Statistics Matches: 54, Mismatches: 8, Indels: 2 0.84 0.12 0.03 Matches are distributed among these distances: 68 3 0.06 69 51 0.94 ACGTcount: A:0.24, C:0.15, G:0.14, T:0.46 Consensus pattern (69 bp): TGCATGGTCTTTATATGTAATTTTAGCATTTCAATGTAATCAATGATACTCCCACCATTTTTTCC TTAG Found at i:13644 original size:3 final size:3 Alignment explanation

Indices: 13636--13691 Score: 112 Period size: 3 Copynumber: 18.7 Consensus size: 3 13626 TTAACAGATT 13636 TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA 1 TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA 13684 TTA TTA TT 1 TTA TTA TT 13692 CACCTTGCAA Statistics Matches: 53, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 3 53 1.00 ACGTcount: A:0.32, C:0.00, G:0.00, T:0.68 Consensus pattern (3 bp): TTA Found at i:15517 original size:7 final size:7 Alignment explanation

Indices: 15477--15507 Score: 55 Period size: 7 Copynumber: 4.6 Consensus size: 7 15467 GAATGAATTT 15477 TTTTG-A 1 TTTTGAA 15483 TTTTGAA 1 TTTTGAA 15490 TTTTGAA 1 TTTTGAA 15497 TTTTGAA 1 TTTTGAA 15504 TTTT 1 TTTT 15508 TTTGGATTTT Statistics Matches: 24, Mismatches: 0, Indels: 1 0.96 0.00 0.04 Matches are distributed among these distances: 6 5 0.21 7 19 0.79 ACGTcount: A:0.23, C:0.00, G:0.13, T:0.65 Consensus pattern (7 bp): TTTTGAA Found at i:19298 original size:37 final size:38 Alignment explanation

Indices: 19241--19408 Score: 184 Period size: 38 Copynumber: 4.5 Consensus size: 38 19231 ACCCCAATAA ** * 19241 AATTAAGAATCAAAACAATAGTAATCAGTGAATTAGGT 1 AATTAAGAATCAAAGTAATAGTAATCAGTGAATTAGAT * 19279 AATTAA-AGTCAAAGTAATAGTAATCAGTGAATTA-AGT 1 AATTAAGAATCAAAGTAATAGTAATCAGTGAATTAGA-T * * 19316 AATTAAGAATCAAAGTAATAATAAGCAGTAGAATT-GAT 1 AATTAAGAATCAAAGTAATAGTAATCAGT-GAATTAGAT * * 19354 AATTAAGAATCAAAAG-AATAGTAATCAGT-AAATCGAT 1 AATTAAGAATC-AAAGTAATAGTAATCAGTGAATTAGAT * * 19391 AATTAAGAGTCAAGGTAA 1 AATTAAGAATCAAAGTAA 19409 AAGTGATAAT Statistics Matches: 111, Mismatches: 12, Indels: 15 0.80 0.09 0.11 Matches are distributed among these distances: 36 6 0.05 37 47 0.42 38 48 0.43 39 10 0.09 ACGTcount: A:0.51, C:0.07, G:0.16, T:0.26 Consensus pattern (38 bp): AATTAAGAATCAAAGTAATAGTAATCAGTGAATTAGAT Found at i:19394 original size:75 final size:75 Alignment explanation

Indices: 19241--19408 Score: 189 Period size: 75 Copynumber: 2.2 Consensus size: 75 19231 ACCCCAATAA ** * * * * 19241 AATTAAGAATCAAAACAATAGTAATCAGTGAATTAGGTAATTAAAGTCAAAGTAATAGTAATCAG 1 AATTAAGAATCAAAGTAATAATAAGCAGTGAATTAGATAATTAAAATCAAAGTAATAGTAATCAG * * 19306 TGAATTAAGT 66 TAAATCAAGT 19316 AATTAAGAATCAAAGTAATAATAAGCAGTAGAATT-GATAATTAAGAATCAAAAG-AATAGTAAT 1 AATTAAGAATCAAAGTAATAATAAGCAGT-GAATTAGATAATTAA-AATC-AAAGTAATAGTAAT * 19379 CAGTAAATCGA-T 63 CAGTAAATCAAGT * * 19391 AATTAAGAGTCAAGGTAA 1 AATTAAGAATCAAAGTAA 19409 AAGTGATAAT Statistics Matches: 79, Mismatches: 11, Indels: 6 0.82 0.11 0.06 Matches are distributed among these distances: 75 50 0.63 76 25 0.32 77 4 0.05 ACGTcount: A:0.51, C:0.07, G:0.16, T:0.26 Consensus pattern (75 bp): AATTAAGAATCAAAGTAATAATAAGCAGTGAATTAGATAATTAAAATCAAAGTAATAGTAATCAG TAAATCAAGT Found at i:19470 original size:21 final size:20 Alignment explanation

Indices: 19439--19477 Score: 60 Period size: 21 Copynumber: 1.9 Consensus size: 20 19429 GTAATTAGGG 19439 ATTAATTAAGTAAATTGGTA 1 ATTAATTAAGTAAATTGGTA * 19459 ATTAAGTTAAGTAATTTGG 1 ATTAA-TTAAGTAAATTGG 19478 CAATCAACTT Statistics Matches: 17, Mismatches: 1, Indels: 1 0.89 0.05 0.05 Matches are distributed among these distances: 20 5 0.29 21 12 0.71 ACGTcount: A:0.41, C:0.00, G:0.18, T:0.41 Consensus pattern (20 bp): ATTAATTAAGTAAATTGGTA Found at i:19489 original size:21 final size:21 Alignment explanation

Indices: 19444--19489 Score: 56 Period size: 21 Copynumber: 2.2 Consensus size: 21 19434 TAGGGATTAA * * * 19444 TTAAGTAAATTGGTAATTAAG 1 TTAAGTAAATTGGCAATCAAC * 19465 TTAAGTAATTTGGCAATCAAC 1 TTAAGTAAATTGGCAATCAAC 19486 TTAA 1 TTAA 19490 TTCGGTGTAA Statistics Matches: 21, Mismatches: 4, Indels: 0 0.84 0.16 0.00 Matches are distributed among these distances: 21 21 1.00 ACGTcount: A:0.41, C:0.07, G:0.15, T:0.37 Consensus pattern (21 bp): TTAAGTAAATTGGCAATCAAC Found at i:19508 original size:56 final size:56 Alignment explanation

Indices: 19441--19908 Score: 666 Period size: 56 Copynumber: 8.4 Consensus size: 56 19431 AATTAGGGAT * 19441 TAATTAAGTAAATTGGTAATTAAGTTAAGTAATTTGGCAATCAACTTAATTCGGTG 1 TAATTAAGTAAATTGGTAATTAAGTTAAGTAATTTGGTAATCAACTTAATTCGGTG * * * ** 19497 TAATTAAGTAAATTGGTGATTAAGTTAAGGAATGTGGTGGTCAACTTAATTCGGTG 1 TAATTAAGTAAATTGGTAATTAAGTTAAGTAATTTGGTAATCAACTTAATTCGGTG * 19553 TAATTAAGTAAATTGATAATTAAG-TAA-T-A-TTGGTAATCAACTTAATTCGGTG 1 TAATTAAGTAAATTGGTAATTAAGTTAAGTAATTTGGTAATCAACTTAATTCGGTG * * 19605 TAATTAAGT-AATTGGAAATTAAGTTAAAGTAATTTGGTAACCAACTTAATTCGGTG 1 TAATTAAGTAAATTGGTAATTAAGTT-AAGTAATTTGGTAATCAACTTAATTCGGTG * 19661 TAATTAAGT-AATTGGAAATTAAGTTAAAGTAATTTGGTAATCAACTT-ATTCGGTG 1 TAATTAAGTAAATTGGTAATTAAGTT-AAGTAATTTGGTAATCAACTTAATTCGGTG ** * * 19716 TAATTAAGTAAATTGGTGGTTAAGTTAAGTAATTTGGTAACCAACTTAATTCGGCG 1 TAATTAAGTAAATTGGTAATTAAGTTAAGTAATTTGGTAATCAACTTAATTCGGTG * * 19772 TAATTAAGT-AATTGGAAATTAAGTTAAGTAATTTGGTAATCAACTTAATTCGATG 1 TAATTAAGTAAATTGGTAATTAAGTTAAGTAATTTGGTAATCAACTTAATTCGGTG * 19827 TAATTAAGTAAATTGGTAATT-AGATTAAGTAATTTGGTAATTAACTTAATTCGGTG 1 TAATTAAGTAAATTGGTAATTAAG-TTAAGTAATTTGGTAATCAACTTAATTCGGTG * * 19883 CAATTAAGTAAACTGGTAAATTAAGT 1 TAATTAAGTAAATTGGT-AATTAAGT 19909 AATTCGGTAA Statistics Matches: 369, Mismatches: 32, Indels: 21 0.87 0.08 0.05 Matches are distributed among these distances: 51 12 0.03 52 30 0.08 53 3 0.01 54 1 0.00 55 92 0.25 56 224 0.61 57 5 0.01 58 2 0.01 ACGTcount: A:0.38, C:0.06, G:0.19, T:0.37 Consensus pattern (56 bp): TAATTAAGTAAATTGGTAATTAAGTTAAGTAATTTGGTAATCAACTTAATTCGGTG Found at i:19574 original size:16 final size:17 Alignment explanation

Indices: 19553--19589 Score: 58 Period size: 16 Copynumber: 2.2 Consensus size: 17 19543 TAATTCGGTG 19553 TAATTAAGTAA-ATTGA 1 TAATTAAGTAATATTGA * 19569 TAATTAAGTAATATTGG 1 TAATTAAGTAATATTGA 19586 TAAT 1 TAAT 19590 CAACTTAATT Statistics Matches: 19, Mismatches: 1, Indels: 1 0.90 0.05 0.05 Matches are distributed among these distances: 16 11 0.58 17 8 0.42 ACGTcount: A:0.46, C:0.00, G:0.14, T:0.41 Consensus pattern (17 bp): TAATTAAGTAATATTGA Found at i:19636 original size:29 final size:29 Alignment explanation

Indices: 19604--19694 Score: 80 Period size: 29 Copynumber: 3.2 Consensus size: 29 19594 TTAATTCGGT 19604 GTAATTAAGTAATTGGAAATTAAGTTAAA 1 GTAATTAAGTAATTGGAAATTAAGTTAAA ** ** * *** 19633 GTAATTTGGTAA--CCAACTTAA-TTCGGT 1 GTAATTAAGTAATTGGAAATTAAGTT-AAA 19660 GTAATTAAGTAATTGGAAATTAAGTTAAA 1 GTAATTAAGTAATTGGAAATTAAGTTAAA 19689 GTAATT 1 GTAATT 19695 TGGTAATCAA Statistics Matches: 42, Mismatches: 16, Indels: 8 0.64 0.24 0.12 Matches are distributed among these distances: 26 2 0.05 27 16 0.38 29 22 0.52 30 2 0.05 ACGTcount: A:0.42, C:0.04, G:0.18, T:0.36 Consensus pattern (29 bp): GTAATTAAGTAATTGGAAATTAAGTTAAA Found at i:19752 original size:111 final size:112 Alignment explanation

Indices: 19441--19908 Score: 668 Period size: 111 Copynumber: 4.2 Consensus size: 112 19431 AATTAGGGAT * * 19441 TAATTAAGTAAATTGGTAATTAAGTTAAGTAATTTGGCAATCAACTTAATTCGGTGTAATTAAGT 1 TAATTAAGTAAATTGGAAATTAAGTTAAGTAATTTGGTAATCAACTTAATTCGGTGTAATTAAGT * * * *** 19506 AAATTGGTGATTAAGTTAAGGAATGTGGTGGTCAACTTAATTCGGTG 66 AAATTGGTAATTAAGTTAAGTAATTTGGTAACCAACTTAATTCGGTG 19553 TAATTAAGTAAATT-G--A-TAA-TTAAGTAATATTGGTAATCAACTTAATTCGGTGTAATTAAG 1 TAATTAAGTAAATTGGAAATTAAGTTAAGTAAT-TTGGTAATCAACTTAATTCGGTGTAATTAAG * 19613 T-AATTGGAAATTAAGTTAAAGTAATTTGGTAACCAACTTAATTCGGTG 65 TAAATTGGTAATTAAGTT-AAGTAATTTGGTAACCAACTTAATTCGGTG 19661 TAATTAAGT-AATTGGAAATTAAGTTAAAGTAATTTGGTAATCAACTT-ATTCGGTGTAATTAAG 1 TAATTAAGTAAATTGGAAATTAAGTT-AAGTAATTTGGTAATCAACTTAATTCGGTGTAATTAAG ** * 19724 TAAATTGGTGGTTAAGTTAAGTAATTTGGTAACCAACTTAATTCGGCG 65 TAAATTGGTAATTAAGTTAAGTAATTTGGTAACCAACTTAATTCGGTG * 19772 TAATTAAGT-AATTGGAAATTAAGTTAAGTAATTTGGTAATCAACTTAATTCGATGTAATTAAGT 1 TAATTAAGTAAATTGGAAATTAAGTTAAGTAATTTGGTAATCAACTTAATTCGGTGTAATTAAGT ** 19836 AAATTGGTAATT-AGATTAAGTAATTTGGTAATTAACTTAATTCGGTG 66 AAATTGGTAATTAAG-TTAAGTAATTTGGTAACCAACTTAATTCGGTG * * 19883 CAATTAAGTAAACTGGTAAATTAAGT 1 TAATTAAGTAAATTGG-AAATTAAGT 19909 AATTCGGTAA Statistics Matches: 323, Mismatches: 20, Indels: 25 0.88 0.05 0.07 Matches are distributed among these distances: 107 27 0.08 108 69 0.21 109 1 0.00 110 24 0.07 111 138 0.43 112 48 0.15 113 16 0.05 ACGTcount: A:0.38, C:0.06, G:0.19, T:0.37 Consensus pattern (112 bp): TAATTAAGTAAATTGGAAATTAAGTTAAGTAATTTGGTAATCAACTTAATTCGGTGTAATTAAGT AAATTGGTAATTAAGTTAAGTAATTTGGTAACCAACTTAATTCGGTG Found at i:19819 original size:21 final size:20 Alignment explanation

Indices: 19775--19819 Score: 54 Period size: 21 Copynumber: 2.2 Consensus size: 20 19765 TTCGGCGTAA * * 19775 TTAAGTAATTGGAAATTAAG 1 TTAAGTAATTGGAAATCAAC * 19795 TTAAGTAATTTGGTAATCAAC 1 TTAAGTAA-TTGGAAATCAAC 19816 TTAA 1 TTAA 19820 TTCGATGTAA Statistics Matches: 21, Mismatches: 3, Indels: 1 0.84 0.12 0.04 Matches are distributed among these distances: 20 8 0.38 21 13 0.62 ACGTcount: A:0.42, C:0.04, G:0.16, T:0.38 Consensus pattern (20 bp): TTAAGTAATTGGAAATCAAC Found at i:19875 original size:21 final size:21 Alignment explanation

Indices: 19829--19869 Score: 73 Period size: 21 Copynumber: 2.0 Consensus size: 21 19819 ATTCGATGTA 19829 ATTAAGTAAATTGGTAATTAG 1 ATTAAGTAAATTGGTAATTAG * 19850 ATTAAGTAATTTGGTAATTA 1 ATTAAGTAAATTGGTAATTA 19870 ACTTAATTCG Statistics Matches: 19, Mismatches: 1, Indels: 0 0.95 0.05 0.00 Matches are distributed among these distances: 21 19 1.00 ACGTcount: A:0.41, C:0.00, G:0.17, T:0.41 Consensus pattern (21 bp): ATTAAGTAAATTGGTAATTAG Found at i:19892 original size:35 final size:35 Alignment explanation

Indices: 19850--19966 Score: 128 Period size: 35 Copynumber: 3.3 Consensus size: 35 19840 TGGTAATTAG 19850 ATTAAGTAATTTGGTAATTAACTTAATTCGGTGCA 1 ATTAAGTAATTTGGTAATTAACTTAATTCGGTGCA ** * ** 19885 ATTAAGTAAACTGGTAAATTAA-GTAATTCGGTAATTAA 1 ATTAAGTAATTTGGT-AATTAACTTAATTCGG---TGCA * * 19923 ATTAAGTAATTTGGTAGTTAACTCAATTCGGTGCA 1 ATTAAGTAATTTGGTAATTAACTTAATTCGGTGCA 19958 ATTAAGTAA 1 ATTAAGTAA 19967 ACTATTAAAT Statistics Matches: 65, Mismatches: 12, Indels: 10 0.75 0.14 0.11 Matches are distributed among these distances: 35 32 0.49 36 6 0.09 37 5 0.08 38 22 0.34 ACGTcount: A:0.38, C:0.08, G:0.17, T:0.37 Consensus pattern (35 bp): ATTAAGTAATTTGGTAATTAACTTAATTCGGTGCA Found at i:19906 original size:73 final size:73 Alignment explanation

Indices: 19828--19995 Score: 257 Period size: 73 Copynumber: 2.3 Consensus size: 73 19818 AATTCGATGT * * 19828 AATTAAGTAAATTGGTAATTAGATTAAGTAATTTGGTAATTAACTTAATTCGGTGCAATTAAGTA 1 AATTAAGTAAATTGGTAATTAAATTAAGTAATTTGGTAATTAACTCAATTCGGTGCAATTAAGTA * 19893 AACTGGTA 66 AACTAGTA * 19901 AATTAAGT-AATTCGGTAATTAAATTAAGTAATTTGGTAGTTAACTCAATTCGGTGCAATTAAGT 1 AATTAAGTAAATT-GGTAATTAAATTAAGTAATTTGGTAATTAACTCAATTCGGTGCAATTAAGT * 19965 AAACTATTA 65 AAACTAGTA * * 19974 AATTAAATAACTTGGTAATTAA 1 AATTAAGTAAATTGGTAATTAA 19996 CCTAATTCGG Statistics Matches: 86, Mismatches: 7, Indels: 4 0.89 0.07 0.04 Matches are distributed among these distances: 72 4 0.05 73 79 0.92 74 3 0.03 ACGTcount: A:0.41, C:0.07, G:0.15, T:0.37 Consensus pattern (73 bp): AATTAAGTAAATTGGTAATTAAATTAAGTAATTTGGTAATTAACTCAATTCGGTGCAATTAAGTA AACTAGTA Found at i:19925 original size:21 final size:21 Alignment explanation

Indices: 19899--19943 Score: 72 Period size: 21 Copynumber: 2.1 Consensus size: 21 19889 AGTAAACTGG 19899 TAAATTAAGTAATTCGGTAAT 1 TAAATTAAGTAATTCGGTAAT * * 19920 TAAATTAAGTAATTTGGTAGT 1 TAAATTAAGTAATTCGGTAAT 19941 TAA 1 TAA 19944 CTCAATTCGG Statistics Matches: 22, Mismatches: 2, Indels: 0 0.92 0.08 0.00 Matches are distributed among these distances: 21 22 1.00 ACGTcount: A:0.42, C:0.02, G:0.16, T:0.40 Consensus pattern (21 bp): TAAATTAAGTAATTCGGTAAT Found at i:19989 original size:52 final size:52 Alignment explanation

Indices: 19918--20019 Score: 152 Period size: 52 Copynumber: 2.0 Consensus size: 52 19908 TAATTCGGTA * * * 19918 ATTAAATTAAGTAATTTGGTAGTTAA-CTCAATTCGGTGCAATTAAGTAAACT 1 ATTAAATTAAATAACTTGGTAATTAACCT-AATTCGGTGCAATTAAGTAAACT * 19970 ATTAAATTAAATAACTTGGTAATTAACCTAATTCGGTGTAATTAAGTAAA 1 ATTAAATTAAATAACTTGGTAATTAACCTAATTCGGTGCAATTAAGTAAA 20020 TCAGTAATTA Statistics Matches: 45, Mismatches: 4, Indels: 2 0.88 0.08 0.04 Matches are distributed among these distances: 52 43 0.96 53 2 0.04 ACGTcount: A:0.41, C:0.09, G:0.14, T:0.36 Consensus pattern (52 bp): ATTAAATTAAATAACTTGGTAATTAACCTAATTCGGTGCAATTAAGTAAACT Found at i:20014 original size:35 final size:35 Alignment explanation

Indices: 19988--20090 Score: 161 Period size: 35 Copynumber: 2.9 Consensus size: 35 19978 AAATAACTTG * 19988 GTAATTAACCTAATTCGGTGTAATTAAGTAAATCA 1 GTAATTAACTTAATTCGGTGTAATTAAGTAAATCA * * 20023 GTAATTAAATTAATTTGGTGTAATTAAGTAAATCA 1 GTAATTAACTTAATTCGGTGTAATTAAGTAAATCA ** 20058 GTAATTGGCTTAATTCGGTGTAATTAAGTAAAT 1 GTAATTAACTTAATTCGGTGTAATTAAGTAAAT 20091 AAATGGCTTA Statistics Matches: 61, Mismatches: 7, Indels: 0 0.90 0.10 0.00 Matches are distributed among these distances: 35 61 1.00 ACGTcount: A:0.39, C:0.07, G:0.17, T:0.38 Consensus pattern (35 bp): GTAATTAACTTAATTCGGTGTAATTAAGTAAATCA Found at i:20028 original size:16 final size:16 Alignment explanation

Indices: 20007--20063 Score: 51 Period size: 16 Copynumber: 3.4 Consensus size: 16 19997 CTAATTCGGT 20007 GTAATTAAGTAAATCA 1 GTAATTAAGTAAATCA * * ** 20023 GTAATTAAATTAATTTGGT 1 GTAATT-AAGTAA-AT-CA 20042 GTAATTAAGTAAATCA 1 GTAATTAAGTAAATCA 20058 GTAATT 1 GTAATT 20064 GGCTTAATTC Statistics Matches: 30, Mismatches: 8, Indels: 6 0.68 0.18 0.14 Matches are distributed among these distances: 16 12 0.40 17 6 0.20 18 6 0.20 19 6 0.20 ACGTcount: A:0.44, C:0.04, G:0.14, T:0.39 Consensus pattern (16 bp): GTAATTAAGTAAATCA Found at i:20041 original size:52 final size:52 Alignment explanation

Indices: 19901--20041 Score: 144 Period size: 52 Copynumber: 2.6 Consensus size: 52 19891 TAAACTGGTA * * * 19901 AATTAAGTAATTCGGTAATTAAATTAAGTAATTTGGTAGTTAACTCAATTCGGTGC 1 AATTAAGTAAATCAGTAATTAAA-T---TAATTTGGTAATTAACTCAATTCGGTGC * * * 19957 AATTAAGTAAA-CTATTAAATTAAA-TAACTTGGTAATTAAC-CTAATTCGGTGT 1 AATTAAGTAAATC-AGT-AATTAAATTAATTTGGTAATTAACTC-AATTCGGTGC 20009 AATTAAGTAAATCAGTAATTAAATTAATTTGGT 1 AATTAAGTAAATCAGTAATTAAATTAATTTGGT 20042 GTAATTAAGT Statistics Matches: 72, Mismatches: 8, Indels: 14 0.77 0.09 0.15 Matches are distributed among these distances: 51 8 0.11 52 44 0.61 53 1 0.01 55 1 0.01 56 11 0.15 57 7 0.10 ACGTcount: A:0.40, C:0.08, G:0.14, T:0.38 Consensus pattern (52 bp): AATTAAGTAAATCAGTAATTAAATTAATTTGGTAATTAACTCAATTCGGTGC Found at i:20101 original size:31 final size:34 Alignment explanation

Indices: 19998--20103 Score: 137 Period size: 35 Copynumber: 3.1 Consensus size: 34 19988 GTAATTAACC *** 19998 TAATTCGGTGTAATTAAGTAAATCAGTAATTAAAT 1 TAATTCGGTGTAATTAAGTAAATCAG-AATTGGCT * 20033 TAATTTGGTGTAATTAAGTAAATCAGTAATTGGCT 1 TAATTCGGTGTAATTAAGTAAATCAG-AATTGGCT 20068 TAATTCGGTGTAATTAAGTAAAT-A-AA-TGGCT 1 TAATTCGGTGTAATTAAGTAAATCAGAATTGGCT 20099 TAATT 1 TAATT 20104 AGGAGTCAGT Statistics Matches: 66, Mismatches: 5, Indels: 4 0.88 0.07 0.05 Matches are distributed among these distances: 31 10 0.15 32 2 0.03 34 1 0.02 35 53 0.80 ACGTcount: A:0.39, C:0.06, G:0.17, T:0.39 Consensus pattern (34 bp): TAATTCGGTGTAATTAAGTAAATCAGAATTGGCT Found at i:24077 original size:2 final size:2 Alignment explanation

Indices: 24070--24095 Score: 52 Period size: 2 Copynumber: 13.0 Consensus size: 2 24060 AGCCAGAATA 24070 AT AT AT AT AT AT AT AT AT AT AT AT AT 1 AT AT AT AT AT AT AT AT AT AT AT AT AT 24096 TAAAATAATA Statistics Matches: 24, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 2 24 1.00 ACGTcount: A:0.50, C:0.00, G:0.00, T:0.50 Consensus pattern (2 bp): AT Found at i:24467 original size:15 final size:14 Alignment explanation

Indices: 24447--24482 Score: 54 Period size: 15 Copynumber: 2.5 Consensus size: 14 24437 TGCCTGATTA 24447 TTTTTATTTTTATT 1 TTTTTATTTTTATT * 24461 GTTTTTAATTTTATT 1 -TTTTTATTTTTATT 24476 TTTTTAT 1 TTTTTAT 24483 AAAAAAATCA Statistics Matches: 19, Mismatches: 2, Indels: 1 0.86 0.09 0.05 Matches are distributed among these distances: 14 6 0.32 15 13 0.68 ACGTcount: A:0.17, C:0.00, G:0.03, T:0.81 Consensus pattern (14 bp): TTTTTATTTTTATT Found at i:24740 original size:17 final size:18 Alignment explanation

Indices: 24720--24766 Score: 60 Period size: 19 Copynumber: 2.6 Consensus size: 18 24710 ACTAAAATTT 24720 TTGTTTATAAAA-AAAAA 1 TTGTTTATAAAATAAAAA * * 24737 TTGTTTATACAAATTAAAT 1 TTGTTTATA-AAATAAAAA 24756 TTGTTTATAAA 1 TTGTTTATAAA 24767 TTTGGACTCA Statistics Matches: 26, Mismatches: 2, Indels: 3 0.84 0.06 0.10 Matches are distributed among these distances: 17 9 0.35 18 5 0.19 19 12 0.46 ACGTcount: A:0.47, C:0.02, G:0.06, T:0.45 Consensus pattern (18 bp): TTGTTTATAAAATAAAAA Found at i:26571 original size:9 final size:10 Alignment explanation

Indices: 26560--26604 Score: 51 Period size: 9 Copynumber: 4.6 Consensus size: 10 26550 ATAATTTTAT 26560 TTATTTATT- 1 TTATTTATTA 26569 TTAGTATTATTA 1 TTA-T-TTATTA 26581 TTA-TTATTA 1 TTATTTATTA 26590 TTA-TTATTA 1 TTATTTATTA 26599 TTATTT 1 TTATTT 26605 CATTCAGTAT Statistics Matches: 32, Mismatches: 0, Indels: 7 0.82 0.00 0.18 Matches are distributed among these distances: 9 21 0.66 10 3 0.09 11 5 0.16 12 3 0.09 ACGTcount: A:0.29, C:0.00, G:0.02, T:0.69 Consensus pattern (10 bp): TTATTTATTA Found at i:26581 original size:3 final size:3 Alignment explanation

Indices: 26564--26603 Score: 64 Period size: 3 Copynumber: 13.7 Consensus size: 3 26554 TTTTATTTAT * 26564 TTA TT- TTA GTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TT 1 TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TTA TT 26604 TCATTCAGTA Statistics Matches: 34, Mismatches: 2, Indels: 2 0.89 0.05 0.05 Matches are distributed among these distances: 2 2 0.06 3 32 0.94 ACGTcount: A:0.30, C:0.00, G:0.03, T:0.68 Consensus pattern (3 bp): TTA Found at i:37342 original size:29 final size:29 Alignment explanation

Indices: 37309--37365 Score: 114 Period size: 29 Copynumber: 2.0 Consensus size: 29 37299 TTCAAGGACA 37309 CACAATGGAAGATTTCAACAATACTTACT 1 CACAATGGAAGATTTCAACAATACTTACT 37338 CACAATGGAAGATTTCAACAATACTTAC 1 CACAATGGAAGATTTCAACAATACTTAC 37366 ACGGCTCTTT Statistics Matches: 28, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 29 28 1.00 ACGTcount: A:0.42, C:0.21, G:0.11, T:0.26 Consensus pattern (29 bp): CACAATGGAAGATTTCAACAATACTTACT Found at i:37483 original size:13 final size:13 Alignment explanation

Indices: 37465--37489 Score: 50 Period size: 13 Copynumber: 1.9 Consensus size: 13 37455 CTTAAATACA 37465 AAAAAAAAAAAGG 1 AAAAAAAAAAAGG 37478 AAAAAAAAAAAG 1 AAAAAAAAAAAG 37490 AGGGTTTAAA Statistics Matches: 12, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 13 12 1.00 ACGTcount: A:0.88, C:0.00, G:0.12, T:0.00 Consensus pattern (13 bp): AAAAAAAAAAAGG Done.