Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWUE01016479.1 Corchorus olitorius cultivar O-4 contig16512, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 84313
ACGTcount: A:0.32, C:0.18, G:0.19, T:0.31


Found at i:7621 original size:41 final size:43

Alignment explanation

Indices: 7564--7649 Score: 131 Period size: 41 Copynumber: 2.0 Consensus size: 43 7554 TTAGATATAT 7564 AGCACCCAAAATACACTATAC-A-ACACTAATTAATAATTGAA 1 AGCACCCAAAATACACTATACAATACACTAATTAATAATTGAA * 7605 AGCACCCAAATTACACTATACATAATACACTAATTAATAATTGAA 1 AGCACCCAAAATACACTATAC--AATACACTAATTAATAATTGAA 7650 GGCTTTCTTT Statistics Matches: 40, Mismatches: 1, Indels: 4 0.89 0.02 0.09 Matches are distributed among these distances: 41 20 0.50 44 1 0.03 45 19 0.47 ACGTcount: A:0.50, C:0.21, G:0.05, T:0.24 Consensus pattern (43 bp): AGCACCCAAAATACACTATACAATACACTAATTAATAATTGAA Found at i:9817 original size:13 final size:13 Alignment explanation

Indices: 9799--9823 Score: 50 Period size: 13 Copynumber: 1.9 Consensus size: 13 9789 TTTTTTTTTT 9799 TTCAAAATTGAAG 1 TTCAAAATTGAAG 9812 TTCAAAATTGAA 1 TTCAAAATTGAA 9824 ATGCAAACGG Statistics Matches: 12, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 13 12 1.00 ACGTcount: A:0.48, C:0.08, G:0.12, T:0.32 Consensus pattern (13 bp): TTCAAAATTGAAG Found at i:12899 original size:15 final size:15 Alignment explanation

Indices: 12879--12908 Score: 60 Period size: 15 Copynumber: 2.0 Consensus size: 15 12869 GGATCCTGTC 12879 TTGTGAATGGAATGA 1 TTGTGAATGGAATGA 12894 TTGTGAATGGAATGA 1 TTGTGAATGGAATGA 12909 GAGTTCGAGT Statistics Matches: 15, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 15 15 1.00 ACGTcount: A:0.33, C:0.00, G:0.33, T:0.33 Consensus pattern (15 bp): TTGTGAATGGAATGA Found at i:12958 original size:29 final size:29 Alignment explanation

Indices: 12925--12982 Score: 116 Period size: 29 Copynumber: 2.0 Consensus size: 29 12915 GAGTCTTATA 12925 AATGAAAGTAAATGAAATGTGAAATGTGG 1 AATGAAAGTAAATGAAATGTGAAATGTGG 12954 AATGAAAGTAAATGAAATGTGAAATGTGG 1 AATGAAAGTAAATGAAATGTGAAATGTGG 12983 CACTTGTTAT Statistics Matches: 29, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 29 29 1.00 ACGTcount: A:0.48, C:0.00, G:0.28, T:0.24 Consensus pattern (29 bp): AATGAAAGTAAATGAAATGTGAAATGTGG Found at i:18173 original size:15 final size:15 Alignment explanation

Indices: 18153--18187 Score: 54 Period size: 15 Copynumber: 2.4 Consensus size: 15 18143 TTCTTTTATC * 18153 TAACTTATCGGATAA 1 TAACTTATCCGATAA 18168 TAACTTATCCGATAA 1 TAACTTATCCGATAA 18183 -AACTT 1 TAACTT 18188 TTATGTTAAA Statistics Matches: 19, Mismatches: 1, Indels: 1 0.90 0.05 0.05 Matches are distributed among these distances: 14 5 0.26 15 14 0.74 ACGTcount: A:0.40, C:0.17, G:0.09, T:0.34 Consensus pattern (15 bp): TAACTTATCCGATAA Found at i:20726 original size:4 final size:4 Alignment explanation

Indices: 20717--20747 Score: 62 Period size: 4 Copynumber: 7.8 Consensus size: 4 20707 AAAGTCCAGT 20717 TTTA TTTA TTTA TTTA TTTA TTTA TTTA TTT 1 TTTA TTTA TTTA TTTA TTTA TTTA TTTA TTT 20748 TTTTTAAGCA Statistics Matches: 27, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 4 27 1.00 ACGTcount: A:0.23, C:0.00, G:0.00, T:0.77 Consensus pattern (4 bp): TTTA Found at i:33574 original size:6 final size:6 Alignment explanation

Indices: 33563--33587 Score: 50 Period size: 6 Copynumber: 4.2 Consensus size: 6 33553 GTTGTCGGGT 33563 GTGGAG GTGGAG GTGGAG GTGGAG G 1 GTGGAG GTGGAG GTGGAG GTGGAG G 33588 GGTTTAAGGT Statistics Matches: 19, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 6 19 1.00 ACGTcount: A:0.16, C:0.00, G:0.68, T:0.16 Consensus pattern (6 bp): GTGGAG Found at i:37633 original size:60 final size:60 Alignment explanation

Indices: 37570--37754 Score: 214 Period size: 60 Copynumber: 3.1 Consensus size: 60 37560 GTATCTAGAT * * * * * 37570 GGTGGCGTGCGGCCTTGAGTAGGCGGCGAGTATTGCCTGGGTGGTGGATAGCCTTGAGTT 1 GGTGGTGTGAGGCCTTGAGTGGGTGGCGAGTATTGCCTGGGTGGTGGATAGCCTTGAGTG * * * * * 37630 GGTGGTG-GATGCCTTTGAATGGGTGGTGAATATTGCCTTGGTGGTGGAT-GCCTTTGAGTG 1 GGTGGTGTGAGGCC-TTGAGTGGGTGGCGAGTATTGCCTGGGTGGTGGATAGCC-TTGAGTG * * 37690 GGTGGTGTGTGGCCTTGAGTGGGTGGCGGGTATTGCCTGGGTGGTGGATGAG-CTTGAGTG 1 GGTGGTGTGAGGCCTTGAGTGGGTGGCGAGTATTGCCTGGGTGGTGGAT-AGCCTTGAGTG 37750 GGTGG 1 GGTGG 37755 AGTGTATGTA Statistics Matches: 103, Mismatches: 17, Indels: 10 0.79 0.13 0.08 Matches are distributed among these distances: 59 7 0.07 60 90 0.87 61 5 0.05 62 1 0.01 ACGTcount: A:0.11, C:0.12, G:0.47, T:0.30 Consensus pattern (60 bp): GGTGGTGTGAGGCCTTGAGTGGGTGGCGAGTATTGCCTGGGTGGTGGATAGCCTTGAGTG Found at i:37635 original size:21 final size:20 Alignment explanation

Indices: 37607--37796 Score: 92 Period size: 21 Copynumber: 9.5 Consensus size: 20 37597 GAGTATTGCC 37607 TGGGTGGTGGATAGCCTTGAG 1 TGGGTGGTGGAT-GCCTTGAG * * 37628 TTGGTGGTGGATGCCTTTGAA 1 TGGGTGGTGGATGCC-TTGAG * * ** 37649 TGGGTGGTGAAT--ATTGCC 1 TGGGTGGTGGATGCCTTGAG * 37667 TTGGTGGTGGATGCCTTTGAG 1 TGGGTGGTGGATGCC-TTGAG 37688 TGGGTGGTGTG-TGGCCTTGAG 1 TGGGTGGTG-GAT-GCCTTGAG * ** ** 37709 TGGGTGGCGG--GTATTGCC 1 TGGGTGGTGGATGCCTTGAG * 37727 TGGGTGGTGGATGAGCTTGAG 1 TGGGTGGTGGATG-CCTTGAG * * 37748 TGGGTGGAGTGTATG--TAGA- 1 TGGGT-G-GTGGATGCCTTGAG 37767 T-GGTGGTGGATGCCTTTGAG 1 TGGGTGGTGGATGCC-TTGAG * 37787 TGGGAGGTGG 1 TGGGTGGTGG 37797 GTATTGCCTG Statistics Matches: 125, Mismatches: 28, Indels: 32 0.68 0.15 0.17 Matches are distributed among these distances: 16 6 0.05 17 1 0.01 18 29 0.23 19 4 0.03 20 9 0.07 21 65 0.52 22 5 0.04 23 6 0.05 ACGTcount: A:0.12, C:0.08, G:0.47, T:0.32 Consensus pattern (20 bp): TGGGTGGTGGATGCCTTGAG Found at i:37715 original size:39 final size:39 Alignment explanation

Indices: 37607--37715 Score: 107 Period size: 39 Copynumber: 2.7 Consensus size: 39 37597 GAGTATTGCC 37607 TGGGTGGTG-GATAGCCTTGAGTTGGTGGTGGATGCCTTTGAA 1 TGGGTGGTGTG-TAGCCTTGAG-T-G-GGTGGATGCCTTTGAA * * * 37649 TGGGTGGTGAATATTGCCTTG-GT-GGTGGATGCCTTTGAG 1 TGGGTGGTG--TGTAGCCTTGAGTGGGTGGATGCCTTTGAA * 37688 TGGGTGGTGTGTGGCCTTGAGTGGGTGG 1 TGGGTGGTGTGTAGCCTTGAGTGGGTGG 37716 CGGGTATTGC Statistics Matches: 57, Mismatches: 5, Indels: 13 0.76 0.07 0.17 Matches are distributed among these distances: 37 8 0.14 38 2 0.04 39 29 0.51 42 10 0.18 43 1 0.02 44 7 0.12 ACGTcount: A:0.11, C:0.09, G:0.46, T:0.34 Consensus pattern (39 bp): TGGGTGGTGTGTAGCCTTGAGTGGGTGGATGCCTTTGAA Found at i:37731 original size:39 final size:39 Alignment explanation

Indices: 37688--37904 Score: 166 Period size: 39 Copynumber: 5.6 Consensus size: 39 37678 TGCCTTTGAG * 37688 TGGGTGGTGTG-TGGCCTTGAGTGGGTGGCGGGTATTGCC 1 TGGGTGGTG-GATGGCCTTGAGTGGGTGGAGGGTATTGCC * * 37727 TGGGTGGTGGATGAG-CTTGAGTGGGTGGAGTGTATGTAG-A 1 TGGGTGGTGGATG-GCCTTGAGTGGGTGGAGGGTAT-T-GCC * * 37767 T-GGTGGTGGAT-GCCTTTGAGTGGGAGGTGGGTATTGCC 1 TGGGTGGTGGATGGCC-TTGAGTGGGTGGAGGGTATTGCC * * * * 37805 TGGGTGGTGGATGAG-CTTGAGTTGGCGGAGTGTATGTAG-A 1 TGGGTGGTGGATG-GCCTTGAGTGGGTGGAGGGTAT-T-GCC * * 37845 T-GGTGGTGGAT-GCCTTTGAGTGGGAGGTGGGTATTGCC 1 TGGGTGGTGGATGGCC-TTGAGTGGGTGGAGGGTATTGCC * 37883 TAGGTGGTGGATGAG-CTTGAGT 1 TGGGTGGTGGATG-GCCTTGAGT 37905 TGGCGGAGTG Statistics Matches: 143, Mismatches: 17, Indels: 36 0.73 0.09 0.18 Matches are distributed among these distances: 37 4 0.03 38 7 0.05 39 121 0.85 40 7 0.05 41 4 0.03 ACGTcount: A:0.13, C:0.08, G:0.48, T:0.31 Consensus pattern (39 bp): TGGGTGGTGGATGGCCTTGAGTGGGTGGAGGGTATTGCC Found at i:37786 original size:78 final size:78 Alignment explanation

Indices: 37704--37941 Score: 431 Period size: 78 Copynumber: 3.1 Consensus size: 78 37694 GTGTGTGGCC * * * * 37704 TTGAGTGGGTGGCGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTGGGTGGAGTGTATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 37769 GTGGTGGATGCCT 66 GTGGTGGATGCCT 37782 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 37847 GTGGTGGATGCCT 66 GTGGTGGATGCCT * 37860 TTGAGTGGGAGGTGGGTATTGCCTAGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 37925 GTGGTGGATGCCT 66 GTGGTGGATGCCT 37938 TTGA 1 TTGA 37942 ACGGGTGGTG Statistics Matches: 155, Mismatches: 5, Indels: 0 0.97 0.03 0.00 Matches are distributed among these distances: 78 155 1.00 ACGTcount: A:0.14, C:0.08, G:0.47, T:0.31 Consensus pattern (78 bp): TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG GTGGTGGATGCCT Found at i:37890 original size:156 final size:156 Alignment explanation

Indices: 37704--38523 Score: 1172 Period size: 156 Copynumber: 5.1 Consensus size: 156 37694 GTGTGTGGCC * * * * 37704 TTGAGTGGGTGGCGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTGGGTGGAGTGTATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 37769 GTGGTGGATGCCTTTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGA 66 GTGGTGGATGCCTTTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGA 37834 GTGTATGTAGATGGTGGTGGATGCCT 131 GTGTATGTAGATGGTGGTGGATGCCT * 37860 TTGAGTGGGAGGTGGGTATTGCCTAGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG ** * ** ** 37925 GTGGTGGATGCCTTTGAACGGGTGGTGTACGGCCTTGAGTGGGTGGTGGGTATTGCCTTGGTGGT 66 GTGGTGGATGCCTTTGAGTGGGAGGTG---GGTATTGCCTGGGTGGT-GG-A------------T * * * 37990 GGATGACTTTGAGTGGGTGGAGTGTATGCAGATGGTGGTGGATGCCT 114 -GA-G-C-TTGAGTTGGCGGAGTGTATGTAGATGGTGGTGGATGCCT * * * * 38037 TTGAGTGGGTGGCGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTGGGTGGAGTGTATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG * 38102 GTGGTGGATGCCTTTGAGTTGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGA 66 GTGGTGGATGCCTTTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGA * * 38167 GTATATGTAGATGGTGGTGGATGCTT 131 GTGTATGTAGATGGTGGTGGATGCCT * 38193 TTGAGTTGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 38258 GTGGTGGATGCCTTTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGA 66 GTGGTGGATGCCTTTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGA 38323 GTGTATGTAGATGGTGGTGGATGCCT 131 GTGTATGTAGATGGTGGTGGATGCCT * * * 38349 TTGAGTAGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGAGGAGTGTATGTAGAGG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG * * 38414 GTGGTGGATGCCTTTGAGTAGGAGGTGGGTATTGCTTGGGTGGTGGATGAGCTTGAGTTGGCGGA 66 GTGGTGGATGCCTTTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGA 38479 GTGTATGTAGATGGTGGTGGATGCCT 131 GTGTATGTAGATGGTGGTGGATGCCT * * * 38505 TTGAATGGGTGGTGAGTAT 1 TTGAGTGGGAGGTGGGTAT 38524 GTAGACGGGG Statistics Matches: 593, Mismatches: 50, Indels: 42 0.87 0.07 0.06 Matches are distributed among these distances: 156 432 0.73 157 1 0.00 158 1 0.00 159 15 0.03 160 3 0.01 161 1 0.00 172 1 0.00 173 3 0.01 174 15 0.03 175 1 0.00 176 1 0.00 177 119 0.20 ACGTcount: A:0.15, C:0.07, G:0.47, T:0.31 Consensus pattern (156 bp): TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG GTGGTGGATGCCTTTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGA GTGTATGTAGATGGTGGTGGATGCCT Found at i:37928 original size:39 final size:39 Alignment explanation

Indices: 37729--37934 Score: 199 Period size: 39 Copynumber: 5.3 Consensus size: 39 37719 GTATTGCCTG * 37729 GGTGGTGGATGAGCTTGAGTGGGTGGAGTGTATGTAGAT 1 GGTGGTGGATGAGCTTGAGTGGGAGGAGTGTATGTAGAT * * * * 37768 GGTGGTGGATG-CCTTTGAGTGGGAGGTGGGTAT-T-GCCT 1 GGTGGTGGATGAGC-TTGAGTGGGAGGAGTGTATGTAG-AT * * 37806 GGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGAT 1 -GGTGGTGGATGAGCTTGAGTGGGAGGAGTGTATGTAGAT * * * * 37846 GGTGGTGGATG-CCTTTGAGTGGGAGGTGGGTAT-T-GCCT 1 GGTGGTGGATGAGC-TTGAGTGGGAGGAGTGTATGTAG-AT * * 37884 AGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGAT 1 -GGTGGTGGATGAGCTTGAGTGGGAGGAGTGTATGTAGAT 37924 GGTGGTGGATG 1 GGTGGTGGATG 37935 CCTTTGAACG Statistics Matches: 132, Mismatches: 23, Indels: 24 0.74 0.13 0.13 Matches are distributed among these distances: 37 2 0.02 38 6 0.05 39 116 0.88 40 6 0.05 41 2 0.02 ACGTcount: A:0.15, C:0.06, G:0.48, T:0.31 Consensus pattern (39 bp): GGTGGTGGATGAGCTTGAGTGGGAGGAGTGTATGTAGAT Found at i:37965 original size:177 final size:177 Alignment explanation

Indices: 37782--38118 Score: 568 Period size: 177 Copynumber: 1.9 Consensus size: 177 37772 GTGGATGCCT * * 37782 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGC-TTGAGTTGGCGGAGTGTATGTAGAT 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGA-CTTTGAGTGGGCGGAGTGTATGCAGAT * * 37846 GGTGGTGGATGCCTTTGAGTGGGAGGTGGGTATTGCCTAGGTGGTGGATGAGCTTGAGTTGGCGG 65 GGTGGTGGATGCCTTTGAGTGGGAGGCGGGTATTGCCTAGGTGGTGGATGAGCTTGAGTGGGCGG 37911 AGTGTATGTAGATGGTGGTGGATGCCTTTGAACGGGTGGTGTACGGCC 130 AGTGTATGTAGATGGTGGTGGATGCCTTTGAACGGGTGGTGTACGGCC * * * 37959 TTGAGTGGGTGGTGGGTATTGCCTTGGTGGTGGATGACTTTGAGTGGGTGGAGTGTATGCAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGACTTTGAGTGGGCGGAGTGTATGCAGATG * * * 38024 GTGGTGGATGCCTTTGAGTGGGTGGCGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTGGGTGGA 66 GTGGTGGATGCCTTTGAGTGGGAGGCGGGTATTGCCTAGGTGGTGGATGAGCTTGAGTGGGCGGA 38089 GTGTATGTAGATGGTGGTGGATGCCTTTGA 131 GTGTATGTAGATGGTGGTGGATGCCTTTGA 38119 GTTGGAGGTG Statistics Matches: 149, Mismatches: 10, Indels: 2 0.93 0.06 0.01 Matches are distributed among these distances: 176 1 0.01 177 148 0.99 ACGTcount: A:0.14, C:0.08, G:0.47, T:0.31 Consensus pattern (177 bp): TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGACTTTGAGTGGGCGGAGTGTATGCAGATG GTGGTGGATGCCTTTGAGTGGGAGGCGGGTATTGCCTAGGTGGTGGATGAGCTTGAGTGGGCGGA GTGTATGTAGATGGTGGTGGATGCCTTTGAACGGGTGGTGTACGGCC Found at i:37988 original size:39 final size:39 Alignment explanation

Indices: 37945--38471 Score: 229 Period size: 39 Copynumber: 13.5 Consensus size: 39 37935 CCTTTGAACG * * * 37945 GGTGGTGTACGGCCTTGAGTGGGTGGTGGGTATTGCCTT 1 GGTGGTGGATGGCCTTGAGTGGGTGGAGGGTATTGCCTT * * * ** 37984 GGTGGTGGATGACTTTGAGTGGGTGGAGTGTA-TGCAGAT 1 GGTGGTGGATGGCCTTGAGTGGGTGGAGGGTATTGC-CTT * * 38023 GGTGGTGGAT-GCCTTTGAGTGGGTGGCGGGTATTGCCTG 1 GGTGGTGGATGGCC-TTGAGTGGGTGGAGGGTATTGCCTT * * 38062 GGTGGTGGATGAG-CTTGAGTGGGTGGAGTGTATGTAG--AT 1 GGTGGTGGATG-GCCTTGAGTGGGTGGAGGGTAT-T-GCCTT * * * * 38101 GGTGGTGGAT-GCCTTTGAGTTGGAGGTGGGTATTGCCTG 1 GGTGGTGGATGGCC-TTGAGTGGGTGGAGGGTATTGCCTT * * *** 38140 GGTGGTGGATGAG-CTTGAGTTGGCGGA--GTATATGTAGAT 1 GGTGGTGGATG-GCCTTGAGTGGGTGGAGGGTAT-TG-CCTT * * * * * 38179 GGTGGTGGAT-GCTTTTGAGTTGGAGGTGGGTATTGCCTG 1 GGTGGTGGATGGC-CTTGAGTGGGTGGAGGGTATTGCCTT * * * * 38218 GGTGGTGGATGAG-CTTGAGTTGGCGGAGTGTATGTAG--AT 1 GGTGGTGGATG-GCCTTGAGTGGGTGGAGGGTAT-T-GCCTT * * * 38257 GGTGGTGGAT-GCCTTTGAGTGGGAGGTGGGTATTGCCTG 1 GGTGGTGGATGGCC-TTGAGTGGGTGGAGGGTATTGCCTT * * * * 38296 GGTGGTGGATGAG-CTTGAGTTGGCGGAGTGTATGTAG--AT 1 GGTGGTGGATG-GCCTTGAGTGGGTGGAGGGTAT-T-GCCTT * * * * 38335 GGTGGTGGAT-GCCTTTGAGTAGGAGGTGGGTATTGCCTG 1 GGTGGTGGATGGCC-TTGAGTGGGTGGAGGGTATTGCCTT * * * ** 38374 GGTGGTGGATGAG-CTTGAGTTGGAGGAGTGTATGTAG--AG 1 GGTGGTGGATG-GCCTTGAGTGGGTGGAGGGTAT-T-GCCTT * * * 38413 GGTGGTGGAT-GCCTTTGAGTAGGAGGTGGGTATTG-CTT 1 GGTGGTGGATGGCC-TTGAGTGGGTGGAGGGTATTGCCTT 38451 GGGTGGTGGATGAG-CTTGAGT 1 -GGTGGTGGATG-GCCTTGAGT 38472 TGGCGGAGTG Statistics Matches: 372, Mismatches: 71, Indels: 90 0.70 0.13 0.17 Matches are distributed among these distances: 37 13 0.03 38 14 0.04 39 317 0.85 40 14 0.04 41 14 0.04 ACGTcount: A:0.14, C:0.07, G:0.47, T:0.31 Consensus pattern (39 bp): GGTGGTGGATGGCCTTGAGTGGGTGGAGGGTATTGCCTT Found at i:38008 original size:21 final size:21 Alignment explanation

Indices: 37924--38087 Score: 55 Period size: 21 Copynumber: 8.2 Consensus size: 21 37914 GTATGTAGAT * ** 37924 GGTGGTGGATGCCTTTGAACG 1 GGTGGTGGATGACTTTGAGTG * * * * 37945 GGTGGTGTACGGCCTTGAGTG 1 GGTGGTGGATGACTTTGAGTG * ** * 37966 GGTGGTGGGT-A--TTGCCTT 1 GGTGGTGGATGACTTTGAGTG 37984 GGTGGTGGATGACTTTGAGTG 1 GGTGGTGGATGACTTTGAGTG * * 38005 GGTGG-AG-TG--TATGCAGAT- 1 GGTGGTGGATGACTTTG-AG-TG * 38023 GGTGGTGGATGCCTTTGAGTG 1 GGTGGTGGATGACTTTGAGTG * * ** 38044 GGTGGCGGGT-A--TTGCCTG 1 GGTGGTGGATGACTTTGAGTG 38062 GGTGGTGGATGAGC-TTGAGTG 1 GGTGGTGGATGA-CTTTGAGTG 38083 GGTGG 1 GGTGG 38088 AGTGTATGTA Statistics Matches: 100, Mismatches: 30, Indels: 26 0.64 0.19 0.17 Matches are distributed among these distances: 17 3 0.03 18 33 0.33 19 6 0.06 20 4 0.04 21 51 0.51 22 3 0.03 ACGTcount: A:0.12, C:0.10, G:0.48, T:0.30 Consensus pattern (21 bp): GGTGGTGGATGACTTTGAGTG Found at i:38048 original size:99 final size:99 Alignment explanation

Indices: 37860--38040 Score: 301 Period size: 99 Copynumber: 1.8 Consensus size: 99 37850 GTGGATGCCT * * 37860 TTGAGTGGGAGGTGGGTATTGCCTAGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTAGGTGGTGGATGAGCTTGAGTGGGCGGAGTGTATGCAGATG 37925 GTGGTGGATGCCTTTGAACGGGTGGTGTACGGCC 66 GTGGTGGATGCCTTTGAACGGGTGGTGTACGGCC * * * 37959 TTGAGTGGGTGGTGGGTATTGCCTTGGTGGTGGATGA-CTTTGAGTGGGTGGAGTGTATGCAGAT 1 TTGAGTGGGAGGTGGGTATTGCCTAGGTGGTGGATGAGC-TTGAGTGGGCGGAGTGTATGCAGAT 38023 GGTGGTGGATGCCTTTGA 65 GGTGGTGGATGCCTTTGA 38041 GTGGGTGGCG Statistics Matches: 76, Mismatches: 5, Indels: 2 0.92 0.06 0.02 Matches are distributed among these distances: 98 1 0.01 99 75 0.99 ACGTcount: A:0.14, C:0.09, G:0.45, T:0.31 Consensus pattern (99 bp): TTGAGTGGGAGGTGGGTATTGCCTAGGTGGTGGATGAGCTTGAGTGGGCGGAGTGTATGCAGATG GTGGTGGATGCCTTTGAACGGGTGGTGTACGGCC Found at i:38556 original size:78 final size:78 Alignment explanation

Indices: 37959--38523 Score: 925 Period size: 78 Copynumber: 7.2 Consensus size: 78 37949 GTGTACGGCC * * * * * 37959 TTGAGTGGGTGGTGGGTATTGCCTTGGTGGTGGATGA-CTTTGAGTGGGTGGAGTGTATGCAGAT 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGC-TTGAGTTGGCGGAGTGTATGTAGAT 38023 GGTGGTGGATGCCT 65 GGTGGTGGATGCCT * * * * 38037 TTGAGTGGGTGGCGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTGGGTGGAGTGTATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 38102 GTGGTGGATGCCT 66 GTGGTGGATGCCT * * 38115 TTGAGTTGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTATATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG * 38180 GTGGTGGATGCTT 66 GTGGTGGATGCCT * 38193 TTGAGTTGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 38258 GTGGTGGATGCCT 66 GTGGTGGATGCCT 38271 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 38336 GTGGTGGATGCCT 66 GTGGTGGATGCCT * * * 38349 TTGAGTAGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGAGGAGTGTATGTAGAGG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 38414 GTGGTGGATGCCT 66 GTGGTGGATGCCT * * 38427 TTGAGTAGGAGGTGGGTATTGCTTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 1 TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG 38492 GTGGTGGATGCCT 66 GTGGTGGATGCCT * * * 38505 TTGAATGGGTGGTGAGTAT 1 TTGAGTGGGAGGTGGGTAT 38524 GTAGACGGGG Statistics Matches: 463, Mismatches: 23, Indels: 2 0.95 0.05 0.00 Matches are distributed among these distances: 78 462 1.00 79 1 0.00 ACGTcount: A:0.15, C:0.07, G:0.47, T:0.32 Consensus pattern (78 bp): TTGAGTGGGAGGTGGGTATTGCCTGGGTGGTGGATGAGCTTGAGTTGGCGGAGTGTATGTAGATG GTGGTGGATGCCT Found at i:44255 original size:27 final size:27 Alignment explanation

Indices: 44204--44255 Score: 77 Period size: 27 Copynumber: 1.9 Consensus size: 27 44194 GTCATTTAAT ** * 44204 AATTCAATTTTAATACTTTTTTAAGGG 1 AATTCAATTTTAATACTGATATAAGGG 44231 AATTCAATTTTAATACTGATATAAG 1 AATTCAATTTTAATACTGATATAAG 44256 TAATAGAAAT Statistics Matches: 22, Mismatches: 3, Indels: 0 0.88 0.12 0.00 Matches are distributed among these distances: 27 22 1.00 ACGTcount: A:0.38, C:0.08, G:0.10, T:0.44 Consensus pattern (27 bp): AATTCAATTTTAATACTGATATAAGGG Found at i:44560 original size:21 final size:21 Alignment explanation

Indices: 44534--44573 Score: 62 Period size: 21 Copynumber: 1.9 Consensus size: 21 44524 TTGTTTGGCA * * 44534 ACTGTACAGATTAGATTATGT 1 ACTGTACAAATGAGATTATGT 44555 ACTGTACAAATGAGATTAT 1 ACTGTACAAATGAGATTAT 44574 TAGAGCAACG Statistics Matches: 17, Mismatches: 2, Indels: 0 0.89 0.11 0.00 Matches are distributed among these distances: 21 17 1.00 ACGTcount: A:0.38, C:0.10, G:0.17, T:0.35 Consensus pattern (21 bp): ACTGTACAAATGAGATTATGT Found at i:47085 original size:18 final size:18 Alignment explanation

Indices: 47062--47096 Score: 52 Period size: 18 Copynumber: 1.9 Consensus size: 18 47052 AGATCATCAT 47062 CATCACCACCACCACCAC 1 CATCACCACCACCACCAC * * 47080 CATCACGATCACCACCA 1 CATCACCACCACCACCA 47097 TCATGGCCAT Statistics Matches: 15, Mismatches: 2, Indels: 0 0.88 0.12 0.00 Matches are distributed among these distances: 18 15 1.00 ACGTcount: A:0.34, C:0.54, G:0.03, T:0.09 Consensus pattern (18 bp): CATCACCACCACCACCAC Found at i:50262 original size:21 final size:20 Alignment explanation

Indices: 50240--50277 Score: 67 Period size: 20 Copynumber: 1.9 Consensus size: 20 50230 CCATTAGGCA 50240 AAAAAAAAAAATTAAAGAAC 1 AAAAAAAAAAATTAAAGAAC * 50260 AAAGAAAAAAATTAAAGA 1 AAAAAAAAAAATTAAAGA 50278 GATCTGGAAG Statistics Matches: 17, Mismatches: 1, Indels: 0 0.94 0.06 0.00 Matches are distributed among these distances: 20 17 1.00 ACGTcount: A:0.79, C:0.03, G:0.08, T:0.11 Consensus pattern (20 bp): AAAAAAAAAAATTAAAGAAC Found at i:52831 original size:27 final size:27 Alignment explanation

Indices: 52793--52852 Score: 93 Period size: 27 Copynumber: 2.2 Consensus size: 27 52783 TAGAGATCAT * 52793 GTGTGGAGTCGTACGTTTGGAGGTCAC 1 GTGTGGAGTCGTACGTTTGAAGGTCAC * * 52820 GTGTGGAGTCGTATGTTTGAAGGTCAT 1 GTGTGGAGTCGTACGTTTGAAGGTCAC 52847 GTGTGG 1 GTGTGG 52853 GGTACCAGAT Statistics Matches: 30, Mismatches: 3, Indels: 0 0.91 0.09 0.00 Matches are distributed among these distances: 27 30 1.00 ACGTcount: A:0.15, C:0.10, G:0.42, T:0.33 Consensus pattern (27 bp): GTGTGGAGTCGTACGTTTGAAGGTCAC Found at i:74602 original size:28 final size:29 Alignment explanation

Indices: 74548--74624 Score: 84 Period size: 29 Copynumber: 2.6 Consensus size: 29 74538 TACAAATTGC * 74548 AAGTTTAGGGGGCAAAACGTCCAAAATTA 1 AAGTTTAGGGGGCAAAACATCCAAAATTA * * 74577 AAGTTTAGGGGGTAAAACAT-TAAAATCATA 1 AAGTTTAGGGGGCAAAACATCCAAAAT--TA * 74607 CAAGTTTATGGGGCAAAA 1 -AAGTTTAGGGGGCAAAA 74625 AGGGCATTAA Statistics Matches: 40, Mismatches: 5, Indels: 4 0.82 0.10 0.08 Matches are distributed among these distances: 28 5 0.12 29 18 0.45 30 2 0.05 31 15 0.38 ACGTcount: A:0.43, C:0.10, G:0.23, T:0.23 Consensus pattern (29 bp): AAGTTTAGGGGGCAAAACATCCAAAATTA Found at i:84274 original size:2 final size:2 Alignment explanation

Indices: 84267--84308 Score: 84 Period size: 2 Copynumber: 21.0 Consensus size: 2 84257 CAAAACTGAT 84267 GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA 1 GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA GA 84309 AGTAA Statistics Matches: 40, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 2 40 1.00 ACGTcount: A:0.50, C:0.00, G:0.50, T:0.00 Consensus pattern (2 bp): GA Done.