Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01014190.1 Corchorus capsularis cultivar CVL-1 contig14211, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 29733
ACGTcount: A:0.32, C:0.18, G:0.20, T:0.30


Found at i:1446 original size:15 final size:15

Alignment explanation

Indices: 1426--1455 Score: 60 Period size: 15 Copynumber: 2.0 Consensus size: 15 1416 CTACTTGTTT 1426 TTTTGAAAGTAATTA 1 TTTTGAAAGTAATTA 1441 TTTTGAAAGTAATTA 1 TTTTGAAAGTAATTA 1456 ACGAGAAGCT Statistics Matches: 15, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 15 15 1.00 ACGTcount: A:0.40, C:0.00, G:0.13, T:0.47 Consensus pattern (15 bp): TTTTGAAAGTAATTA Found at i:3173 original size:5 final size:5 Alignment explanation

Indices: 3147--3212 Score: 89 Period size: 5 Copynumber: 13.0 Consensus size: 5 3137 GTGATGATAA 3147 TATAT ATATAT TAT-T ATATAT TATAT TATAT TATAT TATAT TATAT TATAT 1 TATAT -TATAT TATAT -TATAT TATAT TATAT TATAT TATAT TATAT TATAT * * 3198 TATAT AACAT TATAT 1 TATAT TATAT TATAT 3213 AACATAACAT Statistics Matches: 54, Mismatches: 4, Indels: 5 0.86 0.06 0.08 Matches are distributed among these distances: 4 1 0.02 5 47 0.87 6 6 0.11 ACGTcount: A:0.42, C:0.02, G:0.00, T:0.56 Consensus pattern (5 bp): TATAT Found at i:5550 original size:762 final size:764 Alignment explanation

Indices: 4489--6551 Score: 3441 Period size: 765 Copynumber: 2.7 Consensus size: 764 4479 TCAGCTATAA * * ** 4489 GATGCACAACATTCACCCAAGAACAAATTGTCA-GGGTATTTCGATACTTTCAAACTCGGTATTT 1 GATGCACCACATTCACCCAAGAACAAATTGTCAGGGGTATTTCGGTACTTTCATGCTCGGTATTT * * * * 4553 TCGTTATTATTGTTGATTGTTAAGGGCGTTTTGGGAACTTTGGGATAAAGTTACTATTTGATAGG 66 TCGTTATTATTGTTGATTGTTGAGGGCGTTTTGGGAACTTTAGGATAAAGTTACTATTTGGTGGG * * * * 4618 TCCCACTCTCAATAAACAAATTATTTTTTGTTGG--GA--TA--AATAATCCCCACACTTTTATG 131 TCCCACTCTCAATAAACAAATTATTTTTTGTTGGATTATTTATCAATGATCCTCATACTTTTATG * * * 4677 CTTTATGTTATTTAATCTTTTACAATTATGAGTTGGACGATTGAATGTTTCGACTTTAATTCTTT 196 CTTTATGCTATTTAATCTTTTACAATTATGGGTTGGACGACTGAATGTTTCGACTTTAATTCTTT * 4742 TATTTTTATTCTATTTGTCC-AGTCAAGGTAATTCATGTGTCTATTTAAAGGTAATTTCATGGTC 261 TATTTTTATTCTATTTGTCCGA-TCAAGGTAATTCAGGTGTCTATTTAAAGGTAATTTCATGGTC * 4806 TACAACTTTCATTCAGGACTCAAAAGCCAATTTTAATGTTTTGATTCTAAAAAATGCTTTTGAAA 325 TACAACTTTCATTCAGGACTCAAAAGCCAATTTTAATGTTTTGATTCTAAAAAATGCTTCTGAAA * * * 4871 TTTTGTTGTCTCGATTGCCGGTCTATATAATATTGTATAATTTTCGGTCTACACGTCTGATTGAA 390 TTTTGTTGTCTCGATTGCCGGTCTATATAATATTGTATAATTTTCGGTCCACATGTCCGATTGAA * 4936 ATTATTCAAGTGTTGGTTAAAAAGTTATTTCATGATCTACGACTTTTGTCAAGGGCCTCAAAGCA 455 ATTATTCAAGTGTTGGTTAAAAAGTTATTTCATGATCTACGACTTTTGTCAAGGGCCTCAAAGCT * * 5001 TAATTTGACTAATGATTTTCGTGGAGAGTTCAAGAGGGAATTTTTATGTTT-G-CTCCATGAACA 520 TAATTTGACTAATGAGTTTCGTGGAGAGTTCAAGAGGGAATTTTTATGTTTGGTCTCCATAAACA * 5064 AATA-TTTTTTCCCTGGATTATTTATCAAATGGCCCTTATACTTTTATGCTTTAAGCTATTTAAT 585 AATATTTTTTTCCCTGGATTATTTATCAAATGACCCTTATACTTTTATGCTTTAAGCTATTTAAT * * * 5128 CCTCTACAAATTCTGGGTTGGATGCTTTAACGCTTCGGCTTTAATTCTTTTACTTTTTTTCTATT 650 CCTCTACAAATTCTGGGTTGGACGCTTTAACACTTCGGCTTTAATTCTTTTACTTTTGTTCTATT * 5193 TGTCCGATCAATGTGATTCAAGTGTCTATTGAAAGATAATTTAATGACTT 715 TGTCCGATCAATGCGATTCAAGTGTCTATTGAAAGATAATTTAATGACTT * 5243 GATGCACCACATTCACCCAAGAACAAATTGTTAGGGGTATTTCGGTACTTTCATGCTCGGTATTT 1 GATGCACCACATTCACCCAAGAACAAATTGTCAGGGGTATTTCGGTACTTTCATGCTCGGTATTT * * 5308 TCATTATTATTGTTGATTGTTG-GAGGCGTTTTGGGAACTTTAGGATAAGGTTACTATTTGGTGG 66 TCGTTATTATTGTTGATTGTTGAG-GGCGTTTTGGGAACTTTAGGATAAAGTTACTATTTGGTGG * 5372 GTCCCACTCTCAATAGACAAATTATTTTTTGTTGGATTATTTATCGAATGATCCTCATACTTTTA 130 GTCCCACTCTCAATAAACAAATTATTTTTTGTTGGATTATTTATC-AATGATCCTCATACTTTTA * * * 5437 TGCTTTATGCTATTTAATCTTTTACAATTATGGGTTGGACGACTAAATGTTTCGGCTTTAATTCA 194 TGCTTTATGCTATTTAATCTTTTACAATTATGGGTTGGACGACTGAATGTTTCGACTTTAATTCT 5502 TTTATTTTTATTCTATTTGTCCGATCAAGGTAATTCAGGTGTCTATTTAAAGGTAATTTCATGGT 259 TTTATTTTTATTCTATTTGTCCGATCAAGGTAATTCAGGTGTCTATTTAAAGGTAATTTCATGGT * 5567 CTACAACTTTCATTCAGGACTCAAAAGCCAATTTTAATGTTTTAATTCTAAAAAATGCTTCTGAA 324 CTACAACTTTCATTCAGGACTCAAAAGCCAATTTTAATGTTTTGATTCTAAAAAATGCTTCTGAA * 5632 ATTTGGTTGTCTCGATTGCCGGTCTATATAATATTGTATAATTTTCGGTCCACATGTCCGATTGA 389 ATTTTGTTGTCTCGATTGCCGGTCTATATAATATTGTATAATTTTCGGTCCACATGTCCGATTGA * 5697 AATTATTCAAGTGTTGGTTAAAAAGTTATTTCATGATCTACGACTTTCGTCAAGGGCCTCAAAGC 454 AATTATTCAAGTGTTGGTTAAAAAGTTATTTCATGATCTACGACTTTTGTCAAGGGCCTCAAAGC 5762 TTAATTTGACTAATGAGTTTCGTGGAGAGTTCAAGAGGGAATTTTTATGTTTGGTCTCCATAAAC 519 TTAATTTGACTAATGAGTTTCGTGGAGAGTTCAAGAGGGAATTTTTATGTTTGGTCTCCATAAAC * * * 5827 AAATATTTTTTTCCCTGGATTATTTATTAAATGACCCTTATACTTTTATGTTTTATGCTATTTAA 584 AAATATTTTTTTCCCTGGATTATTTATCAAATGACCCTTATACTTTTATGCTTTAAGCTATTTAA * 5892 TCCTCTACAAATTCTGGGTTGGACGCTTTAACACTTCGGTTTTAATTCTTTTACTTTTGTTCTAT 649 TCCTCTACAAATTCTGGGTTGGACGCTTTAACACTTCGGCTTTAATTCTTTTACTTTTGTTCTAT 5957 TTGTCCGATCAATGCGATTCAAGTGTCTATTGAAAGATAATTTAATGACTT 714 TTGTCCGATCAATGCGATTCAAGTGTCTATTGAAAGATAATTTAATGACTT * * * 6008 GATGCACCACATTCACCTAAGAACAAATTGTCAGGGGTATTTTGGTACTTTCATGCTCGATATTT 1 GATGCACCACATTCACCCAAGAACAAATTGTCAGGGGTATTTCGGTACTTTCATGCTCGGTATTT * 6073 TCGTTATTATTGTTGATTGTTGAGGGCGTTTTGGGAACTTTAGGATAAAGTTACTATTTGGTGTG 66 TCGTTATTATTGTTGATTGTTGAGGGCGTTTTGGGAACTTTAGGATAAAGTTACTATTTGGTGGG * 6138 TCCCACTCTCAATAAACAAATTATTTTTTGTTGTATTATTTATCAAATGATCCTCATACTTTTAT 131 TCCCACTCTCAATAAACAAATTATTTTTTGTTGGATTATTTATC-AATGATCCTCATACTTTTAT * 6203 GCTTTATGCTATTTAATCTTTTACAATTATGGGTTGGACGACTGAATGTTTTGACTTTAATTCTT 195 GCTTTATGCTATTTAATCTTTTACAATTATGGGTTGGACGACTGAATGTTTCGACTTTAATTCTT * * * * 6268 TTATTTTTATTCTATTTGTCCGATCAAGGTAATTCAGGTGTCTATTTAAATGTAATTTTATGTTT 260 TTATTTTTATTCTATTTGTCCGATCAAGGTAATTCAGGTGTCTATTTAAAGGTAATTTCATGGTC * 6333 TATAACTTTCATTCAGGACTCAAAAGCCAATTTTAATGTTTTGATTCTAAAAAATGCTTCTGAAA 325 TACAACTTTCATTCAGGACTCAAAAGCCAATTTTAATGTTTTGATTCTAAAAAATGCTTCTGAAA * * 6398 TTTTGTTGTCTCGATTGCCAGTCTATATAATATTGTATAATTTTCGGTCCATATGTCCGATTGAA 390 TTTTGTTGTCTCGATTGCCGGTCTATATAATATTGTATAATTTTCGGTCCACATGTCCGATTGAA * * * * * 6463 ATTATCCAAGTGTTGGTTAAAAGGTTATTTCATGATCTAC-AATTTTCATCAAGGGCCTGAAAGC 455 ATTATTCAAGTGTTGGTTAAAAAGTTATTTCATGATCTACGACTTTT-GTCAAGGGCCTCAAAGC * 6527 TTAATTTTACTAATGAGTTTCGTGG 519 TTAATTTGACTAATGAGTTTCGTGG 6552 TGTAGGCACC Statistics Matches: 1222, Mismatches: 72, Indels: 19 0.93 0.05 0.01 Matches are distributed among these distances: 754 32 0.03 755 118 0.10 757 1 0.00 759 2 0.00 762 375 0.31 763 2 0.00 764 18 0.01 765 673 0.55 766 1 0.00 ACGTcount: A:0.27, C:0.15, G:0.16, T:0.42 Consensus pattern (764 bp): GATGCACCACATTCACCCAAGAACAAATTGTCAGGGGTATTTCGGTACTTTCATGCTCGGTATTT TCGTTATTATTGTTGATTGTTGAGGGCGTTTTGGGAACTTTAGGATAAAGTTACTATTTGGTGGG TCCCACTCTCAATAAACAAATTATTTTTTGTTGGATTATTTATCAATGATCCTCATACTTTTATG CTTTATGCTATTTAATCTTTTACAATTATGGGTTGGACGACTGAATGTTTCGACTTTAATTCTTT TATTTTTATTCTATTTGTCCGATCAAGGTAATTCAGGTGTCTATTTAAAGGTAATTTCATGGTCT ACAACTTTCATTCAGGACTCAAAAGCCAATTTTAATGTTTTGATTCTAAAAAATGCTTCTGAAAT TTTGTTGTCTCGATTGCCGGTCTATATAATATTGTATAATTTTCGGTCCACATGTCCGATTGAAA TTATTCAAGTGTTGGTTAAAAAGTTATTTCATGATCTACGACTTTTGTCAAGGGCCTCAAAGCTT AATTTGACTAATGAGTTTCGTGGAGAGTTCAAGAGGGAATTTTTATGTTTGGTCTCCATAAACAA ATATTTTTTTCCCTGGATTATTTATCAAATGACCCTTATACTTTTATGCTTTAAGCTATTTAATC CTCTACAAATTCTGGGTTGGACGCTTTAACACTTCGGCTTTAATTCTTTTACTTTTGTTCTATTT GTCCGATCAATGCGATTCAAGTGTCTATTGAAAGATAATTTAATGACTT Found at i:10668 original size:35 final size:35 Alignment explanation

Indices: 10548--11094 Score: 580 Period size: 35 Copynumber: 15.8 Consensus size: 35 10538 GTCAACAATA * * 10548 ACTTAATTCAGTGTAATTAAGTAAACA-CAGTTA-AGG 1 ACTTAATTCAGGGTAATTAAGTAAA-ATCAG-CACA-G * * * * * 10584 ACTTAATTCAGGGCAATTAAATAGAATCAGTAAAGG 1 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACA-G * * 10620 GCTTAATTCAGGGTAATTAAGTGAAATCAGCACAG 1 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * * 10655 ACTTAATTTAGGGTAATTAGGTAAAATCAGCACAG 1 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * * * * 10690 GCTTAATTCGGGGTAATTAAGTAAAACCAGCACAA 1 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG 10725 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG 1 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * * * * * 10760 GCTTAATTCGGGGTAATTTAGTAAAACCAAG-ACAA 1 ACTTAATTCAGGGTAATTAAGTAAAATC-AGCACAG * * 10795 ACTTGATTCAGGGTAATTAAGT-AAATCA-CAAAG 1 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * 10828 GCTTAATTCAGGGTAATTAAGTAAAATCAGCACAG 1 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * * 10863 ACTTAATTCAGGATAATTAAGTAAAACCAGCACAG 1 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * * * 10898 ACTTGATTTAGGGTAATTAAGT-AAATCA-CAAAG 1 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * * 10931 GCTTAATTCAGGG-AATTAAGTAAAATCAGCATAG 1 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * * 10965 ACTTGATTCAGGGTAATTATGTAAAATCAGCACAG 1 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * 11000 ACTTAATTCAGGGTAATTAAGTAAAATCA--A-TG 1 ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * * * 11032 ACTTGATTCAAGG-AGATTAAGT-AAATCAGCAAAG 1 ACTTAATTCAGGGTA-ATTAAGTAAAATCAGCACAG * ** * 11066 ACTTAGTTTCAAAGAAATTAAGTAAAATC 1 ACTTA-ATTCAGGGTAATTAAGTAAAATC 11095 CACAAAGGCT Statistics Matches: 430, Mismatches: 65, Indels: 32 0.82 0.12 0.06 Matches are distributed among these distances: 31 7 0.02 32 27 0.06 33 45 0.10 34 35 0.08 35 254 0.59 36 62 0.14 ACGTcount: A:0.42, C:0.13, G:0.18, T:0.27 Consensus pattern (35 bp): ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG Found at i:10868 original size:103 final size:104 Alignment explanation

Indices: 10548--11070 Score: 593 Period size: 103 Copynumber: 5.0 Consensus size: 104 10538 GTCAACAATA * * * * * 10548 ACTTAATTCAGTGTAATTAAGT-AAACACAGTTA-AGGACTTAATTCAGGGCAATTAAATAGAAT 1 ACTTAATTCAGGGTAATTAGGTAAAAC-CAG-CACA-GACTTAATTCAGGGTAATTAAGTA-AAT * * 10611 CAGTAAAGGGCTTAATTCAGGGTAATTAAGTGAAATCAGCACAG 62 CAGCAAA-GGCTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * * * * * 10655 ACTTAATTTAGGGTAATTAGGTAAAATCAGCACAGGCTTAATTCGGGGTAATTAAGTAAAACCAG 1 ACTTAATTCAGGGTAATTAGGTAAAACCAGCACAGACTTAATTCAGGGTAATTAAGT-AAATCAG * 10720 CACAA-ACTTAATTCAGGGTAATTAAGTAAAATCAGCACAG 65 CA-AAGGCTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * * * * 10760 GCTTAATTCGGGGTAATTTA-GTAAAACCAAG-ACAAACTTGATTCAGGGTAATTAAGTAAATCA 1 ACTTAATTCAGGGTAA-TTAGGTAAAACC-AGCACAGACTTAATTCAGGGTAATTAAGTAAATCA 10823 -CAAAGGCTTAATTCAGGGTAATTAAGTAAAATCAGCACAG 64 GCAAAGGCTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * * * * 10863 ACTTAATTCAGGATAATTAAGTAAAACCAGCACAGACTTGATTTAGGGTAATTAAGTAAATCA-C 1 ACTTAATTCAGGGTAATTAGGTAAAACCAGCACAGACTTAATTCAGGGTAATTAAGTAAATCAGC * 10927 AAAGGCTTAATTCAGGG-AATTAAGTAAAATCAGCATAG 66 AAAGGCTTAATTCAGGGTAATTAAGTAAAATCAGCACAG * * * * 10965 ACTTGATTCAGGGTAATTATGTAAAATCAGCACAGACTTAATTCAGGGTAATTAAGTAAA--ATC 1 ACTTAATTCAGGGTAATTAGGTAAAACCAGCACAGACTTAATTCAGGGTAATTAAGTAAATCAGC * * * * * 11028 AATGACTTGATTCAAGG-AGATTAAGT-AAATCAGCAAAG 66 AAAGGCTTAATTCAGGGTA-ATTAAGTAAAATCAGCACAG 11066 ACTTA 1 ACTTA 11071 GTTTCAAAGA Statistics Matches: 364, Mismatches: 41, Indels: 28 0.84 0.09 0.06 Matches are distributed among these distances: 100 1 0.00 101 30 0.08 102 88 0.24 103 105 0.29 104 5 0.01 105 75 0.21 106 31 0.09 107 26 0.07 108 3 0.01 ACGTcount: A:0.41, C:0.13, G:0.19, T:0.27 Consensus pattern (104 bp): ACTTAATTCAGGGTAATTAGGTAAAACCAGCACAGACTTAATTCAGGGTAATTAAGTAAATCAGC AAAGGCTTAATTCAGGGTAATTAAGTAAAATCAGCACAG Found at i:11121 original size:102 final size:101 Alignment explanation

Indices: 10833--11132 Score: 239 Period size: 102 Copynumber: 2.9 Consensus size: 101 10823 CAAAGGCTTA * * * * * * 10833 ATTCAGGGTAATTAAGTAAAATCAGCACAGACTTAATTC-AGGATAATTAAGTAAAACCAGCACA 1 ATTCAAGG-AATTAAGTAAAATCAGCAAAGACTTGATTCAAAGA-AATTAAGTAAAATCAGCAAA * ** * * * * * * 10897 GACTTGATTTAGGGTAATTAAG-TAAATCACAAAGGCTTA 64 GACTTAATCCAAGATAATTAAGCAAAAT--CAATGACTTG * * ** * * * 10936 ATTCAGGGAATTAAGTAAAATCAGCATAGACTTGATTCAGGGTAATTATGTAAAATCAGCACAGA 1 ATTCAAGGAATTAAGTAAAATCAGCAAAGACTTGATTCAAAGAAATTAAGTAAAATCAGCAAAGA * * * * 11001 CTTAATTCAGGGTAATTAAGTAAAATCAATGACTTG 66 CTTAATCCAAGATAATTAAGCAAAATCAATGACTTG * 11037 ATTCAAGGAGATTAAGT-AAATCAGCAAAGACTTAGTTTCAAAGAAATTAAGTAAAATCCA-CAA 1 ATTCAAGGA-ATTAAGTAAAATCAGCAAAGACTT-GATTCAAAGAAATTAAGTAAAAT-CAGCAA * * * 11100 AGGCTTAATCCAAGATGATTAAGCAAGATCAAT 63 AGACTTAATCCAAGATAATTAAGCAAAATCAAT 11133 CAAAGACTTA Statistics Matches: 165, Mismatches: 27, Indels: 11 0.81 0.13 0.05 Matches are distributed among these distances: 101 30 0.18 102 119 0.72 103 16 0.10 ACGTcount: A:0.43, C:0.13, G:0.17, T:0.26 Consensus pattern (101 bp): ATTCAAGGAATTAAGTAAAATCAGCAAAGACTTGATTCAAAGAAATTAAGTAAAATCAGCAAAGA CTTAATCCAAGATAATTAAGCAAAATCAATGACTTG Found at i:11208 original size:36 final size:36 Alignment explanation

Indices: 11156--11298 Score: 205 Period size: 36 Copynumber: 3.9 Consensus size: 36 11146 TAAGGGGACT * 11156 AAGTGAAGTAAAGAACTTAATTCGGGGTAATTAAGTA 1 AAGTGAA-TAAAGAACTTAATTCAGGGTAATTAAGTA * * * * 11193 AAATCAATAAAGAACTTAATTCAGGGCAACTAAGTA 1 AAGTGAATAAAGAACTTAATTCAGGGTAATTAAGTA * * 11229 GAGTGAATAAAGAACTTAATTCAGGGAAATTAAGTA 1 AAGTGAATAAAGAACTTAATTCAGGGTAATTAAGTA * 11265 AAGTGAATAAAGAACTTAATTTAGGGTAATTAAG 1 AAGTGAATAAAGAACTTAATTCAGGGTAATTAAG 11299 AGGGATATTA Statistics Matches: 93, Mismatches: 13, Indels: 1 0.87 0.12 0.01 Matches are distributed among these distances: 36 88 0.95 37 5 0.05 ACGTcount: A:0.47, C:0.07, G:0.20, T:0.26 Consensus pattern (36 bp): AAGTGAATAAAGAACTTAATTCAGGGTAATTAAGTA Found at i:13366 original size:21 final size:21 Alignment explanation

Indices: 13342--13386 Score: 72 Period size: 21 Copynumber: 2.1 Consensus size: 21 13332 AAATTGTGTA * 13342 CCGGGATGAAGAGGCAAGGCG 1 CCGGGATGAAGAGGCAAGACG * 13363 CCGGGATGAGGAGGCAAGACG 1 CCGGGATGAAGAGGCAAGACG 13384 CCG 1 CCG 13387 AGAGGAGGCA Statistics Matches: 22, Mismatches: 2, Indels: 0 0.92 0.08 0.00 Matches are distributed among these distances: 21 22 1.00 ACGTcount: A:0.27, C:0.22, G:0.47, T:0.04 Consensus pattern (21 bp): CCGGGATGAAGAGGCAAGACG Found at i:13394 original size:21 final size:21 Alignment explanation

Indices: 13352--13394 Score: 59 Period size: 21 Copynumber: 2.0 Consensus size: 21 13342 CCGGGATGAA * * * 13352 GAGGCAAGGCGCCGGGATGAG 1 GAGGCAAGACGCCGAGAGGAG 13373 GAGGCAAGACGCCGAGAGGAG 1 GAGGCAAGACGCCGAGAGGAG 13394 G 1 G 13395 CAAACGAATG Statistics Matches: 19, Mismatches: 3, Indels: 0 0.86 0.14 0.00 Matches are distributed among these distances: 21 19 1.00 ACGTcount: A:0.28, C:0.19, G:0.51, T:0.02 Consensus pattern (21 bp): GAGGCAAGACGCCGAGAGGAG Found at i:17634 original size:14 final size:14 Alignment explanation

Indices: 17584--17635 Score: 52 Period size: 14 Copynumber: 3.6 Consensus size: 14 17574 AATTTTCTGA 17584 TTTTTCTATTTTTCC 1 TTTTTCT-TTTTTCC * 17599 ATTTTT-TCTTTTCC 1 -TTTTTCTTTTTTCC * 17613 TTTCTTCTTTTTTGC 1 TTT-TTCTTTTTTCC 17628 TTTTTCTT 1 TTTTTCTT 17636 CAAATCTTGA Statistics Matches: 31, Mismatches: 3, Indels: 6 0.77 0.08 0.15 Matches are distributed among these distances: 13 3 0.10 14 13 0.42 15 10 0.32 16 5 0.16 ACGTcount: A:0.04, C:0.19, G:0.02, T:0.75 Consensus pattern (14 bp): TTTTTCTTTTTTCC Found at i:19491 original size:14 final size:14 Alignment explanation

Indices: 19472--19498 Score: 54 Period size: 14 Copynumber: 1.9 Consensus size: 14 19462 CTGGAAAATG 19472 TGAGAGAGAGTGAT 1 TGAGAGAGAGTGAT 19486 TGAGAGAGAGTGA 1 TGAGAGAGAGTGA 19499 GTGAAGGGAG Statistics Matches: 13, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 14 13 1.00 ACGTcount: A:0.37, C:0.00, G:0.44, T:0.19 Consensus pattern (14 bp): TGAGAGAGAGTGAT Found at i:20726 original size:31 final size:31 Alignment explanation

Indices: 20684--20802 Score: 193 Period size: 31 Copynumber: 3.8 Consensus size: 31 20674 CATGATTACT * 20684 CACCAAAAGGTATACCGTAAATACTCCCTACC 1 CACC-AAAGGTATACCGTAAATACTCCATACC 20716 CACCAAAGGTATACCGTAAATACTCCATACC 1 CACCAAAGGTATACCGTAAATACTCCATACC * 20747 CACCAAGGGTATACCGTAAATACTCCATACC 1 CACCAAAGGTATACCGTAAATACTCCATACC * * 20778 CACAAAAGGTATACCGTAAACACTC 1 CACCAAAGGTATACCGTAAATACTC 20803 ACCAAGTATT Statistics Matches: 82, Mismatches: 5, Indels: 1 0.93 0.06 0.01 Matches are distributed among these distances: 31 78 0.95 32 4 0.05 ACGTcount: A:0.39, C:0.32, G:0.11, T:0.18 Consensus pattern (31 bp): CACCAAAGGTATACCGTAAATACTCCATACC Found at i:20890 original size:45 final size:45 Alignment explanation

Indices: 20826--20911 Score: 163 Period size: 45 Copynumber: 1.9 Consensus size: 45 20816 AAGCCAATAG * 20826 GCAGTTACTTCATCAAGAATGAGGTAACCACCCACGTTCTTCAAA 1 GCAGTTACTTCACCAAGAATGAGGTAACCACCCACGTTCTTCAAA 20871 GCAGTTACTTCACCAAGAATGAGGTAACCACCCACGTTCTT 1 GCAGTTACTTCACCAAGAATGAGGTAACCACCCACGTTCTT 20912 ATTTGAAGAA Statistics Matches: 40, Mismatches: 1, Indels: 0 0.98 0.02 0.00 Matches are distributed among these distances: 45 40 1.00 ACGTcount: A:0.31, C:0.28, G:0.16, T:0.24 Consensus pattern (45 bp): GCAGTTACTTCACCAAGAATGAGGTAACCACCCACGTTCTTCAAA Found at i:28128 original size:3 final size:3 Alignment explanation

Indices: 28120--28169 Score: 100 Period size: 3 Copynumber: 16.7 Consensus size: 3 28110 TTCAGTTACA 28120 AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT 1 AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT AAT 28168 AA 1 AA 28170 GTGTCTCAAC Statistics Matches: 47, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 3 47 1.00 ACGTcount: A:0.68, C:0.00, G:0.00, T:0.32 Consensus pattern (3 bp): AAT Found at i:28942 original size:36 final size:36 Alignment explanation

Indices: 28889--29056 Score: 180 Period size: 36 Copynumber: 4.7 Consensus size: 36 28879 TGCTCCTGGG * * 28889 GAGGAAGAAGTAGGGCGCACCCTACTATTCC-T-TGGA 1 GAGGAAGAAGTAAGGCGCACCCTACCA--CCTTGTGGA * * ** * 28925 GAAGAAGATGTAAGGCGCATGCTACCACCTTGTGGG 1 GAGGAAGAAGTAAGGCGCACCCTACCACCTTGTGGA * ** 28961 GAGGAAGATGTAAGGCGCATGCTACCACCTTGTGGA 1 GAGGAAGAAGTAAGGCGCACCCTACCACCTTGTGGA 28997 GAGGAAGAAGTAAGGCGCACCCTACCATCCTT-TGGA 1 GAGGAAGAAGTAAGGCGCACCCTACCA-CCTTGTGGA * * 29033 GAGGAGGAAGTAAGGCGTACCCTA 1 GAGGAAGAAGTAAGGCGCACCCTA 29057 TCACGCTTAA Statistics Matches: 115, Mismatches: 14, Indels: 6 0.85 0.10 0.04 Matches are distributed among these distances: 34 2 0.02 35 1 0.01 36 108 0.94 37 4 0.03 ACGTcount: A:0.29, C:0.21, G:0.32, T:0.18 Consensus pattern (36 bp): GAGGAAGAAGTAAGGCGCACCCTACCACCTTGTGGA Done.