Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: Scaffold3302

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 31378
ACGTcount: A:0.32, C:0.14, G:0.21, T:0.33


Found at i:2041 original size:40 final size:39

Alignment explanation

Indices: 1986--2161 Score: 250 Period size: 40 Copynumber: 4.5 Consensus size: 39 1976 CGGATGATAA * 1986 CGGGCTAAGTCCCGAAGGCATTTGTGCTAGTGACTA-ATTC 1 CGGGCTAAGTCCCGAAGGCATTTGTGCGAGT-ACTATA-TC 2026 CGGGCTAAGTCCCGAAGGCATTTGTGCGAGTTACTATATC 1 CGGGCTAAGTCCCGAAGGCATTTGTGCGAG-TACTATATC 2066 CGGGCTAAGTCCCGAAGGCATTTGTGCGAGCTACTATATC 1 CGGGCTAAGTCCCGAAGGCATTTGTGCGAG-TACTATATC * 2106 CGGGCTAAGTCCCGAAGGCATTTGAG-GAGTAGCTATATC 1 CGGGCTAAGTCCCGAAGGCATTTGTGCGAGTA-CTATATC * * 2145 C-GGTTAAATCCCGAAGG 1 CGGGCTAAGTCCCGAAGG 2162 TACTTGGTTT Statistics Matches: 128, Mismatches: 5, Indels: 8 0.91 0.04 0.06 Matches are distributed among these distances: 38 16 0.12 39 11 0.09 40 99 0.77 41 2 0.02 ACGTcount: A:0.24, C:0.23, G:0.28, T:0.25 Consensus pattern (39 bp): CGGGCTAAGTCCCGAAGGCATTTGTGCGAGTACTATATC Found at i:10303 original size:40 final size:40 Alignment explanation

Indices: 10245--10368 Score: 194 Period size: 40 Copynumber: 3.1 Consensus size: 40 10235 CGGATGATAA 10245 CCGGGCTAAGTCCCGAAGGCATTTGTGCGAGTTACTATAT 1 CCGGGCTAAGTCCCGAAGGCATTTGTGCGAGTTACTATAT * ** 10285 CCGGGCTAAGTCCTGAAGGCATTTGTGCGAACTACTATAT 1 CCGGGCTAAGTCCCGAAGGCATTTGTGCGAGTTACTATAT * ** 10325 CCGGGCTAAGTCCCGAAGGCATTTGAGCGAGTGGCTATAT 1 CCGGGCTAAGTCCCGAAGGCATTTGTGCGAGTTACTATAT 10365 CCGG 1 CCGG 10369 TTAAAGCCCG Statistics Matches: 75, Mismatches: 9, Indels: 0 0.89 0.11 0.00 Matches are distributed among these distances: 40 75 1.00 ACGTcount: A:0.23, C:0.23, G:0.29, T:0.25 Consensus pattern (40 bp): CCGGGCTAAGTCCCGAAGGCATTTGTGCGAGTTACTATAT Found at i:13117 original size:50 final size:50 Alignment explanation

Indices: 13032--13297 Score: 295 Period size: 50 Copynumber: 5.3 Consensus size: 50 13022 GCTAAATGAC * * * * * * 13032 CTTGTATATTCGGCCACATAGGTATGTACATATGTGATGTTGTATTGGAT 1 CTTGTATATTCGGCCATATAGGTAAGCACATATGTGATATTATATTTGAT * * * 13082 CTTGAATATTCGGCCATGA-AGGTATGCACAAATGTGATATTATATTTGAAT 1 CTTGTATATTCGGCCAT-ATAGGTAAGCACATATGTGATATTATATTTG-AT * * * * * * 13133 -TTGTATATTCGGCCTTATAAGTAAGTACATATGGGATGTTAAATTTGAT 1 CTTGTATATTCGGCCATATAGGTAAGCACATATGTGATATTATATTTGAT * ** 13182 CTTGCATATTCAACCATATAGGTAAGCACATATGTGATATTA-ATTTTGAT 1 CTTGTATATTCGGCCATATAGGTAAGCACATATGTGATATTATA-TTTGAT * * 13232 CTTGCATATTCGGCCATATAGGTAAGCACATATATGATATTATATTTGAT 1 CTTGTATATTCGGCCATATAGGTAAGCACATATGTGATATTATATTTGAT * 13282 CTTGTATATTTGGCCA 1 CTTGTATATTCGGCCA 13298 AATCAATGAT Statistics Matches: 181, Mismatches: 29, Indels: 12 0.82 0.13 0.05 Matches are distributed among these distances: 49 4 0.02 50 173 0.96 51 4 0.02 ACGTcount: A:0.30, C:0.12, G:0.19, T:0.39 Consensus pattern (50 bp): CTTGTATATTCGGCCATATAGGTAAGCACATATGTGATATTATATTTGAT Found at i:16870 original size:27 final size:26 Alignment explanation

Indices: 16824--16883 Score: 75 Period size: 27 Copynumber: 2.3 Consensus size: 26 16814 GCGAGGCTGC 16824 CAGATATTGTGACGAAGCCACCAGATA 1 CAGATATTGTGACGAAGCCACCAGA-A * * * * 16851 CAGATATTGTGGCTAGGCCACTAGAA 1 CAGATATTGTGACGAAGCCACCAGAA 16877 CAGATAT 1 CAGATAT 16884 ATATATGTGG Statistics Matches: 29, Mismatches: 4, Indels: 1 0.85 0.12 0.03 Matches are distributed among these distances: 26 8 0.28 27 21 0.72 ACGTcount: A:0.35, C:0.20, G:0.23, T:0.22 Consensus pattern (26 bp): CAGATATTGTGACGAAGCCACCAGAA Found at i:21544 original size:46 final size:44 Alignment explanation

Indices: 21490--21666 Score: 158 Period size: 46 Copynumber: 3.9 Consensus size: 44 21480 ATATTTGGGC * 21490 ATCCGAACTCGTTGAGTTGAGTCCGAGTTCACTTATGGATGCGA 1 ATCCGAACTCGTTGAGTTGAGTCCGAGTTCACTGATGGATGCGA ** * * 21534 ATGTCCGAACTCGTTGAGTTGAGTCCGAGTTCGAGAGATGTAACTAG-GC 1 A--TCCGAACTCGTTGAGTTGAGTCCGAGTTC-ACTGATG-GA-T-GCGA * * * * 21583 ATCCGAGCTCGTTAAGTTGAGTCTGAGTTCACTGATGGATTCGAA 1 ATCCGAACTCGTTGAGTTGAGTCCGAGTTCACTGATGGATGCG-A * * * * 21628 CACCCGAGCTCATTGAGTTGAGTCCGAGTTCACTTATGG 1 -ATCCGAACTCGTTGAGTTGAGTCCGAGTTCACTGATGG 21667 GCGGGTTACA Statistics Matches: 106, Mismatches: 18, Indels: 16 0.76 0.13 0.11 Matches are distributed among these distances: 44 3 0.03 45 1 0.01 46 67 0.63 47 30 0.28 48 1 0.01 49 3 0.03 50 1 0.01 ACGTcount: A:0.23, C:0.20, G:0.28, T:0.29 Consensus pattern (44 bp): ATCCGAACTCGTTGAGTTGAGTCCGAGTTCACTGATGGATGCGA Found at i:21646 original size:93 final size:93 Alignment explanation

Indices: 21487--21658 Score: 254 Period size: 93 Copynumber: 1.8 Consensus size: 93 21477 AGGATATTTG * * *** * 21487 GGCATCCGAACTCGTTGAGTTGAGTCCGAGTTCACTTATGGATGCGAATGTCCGAACTCGTTGAG 1 GGCATCCGAACTCGTTAAGTTGAGTCCGAGTTCACTGATGGATGCGAACACCCGAACTCATTGAG 21552 TTGAGTCCGAGTTCGAGAGATGTAACTA 66 TTGAGTCCGAGTTCGAGAGATGTAACTA * * * * 21580 GGCATCCGAGCTCGTTAAGTTGAGTCTGAGTTCACTGATGGATTCGAACACCCGAGCTCATTGAG 1 GGCATCCGAACTCGTTAAGTTGAGTCCGAGTTCACTGATGGATGCGAACACCCGAACTCATTGAG 21645 TTGAGTCCGAGTTC 66 TTGAGTCCGAGTTC 21659 ACTTATGGGC Statistics Matches: 69, Mismatches: 10, Indels: 0 0.87 0.13 0.00 Matches are distributed among these distances: 93 69 1.00 ACGTcount: A:0.23, C:0.21, G:0.28, T:0.28 Consensus pattern (93 bp): GGCATCCGAACTCGTTAAGTTGAGTCCGAGTTCACTGATGGATGCGAACACCCGAACTCATTGAG TTGAGTCCGAGTTCGAGAGATGTAACTA Found at i:24573 original size:649 final size:649 Alignment explanation

Indices: 23336--25266 Score: 3745 Period size: 649 Copynumber: 3.0 Consensus size: 649 23326 GATACGAATG * 23336 AAAATGTCCTTGTCTTGATTTGGACGTCGAATGTTGATGAATGCTAATGATATATAATTTTTATG 1 AAAATGTCCTTGTCTTGATTTGGACGTCAAATGTTGATGAATGCTAATGATATATAATTTTTATG 23401 AGATAAAGGATTATAATGAAATGAACTTATCTATGTTAAATTGTTGGACTGAATTATATGATTGT 66 AGATAAAGGATTATAATGAAATGAACTTATCTATGTTAAATTGTTGGACTGAATTATATGATTGT * 23466 AATGATATGTACATGATGATGCACGAAATGAAAGTTGTGATTGTGATGCAAATATCTATGTTTGT 131 AATGATATGTACATGATGATGCACGAAATGAAAGTTGTGATTGTGATGCAAATATTTATGTTTGT 23531 TTGGTCTTATATGATGTCATGAGCATGACTTAATTTAATTAAATGAATGGATAAGTAAAGCTATC 196 TTGGTCTTATATGATGTCATGAGCATGACTTAATTTAATTAAATGAATGGATAAGTAAAGCTATC 23596 TAGAAAACATAGAATGTATGCATAAGTATATTGTCTAAATGGACAATAGGAAAATTTGTGTAAGC 261 TAGAAAACATAGAATGTATGCATAAGTATATTGTCTAAATGGACAATAGGAAAATTTGTGTAAGC 23661 CAACATGAATGTTGCATTGCCTGAATGAATGACATGATTTTGATGATGTTGCTATGATGATGGGA 326 CAACATGAATGTTGCATTGCCTGAATGAATGACATGATTTTGATGATGTTGCTATGATGATGGGA 23726 GTTATGTCATATGTGTATGTATAAGAAAGTCGAGTCAGAGGTCCTACAATCCCTCCCCCTTACCG 391 GTTATGTCATATGTGTATGTATAAGAAAGTCGAGTCAGAGGTCCTACAATCCCTCCCCCTTACCG * 23791 AAGTGGTACTTATAATGGAATTTCATGAGATTTGTATTGAATAAGTTTTCGGTTGAGAACCCAAA 456 AAGTGGTACTTATAATGGAATTTCATGAGATTTGTATTGAATAAGTTTCCGGTTGAGAACCCAAA 23856 GAGTTTAGTGATAGAATAATTATAAGTATGATCAGAGATTGAAAATGAGATGATAAGTAAAGTCA 521 GAGTTTAGTGATAGAATAATTATAAGTATGATCAGAGATTGAAAATGAGATGATAAGTAAAGTCA 23921 GAGCCAGTAAAGTATCGGATTGAAGTAAAGATTATTGGAGTTATGCAATATCCCAATTGAAGTA 586 GAGCCAGTAAAGTATCGGATTGAAGTAAAGATTATTGGAGTTATGCAATATCCCAATTGAAGTA 23985 AAAATGTCCTTGTCTTGATTTGGACGTCAAATGTTGATGAATGCTAATGATATATAATTTTTATG 1 AAAATGTCCTTGTCTTGATTTGGACGTCAAATGTTGATGAATGCTAATGATATATAATTTTTATG 24050 AGATAAAGGATTATAATGAAATGAACTTATCTATGTTAAATTGTTGGACTGAATTATATGATTGT 66 AGATAAAGGATTATAATGAAATGAACTTATCTATGTTAAATTGTTGGACTGAATTATATGATTGT 24115 AATGATATGTACATGATGATGCACGAAATGAAAGTTGTGATTGTGATGCAAATATTTATGTTTGT 131 AATGATATGTACATGATGATGCACGAAATGAAAGTTGTGATTGTGATGCAAATATTTATGTTTGT * 24180 TTGGTCTTATATGATGTCATGAGCATGACTTAATTTAATTAAATGAATGTATAAGTAAAGCTATC 196 TTGGTCTTATATGATGTCATGAGCATGACTTAATTTAATTAAATGAATGGATAAGTAAAGCTATC 24245 TAGAAAACATAGAATGTATGCATAAGTATATTGTCTAAATGGACAATAGGAAAATTTGTGTAAGC 261 TAGAAAACATAGAATGTATGCATAAGTATATTGTCTAAATGGACAATAGGAAAATTTGTGTAAGC 24310 CAACATGAATGTTGCATTGCCTGAATGAATGACATGATTTTGATGATGTTGCTATGATGATGGGA 326 CAACATGAATGTTGCATTGCCTGAATGAATGACATGATTTTGATGATGTTGCTATGATGATGGGA 24375 GTTATGTCATATGTGTATGTATAAGAAAGTCGAGTCAGAGGTCCTACAATCCCTCCCCCTTACCG 391 GTTATGTCATATGTGTATGTATAAGAAAGTCGAGTCAGAGGTCCTACAATCCCTCCCCCTTACCG 24440 AAGTGGTACTTATAATGGAATTTCATGAGATTTGTATTGAATAAGTTTCCGGTTGAGAACCCAAA 456 AAGTGGTACTTATAATGGAATTTCATGAGATTTGTATTGAATAAGTTTCCGGTTGAGAACCCAAA 24505 GAGTTTAGTGATAGAATAATTATAAGTATGATCAGAGATTGAAAATGAGATGATAAGTAAAGTCA 521 GAGTTTAGTGATAGAATAATTATAAGTATGATCAGAGATTGAAAATGAGATGATAAGTAAAGTCA 24570 GAGCCAGTAAAGTATCGGATTGAAGTAAAGATTATTGGAGTTATGCAATATCCCAATTGAAGTA 586 GAGCCAGTAAAGTATCGGATTGAAGTAAAGATTATTGGAGTTATGCAATATCCCAATTGAAGTA 24634 AAAATGTCCTTGTCTTGATTTGGACGTCAAATGTTGATGAATGCTAATGATATATAATTTTTATG 1 AAAATGTCCTTGTCTTGATTTGGACGTCAAATGTTGATGAATGCTAATGATATATAATTTTTATG * 24699 AGATAAAGGATTATAATGAAATGAACTTATCTATGTTAAATTGTTGGACTAAATTATATGATTGT 66 AGATAAAGGATTATAATGAAATGAACTTATCTATGTTAAATTGTTGGACTGAATTATATGATTGT 24764 AATGATATGTACATGATGATGCACGAAATGAAAGTTGTGATTGTGATGCAAATATTTATGTTTGT 131 AATGATATGTACATGATGATGCACGAAATGAAAGTTGTGATTGTGATGCAAATATTTATGTTTGT * 24829 TTGGTCTTATATGATGTCATGAGCATGAATTAATTTAATTAAATGAATGGATAAGTAAAGCTATC 196 TTGGTCTTATATGATGTCATGAGCATGACTTAATTTAATTAAATGAATGGATAAGTAAAGCTATC 24894 TAGAAAACATAGAATGTATGCATAAGTATATTGTCTAAATGGGACAATAGGAAAATTTGTGTAAG 261 TAGAAAACATAGAATGTATGCATAAGTATATTGTCTAAAT-GGACAATAGGAAAATTTGTGTAAG * 24959 CCAACATGAATGTTGCATTGCCTGAATGAATGACATGATTTTGATGATGTTGCTATGATGATGGA 325 CCAACATGAATGTTGCATTGCCTGAATGAATGACATGATTTTGATGATGTTGCTATGATGATGGG * * 25024 AGTTGTGTCATATGTGTATGTATAAGAAAGTCGAGTCAGAGGTCCTACAACCCCTCCCCCTTACC 390 AGTTATGTCATATGTGTATGTATAAGAAAGTCGAGTCAGAGGTCCTACAATCCCTCCCCCTTACC 25089 GAAGTGGTACTTATAATGGAATTTCATGAGATTTGTATTGAATAAGTTTCCGGTTGAGAACCCAA 455 GAAGTGGTACTTATAATGGAATTTCATGAGATTTGTATTGAATAAGTTTCCGGTTGAGAACCCAA * * 25154 AGAGTTCAGTGATAGAATAATTATAAGTATGATCAGAGATTGAAAATGAGCTGATAAGTAAAGTC 520 AGAGTTTAGTGATAGAATAATTATAAGTATGATCAGAGATTGAAAATGAGATGATAAGTAAAGTC * 25219 AGAGCCAGTAAAGTATCGGATTGACGTAAAGATTATTGGAGTTATGCA 585 AGAGCCAGTAAAGTATCGGATTGAAGTAAAGATTATTGGAGTTATGCA 25267 CTGTCCCATT Statistics Matches: 1268, Mismatches: 13, Indels: 1 0.99 0.01 0.00 Matches are distributed among these distances: 649 942 0.74 650 326 0.26 ACGTcount: A:0.35, C:0.10, G:0.21, T:0.34 Consensus pattern (649 bp): AAAATGTCCTTGTCTTGATTTGGACGTCAAATGTTGATGAATGCTAATGATATATAATTTTTATG AGATAAAGGATTATAATGAAATGAACTTATCTATGTTAAATTGTTGGACTGAATTATATGATTGT AATGATATGTACATGATGATGCACGAAATGAAAGTTGTGATTGTGATGCAAATATTTATGTTTGT TTGGTCTTATATGATGTCATGAGCATGACTTAATTTAATTAAATGAATGGATAAGTAAAGCTATC TAGAAAACATAGAATGTATGCATAAGTATATTGTCTAAATGGACAATAGGAAAATTTGTGTAAGC CAACATGAATGTTGCATTGCCTGAATGAATGACATGATTTTGATGATGTTGCTATGATGATGGGA GTTATGTCATATGTGTATGTATAAGAAAGTCGAGTCAGAGGTCCTACAATCCCTCCCCCTTACCG AAGTGGTACTTATAATGGAATTTCATGAGATTTGTATTGAATAAGTTTCCGGTTGAGAACCCAAA GAGTTTAGTGATAGAATAATTATAAGTATGATCAGAGATTGAAAATGAGATGATAAGTAAAGTCA GAGCCAGTAAAGTATCGGATTGAAGTAAAGATTATTGGAGTTATGCAATATCCCAATTGAAGTA Found at i:25916 original size:15 final size:15 Alignment explanation

Indices: 25893--25928 Score: 54 Period size: 15 Copynumber: 2.4 Consensus size: 15 25883 CTTGGGTTTC * 25893 TTATCCTGGATCTCT 1 TTATTCTGGATCTCT * 25908 TTATTCTGGATTTCT 1 TTATTCTGGATCTCT 25923 TTATTC 1 TTATTC 25929 GGGTTTCTCT Statistics Matches: 19, Mismatches: 2, Indels: 0 0.90 0.10 0.00 Matches are distributed among these distances: 15 19 1.00 ACGTcount: A:0.14, C:0.19, G:0.11, T:0.56 Consensus pattern (15 bp): TTATTCTGGATCTCT Found at i:25966 original size:14 final size:14 Alignment explanation

Indices: 25900--25966 Score: 71 Period size: 15 Copynumber: 4.6 Consensus size: 14 25890 TTCTTATCCT * 25900 GGATCTCTTTATTC 1 GGATTTCTTTATTC 25914 TGGATTTCTTTATTC 1 -GGATTTCTTTATTC * * * 25929 GGGTTTCTCTATCTT 1 GGATTTCTTTAT-TC 25944 GGATTTCTTTATTC 1 GGATTTCTTTATTC * 25958 GGTTTTCTT 1 GGATTTCTT 25967 GTTATCTTTG Statistics Matches: 43, Mismatches: 8, Indels: 3 0.80 0.15 0.06 Matches are distributed among these distances: 14 19 0.44 15 24 0.56 ACGTcount: A:0.10, C:0.16, G:0.16, T:0.57 Consensus pattern (14 bp): GGATTTCTTTATTC Done.