Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: Scaffold3034

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 27269
ACGTcount: A:0.31, C:0.19, G:0.19, T:0.31


Found at i:2253 original size:40 final size:40

Alignment explanation

Indices: 2207--2337 Score: 192 Period size: 40 Copynumber: 3.3 Consensus size: 40 2197 CGACTAAGAT * 2207 CCGAAGGTATTTGTGCGAGTTATTAATTCCGGGTTAAGTC 1 CCGAAGGCATTTGTGCGAGTTATTAATTCCGGGTTAAGTC * * * 2247 CCGAAGGCCTTTGTGCGAGATACTAATTCCGGGTTAAGTC 1 CCGAAGGCATTTGTGCGAGTTATTAATTCCGGGTTAAGTC * * 2287 CCGAAGGCATTCGTGCGAGTT-TTAAAATCCGGGTTAAGTC 1 CCGAAGGCATTTGTGCGAGTTATT-AATTCCGGGTTAAGTC 2327 CCGAAGGCATT 1 CCGAAGGCATT 2338 GAATGAGTTA Statistics Matches: 81, Mismatches: 9, Indels: 2 0.88 0.10 0.02 Matches are distributed among these distances: 39 1 0.01 40 80 0.99 ACGTcount: A:0.24, C:0.20, G:0.27, T:0.29 Consensus pattern (40 bp): CCGAAGGCATTTGTGCGAGTTATTAATTCCGGGTTAAGTC Found at i:2358 original size:39 final size:38 Alignment explanation

Indices: 2235--2384 Score: 131 Period size: 40 Copynumber: 3.8 Consensus size: 38 2225 GTTATTAATT * ** * * 2235 CCGGGTTAAGTCCCGAAGGCCTTTGTGCGAGATACTAATT 1 CCGGGTTAAGTCCCGAAGG-CATTGAACGAGTTACTAA-A ** * 2275 CCGGGTTAAGTCCCGAAGGCATTCGTGCGAGTT-TTAAAA 1 CCGGGTTAAGTCCCGAAGGCATT-GAACGAGTTACT-AAA * 2314 TCCGGGTTAAGTCCCGAAGGCATTGAATGAGTTACTATAA 1 -CCGGGTTAAGTCCCGAAGGCATTGAACGAGTTACTA-AA * * 2354 CCGGGCTATGTCCCGAAGGCACTTGAACGAG 1 CCGGGTTAAGTCCCGAAGGCA-TTGAACGAG 2385 GAGCTAAATC Statistics Matches: 93, Mismatches: 11, Indels: 12 0.80 0.09 0.10 Matches are distributed among these distances: 39 30 0.32 40 63 0.68 ACGTcount: A:0.25, C:0.22, G:0.28, T:0.25 Consensus pattern (38 bp): CCGGGTTAAGTCCCGAAGGCATTGAACGAGTTACTAAA Found at i:4370 original size:15 final size:15 Alignment explanation

Indices: 4346--4375 Score: 51 Period size: 15 Copynumber: 2.0 Consensus size: 15 4336 CTAATGTATT 4346 TTTTGAGGTTTCGGC 1 TTTTGAGGTTTCGGC * 4361 TTTTGTGGTTTCGGC 1 TTTTGAGGTTTCGGC 4376 ACAAGTGTTG Statistics Matches: 14, Mismatches: 1, Indels: 0 0.93 0.07 0.00 Matches are distributed among these distances: 15 14 1.00 ACGTcount: A:0.03, C:0.13, G:0.33, T:0.50 Consensus pattern (15 bp): TTTTGAGGTTTCGGC Found at i:15289 original size:53 final size:52 Alignment explanation

Indices: 15189--15290 Score: 118 Period size: 53 Copynumber: 1.9 Consensus size: 52 15179 TTCCTTTTTA * * * 15189 AACTTACCATTGCCATGTCTTGACATGGTCTTACGTGGTATCCTTGCCTCATG 1 AACTCACCATTGCCATGCCTTGACATGGTCTTACGTGATAT-CTTGCCTCATG * 15242 AACTCACCATTTCCATGCCTTAGA-ATGGTCTTACATGTGATAT-TTGCCT 1 AACTCACCATTGCCATGCCTT-GACATGGTCTTAC--GTGATATCTTGCCT 15291 TATCGTAGTT Statistics Matches: 42, Mismatches: 4, Indels: 6 0.81 0.08 0.12 Matches are distributed among these distances: 53 34 0.81 54 2 0.05 55 6 0.14 ACGTcount: A:0.22, C:0.25, G:0.17, T:0.36 Consensus pattern (52 bp): AACTCACCATTGCCATGCCTTGACATGGTCTTACGTGATATCTTGCCTCATG Found at i:19512 original size:47 final size:47 Alignment explanation

Indices: 19458--20000 Score: 939 Period size: 47 Copynumber: 11.5 Consensus size: 47 19448 TATTTGAATA 19458 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * 19505 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 19552 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGATGTGATG * * * 19601 AATTTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 19648 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGATGTGATG * 19697 AATGTGAAAGTGTATATATGTGATAAGGCCTAATAGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 19744 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 19791 AATGTGAAA--GTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * 19836 AATGTGAAAGTGTATATATGTGAT-AGGCCTAATAGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 19882 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * 19929 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * 19976 AATGTGAAAGTGTATATATGGGATA 1 AATGTGAAAGTGTATATATGTGATA 20001 GGTCCCGAAG Statistics Matches: 472, Mismatches: 17, Indels: 14 0.94 0.03 0.03 Matches are distributed among these distances: 45 45 0.10 46 45 0.10 47 293 0.62 49 89 0.19 ACGTcount: A:0.33, C:0.08, G:0.29, T:0.30 Consensus pattern (47 bp): AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG Found at i:19584 original size:96 final size:94 Alignment explanation

Indices: 19458--20000 Score: 939 Period size: 96 Copynumber: 5.8 Consensus size: 94 19448 TATTTGAATA 19458 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA * * 19523 TGTGATAAGGCCGAATGGCCAATGTGATG 66 TGTGATAAGGCCTAATGGCCGATGTGATG * 19552 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATGAATTTGAAAGTGTATA 1 AATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATA * * 19617 TATGTGATAAGGCCGAATGGCCAATGTGATG 64 TATGTGATAAGGCCTAATGGCCGATGTGATG 19648 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATA 1 AATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATA * 19713 TATGTGATAAGGCCTAATAGCCGATGTGATG 64 TATGTGATAAGGCCTAATGGCCGATGTGATG 19744 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAA--GTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 19807 TGTGATAAGGCCTAATGGCCGATGTGATG 66 TGTGATAAGGCCTAATGGCCGATGTGATG * 19836 AATGTGAAAGTGTATATATGTGAT-AGGCCTAATAGCCGATGTGATGAATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 19900 TGTGATAAGGCCTAATGGCCGATGTGATG 66 TGTGATAAGGCCTAATGGCCGATGTGATG * * 19929 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA * 19994 TGGGATA 66 TGTGATA 20001 GGTCCCGAAG Statistics Matches: 433, Mismatches: 11, Indels: 10 0.95 0.02 0.02 Matches are distributed among these distances: 91 30 0.07 92 59 0.14 93 60 0.14 94 99 0.23 96 185 0.43 ACGTcount: A:0.33, C:0.08, G:0.29, T:0.30 Consensus pattern (94 bp): AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA TGTGATAAGGCCTAATGGCCGATGTGATG Found at i:19625 original size:143 final size:141 Alignment explanation

Indices: 19458--20000 Score: 948 Period size: 143 Copynumber: 3.8 Consensus size: 141 19448 TATTTGAATA 19458 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 19523 TGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAAAGTGTATATATATGTGATAAGGCCTAAT 66 TGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAAAGTG--TATATATGTGATAAGGCCTAAT * 19588 GGCCGATGTGATG 129 AGCCGATGTGATG * * * 19601 AATTTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTG--TATA * * 19666 TATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAAT 64 TATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAAT 19731 AGCCGATGTGATG 129 AGCCGATGTGATG 19744 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAA--GTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA * * 19807 TGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGAT-AGGCCTAATAG 66 TGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATAG 19871 CCGATGTGATG 131 CCGATGTGATG 19882 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA * 19947 TGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAAAGTGTATATATGGGATA 66 TGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAAAGTGTATATATGTGATA 20001 GGTCCCGAAG Statistics Matches: 383, Mismatches: 12, Indels: 12 0.94 0.03 0.03 Matches are distributed among these distances: 138 78 0.20 139 59 0.15 140 57 0.15 141 1 0.00 143 143 0.37 145 45 0.12 ACGTcount: A:0.33, C:0.08, G:0.29, T:0.30 Consensus pattern (141 bp): AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA TGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATAG CCGATGTGATG Found at i:21644 original size:23 final size:23 Alignment explanation

Indices: 21570--21644 Score: 63 Period size: 23 Copynumber: 3.5 Consensus size: 23 21560 TGCTAGTGAT 21570 GTATTCGGGCTAAGTCTCGAAGA 1 GTATTCGGGCTAAGTCTCGAAGA * * * 21593 GCATTCGTGCT-AG--T-G-A-T 1 GTATTCGGGCTAAGTCTCGAAGA * 21610 GTATCCGGGCTAAGTCTCGAAGA 1 GTATTCGGGCTAAGTCTCGAAGA * 21633 GTATTCGTGCTA 1 GTATTCGGGCTA 21645 GTGATGTATC Statistics Matches: 37, Mismatches: 9, Indels: 12 0.64 0.16 0.21 Matches are distributed among these distances: 17 8 0.22 18 3 0.08 19 1 0.03 20 2 0.05 21 1 0.03 22 3 0.08 23 19 0.51 ACGTcount: A:0.23, C:0.19, G:0.29, T:0.29 Consensus pattern (23 bp): GTATTCGGGCTAAGTCTCGAAGA Found at i:21767 original size:40 final size:40 Alignment explanation

Indices: 21404--21755 Score: 569 Period size: 40 Copynumber: 8.8 Consensus size: 40 21394 GAGAATTGAG 21404 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT * 21444 AGTGATGTATCCGGGCTAAGTCTCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT 21484 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT 21524 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT * * 21564 AGTGATGTATTCGGGCTAAGTCTCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT * * 21604 AGTGATGTATCCGGGCTAAGTCTCGAAGAGTATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT * * 21644 AGTGATGTATCCGGACTAAGTTCCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT * * ** 21684 AGTGATATATCCGTGCTAAACCCCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT * * * * 21724 GGTGTTATATCCGGGCTAGGTCCCGAAGAGCA 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCA 21756 ATCATGCTGG Statistics Matches: 290, Mismatches: 22, Indels: 0 0.93 0.07 0.00 Matches are distributed among these distances: 40 290 1.00 ACGTcount: A:0.23, C:0.21, G:0.29, T:0.26 Consensus pattern (40 bp): AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT Found at i:25931 original size:96 final size:94 Alignment explanation

Indices: 25764--26312 Score: 910 Period size: 96 Copynumber: 5.9 Consensus size: 94 25754 ATATTGAATA 25764 AATGTG-AAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGA-GAATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 25827 TGTGATAAGGCCGAATGGCCAATGTGATG 66 TGTGATAAGGCCGAATGGCCAATGTGATG 25856 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATA 1 AATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATA 25921 TATGTGATAAGGCCGAATGGCCAATGTGATG 64 TATGTGATAAGGCCGAATGGCCAATGTGATG 25952 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATA 1 AATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATA * * * 26017 TATGTGATAAGGCCTAATAGCCGATGTGATG 64 TATGTGATAAGGCCGAATGGCCAATGTGATG 26048 AATGTGAAAGT-TATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA * * 26112 TGTGATAAGGCCTAATGGCCGATGTGATG 66 TGTGATAAGGCCGAATGGCCAATGTGATG 26141 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 26206 TGTGATAAGGCCGAATGGCCAATGTGATG 66 TGTGATAAGGCCGAATGGCCAATGTGATG * * * * * * * 26235 AATGTGAAAGTG--TATATGTGATAGGGCCGAGTGGCCAACGTGATGGATGTGAAAGTGTATAAA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA * 26298 TGTGATAAGTCCGAA 66 TGTGATAAGGCCGAA 26313 GGGCATTTGT Statistics Matches: 438, Mismatches: 14, Indels: 10 0.95 0.03 0.02 Matches are distributed among these distances: 92 64 0.15 93 97 0.22 94 92 0.21 95 33 0.08 96 152 0.35 ACGTcount: A:0.33, C:0.09, G:0.30, T:0.29 Consensus pattern (94 bp): AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA TGTGATAAGGCCGAATGGCCAATGTGATG Found at i:25940 original size:47 final size:47 Alignment explanation

Indices: 25764--26306 Score: 889 Period size: 47 Copynumber: 11.6 Consensus size: 47 25754 ATATTGAATA 25764 AATGTG-AAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGA-G 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * 25809 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 25856 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGATGTGATG * * 25905 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 25952 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGATGTGATG * 26001 AATGTGAAAGTGTATATATGTGATAAGGCCTAATAGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 26048 AATGTGAAAGT-TATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 26094 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 26141 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * 26188 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * * * * 26235 AATGTGAAAGTG--TATATGTGATAGGGCCGAGTGGCCAACGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * 26280 GATGTGAAAGTGTATAAATGTGATAAG 1 AATGTGAAAGTGTATATATGTGATAAG 26307 TCCGAAGGGC Statistics Matches: 471, Mismatches: 18, Indels: 16 0.93 0.04 0.03 Matches are distributed among these distances: 45 47 0.10 46 81 0.17 47 253 0.54 49 90 0.19 ACGTcount: A:0.33, C:0.08, G:0.30, T:0.29 Consensus pattern (47 bp): AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG Done.