Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: Scaffold2422

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 26830
ACGTcount: A:0.33, C:0.13, G:0.21, T:0.33


Found at i:427 original size:85 final size:85

Alignment explanation

Indices: 284--462 Score: 349 Period size: 85 Copynumber: 2.1 Consensus size: 85 274 GGCCGGCCAT 284 GAGCATGGGTGGACAAGATGTTATGGCTAAAAACATGTCATAAACATGTTGGGGTAGTGCATTAT 1 GAGCATGGGTGGACAAGATGTTATGGCTAAAAACATGTCATAAACATGTTGGGGTAGTGCATTAT 349 GTAAGGATTAATAAAATAAA 66 GTAAGGATTAATAAAATAAA 369 GAGCATGGGTGGACAAGATGTTATGGCTAAAAACATGTCATAAACATGTTGGGGTAGTGCATTAT 1 GAGCATGGGTGGACAAGATGTTATGGCTAAAAACATGTCATAAACATGTTGGGGTAGTGCATTAT 434 GTAAGGATTAATAAAATAAA 66 GTAAGGATTAATAAAATAAA * 454 GGGCATGGG 1 GAGCATGGG 463 CAATAAAATA Statistics Matches: 93, Mismatches: 1, Indels: 0 0.99 0.01 0.00 Matches are distributed among these distances: 85 93 1.00 ACGTcount: A:0.37, C:0.08, G:0.28, T:0.26 Consensus pattern (85 bp): GAGCATGGGTGGACAAGATGTTATGGCTAAAAACATGTCATAAACATGTTGGGGTAGTGCATTAT GTAAGGATTAATAAAATAAA Found at i:1783 original size:47 final size:47 Alignment explanation

Indices: 1729--2319 Score: 901 Period size: 47 Copynumber: 12.6 Consensus size: 47 1719 TATTTGAATA * 1729 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG * * 1776 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCGAATGGCCAATGTGATG * * 1825 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCGAATGGCCAATGTGATG * * 1874 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1921 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1968 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG * * 2015 AATGTGAACA-TGTGTATGTGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAA-AGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG * * 2062 AATGTGAACA-TGCATATATGAGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAA-AGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG * * 2109 AATGTGAACA-TGTGTATGTGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAA-AGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG * 2156 AATGTGAACA-TG--TATATGAGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAA-AGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 2201 AATGTGAAA-TGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 2247 AATGTG-AAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG * * * 2293 GATGTGGAAGTGTATAAATGTGATAAG 1 AATGTGAAAGTGTATATATGTGATAAG 2320 TCCCGAAGGG Statistics Matches: 519, Mismatches: 18, Indels: 14 0.94 0.03 0.03 Matches are distributed among these distances: 44 3 0.01 45 41 0.08 46 80 0.15 47 299 0.58 48 1 0.00 49 95 0.18 ACGTcount: A:0.33, C:0.09, G:0.30, T:0.28 Consensus pattern (47 bp): AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG Found at i:2220 original size:24 final size:24 Alignment explanation

Indices: 2193--2269 Score: 70 Period size: 23 Copynumber: 3.3 Consensus size: 24 2183 CGAATGGCCA 2193 ATGTGATGAATGTGAAATGTATAT 1 ATGTGATGAATGTGAAATGTATAT * * *** 2217 ATGTGAT-AAGGCCG-AATGGCCA- 1 ATGTGATGAATG-TGAAATGTATAT * 2239 ATGTGATGAATGTGAAGTGTATAT 1 ATGTGATGAATGTGAAATGTATAT 2263 ATGTGAT 1 ATGTGAT 2270 AAGGCCGAAT Statistics Matches: 38, Mismatches: 11, Indels: 8 0.67 0.19 0.14 Matches are distributed among these distances: 22 8 0.21 23 15 0.39 24 15 0.39 ACGTcount: A:0.34, C:0.05, G:0.29, T:0.32 Consensus pattern (24 bp): ATGTGATGAATGTGAAATGTATAT Found at i:4806 original size:38 final size:38 Alignment explanation

Indices: 4742--4816 Score: 107 Period size: 38 Copynumber: 2.0 Consensus size: 38 4732 AATCCGAGTT * 4742 TAAAGACCCGCTGACTATATGAAGAGATTATGTCCGGG 1 TAAAGACCCGATGACTATATGAAGAGATTATGTCCGGG * * 4780 TAAAGACCCGATGGCTATGT-ACAGAGATTATGTCCGG 1 TAAAGACCCGATGACTATATGA-AGAGATTATGTCCGG 4817 ATTAAAATTC Statistics Matches: 33, Mismatches: 3, Indels: 2 0.87 0.08 0.05 Matches are distributed among these distances: 37 1 0.03 38 32 0.97 ACGTcount: A:0.31, C:0.19, G:0.27, T:0.24 Consensus pattern (38 bp): TAAAGACCCGATGACTATATGAAGAGATTATGTCCGGG Found at i:4973 original size:40 final size:40 Alignment explanation

Indices: 4870--5265 Score: 624 Period size: 40 Copynumber: 10.1 Consensus size: 40 4860 AGGTCTCGAC 4870 GATG-ATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 4909 GATGTATCC-GGCTAAGTCCCGAAGAGCATTCATGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 4948 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 4988 GATGTATCCGGGCTAAGT-CCGAAGAGCATTCATGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT * 5027 GATGTATCCGGGCTAAGT-CCGAAGAGCATTCGTGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 5066 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 5106 GATGTATCCGGGCTAAGT-CCGAAGAGCATT-ATGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT * * 5144 GATGTATCCGGGCTAAGTTCCGAAGAGCATTCGTGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT * * ** * * 5184 GATATATCCGTGCTAAACCCCGAAGAGCATTCGTGCTGGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT * * * * * 5224 GTTATATCCGGGCTAGGTCCCGAAGAGCAATCATGCTGGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 5264 GA 1 GA 5266 CGTGTATTCG Statistics Matches: 335, Mismatches: 17, Indels: 9 0.93 0.05 0.02 Matches are distributed among these distances: 38 26 0.08 39 144 0.43 40 165 0.49 ACGTcount: A:0.25, C:0.22, G:0.28, T:0.25 Consensus pattern (40 bp): GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT Found at i:5010 original size:79 final size:80 Alignment explanation

Indices: 4870--5265 Score: 624 Period size: 79 Copynumber: 5.0 Consensus size: 80 4860 AGGTCTCGAC 4870 GATG-ATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCC-GGCTAAGTCCCGAAG 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAGTCCCGAAG 4933 AGCATTCATGCTAGT 66 AGCATTCATGCTAGT 4948 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAGT-CCGAAG 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAGTCCCGAAG 5012 AGCATTCATGCTAGT 66 AGCATTCATGCTAGT * 5027 GATGTATCCGGGCTAAGT-CCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAG 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAGTCCCGAAG 5091 AGCATTCATGCTAGT 66 AGCATTCATGCTAGT * 5106 GATGTATCCGGGCTAAGT-CCGAAGAGCATT-ATGCTAGTGATGTATCCGGGCTAAGTTCCGAAG 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAGTCCCGAAG * 5169 AGCATTCGTGCTAGT 66 AGCATTCATGCTAGT * * ** * * * * * 5184 GATATATCCGTGCTAAACCCCGAAGAGCATTCGTGCTGGTGTTATATCCGGGCTAGGTCCCGAAG 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAGTCCCGAAG * * 5249 AGCAATCATGCTGGT 66 AGCATTCATGCTAGT 5264 GA 1 GA 5266 CGTGTATTCG Statistics Matches: 296, Mismatches: 17, Indels: 8 0.92 0.05 0.02 Matches are distributed among these distances: 78 101 0.34 79 146 0.49 80 49 0.17 ACGTcount: A:0.25, C:0.22, G:0.28, T:0.25 Consensus pattern (80 bp): GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAGTCCCGAAG AGCATTCATGCTAGT Found at i:5083 original size:118 final size:119 Alignment explanation

Indices: 4870--5265 Score: 631 Period size: 118 Copynumber: 3.4 Consensus size: 119 4860 AGGTCTCGAC 4870 GATG-ATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCC-GGCTAAGTCCCGAAG 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAGT-CCGAAG * 4933 AGCATTCATGCTAGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 65 AGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 4988 GATGTATCCGGGCTAAGT-CCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAGTCCGAAGA 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAGTCCGAAGA 5052 GCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 66 GCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 5106 GATGTATCCGGGCTAAGT-CCGAAGAGCATT-ATGCTAGTGATGTATCCGGGCTAAGTTCCGAAG 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAG-TCCGAAG * * ** * * 5169 AGCATTCGTGCTAGTGATATATCCGTGCTAAACCCCGAAGAGCATTCGTGCTGGT 65 AGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT * * * * * 5224 GTTATATCCGGGCTAGGTCCCGAAGAGCAATCATGCTGGTGA 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGA 5266 CGTGTATTCG Statistics Matches: 261, Mismatches: 12, Indels: 8 0.93 0.04 0.03 Matches are distributed among these distances: 117 25 0.10 118 195 0.75 119 32 0.12 120 9 0.03 ACGTcount: A:0.25, C:0.22, G:0.28, T:0.25 Consensus pattern (119 bp): GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAGTCCGAAGA GCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT Found at i:6579 original size:85 final size:85 Alignment explanation

Indices: 6436--6614 Score: 349 Period size: 85 Copynumber: 2.1 Consensus size: 85 6426 GGCCGGCCAT 6436 GAGCATGGGTGGACAAGATGTTATGGCTAAAAACATGTCATAAACATGTTGGGGTAGTGCATTAT 1 GAGCATGGGTGGACAAGATGTTATGGCTAAAAACATGTCATAAACATGTTGGGGTAGTGCATTAT 6501 GTAAGGATTAATAAAATAAA 66 GTAAGGATTAATAAAATAAA 6521 GAGCATGGGTGGACAAGATGTTATGGCTAAAAACATGTCATAAACATGTTGGGGTAGTGCATTAT 1 GAGCATGGGTGGACAAGATGTTATGGCTAAAAACATGTCATAAACATGTTGGGGTAGTGCATTAT 6586 GTAAGGATTAATAAAATAAA 66 GTAAGGATTAATAAAATAAA * 6606 GGGCATGGG 1 GAGCATGGG 6615 CAATAAAATA Statistics Matches: 93, Mismatches: 1, Indels: 0 0.99 0.01 0.00 Matches are distributed among these distances: 85 93 1.00 ACGTcount: A:0.37, C:0.08, G:0.28, T:0.26 Consensus pattern (85 bp): GAGCATGGGTGGACAAGATGTTATGGCTAAAAACATGTCATAAACATGTTGGGGTAGTGCATTAT GTAAGGATTAATAAAATAAA Found at i:7903 original size:49 final size:47 Alignment explanation

Indices: 7825--8329 Score: 708 Period size: 47 Copynumber: 10.6 Consensus size: 47 7815 TATTTGAATA * * 7825 AATGTGAACGTGTATATATGTGATAAGGCCTAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG * ** 7872 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCTGATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCGAATGGCCAATGTGATG * * * 7921 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATAGCCGATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCGAATGGCCAATGTGATG * * * 7970 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGACGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG * * 8017 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCGAATGGCCAATGTGATG 8066 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG * 8113 AATGTGAAAGTGTATATATATGTGATAGGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCGAATGGCCAATGTGATG * * * 8162 AAGGTGAACA-TGTGTATGTGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAA-AGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG * * 8209 AATGTGAACA-TGCATATATGAGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAA-AGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 8256 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG * * * 8303 GATGTGGAAGTGTATAAATGTGATAAG 1 AATGTGAAAGTGTATATATGTGATAAG 8330 TCCCGAAGGG Statistics Matches: 425, Mismatches: 25, Indels: 16 0.91 0.05 0.03 Matches are distributed among these distances: 46 1 0.00 47 242 0.57 49 181 0.43 50 1 0.00 ACGTcount: A:0.33, C:0.09, G:0.30, T:0.29 Consensus pattern (47 bp): AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG Found at i:7934 original size:96 final size:95 Alignment explanation

Indices: 7825--8329 Score: 723 Period size: 96 Copynumber: 5.3 Consensus size: 95 7815 TATTTGAATA * 7825 AATGTGAACGTG-TATATATGTGATAAGGCCTAATGGCCAATGTGATGAATGTGAAAGTGTATAT 1 AATGTGAAAGTGATATATATGTGATAAGGCCTAATGGCCAATGTGATGAATGTGAAAGTG--TAT * ** 7889 ATATGTGATAAGGCCTAATGGCTGATGTGATG 64 ATATGTGATAAGGCCGAATGGCCAATGTGATG * * 7921 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATAGCCGATGTGATGAATGTGAAAGTGTATA 1 AATGTGAAAGTG-ATATATATGTGATAAGGCCTAATGGCCAATGTGATGAATGTGAAAGTGTATA * * * 7986 TATGTGATAAGGCCTAATGGCCGACGTGATG 65 TATGTGATAAGGCCGAATGGCCAATGTGATG * 8017 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATA 1 AATGTGAAAGTG-ATATATATGTGATAAGGCCTAATGGCCAATGTGATGAATGTGAAAGTGTATA 8082 TATGTGATAAGGCCGAATGGCCAATGTGATG 65 TATGTGATAAGGCCGAATGGCCAATGTGATG * * * * 8113 AATGTGAAAGTGTATATATATGTGATAGGGCCGAATGGCCAATGTGATGAAGGTGAACA-TGTGT 1 AATGTGAAAGTG-ATATATATGTGATAAGGCCTAATGGCCAATGTGATGAATGTGAA-AGTGTAT * 8177 ATGTGTGATAAGGCCGAATGGCCAATGTGATG 64 ATATGTGATAAGGCCGAATGGCCAATGTGATG * * * 8209 AATGTGAACA-TG-CATATATGAGATAAGGCCGAATGGCCAATGTGATGAATGTGAAAGTGTATA 1 AATGTGAA-AGTGATATATATGTGATAAGGCCTAATGGCCAATGTGATGAATGTGAAAGTGTATA 8272 TATGTGATAAGGCCGAATGGCCAATGTGATG 65 TATGTGATAAGGCCGAATGGCCAATGTGATG * * * 8303 GATGTGGAAGTG-TATAAATGTGATAAG 1 AATGTGAAAGTGATATATATGTGATAAG 8330 TCCCGAAGGG Statistics Matches: 377, Mismatches: 26, Indels: 14 0.90 0.06 0.03 Matches are distributed among these distances: 93 2 0.01 94 94 0.25 96 234 0.62 97 2 0.01 98 45 0.12 ACGTcount: A:0.33, C:0.09, G:0.30, T:0.29 Consensus pattern (95 bp): AATGTGAAAGTGATATATATGTGATAAGGCCTAATGGCCAATGTGATGAATGTGAAAGTGTATAT ATGTGATAAGGCCGAATGGCCAATGTGATG Found at i:12688 original size:48 final size:48 Alignment explanation

Indices: 12560--12704 Score: 175 Period size: 48 Copynumber: 3.0 Consensus size: 48 12550 AAGGAAAGAT * * * * 12560 TTGAAAAGAGTAAGTTAATATGACTCTATATGAGATATACGATATGTA 1 TTGAAAAGAATAAGTTAATATGACTCTATATGTGATATATGTTATGTA * * * * 12608 TTGAAAA-AAGTAAGTTAATGTAAATCTGTATGTGATATATGTTATGTA 1 TTGAAAAGAA-TAAGTTAATATGACTCTATATGTGATATATGTTATGTA * * * 12656 TTGAAAAGAATAAATTAATATGACTCTATATGTGTTAAATGTTATGTA 1 TTGAAAAGAATAAGTTAATATGACTCTATATGTGATATATGTTATGTA 12704 T 1 T 12705 AATTGCTGAT Statistics Matches: 80, Mismatches: 15, Indels: 4 0.81 0.15 0.04 Matches are distributed among these distances: 47 1 0.01 48 77 0.96 49 2 0.03 ACGTcount: A:0.41, C:0.04, G:0.17, T:0.38 Consensus pattern (48 bp): TTGAAAAGAATAAGTTAATATGACTCTATATGTGATATATGTTATGTA Found at i:24043 original size:21 final size:20 Alignment explanation

Indices: 24019--24057 Score: 51 Period size: 20 Copynumber: 1.9 Consensus size: 20 24009 GTGTAAATGT 24019 AGTAACATAATTGTTATTTTA 1 AGTAACATAA-TGTTATTTTA ** 24040 AGTAATTTAATGTTATTT 1 AGTAACATAATGTTATTT 24058 ATATGATATG Statistics Matches: 16, Mismatches: 2, Indels: 1 0.84 0.11 0.05 Matches are distributed among these distances: 20 8 0.50 21 8 0.50 ACGTcount: A:0.36, C:0.03, G:0.10, T:0.51 Consensus pattern (20 bp): AGTAACATAATGTTATTTTA Done.