Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: Scaffold533

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 31892
ACGTcount: A:0.32, C:0.17, G:0.20, T:0.32


Found at i:2798 original size:47 final size:47

Alignment explanation

Indices: 2744--3270 Score: 891 Period size: 47 Copynumber: 11.4 Consensus size: 47 2734 TATTTGAATA 2744 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * 2791 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 2838 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGATGTGATG 2887 AATGTGAAAGTGTATATATGTGATAAGGCCTAAT-G--GATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 2931 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 2978 AATGTGAAAGTGTATATATGTGATAAGGCCTAAT-GCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 3024 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 3071 AATGTGAAAGTGTATATATGTGATAAGG-CTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 3117 AATGTGAAAGTGTATATATGTGAT-A-GCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 3162 -ATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * * 3208 AATGTGAAAGTGTATATATGTGAT-A-GCC-GATGG-CAACGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 3251 -ATGTGAAAGTGTGATATATG 1 AATGTGAAAGTGT-ATATATG 3271 ATTCCCGAAG Statistics Matches: 462, Mismatches: 7, Indels: 26 0.93 0.01 0.05 Matches are distributed among these distances: 42 12 0.03 43 15 0.03 44 71 0.15 45 24 0.05 46 110 0.24 47 185 0.40 49 45 0.10 ACGTcount: A:0.32, C:0.08, G:0.30, T:0.30 Consensus pattern (47 bp): AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG Found at i:3019 original size:93 final size:94 Alignment explanation

Indices: 2744--3270 Score: 891 Period size: 93 Copynumber: 5.7 Consensus size: 94 2734 TATTTGAATA 2744 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA * * 2809 TGTGATAAGGCCGAATGGCCAATGTGATG 66 TGTGATAAGGCCTAATGGCCGATGTGATG 2838 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATA 1 AATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATA 2903 TATGTGATAAGGCCTAAT-G--GATGTGATG 64 TATGTGATAAGGCCTAATGGCCGATGTGATG 2931 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 2996 TGTGATAAGGCCTAAT-GCCGATGTGATG 66 TGTGATAAGGCCTAATGGCCGATGTGATG 3024 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 3089 TGTGATAAGG-CTAATGGCCGATGTGATG 66 TGTGATAAGGCCTAATGGCCGATGTGATG 3117 AATGTGAAAGTGTATATATGTGAT-A-GCCTAATGGCCGATGTGATG-ATGTGAAAGTGTATATA 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA 3179 TGTGATAAGGCCTAATGGCCGATGTGATG 66 TGTGATAAGGCCTAATGGCCGATGTGATG * * * 3208 AATGTGAAAGTGTATATATGTGAT-A-GCC-GATGG-CAACGTGATG-ATGTGAAAGTGTGATAT 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGT-ATAT 3268 ATG 65 ATG 3271 ATTCCCGAAG Statistics Matches: 421, Mismatches: 5, Indels: 18 0.95 0.01 0.04 Matches are distributed among these distances: 89 20 0.05 90 38 0.09 91 136 0.32 92 6 0.01 93 140 0.33 94 12 0.03 95 1 0.00 96 68 0.16 ACGTcount: A:0.32, C:0.08, G:0.30, T:0.30 Consensus pattern (94 bp): AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA TGTGATAAGGCCTAATGGCCGATGTGATG Found at i:4808 original size:79 final size:79 Alignment explanation

Indices: 4677--5023 Score: 572 Period size: 79 Copynumber: 4.4 Consensus size: 79 4667 GAGAATTGAG 4677 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCGA 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCGA 4742 AGAGCATTCGTGCT 66 AGAGCATTCGTGCT 4756 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGT-CGA 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCGA 4820 AGAGCATTCGTGCT 66 AGAGCATTCGTGCT * 4834 AGTGATGTAT-CGGGCTAAGTCTCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCTCG 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTC-CG 4898 AAGAGCATTCGTGCT 65 AAGAGCATTCGTGCT * * * * ** 4913 AGTGATGTATCCGGACTAAGTTCCGAAGAGCATTCGTGCTAGTGATATATCCGTGCTAAACCCGA 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCGA 4978 AGAGCATTCGTGCT 66 AGAGCATTCGTGCT * * * * 4992 GGTGTTATATCCGGGCTAGGTCCCGAAGAGCA 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCA 5024 ATCATGCTGG Statistics Matches: 251, Mismatches: 14, Indels: 6 0.93 0.05 0.02 Matches are distributed among these distances: 77 49 0.20 78 27 0.11 79 131 0.52 80 44 0.18 ACGTcount: A:0.24, C:0.21, G:0.30, T:0.26 Consensus pattern (79 bp): AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCGA AGAGCATTCGTGCT Found at i:4885 original size:117 final size:118 Alignment explanation

Indices: 4677--5023 Score: 563 Period size: 117 Copynumber: 2.9 Consensus size: 118 4667 GAGAATTGAG 4677 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCGA 1 AGTGATGTATCCGGGCTAAGT-CCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCGA 4742 AGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT 65 AGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT 4796 AGTGATGTATCCGGGCTAAGT-CGAAGAGCATTCGTGCTAGTGATGTAT-CGGGCTAAGTCTCGA 1 AGTGATGTATCCGGGCTAAGTCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTC-CGA * 4859 AGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCTCGAAGAGCATTCGTGCT 65 AGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT * * * ** 4913 AGTGATGTATCCGGACTAAGTTCCGAAGAGCATTCGTGCTAGTGATATATCCGTGCTAAACCCGA 1 AGTGATGTATCCGGGCTAAG-TCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCGA * * * * 4978 AGAGCATTCGTGCTGGTGTTATATCCGGGCTAGGTCCCGAAGAGCA 65 AGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGAGCA 5024 ATCATGCTGG Statistics Matches: 213, Mismatches: 11, Indels: 8 0.92 0.05 0.03 Matches are distributed among these distances: 116 11 0.05 117 102 0.48 118 1 0.00 119 91 0.43 120 8 0.04 ACGTcount: A:0.24, C:0.21, G:0.30, T:0.26 Consensus pattern (118 bp): AGTGATGTATCCGGGCTAAGTCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCGAA GAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT Found at i:5035 original size:40 final size:40 Alignment explanation

Indices: 4677--5023 Score: 560 Period size: 40 Copynumber: 8.8 Consensus size: 40 4667 GAGAATTGAG 4677 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT 4717 AGTGATGTATCCGGGCTAAGT-CCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT 4756 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT 4796 AGTGATGTATCCGGGCTAAGT--CGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT * 4834 AGTGATGTAT-CGGGCTAAGTCTCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT * 4873 AGTGATGTATCCGGGCTAAGTCTCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT * * 4913 AGTGATGTATCCGGACTAAGTTCCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT * * * 4953 AGTGATATATCCGTGCTAA-ACCCGAAGAGCATTCGTGCT 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT * * * * 4992 GGTGTTATATCCGGGCTAGGTCCCGAAGAGCA 1 AGTGATGTATCCGGGCTAAGTCCCGAAGAGCA 5024 ATCATGCTGG Statistics Matches: 289, Mismatches: 13, Indels: 10 0.93 0.04 0.03 Matches are distributed among these distances: 37 10 0.03 38 27 0.09 39 99 0.34 40 153 0.53 ACGTcount: A:0.24, C:0.21, G:0.30, T:0.26 Consensus pattern (40 bp): AGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCT Found at i:9091 original size:47 final size:47 Alignment explanation

Indices: 9037--9584 Score: 871 Period size: 47 Copynumber: 11.6 Consensus size: 47 9027 TATTTGAATA 9037 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * 9084 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * 9131 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGACCGATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGATGTGATG * * 9180 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * 9227 AATGTGAAAGTGTATATATATGTGATAAGGCCTAATGACCAATGTGATG 1 AATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGATGTGATG * 9276 AATGTGAAAGTGTATATATGTGATAAGGCCTAATAGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * 9323 AATGTGAAAGTATATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 9370 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 9417 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * 9464 AATGTGAAAGTGTATATATGTGATAAGGCCGAATGGCCAATGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * * * * * * 9511 AATGTGAAAGTGTATATGTGGGATAGGGCCGAGTGGCCAACGTGATG 1 AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG * * * 9558 GATGGGAAAGTGTATAAATGTGATAAG 1 AATGTGAAAGTGTATATATGTGATAAG 9585 TCCCGAAGGG Statistics Matches: 468, Mismatches: 29, Indels: 8 0.93 0.06 0.02 Matches are distributed among these distances: 47 379 0.81 49 89 0.19 ACGTcount: A:0.34, C:0.08, G:0.30, T:0.29 Consensus pattern (47 bp): AATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATG Found at i:11671 original size:30 final size:29 Alignment explanation

Indices: 11632--11691 Score: 102 Period size: 30 Copynumber: 2.0 Consensus size: 29 11622 GTAGCCGAAG * 11632 CTAGTTAAATCGCACACTTAGTGCCAAAA 1 CTAGTTAAATCGCACAATTAGTGCCAAAA 11661 CTAGTTTAAATCGCACAATTAGTGCCAAAA 1 CTAG-TTAAATCGCACAATTAGTGCCAAAA 11691 C 1 C 11692 ATCCTTTTCA Statistics Matches: 29, Mismatches: 1, Indels: 1 0.94 0.03 0.03 Matches are distributed among these distances: 29 4 0.14 30 25 0.86 ACGTcount: A:0.38, C:0.23, G:0.13, T:0.25 Consensus pattern (29 bp): CTAGTTAAATCGCACAATTAGTGCCAAAA Found at i:20119 original size:40 final size:40 Alignment explanation

Indices: 20075--20258 Score: 228 Period size: 40 Copynumber: 4.6 Consensus size: 40 20065 TATTCGAATG * 20075 ATATCCGGGCTAAGTCCCGAAGGCTTTTATGCTAGTGACT 1 ATATCCGGGCTAAGTCCCGAAGGCATTTATGCTAGTGACT * * * * 20115 ATATCTGGACTAAGAT-CCGAAGGCATTTGTGCGAGTTG-CT 1 ATATCCGGGCTAAG-TCCCGAAGGCATTTATGCTAG-TGACT * * * * 20155 ATATCCGGGCTAAGACCCGAAGGCATTTGTGCTAGCGATT 1 ATATCCGGGCTAAGTCCCGAAGGCATTTATGCTAGTGACT * 20195 ATATCCGGGCTAAGTCCCGAAGGCATTTATGCTAGTGACC 1 ATATCCGGGCTAAGTCCCGAAGGCATTTATGCTAGTGACT * * 20235 ATATCCGGACTAAGACCCGAAGGC 1 ATATCCGGGCTAAGTCCCGAAGGC 20259 CTTGTGTGAG Statistics Matches: 122, Mismatches: 18, Indels: 8 0.82 0.12 0.05 Matches are distributed among these distances: 39 1 0.01 40 118 0.97 41 3 0.02 ACGTcount: A:0.26, C:0.23, G:0.26, T:0.26 Consensus pattern (40 bp): ATATCCGGGCTAAGTCCCGAAGGCATTTATGCTAGTGACT Found at i:28221 original size:38 final size:40 Alignment explanation

Indices: 28051--28224 Score: 195 Period size: 40 Copynumber: 4.5 Consensus size: 40 28041 TTATTCGATG * * 28051 ATCCGGGCTAAG-TCCGAAGGCTTTTATGCTAGTGACTAT 1 ATCCGGGCTAAGACCCGAAGGCATTTATGCTAGTGACTAT * * * 28090 AT-CGGGCT-AGA-TC-AAGGCATTTGTGCGAGTTG-CTAT 1 ATCCGGGCTAAGACCCGAAGGCATTTATGCTAG-TGACTAT * * * 28126 ATCCGGGCTAAGACCCGAAGGCATTTGTGCTAGCGATTAT 1 ATCCGGGCTAAGACCCGAAGGCATTTATGCTAGTGACTAT * 28166 ATCCGGGCTAAG-TCCGAAGGCATTTATGCTAGTGAC-AT 1 ATCCGGGCTAAGACCCGAAGGCATTTATGCTAGTGACTAT 28204 ATCC-GGCTAAGACCCGAAGGC 1 ATCCGGGCTAAGACCCGAAGGC 28225 CTTGTGCGAG Statistics Matches: 114, Mismatches: 13, Indels: 17 0.79 0.09 0.12 Matches are distributed among these distances: 36 19 0.17 37 18 0.16 38 23 0.20 39 24 0.21 40 30 0.26 ACGTcount: A:0.25, C:0.22, G:0.28, T:0.26 Consensus pattern (40 bp): ATCCGGGCTAAGACCCGAAGGCATTTATGCTAGTGACTAT Found at i:28244 original size:37 final size:39 Alignment explanation

Indices: 28051--28259 Score: 177 Period size: 37 Copynumber: 5.5 Consensus size: 39 28041 TTATTCGATG * * * * 28051 ATCCGGGCTAAG-TCCGAAGGCTTTTATGCTAGTGACTAT 1 ATCCGGGCTAAGACCCGAAGGCATTTGTGCGAGTGA-TAT * * 28090 AT-CGGGCT-AGA-TC-AAGGCATTTGTGCGAGTTGCTAT 1 ATCCGGGCTAAGACCCGAAGGCATTTGTGCGAG-TGATAT * * 28126 ATCCGGGCTAAGACCCGAAGGCATTTGTGCTAGCGATTAT 1 ATCCGGGCTAAGACCCGAAGGCATTTGTGCGAGTGA-TAT * * * * 28166 ATCCGGGCTAAG-TCCGAAGGCATTTATGCTAGTGACAT 1 ATCCGGGCTAAGACCCGAAGGCATTTGTGCGAGTGATAT * * * 28204 ATCC-GGCTAAGACCCGAAGGC-CTTGTGCGAGTGGTTT 1 ATCCGGGCTAAGACCCGAAGGCATTTGTGCGAGTGATAT 28241 ATCC-GGCTAA-ATCCCGAAG 1 ATCCGGGCTAAGA-CCCGAAG 28260 ATACTTGGGT Statistics Matches: 141, Mismatches: 20, Indels: 20 0.78 0.11 0.11 Matches are distributed among these distances: 36 19 0.13 37 45 0.32 38 23 0.16 39 24 0.17 40 30 0.21 ACGTcount: A:0.24, C:0.22, G:0.28, T:0.26 Consensus pattern (39 bp): ATCCGGGCTAAGACCCGAAGGCATTTGTGCGAGTGATAT Done.