Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: Scaffold1137

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 22552
ACGTcount: A:0.30, C:0.16, G:0.21, T:0.33


Found at i:8285 original size:27 final size:27

Alignment explanation

Indices: 8238--8289 Score: 70 Period size: 27 Copynumber: 1.9 Consensus size: 27 8228 CATCTGATAT * 8238 TGATTTTGTATTAGGCTTAGGCCCACC 1 TGATTTTGTAATAGGCTTAGGCCCACC * 8265 TGATTTTGTTAATGGGC-TAGGCCCA 1 TGATTTTG-TAATAGGCTTAGGCCCA 8290 ACTGTTACTG Statistics Matches: 22, Mismatches: 2, Indels: 2 0.85 0.08 0.08 Matches are distributed among these distances: 27 16 0.73 28 6 0.27 ACGTcount: A:0.19, C:0.19, G:0.25, T:0.37 Consensus pattern (27 bp): TGATTTTGTAATAGGCTTAGGCCCACC Found at i:11143 original size:24 final size:24 Alignment explanation

Indices: 11116--11422 Score: 200 Period size: 24 Copynumber: 12.8 Consensus size: 24 11106 AATTTGAACA * 11116 GCACTATGTGTACGGATTTGTATG 1 GCACTATGTGTGCGGATTTGTATG * * 11140 GCACTATGTGTGTGGATTTGAATG 1 GCACTATGTGTGCGGATTTGTATG * * * ** * ** * 11164 TCAATATGTATATGAATTACTAAG 1 GCACTATGTGTGCGGATTTGTATG * 11188 GCACTATGTGTGCGAATTTGTATG 1 GCACTATGTGTGCGGATTTGTATG * * 11212 GCACTATATGTGCGGATTTATATG 1 GCACTATGTGTGCGGATTTGTATG * * * * 11236 GCAATATGTGTACGAATTTGAATG 1 GCACTATGTGTGCGGATTTGTATG * * * * * * ** * 11260 TCAATGTGTATGTGAATTACTAAG 1 GCACTATGTGTGCGGATTTGTATG * 11284 GCACTATGTGTGCGAATTTGTATG 1 GCACTATGTGTGCGGATTTGTATG * * 11308 GCACTATATGTGCGGATTTATATG 1 GCACTATGTGTGCGGATTTGTATG * 11332 GCACTATGTGTGCGGATTTGAATG 1 GCACTATGTGTGCGGATTTGTATG * * * * * ** * 11356 TCAATATGTATGTGAATTACTAAG 1 GCACTATGTGTGCGGATTTGTATG * *** 11380 GCACTATGTGTGCGGGTTAACATG 1 GCACTATGTGTGCGGATTTGTATG * * 11404 GCACTATGGGTGCGAATTT 1 GCACTATGTGTGCGGATTT 11423 CCTTGCTTGA Statistics Matches: 209, Mismatches: 74, Indels: 0 0.74 0.26 0.00 Matches are distributed among these distances: 24 209 1.00 ACGTcount: A:0.26, C:0.11, G:0.26, T:0.36 Consensus pattern (24 bp): GCACTATGTGTGCGGATTTGTATG Found at i:11394 original size:48 final size:48 Alignment explanation

Indices: 11139--11393 Score: 275 Period size: 48 Copynumber: 5.3 Consensus size: 48 11129 GGATTTGTAT * * * 11139 GGCACTATGTGTGTGGATTTGAATGTCAATATGTATATGAATTACTAA 1 GGCACTATGTGTGCGAATTTGAATGTCAATATGTATGTGAATTACTAA * * ** * * 11187 GGCACTATGTGTGCGAATTTGTATGGCACTATATGTGCG-GATTTA-TAT 1 GGCACTATGTGTGCGAATTTGAATGTCA--ATATGTATGTGAATTACTAA * * * 11235 GGCAATATGTGTACGAATTTGAATGTCAATGTGTATGTGAATTACTAA 1 GGCACTATGTGTGCGAATTTGAATGTCAATATGTATGTGAATTACTAA * * ** * * 11283 GGCACTATGTGTGCGAATTTGTATGGCACTATATGTGCG-GATTTA-TAT 1 GGCACTATGTGTGCGAATTTGAATGTCA--ATATGTATGTGAATTACTAA * 11331 GGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAATTACTAA 1 GGCACTATGTGTGCGAATTTGAATGTCAATATGTATGTGAATTACTAA 11379 GGCACTATGTGTGCG 1 GGCACTATGTGTGCG 11394 GGTTAACATG Statistics Matches: 165, Mismatches: 34, Indels: 16 0.77 0.16 0.07 Matches are distributed among these distances: 46 13 0.08 47 10 0.06 48 120 0.73 49 10 0.06 50 12 0.07 ACGTcount: A:0.27, C:0.11, G:0.26, T:0.36 Consensus pattern (48 bp): GGCACTATGTGTGCGAATTTGAATGTCAATATGTATGTGAATTACTAA Found at i:11417 original size:96 final size:96 Alignment explanation

Indices: 11116--11393 Score: 475 Period size: 96 Copynumber: 2.9 Consensus size: 96 11106 AATTTGAACA * * * * * 11116 GCACTATGTGTACGGATTTGTATGGCACTATGTGTGTGGATTTGAATGTCAATATGTATATGAAT 1 GCACTATATGTGCGGATTTATATGGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAAT 11181 TACTAAGGCACTATGTGTGCGAATTTGTATG 66 TACTAAGGCACTATGTGTGCGAATTTGTATG * * * * 11212 GCACTATATGTGCGGATTTATATGGCAATATGTGTACGAATTTGAATGTCAATGTGTATGTGAAT 1 GCACTATATGTGCGGATTTATATGGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAAT 11277 TACTAAGGCACTATGTGTGCGAATTTGTATG 66 TACTAAGGCACTATGTGTGCGAATTTGTATG 11308 GCACTATATGTGCGGATTTATATGGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAAT 1 GCACTATATGTGCGGATTTATATGGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAAT 11373 TACTAAGGCACTATGTGTGCG 66 TACTAAGGCACTATGTGTGCG 11394 GGTTAACATG Statistics Matches: 169, Mismatches: 13, Indels: 0 0.93 0.07 0.00 Matches are distributed among these distances: 96 169 1.00 ACGTcount: A:0.27, C:0.11, G:0.26, T:0.36 Consensus pattern (96 bp): GCACTATATGTGCGGATTTATATGGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAAT TACTAAGGCACTATGTGTGCGAATTTGTATG Found at i:18579 original size:16 final size:16 Alignment explanation

Indices: 18560--18591 Score: 55 Period size: 16 Copynumber: 2.0 Consensus size: 16 18550 ATGTCCAAAA 18560 ATATATATGTGTTTAT 1 ATATATATGTGTTTAT * 18576 ATATATGTGTGTTTAT 1 ATATATATGTGTTTAT 18592 TTGAAGTAAT Statistics Matches: 15, Mismatches: 1, Indels: 0 0.94 0.06 0.00 Matches are distributed among these distances: 16 15 1.00 ACGTcount: A:0.28, C:0.00, G:0.16, T:0.56 Consensus pattern (16 bp): ATATATATGTGTTTAT Found at i:19045 original size:24 final size:24 Alignment explanation

Indices: 19018--19350 Score: 236 Period size: 24 Copynumber: 13.9 Consensus size: 24 19008 GAAATGACTT * 19018 TGGCACTATGTGTGCTAATTTGAA 1 TGGCACTATGTGTGCGAATTTGAA * * * 19042 TGGCACTATGTGTACTAATTTGTA 1 TGGCACTATGTGTGCGAATTTGAA * 19066 TGGCACTATGTGTGCGGATTTGAA 1 TGGCACTATGTGTGCGAATTTGAA * * * * 19090 TGTCAATATGTATGTGAATTACT-AA 1 TGGCACTATGTGTGCGAATT--TGAA * 19115 -GGCACTATGTGTGCGAATTTGTA 1 TGGCACTATGTGTGCGAATTTGAA * 19138 TGGCACTATATGTGC-AGATTT-ATA 1 TGGCACTATGTGTGCGA-ATTTGA-A * 19162 TGGCACTATGTGTGCGGATTTGAA 1 TGGCACTATGTGTGCGAATTTGAA * * * * 19186 TGTCAATATGTATGTGAATTACT-AA 1 TGGCACTATGTGTGCGAATT--TGAA * * 19211 -GGCACTATGTGTGCGGATTTGTA 1 TGGCACTATGTGTGCGAATTTGAA * * 19234 TGGCACTATATGTGCGGATTT-ATA 1 TGGCACTATGTGTGCGAATTTGA-A * 19258 TGGCACTATGTGTGCGGATTTGAA 1 TGGCACTATGTGTGCGAATTTGAA * * * * 19282 TGTCAATATGTATGTGAATTACT-AA 1 TGGCACTATGTGTGCGAATT--TGAA * ** * 19307 -GGTACTATGTGTGCG-GGTTAACA 1 TGGCACTATGTGTGCGAATTTGA-A * 19330 TGGCACTATGGGTGCGAATTT 1 TGGCACTATGTGTGCGAATTT 19351 CCTTGCTTGA Statistics Matches: 239, Mismatches: 50, Indels: 39 0.73 0.15 0.12 Matches are distributed among these distances: 21 1 0.00 22 3 0.01 23 5 0.02 24 217 0.91 25 10 0.04 26 3 0.01 ACGTcount: A:0.26, C:0.12, G:0.26, T:0.36 Consensus pattern (24 bp): TGGCACTATGTGTGCGAATTTGAA Found at i:19074 original size:48 final size:47 Alignment explanation

Indices: 19018--19292 Score: 263 Period size: 48 Copynumber: 5.7 Consensus size: 47 19008 GAAATGACTT ** * * 19018 TGGCACTATGTGTGCTAATTTGAATGGCACTATGTGTACTAATTTGTA 1 TGGCACTATGTGTGCGGATTTGAATGGCAATATGTGT-CTAATTTATA * * * 19066 TGGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAA-TTACTA 1 TGGCACTATGTGTGCGGATTTGAATGGCAATATGTGTCT-AATTTA-TA * * * 19114 AGGCACTATGTGTGCGAATTTGTATGGCACTATATGTG-C-AGATTTATA 1 TGGCACTATGTGTGCGGATTTGAATGGCA--ATATGTGTCTA-ATTTATA * * * 19162 TGGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAA-TTACTA 1 TGGCACTATGTGTGCGGATTTGAATGGCAATATGTGTCT-AATTTA-TA * * ** 19210 AGGCACTATGTGTGCGGATTTGTATGGCACTATATGTG-CGGATTTATA 1 TGGCACTATGTGTGCGGATTTGAATGGCA--ATATGTGTCTAATTTATA * 19258 TGGCACTATGTGTGCGGATTTGAATGTCAATATGT 1 TGGCACTATGTGTGCGGATTTGAATGGCAATATGT 19293 ATGTGAATTA Statistics Matches: 185, Mismatches: 29, Indels: 28 0.76 0.12 0.12 Matches are distributed among these distances: 46 12 0.06 47 7 0.04 48 147 0.79 49 7 0.04 50 12 0.06 ACGTcount: A:0.25, C:0.12, G:0.26, T:0.37 Consensus pattern (47 bp): TGGCACTATGTGTGCGGATTTGAATGGCAATATGTGTCTAATTTATA Found at i:19314 original size:48 final size:48 Alignment explanation

Indices: 19067--19322 Score: 324 Period size: 48 Copynumber: 5.3 Consensus size: 48 19057 TAATTTGTAT 19067 GGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAATTACTAA 1 GGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAATTACTAA * * * * * 19115 GGCACTATGTGTGCGAATTTGTATGGCACTA--TATGTGCAGATTTA-TAT 1 GGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTG-A-A-TTACTAA 19163 GGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAATTACTAA 1 GGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAATTACTAA * * ** * * 19211 GGCACTATGTGTGCGGATTTGTATGGCACTATATGTGCG-GATTTA-TAT 1 GGCACTATGTGTGCGGATTTGAATGTCA--ATATGTATGTGAATTACTAA 19259 GGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAATTACTAA 1 GGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAATTACTAA * 19307 GGTACTATGTGTGCGG 1 GGCACTATGTGTGCGG 19323 GTTAACATGG Statistics Matches: 175, Mismatches: 23, Indels: 20 0.80 0.11 0.09 Matches are distributed among these distances: 46 13 0.07 47 9 0.05 48 131 0.75 49 9 0.05 50 13 0.07 ACGTcount: A:0.26, C:0.11, G:0.27, T:0.36 Consensus pattern (48 bp): GGCACTATGTGTGCGGATTTGAATGTCAATATGTATGTGAATTACTAA Found at i:19322 original size:96 final size:96 Alignment explanation

Indices: 19019--19321 Score: 518 Period size: 96 Copynumber: 3.2 Consensus size: 96 19009 AAATGACTTT * * * * * 19019 GGCACTATGTGTGCTAATTTGAATGGCACTATGTGTACTA-ATTTGTATGGCACTATGTGTGCGG 1 GGCACTATGTGTGCGAATTTGTATGGCACTATATGTGC-AGATTTATATGGCACTATGTGTGCGG 19083 ATTTGAATGTCAATATGTATGTGAATTACTAA 65 ATTTGAATGTCAATATGTATGTGAATTACTAA 19115 GGCACTATGTGTGCGAATTTGTATGGCACTATATGTGCAGATTTATATGGCACTATGTGTGCGGA 1 GGCACTATGTGTGCGAATTTGTATGGCACTATATGTGCAGATTTATATGGCACTATGTGTGCGGA 19180 TTTGAATGTCAATATGTATGTGAATTACTAA 66 TTTGAATGTCAATATGTATGTGAATTACTAA * * 19211 GGCACTATGTGTGCGGATTTGTATGGCACTATATGTGCGGATTTATATGGCACTATGTGTGCGGA 1 GGCACTATGTGTGCGAATTTGTATGGCACTATATGTGCAGATTTATATGGCACTATGTGTGCGGA 19276 TTTGAATGTCAATATGTATGTGAATTACTAA 66 TTTGAATGTCAATATGTATGTGAATTACTAA * 19307 GGTACTATGTGTGCG 1 GGCACTATGTGTGCG 19322 GGTTAACATG Statistics Matches: 198, Mismatches: 8, Indels: 2 0.95 0.04 0.01 Matches are distributed among these distances: 95 1 0.01 96 197 0.99 ACGTcount: A:0.26, C:0.12, G:0.26, T:0.37 Consensus pattern (96 bp): GGCACTATGTGTGCGAATTTGTATGGCACTATATGTGCAGATTTATATGGCACTATGTGTGCGGA TTTGAATGTCAATATGTATGTGAATTACTAA Done.