Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: Scaffold1222

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 11265
ACGTcount: A:0.33, C:0.13, G:0.23, T:0.31


Found at i:2384 original size:47 final size:47

Alignment explanation

Indices: 2332--2677 Score: 500 Period size: 47 Copynumber: 7.3 Consensus size: 47 2322 TGTACAAGTA * * * 2332 TATATATGTGATAGGGCCGAGTGGCCAATGTGATGAATGTGAA-AGTA 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACA-TG 2379 TATATATGCGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG 1 TATATAT--GTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG * * 2428 TGTATGTGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG * * 2475 TGTATGTGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG * * 2522 TGTATGTGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG * * 2569 CATATATGAGATAAGGCCGAATGGCCAATGTGATGAATGTGAA-AGTG 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACA-TG * * 2616 TATATATGTGATAAGGCCGAATGGCCAATGTGATGGATGTGGAA-GTG 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGT-GAACATG * 2663 TATAAATGTGATAAG 1 TATATATGTGATAAG 2678 TCCCGAAGGG Statistics Matches: 280, Mismatches: 14, Indels: 10 0.92 0.05 0.03 Matches are distributed among these distances: 46 1 0.00 47 235 0.84 48 3 0.01 49 40 0.14 50 1 0.00 ACGTcount: A:0.32, C:0.10, G:0.31, T:0.27 Consensus pattern (47 bp): TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG Found at i:2555 original size:22 final size:22 Alignment explanation

Indices: 2528--2649 Score: 61 Period size: 22 Copynumber: 5.3 Consensus size: 22 2518 CATGTGTATG 2528 TGTGATAAGGCCGAATGGCCAA 1 TGTGATAAGGCCGAATGGCCAA * * * 2550 TGTGATGAATG-TGAACAT-GCATATA 1 TGTGAT-AAGGCCG-A-ATGGC-CA-A * 2575 TGAGATAAGGCCGAATGGCCAA 1 TGTGATAAGGCCGAATGGCCAA * * *** 2597 TGTGATGAATG-TGAAAGTGTATATA 1 TGTGAT-AAGGCCG-AA-TGGCCA-A 2622 TGTGATAAGGCCGAATGGCCAA 1 TGTGATAAGGCCGAATGGCCAA 2644 TGTGAT 1 TGTGAT 2650 GGATGTGGAA Statistics Matches: 70, Mismatches: 18, Indels: 24 0.62 0.16 0.21 Matches are distributed among these distances: 22 21 0.30 23 17 0.24 24 17 0.24 25 15 0.21 ACGTcount: A:0.34, C:0.11, G:0.30, T:0.25 Consensus pattern (22 bp): TGTGATAAGGCCGAATGGCCAA Found at i:5170 original size:38 final size:38 Alignment explanation

Indices: 5106--5180 Score: 107 Period size: 38 Copynumber: 2.0 Consensus size: 38 5096 AATCCGAGTT * 5106 TAAAGACCCGCTGACTATATGAAGAGATTATGTCCGGG 1 TAAAGACCCGATGACTATATGAAGAGATTATGTCCGGG * * 5144 TAAAGACCCGATGGCTATGT-ACAGAGATTATGTCCGG 1 TAAAGACCCGATGACTATATGA-AGAGATTATGTCCGG 5181 ATTAAAATTC Statistics Matches: 33, Mismatches: 3, Indels: 2 0.87 0.08 0.05 Matches are distributed among these distances: 37 1 0.03 38 32 0.97 ACGTcount: A:0.31, C:0.19, G:0.27, T:0.24 Consensus pattern (38 bp): TAAAGACCCGATGACTATATGAAGAGATTATGTCCGGG Found at i:5293 original size:40 final size:40 Alignment explanation

Indices: 5234--5592 Score: 544 Period size: 40 Copynumber: 9.1 Consensus size: 40 5224 AGGTCTCGAC 5234 GATG-ATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGT * 5273 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGT * 5313 GATGTATCCGGGCTAAGT-CCGAAGAGCATTCATGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGT * * 5352 GATGTACCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGT 5392 GATGTATCCGGGCTAAGT-CCGAAGAGCATTCGTGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGT * 5431 GATGTATCCGGGCTAAGTCTCGAAGAGCATTCGTGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGT * * 5471 GATGTATCCGGACTAAGTTCCGAAGAGCATTCGTGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGT * * ** * 5511 GATATATCCGTGCTAAACCCCGAAGAGCATTCGTGCTGGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGT * * * * * 5551 GTTATATCCGGGCTAGGTCCCGAAGAGCAATCATGCTAGT 1 GATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGT 5591 GA 1 GA 5593 CGTGTATTCG Statistics Matches: 293, Mismatches: 24, Indels: 5 0.91 0.07 0.02 Matches are distributed among these distances: 39 80 0.27 40 213 0.73 ACGTcount: A:0.25, C:0.22, G:0.28, T:0.25 Consensus pattern (40 bp): GATGTATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGT Found at i:5370 original size:79 final size:79 Alignment explanation

Indices: 5234--5592 Score: 540 Period size: 79 Copynumber: 4.5 Consensus size: 79 5224 AGGTCTCGAC 5234 GATG-ATCCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAG 1 GATGTATCCGGGCTAAGT-CCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAG 5298 AGCATTCATGCTAGT 65 AGCATTCATGCTAGT * * 5313 GATGTATCCGGGCTAAGTCCGAAGAGCATTCATGCTAGTGATGTACCCGGGCTAAGTCCCGAAGA 1 GATGTATCCGGGCTAAGTCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGA 5378 GCATTCATGCTAGT 66 GCATTCATGCTAGT * 5392 GATGTATCCGGGCTAAGTCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCTCGAAGA 1 GATGTATCCGGGCTAAGTCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGA * 5457 GCATTCGTGCTAGT 66 GCATTCATGCTAGT * * * ** 5471 GATGTATCCGGACTAAGTTCCGAAGAGCATTCGTGCTAGTGATATATCCGTGCTAAACCCCGAAG 1 GATGTATCCGGGCTAAG-TCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAG * * 5536 AGCATTCGTGCTGGT 65 AGCATTCATGCTAGT * * * * * 5551 GTTATATCCGGGCTAGGTCCCGAAGAGCAATCATGCTAGTGA 1 GATGTATCCGGGCTAAGT-CCGAAGAGCATTCGTGCTAGTGA 5593 CGTGTATTCG Statistics Matches: 258, Mismatches: 19, Indels: 5 0.91 0.07 0.02 Matches are distributed among these distances: 79 155 0.60 80 103 0.40 ACGTcount: A:0.25, C:0.22, G:0.28, T:0.25 Consensus pattern (79 bp): GATGTATCCGGGCTAAGTCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGA GCATTCATGCTAGT Found at i:5455 original size:119 final size:118 Alignment explanation

Indices: 5240--5592 Score: 535 Period size: 119 Copynumber: 3.0 Consensus size: 118 5230 CGACGATGAT 5240 CCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCCGAAGAGCATTC 1 CCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGT-CCGAAGAGCATTC * 5305 ATGCTAGTGATGTATCCGGGCTAAGTCCGAAGAGCATTCATGCTAGTGATGTAC 65 GTGCTAGTGATGTATCCGGGCTAAGTCCGAAGAGCATTCATGCTAGTGATGTAC * 5359 CCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGTATCCGGGCTAAGTCCGAAGAGCATTCG 1 CCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCGAAGAGCATTCG * * 5424 TGCTAGTGATGTATCCGGGCTAAGTCTCGAAGAGCATTCGTGCTAGTGATGTAT 66 TGCTAGTGATGTATCCGGGCTAAGTC-CGAAGAGCATTCATGCTAGTGATGTAC * * * * ** 5478 CCGGACTAAGTTCCGAAGAGCATTCGTGCTAGTGATATATCCGTGCTAAACCCCGAAGAGCATTC 1 CCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCT-AAGTCCGAAGAGCATTC * * * * * 5543 GTGCTGGTGTTATATCCGGGCTAGGTCCCGAAGAGCAATCATGCTAGTGA 65 GTGCTAGTGATGTATCCGGGCTAAGT-CCGAAGAGCATTCATGCTAGTGA 5593 CGTGTATTCG Statistics Matches: 214, Mismatches: 17, Indels: 5 0.91 0.07 0.02 Matches are distributed among these distances: 118 39 0.18 119 117 0.55 120 57 0.27 121 1 0.00 ACGTcount: A:0.24, C:0.22, G:0.28, T:0.25 Consensus pattern (118 bp): CCGGGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATGTATCCGGGCTAAGTCCGAAGAGCATTCG TGCTAGTGATGTATCCGGGCTAAGTCCGAAGAGCATTCATGCTAGTGATGTAC Found at i:8981 original size:47 final size:47 Alignment explanation

Indices: 8929--9327 Score: 579 Period size: 47 Copynumber: 8.4 Consensus size: 47 8919 TGTACAAGTA * * * 8929 TATATATGTGATAGGGCCGAGTGGCCAATGTGATGAATGTGAA-AGTA 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACA-TG 8976 TATATATGCGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG 1 TATATAT--GTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG * * 9025 TGTATGTGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG * * 9072 TGTATGTGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG * * 9119 TGTATGTGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG * * 9166 TGTATGTGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG * * 9213 CATATATGAGATAAGGCCGAATGGCCAATGTGATGAATGTGAA-AGTG 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACA-TG * * 9260 TATATATGTGATAAGGCCGAATGGCCAATGTGATGGATGTGGAA-GTG 1 TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGT-GAACATG * * 9307 TATAAATGTGATAAGTCCGAA 1 TATATATGTGATAAGGCCGAA 9328 GGGCAATTGT Statistics Matches: 332, Mismatches: 15, Indels: 10 0.93 0.04 0.03 Matches are distributed among these distances: 46 1 0.00 47 287 0.86 48 3 0.01 49 40 0.12 50 1 0.00 ACGTcount: A:0.32, C:0.10, G:0.31, T:0.27 Consensus pattern (47 bp): TATATATGTGATAAGGCCGAATGGCCAATGTGATGAATGTGAACATG Found at i:9199 original size:22 final size:22 Alignment explanation

Indices: 9172--9293 Score: 61 Period size: 22 Copynumber: 5.3 Consensus size: 22 9162 CATGTGTATG 9172 TGTGATAAGGCCGAATGGCCAA 1 TGTGATAAGGCCGAATGGCCAA * * * 9194 TGTGATGAATG-TGAACAT-GCATATA 1 TGTGAT-AAGGCCG-A-ATGGC-CA-A * 9219 TGAGATAAGGCCGAATGGCCAA 1 TGTGATAAGGCCGAATGGCCAA * * *** 9241 TGTGATGAATG-TGAAAGTGTATATA 1 TGTGAT-AAGGCCG-AA-TGGCCA-A 9266 TGTGATAAGGCCGAATGGCCAA 1 TGTGATAAGGCCGAATGGCCAA 9288 TGTGAT 1 TGTGAT 9294 GGATGTGGAA Statistics Matches: 70, Mismatches: 18, Indels: 24 0.62 0.16 0.21 Matches are distributed among these distances: 22 21 0.30 23 17 0.24 24 17 0.24 25 15 0.21 ACGTcount: A:0.34, C:0.11, G:0.30, T:0.25 Consensus pattern (22 bp): TGTGATAAGGCCGAATGGCCAA Done.