Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: Scaffold3369

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 34987
ACGTcount: A:0.32, C:0.17, G:0.20, T:0.31


Found at i:1523 original size:28 final size:26

Alignment explanation

Indices: 1466--1592 Score: 128 Period size: 28 Copynumber: 4.5 Consensus size: 26 1456 CATGAGATTG * * 1466 GCACTAAGTGTGCGGGTTTAAATTGCATA 1 GCACTAAGTGTGCGAGTTT-GATT--ATA * 1495 GCACTAATGTGTAGCAAGTTTGATTATA 1 GCACTAA-GTGT-GCGAGTTTGATTATA * 1523 GCACTAAGTGTGCGAGTTTGATTTGTAA 1 GCACTAAGTGTGCGAGTTTGA-TTAT-A 1551 GCACTAAGTGTGCGAGTTTGATTATATA 1 GCACTAAGTGTGCGAGTTTGA-T-TATA * 1579 ACACTAAGTGTGCG 1 GCACTAAGTGTGCG 1593 GACTTACTAT Statistics Matches: 86, Mismatches: 7, Indels: 11 0.83 0.07 0.11 Matches are distributed among these distances: 26 9 0.10 27 7 0.08 28 48 0.56 29 9 0.10 30 7 0.08 31 6 0.07 ACGTcount: A:0.28, C:0.13, G:0.26, T:0.33 Consensus pattern (26 bp): GCACTAAGTGTGCGAGTTTGATTATA Found at i:1585 original size:56 final size:57 Alignment explanation

Indices: 1467--1592 Score: 159 Period size: 56 Copynumber: 2.2 Consensus size: 57 1457 ATGAGATTGG * * 1467 CACTAAGTGTGCGGGTTTAAATTGCATAGCACTAATGTGTAGCAAGTTTGATTATAG 1 CACTAAGTGTGCGAGTTTAAATTGCATAGCACTAATGTGTAGCAAGTTTGATTATAA * * * * 1524 CACTAAGTGTGCGAGTTTGATTTGTA-AGCACTAA-GTGT-GCGAGTTTGATTATATAA 1 CACTAAGTGTGCGAGTTTAAATTGCATAGCACTAATGTGTAGCAAGTTTGA-T-TATAA 1580 CACTAAGTGTGCG 1 CACTAAGTGTGCG 1593 GACTTACTAT Statistics Matches: 61, Mismatches: 6, Indels: 5 0.85 0.08 0.07 Matches are distributed among these distances: 54 9 0.15 55 5 0.08 56 25 0.41 57 22 0.36 ACGTcount: A:0.29, C:0.13, G:0.25, T:0.33 Consensus pattern (57 bp): CACTAAGTGTGCGAGTTTAAATTGCATAGCACTAATGTGTAGCAAGTTTGATTATAA Found at i:9519 original size:28 final size:28 Alignment explanation

Indices: 9453--9580 Score: 166 Period size: 28 Copynumber: 4.5 Consensus size: 28 9443 CATGAGATTG * * ** 9453 GCACTAAGTGTGCGGGTTTAAATTGCATA 1 GCACTAAGTGTGCGAGTTT-GATTATATA * 9482 GCACTAAGTGTGCAAGTTTGATTATATA 1 GCACTAAGTGTGCGAGTTTGATTATATA * 9510 GCACTAAGTGTGCGAGTTTGATTATGTAA 1 GCACTAAGTGTGCGAGTTTGATTATAT-A * 9539 GCACTAAGTGTGCGAGTTTAATTATATA 1 GCACTAAGTGTGCGAGTTTGATTATATA * 9567 ACACTAAGTGTGCG 1 GCACTAAGTGTGCG 9581 GACTTACTAT Statistics Matches: 88, Mismatches: 10, Indels: 3 0.87 0.10 0.03 Matches are distributed among these distances: 28 45 0.51 29 43 0.49 ACGTcount: A:0.30, C:0.12, G:0.25, T:0.33 Consensus pattern (28 bp): GCACTAAGTGTGCGAGTTTGATTATATA Found at i:9542 original size:57 final size:57 Alignment explanation

Indices: 9453--9580 Score: 177 Period size: 57 Copynumber: 2.2 Consensus size: 57 9443 CATGAGATTG * * 9453 GCACTAAGTGTGCGGGTTTAAATTGCATAGCACTAAGTGTGCAAGTTTGATTATATA 1 GCACTAAGTGTGCGAGTTTAAATTGCATAGCACTAAGTGTGCAAGTTTAATTATATA * * * * 9510 GCACTAAGTGTGCGAGTTTGATTATGTA-AGCACTAAGTGTGCGAGTTTAATTATATA 1 GCACTAAGTGTGCGAGTTTAAAT-TGCATAGCACTAAGTGTGCAAGTTTAATTATATA * 9567 ACACTAAGTGTGCG 1 GCACTAAGTGTGCG 9581 GACTTACTAT Statistics Matches: 63, Mismatches: 7, Indels: 2 0.88 0.10 0.03 Matches are distributed among these distances: 57 60 0.95 58 3 0.05 ACGTcount: A:0.30, C:0.12, G:0.25, T:0.33 Consensus pattern (57 bp): GCACTAAGTGTGCGAGTTTAAATTGCATAGCACTAAGTGTGCAAGTTTAATTATATA Found at i:14296 original size:90 final size:90 Alignment explanation

Indices: 14143--14322 Score: 326 Period size: 90 Copynumber: 2.0 Consensus size: 90 14133 TAGGGACAAT 14143 TTGATTGAGATTGAATGATGATTGTATGTATTGATTAAATGTATGGGAAAAGTATGTTTAAATGT 1 TTGATTGAGATTGAATGATGATTGTATGTATTGATTAAATGTATGGGAAAAGTATGTTTAAATGT * 14208 GTTGTAAGT-TCGGTAATGCTCCGTA 66 GTTGTAAGTCT-GATAATGCTCCGTA * 14233 TTGATTGAGATTGAATGATTATTGTATGTATTGATTAAATGTATGGGAAAAGTATGTTTAAATGT 1 TTGATTGAGATTGAATGATGATTGTATGTATTGATTAAATGTATGGGAAAAGTATGTTTAAATGT 14298 GTTGTAAGTCTGATAATGCTCCGTA 66 GTTGTAAGTCTGATAATGCTCCGTA 14323 ACCCTATTTT Statistics Matches: 87, Mismatches: 2, Indels: 2 0.96 0.02 0.02 Matches are distributed among these distances: 90 86 0.99 91 1 0.01 ACGTcount: A:0.31, C:0.04, G:0.24, T:0.41 Consensus pattern (90 bp): TTGATTGAGATTGAATGATGATTGTATGTATTGATTAAATGTATGGGAAAAGTATGTTTAAATGT GTTGTAAGTCTGATAATGCTCCGTA Found at i:18664 original size:50 final size:49 Alignment explanation

Indices: 18542--18724 Score: 206 Period size: 50 Copynumber: 3.7 Consensus size: 49 18532 TATGTAGCTA * * * * * 18542 GGTCGCATGTATAGTATTAAGTGCAGGCTACTATGCGTACTC-GATAACTT 1 GGTCACATGTGTAGTACTAAGTGCAGGCTACTACGTGTAC-CAGATAA-TT * * * * 18592 CGATCACATGTGTAGTACTAAGTGTAGGCTACTACGTGTATCAGATAGTT 1 -GGTCACATGTGTAGTACTAAGTGCAGGCTACTACGTGTACCAGATAATT * * * 18642 AGGTCACGTGTGTAGTACTAAGTGCAAGCTACTACGTGTACCGGATAATT 1 -GGTCACATGTGTAGTACTAAGTGCAGGCTACTACGTGTACCAGATAATT * 18692 GGTCGCATGTGTAGTACTAAGTGCAGGCTACTA 1 GGTCACATGTGTAGTACTAAGTGCAGGCTACTA 18725 TGCATACTAG Statistics Matches: 111, Mismatches: 20, Indels: 4 0.82 0.15 0.03 Matches are distributed among these distances: 49 30 0.27 50 45 0.41 51 36 0.32 ACGTcount: A:0.27, C:0.17, G:0.26, T:0.30 Consensus pattern (49 bp): GGTCACATGTGTAGTACTAAGTGCAGGCTACTACGTGTACCAGATAATT Found at i:18737 original size:99 final size:100 Alignment explanation

Indices: 18553--18740 Score: 240 Period size: 99 Copynumber: 1.9 Consensus size: 100 18543 GTCGCATGTA * * * * 18553 TAGTATTAAGTGCAGGCTACTATGCGTACTCGATAACTTCGATCACATGTGTAGTACTAAGTGTA 1 TAGTACTAAGTGCAAGCTACTACGCGTACTCGATAACTTCGATCACATGTGTAGTACTAAGTGCA * 18618 GGCTACTACGTGTATCAGATAGTTAGGTCACGTGTG 66 GGCTACTAC-TGCATCAGATAGTTAGGTCACGTGTG * * * 18654 TAGTACTAAGTGCAAGCTACTACGTGTAC-CGGATAA-TT-GGTCGCATGTGTAGTACTAAGTGC 1 TAGTACTAAGTGCAAGCTACTACGCGTACTC-GATAACTTCGATCACATGTGTAGTACTAAGTGC 18716 AGGCTACTA-TGCATACTAGATAGTT 65 AGGCTACTACTGCAT-C-AGATAGTT 18741 TGGCTACATA Statistics Matches: 76, Mismatches: 8, Indels: 8 0.83 0.09 0.09 Matches are distributed among these distances: 97 4 0.05 98 1 0.01 99 38 0.50 100 3 0.04 101 30 0.39 ACGTcount: A:0.28, C:0.17, G:0.24, T:0.31 Consensus pattern (100 bp): TAGTACTAAGTGCAAGCTACTACGCGTACTCGATAACTTCGATCACATGTGTAGTACTAAGTGCA GGCTACTACTGCATCAGATAGTTAGGTCACGTGTG Found at i:19095 original size:36 final size:36 Alignment explanation

Indices: 19048--19120 Score: 137 Period size: 36 Copynumber: 2.0 Consensus size: 36 19038 AGAAAGTGTG * 19048 AAAGAGTGAATTAGCAATAAAACTTTTTTGGACAGT 1 AAAGAGTGAATTAGCAATAAAACTGTTTTGGACAGT 19084 AAAGAGTGAATTAGCAATAAAACTGTTTTGGACAGT 1 AAAGAGTGAATTAGCAATAAAACTGTTTTGGACAGT 19120 A 1 A 19121 CCAGTGACTT Statistics Matches: 36, Mismatches: 1, Indels: 0 0.97 0.03 0.00 Matches are distributed among these distances: 36 36 1.00 ACGTcount: A:0.42, C:0.08, G:0.21, T:0.29 Consensus pattern (36 bp): AAAGAGTGAATTAGCAATAAAACTGTTTTGGACAGT Found at i:22253 original size:78 final size:81 Alignment explanation

Indices: 22137--22318 Score: 239 Period size: 79 Copynumber: 2.3 Consensus size: 81 22127 TACTCGTTCA * * 22137 AATGCCTTCGGGACATAGCCCGG-TTATAGTAACTCGCACAAATGCCTTCGGA-CTTAACCCGGA 1 AATGCCTTCGGGACTTAGCCCGGAATATAGTAACTCGCACAAATGCCTTCGGATCTTAACCCGGA * * * 22200 TTTAGTGAC-TCGCACC 66 TATAGTCACTTAGCA-C * ** 22216 AATGCCTTTGGG-CTTAGCCCGGAAT-TAGTAACTCGCACAAATGCCTTCGGATCTTAGTCCGGA 1 AATGCCTTCGGGACTTAGCCCGGAATATAGTAACTCGCACAAATGCCTTCGGATCTTAACCCGGA 22279 TATAGTCACTTAGCAC 66 TATAGTCACTTAGCAC * 22295 AAAGCCTTCGGGACTTAGCCCGGA 1 AATGCCTTCGGGACTTAGCCCGGA 22319 CATCATTCGA Statistics Matches: 89, Mismatches: 10, Indels: 7 0.84 0.09 0.07 Matches are distributed among these distances: 78 35 0.39 79 39 0.44 80 15 0.17 ACGTcount: A:0.25, C:0.27, G:0.23, T:0.25 Consensus pattern (81 bp): AATGCCTTCGGGACTTAGCCCGGAATATAGTAACTCGCACAAATGCCTTCGGATCTTAACCCGGA TATAGTCACTTAGCAC Found at i:22318 original size:40 final size:40 Alignment explanation

Indices: 22116--22318 Score: 220 Period size: 39 Copynumber: 5.1 Consensus size: 40 22106 CGGAATTTAA ** * 22116 CCGGATATAGCT-ACTCGTTCAAATGCCTTCGGGACATAGC 1 CCGGATATAG-TAACTCGCACAAATGCCTTCGGGACTTAGC * * 22156 CCGGTTATAGTAACTCGCACAAATGCCTTC-GGACTTAAC 1 CCGGATATAGTAACTCGCACAAATGCCTTCGGGACTTAGC * * * * 22195 CCGGATTTAGTGACTCGCACCAATGCCTTTGGG-CTTAGC 1 CCGGATATAGTAACTCGCACAAATGCCTTCGGGACTTAGC * 22234 CCGGA-ATTAGTAACTCGCACAAATGCCTTC-GGATCTTAGT 1 CCGGATA-TAGTAACTCGCACAAATGCCTTCGGGA-CTTAGC * * 22274 CCGGATATAGTCACTTAGCACAAA-GCCTTCGGGACTTAGC 1 CCGGATATAGTAAC-TCGCACAAATGCCTTCGGGACTTAGC 22314 CCGGA 1 CCGGA 22319 CATCATTCGA Statistics Matches: 136, Mismatches: 19, Indels: 16 0.80 0.11 0.09 Matches are distributed among these distances: 38 2 0.01 39 63 0.46 40 59 0.43 41 12 0.09 ACGTcount: A:0.25, C:0.28, G:0.22, T:0.25 Consensus pattern (40 bp): CCGGATATAGTAACTCGCACAAATGCCTTCGGGACTTAGC Found at i:34538 original size:45 final size:48 Alignment explanation

Indices: 34455--34802 Score: 304 Period size: 47 Copynumber: 7.1 Consensus size: 48 34445 ATAAATATAT * 34455 ATATATGTGTGATATGTAATGTGGTGGTAAAGCCGAATGGCTAATGTGAA 1 ATATATGTGTGATATGT-ATAT-GTGGTAAAGCCGAATGGCTAATGTGAA * 34505 A-ATATGTGT-ATATGTATATGT-GTAAAGCCGAATGGCAAATTGTG-A 1 ATATATGTGTGATATGTATATGTGGTAAAGCCGAATGGCTAA-TGTGAA * 34550 A-ATATGTGTGATATGTATATATGGTAAAGCC-AATGGCTAATGTGAA 1 ATATATGTGTGATATGTATATGTGGTAAAGCCGAATGGCTAATGTGAA * * * 34596 ATATATATGAGATATGTATTATGTGGTAAAGCCGAAT--CTAATATGAA 1 ATATATGTGTGATATGTA-TATGTGGTAAAGCCGAATGGCTAATGTGAA * * * * * 34643 ATATATGTGTTGATATGTAGTACGTCGTAAAACCGCTAAAGGCGAATGTGAA 1 ATATATGTG-TGATATGTA-TATGTGGTAAAGCCG--AATGGCTAATGTGAA * * * * 34695 ATAGTA--TGAGATATGTATATGTGGGAAAATCCAAATCGAGCATCAATCGTGACA 1 ATA-TATGTGTGATATGTATATGT-GGTAAAGCCGAAT-G-GC-T-AAT-GTGA-A * 34749 ACATATAGTTGTGATATGTATATGTGCGTAAAGCCGAATGGC-AATGTGAA 1 ATATAT-G-TGTGATATGTATATGTG-GTAAAGCCGAATGGCTAATGTGAA 34799 ATAT 1 ATAT 34803 GTATGAGAAT Statistics Matches: 242, Mismatches: 31, Indels: 50 0.75 0.10 0.15 Matches are distributed among these distances: 45 31 0.13 46 27 0.11 47 42 0.17 48 41 0.17 49 16 0.07 50 23 0.10 51 6 0.02 52 17 0.07 53 8 0.03 54 3 0.01 55 2 0.01 56 2 0.01 57 24 0.10 ACGTcount: A:0.36, C:0.09, G:0.24, T:0.31 Consensus pattern (48 bp): ATATATGTGTGATATGTATATGTGGTAAAGCCGAATGGCTAATGTGAA Found at i:34610 original size:47 final size:48 Alignment explanation

Indices: 34455--34817 Score: 269 Period size: 48 Copynumber: 7.4 Consensus size: 48 34445 ATAAATATAT * * * 34455 ATATATGTGTGATATGTAATGTGGTGGTAAAGCCGAATGGCTAATGTGAA 1 ATATATATGAGATATGT-ATAT-GTGGTAAAGCCGAATGGCTAATGTGAA * * * 34505 A-ATATGTG-TATATGTATATGT-GTAAAGCCGAATGGCAAATTGTG-A 1 ATATATATGAGATATGTATATGTGGTAAAGCCGAATGGCTAA-TGTGAA * * * 34550 A-ATATGTGTGATATGTATATATGGTAAAGCC-AATGGCTAATGTGAA 1 ATATATATGAGATATGTATATGTGGTAAAGCCGAATGGCTAATGTGAA * 34596 ATATATATGAGATATGTATTATGTGGTAAAGCCGAAT--CTAATATGAA 1 ATATATATGAGATATGTA-TATGTGGTAAAGCCGAATGGCTAATGTGAA * * * * * * * 34643 ATATATGTGTTGATATGTAGTACGTCGTAAAACCGCTAAAGGCGAATGTGAA 1 ATATATATG-AGATATGTA-TATGTGGTAAAGCCG--AATGGCTAATGTGAA * * * * 34695 ATA-GTATGAGATATGTATATGTGGGAAAATCCAAATCGAGCATCAATCGTGACA 1 ATATATATGAGATATGTATATGT-GGTAAAGCCGAAT-G-GC-T-AAT-GTGA-A * * 34749 ACATATAGTTGTGATATGTATATGTGCGTAAAGCCGAATGGC-AATGTGAA 1 ATATATA--TGAGATATGTATATGTG-GTAAAGCCGAATGGCTAATGTGAA * 34799 ATATGTATGAGAATATGTA 1 ATATATATGAG-ATATGTA 34818 AGTGTAAGCA Statistics Matches: 251, Mismatches: 38, Indels: 49 0.74 0.11 0.14 Matches are distributed among these distances: 45 30 0.12 46 27 0.11 47 42 0.17 48 44 0.18 49 22 0.09 50 25 0.10 51 7 0.03 52 17 0.07 53 4 0.02 54 3 0.01 55 4 0.02 56 2 0.01 57 24 0.10 ACGTcount: A:0.36, C:0.08, G:0.24, T:0.31 Consensus pattern (48 bp): ATATATATGAGATATGTATATGTGGTAAAGCCGAATGGCTAATGTGAA Done.