Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: Scaffold3369
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 34987
ACGTcount: A:0.32, C:0.17, G:0.20, T:0.31
Found at i:1523 original size:28 final size:26
Alignment explanation
Indices: 1466--1592 Score: 128
Period size: 28 Copynumber: 4.5 Consensus size: 26
1456 CATGAGATTG
* *
1466 GCACTAAGTGTGCGGGTTTAAATTGCATA
1 GCACTAAGTGTGCGAGTTT-GATT--ATA
*
1495 GCACTAATGTGTAGCAAGTTTGATTATA
1 GCACTAA-GTGT-GCGAGTTTGATTATA
*
1523 GCACTAAGTGTGCGAGTTTGATTTGTAA
1 GCACTAAGTGTGCGAGTTTGA-TTAT-A
1551 GCACTAAGTGTGCGAGTTTGATTATATA
1 GCACTAAGTGTGCGAGTTTGA-T-TATA
*
1579 ACACTAAGTGTGCG
1 GCACTAAGTGTGCG
1593 GACTTACTAT
Statistics
Matches: 86, Mismatches: 7, Indels: 11
0.83 0.07 0.11
Matches are distributed among these distances:
26 9 0.10
27 7 0.08
28 48 0.56
29 9 0.10
30 7 0.08
31 6 0.07
ACGTcount: A:0.28, C:0.13, G:0.26, T:0.33
Consensus pattern (26 bp):
GCACTAAGTGTGCGAGTTTGATTATA
Found at i:1585 original size:56 final size:57
Alignment explanation
Indices: 1467--1592 Score: 159
Period size: 56 Copynumber: 2.2 Consensus size: 57
1457 ATGAGATTGG
* *
1467 CACTAAGTGTGCGGGTTTAAATTGCATAGCACTAATGTGTAGCAAGTTTGATTATAG
1 CACTAAGTGTGCGAGTTTAAATTGCATAGCACTAATGTGTAGCAAGTTTGATTATAA
* * * *
1524 CACTAAGTGTGCGAGTTTGATTTGTA-AGCACTAA-GTGT-GCGAGTTTGATTATATAA
1 CACTAAGTGTGCGAGTTTAAATTGCATAGCACTAATGTGTAGCAAGTTTGA-T-TATAA
1580 CACTAAGTGTGCG
1 CACTAAGTGTGCG
1593 GACTTACTAT
Statistics
Matches: 61, Mismatches: 6, Indels: 5
0.85 0.08 0.07
Matches are distributed among these distances:
54 9 0.15
55 5 0.08
56 25 0.41
57 22 0.36
ACGTcount: A:0.29, C:0.13, G:0.25, T:0.33
Consensus pattern (57 bp):
CACTAAGTGTGCGAGTTTAAATTGCATAGCACTAATGTGTAGCAAGTTTGATTATAA
Found at i:9519 original size:28 final size:28
Alignment explanation
Indices: 9453--9580 Score: 166
Period size: 28 Copynumber: 4.5 Consensus size: 28
9443 CATGAGATTG
* * **
9453 GCACTAAGTGTGCGGGTTTAAATTGCATA
1 GCACTAAGTGTGCGAGTTT-GATTATATA
*
9482 GCACTAAGTGTGCAAGTTTGATTATATA
1 GCACTAAGTGTGCGAGTTTGATTATATA
*
9510 GCACTAAGTGTGCGAGTTTGATTATGTAA
1 GCACTAAGTGTGCGAGTTTGATTATAT-A
*
9539 GCACTAAGTGTGCGAGTTTAATTATATA
1 GCACTAAGTGTGCGAGTTTGATTATATA
*
9567 ACACTAAGTGTGCG
1 GCACTAAGTGTGCG
9581 GACTTACTAT
Statistics
Matches: 88, Mismatches: 10, Indels: 3
0.87 0.10 0.03
Matches are distributed among these distances:
28 45 0.51
29 43 0.49
ACGTcount: A:0.30, C:0.12, G:0.25, T:0.33
Consensus pattern (28 bp):
GCACTAAGTGTGCGAGTTTGATTATATA
Found at i:9542 original size:57 final size:57
Alignment explanation
Indices: 9453--9580 Score: 177
Period size: 57 Copynumber: 2.2 Consensus size: 57
9443 CATGAGATTG
* *
9453 GCACTAAGTGTGCGGGTTTAAATTGCATAGCACTAAGTGTGCAAGTTTGATTATATA
1 GCACTAAGTGTGCGAGTTTAAATTGCATAGCACTAAGTGTGCAAGTTTAATTATATA
* * * *
9510 GCACTAAGTGTGCGAGTTTGATTATGTA-AGCACTAAGTGTGCGAGTTTAATTATATA
1 GCACTAAGTGTGCGAGTTTAAAT-TGCATAGCACTAAGTGTGCAAGTTTAATTATATA
*
9567 ACACTAAGTGTGCG
1 GCACTAAGTGTGCG
9581 GACTTACTAT
Statistics
Matches: 63, Mismatches: 7, Indels: 2
0.88 0.10 0.03
Matches are distributed among these distances:
57 60 0.95
58 3 0.05
ACGTcount: A:0.30, C:0.12, G:0.25, T:0.33
Consensus pattern (57 bp):
GCACTAAGTGTGCGAGTTTAAATTGCATAGCACTAAGTGTGCAAGTTTAATTATATA
Found at i:14296 original size:90 final size:90
Alignment explanation
Indices: 14143--14322 Score: 326
Period size: 90 Copynumber: 2.0 Consensus size: 90
14133 TAGGGACAAT
14143 TTGATTGAGATTGAATGATGATTGTATGTATTGATTAAATGTATGGGAAAAGTATGTTTAAATGT
1 TTGATTGAGATTGAATGATGATTGTATGTATTGATTAAATGTATGGGAAAAGTATGTTTAAATGT
*
14208 GTTGTAAGT-TCGGTAATGCTCCGTA
66 GTTGTAAGTCT-GATAATGCTCCGTA
*
14233 TTGATTGAGATTGAATGATTATTGTATGTATTGATTAAATGTATGGGAAAAGTATGTTTAAATGT
1 TTGATTGAGATTGAATGATGATTGTATGTATTGATTAAATGTATGGGAAAAGTATGTTTAAATGT
14298 GTTGTAAGTCTGATAATGCTCCGTA
66 GTTGTAAGTCTGATAATGCTCCGTA
14323 ACCCTATTTT
Statistics
Matches: 87, Mismatches: 2, Indels: 2
0.96 0.02 0.02
Matches are distributed among these distances:
90 86 0.99
91 1 0.01
ACGTcount: A:0.31, C:0.04, G:0.24, T:0.41
Consensus pattern (90 bp):
TTGATTGAGATTGAATGATGATTGTATGTATTGATTAAATGTATGGGAAAAGTATGTTTAAATGT
GTTGTAAGTCTGATAATGCTCCGTA
Found at i:18664 original size:50 final size:49
Alignment explanation
Indices: 18542--18724 Score: 206
Period size: 50 Copynumber: 3.7 Consensus size: 49
18532 TATGTAGCTA
* * * * *
18542 GGTCGCATGTATAGTATTAAGTGCAGGCTACTATGCGTACTC-GATAACTT
1 GGTCACATGTGTAGTACTAAGTGCAGGCTACTACGTGTAC-CAGATAA-TT
* * * *
18592 CGATCACATGTGTAGTACTAAGTGTAGGCTACTACGTGTATCAGATAGTT
1 -GGTCACATGTGTAGTACTAAGTGCAGGCTACTACGTGTACCAGATAATT
* * *
18642 AGGTCACGTGTGTAGTACTAAGTGCAAGCTACTACGTGTACCGGATAATT
1 -GGTCACATGTGTAGTACTAAGTGCAGGCTACTACGTGTACCAGATAATT
*
18692 GGTCGCATGTGTAGTACTAAGTGCAGGCTACTA
1 GGTCACATGTGTAGTACTAAGTGCAGGCTACTA
18725 TGCATACTAG
Statistics
Matches: 111, Mismatches: 20, Indels: 4
0.82 0.15 0.03
Matches are distributed among these distances:
49 30 0.27
50 45 0.41
51 36 0.32
ACGTcount: A:0.27, C:0.17, G:0.26, T:0.30
Consensus pattern (49 bp):
GGTCACATGTGTAGTACTAAGTGCAGGCTACTACGTGTACCAGATAATT
Found at i:18737 original size:99 final size:100
Alignment explanation
Indices: 18553--18740 Score: 240
Period size: 99 Copynumber: 1.9 Consensus size: 100
18543 GTCGCATGTA
* * * *
18553 TAGTATTAAGTGCAGGCTACTATGCGTACTCGATAACTTCGATCACATGTGTAGTACTAAGTGTA
1 TAGTACTAAGTGCAAGCTACTACGCGTACTCGATAACTTCGATCACATGTGTAGTACTAAGTGCA
*
18618 GGCTACTACGTGTATCAGATAGTTAGGTCACGTGTG
66 GGCTACTAC-TGCATCAGATAGTTAGGTCACGTGTG
* * *
18654 TAGTACTAAGTGCAAGCTACTACGTGTAC-CGGATAA-TT-GGTCGCATGTGTAGTACTAAGTGC
1 TAGTACTAAGTGCAAGCTACTACGCGTACTC-GATAACTTCGATCACATGTGTAGTACTAAGTGC
18716 AGGCTACTA-TGCATACTAGATAGTT
65 AGGCTACTACTGCAT-C-AGATAGTT
18741 TGGCTACATA
Statistics
Matches: 76, Mismatches: 8, Indels: 8
0.83 0.09 0.09
Matches are distributed among these distances:
97 4 0.05
98 1 0.01
99 38 0.50
100 3 0.04
101 30 0.39
ACGTcount: A:0.28, C:0.17, G:0.24, T:0.31
Consensus pattern (100 bp):
TAGTACTAAGTGCAAGCTACTACGCGTACTCGATAACTTCGATCACATGTGTAGTACTAAGTGCA
GGCTACTACTGCATCAGATAGTTAGGTCACGTGTG
Found at i:19095 original size:36 final size:36
Alignment explanation
Indices: 19048--19120 Score: 137
Period size: 36 Copynumber: 2.0 Consensus size: 36
19038 AGAAAGTGTG
*
19048 AAAGAGTGAATTAGCAATAAAACTTTTTTGGACAGT
1 AAAGAGTGAATTAGCAATAAAACTGTTTTGGACAGT
19084 AAAGAGTGAATTAGCAATAAAACTGTTTTGGACAGT
1 AAAGAGTGAATTAGCAATAAAACTGTTTTGGACAGT
19120 A
1 A
19121 CCAGTGACTT
Statistics
Matches: 36, Mismatches: 1, Indels: 0
0.97 0.03 0.00
Matches are distributed among these distances:
36 36 1.00
ACGTcount: A:0.42, C:0.08, G:0.21, T:0.29
Consensus pattern (36 bp):
AAAGAGTGAATTAGCAATAAAACTGTTTTGGACAGT
Found at i:22253 original size:78 final size:81
Alignment explanation
Indices: 22137--22318 Score: 239
Period size: 79 Copynumber: 2.3 Consensus size: 81
22127 TACTCGTTCA
* *
22137 AATGCCTTCGGGACATAGCCCGG-TTATAGTAACTCGCACAAATGCCTTCGGA-CTTAACCCGGA
1 AATGCCTTCGGGACTTAGCCCGGAATATAGTAACTCGCACAAATGCCTTCGGATCTTAACCCGGA
* * *
22200 TTTAGTGAC-TCGCACC
66 TATAGTCACTTAGCA-C
* **
22216 AATGCCTTTGGG-CTTAGCCCGGAAT-TAGTAACTCGCACAAATGCCTTCGGATCTTAGTCCGGA
1 AATGCCTTCGGGACTTAGCCCGGAATATAGTAACTCGCACAAATGCCTTCGGATCTTAACCCGGA
22279 TATAGTCACTTAGCAC
66 TATAGTCACTTAGCAC
*
22295 AAAGCCTTCGGGACTTAGCCCGGA
1 AATGCCTTCGGGACTTAGCCCGGA
22319 CATCATTCGA
Statistics
Matches: 89, Mismatches: 10, Indels: 7
0.84 0.09 0.07
Matches are distributed among these distances:
78 35 0.39
79 39 0.44
80 15 0.17
ACGTcount: A:0.25, C:0.27, G:0.23, T:0.25
Consensus pattern (81 bp):
AATGCCTTCGGGACTTAGCCCGGAATATAGTAACTCGCACAAATGCCTTCGGATCTTAACCCGGA
TATAGTCACTTAGCAC
Found at i:22318 original size:40 final size:40
Alignment explanation
Indices: 22116--22318 Score: 220
Period size: 39 Copynumber: 5.1 Consensus size: 40
22106 CGGAATTTAA
** *
22116 CCGGATATAGCT-ACTCGTTCAAATGCCTTCGGGACATAGC
1 CCGGATATAG-TAACTCGCACAAATGCCTTCGGGACTTAGC
* *
22156 CCGGTTATAGTAACTCGCACAAATGCCTTC-GGACTTAAC
1 CCGGATATAGTAACTCGCACAAATGCCTTCGGGACTTAGC
* * * *
22195 CCGGATTTAGTGACTCGCACCAATGCCTTTGGG-CTTAGC
1 CCGGATATAGTAACTCGCACAAATGCCTTCGGGACTTAGC
*
22234 CCGGA-ATTAGTAACTCGCACAAATGCCTTC-GGATCTTAGT
1 CCGGATA-TAGTAACTCGCACAAATGCCTTCGGGA-CTTAGC
* *
22274 CCGGATATAGTCACTTAGCACAAA-GCCTTCGGGACTTAGC
1 CCGGATATAGTAAC-TCGCACAAATGCCTTCGGGACTTAGC
22314 CCGGA
1 CCGGA
22319 CATCATTCGA
Statistics
Matches: 136, Mismatches: 19, Indels: 16
0.80 0.11 0.09
Matches are distributed among these distances:
38 2 0.01
39 63 0.46
40 59 0.43
41 12 0.09
ACGTcount: A:0.25, C:0.28, G:0.22, T:0.25
Consensus pattern (40 bp):
CCGGATATAGTAACTCGCACAAATGCCTTCGGGACTTAGC
Found at i:34538 original size:45 final size:48
Alignment explanation
Indices: 34455--34802 Score: 304
Period size: 47 Copynumber: 7.1 Consensus size: 48
34445 ATAAATATAT
*
34455 ATATATGTGTGATATGTAATGTGGTGGTAAAGCCGAATGGCTAATGTGAA
1 ATATATGTGTGATATGT-ATAT-GTGGTAAAGCCGAATGGCTAATGTGAA
*
34505 A-ATATGTGT-ATATGTATATGT-GTAAAGCCGAATGGCAAATTGTG-A
1 ATATATGTGTGATATGTATATGTGGTAAAGCCGAATGGCTAA-TGTGAA
*
34550 A-ATATGTGTGATATGTATATATGGTAAAGCC-AATGGCTAATGTGAA
1 ATATATGTGTGATATGTATATGTGGTAAAGCCGAATGGCTAATGTGAA
* * *
34596 ATATATATGAGATATGTATTATGTGGTAAAGCCGAAT--CTAATATGAA
1 ATATATGTGTGATATGTA-TATGTGGTAAAGCCGAATGGCTAATGTGAA
* * * * *
34643 ATATATGTGTTGATATGTAGTACGTCGTAAAACCGCTAAAGGCGAATGTGAA
1 ATATATGTG-TGATATGTA-TATGTGGTAAAGCCG--AATGGCTAATGTGAA
* * * *
34695 ATAGTA--TGAGATATGTATATGTGGGAAAATCCAAATCGAGCATCAATCGTGACA
1 ATA-TATGTGTGATATGTATATGT-GGTAAAGCCGAAT-G-GC-T-AAT-GTGA-A
*
34749 ACATATAGTTGTGATATGTATATGTGCGTAAAGCCGAATGGC-AATGTGAA
1 ATATAT-G-TGTGATATGTATATGTG-GTAAAGCCGAATGGCTAATGTGAA
34799 ATAT
1 ATAT
34803 GTATGAGAAT
Statistics
Matches: 242, Mismatches: 31, Indels: 50
0.75 0.10 0.15
Matches are distributed among these distances:
45 31 0.13
46 27 0.11
47 42 0.17
48 41 0.17
49 16 0.07
50 23 0.10
51 6 0.02
52 17 0.07
53 8 0.03
54 3 0.01
55 2 0.01
56 2 0.01
57 24 0.10
ACGTcount: A:0.36, C:0.09, G:0.24, T:0.31
Consensus pattern (48 bp):
ATATATGTGTGATATGTATATGTGGTAAAGCCGAATGGCTAATGTGAA
Found at i:34610 original size:47 final size:48
Alignment explanation
Indices: 34455--34817 Score: 269
Period size: 48 Copynumber: 7.4 Consensus size: 48
34445 ATAAATATAT
* * *
34455 ATATATGTGTGATATGTAATGTGGTGGTAAAGCCGAATGGCTAATGTGAA
1 ATATATATGAGATATGT-ATAT-GTGGTAAAGCCGAATGGCTAATGTGAA
* * *
34505 A-ATATGTG-TATATGTATATGT-GTAAAGCCGAATGGCAAATTGTG-A
1 ATATATATGAGATATGTATATGTGGTAAAGCCGAATGGCTAA-TGTGAA
* * *
34550 A-ATATGTGTGATATGTATATATGGTAAAGCC-AATGGCTAATGTGAA
1 ATATATATGAGATATGTATATGTGGTAAAGCCGAATGGCTAATGTGAA
*
34596 ATATATATGAGATATGTATTATGTGGTAAAGCCGAAT--CTAATATGAA
1 ATATATATGAGATATGTA-TATGTGGTAAAGCCGAATGGCTAATGTGAA
* * * * * * *
34643 ATATATGTGTTGATATGTAGTACGTCGTAAAACCGCTAAAGGCGAATGTGAA
1 ATATATATG-AGATATGTA-TATGTGGTAAAGCCG--AATGGCTAATGTGAA
* * * *
34695 ATA-GTATGAGATATGTATATGTGGGAAAATCCAAATCGAGCATCAATCGTGACA
1 ATATATATGAGATATGTATATGT-GGTAAAGCCGAAT-G-GC-T-AAT-GTGA-A
* *
34749 ACATATAGTTGTGATATGTATATGTGCGTAAAGCCGAATGGC-AATGTGAA
1 ATATATA--TGAGATATGTATATGTG-GTAAAGCCGAATGGCTAATGTGAA
*
34799 ATATGTATGAGAATATGTA
1 ATATATATGAG-ATATGTA
34818 AGTGTAAGCA
Statistics
Matches: 251, Mismatches: 38, Indels: 49
0.74 0.11 0.14
Matches are distributed among these distances:
45 30 0.12
46 27 0.11
47 42 0.17
48 44 0.18
49 22 0.09
50 25 0.10
51 7 0.03
52 17 0.07
53 4 0.02
54 3 0.01
55 4 0.02
56 2 0.01
57 24 0.10
ACGTcount: A:0.36, C:0.08, G:0.24, T:0.31
Consensus pattern (48 bp):
ATATATATGAGATATGTATATGTGGTAAAGCCGAATGGCTAATGTGAA
Done.