Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: Scaffold3335
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 20434
ACGTcount: A:0.32, C:0.13, G:0.22, T:0.33
Found at i:4466 original size:47 final size:47
Alignment explanation
Indices: 4408--4894 Score: 843
Period size: 47 Copynumber: 10.4 Consensus size: 47
4398 CAGCCAAGAC
*
4408 AGTGTATATATGTGATAAGGCCTAATAGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
4455 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
4502 AGTG--TATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
4547 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
4594 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
*
4641 AGTGTATATATGTGATAAGGCCTAATAGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
*
4688 AGTGTATATATGTGATAAGGCCTAATAGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
*
4735 AGTGTATATATGTAATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
4782 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
* * * * * * *
4829 AGTGTATATATGTGACAGGGCCGAGTGGCCAACGTGATGGATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
* *
4876 AGTGCATAAATGTGATAAG
1 AGTGTATATATGTGATAAG
4895 TCCCGAAGGG
Statistics
Matches: 422, Mismatches: 16, Indels: 4
0.95 0.04 0.01
Matches are distributed among these distances:
45 45 0.11
47 377 0.89
ACGTcount: A:0.33, C:0.09, G:0.30, T:0.29
Consensus pattern (47 bp):
AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
Found at i:4492 original size:22 final size:22
Alignment explanation
Indices: 4464--4537 Score: 62
Period size: 22 Copynumber: 3.3 Consensus size: 22
4454 AAGTGTATAT
4464 ATGTGATAAGGCCTAATGGCCG
1 ATGTGATAAGGCCTAATGGCCG
* * ***
4486 ATGTGATGAATG--TGAAAGTGTAT
1 ATGTGAT-AAGGCCT-AATG-GCCG
4509 ATGTGATAAGGCCTAATGGCCG
1 ATGTGATAAGGCCTAATGGCCG
4531 ATGTGAT
1 ATGTGAT
4538 GAATGTGAAA
Statistics
Matches: 37, Mismatches: 10, Indels: 10
0.65 0.18 0.18
Matches are distributed among these distances:
21 1 0.03
22 21 0.57
23 14 0.38
24 1 0.03
ACGTcount: A:0.30, C:0.11, G:0.31, T:0.28
Consensus pattern (22 bp):
ATGTGATAAGGCCTAATGGCCG
Found at i:5069 original size:37 final size:37
Alignment explanation
Indices: 5013--5091 Score: 115
Period size: 37 Copynumber: 2.1 Consensus size: 37
5003 CCGAGCTCTA
* *
5013 AAGACCCGATGACTACGTGTGG-GAATTTTGTCCGGGT
1 AAGACCCGATAACTACGTGTGGAG-ATTATGTCCGGGT
*
5050 AAGACCCGATAACTTCGTGTGGAGATTATGTCCGGGT
1 AAGACCCGATAACTACGTGTGGAGATTATGTCCGGGT
5087 AAGAC
1 AAGAC
5092 TTCGTAATAA
Statistics
Matches: 38, Mismatches: 3, Indels: 2
0.88 0.07 0.05
Matches are distributed among these distances:
37 37 0.97
38 1 0.03
ACGTcount: A:0.25, C:0.19, G:0.30, T:0.25
Consensus pattern (37 bp):
AAGACCCGATAACTACGTGTGGAGATTATGTCCGGGT
Found at i:7004 original size:43 final size:43
Alignment explanation
Indices: 6956--7058 Score: 206
Period size: 43 Copynumber: 2.4 Consensus size: 43
6946 TTGGTTTTCA
6956 GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
1 GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
6999 GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
1 GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
7042 GCACTAAGTGTGCGGGC
1 GCACTAAGTGTGCGGGC
7059 TTGAAATGCA
Statistics
Matches: 60, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
43 60 1.00
ACGTcount: A:0.22, C:0.16, G:0.36, T:0.26
Consensus pattern (43 bp):
GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
Found at i:7075 original size:29 final size:29
Alignment explanation
Indices: 7040--7113 Score: 105
Period size: 29 Copynumber: 2.6 Consensus size: 29
7030 GTTGTGAGAT
* *
7040 TGGCACTAAGTGTGCGGGCTTGAAA-TGCA
1 TGGCACTAAGTGTGCGAG-TTGAAAGTACA
*
7069 TGGCACTAAGTGTGCGAGTTTAAAGTACA
1 TGGCACTAAGTGTGCGAGTTGAAAGTACA
7098 TGGCACTAAGTGTGCG
1 TGGCACTAAGTGTGCG
7114 TGGTTGATTA
Statistics
Matches: 41, Mismatches: 3, Indels: 2
0.89 0.07 0.04
Matches are distributed among these distances:
28 5 0.12
29 36 0.88
ACGTcount: A:0.26, C:0.16, G:0.32, T:0.26
Consensus pattern (29 bp):
TGGCACTAAGTGTGCGAGTTGAAAGTACA
Found at i:7613 original size:39 final size:39
Alignment explanation
Indices: 7426--7601 Score: 214
Period size: 39 Copynumber: 4.5 Consensus size: 39
7416 ATGATGTCCG
* *
7426 GGCTAAGTCCCGAAG-GC-TTTGTGCTAAGTGACCATATCC
1 GGCTAAGTCCCGAAGAGCATTCGTGCT-AGTGA-TATATCC
* *
7465 GGACTAAGTTCCGAAGAGCATTCGTGCTAGTGATGTATCC
1 GG-CTAAGTCCCGAAGAGCATTCGTGCTAGTGATATATCC
*
7505 GGCTAAGTTCCGAAGAGCATTCGTGCTAGTGATATATCC
1 GGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATATATCC
* * *
7544 GTGCTAA-ACCCGAAGAGCATTCGTGCTGGTGTTATATCC
1 G-GCTAAGTCCCGAAGAGCATTCGTGCTAGTGATATATCC
*
7583 GGCTAGGTCCCGAAGAGCA
1 GGCTAAGTCCCGAAGAGCA
7602 ATCATGCTGG
Statistics
Matches: 121, Mismatches: 11, Indels: 10
0.85 0.08 0.07
Matches are distributed among these distances:
38 4 0.03
39 79 0.65
40 24 0.20
41 7 0.06
42 7 0.06
ACGTcount: A:0.24, C:0.23, G:0.27, T:0.26
Consensus pattern (39 bp):
GGCTAAGTCCCGAAGAGCATTCGTGCTAGTGATATATCC
Found at i:7805 original size:25 final size:25
Alignment explanation
Indices: 7775--7825 Score: 68
Period size: 25 Copynumber: 2.0 Consensus size: 25
7765 TGTGTATAAC
7775 GAATGAATAAGA-GCACTATGTGTGT
1 GAATG-ATAAGAGGCACTATGTGTGT
* *
7800 GAATGATTAGAGGCACTGTGTGTGT
1 GAATGATAAGAGGCACTATGTGTGT
7825 G
1 G
7826 CGAATTCCTT
Statistics
Matches: 23, Mismatches: 2, Indels: 2
0.85 0.07 0.07
Matches are distributed among these distances:
24 5 0.22
25 18 0.78
ACGTcount: A:0.29, C:0.08, G:0.33, T:0.29
Consensus pattern (25 bp):
GAATGATAAGAGGCACTATGTGTGT
Found at i:11262 original size:47 final size:47
Alignment explanation
Indices: 11138--11628 Score: 865
Period size: 47 Copynumber: 10.4 Consensus size: 47
11128 CAGCCAAGAC
11138 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
11185 AGTGTATGTATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTA--TATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
11234 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
11281 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
11328 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
*
11375 AGTGTATATATGTGATAAGGCCTAATAGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
*
11422 AGTGTATATATGTGATAAGGCCTAATAGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
11469 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
11516 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
* * * * * * *
11563 AGTGTATATATGTGACAGGGCCGAGTGGCCAACGTGATGGATGTGAA
1 AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
* *
11610 AGTGCATAAATGTGATAAG
1 AGTGTATATATGTGATAAG
11629 TCCCGAAGGG
Statistics
Matches: 429, Mismatches: 13, Indels: 4
0.96 0.03 0.01
Matches are distributed among these distances:
47 382 0.89
49 47 0.11
ACGTcount: A:0.32, C:0.09, G:0.30, T:0.29
Consensus pattern (47 bp):
AGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAA
Found at i:11803 original size:37 final size:37
Alignment explanation
Indices: 11747--11825 Score: 115
Period size: 37 Copynumber: 2.1 Consensus size: 37
11737 CCGAGCTCTA
* *
11747 AAGACCCGATGACTACGTGTGG-GAATTTTGTCCGGGT
1 AAGACCCGATAACTACGTGTGGAG-ATTATGTCCGGGT
*
11784 AAGACCCGATAACTTCGTGTGGAGATTATGTCCGGGT
1 AAGACCCGATAACTACGTGTGGAGATTATGTCCGGGT
11821 AAGAC
1 AAGAC
11826 TTCGTAATAA
Statistics
Matches: 38, Mismatches: 3, Indels: 2
0.88 0.07 0.05
Matches are distributed among these distances:
37 37 0.97
38 1 0.03
ACGTcount: A:0.25, C:0.19, G:0.30, T:0.25
Consensus pattern (37 bp):
AAGACCCGATAACTACGTGTGGAGATTATGTCCGGGT
Found at i:13724 original size:43 final size:43
Alignment explanation
Indices: 13676--13778 Score: 206
Period size: 43 Copynumber: 2.4 Consensus size: 43
13666 TTGGTTTTCA
13676 GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
1 GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
13719 GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
1 GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
13762 GCACTAAGTGTGCGGGC
1 GCACTAAGTGTGCGGGC
13779 TTGAAATGCA
Statistics
Matches: 60, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
43 60 1.00
ACGTcount: A:0.22, C:0.16, G:0.36, T:0.26
Consensus pattern (43 bp):
GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
Found at i:13795 original size:29 final size:29
Alignment explanation
Indices: 13760--13833 Score: 105
Period size: 29 Copynumber: 2.6 Consensus size: 29
13750 GTTGTGAGAT
* *
13760 TGGCACTAAGTGTGCGGGCTTGAAA-TGCA
1 TGGCACTAAGTGTGCGAG-TTGAAAGTACA
*
13789 TGGCACTAAGTGTGCGAGTTTAAAGTACA
1 TGGCACTAAGTGTGCGAGTTGAAAGTACA
13818 TGGCACTAAGTGTGCG
1 TGGCACTAAGTGTGCG
13834 TGGTTGATTA
Statistics
Matches: 41, Mismatches: 3, Indels: 2
0.89 0.07 0.04
Matches are distributed among these distances:
28 5 0.12
29 36 0.88
ACGTcount: A:0.26, C:0.16, G:0.32, T:0.26
Consensus pattern (29 bp):
TGGCACTAAGTGTGCGAGTTGAAAGTACA
Found at i:14246 original size:40 final size:40
Alignment explanation
Indices: 14144--14270 Score: 181
Period size: 40 Copynumber: 3.2 Consensus size: 40
14134 TTGAATGATG
* *
14144 TCCGGGCTAAGTCCCGAAG-GC-TTTGTGCTAAGTGATATA
1 TCCGGGCTAAGTTCCGAAGAGCATTCGTGCT-AGTGATATA
*
14183 TCC-GGCTAAG-TCCGAAGAGCATTCGTGCTAGTGATGTA
1 TCCGGGCTAAGTTCCGAAGAGCATTCGTGCTAGTGATATA
14221 TCCGGGCTAAGTTCCGAAGAGCATTCGTGCTAGTGATATA
1 TCCGGGCTAAGTTCCGAAGAGCATTCGTGCTAGTGATATA
*
14261 TCCGTGCTAA
1 TCCGGGCTAA
14271 ACCCGAAGAG
Statistics
Matches: 79, Mismatches: 5, Indels: 7
0.87 0.05 0.08
Matches are distributed among these distances:
37 6 0.08
38 20 0.25
39 17 0.22
40 36 0.46
ACGTcount: A:0.24, C:0.21, G:0.28, T:0.28
Consensus pattern (40 bp):
TCCGGGCTAAGTTCCGAAGAGCATTCGTGCTAGTGATATA
Found at i:17976 original size:47 final size:47
Alignment explanation
Indices: 17900--18441 Score: 917
Period size: 47 Copynumber: 11.7 Consensus size: 47
17890 ATTGATAGGC
17900 TGTGATG-ATGTGAAA-TG-ATATATGTGATAAGGCCTAATGGCCGA
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
17944 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
17991 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
18038 TGTGATGAATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGA
1 TGTGATGAATGTGAAAGTG--TATATATGTGATAAGGCCTAATGGCCGA
18087 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
18134 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
18181 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
18228 TGTGATGAATGTGAAAGTGTATATA--T-AT---G--TAATGGCCGA
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
18267 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
18314 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
* * * * *
18361 TGTGATGAATGTGAAAGTGTATATATGTGACAGGGCCGAGTGGCCAA
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
* * *
18408 CGTGATGGATGTGAAAGTGTATAAATGTGATAAG
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAG
18442 TCCCGAAGGG
Statistics
Matches: 475, Mismatches: 10, Indels: 23
0.94 0.02 0.05
Matches are distributed among these distances:
39 35 0.07
41 2 0.00
42 2 0.00
44 9 0.02
45 10 0.02
46 2 0.00
47 368 0.77
49 47 0.10
ACGTcount: A:0.32, C:0.08, G:0.30, T:0.30
Consensus pattern (47 bp):
TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGA
Found at i:18379 original size:180 final size:184
Alignment explanation
Indices: 17900--18439 Score: 896
Period size: 180 Copynumber: 2.9 Consensus size: 184
17890 ATTGATAGGC
17900 TGTGATG-ATGTGAAA-TG-ATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGT
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGT
17962 GTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGC
66 GTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGC
18027 CTAATGGCCGATGTGATGAATGTGAAAGTGTATATATATGTGATAAGGCCTAATGGCCGA
131 CTAATGGCCGATGTGATGAATGTGAAAGTG--TATATA-GTGAT-A-G-CTAATGGCCGA
18087 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGT
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGT
18152 GTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGC
66 GTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGC
18217 CTAATGGCCGATGTGATGAATGTGAAAGTGTATATA-T-AT-G-TAATGGCCGA
131 CTAATGGCCGATGTGATGAATGTGAAAGTGTATATAGTGATAGCTAATGGCCGA
18267 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGT
1 TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGT
* *
18332 GTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGACAGGGC
66 GTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGC
* * * * * *
18397 CGAGTGGCCAACGTGATGGATGTGAAAGTGTATAAATGTGATA
131 CTAATGGCCGATGTGATGAATGTGAAAGTGTATATA-GTGATA
18440 AGTCCCGAAG
Statistics
Matches: 338, Mismatches: 8, Indels: 17
0.93 0.02 0.05
Matches are distributed among these distances:
180 168 0.50
182 2 0.01
183 2 0.01
185 2 0.01
186 1 0.00
187 7 0.02
188 14 0.04
189 2 0.01
190 140 0.41
ACGTcount: A:0.32, C:0.08, G:0.30, T:0.30
Consensus pattern (184 bp):
TGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGT
GTATATATGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGC
CTAATGGCCGATGTGATGAATGTGAAAGTGTATATAGTGATAGCTAATGGCCGA
Found at i:18615 original size:36 final size:37
Alignment explanation
Indices: 18560--18637 Score: 122
Period size: 36 Copynumber: 2.1 Consensus size: 37
18550 CCGAGCTCTA
* *
18560 AAGACCCGATGACTACGTGTGG-GATTTTGTCCGGGT
1 AAGACCCGATAACTACGTGTGGAGATTATGTCCGGGT
*
18596 AAGACCCGATAACTTCGTGTGGAGATTATGTCCGGGT
1 AAGACCCGATAACTACGTGTGGAGATTATGTCCGGGT
18633 AAGAC
1 AAGAC
18638 TTCGTAATAA
Statistics
Matches: 38, Mismatches: 3, Indels: 1
0.90 0.07 0.02
Matches are distributed among these distances:
36 20 0.53
37 18 0.47
ACGTcount: A:0.24, C:0.19, G:0.31, T:0.26
Consensus pattern (37 bp):
AAGACCCGATAACTACGTGTGGAGATTATGTCCGGGT
Done.