Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: Scaffold2954
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 15995
ACGTcount: A:0.32, C:0.14, G:0.22, T:0.32
Found at i:3605 original size:47 final size:47
Alignment explanation
Indices: 3478--3857 Score: 620
Period size: 47 Copynumber: 8.1 Consensus size: 47
3468 GAAATGATAG
3478 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
*
3525 TAAGGCCTAAT-GCCGATGTGATGAATGTGAAAGTGTATATGTGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
*
3571 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATGTGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
3618 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
3665 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA--TGTGA
*
3714 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATATGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
3761 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
** * * * * * * *
3808 -CGGGCCGAGTGGCCAACGTGATGGATGTGAAAGTGCATAAATGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
3854 TAAG
1 TAAG
3858 TCCCGAAGGG
Statistics
Matches: 314, Mismatches: 15, Indels: 8
0.93 0.04 0.02
Matches are distributed among these distances:
46 82 0.26
47 185 0.59
49 47 0.15
ACGTcount: A:0.31, C:0.09, G:0.31, T:0.29
Consensus pattern (47 bp):
TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
Found at i:3731 original size:96 final size:94
Alignment explanation
Indices: 3478--3857 Score: 620
Period size: 93 Copynumber: 4.0 Consensus size: 94
3468 GAAATGATAG
3478 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAAT-GCCGAT
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
*
3542 GTGATGAATGTGAAAGTGTATATGTGTGA
66 GTGATGAATGTGAAAGTGTATATATGTGA
*
3571 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATGTGTGATAAGGCCTAATGGCCGAT
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
3636 GTGATGAATGTGAAAGTGTATATATGTGA
66 GTGATGAATGTGAAAGTGTATATATGTGA
3665 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGTGATAAGGCCTAATGGCCG
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATA--TGTGATAAGGCCTAATGGCCG
*
3730 ATGTGATGAATGTGAAAGTGTATATATATGA
64 ATGTGATGAATGTGAAAGTGTATATATGTGA
** * * * *
3761 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA-CGGGCCGAGTGGCCAAC
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
* * *
3825 GTGATGGATGTGAAAGTGCATAAATGTGA
66 GTGATGAATGTGAAAGTGTATATATGTGA
3854 TAAG
1 TAAG
3858 TCCCGAAGGG
Statistics
Matches: 270, Mismatches: 14, Indels: 6
0.93 0.05 0.02
Matches are distributed among these distances:
93 97 0.36
94 80 0.30
96 93 0.34
ACGTcount: A:0.31, C:0.09, G:0.31, T:0.29
Consensus pattern (94 bp):
TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
GTGATGAATGTGAAAGTGTATATATGTGA
Found at i:3764 original size:143 final size:142
Alignment explanation
Indices: 3478--3852 Score: 621
Period size: 143 Copynumber: 2.6 Consensus size: 142
3468 GAAATGATAG
3478 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAAT-GCCGAT
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
3542 GTGATGAATGTGAAAGTG-TATATGTGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGT
66 GTGATGAATGTGAAAGTGATATATGTGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGT
* *
3606 GTATATGTGTGA
131 GTATATATATGA
3618 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
3683 GTGATGAATGTGAAAGTGTATATATGTGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAG
66 GTGATGAATGTGAAAGTG-ATATATGTGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAG
3748 TGTATATATATGA
130 TGTATATATATGA
** * * * *
3761 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA-CGGGCCGAGTGGCCAAC
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
* *
3825 GTGATGGATGTGAAAGTGCATAAATGTG
66 GTGATGAATGTGAAAGTG-ATATATGTG
3853 ATAAGTCCCG
Statistics
Matches: 221, Mismatches: 11, Indels: 4
0.94 0.05 0.02
Matches are distributed among these distances:
140 58 0.26
141 24 0.11
142 36 0.16
143 103 0.47
ACGTcount: A:0.31, C:0.09, G:0.31, T:0.29
Consensus pattern (142 bp):
TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
GTGATGAATGTGAAAGTGATATATGTGTGATAAGGCCTAATGGCCGATGTGATGAATGTGAAAGT
GTATATATATGA
Found at i:4026 original size:34 final size:37
Alignment explanation
Indices: 3978--4048 Score: 103
Period size: 34 Copynumber: 2.0 Consensus size: 37
3968 GAGCTCTAGA
*
3978 CCGATGACTACGTGTGG-GATT-TGTCC-GGTAAGAC
1 CCGATAACTACGTGTGGAGATTATGTCCGGGTAAGAC
*
4012 CCGATAACTTCGTGTGGAGATTATGTCCGGGTAAGAC
1 CCGATAACTACGTGTGGAGATTATGTCCGGGTAAGAC
4049 TTCGTAATAA
Statistics
Matches: 32, Mismatches: 2, Indels: 3
0.86 0.05 0.08
Matches are distributed among these distances:
34 15 0.47
35 4 0.12
36 5 0.16
37 8 0.25
ACGTcount: A:0.23, C:0.20, G:0.31, T:0.27
Consensus pattern (37 bp):
CCGATAACTACGTGTGGAGATTATGTCCGGGTAAGAC
Found at i:5982 original size:42 final size:43
Alignment explanation
Indices: 5935--6036 Score: 197
Period size: 43 Copynumber: 2.4 Consensus size: 43
5925 GGTGTTTCTA
5935 GCACTAAGTGTGCGGGCAATAAGTGTTCA-GGTTGTGAGATTG
1 GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
5977 GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
1 GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
6020 GCACTAAGTGTGCGGGC
1 GCACTAAGTGTGCGGGC
6037 TTGAAATGCA
Statistics
Matches: 59, Mismatches: 0, Indels: 1
0.98 0.00 0.02
Matches are distributed among these distances:
42 29 0.49
43 30 0.51
ACGTcount: A:0.23, C:0.15, G:0.36, T:0.26
Consensus pattern (43 bp):
GCACTAAGTGTGCGGGCAATAAGTGTTCACGGTTGTGAGATTG
Found at i:6053 original size:29 final size:29
Alignment explanation
Indices: 6018--6091 Score: 105
Period size: 29 Copynumber: 2.6 Consensus size: 29
6008 GTTGTGAGAT
* *
6018 TGGCACTAAGTGTGCGGGCTTGAAA-TGCA
1 TGGCACTAAGTGTGCGAG-TTGAAAGTACA
*
6047 TGGCACTAAGTGTGCGAGTTTAAAGTACA
1 TGGCACTAAGTGTGCGAGTTGAAAGTACA
6076 TGGCACTAAGTGTGCG
1 TGGCACTAAGTGTGCG
6092 TGGTTGATTA
Statistics
Matches: 41, Mismatches: 3, Indels: 2
0.89 0.07 0.04
Matches are distributed among these distances:
28 5 0.12
29 36 0.88
ACGTcount: A:0.26, C:0.16, G:0.32, T:0.26
Consensus pattern (29 bp):
TGGCACTAAGTGTGCGAGTTGAAAGTACA
Found at i:6534 original size:80 final size:79
Alignment explanation
Indices: 6393--6592 Score: 210
Period size: 80 Copynumber: 2.5 Consensus size: 79
6383 GTTATTCGAA
* **
6393 TGATGTCCGGGCTAAGTCCCGAAG-GC-TTTGTGCTAAGTGACCATATCCGGACTAAGATCCGAA
1 TGATATCCGGGCTAAGTCCCGAAGAGCATTCATGCT-AGTGACCATATCCGGACTAAGATCCGAA
*
6456 G-GCATTGGTGCGAG
65 GAGCATTCGTGCGAG
* ** * *
6470 TTACTAAATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGA-TGTATCCGGGCTAAGTTCCG
1 TGA-T--ATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGACCATATCCGGACTAAGATCCG
*
6534 AAGAGCATTCGTGCTAG
63 AAGAGCATTCGTGCGAG
* * * *
6551 TGATATCCGTGCTAAATCCCGAAGAGCAATCATGCTGGTGAC
1 TGATATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGAC
6593 GTGTATTCGG
Statistics
Matches: 101, Mismatches: 15, Indels: 12
0.79 0.12 0.09
Matches are distributed among these distances:
77 2 0.02
78 34 0.34
80 39 0.39
81 20 0.20
82 6 0.06
ACGTcount: A:0.26, C:0.23, G:0.28, T:0.24
Consensus pattern (79 bp):
TGATATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGACCATATCCGGACTAAGATCCGAAG
AGCATTCGTGCGAG
Found at i:6573 original size:38 final size:39
Alignment explanation
Indices: 6477--6591 Score: 160
Period size: 40 Copynumber: 2.9 Consensus size: 39
6467 GAGTTACTAA
6477 ATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGATGT
1 ATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGA-GT
* *
6517 ATCCGGGCTAAGTTCCGAAGAGCATTCGTGCTAGTGA-T
1 ATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGAGT
* * * *
6555 ATCCGTGCTAAATCCCGAAGAGCAATCATGCTGGTGA
1 ATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGA
6592 CGTGTATTCG
Statistics
Matches: 67, Mismatches: 8, Indels: 2
0.87 0.10 0.03
Matches are distributed among these distances:
38 32 0.48
40 35 0.52
ACGTcount: A:0.26, C:0.23, G:0.27, T:0.24
Consensus pattern (39 bp):
ATCCGGGCTAAGTCCCGAAGAGCATTCATGCTAGTGAGT
Found at i:6576 original size:78 final size:79
Alignment explanation
Indices: 6436--6591 Score: 199
Period size: 78 Copynumber: 2.0 Consensus size: 79
6426 TAAGTGACCA
* * *
6436 TATCCGGACTAAGATCCGAAGGCATTGGTGCGAGTTACTAAATCCGGGCTAAGTCCCGAAGAGCA
1 TATCCGGACTAAGATCCGAAGGCATTCGTGCGAGTGACT-AATCCGGGCTAAATCCCGAAGAGCA
*
6501 TTCATGCTAGTGATG
65 ATCATGCTAGTGATG
* * * *
6516 TATCCGGGCTAAGTTCCGAAGAGCATTCGTGCTAGTGA-T-ATCCGTGCTAAATCCCGAAGAGCA
1 TATCCGGACTAAGATCCGAAG-GCATTCGTGCGAGTGACTAATCCGGGCTAAATCCCGAAGAGCA
*
6579 ATCATGCTGGTGA
65 ATCATGCTAGTGA
6592 CGTGTATTCG
Statistics
Matches: 66, Mismatches: 9, Indels: 4
0.84 0.11 0.05
Matches are distributed among these distances:
78 33 0.50
80 20 0.30
81 13 0.20
ACGTcount: A:0.27, C:0.22, G:0.27, T:0.24
Consensus pattern (79 bp):
TATCCGGACTAAGATCCGAAGGCATTCGTGCGAGTGACTAATCCGGGCTAAATCCCGAAGAGCAA
TCATGCTAGTGATG
Found at i:10024 original size:47 final size:47
Alignment explanation
Indices: 9958--10242 Score: 464
Period size: 47 Copynumber: 6.1 Consensus size: 47
9948 GAAATGATAG
* *
9958 TAAGGCCTAATGGCCGATGTGATGAATATGAAAATGTATATATGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
10005 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
10052 TAAGGCCTAAT-GCCGATGTGATGAATGTGAAAGTGTATATATGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
10098 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
10145 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
* * * * * * * * *
10192 CAGGGCCGAGTGGCCAACGTGATGGATGTGAAAGTGCATAAATGTGA
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
10239 TAAG
1 TAAG
10243 TCCCGAAGGG
Statistics
Matches: 224, Mismatches: 13, Indels: 2
0.94 0.05 0.01
Matches are distributed among these distances:
46 46 0.21
47 178 0.79
ACGTcount: A:0.33, C:0.09, G:0.30, T:0.28
Consensus pattern (47 bp):
TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGA
Found at i:10118 original size:93 final size:94
Alignment explanation
Indices: 9958--10242 Score: 464
Period size: 93 Copynumber: 3.0 Consensus size: 94
9948 GAAATGATAG
* *
9958 TAAGGCCTAATGGCCGATGTGATGAATATGAAAATGTATATATGTGATAAGGCCTAATGGCCGAT
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
10023 GTGATGAATGTGAAAGTGTATATATGTGA
66 GTGATGAATGTGAAAGTGTATATATGTGA
10052 TAAGGCCTAAT-GCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
10116 GTGATGAATGTGAAAGTGTATATATGTGA
66 GTGATGAATGTGAAAGTGTATATATGTGA
* * * * * *
10145 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGACAGGGCCGAGTGGCCAAC
1 TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
* * *
10210 GTGATGGATGTGAAAGTGCATAAATGTGA
66 GTGATGAATGTGAAAGTGTATATATGTGA
10239 TAAG
1 TAAG
10243 TCCCGAAGGG
Statistics
Matches: 179, Mismatches: 11, Indels: 2
0.93 0.06 0.01
Matches are distributed among these distances:
93 91 0.51
94 88 0.49
ACGTcount: A:0.33, C:0.09, G:0.30, T:0.28
Consensus pattern (94 bp):
TAAGGCCTAATGGCCGATGTGATGAATGTGAAAGTGTATATATGTGATAAGGCCTAATGGCCGAT
GTGATGAATGTGAAAGTGTATATATGTGA
Found at i:10416 original size:36 final size:37
Alignment explanation
Indices: 10361--10438 Score: 122
Period size: 36 Copynumber: 2.1 Consensus size: 37
10351 CCGAGCTCTA
* *
10361 AAGACCCGATGACTACGTGTGG-GATTTTGTCCGGGT
1 AAGACCCGATAACTACGTGTGGAGATTATGTCCGGGT
*
10397 AAGACCCGATAACTTCGTGTGGAGATTATGTCCGGGT
1 AAGACCCGATAACTACGTGTGGAGATTATGTCCGGGT
10434 AAGAC
1 AAGAC
10439 TTCGTAATAA
Statistics
Matches: 38, Mismatches: 3, Indels: 1
0.90 0.07 0.02
Matches are distributed among these distances:
36 20 0.53
37 18 0.47
ACGTcount: A:0.24, C:0.19, G:0.31, T:0.26
Consensus pattern (37 bp):
AAGACCCGATAACTACGTGTGGAGATTATGTCCGGGT
Done.