Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: scaffold_113 ID=scaffold_113-JGI_221_v2.0
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 13884
ACGTcount: A:0.31, C:0.16, G:0.14, T:0.31
Warning! 1174 characters in sequence are not A, C, G, or T
Found at i:175 original size:61 final size:61
Alignment explanation
Indices: 34--220 Score: 239
Period size: 61 Copynumber: 3.0 Consensus size: 61
24 TAGACATGTA
* *
34 TAAAAACCCTAACCTAATTAAATTAAAAACCCTAACCTAGTTTAATTAAAAATCTTAAACCCTAA
1 TAAAAACCCTAACCTAATTAAATTAAAAACCCTAACCTAATTAAATTAAAAA-C-T-----CTAA
99 ACT
59 ACT
*
102 TAAAAACCCTAACCTAATTAAATTAAAAATCCTAACCTAATTAAATTAAAAACTCTAAACT
1 TAAAAACCCTAACCTAATTAAATTAAAAACCCTAACCTAATTAAATTAAAAACTCTAAACT
*** * *
163 TAAAAACCCTAACCCCTTTAACTTAAAAACCCTAACCTAATTAACTTAAAAACTCTAA
1 TAAAAACCCTAACCTAATTAAATTAAAAACCCTAACCTAATTAAATTAAAAACTCTAA
221 CCTAATTAAA
Statistics
Matches: 110, Mismatches: 9, Indels: 7
0.87 0.07 0.06
Matches are distributed among these distances:
61 59 0.54
66 1 0.01
67 1 0.01
68 49 0.45
ACGTcount: A:0.49, C:0.23, G:0.01, T:0.27
Consensus pattern (61 bp):
TAAAAACCCTAACCTAATTAAATTAAAAACCCTAACCTAATTAAATTAAAAACTCTAAACT
Found at i:189 original size:38 final size:37
Alignment explanation
Indices: 120--197 Score: 93
Period size: 38 Copynumber: 2.1 Consensus size: 37
110 CTAACCTAAT
* * *
120 TAAATTAAAAATCCTAACCTAATTAAATTAAAAACTC
1 TAAATTAAAAACCCTAACCCAATTAAATTAAAAACCC
** *
157 TAAACTTAAAAACCCTAACCCCTTTAACTTAAAAACCC
1 TAAA-TTAAAAACCCTAACCCAATTAAATTAAAAACCC
195 TAA
1 TAA
198 CCTAATTAAC
Statistics
Matches: 34, Mismatches: 6, Indels: 1
0.83 0.15 0.02
Matches are distributed among these distances:
37 4 0.12
38 30 0.88
ACGTcount: A:0.50, C:0.23, G:0.00, T:0.27
Consensus pattern (37 bp):
TAAATTAAAAACCCTAACCCAATTAAATTAAAAACCC
Found at i:227 original size:107 final size:110
Alignment explanation
Indices: 52--321 Score: 329
Period size: 107 Copynumber: 2.5 Consensus size: 110
42 CTAACCTAAT
* * * ** *
52 TAAA-TTAAAAACCCTAACCTAGTTTAATTAAAAATCTTAAAC--CCTAAACTTAAAAACCCTAA
1 TAAACTTAAAAACCCTAACCTAATTTAATTAAAAACCCTAAACTAAATTAACTTAAAAACCCTAA
*
114 CCTAATTAAATTAAAAATCCTAACCTAATTAAATTAAAAA-CT-C
66 CCTAATTAAATTAAAAATCCTAACCAAATTAAATTAAAAACCTAC
** * *
157 TAAACTTAAAAACCCTAACC-CCTTTAACTTAAAAACCCTAACCT-AATTAACTTAAAAACTCTA
1 TAAACTTAAAAACCCTAACCTAATTTAA-TTAAAAACCCTAAACTAAATTAACTTAAAAACCCTA
*
220 ACCTAATTAAATTAAAAATCCTAACCAAATTTAATTAAAAACCCTAAACCC
65 ACCTAATTAAATTAAAAATCCTAACCAAATTAAATTAAAAA-CCT--A--C
271 TAAACTTAAAAACCCTAACCTAATTTAATTAAAAACCCTAAACTAAATTAA
1 TAAACTTAAAAACCCTAACCTAATTTAATTAAAAACCCTAAACTAAATTAA
322 TAATTTTACT
Statistics
Matches: 139, Mismatches: 14, Indels: 14
0.83 0.08 0.08
Matches are distributed among these distances:
105 9 0.06
106 27 0.19
107 54 0.39
109 2 0.01
114 36 0.26
115 11 0.08
ACGTcount: A:0.50, C:0.22, G:0.00, T:0.27
Consensus pattern (110 bp):
TAAACTTAAAAACCCTAACCTAATTTAATTAAAAACCCTAAACTAAATTAACTTAAAAACCCTAA
CCTAATTAAATTAAAAATCCTAACCAAATTAAATTAAAAACCTAC
Found at i:306 original size:45 final size:45
Alignment explanation
Indices: 162--313 Score: 184
Period size: 45 Copynumber: 3.3 Consensus size: 45
152 AACTCTAAAC
* *
162 TTAAAAACCCTAACCCCTTTAACTTAAAAACCCTAACCTAA-TTAA
1 TTAAAAACCCTAAACCC-TAAACTTAAAAACCCTAACCTAATTTAA
* * * *
207 CTTAAAAACTCT-AA-CCTAATTAAATTAAAAATCCTAACCAAATTTAA
1 -TTAAAAACCCTAAACCCT-A--AACTTAAAAACCCTAACCTAATTTAA
254 TTAAAAACCCTAAACCCTAAACTTAAAAACCCTAACCTAATTTAA
1 TTAAAAACCCTAAACCCTAAACTTAAAAACCCTAACCTAATTTAA
299 TTAAAAACCCTAAAC
1 TTAAAAACCCTAAAC
314 TAAATTAATA
Statistics
Matches: 90, Mismatches: 10, Indels: 13
0.80 0.09 0.12
Matches are distributed among these distances:
43 1 0.01
44 2 0.02
45 39 0.43
46 38 0.42
47 7 0.08
48 3 0.03
ACGTcount: A:0.49, C:0.25, G:0.00, T:0.26
Consensus pattern (45 bp):
TTAAAAACCCTAAACCCTAAACTTAAAAACCCTAACCTAATTTAA
Found at i:321 original size:23 final size:22
Alignment explanation
Indices: 34--322 Score: 177
Period size: 23 Copynumber: 13.0 Consensus size: 22
24 TAGACATGTA
*
34 TAAAAACCCTAACCTAATTAAAT
1 TAAAAACCCTAAACTAATT-AAT
* *
57 TAAAAACCCTAACCTAGTTTAAT
1 TAAAAACCCTAAACTA-ATTAAT
* * *
80 TAAAAATCTTAAACCCTAA--ACT
1 TAAAAACCCTAAA--CTAATTAAT
*
102 TAAAAACCCTAACCTAATTAAAT
1 TAAAAACCCTAAACTAATT-AAT
* *
125 TAAAAATCCTAACCTAATTAAAT
1 TAAAAACCCTAAACTAATT-AAT
*
148 TAAAAA--CT---CTAA--ACT
1 TAAAAACCCTAAACTAATTAAT
* ***
163 TAAAAACCCTAACCCCTTTAACT
1 TAAAAACCCTAAACTAATTAA-T
*
186 TAAAAACCCTAACCTAATTAACT
1 TAAAAACCCTAAACTAATTAA-T
* *
209 TAAAAACTCTAACCTAATTAAAT
1 TAAAAACCCTAAACTAATT-AAT
* * *
232 TAAAAATCCTAACCAAATTTAAT
1 TAAAAACCCTAAACTAA-TTAAT
*
255 TAAAAACCCTAAACCCTAA--ACT
1 TAAAAACCCTAAA--CTAATTAAT
*
277 TAAAAACCCTAACCTAATTTAAT
1 TAAAAACCCTAAACTAA-TTAAT
300 TAAAAACCCTAAACTAAATTAAT
1 TAAAAACCCTAAACT-AATTAAT
323 AATTTTACTT
Statistics
Matches: 214, Mismatches: 30, Indels: 44
0.74 0.10 0.15
Matches are distributed among these distances:
15 8 0.04
17 2 0.01
18 4 0.02
20 9 0.04
21 2 0.01
22 27 0.13
23 148 0.69
24 8 0.04
25 6 0.03
ACGTcount: A:0.50, C:0.22, G:0.00, T:0.27
Consensus pattern (22 bp):
TAAAAACCCTAAACTAATTAAT
Found at i:322 original size:68 final size:68
Alignment explanation
Indices: 157--311 Score: 199
Period size: 68 Copynumber: 2.2 Consensus size: 68
147 TTAAAAACTC
** *
157 TAAACTTAAAAACCCTAACC-CCTTTAACTTAAAAACCCTAACCTAATTAACTTAAAAACTCTAA
1 TAAA-TTAAAAACCCTAACCAAATTTAA-TTAAAAACCCTAACCTAA-TAACTTAAAAACCCTAA
221 CCTAAT
63 CCTAAT
*
227 TAAATTAAAAATCCTAACCAAATTTAATTAAAAACCCTAAACCCT-A-AACTTAAAAACCCTAAC
1 TAAATTAAAAACCCTAACCAAATTTAATTAAAAACCCT-AA-CCTAATAACTTAAAAACCCTAAC
290 CTAAT
64 CTAAT
*
295 TTAATTAAAAACCCTAA
1 TAAATTAAAAACCCTAA
312 ACTAAATTAA
Statistics
Matches: 76, Mismatches: 6, Indels: 8
0.84 0.07 0.09
Matches are distributed among these distances:
68 36 0.47
69 25 0.33
70 12 0.16
71 3 0.04
ACGTcount: A:0.49, C:0.25, G:0.00, T:0.26
Consensus pattern (68 bp):
TAAATTAAAAACCCTAACCAAATTTAATTAAAAACCCTAACCTAATAACTTAAAAACCCTAACCT
AAT
Found at i:4399 original size:13 final size:13
Alignment explanation
Indices: 4381--4413 Score: 66
Period size: 13 Copynumber: 2.5 Consensus size: 13
4371 TGACCTCTTG
4381 GCGGATTATCCCT
1 GCGGATTATCCCT
4394 GCGGATTATCCCT
1 GCGGATTATCCCT
4407 GCGGATT
1 GCGGATT
4414 CTATCTTCAC
Statistics
Matches: 20, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
13 20 1.00
ACGTcount: A:0.15, C:0.27, G:0.27, T:0.30
Consensus pattern (13 bp):
GCGGATTATCCCT
Found at i:5215 original size:26 final size:24
Alignment explanation
Indices: 5172--5225 Score: 63
Period size: 26 Copynumber: 2.2 Consensus size: 24
5162 CCTAATGAGC
* *
5172 TTATTTTATAACATTTTTATATGTTT
1 TTATTTAATAACAATTTT-TAT-TTT
*
5198 TTATTTAATTACAATTTTTATTTT
1 TTATTTAATAACAATTTTTATTTT
5222 TTAT
1 TTAT
5226 GATTAAATTA
Statistics
Matches: 25, Mismatches: 3, Indels: 2
0.83 0.10 0.07
Matches are distributed among these distances:
24 7 0.28
25 3 0.12
26 15 0.60
ACGTcount: A:0.28, C:0.04, G:0.02, T:0.67
Consensus pattern (24 bp):
TTATTTAATAACAATTTTTATTTT
Found at i:7208 original size:14 final size:14
Alignment explanation
Indices: 7189--7215 Score: 54
Period size: 14 Copynumber: 1.9 Consensus size: 14
7179 TACATTGGAC
7189 AGATTCATGCATGT
1 AGATTCATGCATGT
7203 AGATTCATGCATG
1 AGATTCATGCATG
7216 GGAAGATGCA
Statistics
Matches: 13, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
14 13 1.00
ACGTcount: A:0.30, C:0.15, G:0.22, T:0.33
Consensus pattern (14 bp):
AGATTCATGCATGT
Found at i:8756 original size:47 final size:48
Alignment explanation
Indices: 8702--8801 Score: 168
Period size: 48 Copynumber: 2.1 Consensus size: 48
8692 CATGTTCGAC
8702 TTTACCAATTCACA-ACAT-TTTAGGGTGTTTTCACTTATTAAAACTTA
1 TTTACCAATTCACATA-ATATTTAGGGTGTTTTCACTTATTAAAACTTA
*
8749 TTTACCAATTCACATAATATTTTGGGTGTTTTCACTTATTAAAACTTA
1 TTTACCAATTCACATAATATTTAGGGTGTTTTCACTTATTAAAACTTA
8797 TTTAC
1 TTTAC
8802 TCATGGAATG
Statistics
Matches: 50, Mismatches: 1, Indels: 3
0.93 0.02 0.06
Matches are distributed among these distances:
47 16 0.32
48 34 0.68
ACGTcount: A:0.31, C:0.16, G:0.08, T:0.45
Consensus pattern (48 bp):
TTTACCAATTCACATAATATTTAGGGTGTTTTCACTTATTAAAACTTA
Found at i:13858 original size:24 final size:23
Alignment explanation
Indices: 13798--13884 Score: 90
Period size: 23 Copynumber: 3.8 Consensus size: 23
13788 TAGACATGTA
13798 TAAAAACCCTAACCTAATTAAAT
1 TAAAAACCCTAACCTAATTAAAT
* *
13821 TAAAAACCCTAACCTAGTTTAAT
1 TAAAAACCCTAACCTAATTAAAT
* * *
13844 TAAAAATCTTAAACCCT-A--AACT
1 TAAAAACCCT-AA-CCTAATTAAAT
13866 TAAAAACCCTAACCTAATT
1 TAAAAACCCTAACCTAATT
Statistics
Matches: 50, Mismatches: 9, Indels: 10
0.72 0.13 0.14
Matches are distributed among these distances:
20 3 0.06
21 3 0.06
22 10 0.20
23 29 0.58
24 2 0.04
25 3 0.06
ACGTcount: A:0.48, C:0.23, G:0.01, T:0.28
Consensus pattern (23 bp):
TAAAAACCCTAACCTAATTAAAT
Done.