Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: scaffold_48 ID=scaffold_48-JGI_221_v2.0
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 35838
ACGTcount: A:0.22, C:0.12, G:0.13, T:0.21
Warning! 11703 characters in sequence are not A, C, G, or T
Found at i:3833 original size:9 final size:9
Alignment explanation
Indices: 3819--4240 Score: 120
Period size: 9 Copynumber: 48.7 Consensus size: 9
3809 AAGGTATACA
3819 TTATGTAAG
1 TTATGTAAG
3828 TTATGTAAG
1 TTATGTAAG
*
3837 TTGTGTAAG
1 TTATGTAAG
**
3846 TTGCGTAAG
1 TTATGTAAG
* *
3855 ATGTGT-A-
1 TTATGTAAG
* *
3862 TTATGAAAC
1 TTATGTAAG
3871 TTATGTAAG
1 TTATGTAAG
*
3880 TTATGT--C
1 TTATGTAAG
3887 TTATGTAAG
1 TTATGTAAG
*
3896 TTATGTAAA
1 TTATGTAAG
*
3905 ATATGT-A-
1 TTATGTAAG
*
3912 TTATTTACA-
1 TTATGTA-AG
*
3921 -CATGTAAG
1 TTATGTAAG
*
3929 TTATGT--C
1 TTATGTAAG
3936 TTATGTAAG
1 TTATGTAAG
**
3945 TTGCGTAAG
1 TTATGTAAG
*
3954 TTGTGT-A-
1 TTATGTAAG
*
3961 TTATGAAAG
1 TTATGTAAG
*
3970 TTATGT--C
1 TTATGTAAG
3977 TTATGTAAG
1 TTATGTAAG
*
3986 TTATGTAGG
1 TTATGTAAG
*
3995 GTATGTATTA-
1 TTATGTA--AG
*
4005 TTATGTAAC
1 TTATGTAAG
* *
4014 TTATTTAAT
1 TTATGTAAG
*
4023 TTATGTAAC
1 TTATGTAAG
* *
4032 TTATTTAAT
1 TTATGTAAG
*
4041 TTATGTAGG
1 TTATGTAAG
* *
4050 GTATGCATTA-
1 TTATG--TAAG
*
4060 TTATGTAAC
1 TTATGTAAG
* *
4069 TTATTTAAT
1 TTATGTAAG
*
4078 TTATGTAGG
1 TTATGTAAG
*
4087 GTATGTATTA-
1 TTATGTA--AG
*
4097 TTATGTAAC
1 TTATGTAAG
* *
4106 TTATTTAAT
1 TTATGTAAG
*
4115 TTATGTAGG
1 TTATGTAAG
*
4124 GTATGTAAG
1 TTATGTAAG
4133 TTATGTAAG
1 TTATGTAAG
* *
4142 CTCTGT-A-
1 TTATGTAAG
* *
4149 TTATTTACG
1 TTATGTAAG
*
4158 -CATGTAAG
1 TTATGTAAG
*
4166 TTGTGT-A-
1 TTATGTAAG
4173 TTATGTATTA-
1 TTATGTA--AG
* *
4183 TTACGTAAC
1 TTATGTAAG
*
4192 TTATTTAAG
1 TTATGTAAG
*
4201 TTATGCAAG
1 TTATGTAAG
*
4210 TTATAT-A-
1 TTATGTAAG
* *
4217 TTAAGTAGG
1 TTATGTAAG
4226 TTATGTAAG
1 TTATGTAAG
4235 TTATGT
1 TTATGT
4241 GTTACGTAAA
Statistics
Matches: 294, Mismatches: 87, Indels: 64
0.66 0.20 0.14
Matches are distributed among these distances:
7 42 0.14
8 22 0.07
9 206 0.70
10 23 0.08
11 1 0.00
ACGTcount: A:0.30, C:0.05, G:0.19, T:0.46
Consensus pattern (9 bp):
TTATGTAAG
Found at i:3889 original size:16 final size:16
Alignment explanation
Indices: 3870--3991 Score: 82
Period size: 16 Copynumber: 8.0 Consensus size: 16
3860 TATTATGAAA
3870 CTTATGTAAGTTATGT
1 CTTATGTAAGTTATGT
3886 CTTATGTAAGTTATGT
1 CTTATGTAAGTTATGT
** *
3902 AAAATATGT-A-TTATTT
1 --CTTATGTAAGTTATGT
**
3918 ACACATGTAAGTTATGT
1 -CTTATGTAAGTTATGT
3935 CTTATGTAAG-T-TG-
1 CTTATGTAAGTTATGT
*
3948 C----GTAAGTTGTGT
1 CTTATGTAAGTTATGT
* *
3960 ATTATGAAAGTTATGT
1 CTTATGTAAGTTATGT
3976 CTTATGTAAGTTATGT
1 CTTATGTAAGTTATGT
3992 AGGGTATGTA
Statistics
Matches: 82, Mismatches: 13, Indels: 22
0.70 0.11 0.19
Matches are distributed among these distances:
9 5 0.06
10 1 0.01
11 2 0.02
13 1 0.01
14 2 0.02
15 7 0.09
16 53 0.65
17 6 0.07
18 5 0.06
ACGTcount: A:0.30, C:0.06, G:0.19, T:0.46
Consensus pattern (16 bp):
CTTATGTAAGTTATGT
Found at i:3964 original size:25 final size:25
Alignment explanation
Indices: 3823--3972 Score: 97
Period size: 25 Copynumber: 6.0 Consensus size: 25
3813 TATACATTAT
* *
3823 GTAAGTTATGTAAGTTGTGTAAGTTGC
1 GTAAGTTATGT-A-TTATGTAAGTTAC
* * * * *
3850 GTAAGATGTGTATTATGAAACTTAT
1 GTAAGTTATGTATTATGTAAGTTAC
* *
3875 GTAAGTTATGTCTTATGTAAGTTAT
1 GTAAGTTATGTATTATGTAAGTTAC
** * * *
3900 GTAAAATATGTATTATTTACA--CAT
1 GTAAGTTATGTATTATGTA-AGTTAC
* *
3924 GTAAGTTATGTCTTATGTAAGTTGC
1 GTAAGTTATGTATTATGTAAGTTAC
* *
3949 GTAAGTTGTGTATTATGAAAGTTA
1 GTAAGTTATGTATTATGTAAGTTA
3973 TGTCTTATGT
Statistics
Matches: 92, Mismatches: 28, Indels: 8
0.72 0.22 0.06
Matches are distributed among these distances:
23 1 0.01
24 17 0.18
25 63 0.68
26 2 0.02
27 9 0.10
ACGTcount: A:0.31, C:0.05, G:0.21, T:0.43
Consensus pattern (25 bp):
GTAAGTTATGTATTATGTAAGTTAC
Found at i:4002 original size:41 final size:41
Alignment explanation
Indices: 3926--4005 Score: 115
Period size: 41 Copynumber: 2.0 Consensus size: 41
3916 TTACACATGT
* * *
3926 AAGTTATGTCTTATGTAAGTTGCGTAAGTTGTGTATTATGA
1 AAGTTATGTCTTATGTAAGTTACGTAAGGTATGTATTATGA
* *
3967 AAGTTATGTCTTATGTAAGTTATGTAGGGTATGTATTAT
1 AAGTTATGTCTTATGTAAGTTACGTAAGGTATGTATTAT
4006 TATGTAACTT
Statistics
Matches: 34, Mismatches: 5, Indels: 0
0.87 0.13 0.00
Matches are distributed among these distances:
41 34 1.00
ACGTcount: A:0.28, C:0.04, G:0.24, T:0.45
Consensus pattern (41 bp):
AAGTTATGTCTTATGTAAGTTACGTAAGGTATGTATTATGA
Found at i:4048 original size:55 final size:55
Alignment explanation
Indices: 3976--4084 Score: 191
Period size: 55 Copynumber: 2.0 Consensus size: 55
3966 AAAGTTATGT
*
3976 CTTATGTAAGTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATGTAA
1 CTTATGTAAGTTATGTAGGGTATGCATTATTATGTAACTTATTTAATTTATGTAA
* *
4031 CTTATTTAATTTATGTAGGGTATGCATTATTATGTAACTTATTTAATTTATGTA
1 CTTATGTAAGTTATGTAGGGTATGCATTATTATGTAACTTATTTAATTTATGTA
4085 GGGTATGTAT
Statistics
Matches: 51, Mismatches: 3, Indels: 0
0.94 0.06 0.00
Matches are distributed among these distances:
55 51 1.00
ACGTcount: A:0.30, C:0.05, G:0.15, T:0.50
Consensus pattern (55 bp):
CTTATGTAAGTTATGTAGGGTATGCATTATTATGTAACTTATTTAATTTATGTAA
Found at i:4129 original size:37 final size:37
Alignment explanation
Indices: 4023--4130 Score: 207
Period size: 37 Copynumber: 2.9 Consensus size: 37
4013 CTTATTTAAT
*
4023 TTATGTAACTTATTTAATTTATGTAGGGTATGCATTA
1 TTATGTAACTTATTTAATTTATGTAGGGTATGTATTA
4060 TTATGTAACTTATTTAATTTATGTAGGGTATGTATTA
1 TTATGTAACTTATTTAATTTATGTAGGGTATGTATTA
4097 TTATGTAACTTATTTAATTTATGTAGGGTATGTA
1 TTATGTAACTTATTTAATTTATGTAGGGTATGTA
4131 AGTTATGTAA
Statistics
Matches: 70, Mismatches: 1, Indels: 0
0.99 0.01 0.00
Matches are distributed among these distances:
37 70 1.00
ACGTcount: A:0.30, C:0.04, G:0.17, T:0.50
Consensus pattern (37 bp):
TTATGTAACTTATTTAATTTATGTAGGGTATGTATTA
Found at i:4152 original size:92 final size:92
Alignment explanation
Indices: 3976--4205 Score: 265
Period size: 92 Copynumber: 2.6 Consensus size: 92
3966 AAAGTTATGT
* * *
3976 CTTATGTAAGTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATGTAACTTATTTAAT
1 CTTATGTAAGTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATGTAACGTATGTAAG
* *
4041 TTATGTAGGGTATGCATTATTATGTAA
66 TTATGTAAGCTATGCATTATTATGTAA
* * **
4068 CTTATTTAATTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATGTAGGGTATGTAAG
1 CTTATGTAAGTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATGTAACGTATGTAAG
* *
4133 TTATGTAAGCTCTG---TATTAT-TTA
66 TTATGTAAGCTATGCATTATTATGTAA
** * * * *
4156 CGCATGTAAGTTGTGTA--TTATGTATTATTACGTAACTTATTTAAGTTATG
1 CTTATGTAAGTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATG
4206 CAAGTTATAT
Statistics
Matches: 119, Mismatches: 19, Indels: 6
0.83 0.13 0.04
Matches are distributed among these distances:
86 30 0.25
88 14 0.12
89 6 0.05
92 69 0.58
ACGTcount: A:0.29, C:0.05, G:0.17, T:0.49
Consensus pattern (92 bp):
CTTATGTAAGTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATGTAACGTATGTAAG
TTATGTAAGCTATGCATTATTATGTAA
Found at i:4343 original size:41 final size:41
Alignment explanation
Indices: 4298--4529 Score: 94
Period size: 46 Copynumber: 5.1 Consensus size: 41
4288 ATTTAAGTTA
4298 TAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG
1 TAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG
** * ** *
4339 TAAATGAATATATGTA-TAATATTAAA-AAAAATAGTAATACTTATTTAAG
1 TAAAT---T-TAT-TATTAATA--AAATTTAAATA-T-A-GCTTACATACG
4388 TTATAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG
1 ---TAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG
** * ** *
4432 TAAATGAATATATGTA-TAATATTAAA-AAAAATAGTAATACTTATTTAAG
1 TAAAT---T-TAT-TATTAATA--AAATTTAAATA-T-A-GCTTACATACG
4481 TTATAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG
1 ---TAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG
4525 TAAAT
1 TAAAT
4530 GANNNNNNNN
Statistics
Matches: 137, Mismatches: 24, Indels: 60
0.62 0.11 0.27
Matches are distributed among these distances:
41 15 0.11
44 16 0.12
45 18 0.13
46 22 0.16
47 22 0.16
48 18 0.13
49 16 0.12
52 10 0.07
ACGTcount: A:0.49, C:0.05, G:0.06, T:0.40
Consensus pattern (41 bp):
TAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG
Found at i:4395 original size:52 final size:52
Alignment explanation
Indices: 4339--4488 Score: 137
Period size: 46 Copynumber: 3.1 Consensus size: 52
4329 CTTACATACG
4339 TAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTA
1 TAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTA
** * ** *
4391 TAAAT---T-TAT-TATTAATA--AAATTTAAATA-T-A-GCTTACATACG---
1 TAAATGAATATATGTA-TAATATTAAA-AAAAATAGTAATACTTATTTAAGTTA
4432 TAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTA
1 TAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTA
4484 TAAAT
1 TAAAT
4489 TTATTATTAA
Statistics
Matches: 71, Mismatches: 12, Indels: 30
0.63 0.11 0.27
Matches are distributed among these distances:
41 5 0.07
44 8 0.11
45 9 0.13
46 11 0.15
47 11 0.15
48 9 0.13
49 8 0.11
52 10 0.14
ACGTcount: A:0.51, C:0.03, G:0.07, T:0.39
Consensus pattern (52 bp):
TAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTA
Found at i:4401 original size:93 final size:93
Alignment explanation
Indices: 4243--4531 Score: 562
Period size: 93 Copynumber: 3.1 Consensus size: 93
4233 AGTTATGTGT
*
4243 TACGTAAATGAATATATGTATATTATT-AAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT
1 TACGTAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT
4307 TATTAATAAAATTTAAATATAGCTTACA
66 TATTAATAAAATTTAAATATAGCTTACA
4335 TACGTAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT
1 TACGTAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT
4400 TATTAATAAAATTTAAATATAGCTTACA
66 TATTAATAAAATTTAAATATAGCTTACA
4428 TACGTAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT
1 TACGTAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT
4493 TATTAATAAAATTTAAATATAGCTTACA
66 TATTAATAAAATTTAAATATAGCTTACA
4521 TACGTAAATGA
1 TACGTAAATGA
4532 NNNNNNNNNN
Statistics
Matches: 195, Mismatches: 1, Indels: 1
0.99 0.01 0.01
Matches are distributed among these distances:
92 26 0.13
93 169 0.87
ACGTcount: A:0.49, C:0.04, G:0.07, T:0.40
Consensus pattern (93 bp):
TACGTAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT
TATTAATAAAATTTAAATATAGCTTACA
Found at i:4407 original size:48 final size:48
Alignment explanation
Indices: 4355--4500 Score: 142
Period size: 48 Copynumber: 3.1 Consensus size: 48
4345 AATATATGTA
4355 TAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTATTAT
1 TAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTATTAT
** * ** * * * *
4403 TAATA--AAATTTAAATA-T-A-GCTTACATACGTAAATGAATATATGTA-
1 TAATATTAAA-AAAAATAGTAATACTTATTTAAGT-TATAAATTTAT-TAT
4448 TAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTATTAT
1 TAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTATTAT
4496 TAATA
1 TAATA
4501 AAATTTAAAT
Statistics
Matches: 71, Mismatches: 18, Indels: 18
0.66 0.17 0.17
Matches are distributed among these distances:
44 8 0.11
45 14 0.20
46 11 0.15
47 11 0.15
48 19 0.27
49 8 0.11
ACGTcount: A:0.50, C:0.03, G:0.05, T:0.41
Consensus pattern (48 bp):
TAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTATTAT
Found at i:14303 original size:15 final size:15
Alignment explanation
Indices: 14283--14314 Score: 55
Period size: 15 Copynumber: 2.1 Consensus size: 15
14273 CATTTCACTA
*
14283 TTATGTCTTTTGTAT
1 TTATGTCTTTTATAT
14298 TTATGTCTTTTATAT
1 TTATGTCTTTTATAT
14313 TT
1 TT
14315 TGCATGCATA
Statistics
Matches: 16, Mismatches: 1, Indels: 0
0.94 0.06 0.00
Matches are distributed among these distances:
15 16 1.00
ACGTcount: A:0.16, C:0.06, G:0.09, T:0.69
Consensus pattern (15 bp):
TTATGTCTTTTATAT
Found at i:35264 original size:43 final size:44
Alignment explanation
Indices: 35154--35265 Score: 138
Period size: 44 Copynumber: 2.6 Consensus size: 44
35144 GAAGAATTTT
* * ** *
35154 AGATCTTATCTCCCTGAGGTTACAGTGGAGCAGATTGAAGCCAG
1 AGATCTTATCTCCCTGAAGTTACAGCGGAGCAGATCCAAGACAG
35198 AGATCTTATCTCCCTG-AGATTACAGCGGAGCAGATCCAAGACA-
1 AGATCTTATCTCCCTGAAG-TTACAGCGGAGCAGATCCAAGACAG
**
35241 CTATCTTATCTCCCTGAAGTTACAG
1 AGATCTTATCTCCCTGAAGTTACAG
35266 TNNNNNNNNN
Statistics
Matches: 59, Mismatches: 7, Indels: 5
0.83 0.10 0.07
Matches are distributed among these distances:
43 21 0.36
44 38 0.64
ACGTcount: A:0.29, C:0.24, G:0.21, T:0.26
Consensus pattern (44 bp):
AGATCTTATCTCCCTGAAGTTACAGCGGAGCAGATCCAAGACAG
Done.