Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: AWUE01014064.1 Corchorus olitorius cultivar O-4 contig14097, whole genome shotgun sequence
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 17615
ACGTcount: A:0.34, C:0.18, G:0.16, T:0.32
Found at i:2308 original size:19 final size:19
Alignment explanation
Indices: 2284--2325 Score: 57
Period size: 19 Copynumber: 2.2 Consensus size: 19
2274 AAACCAGAGT
*
2284 AAAACCAAGACAATCAATC
1 AAAACCAAGACAATAAATC
* *
2303 AAAACCAGGATAATAAATC
1 AAAACCAAGACAATAAATC
2322 AAAA
1 AAAA
2326 TGCCAAATCA
Statistics
Matches: 20, Mismatches: 3, Indels: 0
0.87 0.13 0.00
Matches are distributed among these distances:
19 20 1.00
ACGTcount: A:0.62, C:0.19, G:0.07, T:0.12
Consensus pattern (19 bp):
AAAACCAAGACAATAAATC
Found at i:4523 original size:2 final size:2
Alignment explanation
Indices: 4516--4545 Score: 51
Period size: 2 Copynumber: 15.0 Consensus size: 2
4506 ACACCTAATT
*
4516 TA TA TA TA TA TA TA TA TA TA TA TA TT TA TA
1 TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA
4546 CGGTATTACA
Statistics
Matches: 26, Mismatches: 2, Indels: 0
0.93 0.07 0.00
Matches are distributed among these distances:
2 26 1.00
ACGTcount: A:0.47, C:0.00, G:0.00, T:0.53
Consensus pattern (2 bp):
TA
Found at i:8239 original size:26 final size:25
Alignment explanation
Indices: 8196--8253 Score: 62
Period size: 26 Copynumber: 2.3 Consensus size: 25
8186 TTTTGATATT
* * *
8196 TTGGTTTATTATCCTGATTTATTACG
1 TTGGTTTATGATCCTGA-TTATGACA
**
8222 TTGGTTTATGATTTTGATTATGACA
1 TTGGTTTATGATCCTGATTATGACA
8247 TTGGTTT
1 TTGGTTT
8254 TAACGATTTT
Statistics
Matches: 27, Mismatches: 5, Indels: 1
0.82 0.15 0.03
Matches are distributed among these distances:
25 13 0.48
26 14 0.52
ACGTcount: A:0.19, C:0.07, G:0.19, T:0.55
Consensus pattern (25 bp):
TTGGTTTATGATCCTGATTATGACA
Found at i:15350 original size:50 final size:50
Alignment explanation
Indices: 15285--15379 Score: 145
Period size: 50 Copynumber: 1.9 Consensus size: 50
15275 TCTTATAATT
15285 TTTTTAATAACCTAAAAACATTTCTAGTAACAGTATCAAGTTTTAATTTC
1 TTTTTAATAACCTAAAAACATTTCTAGTAACAGTATCAAGTTTTAATTTC
* * * * *
15335 TTTTTAGTCACCTAAAAACTTTTTTAGTAACCGTATCAAGTTTTA
1 TTTTTAATAACCTAAAAACATTTCTAGTAACAGTATCAAGTTTTA
15380 TAGTAATCTT
Statistics
Matches: 40, Mismatches: 5, Indels: 0
0.89 0.11 0.00
Matches are distributed among these distances:
50 40 1.00
ACGTcount: A:0.35, C:0.15, G:0.07, T:0.43
Consensus pattern (50 bp):
TTTTTAATAACCTAAAAACATTTCTAGTAACAGTATCAAGTTTTAATTTC
Found at i:16174 original size:399 final size:399
Alignment explanation
Indices: 15418--16304 Score: 1244
Period size: 399 Copynumber: 2.2 Consensus size: 399
15408 TGAGCTTTTT
* * * * *
15418 CATAATTAAATAAATATTTAATATTAACACATATTCCCTAAAGAGACACATGTCAACTCTTAAAC
1 CATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTAAAC
*** * * *
15483 CCCGGGCGTGCAGTCTGCTAAACTCCACTGACGGTATATTGTATAATTTTTCTTATAAGATTATT
66 CCCACACGTGCAGTCTGCTAAACTCCACTCACGATATATTGTATAATTTTTCATATAAGATTATT
* * * * *
15548 ATACAATACACTGTAAGTGTAAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACATACCCA
131 ATAAAATACACAGTAAGCGTAAATTTTGAACTCCATAAGCGGGTTAAGAAGTTGACACATACCCA
* *
15613 TTTCATAATTAATTCAATATTTAATATCAATACATATTCCCTAAGGGGACACATGCCAACTCTTA
196 TTTCATAATTAATTAAATATTTAATATCAATACATATTCCCTAAGGGGACACATGCCAACCCTTA
* * * * *
15678 AACCCCACACGTGCAGTCTGCTAAATTCCACGGACGATGTATTGTATATTTTTTACTTATAGGGA
261 AACCCCACACGTCCAGTCTGCTAAACTCCACGAACGATGTATTGCATAATTTTTACTTATAGGGA
* * *
15743 TTATTATACAAGTACACTGTCAGTGTAAATTTTGGACTACATAAGCGGGTTAAGAGGTTGACACA
326 TTATTATACAAGTACACTGTCAGTGTAAATTTT-GACTACATAAGCAGATTAAGACGTTGACACA
15808 T-ACCCATTA
390 TAACCCATTA
15817 CATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTAAAC
1 CATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTAAAC
* * * * *
15882 CCCCCATGTGCAGTCTGCTAAACTCCATTCACGATGTATTGTATAATTTTTCATATAGGGATTAT
66 CCCACACGTGCAGTCTGCTAAACTCCACTCACGATATATTGTATAATTTTTCATATA-AGATTAT
* * *
15947 TATAAAATACACAGTCAGCGTAAATTTTGAACTCTATAAGCGGGTTAAGAAGTTGACACATATCT
130 TATAAAATACACAGTAAGCGTAAATTTTGAACTCCATAAGCGGGTTAAGAAGTTGACACATA-CC
* * *
16012 CATTTCATAATTAATTAAATATTTAATATTAATAGATATTCCCTAAGGGGACACATGTCAACCCT
194 CATTTCATAATTAATTAAATATTTAATATCAATACATATTCCCTAAGGGGACACATGCCAACCCT
* *
16077 TAAACCCCGCACGTCCAGTCTGCTAAACTCCACTAACTG-TGTATTGCATAATTTTT-CTTATA-
259 TAAACCCCACACGTCCAGTCTGCTAAACTCCACGAAC-GATGTATTGCATAATTTTTACTTATAG
* * * *
16139 GTATTATTATACAA-TACACTTTCGGTGTAAAATTTTGACTCCATAAGCAGATTAAGACGTTGAC
323 GGATTATTATACAAGTACACTGTCAGTGT-AAATTTTGACTACATAAGCAGATTAAGACGTTGAC
* *
16203 ACATAACCCGTTT
387 ACATAACCCATTA
* *
16216 CATAATTAATTAAATATTTAATATTAATACATATTCTCTAAGGGGACACATGTCAACCCTTACAC
1 CATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTAAAC
* * *
16281 CCCATAGGTGCAGTCTACTAAACT
66 CCCACACGTGCAGTCTGCTAAACT
16305 AATCAAACAT
Statistics
Matches: 433, Mismatches: 50, Indels: 10
0.88 0.10 0.02
Matches are distributed among these distances:
398 40 0.09
399 217 0.50
400 67 0.15
401 108 0.25
402 1 0.00
ACGTcount: A:0.34, C:0.20, G:0.13, T:0.33
Consensus pattern (399 bp):
CATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTAAAC
CCCACACGTGCAGTCTGCTAAACTCCACTCACGATATATTGTATAATTTTTCATATAAGATTATT
ATAAAATACACAGTAAGCGTAAATTTTGAACTCCATAAGCGGGTTAAGAAGTTGACACATACCCA
TTTCATAATTAATTAAATATTTAATATCAATACATATTCCCTAAGGGGACACATGCCAACCCTTA
AACCCCACACGTCCAGTCTGCTAAACTCCACGAACGATGTATTGCATAATTTTTACTTATAGGGA
TTATTATACAAGTACACTGTCAGTGTAAATTTTGACTACATAAGCAGATTAAGACGTTGACACAT
AACCCATTA
Found at i:16274 original size:199 final size:199
Alignment explanation
Indices: 15415--16304 Score: 1248
Period size: 199 Copynumber: 4.5 Consensus size: 199
15405 AATTGAGCTT
* * * * *
15415 TTTCATAATTAAATAAATATTTAATATTAACACATATTCCCTAAAGAGACACATGTCAACTCTTA
1 TTTCATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA
** * * *
15480 AACCCCGGGCGTGCAGTCTGCTAAACTCCACTGACGGTATATTGTATAATTTTTCTTATA-AGAT
66 AACCCCGCACGTGCAGTCTGCTAAACTCCACTGACGATGTATTGTATAATTTTTCTTATAGGGAT
*
15544 TATTATACAATACACTGTAAGTGTAAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACATA
131 TATTATACAATACACTGTCAGTGTAAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACATA
15609 CCCA
196 CCCA
* * * *
15613 TTTCATAATTAATTCAATATTTAATATCAATACATATTCCCTAAGGGGACACATGCCAACTCTTA
1 TTTCATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA
* * * *
15678 AACCCCACACGTGCAGTCTGCTAAATTCCACGGACGATGTATTGTATATTTTTTACTTATAGGGA
66 AACCCCGCACGTGCAGTCTGCTAAACTCCACTGACGATGTATTGTATAATTTTT-CTTATAGGGA
*
15743 TTATTATACAAGTACACTGTCAGTGTAAATTTTGGACTACATAAGCGGGTTAAGAGGTTGACACA
130 TTATTATACAA-TACACTGTCAGTGTAAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACA
15808 TACCCA
194 TACCCA
*
15814 TTACATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA
1 TTTCATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA
* * * * *
15879 AACCCCCCATGTGCAGTCTGCTAAACTCCATTCACGATGTATTGTATAATTTTTCATATAGGGAT
66 AACCCCGCACGTGCAGTCTGCTAAACTCCACTGACGATGTATTGTATAATTTTTCTTATAGGGAT
* * * * * *
15944 TATTATAAAATACACAGTCAGCGTAAATTTTGAACTCTATAAGCGGGTTAAGAAGTTGACACATA
131 TATTATACAATACACTGTCAGTGTAAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACATA
*
16009 TCTCA
196 -CCCA
*
16014 TTTCATAATTAATTAAATATTTAATATTAATAGATATTCCCTAAGGGGACACATGTCAACCCTTA
1 TTTCATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA
* * * *
16079 AACCCCGCACGTCCAGTCTGCTAAACTCCACTAACTG-TGTATTGCATAATTTTTCTTATA-GTA
66 AACCCCGCACGTGCAGTCTGCTAAACTCCACTGAC-GATGTATTGTATAATTTTTCTTATAGGGA
* * * * *
16142 TTATTATACAATACACTTTCGGTGTAAAATTTT-GACTCCATAAGCAGATTAAGACGTTGACACA
130 TTATTATACAATACACTGTCAGTGT-AAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACA
*
16206 TAACCCG
194 T-ACCCA
*
16213 TTTCATAATTAATTAAATATTTAATATTAATACATATTCTCTAAGGGGACACATGTCAACCCTTA
1 TTTCATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA
* ** * *
16278 CACCCCATAGGTGCAGTCTACTAAACT
66 AACCCCGCACGTGCAGTCTGCTAAACT
16305 AATCAAACAT
Statistics
Matches: 616, Mismatches: 69, Indels: 13
0.88 0.10 0.02
Matches are distributed among these distances:
198 104 0.17
199 190 0.31
200 157 0.25
201 165 0.27
ACGTcount: A:0.34, C:0.19, G:0.13, T:0.33
Consensus pattern (199 bp):
TTTCATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA
AACCCCGCACGTGCAGTCTGCTAAACTCCACTGACGATGTATTGTATAATTTTTCTTATAGGGAT
TATTATACAATACACTGTCAGTGTAAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACATA
CCCA
Found at i:16671 original size:10 final size:10
Alignment explanation
Indices: 16652--16711 Score: 61
Period size: 10 Copynumber: 5.9 Consensus size: 10
16642 TTGTTTTTTA
*
16652 ATTATGAATT
1 ATTATTAATT
16662 ATTATTAATT
1 ATTATTAATT
16672 ATTAATT-ATT
1 ATT-ATTAATT
16682 AATTATT-ATT
1 -ATTATTAATT
16692 AATTATTAATT
1 -ATTATTAATT
*
16703 ATAATTAAT
1 ATTATTAAT
16712 AATAACAATT
Statistics
Matches: 45, Mismatches: 2, Indels: 6
0.85 0.04 0.11
Matches are distributed among these distances:
10 36 0.80
11 9 0.20
ACGTcount: A:0.43, C:0.00, G:0.02, T:0.55
Consensus pattern (10 bp):
ATTATTAATT
Found at i:16671 original size:17 final size:17
Alignment explanation
Indices: 16652--16711 Score: 86
Period size: 17 Copynumber: 3.5 Consensus size: 17
16642 TTGTTTTTTA
*
16652 ATTATGAATTATT-ATT
1 ATTATTAATTATTAATT
16668 AATTATTAATTATTAATT
1 -ATTATTAATTATTAATT
16686 ATTATTAATTATTAATT
1 ATTATTAATTATTAATT
*
16703 ATAATTAAT
1 ATTATTAAT
16712 AATAACAATT
Statistics
Matches: 40, Mismatches: 2, Indels: 2
0.91 0.05 0.05
Matches are distributed among these distances:
17 37 0.93
18 3 0.08
ACGTcount: A:0.43, C:0.00, G:0.02, T:0.55
Consensus pattern (17 bp):
ATTATTAATTATTAATT
Found at i:16677 original size:24 final size:23
Alignment explanation
Indices: 16649--16709 Score: 104
Period size: 24 Copynumber: 2.6 Consensus size: 23
16639 TTTTTGTTTT
16649 TTAATTATGAATTATTATTAATTA
1 TTAATTAT-AATTATTATTAATTA
16673 TTAATTATTAATTATTATTAATTA
1 TTAATTA-TAATTATTATTAATTA
16697 TTAATTATAATTA
1 TTAATTATAATTA
16710 ATAATAACAA
Statistics
Matches: 36, Mismatches: 0, Indels: 3
0.92 0.00 0.08
Matches are distributed among these distances:
23 6 0.17
24 29 0.81
25 1 0.03
ACGTcount: A:0.43, C:0.00, G:0.02, T:0.56
Consensus pattern (23 bp):
TTAATTATAATTATTATTAATTA
Found at i:16716 original size:10 final size:10
Alignment explanation
Indices: 16674--16764 Score: 61
Period size: 10 Copynumber: 9.7 Consensus size: 10
16664 TATTAATTAT
*
16674 TAATTATTAA
1 TAATTAATAA
* *
16684 TTATTATTAA
1 TAATTAATAA
* *
16694 TTATTAATTA
1 TAATTAATAA
16704 TAATTAATAA
1 TAATTAATAA
* *
16714 TAA-CAAT-T
1 TAATTAATAA
16722 TAAATTAATAA
1 T-AATTAATAA
16733 TAA-T--TAA
1 TAATTAATAA
16740 TAATT-A-AA
1 TAATTAATAA
16748 TAATTAATAA
1 TAATTAATAA
16758 TAATTAA
1 TAATTAA
16765 AAAATAAAAA
Statistics
Matches: 65, Mismatches: 9, Indels: 14
0.74 0.10 0.16
Matches are distributed among these distances:
7 6 0.09
8 9 0.14
9 7 0.11
10 42 0.65
11 1 0.02
ACGTcount: A:0.54, C:0.01, G:0.00, T:0.45
Consensus pattern (10 bp):
TAATTAATAA
Found at i:16735 original size:29 final size:25
Alignment explanation
Indices: 16696--16773 Score: 84
Period size: 29 Copynumber: 2.9 Consensus size: 25
16686 ATTATTAATT
*
16696 ATTAATTATAATTAATAATAACAATTTAA
1 ATTAATAATAATTAATAATAA-AA--T-A
*
16725 ATTAATAATAATTAATAATTAAATA
1 ATTAATAATAATTAATAATAAAATA
*
16750 ATTAATAATAATTAAAAAATAAAA
1 ATTAATAATAATT-AATAATAAAA
16774 AAAATAATTG
Statistics
Matches: 44, Mismatches: 4, Indels: 5
0.83 0.08 0.09
Matches are distributed among these distances:
25 14 0.32
26 9 0.20
28 2 0.05
29 19 0.43
ACGTcount: A:0.62, C:0.01, G:0.00, T:0.37
Consensus pattern (25 bp):
ATTAATAATAATTAATAATAAAATA
Found at i:16736 original size:22 final size:21
Alignment explanation
Indices: 16703--16760 Score: 73
Period size: 22 Copynumber: 2.7 Consensus size: 21
16693 ATTATTAATT
16703 ATAATTAATAATAACAATTTAA
1 ATAATTAATAATAACAA-TTAA
*
16725 ATTAA-TAATAATTAATAATTAA
1 A-TAATTAATAA-TAACAATTAA
16747 ATAATTAATAATAA
1 ATAATTAATAATAA
16761 TTAAAAAATA
Statistics
Matches: 32, Mismatches: 1, Indels: 7
0.80 0.03 0.17
Matches are distributed among these distances:
21 6 0.19
22 18 0.56
23 8 0.25
ACGTcount: A:0.60, C:0.02, G:0.00, T:0.38
Consensus pattern (21 bp):
ATAATTAATAATAACAATTAA
Found at i:16742 original size:7 final size:7
Alignment explanation
Indices: 16665--16758 Score: 77
Period size: 7 Copynumber: 13.3 Consensus size: 7
16655 ATGAATTATT
*
16665 ATTAATT
1 ATTAATA
*
16672 ATTAATT
1 ATTAATA
*
16679 ATTAATT
1 ATTAATA
*
16686 ATTATTA
1 ATTAATA
*
16693 ATTATTA
1 ATTAATA
16700 ATT-ATA
1 ATTAATA
16706 ATTAATA
1 ATTAATA
*
16713 A-TAACA
1 ATTAATA
16719 ATTTAAATTA
1 A-TT-AA-TA
16729 A-TAATA
1 ATTAATA
16735 ATTAATA
1 ATTAATA
16742 ATTAAATA
1 ATT-AATA
16750 ATTAATA
1 ATTAATA
16757 AT
1 AT
16759 AATTAAAAAA
Statistics
Matches: 75, Mismatches: 5, Indels: 14
0.80 0.05 0.15
Matches are distributed among these distances:
6 13 0.17
7 49 0.65
8 9 0.12
9 2 0.03
10 2 0.03
ACGTcount: A:0.52, C:0.01, G:0.00, T:0.47
Consensus pattern (7 bp):
ATTAATA
Found at i:16772 original size:25 final size:25
Alignment explanation
Indices: 16724--16772 Score: 80
Period size: 25 Copynumber: 2.0 Consensus size: 25
16714 TAACAATTTA
* *
16724 AATTAATAATAATTAATAATTAAAT
1 AATTAATAATAATTAAAAAATAAAT
16749 AATTAATAATAATTAAAAAATAAA
1 AATTAATAATAATTAAAAAATAAA
16773 AAAAATAATT
Statistics
Matches: 22, Mismatches: 2, Indels: 0
0.92 0.08 0.00
Matches are distributed among these distances:
25 22 1.00
ACGTcount: A:0.65, C:0.00, G:0.00, T:0.35
Consensus pattern (25 bp):
AATTAATAATAATTAAAAAATAAAT
Found at i:16854 original size:13 final size:13
Alignment explanation
Indices: 16838--16862 Score: 50
Period size: 13 Copynumber: 1.9 Consensus size: 13
16828 TGACAGAATT
16838 TTAGATCTACAAC
1 TTAGATCTACAAC
16851 TTAGATCTACAA
1 TTAGATCTACAA
16863 AATCCGACAT
Statistics
Matches: 12, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
13 12 1.00
ACGTcount: A:0.40, C:0.20, G:0.08, T:0.32
Consensus pattern (13 bp):
TTAGATCTACAAC
Found at i:16884 original size:12 final size:12
Alignment explanation
Indices: 16867--16891 Score: 50
Period size: 12 Copynumber: 2.1 Consensus size: 12
16857 CTACAAAATC
16867 CGACATGATTTT
1 CGACATGATTTT
16879 CGACATGATTTT
1 CGACATGATTTT
16891 C
1 C
16892 TTCAAGATTG
Statistics
Matches: 13, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
12 13 1.00
ACGTcount: A:0.24, C:0.20, G:0.16, T:0.40
Consensus pattern (12 bp):
CGACATGATTTT
Done.