Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: AWUE01010130.1 Corchorus olitorius cultivar O-4 contig10162, whole genome shotgun sequence
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 2646
ACGTcount: A:0.35, C:0.14, G:0.18, T:0.33
Found at i:1282 original size:645 final size:641
Alignment explanation
Indices: 6--1559 Score: 2123
Period size: 645 Copynumber: 2.4 Consensus size: 641
1 AATCG
* *
6 AAATTTTTTTTTCTGAATCTTTTGCCACAATACTTAGAATAAATATACAATTCAATGCCAAAAAG
1 AAATTTTTTTTTCTGAATCTTTTGCCACAATACTCAGAA-AAATATA-AATTCAACGCCAAAAAG
* *
71 ATTGACGAGTTTTTCACGCTTCTAATATCATTTTTCCATTTTTTAGGAATT-ATTCTCTATTTAA
64 ATTGACGGGCTTTTCACGCTTCTAATATCATTTTTCCA-TTTTTAGGAATTAATT-TCTATTTAA
* *
135 ATCGAAACAAGATTCATATGCTCGTAAAAACAAATCCTTATATCCAATGTGGCTGGGATTTGGAT
127 ATCGAAATAAGATTCAGATGCTCGTAAAAACAAATCCTTATATCCAATGTGGCTGGGATTTGGAT
* * *
200 AGAAGAATATAGATATTTCAAGAAGACTTTACGCCAAAACTCATGCAAAACTGAGTCGGGGATCC
192 AGAAGAATATAGATATTTCAAGAAGTCTTTACGCCAAAAATCATGCAAAACTGAGTCGGGGACCC
* * *
265 GGAACGTGTTTTTAACAAAAAACAGTGATGGTCGATGTCGGCTAAAATTTTGTAAAAACTGACCC
257 GGAACGCGTTTTTAACAAAAAACCGTGAT-GTCGATGTCAGCTAAAATTTTGTAAAAACTGACCC
*
330 AAAAAATTTATCCTCAATTTTTTTGCCACAATAGTCAGGAACAATATATAATTCAATGCAAAAAA
321 AAAAAATTTATCCTCAATTTTTTTGCCACAATAGTCAGGAACAATATATAATTAAATGCAAAAAA
395 AAAATGAAGGGTTTTTCACGATTCTAATATCGTTTTTCCATTTTTTCAGTTTATTACAAAATAAA
386 AAAATGAAGGGTTTTTCACGATTCTAATATCGTTTTTCCATTTTTTCAGTTTATTACAAAATAAA
* * *
460 TCGAAAAAAAATTTAGATGCTCGTAAAAACTATCCCTTAACTCAAATGTAGCTGAGACATGGTTA
451 GCGAAAAAAAATTTAGATGCTCATAAAAAC-ATCCCTTAAATCAAATGTAGCTGAGACATGGTTA
* *
525 GATGAATATAGATATTTCAAGGAGTCTTTTTGCCAAAAATATTTAAAACGAGCTGGGGCCGCGAA
515 GATGAATATAGATATTACAAGGAGTCTTTTTGCCAAAAATATTCAAAACGAGCTGGGGCCGCGAA
*
590 ACGCGTTTTTAGCCCAAAAACCGTGATGGTTAGTACACAATTTAGGCTAAAAACTGAGTCAA
580 ACACGTTTTTAGCCCAAAAACCGTGATGGTTAGTACACAATTTAGGCTAAAAACTGAGTCAA
*
652 AAATTGTTTTTTCTGAAATCTTTTGCCACAATACTCAGAAAAGATATATAATTCAACGCCAAAAA
1 AAATTTTTTTTTCTG-AATCTTTTGCCACAATACTCAGAAAA-ATATA-AATTCAACGCCAAAAA
* *
717 GATTGACGGGCTTTTCATGCTTCTAATATCATTTTTCCA-TTTGAGGAATTAATTTCTATTTAAA
63 GATTGACGGGCTTTTCACGCTTCTAATATCATTTTTCCATTTTTAGGAATTAATTTCTATTTAAA
* *
781 TCGAAATAAGATTCAGATGCTCGTAAAAACAAATCCTTATATCCAATGTGACTGGGATTTGGATC
128 TCGAAATAAGATTCAGATGCTCGTAAAAACAAATCCTTATATCCAATGTGGCTGGGATTTGGATA
* * *
846 GAAGAATATAGATATTTTAAGAAGTCTTTACGCCAAAAATCATACAAAACTGAGCCGGGGACCCG
193 GAAGAATATAGATATTTCAAGAAGTCTTTACGCCAAAAATCATGCAAAACTGAGTCGGGGACCCG
*
911 GAACGCGTTTTTAACAAAAAAACCGTGATGTACACGATTTCAGCTAAAATTTTGTAAAAACTGAC
258 GAACGCGTTTTTAAC-AAAAAACCGTGATGT---CGATGTCAGCTAAAATTTTGTAAAAACTGAC
* *
976 CCAAAAAATTTATTCTCAATTTTTTTGCCACAATAGTCAGGAACAATATATGATTAAATGC-AAA
319 CCAAAAAATTTATCCTCAATTTTTTTGCCACAATAGTCAGGAACAATATATAATTAAATGCAAAA
* * * *
1040 AAAAAATGAAGGGTTTTTCACGCTTCTAATATCGTTTTTCCATTTTTTCAGTTTATTTCTAATTA
384 AAAAAATGAAGGGTTTTTCACGATTCTAATATCGTTTTTCCATTTTTTCAGTTTATTACAAAATA
* * * * * *
1105 AAGCGAAACAAGATTTAGATGCTCATAAACAA-A-CCCTTAAATCAATTGTGGTTGAGACTTGGT
449 AAGCGAAAAAAAATTTAGATGCTCATAAA-AACATCCCTTAAATCAAATGTAGCTGAGACATGGT
*
1168 TAGATGAATATAGATATTACAAGGAGTCTTTTTGCCAAAAATATTCAAAACTGAGCTGGGGCCTC
513 TAGATGAATATAGATATTACAAGGAGTCTTTTTGCCAAAAATATTCAAAAC-GAGCTGGGGCCGC
** * *
1233 GAAACACGTTTTTAGCCCCCAAACGGTGATGGTTAGTA-ACGAA-TTAGGCTAAAAACTGAGTCG
577 GAAACACGTTTTTAGCCCAAAAACCGTGATGGTTAGTACAC-AATTTAGGCTAAAAACTGAGTCA
1296 A
641 A
** *
1297 ATTTTTTTTTTTCTGAAT-TTTT-------TGC-C------------A--CAACG--AAAAAGAT
1 AAATTTTTTTTTCTGAATCTTTTGCCACAATACTCAGAAAAATATAAATTCAACGCCAAAAAGAT
* *
1337 TGACGGGCTTTTCACGCTTCTAATATCATTTTTCAATTTTTTCGGAATTAATTTCTATTTAAATC
66 TGACGGGCTTTTCACGCTTCTAATATCATTTTTCCA-TTTTTAGGAATTAATTTCTATTTAAATC
* * * * * * *
1402 GAAATAAGATTCAGATGCTCATAAAAACAAATCGTTAAATCGAATATGGCTGGGATTTGGTTTGA
130 GAAATAAGATTCAGATGCTCGTAAAAACAAATCCTTATATCCAATGTGGCTGGGATTTGGATAGA
* * * *
1467 TA-AATATAGATATTTCAAGGAGTCTTTACAACAGAAAAAT-ATGCAAAACTGAGTCGGGGAGCC
195 -AGAATATAGATATTTCAAGAAGTCTTTAC-GC-CAAAAATCATGCAAAACTGAGTCGGGGACCC
* *
1530 GGAACACGTTTTTAGCAAAAAACCGTGATG
257 GGAACGCGTTTTTAACAAAAAACCGTGATG
1560 GTTAGTACAC
Statistics
Matches: 822, Mismatches: 71, Indels: 57
0.87 0.07 0.06
Matches are distributed among these distances:
617 42 0.05
619 126 0.15
620 36 0.04
621 7 0.01
635 1 0.00
636 2 0.00
643 4 0.00
644 3 0.00
645 264 0.32
646 80 0.10
647 168 0.20
648 89 0.11
ACGTcount: A:0.36, C:0.16, G:0.16, T:0.32
Consensus pattern (641 bp):
AAATTTTTTTTTCTGAATCTTTTGCCACAATACTCAGAAAAATATAAATTCAACGCCAAAAAGAT
TGACGGGCTTTTCACGCTTCTAATATCATTTTTCCATTTTTAGGAATTAATTTCTATTTAAATCG
AAATAAGATTCAGATGCTCGTAAAAACAAATCCTTATATCCAATGTGGCTGGGATTTGGATAGAA
GAATATAGATATTTCAAGAAGTCTTTACGCCAAAAATCATGCAAAACTGAGTCGGGGACCCGGAA
CGCGTTTTTAACAAAAAACCGTGATGTCGATGTCAGCTAAAATTTTGTAAAAACTGACCCAAAAA
ATTTATCCTCAATTTTTTTGCCACAATAGTCAGGAACAATATATAATTAAATGCAAAAAAAAAAT
GAAGGGTTTTTCACGATTCTAATATCGTTTTTCCATTTTTTCAGTTTATTACAAAATAAAGCGAA
AAAAAATTTAGATGCTCATAAAAACATCCCTTAAATCAAATGTAGCTGAGACATGGTTAGATGAA
TATAGATATTACAAGGAGTCTTTTTGCCAAAAATATTCAAAACGAGCTGGGGCCGCGAAACACGT
TTTTAGCCCAAAAACCGTGATGGTTAGTACACAATTTAGGCTAAAAACTGAGTCAA
Found at i:1988 original size:7 final size:7
Alignment explanation
Indices: 1976--2264 Score: 210
Period size: 7 Copynumber: 41.9 Consensus size: 7
1966 AAAAAATGAA
1976 GGTTTAG
1 GGTTTAG
1983 GGTTTAG
1 GGTTTAG
1990 GG-TTAG
1 GGTTTAG
1996 GGTTTAGG
1 GGTTTA-G
2004 GGTTTAG
1 GGTTTAG
*
2011 TGTTTAG
1 GGTTTAG
2018 GG-TTAG
1 GGTTTAG
* *
2024 GTTTTAA
1 GGTTTAG
2031 GGTTTAG
1 GGTTTAG
2038 GGTTTTA-
1 GG-TTTAG
2045 GG-TTAG
1 GGTTTAG
2051 GGTTTAG
1 GGTTTAG
2058 GG-TTAG
1 GGTTTAG
*
2064 GGTTTATT
1 GGTTTA-G
**
2072 TCTAATTAAATCG
1 GGT--TT--A--G
*****
2085 AAACAAG
1 GGTTTAG
2092 GGTTTAG
1 GGTTTAG
2099 GGTTTAG
1 GGTTTAG
*
2106 GG-TTAT
1 GGTTTAG
*
2112 GGTTTAT
1 GGTTTAG
2119 GG-TTAG
1 GGTTTAG
2125 GG-TTAG
1 GGTTTAG
*
2131 GGGTTAG
1 GGTTTAG
*
2138 GGTTTAT
1 GGTTTAG
*
2145 GTTTTAG
1 GGTTTAG
2152 GGTTTAG
1 GGTTTAG
2159 GG-TTAG
1 GGTTTAG
*
2165 GGTTTAA
1 GGTTTAG
2172 GG-TTAG
1 GGTTTAG
2178 GGTTTATG
1 GGTTTA-G
2186 GGTTTAG
1 GGTTTAG
2193 GGTTTAG
1 GGTTTAG
2200 GG-TTAG
1 GGTTTAG
*
2206 GGTTTAA
1 GGTTTAG
2213 GG-TTAG
1 GGTTTAG
2219 GGTTTAG
1 GGTTTAG
*
2226 TGTTTA-
1 GGTTTAG
2232 GGTTTAG
1 GGTTTAG
2239 GGTTTAG
1 GGTTTAG
*
2246 GGTTGAG
1 GGTTTAG
2253 GG-TTAG
1 GGTTTAG
2259 GGTTTA
1 GGTTTA
2265 TTTCTAATTA
Statistics
Matches: 224, Mismatches: 36, Indels: 44
0.74 0.12 0.14
Matches are distributed among these distances:
5 3 0.01
6 67 0.30
7 131 0.58
8 19 0.08
9 1 0.00
10 2 0.01
12 1 0.00
ACGTcount: A:0.18, C:0.01, G:0.38, T:0.42
Consensus pattern (7 bp):
GGTTTAG
Found at i:1997 original size:13 final size:13
Alignment explanation
Indices: 1979--2264 Score: 209
Period size: 13 Copynumber: 20.8 Consensus size: 13
1969 AAATGAAGGT
1979 TTAGGGTTTAGGG
1 TTAGGGTTTAGGG
1992 TTAGGGTTTAGGGG
1 TTAGGGTTTA-GGG
*
2006 TTTAGTGTTTAGGG
1 -TTAGGGTTTAGGG
* *
2020 TTAGGTTTTAAGGT
1 TTAGGGTTT-AGGG
2034 TTAGGGTTTTA-GG
1 TTAGGG-TTTAGGG
2047 TTAGGGTTTAGGG
1 TTAGGGTTTAGGG
***
2060 TTAGGGTTTATTTCTAA
1 TTAGGGTTTA----GGG
*****
2077 TTAAATCGAAACAAGGG
1 TT--A--GGGTTTAGGG
2094 TTTAGGGTTTAGGG
1 -TTAGGGTTTAGGG
* *
2108 TTATGGTTTATGG
1 TTAGGGTTTAGGG
2121 TTAGGG-TTAGGGG
1 TTAGGGTTTA-GGG
**
2134 TTAGGGTTTATGTT
1 TTAGGGTTTA-GGG
2148 TTAGGGTTTAGGG
1 TTAGGGTTTAGGG
*
2161 TTAGGGTTTAAGG
1 TTAGGGTTTAGGG
2174 TTAGGGTTTATGGG
1 TTAGGGTTTA-GGG
2188 TTTAGGGTTTAGGG
1 -TTAGGGTTTAGGG
*
2202 TTAGGGTTTAAGG
1 TTAGGGTTTAGGG
*
2215 TTAGGGTTTAGTGT
1 TTAGGGTTTAG-GG
2229 TTA-GGTTTAGGG
1 TTAGGGTTTAGGG
*
2241 TTTAGGGTTGAGGG
1 -TTAGGGTTTAGGG
2255 TTAGGGTTTA
1 TTAGGGTTTA
2265 TTTCTAATTA
Statistics
Matches: 213, Mismatches: 39, Indels: 42
0.72 0.13 0.14
Matches are distributed among these distances:
12 8 0.04
13 124 0.58
14 51 0.24
15 22 0.10
16 1 0.00
17 2 0.01
18 2 0.01
19 1 0.00
21 2 0.01
ACGTcount: A:0.19, C:0.01, G:0.38, T:0.42
Consensus pattern (13 bp):
TTAGGGTTTAGGG
Found at i:2001 original size:20 final size:20
Alignment explanation
Indices: 1979--2264 Score: 177
Period size: 20 Copynumber: 13.5 Consensus size: 20
1969 AAATGAAGGT
1979 TTAGGGTTTAGGG-TTAGGG
1 TTAGGGTTTAGGGTTTAGGG
*
1998 TTTAGGGGTTTAGTGTTTAGGG
1 -TTA-GGGTTTAGGGTTTAGGG
* *
2020 TTAGGTTTTAAGGTTTAGGG
1 TTAGGGTTTAGGGTTTAGGG
2040 TTTTA-GG-TTAGGGTTTAGGG
1 --TTAGGGTTTAGGGTTTAGGG
*** **
2060 TTAGGGTTTATTTCTAATTAAATCGAAA
1 TTAGGGTTTA-GGGT--TT--A--G-GG
**
2088 CAAGGGTTTAGGGTTTAGGG
1 TTAGGGTTTAGGGTTTAGGG
* *
2108 TTATGGTTTATGGTTAGGGTTAGGGG
1 TTAGGGTTTA--G---GGTTTA-GGG
* *
2134 TTAGGGTTTATGTTTTAGGG
1 TTAGGGTTTAGGGTTTAGGG
*
2154 TTTAGGG-TTAGGGTTTAAGG
1 -TTAGGGTTTAGGGTTTAGGG
2174 TTAGGGTTTATGGGTTTAGGG
1 TTAGGGTTTA-GGGTTTAGGG
*
2195 TTTAGGG-TTAGGGTTTAAGG
1 -TTAGGGTTTAGGGTTTAGGG
* *
2215 TTAGGGTTTAGTGTTTAGGT
1 TTAGGGTTTAGGGTTTAGGG
*
2235 TTAGGGTTTAGGGTTGAGGG
1 TTAGGGTTTAGGGTTTAGGG
2255 TTAGGGTTTA
1 TTAGGGTTTA
2265 TTTCTAATTA
Statistics
Matches: 204, Mismatches: 37, Indels: 50
0.70 0.13 0.17
Matches are distributed among these distances:
18 3 0.01
19 14 0.07
20 101 0.50
21 37 0.18
22 16 0.08
23 3 0.01
25 8 0.04
26 12 0.06
27 2 0.01
28 8 0.04
ACGTcount: A:0.19, C:0.01, G:0.38, T:0.42
Consensus pattern (20 bp):
TTAGGGTTTAGGGTTTAGGG
Done.