Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: AWWV01006959.1 Corchorus capsularis cultivar CVL-1 contig06980, whole genome shotgun sequence
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 47379
ACGTcount: A:0.31, C:0.19, G:0.17, T:0.34
Found at i:7461 original size:20 final size:21
Alignment explanation
Indices: 7431--7469 Score: 62
Period size: 20 Copynumber: 1.9 Consensus size: 21
7421 TTAAAAGAAA
7431 AAAAAAGGAAAAACAAAATGG
1 AAAAAAGGAAAAACAAAATGG
*
7452 AAAAAA-GAAAAAGAAAAT
1 AAAAAAGGAAAAACAAAAT
7470 AAAAGGAGAT
Statistics
Matches: 17, Mismatches: 1, Indels: 1
0.89 0.05 0.05
Matches are distributed among these distances:
20 11 0.65
21 6 0.35
ACGTcount: A:0.77, C:0.03, G:0.15, T:0.05
Consensus pattern (21 bp):
AAAAAAGGAAAAACAAAATGG
Found at i:16859 original size:41 final size:41
Alignment explanation
Indices: 16802--16919 Score: 236
Period size: 41 Copynumber: 2.9 Consensus size: 41
16792 GCCTTAAGCC
16802 CTTAAGATCACAAGATTCACAAACAATTAAGCAATTGAACA
1 CTTAAGATCACAAGATTCACAAACAATTAAGCAATTGAACA
16843 CTTAAGATCACAAGATTCACAAACAATTAAGCAATTGAACA
1 CTTAAGATCACAAGATTCACAAACAATTAAGCAATTGAACA
16884 CTTAAGATCACAAGATTCACAAACAATTAAGCAATT
1 CTTAAGATCACAAGATTCACAAACAATTAAGCAATT
16920 ACAATCTAAC
Statistics
Matches: 77, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
41 77 1.00
ACGTcount: A:0.48, C:0.19, G:0.09, T:0.23
Consensus pattern (41 bp):
CTTAAGATCACAAGATTCACAAACAATTAAGCAATTGAACA
Found at i:22026 original size:35 final size:35
Alignment explanation
Indices: 21977--22311 Score: 345
Period size: 35 Copynumber: 9.7 Consensus size: 35
21967 CATAATAAGC
*
21977 AACTTAATTCAGGGTAATTAAGTCAGTCAGTAATT
1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT
* * *
22012 AAGTTAATTCAGGGTAATTAAGTAATTCAGTTATT
1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT
* * * *
22047 AATTTAATTCAGGGTAATTAAGTAATTTAGTAATC
1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT
*
22082 AACTTAATTCAGGGTAATTAAGT---T-AGTAAGT
1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT
* * * *
22113 AGCTTAATGCAGGGTAATTAAGTAAGTCAGTTAGT
1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT
* * * *
22148 AACTTAATTTAGGGTAATTAAGTGAGTCAGTTAGT
1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT
* ** * **
22183 AACTTAACTCAGGGTAATTTTGCAAGTCAGTAACC
1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT
** *
22218 AACTTAATTCAGGGTAATTAAGTGGGTCAGTAATC
1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT
* * * * *
22253 AACTTAAAATCAGGGTAATCAAGTAAGTCATTGATC
1 AACTT-AATTCAGGGTAATTAAGTAAGTCAGTAATT
*
22289 GACTTAATTCAGGGTAATTAAGT
1 AACTTAATTCAGGGTAATTAAGT
22312 TTAGTAAGAA
Statistics
Matches: 252, Mismatches: 43, Indels: 10
0.83 0.14 0.03
Matches are distributed among these distances:
31 26 0.10
32 1 0.00
34 1 0.00
35 196 0.78
36 28 0.11
ACGTcount: A:0.37, C:0.10, G:0.19, T:0.34
Consensus pattern (35 bp):
AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT
Found at i:22056 original size:17 final size:16
Alignment explanation
Indices: 21980--22093 Score: 75
Period size: 16 Copynumber: 6.6 Consensus size: 16
21970 AATAAGCAAC
21980 TTAATTCAGGGTAATTAA
1 TTAATTCA--GTAATTAA
* * *
21998 GTCAGTCAGTAATTAA
1 TTAATTCAGTAATTAA
22014 GTTAATTCAGGGTAATTAA
1 -TTAATTCA--GTAATTAA
* *
22033 GTAATTCAGTTATTAA
1 TTAATTCAGTAATTAA
22049 TTTAATTCAGGGTAATTAA
1 -TTAATTCA--GTAATTAA
* * *
22068 GTAATTTAGTAATCAA
1 TTAATTCAGTAATTAA
22084 CTTAATTCAG
1 -TTAATTCAG
22094 GGTAATTAAG
Statistics
Matches: 74, Mismatches: 15, Indels: 15
0.71 0.14 0.14
Matches are distributed among these distances:
16 22 0.30
17 19 0.26
18 18 0.24
19 15 0.20
ACGTcount: A:0.38, C:0.08, G:0.16, T:0.39
Consensus pattern (16 bp):
TTAATTCAGTAATTAA
Found at i:22223 original size:136 final size:136
Alignment explanation
Indices: 21979--22311 Score: 375
Period size: 136 Copynumber: 2.4 Consensus size: 136
21969 TAATAAGCAA
* * * * *
21979 CTTAATTCAGGGTAATTAAGTCAGTCAGTAATTAAGTTAATTCAGGGTAATTAAGTAATTCAGTT
1 CTTAATGCAGGGTAATTAAGTAAGTCAGTAAGTAACTTAATTCAGGGTAATTAAGTAAGTCAGTT
* * * * * * *
22044 ATTAATTTAATTCAGGGTAATTAAGTAATTTAGTAATCAACTTAATTCAGGGTAATTAAGTTAGT
66 AGTAACTTAACTCAGGGTAATTAAGCAAGTCAGTAACCAACTTAATTCAGGGTAATTAAGTTAGT
22109 AAGTAG
131 AAGTAG
* * *
22115 CTTAATGCAGGGTAATTAAGTAAGTCAGTTAGTAACTTAATTTAGGGTAATTAAGTGAGTCAGTT
1 CTTAATGCAGGGTAATTAAGTAAGTCAGTAAGTAACTTAATTCAGGGTAATTAAGTAAGTCAGTT
**
22180 AGTAACTTAACTCAGGGTAATTTTGCAAGTCAGTAACCAACTTAATTCAGGGTAATTAAGTGGGT
66 AGTAACTTAACTCAGGGTAATTAAGCAAGTCAGTAACCAACTTAATTCAGGGTAATTAAGT---T
*
22245 CAGTAA-TCAA
128 -AGTAAGT-AG
* * * *
22255 CTTAAAAT-CAGGGTAATCAAGTAAGTCATTGA-TCGACTTAATTCAGGGTAATTAAGT
1 CTT--AATGCAGGGTAATTAAGTAAGTCAGTAAGT-AACTTAATTCAGGGTAATTAAGT
22312 TTAGTAAGAA
Statistics
Matches: 166, Mismatches: 23, Indels: 11
0.83 0.12 0.05
Matches are distributed among these distances:
136 109 0.66
139 2 0.01
140 10 0.06
141 42 0.25
142 3 0.02
ACGTcount: A:0.36, C:0.10, G:0.20, T:0.34
Consensus pattern (136 bp):
CTTAATGCAGGGTAATTAAGTAAGTCAGTAAGTAACTTAATTCAGGGTAATTAAGTAAGTCAGTT
AGTAACTTAACTCAGGGTAATTAAGCAAGTCAGTAACCAACTTAATTCAGGGTAATTAAGTTAGT
AAGTAG
Found at i:24483 original size:141 final size:140
Alignment explanation
Indices: 24229--24535 Score: 483
Period size: 141 Copynumber: 2.2 Consensus size: 140
24219 TGGATTATCT
* * *
24229 AATTACAACTTTAATTGGCAAAATTAATTAACAACATGTTCAATAATTTATTTTGTTGGTAACAT
1 AATTACAACTTTGATTGACAAAATTAACTAACAACATGTTCAATAATTTATTTTGTTGGTAACAT
* *
24294 AATTACTAATTGATTTATTTATTTATGGTAATCTTTTTTATAGCGATTTTATGGTAAAATTATAT
66 AAATACTAATTGATTTATTTATTTATGGTAATCTTTTTTATAGCGA-TTTATGGTAAAATTAAAT
24359 AATCATCAATC
130 AATCATCAATC
* *
24370 AATTACAACTTTGATTGACAAAATTAACTAACGACATGTTCAATAATTTATTTTTTTGGTAACAT
1 AATTACAACTTTGATTGACAAAATTAACTAACAACATGTTCAATAATTTATTTTGTTGGTAACAT
* *
24435 AAATACTAATTGATTTATTTATTTATGTTAA-CTTTTTTTGTAGCGATTTATGGTAAAATTAAAT
66 AAATACTAATTGATTTATTTATTTATGGTAATC-TTTTTTATAGCGATTTATGGTAAAATTAAAT
*
24499 AATTATCAATC
130 AATCATCAATC
24510 AATTACAACTTTGATTGGA-AAAATTA
1 AATTACAACTTTGATT-GACAAAATTA
24536 GACATATAAG
Statistics
Matches: 154, Mismatches: 10, Indels: 5
0.91 0.06 0.03
Matches are distributed among these distances:
140 51 0.33
141 103 0.67
ACGTcount: A:0.38, C:0.09, G:0.09, T:0.44
Consensus pattern (140 bp):
AATTACAACTTTGATTGACAAAATTAACTAACAACATGTTCAATAATTTATTTTGTTGGTAACAT
AAATACTAATTGATTTATTTATTTATGGTAATCTTTTTTATAGCGATTTATGGTAAAATTAAATA
ATCATCAATC
Found at i:25506 original size:13 final size:13
Alignment explanation
Indices: 25488--25512 Score: 50
Period size: 13 Copynumber: 1.9 Consensus size: 13
25478 AAATGTTTTA
25488 TTGTATTAGCAAG
1 TTGTATTAGCAAG
25501 TTGTATTAGCAA
1 TTGTATTAGCAA
25513 TGTCCTTATC
Statistics
Matches: 12, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
13 12 1.00
ACGTcount: A:0.32, C:0.08, G:0.20, T:0.40
Consensus pattern (13 bp):
TTGTATTAGCAAG
Found at i:27747 original size:135 final size:137
Alignment explanation
Indices: 27482--27730 Score: 328
Period size: 135 Copynumber: 1.8 Consensus size: 137
27472 AATTTTTAAG
* * *
27482 TTTTGCTAATTAATATATTCTATAAGTATGATTCCAAATACTTTTCAATTAGTTGATTTAATCTC
1 TTTTGCTAATTAATATATTCTATAAATATGATTCCAAATACTTTTCAATTAGTCGATTTAATCCC
* * *
27547 TCAATCATTTGATTCTATGCAATTTAATCCTTCACCATTTTTCTTTTGTCCTTTTTAATAATTCT
66 TCAAGCATTTGATTCTATGCAATTTAATCCTTCACCATTTTTCTTATATCCTTTTTAATAATTCT
27612 TCTTCAA
131 TCTTCAA
* * *
27619 TTTTGCTCATTAA-A-ATTCTATAAATATGA-TCTCAAATACTTTTCTATTCGTCGA-TTAATTC
1 TTTTGCTAATTAATATATTCTATAAATATGATTC-CAAATACTTTTCAATTAGTCGATTTAA-TC
* * *
27680 CCTCAAGCATTTGATTCTATGCAA-TTAGTGCTTCACCTTTATTTCTTATAT
64 CCTCAAGCATTTGATTCTATGCAATTTAATCCTTCACCATT-TTTCTTATAT
27731 TTTTTTTTAT
Statistics
Matches: 97, Mismatches: 12, Indels: 8
0.83 0.10 0.07
Matches are distributed among these distances:
134 19 0.20
135 65 0.67
136 1 0.01
137 12 0.12
ACGTcount: A:0.28, C:0.18, G:0.07, T:0.48
Consensus pattern (137 bp):
TTTTGCTAATTAATATATTCTATAAATATGATTCCAAATACTTTTCAATTAGTCGATTTAATCCC
TCAAGCATTTGATTCTATGCAATTTAATCCTTCACCATTTTTCTTATATCCTTTTTAATAATTCT
TCTTCAA
Found at i:28082 original size:1 final size:1
Alignment explanation
Indices: 28076--28105 Score: 60
Period size: 1 Copynumber: 30.0 Consensus size: 1
28066 CTAACATCAC
28076 TTTTTTTTTTTTTTTTTTTTTTTTTTTTTT
1 TTTTTTTTTTTTTTTTTTTTTTTTTTTTTT
28106 GGTGTAGTTT
Statistics
Matches: 29, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
1 29 1.00
ACGTcount: A:0.00, C:0.00, G:0.00, T:1.00
Consensus pattern (1 bp):
T
Found at i:36317 original size:2 final size:2
Alignment explanation
Indices: 36310--36349 Score: 66
Period size: 2 Copynumber: 21.0 Consensus size: 2
36300 GAAATTTGCT
36310 TA TA TA TA TA TA TA -A TA TA TA TA TA TA TA TA -A TA TA TA TA
1 TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA
36350 ATTTCATTTG
Statistics
Matches: 36, Mismatches: 0, Indels: 4
0.90 0.00 0.10
Matches are distributed among these distances:
1 2 0.06
2 34 0.94
ACGTcount: A:0.53, C:0.00, G:0.00, T:0.47
Consensus pattern (2 bp):
TA
Found at i:36330 original size:15 final size:14
Alignment explanation
Indices: 36310--36349 Score: 66
Period size: 13 Copynumber: 3.0 Consensus size: 14
36300 GAAATTTGCT
36310 TATATATATATATA
1 TATATATATATATA
36324 -ATATATATATATA
1 TATATATATATATA
36337 TATA-ATATATATA
1 TATATATATATATA
36350 ATTTCATTTG
Statistics
Matches: 25, Mismatches: 0, Indels: 3
0.89 0.00 0.11
Matches are distributed among these distances:
13 22 0.88
14 3 0.12
ACGTcount: A:0.53, C:0.00, G:0.00, T:0.47
Consensus pattern (14 bp):
TATATATATATATA
Found at i:36332 original size:17 final size:17
Alignment explanation
Indices: 36310--36349 Score: 80
Period size: 17 Copynumber: 2.4 Consensus size: 17
36300 GAAATTTGCT
36310 TATATATATATATAATA
1 TATATATATATATAATA
36327 TATATATATATATAATA
1 TATATATATATATAATA
36344 TATATA
1 TATATA
36350 ATTTCATTTG
Statistics
Matches: 23, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
17 23 1.00
ACGTcount: A:0.53, C:0.00, G:0.00, T:0.47
Consensus pattern (17 bp):
TATATATATATATAATA
Done.