Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: AWWV01014611.1 Corchorus capsularis cultivar CVL-1 contig14632, whole genome shotgun sequence
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 24079
ACGTcount: A:0.33, C:0.18, G:0.18, T:0.31
Found at i:705 original size:107 final size:107
Alignment explanation
Indices: 478--720 Score: 249
Period size: 107 Copynumber: 2.3 Consensus size: 107
468 TCAATGCTTC
* ** *
478 AATGACCCAGGGTGGTCTATTCTTCAGTTCAGTTCAGAATGATCGAGGGTGGTCATTCTTCAGCT
1 AATGATCCAGGGTGGTC-ATTCTTCAGTTCAGTTCAGAATGATCGAGGGAAGTCATCCTTCAGCT
* *
543 TATTTCAGTTAACCCAGGGCGGTCTTTCTCCAGTTTGAGTCGG
65 TATTTCAGTTAACCCAGGGCGGTCATTCTCCAGTTTCAGTCGG
* * * * * * *
586 AACGATCGAGGGTGGTCGTTCTTTAGTTCAGTTCGGAATGATTGAGGGAAGTCGTCCTTCAGTCT
1 AATGATCCAGGGTGGTCATTCTTCAGTTCAGTTCAGAATGATCGAGGGAAGTCATCCTTCAG-CT
* * ** *
651 GT-TTT-AGTTGAACCCCGGGTGGTCATTCTTTA-TTTCAGTTGG
65 -TATTTCAGTT-AACCCAGGGCGGTCATTCTCCAGTTTCAGTCGG
* *
693 GATGATCCAGGGTGGTCCTTCTTCAGTT
1 AATGATCCAGGGTGGTCATTCTTCAGTT
721 ACTTATTTTA
Statistics
Matches: 109, Mismatches: 23, Indels: 7
0.78 0.17 0.05
Matches are distributed among these distances:
107 72 0.66
108 36 0.33
109 1 0.01
ACGTcount: A:0.18, C:0.19, G:0.28, T:0.35
Consensus pattern (107 bp):
AATGATCCAGGGTGGTCATTCTTCAGTTCAGTTCAGAATGATCGAGGGAAGTCATCCTTCAGCTT
ATTTCAGTTAACCCAGGGCGGTCATTCTCCAGTTTCAGTCGG
Found at i:4980 original size:35 final size:35
Alignment explanation
Indices: 4941--5357 Score: 588
Period size: 35 Copynumber: 11.8 Consensus size: 35
4931 GGGTAATTTA
*
4941 AGTAATCAACTTAATTCAGGGTAATTAAGTGAGTC
1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
* * * *
4976 AGTAAGT-AGCTTAATTCAGGGTAATTAAGCAAAATTA
1 AGTAA-TCAACTTAATTCAGGGTAATTAAG--TAAGTC
* *
5013 AGTAATCAACTTAATTCAGGGTAATTAAGTGAGTG
1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
* *
5048 AGTAAGT-AGCTTAATTCAGGGTAATTAAGCAAAGTC
1 AGTAA-TCAACTTAATTCAGGGTAATTAAG-TAAGTC
5084 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
5119 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
*
5154 AGTGATCAACTTAATTCAGGGTAATTAAGTAAGTC
1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
* *
5189 GGTAATCAACTTAATTCAGGGTAATTAAATAAGTC
1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
* *
5224 GGTAATCAACTTAATTCAGGGTGATTAAGTAAGTC
1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
5259 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
* * *
5294 GGTAATTAACTTAATTCAGGGTTATTAAGTAAG-C
1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
* *
5328 TGGTAAACAACTTAATTCAGGGTAATTAAG
1 -AGTAATCAACTTAATTCAGGGTAATTAAG
5358 ATCGACTTAA
Statistics
Matches: 344, Mismatches: 30, Indels: 16
0.88 0.08 0.04
Matches are distributed among these distances:
34 1 0.00
35 283 0.82
36 32 0.09
37 28 0.08
ACGTcount: A:0.39, C:0.11, G:0.20, T:0.31
Consensus pattern (35 bp):
AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC
Found at i:5379 original size:105 final size:104
Alignment explanation
Indices: 4860--5358 Score: 570
Period size: 105 Copynumber: 4.8 Consensus size: 104
4850 GTAAGTAATA
* * * * *
4860 GGTAACTTAATTAAGTCAGTAAGT-AGCTTAATTCAGGGTAATTAAGCAAAATCAGTTAGT-AAC
1 GGTAA-TTAAGTAAGTCAGTAA-TCAACTTAATTCAGGGTAATTAAG-TAAGTCAG-TAATCAAC
* *
4923 TTAGTTCAGGGTAATT------TAAGTAATCAACTTAATTCAG
62 TTAATTCAGGGTAATTAAGAAGTCAGTAATCAACTTAATTCAG
* * * * *
4960 GGTAATTAAGTGAGTCAGTAAGT-AGCTTAATTCAGGGTAATTAAGCAAAATTAAGTAATCAACT
1 GGTAATTAAGTAAGTCAGTAA-TCAACTTAATTCAGGGTAATTAAG--TAAGTCAGTAATCAACT
* * *
5024 TAATTCAGGGTAATTAAGTGAGTGAGTAAGT-AGCTTAATTCAG
63 TAATTCAGGGTAATTAAG-AAGTCAGTAA-TCAACTTAATTCAG
*
5067 GGTAATTAAGCAAAGTCAGTAATCAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATCAACTTA
1 GGTAATTAAG-TAAGTCAGTAATCAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATCAACTTA
*
5132 ATTCAGGGTAATTAAGTAAGTCAGTGATCAACTTAATTCAG
65 ATTCAGGGTAATTAAG-AAGTCAGTAATCAACTTAATTCAG
* * *
5173 GGTAATTAAGTAAGTCGGTAATCAACTTAATTCAGGGTAATTAAATAAGTCGGTAATCAACTTAA
1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATCAACTTAA
*
5238 TTCAGGGTGATTAAGTAAGTCAGTAATCAACTTAATTCAG
66 TTCAGGGTAATTAAG-AAGTCAGTAATCAACTTAATTCAG
* * * * *
5278 GGTAATTAAGTAAGTCGGTAATTAACTTAATTCAGGGTTATTAAGTAAG-CTGGTAAACAACTTA
1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC-AGTAATCAACTTA
5342 ATTCAGGGTAATTAAGA
65 ATTCAGGGTAATTAAGA
5359 TCGACTTAAT
Statistics
Matches: 355, Mismatches: 30, Indels: 24
0.87 0.07 0.06
Matches are distributed among these distances:
99 41 0.12
100 29 0.08
104 2 0.01
105 163 0.46
106 61 0.17
107 28 0.08
108 31 0.09
ACGTcount: A:0.38, C:0.10, G:0.20, T:0.31
Consensus pattern (104 bp):
GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATCAACTTAA
TTCAGGGTAATTAAGAAGTCAGTAATCAACTTAATTCAG
Found at i:5449 original size:56 final size:57
Alignment explanation
Indices: 5363--5502 Score: 144
Period size: 58 Copynumber: 2.5 Consensus size: 57
5353 TTAAGATCGA
* * *
5363 CTTAATTCAGGGTAATTAAGTTTAG-TAAGAAGCAAA-AATTAGGGAA-AATAA-AACGG
1 CTTAATTCAGGGTAATTGAG-TCAGTTAAGAAGCAAAGAA--AGAGAACAATAATAACGG
* * * * *
5419 CTTAATCCAGGGTAATTGAGTCAGTTAAGAATCAAAGAAAGATAATCAGTAATAAGGG
1 CTTAATTCAGGGTAATTGAGTCAGTTAAGAAGCAAAGAAAGAGAA-CAATAATAACGG
5477 CTTAATTCAGGGTAATTGAGTCAGTT
1 CTTAATTCAGGGTAATTGAGTCAGTT
5503 GAAAACAAAA
Statistics
Matches: 70, Mismatches: 9, Indels: 8
0.80 0.10 0.09
Matches are distributed among these distances:
55 7 0.10
56 28 0.40
57 6 0.09
58 29 0.41
ACGTcount: A:0.41, C:0.09, G:0.22, T:0.27
Consensus pattern (57 bp):
CTTAATTCAGGGTAATTGAGTCAGTTAAGAAGCAAAGAAAGAGAACAATAATAACGG
Found at i:13297 original size:3 final size:3
Alignment explanation
Indices: 13291--13347 Score: 114
Period size: 3 Copynumber: 19.0 Consensus size: 3
13281 TAATATTACG
13291 TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA
1 TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA
13339 TAA TAA TAA
1 TAA TAA TAA
13348 CAATGAGAGA
Statistics
Matches: 54, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
3 54 1.00
ACGTcount: A:0.67, C:0.00, G:0.00, T:0.33
Consensus pattern (3 bp):
TAA
Found at i:16707 original size:31 final size:29
Alignment explanation
Indices: 16633--16713 Score: 92
Period size: 29 Copynumber: 2.7 Consensus size: 29
16623 TAAACTTTTG
* *
16633 ATAGCTAAGGGATTTATTTGGCCCAAAAA
1 ATAGATAAGGGATTTATTTGTCCCAAAAA
*
16662 ATAGATCAGGGATTTATTTGTCCCGAAATGAA
1 ATAGATAAGGGATTTATTTGTCCC-AAA--AA
*
16694 A-AGGTAAGGGATTTATTTGT
1 ATAGATAAGGGATTTATTTGT
16714 TATTTAAGCC
Statistics
Matches: 44, Mismatches: 5, Indels: 4
0.83 0.09 0.08
Matches are distributed among these distances:
29 21 0.48
30 3 0.07
31 17 0.39
32 3 0.07
ACGTcount: A:0.35, C:0.10, G:0.23, T:0.32
Consensus pattern (29 bp):
ATAGATAAGGGATTTATTTGTCCCAAAAA
Found at i:19318 original size:36 final size:36
Alignment explanation
Indices: 19271--19342 Score: 119
Period size: 36 Copynumber: 2.0 Consensus size: 36
19261 AGGAAGACAC
*
19271 CAACTTGTGCTGGAATTGGCAGG-CCTGACTATCCCT
1 CAACTTATGCTGGAATTGGCAGGTCC-GACTATCCCT
19307 CAACTTATGCTGGAATTGGCAGGTCCGACTATCCCT
1 CAACTTATGCTGGAATTGGCAGGTCCGACTATCCCT
19343 GGGCGTCCAG
Statistics
Matches: 34, Mismatches: 1, Indels: 2
0.92 0.03 0.05
Matches are distributed among these distances:
36 32 0.94
37 2 0.06
ACGTcount: A:0.21, C:0.28, G:0.24, T:0.28
Consensus pattern (36 bp):
CAACTTATGCTGGAATTGGCAGGTCCGACTATCCCT
Found at i:23420 original size:21 final size:21
Alignment explanation
Indices: 23394--23446 Score: 72
Period size: 21 Copynumber: 2.6 Consensus size: 21
23384 GCACTAGAGT
* * *
23394 ACATGGGTCGCGAGGCAAACC
1 ACATGGGGCGCCAAGCAAACC
23415 ACATGGGGCGCCAAGCAAACC
1 ACATGGGGCGCCAAGCAAACC
23436 ACAT-GGGCGCC
1 ACATGGGGCGCC
23447 CAGCGCTAGT
Statistics
Matches: 29, Mismatches: 3, Indels: 1
0.88 0.09 0.03
Matches are distributed among these distances:
20 7 0.24
21 22 0.76
ACGTcount: A:0.28, C:0.32, G:0.32, T:0.08
Consensus pattern (21 bp):
ACATGGGGCGCCAAGCAAACC
Done.