Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: AWWV01013270.1 Corchorus capsularis cultivar CVL-1 contig13291, whole genome shotgun sequence
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 28112
ACGTcount: A:0.31, C:0.20, G:0.17, T:0.32
Found at i:613 original size:15 final size:15
Alignment explanation
Indices: 580--613 Score: 50
Period size: 15 Copynumber: 2.3 Consensus size: 15
570 TAACAGAATT
*
580 AAAAGTGAATAAGAC
1 AAAAGTGAATAAGAA
*
595 AAAAGTGAGTAAGAA
1 AAAAGTGAATAAGAA
610 AAAA
1 AAAA
614 TTACCGAGAG
Statistics
Matches: 17, Mismatches: 2, Indels: 0
0.89 0.11 0.00
Matches are distributed among these distances:
15 17 1.00
ACGTcount: A:0.65, C:0.03, G:0.21, T:0.12
Consensus pattern (15 bp):
AAAAGTGAATAAGAA
Found at i:2190 original size:35 final size:35
Alignment explanation
Indices: 2146--2773 Score: 573
Period size: 35 Copynumber: 18.7 Consensus size: 35
2136 AGCAATAAGT
2146 AACTCTAATTCAGGGTAATTAAGTAGTTCAGTAATC
1 AACT-TAATTCAGGGTAATTAAGTAGTTCAGTAATC
* *
2182 AACTTAATTCAGGGTAATTAAGTAATTCAGTTAGT-
1 AACTTAATTCAGGGTAATTAAGTAGTTCAG-TAATC
2217 AACTTAATTCAGGGTAATT-A--AG-T-AGT--TC
1 AACTTAATTCAGGGTAATTAAGTAGTTCAGTAATC
* *
2245 AACTTAATTCAGGGTAATTAAATGAG-TCAATAATC
1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAATC
*
2280 AACTTAATTCAGGGTAATTAAGTGAG-TCAATAATC
1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAATC
* *
2315 AACTTAATTCAGGGTAATTAAGTAATTCAGTTAGT-
1 AACTTAATTCAGGGTAATTAAGTAGTTCAG-TAATC
2350 AACTTAATTCAGGGTAATTAAGTAGTTC---AA-C
1 AACTTAATTCAGGGTAATTAAGTAGTTCAGTAATC
* *
2381 -TC-TAATTCAGGGTAATTAAGTGAG-TCAATAATC
1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAATC
* *
2414 AACTTAATTCAGGGTAATTAAGTAATTCAGTTAGT-
1 AACTTAATTCAGGGTAATTAAGTAGTTCAG-TAATC
2449 AACTTAATTCAGGGTAATTAAGTAGTTC---AA-C
1 AACTTAATTCAGGGTAATTAAGTAGTTCAGTAATC
* *
2480 -TC-TAATTCAGGGTAATTAAGTGAGTT-AATAAGT-
1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAA-TC
* * *
2513 AACTTAATTCAGGGTAATTAAGTAATTCAATGAGT-
1 AACTTAATTCAGGGTAATTAAGTAGTTCAGT-AATC
*
2548 AACTTAATTCAGGGTAATTAAGTGAG-TCGGTAATC
1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAATC
* *
2583 AACTTAATTCAGGGTAACTAAGTAAG-TCAATAATC
1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAATC
* * *
2618 AACCTTAATTCAAGGTAATTAAGTAATTCAGTTAGT-
1 AA-CTTAATTCAGGGTAATTAAGTAGTTCAG-TAATC
* ** *
2654 AACTTAGTTCAGGAAAATTAAGTAAG-GCAG---T-
1 AACTTAATTCAGGGTAATTAAGT-AGTTCAGTAATC
* *
2685 AACTTAATTCAGGGTAATTAAGGAATTCAGTAATC
1 AACTTAATTCAGGGTAATTAAGTAGTTCAGTAATC
2720 AACTTAATTCAGGGTAATTAAG--G--CAGTGAA-C
1 AACTTAATTCAGGGTAATTAAGTAGTTCAGT-AATC
2751 AACTTAATTCAGGGTAATTAAGT
1 AACTTAATTCAGGGTAATTAAGT
2774 GTAGTAAGAA
Statistics
Matches: 500, Mismatches: 47, Indels: 94
0.78 0.07 0.15
Matches are distributed among these distances:
27 1 0.00
28 19 0.04
29 42 0.08
30 11 0.02
31 53 0.11
32 10 0.02
33 3 0.01
34 11 0.02
35 307 0.61
36 40 0.08
37 3 0.01
ACGTcount: A:0.39, C:0.11, G:0.18, T:0.33
Consensus pattern (35 bp):
AACTTAATTCAGGGTAATTAAGTAGTTCAGTAATC
Found at i:2412 original size:99 final size:99
Alignment explanation
Indices: 2278--2773 Score: 650
Period size: 99 Copynumber: 5.0 Consensus size: 99
2268 GAGTCAATAA
2278 TCAACTTAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAGTAATTC
1 TCAACTTAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAGTAATTC
2343 AGTTAGTAACTTAATTCAGGGTAATTAAGT-AGT
66 AGTTAGTAACTTAATTCAGGGTAATTAAGTAAGT
2376 TCAACTCTAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAGTAATT
1 TCAACT-TAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAGTAATT
2441 CAGTTAGTAACTTAATTCAGGGTAATTAAGT-AGT
65 CAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGT
*
2475 TCAACTCTAATTCAGGGTAATTAAGTGAGTTAATAAGT-AACTTAATTCAGGGTAATTAAGTAAT
1 TCAACT-TAATTCAGGGTAATTAAGTGAGTCAATAA-TCAACTTAATTCAGGGTAATTAAGTAAT
* * *
2539 TCAATGAGTAACTTAATTCAGGGTAATTAAGTGAGTCGGT
64 TCAGTTAGTAACTTAATTCAGGGTAATTAAGT-A---AGT
* * *
2579 AATCAACTTAATTCAGGGTAACTAAGTAAGTCAATAATCAACCTTAATTCAAGGTAATTAAGTAA
1 --TCAACTTAATTCAGGGTAATTAAGTGAGTCAATAATCAA-CTTAATTCAGGGTAATTAAGTAA
* **
2644 TTCAGTTAGTAACTTAGTTCAGGAAAATTAAGTAAG-
63 TTCAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGT
* * *
2680 GCAGTAACTTAATTCAGGGTAATTAAG-GAATTCAGTAATCAACTTAATTCAGGGTAATTAAG--
1 TC---AACTTAATTCAGGGTAATTAAGTG-AGTCAATAATCAACTTAATTCAGGGTAATTAAGTA
* * **
2742 --GCAGTGAACAACTTAATTCAGGGTAATTAAGT
62 ATTCAGTTAGTAACTTAATTCAGGGTAATTAAGT
2774 GTAGTAAGAA
Statistics
Matches: 356, Mismatches: 27, Indels: 31
0.86 0.07 0.07
Matches are distributed among these distances:
97 25 0.07
98 6 0.02
99 184 0.52
100 1 0.00
101 19 0.05
102 33 0.09
104 3 0.01
105 29 0.08
106 56 0.16
ACGTcount: A:0.39, C:0.11, G:0.18, T:0.33
Consensus pattern (99 bp):
TCAACTTAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAGTAATTC
AGTTAGTAACTTAATTCAGGGTAATTAAGTAAGT
Found at i:2467 original size:134 final size:135
Alignment explanation
Indices: 2138--2773 Score: 682
Period size: 134 Copynumber: 4.7 Consensus size: 135
2128 GGTGAATCAG
*
2138 CAATAAGTAACTCTAATTCAGGGTAATTAAGTAGTTCAGTAATCAACTTAATTCAGGGTAATTAA
1 CAATAA-TAACT-TAATTCAGGGTAATTAAGTAATTCAGTAATCAACTTAATTCAGGGTAATTAA
*
2203 GTAATTCAGTTAGTAACTTAATTCAGGGTAATTAAGTAGTTC-A--ACTTAATTCAGGGTAATTA
64 GTAATTCAGTTAATAACTTAATTCAGGGTAATTAAGTAGTTCAACTACTTAATTCAGGGTAATTA
* *
2265 AATGAGT
129 AGTAAGT
* * *
2272 CAATAATCAACTTAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAG
1 CAATAAT-AACTTAATTCAGGGTAATTAAGTAATTCAGTAATCAACTTAATTCAGGGTAATTAAG
*
2337 TAATTCAGTTAGTAACTTAATTCAGGGTAATTAAGTAGTTCAACT-C-TAATTCAGGGTAATTAA
65 TAATTCAGTTAATAACTTAATTCAGGGTAATTAAGTAGTTCAACTACTTAATTCAGGGTAATTAA
*
2400 GTGAGT
130 GTAAGT
*
2406 CAATAATCAACTTAATTCAGGGTAATTAAGTAATTCAGTTAGT-AACTTAATTCAGGGTAATTAA
1 CAATAAT-AACTTAATTCAGGGTAATTAAGTAATTCAG-TAATCAACTTAATTCAGGGTAATTAA
* * * *
2470 GTAGTTCA---ACT--C-TAATTCAGGGTAATTAAGTGAGTTAATAAGTAACTTAATTCAGGGTA
64 GTAATTCAGTTAATAACTTAATTCAGGGTAATTAAGT-AGTT--CAACT-ACTTAATTCAGGGTA
*
2529 ATTAAGTAATT
125 ATTAAGTAAGT
* * * * *
2540 CAATGAGTAACTTAATTCAGGGTAATTAAGTGAGTCGGTAATCAACTTAATTCAGGGTAACTAAG
1 CAAT-AATAACTTAATTCAGGGTAATTAAGTAATTCAGTAATCAACTTAATTCAGGGTAATTAAG
* * * * * * **
2605 TAAGTCA-ATAATCAACCTTAATTCAAGGTAATTAAGTAATTCAGTTAGTAACTTAGTTCAGGAA
65 TAATTCAGTTAAT-AA-CTTAATTCAGGGTAATTAAGTAGTTCA---ACT-ACTTAATTCAGGGT
*
2669 AATTAAGTAAGG
124 AATTAAGTAAGT
* *
2681 C---AGTAACTTAATTCAGGGTAATTAAGGAATTCAGTAATCAACTTAATTCAGGGTAATTAAG-
1 CAATAATAACTTAATTCAGGGTAATTAAGTAATTCAGTAATCAACTTAATTCAGGGTAATTAAGT
* * *
2742 ---GCAGTGAACAACTTAATTCAGGGTAATTAAGT
66 AATTCAGTTAATAACTTAATTCAGGGTAATTAAGT
2774 GTAGTAAGAA
Statistics
Matches: 436, Mismatches: 42, Indels: 50
0.83 0.08 0.09
Matches are distributed among these distances:
128 19 0.04
129 5 0.01
131 5 0.01
132 20 0.05
133 99 0.23
134 176 0.40
135 6 0.01
136 2 0.00
137 55 0.13
138 1 0.00
140 4 0.01
141 44 0.10
ACGTcount: A:0.39, C:0.11, G:0.18, T:0.33
Consensus pattern (135 bp):
CAATAATAACTTAATTCAGGGTAATTAAGTAATTCAGTAATCAACTTAATTCAGGGTAATTAAGT
AATTCAGTTAATAACTTAATTCAGGGTAATTAAGTAGTTCAACTACTTAATTCAGGGTAATTAAG
TAAGT
Found at i:2712 original size:66 final size:66
Alignment explanation
Indices: 2378--2772 Score: 322
Period size: 66 Copynumber: 5.8 Consensus size: 66
2368 TAAGTAGTTC
* * *
2378 AACTCTAATTCAGGGTAATTAAGTGAGTCAATAATCAACTTAATTCAGGGTAATTAAGTAATTCA
1 AACT-TAATTCAGGGTAATTAAGTAAGGC---AAT-AACTTAATTCAGGGTAATTAAGGAATTCA
2443 GTTAGT
61 GTTAGT
* * *
2449 AACTTAATTCAGGGTAATTAAGT-A-G--TTCAACTCTAATTCAGGGTAATTAAGTGAGTT-AAT
1 AACTTAATTCAGGGTAATTAAGTAAGGCAAT-AACT-TAATTCAGGGTAATTAAG-GAATTCAGT
*
2509 AAGT
63 TAGT
** *
2513 AACTTAATTCAGGGTAATTAAGTAATTCAATGAGTAACTTAATTCAGGGTAATTAAGTG-AGTC-
1 AACTTAATTCAGGGTAATTAAGTAAGGC-A--A-TAACTTAATTCAGGGTAATTAAG-GAATTCA
* *
2576 GGTAAT
61 GTTAGT
* * * *
2582 CAACTTAATTCAGGGTAACTAAGTAAGTCAATAATCAACCTTAATTCAAGGTAATTAAGTAATTC
1 -AACTTAATTCAGGGTAATTAAGTAAGGC---AAT-AA-CTTAATTCAGGGTAATTAAGGAATTC
2647 AGTTAGT
60 AGTTAGT
* ** * *
2654 AACTTAGTTCAGGAAAATTAAGTAAGGCAGTAACTTAATTCAGGGTAATTAAGGAATTCAG-TAA
1 AACTTAATTCAGGGTAATTAAGTAAGGCAATAACTTAATTCAGGGTAATTAAGGAATTCAGTTAG
2718 T
66 T
** *
2719 CAACTTAATTCAGGGTAATTAAGGCAGTG-AACAACTTAATTCAGGGTAATTAAG
1 -AACTTAATTCAGGGTAATTAAGTAAG-GCAATAACTTAATTCAGGGTAATTAAG
2773 TGTAGTAAGA
Statistics
Matches: 266, Mismatches: 38, Indels: 45
0.76 0.11 0.13
Matches are distributed among these distances:
63 6 0.02
64 46 0.17
65 7 0.03
66 70 0.26
67 3 0.01
68 2 0.01
69 5 0.02
70 68 0.26
71 53 0.20
72 6 0.02
ACGTcount: A:0.39, C:0.11, G:0.18, T:0.32
Consensus pattern (66 bp):
AACTTAATTCAGGGTAATTAAGTAAGGCAATAACTTAATTCAGGGTAATTAAGGAATTCAGTTAG
T
Found at i:5954 original size:40 final size:40
Alignment explanation
Indices: 5910--6022 Score: 129
Period size: 40 Copynumber: 2.8 Consensus size: 40
5900 TTTTATTAAT
* *
5910 TTCCAAAAGTTTTCTCTTGG-ATTTCTAAAAAACATTTGCA
1 TTCCAAAAGTCTTCTCTTGGAATTACT-AAAAACATTTGCA
***
5950 TTCCAAAAGTCTTCTCTTGGAATTACTAAAAACATTTATT
1 TTCCAAAAGTCTTCTCTTGGAATTACTAAAAACATTTGCA
* * *
5990 TTCCAAAAATCTTCTCTTTGAATTGCTTAAAAA
1 TTCCAAAAGTCTTCTCTTGGAATTAC-TAAAAA
6023 ACGTTCTTTT
Statistics
Matches: 63, Mismatches: 8, Indels: 3
0.85 0.11 0.04
Matches are distributed among these distances:
40 52 0.83
41 11 0.17
ACGTcount: A:0.35, C:0.18, G:0.08, T:0.40
Consensus pattern (40 bp):
TTCCAAAAGTCTTCTCTTGGAATTACTAAAAACATTTGCA
Found at i:7347 original size:20 final size:20
Alignment explanation
Indices: 7325--7361 Score: 67
Period size: 20 Copynumber: 1.9 Consensus size: 20
7315 ACCCTTTGTT
7325 TTTTTC-GTATTTTTTGAGC
1 TTTTTCTGTATTTTTTGAGC
7344 TTTTTCTGTATTTTTTGA
1 TTTTTCTGTATTTTTTGA
7362 CTGTTAAAAG
Statistics
Matches: 17, Mismatches: 0, Indels: 1
0.94 0.00 0.06
Matches are distributed among these distances:
19 6 0.35
20 11 0.65
ACGTcount: A:0.11, C:0.08, G:0.14, T:0.68
Consensus pattern (20 bp):
TTTTTCTGTATTTTTTGAGC
Found at i:9865 original size:24 final size:25
Alignment explanation
Indices: 9834--9892 Score: 93
Period size: 24 Copynumber: 2.3 Consensus size: 25
9824 GATTCTAATA
9834 CAAATTAATATGATATGATTG-ATG
1 CAAATTAATATGATATGATTGAATG
9858 CAAATTAATATGATATGATTGTAATG
1 CAAATTAATATGATATGATTG-AATG
9884 CAAAATTAA
1 C-AAATTAA
9893 AAAGGACTAA
Statistics
Matches: 32, Mismatches: 0, Indels: 3
0.91 0.00 0.09
Matches are distributed among these distances:
24 21 0.66
26 4 0.12
27 7 0.22
ACGTcount: A:0.46, C:0.05, G:0.14, T:0.36
Consensus pattern (25 bp):
CAAATTAATATGATATGATTGAATG
Found at i:20462 original size:23 final size:23
Alignment explanation
Indices: 20436--20502 Score: 56
Period size: 23 Copynumber: 3.2 Consensus size: 23
20426 CAATTTTATT
20436 AATTTCCAAAAGTCTTCTCTTGG
1 AATTTCCAAAAGTCTTCTCTTGG
* * *
20459 AATTACTAAAA-AC-T-T-TT--
1 AATTTCCAAAAGTCTTCTCTTGG
*
20476 ATTTTCCAAAAGTCTTCTCTTGG
1 AATTTCCAAAAGTCTTCTCTTGG
20499 AATT
1 AATT
20503 GCTTAAATAG
Statistics
Matches: 30, Mismatches: 8, Indels: 12
0.60 0.16 0.24
Matches are distributed among these distances:
17 8 0.27
18 1 0.03
19 3 0.10
20 2 0.07
21 3 0.10
22 1 0.03
23 12 0.40
ACGTcount: A:0.31, C:0.18, G:0.09, T:0.42
Consensus pattern (23 bp):
AATTTCCAAAAGTCTTCTCTTGG
Found at i:21652 original size:25 final size:26
Alignment explanation
Indices: 21593--21653 Score: 72
Period size: 26 Copynumber: 2.3 Consensus size: 26
21583 ACAAATTAAC
21593 AATAAATAACCCAAAGCCCAAATAAGT
1 AATAAATAA-CCAAAGCCCAAATAAGT
*
21620 AATGAAATAA-CAAAGCCCAAA-GAGT
1 AAT-AAATAACCAAAGCCCAAATAAGT
21645 AACTAAATA
1 AA-TAAATA
21654 TCAGGCCCAA
Statistics
Matches: 31, Mismatches: 1, Indels: 6
0.82 0.03 0.16
Matches are distributed among these distances:
25 10 0.32
26 12 0.39
27 3 0.10
28 6 0.19
ACGTcount: A:0.57, C:0.18, G:0.10, T:0.15
Consensus pattern (26 bp):
AATAAATAACCAAAGCCCAAATAAGT
Found at i:22518 original size:22 final size:24
Alignment explanation
Indices: 22464--22528 Score: 89
Period size: 22 Copynumber: 2.8 Consensus size: 24
22454 CACTAAAAAA
*
22464 AAAAAAAAGATTTGTTCACAGCAGG
1 AAAAAAAAG-TTTGTTCACACCAGG
*
22489 AAAAAAAAGTTAGTTCACACCA-G
1 AAAAAAAAGTTTGTTCACACCAGG
22512 -AAAAAAAGTTTGTTCAC
1 AAAAAAAAGTTTGTTCAC
22529 CAGCCACCAA
Statistics
Matches: 37, Mismatches: 3, Indels: 3
0.86 0.07 0.07
Matches are distributed among these distances:
22 16 0.43
23 1 0.03
24 11 0.30
25 9 0.24
ACGTcount: A:0.49, C:0.14, G:0.15, T:0.22
Consensus pattern (24 bp):
AAAAAAAAGTTTGTTCACACCAGG
Found at i:22930 original size:15 final size:16
Alignment explanation
Indices: 22910--22942 Score: 50
Period size: 17 Copynumber: 2.1 Consensus size: 16
22900 TTATTTATGC
22910 TGTTTAT-TTTAATAT
1 TGTTTATATTTAATAT
22925 TGTTTATAATTTAATAT
1 TGTTTAT-ATTTAATAT
22942 T
1 T
22943 AATTTATTTG
Statistics
Matches: 16, Mismatches: 0, Indels: 2
0.89 0.00 0.11
Matches are distributed among these distances:
15 7 0.44
17 9 0.56
ACGTcount: A:0.30, C:0.00, G:0.06, T:0.64
Consensus pattern (16 bp):
TGTTTATATTTAATAT
Found at i:27800 original size:21 final size:22
Alignment explanation
Indices: 27760--27808 Score: 82
Period size: 21 Copynumber: 2.2 Consensus size: 22
27750 TGTAATCTAA
27760 TATGTTTTAGTAGTTTTTAGTTT
1 TATG-TTTAGTAGTTTTTAGTTT
27783 TATGTTTAGTAG-TTTTAGTTT
1 TATGTTTAGTAGTTTTTAGTTT
27804 TATGT
1 TATGT
27809 ATGTTCTGTA
Statistics
Matches: 26, Mismatches: 0, Indels: 2
0.93 0.00 0.07
Matches are distributed among these distances:
21 14 0.54
22 8 0.31
23 4 0.15
ACGTcount: A:0.18, C:0.00, G:0.18, T:0.63
Consensus pattern (22 bp):
TATGTTTAGTAGTTTTTAGTTT
Done.