Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: AWUE01017510.1 Corchorus olitorius cultivar O-4 contig17543, whole genome shotgun sequence
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 2153
ACGTcount: A:0.35, C:0.19, G:0.14, T:0.32
Found at i:1217 original size:31 final size:28
Alignment explanation
Indices: 1179--2153 Score: 906
Period size: 25 Copynumber: 35.6 Consensus size: 28
1169 TTAGAGGCCC
1179 CTGAATATGCAACTATATGATTATGACCCTA
1 CTGAATATGCAACTATATGA-T-TG-CCCTA
*
1210 CTGAATATGCAACTATATGATTATGACCATA
1 CTGAATATGCAACTATATGA-T-TG-CCCTA
*
1241 CTGAATATGCAACTGTATG---GCCCCTA
1 CTGAATATGCAACTATATGATTG-CCCTA
1267 CTGAATATGCAACTATATG---GCCCCTA
1 CTGAATATGCAACTATATGATTG-CCCTA
*
1293 CTGAATATGCGACTATATGA---CCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
*
1318 CTGAATATGCGACTATATG---GCCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
* *
1343 CTGAATATGCGACTATATGA---CCCAA
1 CTGAATATGCAACTATATGATTGCCCTA
*
1368 CTGAATATGCAACTATATGATTATGGGCCTA
1 CTGAATATGCAACTATATGA-T-T-GCCCTA
*
1399 CTGATTATGCAACTATATGATTATGGCCCTA
1 CTGAATATGCAACTATATGA-T-T-GCCCTA
*
1430 CTGGATATGCAACTATATGATTATGGCCCTA
1 CTGAATATGCAACTATATGA-T-T-GCCCTA
* *
1461 CTGAACATGCAACTATATG---GCTCTA
1 CTGAATATGCAACTATATGATTGCCCTA
*
1486 CTGAATATGCAACGTATATAATTATGGCCCTA
1 CTGAATATGCAAC-TATATGA-T-T-GCCCTA
* * *
1518 CAGAAAATGCAACTATATGGTTATGGCCCTA
1 CTGAATATGCAACTATAT-G--ATTGCCCTA
1549 CTGAATATGCAACTATATG---GCCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
1574 CTGAATATGCAACTATATG---GCCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
*
1599 CTGAATATGCAACT-TATG---GCCCAA
1 CTGAATATGCAACTATATGATTGCCCTA
*
1623 CTAAATATGCAACTATATG---GCCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
1648 CTGAATATGCAACTATATG---GCCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
*
1673 CTGAATATGCAACTATATGATTATGAACCTA
1 CTGAATATGCAACTATATGA-T-TG-CCCTA
1704 CTGAATATGCAACTATATGATTATGACCCTA
1 CTGAATATGCAACTATATGA-T-TG-CCCTA
1735 CTGAATATGCAACTATATG---GCCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
*
1760 CTGAATATGCAACTATATG---GTCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
*
1785 CTGAATATGCAGCTATATG---GCCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
1810 CTGAATATGCAACTATATGATTATAGGACCCTA
1 CTGAATATGCAACTATATGA-T-T--G-CCCTA
1843 CTGAATATGCAACTATATGATTATGGCCCTA
1 CTGAATATGCAACTATATGA-T-T-GCCCTA
1874 CTGAATATGCAACTATATGA-T-CCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
1900 CTGAATATGCAACTATATG---GCCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
****
1925 CTGAATATGCAACTATATGATT-ATGGA
1 CTGAATATGCAACTATATGATTGCCCTA
*
1952 CTGAATATGCAACTACATGA---CCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
1977 CTGAATATGCAACTATATGATT-CCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
*
2004 -TG-ATAATGCAACTA-AT-ATGGCCCTA
1 CTGAAT-ATGCAACTATATGATTGCCCTA
2029 CTGAATATGCAACTATATGATT-CCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
*
2056 CTGAATATGCAATTATATGATT-CCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
2083 CTGAATATGCAACTATATG---GCCCCTA
1 CTGAATATGCAACTATATGATTG-CCCTA
2109 CTGAATATGCAACTATATGATT-CCCTA
1 CTGAATATGCAACTATATGATTGCCCTA
2136 CTGAATATGCAACTATAT
1 CTGAATATGCAACTATAT
Statistics
Matches: 843, Mismatches: 50, Indels: 106
0.84 0.05 0.11
Matches are distributed among these distances:
24 24 0.03
25 308 0.37
26 124 0.15
27 101 0.12
28 3 0.00
30 2 0.00
31 231 0.27
32 19 0.02
33 30 0.04
34 1 0.00
ACGTcount: A:0.33, C:0.21, G:0.15, T:0.30
Consensus pattern (28 bp):
CTGAATATGCAACTATATGATTGCCCTA
Found at i:1421 original size:16 final size:16
Alignment explanation
Indices: 1373--1454 Score: 64
Period size: 16 Copynumber: 5.2 Consensus size: 16
1363 CCCAACTGAA
1373 TATGCAACTATATGAT
1 TATGCAACTATATGAT
*** *
1389 TATGGGCCTA-CTGAT
1 TATGCAACTATATGAT
1404 TATGCAACTATATGAT
1 TATGCAACTATATGAT
* *
1420 TATGGC-CCTACT-GGA-
1 TAT-GCAACTA-TATGAT
1435 TATGCAACTATATGAT
1 TATGCAACTATATGAT
1451 TATG
1 TATG
1455 GCCCTACTGA
Statistics
Matches: 48, Mismatches: 12, Indels: 12
0.67 0.17 0.17
Matches are distributed among these distances:
14 3 0.06
15 19 0.40
16 23 0.48
17 3 0.06
ACGTcount: A:0.30, C:0.16, G:0.18, T:0.35
Consensus pattern (16 bp):
TATGCAACTATATGAT
Found at i:1762 original size:186 final size:178
Alignment explanation
Indices: 1244--2153 Score: 895
Period size: 186 Copynumber: 4.8 Consensus size: 178
1234 GACCATACTG
* *
1244 AATATGCAACT-GTATGGCCCCTACTGAATATGCAACTATATGGCCCCTACTGAATATGCGACTA
1 AATATGCAACTAATATGG-CCCTACTGAATATGCAACTATATGG-CCCTACTGAATATGCAACTA
* * * *
1308 TATG--A-CCCTACTGAATATGCGACTATATGGCCCTACTGAATATGCGACTATATGACCCAACT
64 TATGATATCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATATGGCCCTACT
* * *
1370 GAATATGCAACTATATGATTATGGGCCTACTGATTATGCAACTATATGATTATGGCCCTACTG
129 GAATATGCAAC----T-A-TATGGCCCTACTGAATATGCAAC----T-A-TATGGCCC-ACTA
* * *
1433 GATATGCAACTATATGATTATGGCCCTACTGAACATGCAACTATATGGCTCTACTGAATATGCAA
1 AATATGCAAC--TA--A-TATGGCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAA
* * *
1498 CGTATATAATTATGGCCCTACAGAAAATGCAACTATATGGTTATGGCCCTACTGAATATGCAACT
61 C-TATATGA-TAT--CCCTACTGAATATGCAAC--TA----TATGGCCCTACTGAATATGCAACT
1563 ATATGGCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACT-TATGGCCCAACTA
116 ATATGGCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATATGGCCC-ACTA
1626 AATATGCAACT-ATATGGCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATA
1 AATATGCAACTAATATGGCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATA
*
1690 TGATTATGAACCTACTGAATATGCAACTATATGATTATGACCCTACTGAATATGCAACTATATGG
66 TGA-TAT--CCCTACTGAATATGCAACTATATG-----G-CCCTACTGAATATGCAACTATATGG
* * *
1755 CCCTACTGAATATGCAACTATATGGTCCTACTGAATATGCAGCTATATGGCCCTACTG
122 CCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATATGGCCC-ACTA
1813 AATATGCAACTATATGATTATAGGACCCTACTGAATATGCAACTATATGATTATGGCCCTACTGA
1 AATATGCAAC--TA--A-TAT-GG-CCCTACTGAATATGCAAC----T-A-TATGGCCCTACTGA
1878 ATATGCAACTATATG--ATCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTAT
53 ATATGCAACTATATGATATCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTAT
**** * * **
1941 ATGATTATGGACTGAATATGCAACTACATGACCCTACTGAATATGCAACTATATGATTCC-CTA
118 ATGGCCCT--ACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATATG-GCCCACTA
* * *
2004 TGATAATGCAACTAATATGGCCCTACTGAATATGCAACTATATGATTCCCTACTGAATATGCAAT
1 -AAT-ATGCAACTAATATGGCCCTACTGAATATGCAACTATATG--GCCCTACTGAATATGCAAC
*
2069 TATATGAT-TCCCTACTGAATATGCAACTATATGGCCCCTACTGAATATGCAACTATATGATTCC
62 TATATGATATCCCTACTGAATATGCAACTATATGG-CCCTACTGAATATGCAACTATATG--GCC
2133 CTACTGAATATGCAACTATAT
124 CTACTGAATATGCAACTATAT
Statistics
Matches: 621, Mismatches: 48, Indels: 109
0.80 0.06 0.14
Matches are distributed among these distances:
180 8 0.01
181 1 0.00
182 24 0.04
183 26 0.04
184 44 0.07
185 1 0.00
186 112 0.18
187 69 0.11
188 4 0.01
189 11 0.02
190 25 0.04
191 7 0.01
192 44 0.07
193 48 0.08
194 31 0.05
195 23 0.04
196 24 0.04
197 1 0.00
198 2 0.00
199 1 0.00
200 37 0.06
201 30 0.05
202 3 0.00
206 45 0.07
ACGTcount: A:0.33, C:0.22, G:0.15, T:0.30
Consensus pattern (178 bp):
AATATGCAACTAATATGGCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATA
TGATATCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATATGGCCCTACTGA
ATATGCAACTATATGGCCCTACTGAATATGCAACTATATGGCCCACTA
Found at i:1842 original size:33 final size:31
Alignment explanation
Indices: 1800--2153 Score: 311
Period size: 27 Copynumber: 12.9 Consensus size: 31
1790 TATGCAGCTA
1800 TATGGCCCTACTGAATATGCAACTATATGAT
1 TATGGCCCTACTGAATATGCAACTATATGAT
1831 TATAGGACCCTACTGAATATGCAACTATATGAT
1 TAT-GG-CCCTACTGAATATGCAACTATATGAT
1864 TATGGCCCTACTGAATATGCAACTATATG--
1 TATGGCCCTACTGAATATGCAACTATATGAT
1893 -AT--CCCTACTGAATATGCAAC----T-A-
1 TATGGCCCTACTGAATATGCAACTATATGAT
1915 TATGGCCCTACTGAATATGCAACTATATGAT
1 TATGGCCCTACTGAATATGCAACTATATGAT
*
1946 TATGG----ACTGAATATGCAACTACATG--
1 TATGGCCCTACTGAATATGCAACTATATGAT
1971 -A---CCCTACTGAATATGCAACTATATGA-
1 TATGGCCCTACTGAATATGCAACTATATGAT
1997 T-T--CCCTA-TG-ATAATGCAAC--TA--A-
1 TATGGCCCTACTGAAT-ATGCAACTATATGAT
2019 TATGGCCCTACTGAATATGCAACTATATGA-
1 TATGGCCCTACTGAATATGCAACTATATGAT
*
2049 T-T--CCCTACTGAATATGCAATTATATGA-
1 TATGGCCCTACTGAATATGCAACTATATGAT
2076 T-T--CCCTACTGAATATGCAACTATATG--
1 TATGGCCCTACTGAATATGCAACTATATGAT
*
2102 ---GCCCCTACTGAATATGCAACTATATGA-
1 TATGGCCCTACTGAATATGCAACTATATGAT
2129 T-T--CCCTACTGAATATGCAACTATAT
1 TATGGCCCTACTGAATATGCAACTATAT
Statistics
Matches: 285, Mismatches: 4, Indels: 72
0.79 0.01 0.20
Matches are distributed among these distances:
22 3 0.01
23 3 0.01
24 3 0.01
25 44 0.15
26 60 0.21
27 98 0.34
28 4 0.01
29 2 0.01
30 3 0.01
31 32 0.11
32 4 0.01
33 29 0.10
ACGTcount: A:0.34, C:0.21, G:0.14, T:0.31
Consensus pattern (31 bp):
TATGGCCCTACTGAATATGCAACTATATGAT
Found at i:1977 original size:52 final size:50
Alignment explanation
Indices: 1840--2153 Score: 353
Period size: 52 Copynumber: 5.9 Consensus size: 50
1830 TTATAGGACC
*
1840 CTACTGAATATGCAACTATATGATTATGGCCCTACTGAATATGCAACTATATGATCC
1 CTACTGAATATGCAACTATATG---A---CCCTACTGAATATGCAACTATATGAT-T
*
1897 CTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATATGATT
1 CTACTGAATATGCAACTATATGACCCTACTGAATATGCAACTATATGATT
* *
1947 ATGGACTGAATATGCAACTACATGACCCTACTGAATATGCAACTATATGATT
1 CT--ACTGAATATGCAACTATATGACCCTACTGAATATGCAACTATATGATT
*
1999 CCCTA-TG-ATAATGCAACTAATATGGCCCTACTGAATATGCAACTATATGATT
1 --CTACTGAAT-ATGCAACT-ATATGACCCTACTGAATATGCAACTATATGATT
* ***
2051 CCCTACTGAATATGCAATTATATGATTCCCTACTGAATATGCAACTATATGGCCC
1 --CTACTGAATATGCAACTATATGA--CCCTACTGAATATGCAACTATAT-GATT
2106 CTACTGAATATGCAACTATATGATTCCCTACTGAATATGCAACTATAT
1 CTACTGAATATGCAACTATATGA--CCCTACTGAATATGCAACTATAT
Statistics
Matches: 232, Mismatches: 14, Indels: 26
0.85 0.05 0.10
Matches are distributed among these distances:
50 3 0.01
51 36 0.16
52 88 0.38
53 56 0.24
54 26 0.11
55 1 0.00
57 22 0.09
ACGTcount: A:0.34, C:0.21, G:0.13, T:0.31
Consensus pattern (50 bp):
CTACTGAATATGCAACTATATGACCCTACTGAATATGCAACTATATGATT
Found at i:2134 original size:80 final size:78
Alignment explanation
Indices: 1864--2153 Score: 419
Period size: 80 Copynumber: 3.7 Consensus size: 78
1854 ACTATATGAT
*
1864 TATGGCCCTACTGAATATGCAACTATATGATCCCTACTGAATATGCAACTATATG--GCCCTACT
1 TATGGCCCTACTGAATATGCAACTATATGATCCCTACTGAATATGCAACTATATGATTCCCTACT
1927 GAATATGCAACTA
66 GAATATGCAACTA
**** *
1940 TATGATTATGGACTGAATATGCAACTACATGA-CCCTACTGAATATGCAACTATATGATTCCCTA
1 TATGGCCCT--ACTGAATATGCAACTATATGATCCCTACTGAATATGCAACTATATGATTCCCTA
2004 -TG-ATAATGCAACTAA
64 CTGAAT-ATGCAACT-A
*
2019 TATGGCCCTACTGAATATGCAACTATATGATTCCCTACTGAATATGCAATTATATGATTCCCTAC
1 TATGGCCCTACTGAATATGCAACTATATGA-TCCCTACTGAATATGCAACTATATGATTCCCTAC
2084 TGAATATGCAACTA
65 TGAATATGCAACTA
2098 TATGGCCCCTACTGAATATGCAACTATATGATTCCCTACTGAATATGCAACTATAT
1 TATGG-CCCTACTGAATATGCAACTATATGA-TCCCTACTGAATATGCAACTATAT
Statistics
Matches: 190, Mismatches: 13, Indels: 18
0.86 0.06 0.08
Matches are distributed among these distances:
76 5 0.03
77 46 0.24
78 30 0.16
79 48 0.25
80 59 0.31
81 2 0.01
ACGTcount: A:0.34, C:0.22, G:0.13, T:0.31
Consensus pattern (78 bp):
TATGGCCCTACTGAATATGCAACTATATGATCCCTACTGAATATGCAACTATATGATTCCCTACT
GAATATGCAACTA
Done.