Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWUE01017510.1 Corchorus olitorius cultivar O-4 contig17543, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 2153
ACGTcount: A:0.35, C:0.19, G:0.14, T:0.32


Found at i:1217 original size:31 final size:28

Alignment explanation

Indices: 1179--2153 Score: 906 Period size: 25 Copynumber: 35.6 Consensus size: 28 1169 TTAGAGGCCC 1179 CTGAATATGCAACTATATGATTATGACCCTA 1 CTGAATATGCAACTATATGA-T-TG-CCCTA * 1210 CTGAATATGCAACTATATGATTATGACCATA 1 CTGAATATGCAACTATATGA-T-TG-CCCTA * 1241 CTGAATATGCAACTGTATG---GCCCCTA 1 CTGAATATGCAACTATATGATTG-CCCTA 1267 CTGAATATGCAACTATATG---GCCCCTA 1 CTGAATATGCAACTATATGATTG-CCCTA * 1293 CTGAATATGCGACTATATGA---CCCTA 1 CTGAATATGCAACTATATGATTGCCCTA * 1318 CTGAATATGCGACTATATG---GCCCTA 1 CTGAATATGCAACTATATGATTGCCCTA * * 1343 CTGAATATGCGACTATATGA---CCCAA 1 CTGAATATGCAACTATATGATTGCCCTA * 1368 CTGAATATGCAACTATATGATTATGGGCCTA 1 CTGAATATGCAACTATATGA-T-T-GCCCTA * 1399 CTGATTATGCAACTATATGATTATGGCCCTA 1 CTGAATATGCAACTATATGA-T-T-GCCCTA * 1430 CTGGATATGCAACTATATGATTATGGCCCTA 1 CTGAATATGCAACTATATGA-T-T-GCCCTA * * 1461 CTGAACATGCAACTATATG---GCTCTA 1 CTGAATATGCAACTATATGATTGCCCTA * 1486 CTGAATATGCAACGTATATAATTATGGCCCTA 1 CTGAATATGCAAC-TATATGA-T-T-GCCCTA * * * 1518 CAGAAAATGCAACTATATGGTTATGGCCCTA 1 CTGAATATGCAACTATAT-G--ATTGCCCTA 1549 CTGAATATGCAACTATATG---GCCCTA 1 CTGAATATGCAACTATATGATTGCCCTA 1574 CTGAATATGCAACTATATG---GCCCTA 1 CTGAATATGCAACTATATGATTGCCCTA * 1599 CTGAATATGCAACT-TATG---GCCCAA 1 CTGAATATGCAACTATATGATTGCCCTA * 1623 CTAAATATGCAACTATATG---GCCCTA 1 CTGAATATGCAACTATATGATTGCCCTA 1648 CTGAATATGCAACTATATG---GCCCTA 1 CTGAATATGCAACTATATGATTGCCCTA * 1673 CTGAATATGCAACTATATGATTATGAACCTA 1 CTGAATATGCAACTATATGA-T-TG-CCCTA 1704 CTGAATATGCAACTATATGATTATGACCCTA 1 CTGAATATGCAACTATATGA-T-TG-CCCTA 1735 CTGAATATGCAACTATATG---GCCCTA 1 CTGAATATGCAACTATATGATTGCCCTA * 1760 CTGAATATGCAACTATATG---GTCCTA 1 CTGAATATGCAACTATATGATTGCCCTA * 1785 CTGAATATGCAGCTATATG---GCCCTA 1 CTGAATATGCAACTATATGATTGCCCTA 1810 CTGAATATGCAACTATATGATTATAGGACCCTA 1 CTGAATATGCAACTATATGA-T-T--G-CCCTA 1843 CTGAATATGCAACTATATGATTATGGCCCTA 1 CTGAATATGCAACTATATGA-T-T-GCCCTA 1874 CTGAATATGCAACTATATGA-T-CCCTA 1 CTGAATATGCAACTATATGATTGCCCTA 1900 CTGAATATGCAACTATATG---GCCCTA 1 CTGAATATGCAACTATATGATTGCCCTA **** 1925 CTGAATATGCAACTATATGATT-ATGGA 1 CTGAATATGCAACTATATGATTGCCCTA * 1952 CTGAATATGCAACTACATGA---CCCTA 1 CTGAATATGCAACTATATGATTGCCCTA 1977 CTGAATATGCAACTATATGATT-CCCTA 1 CTGAATATGCAACTATATGATTGCCCTA * 2004 -TG-ATAATGCAACTA-AT-ATGGCCCTA 1 CTGAAT-ATGCAACTATATGATTGCCCTA 2029 CTGAATATGCAACTATATGATT-CCCTA 1 CTGAATATGCAACTATATGATTGCCCTA * 2056 CTGAATATGCAATTATATGATT-CCCTA 1 CTGAATATGCAACTATATGATTGCCCTA 2083 CTGAATATGCAACTATATG---GCCCCTA 1 CTGAATATGCAACTATATGATTG-CCCTA 2109 CTGAATATGCAACTATATGATT-CCCTA 1 CTGAATATGCAACTATATGATTGCCCTA 2136 CTGAATATGCAACTATAT 1 CTGAATATGCAACTATAT Statistics Matches: 843, Mismatches: 50, Indels: 106 0.84 0.05 0.11 Matches are distributed among these distances: 24 24 0.03 25 308 0.37 26 124 0.15 27 101 0.12 28 3 0.00 30 2 0.00 31 231 0.27 32 19 0.02 33 30 0.04 34 1 0.00 ACGTcount: A:0.33, C:0.21, G:0.15, T:0.30 Consensus pattern (28 bp): CTGAATATGCAACTATATGATTGCCCTA Found at i:1421 original size:16 final size:16 Alignment explanation

Indices: 1373--1454 Score: 64 Period size: 16 Copynumber: 5.2 Consensus size: 16 1363 CCCAACTGAA 1373 TATGCAACTATATGAT 1 TATGCAACTATATGAT *** * 1389 TATGGGCCTA-CTGAT 1 TATGCAACTATATGAT 1404 TATGCAACTATATGAT 1 TATGCAACTATATGAT * * 1420 TATGGC-CCTACT-GGA- 1 TAT-GCAACTA-TATGAT 1435 TATGCAACTATATGAT 1 TATGCAACTATATGAT 1451 TATG 1 TATG 1455 GCCCTACTGA Statistics Matches: 48, Mismatches: 12, Indels: 12 0.67 0.17 0.17 Matches are distributed among these distances: 14 3 0.06 15 19 0.40 16 23 0.48 17 3 0.06 ACGTcount: A:0.30, C:0.16, G:0.18, T:0.35 Consensus pattern (16 bp): TATGCAACTATATGAT Found at i:1762 original size:186 final size:178 Alignment explanation

Indices: 1244--2153 Score: 895 Period size: 186 Copynumber: 4.8 Consensus size: 178 1234 GACCATACTG * * 1244 AATATGCAACT-GTATGGCCCCTACTGAATATGCAACTATATGGCCCCTACTGAATATGCGACTA 1 AATATGCAACTAATATGG-CCCTACTGAATATGCAACTATATGG-CCCTACTGAATATGCAACTA * * * * 1308 TATG--A-CCCTACTGAATATGCGACTATATGGCCCTACTGAATATGCGACTATATGACCCAACT 64 TATGATATCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATATGGCCCTACT * * * 1370 GAATATGCAACTATATGATTATGGGCCTACTGATTATGCAACTATATGATTATGGCCCTACTG 129 GAATATGCAAC----T-A-TATGGCCCTACTGAATATGCAAC----T-A-TATGGCCC-ACTA * * * 1433 GATATGCAACTATATGATTATGGCCCTACTGAACATGCAACTATATGGCTCTACTGAATATGCAA 1 AATATGCAAC--TA--A-TATGGCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAA * * * 1498 CGTATATAATTATGGCCCTACAGAAAATGCAACTATATGGTTATGGCCCTACTGAATATGCAACT 61 C-TATATGA-TAT--CCCTACTGAATATGCAAC--TA----TATGGCCCTACTGAATATGCAACT 1563 ATATGGCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACT-TATGGCCCAACTA 116 ATATGGCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATATGGCCC-ACTA 1626 AATATGCAACT-ATATGGCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATA 1 AATATGCAACTAATATGGCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATA * 1690 TGATTATGAACCTACTGAATATGCAACTATATGATTATGACCCTACTGAATATGCAACTATATGG 66 TGA-TAT--CCCTACTGAATATGCAACTATATG-----G-CCCTACTGAATATGCAACTATATGG * * * 1755 CCCTACTGAATATGCAACTATATGGTCCTACTGAATATGCAGCTATATGGCCCTACTG 122 CCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATATGGCCC-ACTA 1813 AATATGCAACTATATGATTATAGGACCCTACTGAATATGCAACTATATGATTATGGCCCTACTGA 1 AATATGCAAC--TA--A-TAT-GG-CCCTACTGAATATGCAAC----T-A-TATGGCCCTACTGA 1878 ATATGCAACTATATG--ATCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTAT 53 ATATGCAACTATATGATATCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTAT **** * * ** 1941 ATGATTATGGACTGAATATGCAACTACATGACCCTACTGAATATGCAACTATATGATTCC-CTA 118 ATGGCCCT--ACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATATG-GCCCACTA * * * 2004 TGATAATGCAACTAATATGGCCCTACTGAATATGCAACTATATGATTCCCTACTGAATATGCAAT 1 -AAT-ATGCAACTAATATGGCCCTACTGAATATGCAACTATATG--GCCCTACTGAATATGCAAC * 2069 TATATGAT-TCCCTACTGAATATGCAACTATATGGCCCCTACTGAATATGCAACTATATGATTCC 62 TATATGATATCCCTACTGAATATGCAACTATATGG-CCCTACTGAATATGCAACTATATG--GCC 2133 CTACTGAATATGCAACTATAT 124 CTACTGAATATGCAACTATAT Statistics Matches: 621, Mismatches: 48, Indels: 109 0.80 0.06 0.14 Matches are distributed among these distances: 180 8 0.01 181 1 0.00 182 24 0.04 183 26 0.04 184 44 0.07 185 1 0.00 186 112 0.18 187 69 0.11 188 4 0.01 189 11 0.02 190 25 0.04 191 7 0.01 192 44 0.07 193 48 0.08 194 31 0.05 195 23 0.04 196 24 0.04 197 1 0.00 198 2 0.00 199 1 0.00 200 37 0.06 201 30 0.05 202 3 0.00 206 45 0.07 ACGTcount: A:0.33, C:0.22, G:0.15, T:0.30 Consensus pattern (178 bp): AATATGCAACTAATATGGCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATA TGATATCCCTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATATGGCCCTACTGA ATATGCAACTATATGGCCCTACTGAATATGCAACTATATGGCCCACTA Found at i:1842 original size:33 final size:31 Alignment explanation

Indices: 1800--2153 Score: 311 Period size: 27 Copynumber: 12.9 Consensus size: 31 1790 TATGCAGCTA 1800 TATGGCCCTACTGAATATGCAACTATATGAT 1 TATGGCCCTACTGAATATGCAACTATATGAT 1831 TATAGGACCCTACTGAATATGCAACTATATGAT 1 TAT-GG-CCCTACTGAATATGCAACTATATGAT 1864 TATGGCCCTACTGAATATGCAACTATATG-- 1 TATGGCCCTACTGAATATGCAACTATATGAT 1893 -AT--CCCTACTGAATATGCAAC----T-A- 1 TATGGCCCTACTGAATATGCAACTATATGAT 1915 TATGGCCCTACTGAATATGCAACTATATGAT 1 TATGGCCCTACTGAATATGCAACTATATGAT * 1946 TATGG----ACTGAATATGCAACTACATG-- 1 TATGGCCCTACTGAATATGCAACTATATGAT 1971 -A---CCCTACTGAATATGCAACTATATGA- 1 TATGGCCCTACTGAATATGCAACTATATGAT 1997 T-T--CCCTA-TG-ATAATGCAAC--TA--A- 1 TATGGCCCTACTGAAT-ATGCAACTATATGAT 2019 TATGGCCCTACTGAATATGCAACTATATGA- 1 TATGGCCCTACTGAATATGCAACTATATGAT * 2049 T-T--CCCTACTGAATATGCAATTATATGA- 1 TATGGCCCTACTGAATATGCAACTATATGAT 2076 T-T--CCCTACTGAATATGCAACTATATG-- 1 TATGGCCCTACTGAATATGCAACTATATGAT * 2102 ---GCCCCTACTGAATATGCAACTATATGA- 1 TATGGCCCTACTGAATATGCAACTATATGAT 2129 T-T--CCCTACTGAATATGCAACTATAT 1 TATGGCCCTACTGAATATGCAACTATAT Statistics Matches: 285, Mismatches: 4, Indels: 72 0.79 0.01 0.20 Matches are distributed among these distances: 22 3 0.01 23 3 0.01 24 3 0.01 25 44 0.15 26 60 0.21 27 98 0.34 28 4 0.01 29 2 0.01 30 3 0.01 31 32 0.11 32 4 0.01 33 29 0.10 ACGTcount: A:0.34, C:0.21, G:0.14, T:0.31 Consensus pattern (31 bp): TATGGCCCTACTGAATATGCAACTATATGAT Found at i:1977 original size:52 final size:50 Alignment explanation

Indices: 1840--2153 Score: 353 Period size: 52 Copynumber: 5.9 Consensus size: 50 1830 TTATAGGACC * 1840 CTACTGAATATGCAACTATATGATTATGGCCCTACTGAATATGCAACTATATGATCC 1 CTACTGAATATGCAACTATATG---A---CCCTACTGAATATGCAACTATATGAT-T * 1897 CTACTGAATATGCAACTATATGGCCCTACTGAATATGCAACTATATGATT 1 CTACTGAATATGCAACTATATGACCCTACTGAATATGCAACTATATGATT * * 1947 ATGGACTGAATATGCAACTACATGACCCTACTGAATATGCAACTATATGATT 1 CT--ACTGAATATGCAACTATATGACCCTACTGAATATGCAACTATATGATT * 1999 CCCTA-TG-ATAATGCAACTAATATGGCCCTACTGAATATGCAACTATATGATT 1 --CTACTGAAT-ATGCAACT-ATATGACCCTACTGAATATGCAACTATATGATT * *** 2051 CCCTACTGAATATGCAATTATATGATTCCCTACTGAATATGCAACTATATGGCCC 1 --CTACTGAATATGCAACTATATGA--CCCTACTGAATATGCAACTATAT-GATT 2106 CTACTGAATATGCAACTATATGATTCCCTACTGAATATGCAACTATAT 1 CTACTGAATATGCAACTATATGA--CCCTACTGAATATGCAACTATAT Statistics Matches: 232, Mismatches: 14, Indels: 26 0.85 0.05 0.10 Matches are distributed among these distances: 50 3 0.01 51 36 0.16 52 88 0.38 53 56 0.24 54 26 0.11 55 1 0.00 57 22 0.09 ACGTcount: A:0.34, C:0.21, G:0.13, T:0.31 Consensus pattern (50 bp): CTACTGAATATGCAACTATATGACCCTACTGAATATGCAACTATATGATT Found at i:2134 original size:80 final size:78 Alignment explanation

Indices: 1864--2153 Score: 419 Period size: 80 Copynumber: 3.7 Consensus size: 78 1854 ACTATATGAT * 1864 TATGGCCCTACTGAATATGCAACTATATGATCCCTACTGAATATGCAACTATATG--GCCCTACT 1 TATGGCCCTACTGAATATGCAACTATATGATCCCTACTGAATATGCAACTATATGATTCCCTACT 1927 GAATATGCAACTA 66 GAATATGCAACTA **** * 1940 TATGATTATGGACTGAATATGCAACTACATGA-CCCTACTGAATATGCAACTATATGATTCCCTA 1 TATGGCCCT--ACTGAATATGCAACTATATGATCCCTACTGAATATGCAACTATATGATTCCCTA 2004 -TG-ATAATGCAACTAA 64 CTGAAT-ATGCAACT-A * 2019 TATGGCCCTACTGAATATGCAACTATATGATTCCCTACTGAATATGCAATTATATGATTCCCTAC 1 TATGGCCCTACTGAATATGCAACTATATGA-TCCCTACTGAATATGCAACTATATGATTCCCTAC 2084 TGAATATGCAACTA 65 TGAATATGCAACTA 2098 TATGGCCCCTACTGAATATGCAACTATATGATTCCCTACTGAATATGCAACTATAT 1 TATGG-CCCTACTGAATATGCAACTATATGA-TCCCTACTGAATATGCAACTATAT Statistics Matches: 190, Mismatches: 13, Indels: 18 0.86 0.06 0.08 Matches are distributed among these distances: 76 5 0.03 77 46 0.24 78 30 0.16 79 48 0.25 80 59 0.31 81 2 0.01 ACGTcount: A:0.34, C:0.22, G:0.13, T:0.31 Consensus pattern (78 bp): TATGGCCCTACTGAATATGCAACTATATGATCCCTACTGAATATGCAACTATATGATTCCCTACT GAATATGCAACTA Done.