Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01006942.1 Corchorus capsularis cultivar CVL-1 contig06963, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 35328
ACGTcount: A:0.33, C:0.18, G:0.16, T:0.32


Found at i:41 original size:20 final size:20

Alignment explanation

Indices: 3--41 Score: 53 Period size: 20 Copynumber: 1.9 Consensus size: 20 1 TC * 3 ATTATAAGGTTATCGAGAAA 1 ATTATAAGGTTATCCAGAAA 23 ATTATAAAGGTTA-CCAGAA 1 ATTAT-AAGGTTATCCAGAA 42 CGTTATACTA Statistics Matches: 17, Mismatches: 1, Indels: 2 0.85 0.05 0.10 Matches are distributed among these distances: 20 10 0.59 21 7 0.41 ACGTcount: A:0.46, C:0.08, G:0.18, T:0.28 Consensus pattern (20 bp): ATTATAAGGTTATCCAGAAA Found at i:181 original size:20 final size:20 Alignment explanation

Indices: 152--200 Score: 64 Period size: 20 Copynumber: 2.4 Consensus size: 20 142 CTTCAGAAGG * 152 TATAAAATTATTAA-AAATGT 1 TATAATATTATTAATAAAT-T 172 TATAATATTATTAATAAATT 1 TATAATATTATTAATAAATT 192 TAGTAATAT 1 TA-TAATAT 201 CTTACATTCT Statistics Matches: 26, Mismatches: 1, Indels: 3 0.87 0.03 0.10 Matches are distributed among these distances: 20 16 0.62 21 10 0.38 ACGTcount: A:0.51, C:0.00, G:0.04, T:0.45 Consensus pattern (20 bp): TATAATATTATTAATAAATT Found at i:10396 original size:17 final size:17 Alignment explanation

Indices: 10376--10411 Score: 54 Period size: 17 Copynumber: 2.1 Consensus size: 17 10366 TATTATTTTC * * 10376 TTTTTCTTGTTCATTTA 1 TTTTTATTGTTCACTTA 10393 TTTTTATTGTTCACTTA 1 TTTTTATTGTTCACTTA 10410 TT 1 TT 10412 CACAAAACTC Statistics Matches: 17, Mismatches: 2, Indels: 0 0.89 0.11 0.00 Matches are distributed among these distances: 17 17 1.00 ACGTcount: A:0.14, C:0.11, G:0.06, T:0.69 Consensus pattern (17 bp): TTTTTATTGTTCACTTA Found at i:11128 original size:59 final size:59 Alignment explanation

Indices: 11036--11153 Score: 227 Period size: 59 Copynumber: 2.0 Consensus size: 59 11026 CATTATATAC * 11036 GTAAAACATCAATCAATGTTACTACCAGATATGTTAAGGAAAATTATTCAATACGCTGT 1 GTAAAACATCAATCAATGTTACTACCAGATATGTTAAGGAAAATTATTCAATACACTGT 11095 GTAAAACATCAATCAATGTTACTACCAGATATGTTAAGGAAAATTATTCAATACACTGT 1 GTAAAACATCAATCAATGTTACTACCAGATATGTTAAGGAAAATTATTCAATACACTGT 11154 CAGTGGAGTT Statistics Matches: 58, Mismatches: 1, Indels: 0 0.98 0.02 0.00 Matches are distributed among these distances: 59 58 1.00 ACGTcount: A:0.42, C:0.15, G:0.13, T:0.31 Consensus pattern (59 bp): GTAAAACATCAATCAATGTTACTACCAGATATGTTAAGGAAAATTATTCAATACACTGT Found at i:11356 original size:2 final size:2 Alignment explanation

Indices: 11343--11378 Score: 63 Period size: 2 Copynumber: 18.0 Consensus size: 2 11333 AAATGTGAAC * 11343 AT AT AC AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT 1 AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT 11379 TCGTTATCTC Statistics Matches: 32, Mismatches: 2, Indels: 0 0.94 0.06 0.00 Matches are distributed among these distances: 2 32 1.00 ACGTcount: A:0.50, C:0.03, G:0.00, T:0.47 Consensus pattern (2 bp): AT Found at i:11627 original size:29 final size:28 Alignment explanation

Indices: 11585--11642 Score: 71 Period size: 29 Copynumber: 2.0 Consensus size: 28 11575 AAATGGATTG * 11585 CATGACCCGAATTTTAAACAATTTTGGTC 1 CATGACCCGAATTTT-AACAATTTTAGTC * * * 11614 CATGACCTGGATTTTAGCAATTTTAGTC 1 CATGACCCGAATTTTAACAATTTTAGTC 11642 C 1 C 11643 TTTCTTAAAT Statistics Matches: 25, Mismatches: 4, Indels: 1 0.83 0.13 0.03 Matches are distributed among these distances: 28 12 0.48 29 13 0.52 ACGTcount: A:0.28, C:0.21, G:0.16, T:0.36 Consensus pattern (28 bp): CATGACCCGAATTTTAACAATTTTAGTC Found at i:11694 original size:14 final size:14 Alignment explanation

Indices: 11675--11711 Score: 65 Period size: 14 Copynumber: 2.6 Consensus size: 14 11665 CATTAAAAGG 11675 TTTATACTAGAAGA 1 TTTATACTAGAAGA * 11689 TTTATACTAGAAGG 1 TTTATACTAGAAGA 11703 TTTATACTA 1 TTTATACTA 11712 TAAATGACCT Statistics Matches: 22, Mismatches: 1, Indels: 0 0.96 0.04 0.00 Matches are distributed among these distances: 14 22 1.00 ACGTcount: A:0.38, C:0.08, G:0.14, T:0.41 Consensus pattern (14 bp): TTTATACTAGAAGA Found at i:12332 original size:29 final size:29 Alignment explanation

Indices: 12298--12361 Score: 101 Period size: 29 Copynumber: 2.2 Consensus size: 29 12288 TTCTTCTTAC ** * 12298 TCTTCTTAATTTCTCCTTTTCTCTAGTTG 1 TCTTCTTAACCTCTCCTTTTCTCTAGTTA 12327 TCTTCTTAACCTCTCCTTTTCTCTAGTTA 1 TCTTCTTAACCTCTCCTTTTCTCTAGTTA 12356 TCTTCT 1 TCTTCT 12362 ATTTCTTCTT Statistics Matches: 32, Mismatches: 3, Indels: 0 0.91 0.09 0.00 Matches are distributed among these distances: 29 32 1.00 ACGTcount: A:0.11, C:0.28, G:0.05, T:0.56 Consensus pattern (29 bp): TCTTCTTAACCTCTCCTTTTCTCTAGTTA Found at i:15282 original size:35 final size:34 Alignment explanation

Indices: 15240--16062 Score: 971 Period size: 35 Copynumber: 23.7 Consensus size: 34 15230 TTCCTACTAA * 15240 ACTTAATTACCCTGAATTAAGTT-ACTTATTGAACT 1 ACTTAATTACCCTGAATTAAGTTGA-TTACTG-ACT * 15275 ACATAATTACCCTGAATTAAGGTTGATTACTGACT 1 ACTTAATTACCCTGAATTAA-GTTGATTACTGACT * 15310 CACTTAATTACCCTGAATTAAGTTGATTACTGAATT 1 -ACTTAATTACCCTGAATTAAGTTGATTACTG-ACT 15346 ACTTAATTACCCTGAATTAAGTTGATTACTGACT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGACT * * 15380 CTCTTAATTACCCTGAATTAAGTTGATTACTGAATT 1 -ACTTAATTACCCTGAATTAAGTTGATTACTG-ACT 15416 ACTTAATTACCCTGAATTAAGTTGATTACTGACT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGACT 15450 CACTTAATTACCCTGAATTAAGTTGATTACTGACT 1 -ACTTAATTACCCTGAATTAAGTTGATTACTGACT * * 15485 CACTTAATTACCCTGAATTAAGTTGATTACTTAATT 1 -ACTTAATTACCCTGAATTAAGTTGATTAC-TGACT * * 15521 ACTTAACTACCCTGAATTAAGTTGATTACTGAATT 1 ACTTAATTACCCTGAATTAAGTTGATTACTG-ACT * 15556 ACTTAATAACCCTGAATTAAGTTGATTACTGACT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGACT * 15590 CACTTAATTACCCTGAATTAAGTTGATTACTGAATT 1 -ACTTAATTACCCTGAATTAAGTTGATTACTG-ACT 15626 ACTTAATTACCCTGAATTAAGTTGATTACTGACT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGACT * * 15660 CTCTTAATTACCTTGAATTAAGTTGATTACTGACT 1 -ACTTAATTACCCTGAATTAAGTTGATTACTGACT * 15695 CACTTAATTACCCTGAATTAAGTTGATTACTGAATT 1 -ACTTAATTACCCTGAATTAAGTTGATTACTG-ACT 15731 ACTTAATTACCCTGAATTAAGTTGATTAC---CTT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGAC-T * * * 15763 ACTTAATTTCCCTGAACTAAGTT-ACTAACTGACTTT 1 ACTTAATTACCCTGAATTAAGTTGA-TTACTGAC--T * 15799 ACTTAATTACCCTGAATTAAGCT-ACTTACTG--- 1 ACTTAATTACCCTGAATTAAGTTGA-TTACTGACT * * * 15830 ACTTAATTACCCTTAATTAAGTT-ACCTA-TTACTT 1 ACTTAATTACCCTGAATTAAGTTGA-TTACTGAC-T 15864 ACTTAATTACCCTGAATTAAGTTG--T--TGACTT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGAC-T * * 15895 ACTTAGTTACCTTGAATTAAGTT-ATTTACTGACTT 1 ACTTAATTACCCTGAATTAAGTTGA-TTACTGAC-T * * 15930 TCTTAATTACCCTGAATTAAGTTACCGACTTACTAACTT 1 ACTTAATTACCCTGAATTAAGTT---GA-TTACTGAC-T 15969 ACTTAATTACCCTGAATTAAGTT-ATTCACTGACCT 1 ACTTAATTACCCTGAATTAAGTTGATT-ACTGA-CT 16004 ACTTAATTTACCCTGAATTAAGTT-ATTCACTGATCT 1 ACTTAA-TTACCCTGAATTAAGTTGATT-ACTGA-CT 16040 ACTTAATTACCCTGAATTAAGTT 1 ACTTAATTACCCTGAATTAAGTT 16063 ACTTATTACT Statistics Matches: 704, Mismatches: 48, Indels: 72 0.85 0.06 0.09 Matches are distributed among these distances: 30 1 0.00 31 52 0.07 32 26 0.04 33 1 0.00 34 33 0.05 35 456 0.65 36 102 0.14 37 1 0.00 39 32 0.05 ACGTcount: A:0.32, C:0.18, G:0.10, T:0.39 Consensus pattern (34 bp): ACTTAATTACCCTGAATTAAGTTGATTACTGACT Found at i:15444 original size:105 final size:105 Alignment explanation

Indices: 15240--16062 Score: 1089 Period size: 105 Copynumber: 7.9 Consensus size: 105 15230 TTCCTACTAA * * 15240 ACTTAATTACCCTGAATTAAGTT-ACTTATTGAACT-ACATAATTACCCTGAATTAAGGTTGATT 1 ACTTAATTACCCTGAATTAAGTTGA-TTACTG-ACTCACTTAATTACCCTGAATTAA-GTTGATT * * * 15303 ACTGACTCACTTAATTACCCTGAATTAAGTTGATTACTGAATT 63 ACTGAATTACTTAATTACCCTGAATTAAGTTGATTACTGACTT * 15346 ACTTAATTACCCTGAATTAAGTTGATTACTGACTCTCTTAATTACCCTGAATTAAGTTGATTACT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGACTCACTTAATTACCCTGAATTAAGTTGATTACT * 15411 GAATTACTTAATTACCCTGAATTAAGTTGATTACTGACTC 66 GAATTACTTAATTACCCTGAATTAAGTTGATTACTGACTT 15451 ACTTAATTACCCTGAATTAAGTTGATTACTGACTCACTTAATTACCCTGAATTAAGTTGATTACT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGACTCACTTAATTACCCTGAATTAAGTTGATTACT * * * 15516 TAATTACTTAACTACCCTGAATTAAGTTGATTACTGAATT 66 GAATTACTTAATTACCCTGAATTAAGTTGATTACTGACTT * 15556 ACTTAATAACCCTGAATTAAGTTGATTACTGACTCACTTAATTACCCTGAATTAAGTTGATTACT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGACTCACTTAATTACCCTGAATTAAGTTGATTACT 15621 GAATTACTTAATTACCCTGAATTAAGTTGATTACTGACTCT 66 GAATTACTTAATTACCCTGAATTAAGTTGATTACTGACT-T * 15662 -CTTAATTACCTTGAATTAAGTTGATTACTGACTCACTTAATTACCCTGAATTAAGTTGATTACT 1 ACTTAATTACCCTGAATTAAGTTGATTACTGACTCACTTAATTACCCTGAATTAAGTTGATTACT 15726 GAATTACTTAATTACCCTGAATTAAGTTGATTAC---CTT 66 GAATTACTTAATTACCCTGAATTAAGTTGATTACTGACTT * * * * * 15763 ACTTAATTTCCCTGAACTAAGTT-ACTAACTGACTTTACTTAATTACCCTGAATTAAGCT-ACTT 1 ACTTAATTACCCTGAATTAAGTTGA-TTACTGAC-TCACTTAATTACCCTGAATTAAGTTGA-TT * * * 15826 ACTG----ACTTAATTACCCTTAATTAAGTT-ACCTA-TTACTT 63 ACTGAATTACTTAATTACCCTGAATTAAGTTGA-TTACTGACTT * * * 15864 ACTTAATTACCCTGAATTAAGTTG--T--TGACTTACTTAGTTACCTTGAATTAAGTT-ATTTAC 1 ACTTAATTACCCTGAATTAAGTTGATTACTGACTCACTTAATTACCCTGAATTAAGTTGA-TTAC * * * 15924 TGACTTTCTTAATTACCCTGAATTAAGTTACCGACTTACTAACTT 65 TGAATTACTTAATTACCCTGAATTAAGTT---GA-TTACTGACTT 15969 ACTTAATTACCCTGAATTAAGTT-ATTCACTGAC-CTACTTAATTTACCCTGAATTAAGTT-ATT 1 ACTTAATTACCCTGAATTAAGTTGATT-ACTGACTC-ACTTAA-TTACCCTGAATTAAGTTGATT 16031 CACTG-ATCTACTTAATTACCCTGAATTAAGTT 63 -ACTGAAT-TACTTAATTACCCTGAATTAAGTT 16063 ACTTATTACT Statistics Matches: 645, Mismatches: 42, Indels: 56 0.87 0.06 0.08 Matches are distributed among these distances: 96 29 0.04 97 4 0.01 98 1 0.00 99 24 0.04 100 21 0.03 101 26 0.04 102 29 0.04 103 29 0.04 104 4 0.01 105 373 0.58 106 48 0.07 107 1 0.00 109 12 0.02 110 44 0.07 ACGTcount: A:0.32, C:0.18, G:0.10, T:0.39 Consensus pattern (105 bp): ACTTAATTACCCTGAATTAAGTTGATTACTGACTCACTTAATTACCCTGAATTAAGTTGATTACT GAATTACTTAATTACCCTGAATTAAGTTGATTACTGACTT Found at i:15572 original size:18 final size:18 Alignment explanation

Indices: 15240--15749 Score: 234 Period size: 16 Copynumber: 29.1 Consensus size: 18 15230 TTCCTACTAA 15240 ACTTAATTACCCTGAATT 1 ACTTAATTACCCTGAATT * * * * 15258 AAGTTACTTA--TTGAACT 1 -ACTTAATTACCCTGAATT * 15275 ACATAATTACCCTGAATT 1 ACTTAATTACCCTGAATT * * * * 15293 AAGGTTGATTA--CTGACTC 1 -A-CTTAATTACCCTGAATT 15311 ACTTAATTACCCTGAATT 1 ACTTAATTACCCTGAATT * * 15329 AAGTTGATTA--CTGAATT 1 -ACTTAATTACCCTGAATT 15346 ACTTAATTACCCTGAATT 1 ACTTAATTACCCTGAATT * * * 15364 AAGTTGATTA--CTGACTCT 1 -ACTTAATTACCCTGAAT-T 15382 -CTTAATTACCCTGAATT 1 ACTTAATTACCCTGAATT * * 15399 AAGTTGATTA--CTGAATT 1 -ACTTAATTACCCTGAATT 15416 ACTTAATTACCCTGAATT 1 ACTTAATTACCCTGAATT * * * * 15434 AAGTTGATTA--CTGACTC 1 -ACTTAATTACCCTGAATT 15451 ACTTAATTACCCTGAATT 1 ACTTAATTACCCTGAATT * * * * 15469 AAGTTGATTA--CTGACTC 1 -ACTTAATTACCCTGAATT 15486 ACTTAATTACCCTGAATT 1 ACTTAATTACCCTGAATT * * * 15504 AAGTTGATTA--CTTAATT 1 -ACTTAATTACCCTGAATT * 15521 ACTTAACTACCCTGAATT 1 ACTTAATTACCCTGAATT * * 15539 AAGTTGATTA--CTGAATT 1 -ACTTAATTACCCTGAATT * 15556 ACTTAATAACCCTGAATT 1 ACTTAATTACCCTGAATT * * * * 15574 AAGTTGATTA--CTGACTC 1 -ACTTAATTACCCTGAATT 15591 ACTTAATTACCCTGAATT 1 ACTTAATTACCCTGAATT * * 15609 AAGTTGATTA--CTGAATT 1 -ACTTAATTACCCTGAATT 15626 ACTTAATTACCCTGAATT 1 ACTTAATTACCCTGAATT * * * 15644 AAGTTGATTA--CTGACTCT 1 -ACTTAATTACCCTGAAT-T * 15662 -CTTAATTACCTTGAATT 1 ACTTAATTACCCTGAATT * * * * 15679 AAGTTGATTA--CTGACTC 1 -ACTTAATTACCCTGAATT 15696 ACTTAATTACCCTGAATT 1 ACTTAATTACCCTGAATT * * 15714 AAGTTGATTA--CTGAATT 1 -ACTTAATTACCCTGAATT 15731 ACTTAATTACCCTGAATT 1 ACTTAATTACCCTGAATT 15749 A 1 A 15750 AGTTGATTAC Statistics Matches: 351, Mismatches: 94, Indels: 93 0.65 0.17 0.17 Matches are distributed among these distances: 16 92 0.26 17 78 0.22 18 88 0.25 19 88 0.25 20 5 0.01 ACGTcount: A:0.33, C:0.17, G:0.11, T:0.39 Consensus pattern (18 bp): ACTTAATTACCCTGAATT Found at i:21897 original size:44 final size:44 Alignment explanation

Indices: 21849--21941 Score: 177 Period size: 44 Copynumber: 2.1 Consensus size: 44 21839 GGCCTGCAAT 21849 GAACTTTGTCATTCTCTTCAATATAGTTTTCACAAATCTTTTGA 1 GAACTTTGTCATTCTCTTCAATATAGTTTTCACAAATCTTTTGA * 21893 GAACTTTGTCATTCTCTTCAATATGGTTTTCACAAATCTTTTGA 1 GAACTTTGTCATTCTCTTCAATATAGTTTTCACAAATCTTTTGA 21937 GAACT 1 GAACT 21942 ACCGCTTAAA Statistics Matches: 48, Mismatches: 1, Indels: 0 0.98 0.02 0.00 Matches are distributed among these distances: 44 48 1.00 ACGTcount: A:0.27, C:0.18, G:0.11, T:0.44 Consensus pattern (44 bp): GAACTTTGTCATTCTCTTCAATATAGTTTTCACAAATCTTTTGA Found at i:24764 original size:8 final size:8 Alignment explanation

Indices: 24751--24777 Score: 54 Period size: 8 Copynumber: 3.4 Consensus size: 8 24741 TTTTAAAGTT 24751 ATTAGAAA 1 ATTAGAAA 24759 ATTAGAAA 1 ATTAGAAA 24767 ATTAGAAA 1 ATTAGAAA 24775 ATT 1 ATT 24778 TCAACATCAA Statistics Matches: 19, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 8 19 1.00 ACGTcount: A:0.59, C:0.00, G:0.11, T:0.30 Consensus pattern (8 bp): ATTAGAAA Found at i:30851 original size:2 final size:2 Alignment explanation

Indices: 30846--30879 Score: 68 Period size: 2 Copynumber: 17.0 Consensus size: 2 30836 TGTGTGTGTC 30846 TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA 1 TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA 30880 CAGTACATAA Statistics Matches: 32, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 2 32 1.00 ACGTcount: A:0.50, C:0.00, G:0.00, T:0.50 Consensus pattern (2 bp): TA Done.