Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWUE01024441.1 Corchorus olitorius cultivar O-4 contig24474, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 15745
ACGTcount: A:0.34, C:0.16, G:0.17, T:0.33


Found at i:1017 original size:73 final size:68

Alignment explanation

Indices: 840--1033 Score: 300 Period size: 69 Copynumber: 2.8 Consensus size: 68 830 AATTAAATGA * * * 840 CATTAATACTAATTGATTTTAATTTGATC-AATATTCAAATCAATCAATCAATCAATCAATTTAA 1 CATTAGTACTAATTGATTCTAATTGGATCAAATATTCAAATCAATCAATCAATCAATCAATTTAA 904 TAT 66 TAT 907 CATTAGTACTAATTGATTCTAATTGGATCAAGATATTCAAATCAATCAATCAATCAATCAATTTA 1 CATTAGTACTAATTGATTCTAATTGGATCAA-ATATTCAAATCAATCAATCAATCAATCAATTTA 972 ATAT 65 ATAT 976 CATTTTAGTACTAATTGATTCTAATTGGATCAAAATATATTCAAATCAATCAATCAAT 1 CA--TTAGTACTAATTGATTCTAATTGGATC--AA-ATATTCAAATCAATCAATCAAT 1034 TTAATATATA Statistics Matches: 117, Mismatches: 4, Indels: 6 0.92 0.03 0.05 Matches are distributed among these distances: 67 26 0.22 68 1 0.01 69 39 0.33 71 27 0.23 73 24 0.21 ACGTcount: A:0.42, C:0.14, G:0.06, T:0.38 Consensus pattern (68 bp): CATTAGTACTAATTGATTCTAATTGGATCAAATATTCAAATCAATCAATCAATCAATCAATTTAA TAT Found at i:3361 original size:36 final size:35 Alignment explanation

Indices: 3321--4076 Score: 541 Period size: 36 Copynumber: 21.6 Consensus size: 35 3311 TAATGTCCCC * 3321 ACTTAATTACCTTGAATTAAGTTCTTTATTGACTTT 1 ACTTAATTACCCTGAATTAAG-TCTTTATTGACTTT * * 3357 ACTTATTTA-TCTCGAATTAAG--TTTATTGACTCTTT 1 ACTTAATTACCCT-GAATTAAGTCTTTATTGA--CTTT * * 3392 ACTTAATTACCCTGAATTAAGTCCTTGACT-ACTTTT 1 ACTTAATTACCCTGAATTAAGT-CTTTATTGAC-TTT 3428 ACTTAATTACCCTGAATTAAG--TTTATTGACTCTTT 1 ACTTAATTACCCTGAATTAAGTCTTTATTGA--CTTT * * 3463 ACTTAATTACCCTGAATTAAGTCCTTGACT-ACTTTT 1 ACTTAATTACCCTGAATTAAGT-CTTTATTGAC-TTT * 3499 ACTTAATTACCCAGAATTAAG--TTTATTGACTCTTT 1 ACTTAATTACCCTGAATTAAGTCTTTATTGA--CTTT 3534 ACTTAATTACCCTGAATTAAG-CTTT-TGCTGA-TTT 1 ACTTAATTACCCTGAATTAAGTCTTTAT--TGACTTT * ** * 3568 ACTTAACTACCCTGAATTAAGTCTGTGCTTGATTTT 1 ACTTAATTACCCTGAATTAAGTCT-TTATTGACTTT * * * ** 3604 ACCTAATTTCCTTGAAATTAAGTCCTTGCTTGA-TTT 1 ACTTAATTACCCTG-AATTAAGT-CTTTATTGACTTT * * 3640 GCTTAATTACCTTTGAATTAAGTCTTTGATTG-CTTT 1 ACTTAATTACC-CTGAATTAAGTCTTT-ATTGACTTT * * ** 3676 ACTTAATCACCCTGAATTAAGTTTTTGCTGA-TTT 1 ACTTAATTACCCTGAATTAAGTCTTTATTGACTTT * * 3710 ACTTAATTACCCTGAATTAAGT-TTGTGCTTGATTTT 1 ACTTAATTACCCTGAATTAAGTCTT-T-ATTGACTTT * * * ** * 3746 ACCTAATTTCCTTGAAATTAAGTCCTTGCTTGA-TTC 1 ACTTAATTACCCTG-AATTAAGT-CTTTATTGACTTT * 3782 ACTTAATTACCTTGAATTAAGTCTTTGATTG-CTTT 1 ACTTAATTACCCTGAATTAAGTCTTT-ATTGACTTT * 3817 ACTTAATCACCCTGAATTAAG--TTT-TTG----- 1 ACTTAATTACCCTGAATTAAGTCTTTATTGACTTT * ** * 3844 -C-TGATTACCCTGAATTAAGTCTGTGCTTGATTTT 1 ACTTAATTACCCTGAATTAAGTCT-TTATTGACTTT * * * * 3878 ACTTAA-TGCCTTGGAATTATGTCTTTCCTTGA-TTT 1 ACTTAATTACCCT-GAATTAAGTCTTT-ATTGACTTT * * * 3913 ACTTAATTATCTTGAATTAAGTCTTTGATTG-TTTT 1 ACTTAATTACCCTGAATTAAGTCTTT-ATTGACTTT * ** 3948 ACTTAATCACCCTGAATTAAGTCTTTGATTGTGTTT 1 ACTTAATTACCCTGAATTAAGTCTTT-ATTGACTTT * * 3984 ACTTAATTACCCTGAATTAAGTCTTTGCTTGATTTT 1 ACTTAATTACCCTGAATTAAGTCTTT-ATTGACTTT * * 4020 ACTTAATTGCCCTGAATTAAGTCTTTGCTTGA-TTT 1 ACTTAATTACCCTGAATTAAGTCTTT-ATTGACTTT 4055 CACTTAATTACCCTGAATTAAG 1 -ACTTAATTACCCTGAATTAAG 4077 GGGTTGTTTG Statistics Matches: 594, Mismatches: 70, Indels: 112 0.77 0.09 0.14 Matches are distributed among these distances: 25 16 0.03 26 1 0.00 27 1 0.00 28 1 0.00 29 3 0.01 31 3 0.01 33 21 0.04 34 55 0.09 35 191 0.32 36 253 0.43 37 37 0.06 38 10 0.02 39 2 0.00 ACGTcount: A:0.26, C:0.17, G:0.12, T:0.45 Consensus pattern (35 bp): ACTTAATTACCCTGAATTAAGTCTTTATTGACTTT Found at i:3409 original size:71 final size:70 Alignment explanation

Indices: 3321--4076 Score: 559 Period size: 71 Copynumber: 10.8 Consensus size: 70 3311 TAATGTCCCC * * * * * * 3321 ACTTAATTACCTTGAATTAAGTTCTTTATTGACTTTACTTATTTA-TCTCGAATTAAGTTTATTG 1 ACTTAATTACCCTGAATTAAGTCCTTGACTGA-TTTACTTAATTACCCT-GAATTAAGTTTATTG 3385 ACTCTTT 64 ACTCTTT 3392 ACTTAATTACCCTGAATTAAGTCCTTGACT-ACTTTTACTTAATTACCCTGAATTAAGTTTATTG 1 ACTTAATTACCCTGAATTAAGTCCTTGACTGA--TTTACTTAATTACCCTGAATTAAGTTTATTG 3456 ACTCTTT 64 ACTCTTT * 3463 ACTTAATTACCCTGAATTAAGTCCTTGACT-ACTTTTACTTAATTACCCAGAATTAAGTTTATTG 1 ACTTAATTACCCTGAATTAAGTCCTTGACTGA--TTTACTTAATTACCCTGAATTAAGTTTATTG 3527 ACTCTTT 64 ACTCTTT * * * 3534 ACTTAATTACCCTGAATTAAG-CTTTTG-CTGATTTACTTAACTACCCTGAATTAAGTCTGTGCT 1 ACTTAATTACCCTGAATTAAGTC-CTTGACTGATTTACTTAATTACCCTGAATTAAGT-T-T-AT 3597 TGA-T-TTT 62 TGACTCTTT * * * * * * 3604 ACCTAATTTCCTTGAAATTAAGTCCTTG-CTTGATTTGCTTAATTACCTTTGAATTAAGTCT-TT 1 ACTTAATTACCCTG-AATTAAGTCCTTGAC-TGATTTACTTAATTACC-CTGAATTAAGTTTATT * 3667 GATTGCTTT 63 GACT-CTTT * ** * 3676 ACTTAATCACCCTGAATTAAGTTTTTG-CTGATTTACTTAATTACCCTGAATTAAGTTTGTGCTT 1 ACTTAATTACCCTGAATTAAGTCCTTGACTGATTTACTTAATTACCCTGAATTAAG-TT-T-ATT 3740 GA-T-TTT 63 GACTCTTT * * * * * * 3746 ACCTAATTTCCTTGAAATTAAGTCCTTG-CTTGATTCACTTAATTACCTTGAATTAAGTCT-TTG 1 ACTTAATTACCCTG-AATTAAGTCCTTGAC-TGATTTACTTAATTACCCTGAATTAAGTTTATTG * 3809 ATTGCTTT 64 ACT-CTTT * * * * 3817 ACTTAATCACCCTGAATTAAG----T---T--TTTGC-TGATTACCCTGAATTAAGTCTGTGCTT 1 ACTTAATTACCCTGAATTAAGTCCTTGACTGATTTACTTAATTACCCTGAATTAAGT-T-T-ATT 3872 GA-T-TTT 63 GACTCTTT * * * ** * * * 3878 ACTTAA-TGCCTTGGAATTATGT-CTTTCCTTGATTTACTTAATTATCTTGAATTAAGTCT-TTG 1 ACTTAATTACCCT-GAATTAAGTCCTTGAC-TGATTTACTTAATTACCCTGAATTAAGTTTATTG * * 3940 ATTGTTTT 64 ACT-CTTT * * * * * 3948 ACTTAATCACCCTGAATTAAGTCTTTGATTGTGTTTACTTAATTACCCTGAATTAAGTCTTTGCT 1 ACTTAATTACCCTGAATTAAGTCCTTGACTG-ATTTACTTAATTACCCTGAATTAAG--TTT-AT 4013 TGA-T-TTT 62 TGACTCTTT * * 4020 ACTTAATTGCCCTGAATTAAGTCTTTG-CTTGATTTCACTTAATTACCCTGAATTAAG 1 ACTTAATTACCCTGAATTAAGTCCTTGAC-TGATTT-ACTTAATTACCCTGAATTAAG 4077 GGGTTGTTTG Statistics Matches: 563, Mismatches: 72, Indels: 99 0.77 0.10 0.13 Matches are distributed among these distances: 60 20 0.04 61 19 0.03 62 1 0.00 63 2 0.00 64 5 0.01 66 1 0.00 67 4 0.01 68 6 0.01 69 38 0.07 70 81 0.14 71 253 0.45 72 112 0.20 73 16 0.03 74 1 0.00 75 4 0.01 ACGTcount: A:0.26, C:0.17, G:0.12, T:0.45 Consensus pattern (70 bp): ACTTAATTACCCTGAATTAAGTCCTTGACTGATTTACTTAATTACCCTGAATTAAGTTTATTGAC TCTTT Found at i:3870 original size:25 final size:26 Alignment explanation

Indices: 3825--3875 Score: 77 Period size: 25 Copynumber: 2.0 Consensus size: 26 3815 TTACTTAATC * * 3825 ACCCTGAATTAAGTTTTTGC-TGATT 1 ACCCTGAATTAAGTCTGTGCTTGATT 3850 ACCCTGAATTAAGTCTGTGCTTGATT 1 ACCCTGAATTAAGTCTGTGCTTGATT 3876 TTACTTAATG Statistics Matches: 23, Mismatches: 2, Indels: 1 0.88 0.08 0.04 Matches are distributed among these distances: 25 18 0.78 26 5 0.22 ACGTcount: A:0.24, C:0.18, G:0.18, T:0.41 Consensus pattern (26 bp): ACCCTGAATTAAGTCTGTGCTTGATT Found at i:3929 original size:96 final size:95 Alignment explanation

Indices: 3761--4053 Score: 250 Period size: 96 Copynumber: 2.9 Consensus size: 95 3751 ATTTCCTTGA * * 3761 AATTAAGTCCTTGCTTGATTCACTTAATTACCTTGAATTAAGTCTTTGATTGCTTTACTTAATCA 1 AATTAAGTCCTTGCTTGATTCACTTAATTACCTTGAATTAAGTCTTTCATTGATTTACTTAATCA * 3826 CCCTGAATTAAGTTTTTGCTGATTACCCTG 66 CCCTGAATTAAGTCTTTGCTGATTACCCTG * * * * 3856 AATTAAGT-CTGTGCTTGATTTTACTTAA-TGCCTTGGAATTATGTCTTTCCTTGATTTACTTAA 1 AATTAAGTCCT-TGCTTGA-TTCACTTAATTACCTT-GAATTAAGTCTTTCATTGATTTACTTAA * * * * 3919 TTATCTTGAATTAAGTCTTTGATTGTTTTACTTAATCACCCTG 63 TCACCCTGAATTAAGTCTTTG-CTG----A--T--T-ACCCTG * * * * * 3962 AATTAAGTCTTTGATTGTGTTTACTTAATTACCCTGAATTAAGTCTTTGC-TTGATTTTACTTAA 1 AATTAAGTCCTTGCTTG-ATTCACTTAATTACCTTGAATTAAGTCTTT-CATTGA-TTTACTTAA ** 4026 TTGCCCTGAATTAAGTCTTTGCTTGATT 63 TCACCCTGAATTAAGTCTTTGC-TGATT 4054 TCACTTAATT Statistics Matches: 158, Mismatches: 21, Indels: 34 0.74 0.10 0.16 Matches are distributed among these distances: 94 2 0.01 95 20 0.13 96 49 0.31 97 2 0.01 99 1 0.01 101 2 0.01 103 2 0.01 105 1 0.01 106 44 0.28 107 35 0.22 ACGTcount: A:0.24, C:0.16, G:0.13, T:0.46 Consensus pattern (95 bp): AATTAAGTCCTTGCTTGATTCACTTAATTACCTTGAATTAAGTCTTTCATTGATTTACTTAATCA CCCTGAATTAAGTCTTTGCTGATTACCCTG Found at i:3950 original size:131 final size:137 Alignment explanation

Indices: 3321--4076 Score: 720 Period size: 142 Copynumber: 5.4 Consensus size: 137 3311 TAATGTCCCC * * * * * * 3321 ACTTAATTACCTT-GAATTAAGTTCTTT-ATTGACTTTACTTATTTATCTCGAATTAAGTTTATT 1 ACTTAATTGCCTTGGAATTAAG-TCTTTGCTTGA-TTTACTTAATTACCTTGAATTAAGTCT-TT * * * 3384 GACT-CTTTACTTAATTACCCTGAATTAAGTCCTTGACTACT-TTTACTTAATTACCCTGAATTA 63 GATTGCTTTACTTAATCACCCTGAATTAAGT--TT-A-T--TGTGT-CTTAATTACCCTGAATTA * 3447 AGT-T-T-ATTGACTCTTT 121 AGTCTGTGCTTGA-T-TTT * * * *** ** * 3463 ACTTAATTACCCT-GAATTAAGTCCTTGACTACTTTTACTTAATTACCCAGAATTAAGTTTATTG 1 ACTTAATTGCCTTGGAATTAAGTCTTTG-CTTGATTTACTTAATTACCTTGAATTAAGTCT-TTG * * * * 3527 ACT-CTTTACTTAATTACCCTGAATTAAGCTTT-TGCTGATTTACTTAACTACCCTGAATTAAGT 64 ATTGCTTTACTTAATCACCCTGAATTAAG-TTTAT--TG-TGT-CTTAATTACCCTGAATTAAGT 3590 CTGTGCTTGATTTT 124 CTGTGCTTGATTTT * * * * * 3604 ACCTAATTTCCTTGAAATTAAGTCCTTGCTTGATTTGCTTAATTACCTTTGAATTAAGTCTTTGA 1 ACTTAATTGCCTTGGAATTAAGTCTTTGCTTGATTTACTTAATTACC-TTGAATTAAGTCTTTGA * 3669 TTGCTTTACTTAATCACCCTGAATTAAGTTT-TTGCTGATTTACTTAATTACCCTGAATTAAGTT 65 TTGCTTTACTTAATCACCCTGAATTAAGTTTATTG-TG---T-CTTAATTACCCTGAATTAAGTC 3733 TGTGCTTGATTTT 125 TGTGCTTGATTTT * * * * * 3746 ACCTAATTTCCTTGAAATTAAGTCCTTGCTTGATTCACTTAATTACCTTGAATTAAGTCTTTGAT 1 ACTTAATTGCCTTGGAATTAAGTCTTTGCTTGATTTACTTAATTACCTTGAATTAAGTCTTTGAT * 3811 TGCTTTACTTAATCACCCTGAATTAAG-TT-TT-TG-C-TGATTACCCTGAATTAAGTCTGTGCT 66 TGCTTTACTTAATCACCCTGAATTAAGTTTATTGTGTCTTAATTACCCTGAATTAAGTCTGTGCT 3871 TGATTTT 131 TGATTTT * * * 3878 ACTTAA-TGCCTTGGAATTATGTCTTTCCTTGATTTACTTAATTATCTTGAATTAAGTCTTTGAT 1 ACTTAATTGCCTTGGAATTAAGTCTTTGCTTGATTTACTTAATTACCTTGAATTAAGTCTTTGAT * 3942 TGTTTTACTTAATCACCCTGAATTAAGTCTTTGATTGTGTTTACTTAATTACCCTGAATTAAGTC 66 TGCTTTACTTAATCACCCTGAATTAAG--TTT-ATTGTG--T-CTTAATTACCCTGAATTAAGTC * 4007 TTTGCTTGATTTT 125 TGTGCTTGATTTT * * 4020 ACTTAATTGCCCT-GAATTAAGTCTTTGCTTGATTTCACTTAATTACCCTGAATTAAG 1 ACTTAATTGCCTTGGAATTAAGTCTTTGCTTGATTT-ACTTAATTACCTTGAATTAAG 4077 GGGTTGTTTG Statistics Matches: 537, Mismatches: 50, Indels: 53 0.84 0.08 0.08 Matches are distributed among these distances: 131 77 0.14 132 36 0.07 133 1 0.00 134 2 0.00 136 2 0.00 137 2 0.00 138 5 0.01 139 3 0.01 140 28 0.05 141 90 0.17 142 261 0.49 143 30 0.06 ACGTcount: A:0.26, C:0.17, G:0.12, T:0.45 Consensus pattern (137 bp): ACTTAATTGCCTTGGAATTAAGTCTTTGCTTGATTTACTTAATTACCTTGAATTAAGTCTTTGAT TGCTTTACTTAATCACCCTGAATTAAGTTTATTGTGTCTTAATTACCCTGAATTAAGTCTGTGCT TGATTTT Found at i:4550 original size:36 final size:36 Alignment explanation

Indices: 4504--4595 Score: 114 Period size: 36 Copynumber: 2.6 Consensus size: 36 4494 ATTGCTTTAG * * 4504 TTAATCACCCTGAATTAAGTTTTTGCTTGAT-TACAC 1 TTAATTACCCTGAATTAAGTTTTTGATTG-TGTACAC * ** 4540 TTAATTACCCTGAATTAACTTTTTGATTGTGTTTAC 1 TTAATTACCCTGAATTAAGTTTTTGATTGTGTACAC * 4576 TTAATTACCTTGAATTAAGT 1 TTAATTACCCTGAATTAAGT 4596 CCTTGATTTT Statistics Matches: 48, Mismatches: 7, Indels: 2 0.84 0.12 0.04 Matches are distributed among these distances: 35 1 0.02 36 47 0.98 ACGTcount: A:0.28, C:0.15, G:0.11, T:0.46 Consensus pattern (36 bp): TTAATTACCCTGAATTAAGTTTTTGATTGTGTACAC Found at i:4612 original size:36 final size:36 Alignment explanation

Indices: 4538--4612 Score: 87 Period size: 36 Copynumber: 2.1 Consensus size: 36 4528 GCTTGATTAC ** ** 4538 ACTTAATTACCCTGAATTAACTTTTTGATTGTGTTT 1 ACTTAATTACCCTGAATTAACTCCTTGATTGTACTT * * * 4574 ACTTAATTACCTTGAATTAAGTCCTTGATTTTACTT 1 ACTTAATTACCCTGAATTAACTCCTTGATTGTACTT 4610 ACT 1 ACT 4613 GCATTGATGC Statistics Matches: 32, Mismatches: 7, Indels: 0 0.82 0.18 0.00 Matches are distributed among these distances: 36 32 1.00 ACGTcount: A:0.27, C:0.16, G:0.09, T:0.48 Consensus pattern (36 bp): ACTTAATTACCCTGAATTAACTCCTTGATTGTACTT Found at i:6263 original size:2 final size:2 Alignment explanation

Indices: 6256--6280 Score: 50 Period size: 2 Copynumber: 12.5 Consensus size: 2 6246 TTATAATGCC 6256 TA TA TA TA TA TA TA TA TA TA TA TA T 1 TA TA TA TA TA TA TA TA TA TA TA TA T 6281 TGTTGTTTTG Statistics Matches: 23, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 2 23 1.00 ACGTcount: A:0.48, C:0.00, G:0.00, T:0.52 Consensus pattern (2 bp): TA Found at i:11245 original size:18 final size:18 Alignment explanation

Indices: 11222--11258 Score: 65 Period size: 18 Copynumber: 2.1 Consensus size: 18 11212 CAATAGCTCG 11222 ATTACAATTCACAAACTA 1 ATTACAATTCACAAACTA * 11240 ATTACAATTTACAAACTA 1 ATTACAATTCACAAACTA 11258 A 1 A 11259 GAATGAATTT Statistics Matches: 18, Mismatches: 1, Indels: 0 0.95 0.05 0.00 Matches are distributed among these distances: 18 18 1.00 ACGTcount: A:0.51, C:0.19, G:0.00, T:0.30 Consensus pattern (18 bp): ATTACAATTCACAAACTA Found at i:11365 original size:23 final size:23 Alignment explanation

Indices: 11339--11386 Score: 87 Period size: 23 Copynumber: 2.1 Consensus size: 23 11329 TCTAACATAT * 11339 ATATAATAGATAAAAATTTCCAG 1 ATATAATAGAGAAAAATTTCCAG 11362 ATATAATAGAGAAAAATTTCCAG 1 ATATAATAGAGAAAAATTTCCAG 11385 AT 1 AT 11387 CTATATAATA Statistics Matches: 24, Mismatches: 1, Indels: 0 0.96 0.04 0.00 Matches are distributed among these distances: 23 24 1.00 ACGTcount: A:0.52, C:0.08, G:0.10, T:0.29 Consensus pattern (23 bp): ATATAATAGAGAAAAATTTCCAG Found at i:12000 original size:17 final size:17 Alignment explanation

Indices: 11978--12013 Score: 56 Period size: 17 Copynumber: 2.1 Consensus size: 17 11968 ATTCCACAAC 11978 TAAATATA-AACATATTA 1 TAAATATATAA-ATATTA 11995 TAAATATATAAATATTA 1 TAAATATATAAATATTA 12012 TA 1 TA 12014 TATGATAACT Statistics Matches: 18, Mismatches: 0, Indels: 2 0.90 0.00 0.10 Matches are distributed among these distances: 17 16 0.89 18 2 0.11 ACGTcount: A:0.58, C:0.03, G:0.00, T:0.39 Consensus pattern (17 bp): TAAATATATAAATATTA Done.