Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWUE01016063.1 Corchorus olitorius cultivar O-4 contig16096, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 25113
ACGTcount: A:0.34, C:0.17, G:0.17, T:0.32


Found at i:524 original size:2 final size:2

Alignment explanation

Indices: 511--552 Score: 75 Period size: 2 Copynumber: 21.0 Consensus size: 2 501 GAAAATTATT * 511 TA TA TA TG TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA 1 TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA 553 CATAAGAAAC Statistics Matches: 38, Mismatches: 2, Indels: 0 0.95 0.05 0.00 Matches are distributed among these distances: 2 38 1.00 ACGTcount: A:0.48, C:0.00, G:0.02, T:0.50 Consensus pattern (2 bp): TA Found at i:1379 original size:19 final size:20 Alignment explanation

Indices: 1332--1379 Score: 57 Period size: 19 Copynumber: 2.5 Consensus size: 20 1322 GGGATTTTTG 1332 ATAA-TAATTATTCAATAAA 1 ATAATTAATTATTCAATAAA * * 1351 ATAATT-ATTATTTAAT-TA 1 ATAATTAATTATTCAATAAA 1369 ATAATTAATTA 1 ATAATTAATTA 1380 ATTTCAGTCC Statistics Matches: 25, Mismatches: 2, Indels: 4 0.81 0.06 0.13 Matches are distributed among these distances: 18 7 0.28 19 17 0.68 20 1 0.04 ACGTcount: A:0.52, C:0.02, G:0.00, T:0.46 Consensus pattern (20 bp): ATAATTAATTATTCAATAAA Found at i:6031 original size:2 final size:2 Alignment explanation

Indices: 6024--6059 Score: 72 Period size: 2 Copynumber: 18.0 Consensus size: 2 6014 AAGTTTCTTA 6024 AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT 1 AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT 6060 GATAAATCAA Statistics Matches: 34, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 2 34 1.00 ACGTcount: A:0.50, C:0.00, G:0.00, T:0.50 Consensus pattern (2 bp): AT Found at i:14112 original size:23 final size:23 Alignment explanation

Indices: 14086--14152 Score: 58 Period size: 23 Copynumber: 3.2 Consensus size: 23 14076 TTATAATAAT 14086 CAAATGACATACACTATAGGAAG 1 CAAATGACATACACTATAGGAAG * * * 14109 CAAAT-A-GTA-A-T-CA--AAT 1 CAAATGACATACACTATAGGAAG 14125 CAAATGACATACACTATAGGAAG 1 CAAATGACATACACTATAGGAAG 14148 CAAAT 1 CAAAT 14153 AGTAATCAAA Statistics Matches: 31, Mismatches: 6, Indels: 14 0.61 0.12 0.27 Matches are distributed among these distances: 16 7 0.23 17 1 0.03 18 3 0.10 19 2 0.06 20 2 0.06 21 3 0.10 22 1 0.03 23 12 0.39 ACGTcount: A:0.51, C:0.16, G:0.13, T:0.19 Consensus pattern (23 bp): CAAATGACATACACTATAGGAAG Found at i:14165 original size:34 final size:35 Alignment explanation

Indices: 14081--14189 Score: 175 Period size: 34 Copynumber: 3.0 Consensus size: 35 14071 ATATATTATA 14081 ATAATCAAATGACATACACTATAGGAAGCAAATAG 1 ATAATCAAATGACATACACTATAGGAAGCAAATAG 14116 TAATCAAATCAAATGACATACACTATAGGAAGCAAATAG 1 --AT--AATCAAATGACATACACTATAGGAAGCAAATAG 14155 -TAATCAAATGACATACACTATAGGAAGCAAATAG 1 ATAATCAAATGACATACACTATAGGAAGCAAATAG 14189 A 1 A 14190 AGCAAAATAG Statistics Matches: 69, Mismatches: 0, Indels: 8 0.90 0.00 0.10 Matches are distributed among these distances: 34 33 0.48 36 1 0.01 37 2 0.03 39 33 0.48 ACGTcount: A:0.51, C:0.15, G:0.14, T:0.20 Consensus pattern (35 bp): ATAATCAAATGACATACACTATAGGAAGCAAATAG Found at i:14584 original size:68 final size:68 Alignment explanation

Indices: 14473--14608 Score: 227 Period size: 68 Copynumber: 2.0 Consensus size: 68 14463 GTAAAATAAC * * 14473 TTCTAAAGATTAATCTCTTGTATGAGCACATACAGAATCTCACTAGCACCCTCAATCAAATTTAA 1 TTCTAAAGATTAATCTCTTGTATGAGCACATACAAAATCTCACTAGCACCCTCAATCAAATATAA 14538 GTT 66 GTT * * * 14541 TTCTAAAGATTAATTTCTTGTATGAGCACATACAAAATTTCACTAGCACCCTCAATGAAATATAA 1 TTCTAAAGATTAATCTCTTGTATGAGCACATACAAAATCTCACTAGCACCCTCAATCAAATATAA 14606 GTT 66 GTT 14609 GACATCTATC Statistics Matches: 63, Mismatches: 5, Indels: 0 0.93 0.07 0.00 Matches are distributed among these distances: 68 63 1.00 ACGTcount: A:0.37, C:0.20, G:0.10, T:0.33 Consensus pattern (68 bp): TTCTAAAGATTAATCTCTTGTATGAGCACATACAAAATCTCACTAGCACCCTCAATCAAATATAA GTT Found at i:15330 original size:12 final size:12 Alignment explanation

Indices: 15313--15339 Score: 54 Period size: 12 Copynumber: 2.2 Consensus size: 12 15303 TCATAATACT 15313 AATGTAAACATC 1 AATGTAAACATC 15325 AATGTAAACATC 1 AATGTAAACATC 15337 AAT 1 AAT 15340 CAATCTAGAA Statistics Matches: 15, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 12 15 1.00 ACGTcount: A:0.52, C:0.15, G:0.07, T:0.26 Consensus pattern (12 bp): AATGTAAACATC Found at i:16618 original size:13 final size:13 Alignment explanation

Indices: 16600--16626 Score: 54 Period size: 13 Copynumber: 2.1 Consensus size: 13 16590 TGAAAGAAGA 16600 TGAAAAGATGGAT 1 TGAAAAGATGGAT 16613 TGAAAAGATGGAT 1 TGAAAAGATGGAT 16626 T 1 T 16627 TGGTTGAAGT Statistics Matches: 14, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 13 14 1.00 ACGTcount: A:0.44, C:0.00, G:0.30, T:0.26 Consensus pattern (13 bp): TGAAAAGATGGAT Found at i:20782 original size:181 final size:181 Alignment explanation

Indices: 20478--20840 Score: 726 Period size: 181 Copynumber: 2.0 Consensus size: 181 20468 TTATCAATAT 20478 CCTTTAATTGGATTAAGTTTTTCTTGTTGAACTTTTGCTCTTTGGACCTTTAAGTGGACATTTGG 1 CCTTTAATTGGATTAAGTTTTTCTTGTTGAACTTTTGCTCTTTGGACCTTTAAGTGGACATTTGG 20543 GCACATTGGGCTACTTTTCGCCTTGCATCTGTATTTTCAAAACAGTTCATTATATTGTCACATTG 66 GCACATTGGGCTACTTTTCGCCTTGCATCTGTATTTTCAAAACAGTTCATTATATTGTCACATTG 20608 TATGAAATAAGTCCTTGAATGGAGTCCTTCACATTTAACACTTTCAATACA 131 TATGAAATAAGTCCTTGAATGGAGTCCTTCACATTTAACACTTTCAATACA 20659 CCTTTAATTGGATTAAGTTTTTCTTGTTGAACTTTTGCTCTTTGGACCTTTAAGTGGACATTTGG 1 CCTTTAATTGGATTAAGTTTTTCTTGTTGAACTTTTGCTCTTTGGACCTTTAAGTGGACATTTGG 20724 GCACATTGGGCTACTTTTCGCCTTGCATCTGTATTTTCAAAACAGTTCATTATATTGTCACATTG 66 GCACATTGGGCTACTTTTCGCCTTGCATCTGTATTTTCAAAACAGTTCATTATATTGTCACATTG 20789 TATGAAATAAGTCCTTGAATGGAGTCCTTCACATTTAACACTTTCAATACA 131 TATGAAATAAGTCCTTGAATGGAGTCCTTCACATTTAACACTTTCAATACA 20840 C 1 C 20841 AAGTTGGTAT Statistics Matches: 182, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 181 182 1.00 ACGTcount: A:0.25, C:0.18, G:0.16, T:0.41 Consensus pattern (181 bp): CCTTTAATTGGATTAAGTTTTTCTTGTTGAACTTTTGCTCTTTGGACCTTTAAGTGGACATTTGG GCACATTGGGCTACTTTTCGCCTTGCATCTGTATTTTCAAAACAGTTCATTATATTGTCACATTG TATGAAATAAGTCCTTGAATGGAGTCCTTCACATTTAACACTTTCAATACA Found at i:23114 original size:58 final size:57 Alignment explanation

Indices: 23030--23385 Score: 157 Period size: 58 Copynumber: 5.9 Consensus size: 57 23020 TTACCTTCTT * * * * * 23030 TTACTTCTTAAGT-AGCCTAATTAACTTACACTAAGCCCATTTTACTGATTACGTTA-G 1 TTACTTCTTAA-TCAACTTAATTAACTTA-ACTAAGCCAATTTTACTGATTACCTTACC * * * 23087 TTCACTTCTTAATCAACTTAATCAACTTTAATTAAGTCAATTTTACTGATTACCTTACC 1 TT-ACTTCTTAATCAACTTAATTAAC-TTAACTAAGCCAATTTTACTGATTACCTTACC * 23146 TTATTTCTTAATCAACTTAATTAACTTTTAATCAACTTTAATTAAGCCAATTTTACTGATTACCT 1 TTACTTCTTAATCAACTTAATTAAC---T--T-AAC------TAAGCCAATTTTACTGATTACCT * * 23211 TTCT 54 TACC * * * * * * * ** 23215 TTA-TACCTTAATTAACTTAATCAACTTTAATTAAGTCAATTTTACTGGCTT-TCTTATT 1 TTACT-TCTTAATCAACTTAATTAAC-TTAACTAAGCCAATTTTACT-GATTACCTTACC * * * * * 23273 TTACCTT-ATAATCAACTTAATTAACTTTAATTAAGCCAATTGTTACCGACTACCCCTT-CT 1 TTA-CTTCTTAATCAACTTAATTAAC-TTAACTAAGCCAATT-TTACTGATTA--CCTTACC * * * * * * 23333 TTTCCTCTGAATTAACTTAATTAACTTTAAGTAAGCCAATTTTTACTAATTAC 1 TTACTTCTTAATCAACTTAATTAAC-TTAACTAAGCCAA-TTTTACTGATTAC 23386 TATTTTTATC Statistics Matches: 232, Mismatches: 42, Indels: 49 0.72 0.13 0.15 Matches are distributed among these distances: 57 3 0.01 58 116 0.50 59 14 0.06 60 41 0.18 61 5 0.02 62 1 0.00 63 2 0.01 64 2 0.01 65 1 0.00 67 2 0.01 68 1 0.00 69 44 0.19 ACGTcount: A:0.32, C:0.20, G:0.05, T:0.43 Consensus pattern (57 bp): TTACTTCTTAATCAACTTAATTAACTTAACTAAGCCAATTTTACTGATTACCTTACC Found at i:23183 original size:69 final size:69 Alignment explanation

Indices: 23094--23242 Score: 221 Period size: 69 Copynumber: 2.2 Consensus size: 69 23084 TAGTTCACTT * ** 23094 CTTAATCAAC--TTAATCAACTTTAATTAAGTCAATTTTACTGATTACCTTACCTTATTTCTTAA 1 CTTAATCAACTTTTAATCAACTTTAATTAAGCCAATTTTACTGATTACCTTACCTTATACCTTAA 23157 TCAA 66 TCAA * * * 23161 CTTAATTAACTTTTAATCAACTTTAATTAAGCCAATTTTACTGATTACCTTTCTTTATACCTTAA 1 CTTAATCAACTTTTAATCAACTTTAATTAAGCCAATTTTACTGATTACCTTACCTTATACCTTAA * 23226 TTAA 66 TCAA 23230 CTTAATCAACTTT 1 CTTAATCAACTTT 23243 AATTAAGTCA Statistics Matches: 72, Mismatches: 8, Indels: 2 0.88 0.10 0.02 Matches are distributed among these distances: 67 9 0.12 69 63 0.88 ACGTcount: A:0.34, C:0.19, G:0.03, T:0.45 Consensus pattern (69 bp): CTTAATCAACTTTTAATCAACTTTAATTAAGCCAATTTTACTGATTACCTTACCTTATACCTTAA TCAA Found at i:23393 original size:118 final size:116 Alignment explanation

Indices: 23173--23470 Score: 283 Period size: 116 Copynumber: 2.6 Consensus size: 116 23163 TAATTAACTT * * * 23173 TTAATCAACTTTAATTAAGCCAATTTTACTGATTACCTTTCTTTATACCTTAATTAACTTAATCA 1 TTAATCAACTTTAATTAAGCCAATTTTACCGACTACCCTTCTTTATACCTTAATTAACTTAATCA * * ** * 23238 ACTTTAATTAAGTCAATTTTACTGGCTTTCTTATTTTACCTTATAATCAAC 66 ACTTTAAGTAAGCCAATTTTACTGAATTACTTATTTTACCTTATAATCAAC * 23289 TTAATTAACTTTAATTAAGCCAATTGTTACCGACTACCCCTTCTTT-T-CCTCTGAATTAACTTA 1 TTAATCAACTTTAATTAAGCCAATT-TTACCGACTA-CCCTTCTTTATACCT-T-AATTAACTTA * * * * 23352 ATTAACTTTAAGTAAGCCAATTTTTACT-AATTAC-TATTTTTATC-T-TAATTAGC 62 ATCAACTTTAAGTAAGCCAA-TTTTACTGAATTACTTA-TTTTACCTTATAATCAAC * * * * * * * * 23405 TTACTCAACTTTGATTAAGCTAA-TTTACTGATTACCATT-TTTAT--CTTAATTAAGTTACTCA 1 TTAATCAACTTTAATTAAGCCAATTTTACCGACTACCCTTCTTTATACCTTAATTAACTTAATCA 23466 ACTTT 66 ACTTT 23471 GATTAAGTTA Statistics Matches: 152, Mismatches: 23, Indels: 20 0.78 0.12 0.10 Matches are distributed among these distances: 110 16 0.11 111 1 0.01 112 5 0.03 113 5 0.03 114 8 0.05 115 1 0.01 116 52 0.34 117 13 0.09 118 44 0.29 119 7 0.05 ACGTcount: A:0.31, C:0.18, G:0.05, T:0.45 Consensus pattern (116 bp): TTAATCAACTTTAATTAAGCCAATTTTACCGACTACCCTTCTTTATACCTTAATTAACTTAATCA ACTTTAAGTAAGCCAATTTTACTGAATTACTTATTTTACCTTATAATCAAC Found at i:23430 original size:56 final size:54 Alignment explanation

Indices: 23161--23733 Score: 504 Period size: 56 Copynumber: 10.1 Consensus size: 54 23151 TCTTAATCAA * * * * 23161 CTTAATTAACTTTTAATCAACTTTAATTAAGCCAATTTTACTGATTACCTTTCTTTAT 1 CTTAATTAAC--TTACTCAACTTTGATTAAGCTAA-TTTACTGATTACCATT-TTTAT * * * * * * 23219 ACCTTAATTAACTTAATCAACTTTAATTAAG-TCAATTTTACTGGCTT-TCTTATTTTAC 1 --CTTAATTAACTTACTCAACTTTGATTAAGCT-AA-TTTACT-GATTACCAT-TTTTAT * * * * * * * * 23277 CTTATAATCAACTTAATTAACTTTAATTAAGCCAATTGTTACCGACTACCCCTTCTTT-T 1 C-T-TAATTAACTTACTCAACTTTGATTAAGCTAA-T-TTACTGATTA-CCATT-TTTAT * * * * * * * 23336 CCTCTGAATTAACTTAATTAACTTTAAGTAAGCCAATTTTTACTAATTACTATTTTTAT 1 -CT-T-AATTAACTTACTCAACTTTGATTAAGCTAA--TTTACTGATTACCATTTTTAT * 23395 CTTAATTAGCTTACTCAACTTTGATTAAGCTAATTTACTGATTACCATTTTTAT 1 CTTAATTAACTTACTCAACTTTGATTAAGCTAATTTACTGATTACCATTTTTAT * * 23449 CTTAATTAAGTTACTCAACTTTGATTAAGTTAATTTACTGATTACCAACTTTTTAT 1 CTTAATTAACTTACTCAACTTTGATTAAGCTAATTTACTGATTACC-A-TTTTTAT * 23505 CTTAATTAACTTACTCAACTTTGACTAAGCTAATTTACTGATTACCATCTTTTTTTAT 1 CTTAATTAACTTACTCAACTTTGATTAAGCTAATTTACTGATTACCA----TTTTTAT * * 23563 CTTAATTAACTTACTCAACTTTGATTAAGTTAATTTACTGATCACCATCATTTTAT 1 CTTAATTAACTTACTCAACTTTGATTAAGCTAATTTACTGATTACCAT--TTTTAT * 23619 CTTAATTAACTTACTCAACTTTGACTAAGCTAATTTACTGATTACCATCTTTTTTAT 1 CTTAATTAACTTACTCAACTTTGATTAAGCTAATTTACTGATTACCA---TTTTTAT * * * * 23676 CTTAATTACCTTGCTCAACTTTGATTAAGTTAATTTACTTATTACCATCTTTTAT 1 CTTAATTAACTTACTCAACTTTGATTAAGCTAATTTACTGATTACCAT-TTTTAT 23731 CTT 1 CTT 23734 TGACTGACTT Statistics Matches: 441, Mismatches: 47, Indels: 55 0.81 0.09 0.10 Matches are distributed among these distances: 54 64 0.15 55 11 0.02 56 125 0.28 57 50 0.11 58 122 0.28 59 16 0.04 60 51 0.12 61 2 0.00 ACGTcount: A:0.31, C:0.18, G:0.05, T:0.46 Consensus pattern (54 bp): CTTAATTAACTTACTCAACTTTGATTAAGCTAATTTACTGATTACCATTTTTAT Found at i:23617 original size:114 final size:112 Alignment explanation

Indices: 23374--23733 Score: 575 Period size: 114 Copynumber: 3.2 Consensus size: 112 23364 TAAGCCAATT * * * * 23374 TTTACTAATTACTAT-TTTTATCTTAATTAGCTTACTCAACTTTGATTAAGCTAATTTACTGATT 1 TTTACTGATTACCATCTTTTATCTTAATTAACTTACTCAACTTTGACTAAGCTAATTTACTGATT * 23438 ACCA---TTTTTATCTTAATTAAGTTACTCAACTTTGATTAAGTTAA 66 ACCATCTTTTTTATCTTAATTAACTTACTCAACTTTGATTAAGTTAA * 23482 TTTACTGATTACCAACTTTTTATCTTAATTAACTTACTCAACTTTGACTAAGCTAATTTACTGAT 1 TTTACTGATTACCATC-TTTTATCTTAATTAACTTACTCAACTTTGACTAAGCTAATTTACTGAT 23547 TACCATCTTTTTTTATCTTAATTAACTTACTCAACTTTGATTAAGTTAA 65 TACCATC-TTTTTTATCTTAATTAACTTACTCAACTTTGATTAAGTTAA * 23596 TTTACTGATCACCATCATTTTATCTTAATTAACTTACTCAACTTTGACTAAGCTAATTTACTGAT 1 TTTACTGATTACCATC-TTTTATCTTAATTAACTTACTCAACTTTGACTAAGCTAATTTACTGAT * * 23661 TACCATCTTTTTTATCTTAATTACCTTGCTCAACTTTGATTAAGTTAA 65 TACCATCTTTTTTATCTTAATTAACTTACTCAACTTTGATTAAGTTAA * 23709 TTTACTTATTACCATCTTTTATCTT 1 TTTACTGATTACCATCTTTTATCTT 23734 TGACTGACTT Statistics Matches: 233, Mismatches: 13, Indels: 8 0.92 0.05 0.03 Matches are distributed among these distances: 108 12 0.05 110 51 0.22 112 9 0.04 113 53 0.23 114 108 0.46 ACGTcount: A:0.30, C:0.17, G:0.06, T:0.47 Consensus pattern (112 bp): TTTACTGATTACCATCTTTTATCTTAATTAACTTACTCAACTTTGACTAAGCTAATTTACTGATT ACCATCTTTTTTATCTTAATTAACTTACTCAACTTTGATTAAGTTAA Done.