Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWUE01014064.1 Corchorus olitorius cultivar O-4 contig14097, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 17615
ACGTcount: A:0.34, C:0.18, G:0.16, T:0.32


Found at i:2308 original size:19 final size:19

Alignment explanation

Indices: 2284--2325 Score: 57 Period size: 19 Copynumber: 2.2 Consensus size: 19 2274 AAACCAGAGT * 2284 AAAACCAAGACAATCAATC 1 AAAACCAAGACAATAAATC * * 2303 AAAACCAGGATAATAAATC 1 AAAACCAAGACAATAAATC 2322 AAAA 1 AAAA 2326 TGCCAAATCA Statistics Matches: 20, Mismatches: 3, Indels: 0 0.87 0.13 0.00 Matches are distributed among these distances: 19 20 1.00 ACGTcount: A:0.62, C:0.19, G:0.07, T:0.12 Consensus pattern (19 bp): AAAACCAAGACAATAAATC Found at i:4523 original size:2 final size:2 Alignment explanation

Indices: 4516--4545 Score: 51 Period size: 2 Copynumber: 15.0 Consensus size: 2 4506 ACACCTAATT * 4516 TA TA TA TA TA TA TA TA TA TA TA TA TT TA TA 1 TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA 4546 CGGTATTACA Statistics Matches: 26, Mismatches: 2, Indels: 0 0.93 0.07 0.00 Matches are distributed among these distances: 2 26 1.00 ACGTcount: A:0.47, C:0.00, G:0.00, T:0.53 Consensus pattern (2 bp): TA Found at i:8239 original size:26 final size:25 Alignment explanation

Indices: 8196--8253 Score: 62 Period size: 26 Copynumber: 2.3 Consensus size: 25 8186 TTTTGATATT * * * 8196 TTGGTTTATTATCCTGATTTATTACG 1 TTGGTTTATGATCCTGA-TTATGACA ** 8222 TTGGTTTATGATTTTGATTATGACA 1 TTGGTTTATGATCCTGATTATGACA 8247 TTGGTTT 1 TTGGTTT 8254 TAACGATTTT Statistics Matches: 27, Mismatches: 5, Indels: 1 0.82 0.15 0.03 Matches are distributed among these distances: 25 13 0.48 26 14 0.52 ACGTcount: A:0.19, C:0.07, G:0.19, T:0.55 Consensus pattern (25 bp): TTGGTTTATGATCCTGATTATGACA Found at i:15350 original size:50 final size:50 Alignment explanation

Indices: 15285--15379 Score: 145 Period size: 50 Copynumber: 1.9 Consensus size: 50 15275 TCTTATAATT 15285 TTTTTAATAACCTAAAAACATTTCTAGTAACAGTATCAAGTTTTAATTTC 1 TTTTTAATAACCTAAAAACATTTCTAGTAACAGTATCAAGTTTTAATTTC * * * * * 15335 TTTTTAGTCACCTAAAAACTTTTTTAGTAACCGTATCAAGTTTTA 1 TTTTTAATAACCTAAAAACATTTCTAGTAACAGTATCAAGTTTTA 15380 TAGTAATCTT Statistics Matches: 40, Mismatches: 5, Indels: 0 0.89 0.11 0.00 Matches are distributed among these distances: 50 40 1.00 ACGTcount: A:0.35, C:0.15, G:0.07, T:0.43 Consensus pattern (50 bp): TTTTTAATAACCTAAAAACATTTCTAGTAACAGTATCAAGTTTTAATTTC Found at i:16174 original size:399 final size:399 Alignment explanation

Indices: 15418--16304 Score: 1244 Period size: 399 Copynumber: 2.2 Consensus size: 399 15408 TGAGCTTTTT * * * * * 15418 CATAATTAAATAAATATTTAATATTAACACATATTCCCTAAAGAGACACATGTCAACTCTTAAAC 1 CATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTAAAC *** * * * 15483 CCCGGGCGTGCAGTCTGCTAAACTCCACTGACGGTATATTGTATAATTTTTCTTATAAGATTATT 66 CCCACACGTGCAGTCTGCTAAACTCCACTCACGATATATTGTATAATTTTTCATATAAGATTATT * * * * * 15548 ATACAATACACTGTAAGTGTAAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACATACCCA 131 ATAAAATACACAGTAAGCGTAAATTTTGAACTCCATAAGCGGGTTAAGAAGTTGACACATACCCA * * 15613 TTTCATAATTAATTCAATATTTAATATCAATACATATTCCCTAAGGGGACACATGCCAACTCTTA 196 TTTCATAATTAATTAAATATTTAATATCAATACATATTCCCTAAGGGGACACATGCCAACCCTTA * * * * * 15678 AACCCCACACGTGCAGTCTGCTAAATTCCACGGACGATGTATTGTATATTTTTTACTTATAGGGA 261 AACCCCACACGTCCAGTCTGCTAAACTCCACGAACGATGTATTGCATAATTTTTACTTATAGGGA * * * 15743 TTATTATACAAGTACACTGTCAGTGTAAATTTTGGACTACATAAGCGGGTTAAGAGGTTGACACA 326 TTATTATACAAGTACACTGTCAGTGTAAATTTT-GACTACATAAGCAGATTAAGACGTTGACACA 15808 T-ACCCATTA 390 TAACCCATTA 15817 CATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTAAAC 1 CATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTAAAC * * * * * 15882 CCCCCATGTGCAGTCTGCTAAACTCCATTCACGATGTATTGTATAATTTTTCATATAGGGATTAT 66 CCCACACGTGCAGTCTGCTAAACTCCACTCACGATATATTGTATAATTTTTCATATA-AGATTAT * * * 15947 TATAAAATACACAGTCAGCGTAAATTTTGAACTCTATAAGCGGGTTAAGAAGTTGACACATATCT 130 TATAAAATACACAGTAAGCGTAAATTTTGAACTCCATAAGCGGGTTAAGAAGTTGACACATA-CC * * * 16012 CATTTCATAATTAATTAAATATTTAATATTAATAGATATTCCCTAAGGGGACACATGTCAACCCT 194 CATTTCATAATTAATTAAATATTTAATATCAATACATATTCCCTAAGGGGACACATGCCAACCCT * * 16077 TAAACCCCGCACGTCCAGTCTGCTAAACTCCACTAACTG-TGTATTGCATAATTTTT-CTTATA- 259 TAAACCCCACACGTCCAGTCTGCTAAACTCCACGAAC-GATGTATTGCATAATTTTTACTTATAG * * * * 16139 GTATTATTATACAA-TACACTTTCGGTGTAAAATTTTGACTCCATAAGCAGATTAAGACGTTGAC 323 GGATTATTATACAAGTACACTGTCAGTGT-AAATTTTGACTACATAAGCAGATTAAGACGTTGAC * * 16203 ACATAACCCGTTT 387 ACATAACCCATTA * * 16216 CATAATTAATTAAATATTTAATATTAATACATATTCTCTAAGGGGACACATGTCAACCCTTACAC 1 CATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTAAAC * * * 16281 CCCATAGGTGCAGTCTACTAAACT 66 CCCACACGTGCAGTCTGCTAAACT 16305 AATCAAACAT Statistics Matches: 433, Mismatches: 50, Indels: 10 0.88 0.10 0.02 Matches are distributed among these distances: 398 40 0.09 399 217 0.50 400 67 0.15 401 108 0.25 402 1 0.00 ACGTcount: A:0.34, C:0.20, G:0.13, T:0.33 Consensus pattern (399 bp): CATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTAAAC CCCACACGTGCAGTCTGCTAAACTCCACTCACGATATATTGTATAATTTTTCATATAAGATTATT ATAAAATACACAGTAAGCGTAAATTTTGAACTCCATAAGCGGGTTAAGAAGTTGACACATACCCA TTTCATAATTAATTAAATATTTAATATCAATACATATTCCCTAAGGGGACACATGCCAACCCTTA AACCCCACACGTCCAGTCTGCTAAACTCCACGAACGATGTATTGCATAATTTTTACTTATAGGGA TTATTATACAAGTACACTGTCAGTGTAAATTTTGACTACATAAGCAGATTAAGACGTTGACACAT AACCCATTA Found at i:16274 original size:199 final size:199 Alignment explanation

Indices: 15415--16304 Score: 1248 Period size: 199 Copynumber: 4.5 Consensus size: 199 15405 AATTGAGCTT * * * * * 15415 TTTCATAATTAAATAAATATTTAATATTAACACATATTCCCTAAAGAGACACATGTCAACTCTTA 1 TTTCATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA ** * * * 15480 AACCCCGGGCGTGCAGTCTGCTAAACTCCACTGACGGTATATTGTATAATTTTTCTTATA-AGAT 66 AACCCCGCACGTGCAGTCTGCTAAACTCCACTGACGATGTATTGTATAATTTTTCTTATAGGGAT * 15544 TATTATACAATACACTGTAAGTGTAAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACATA 131 TATTATACAATACACTGTCAGTGTAAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACATA 15609 CCCA 196 CCCA * * * * 15613 TTTCATAATTAATTCAATATTTAATATCAATACATATTCCCTAAGGGGACACATGCCAACTCTTA 1 TTTCATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA * * * * 15678 AACCCCACACGTGCAGTCTGCTAAATTCCACGGACGATGTATTGTATATTTTTTACTTATAGGGA 66 AACCCCGCACGTGCAGTCTGCTAAACTCCACTGACGATGTATTGTATAATTTTT-CTTATAGGGA * 15743 TTATTATACAAGTACACTGTCAGTGTAAATTTTGGACTACATAAGCGGGTTAAGAGGTTGACACA 130 TTATTATACAA-TACACTGTCAGTGTAAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACA 15808 TACCCA 194 TACCCA * 15814 TTACATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA 1 TTTCATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA * * * * * 15879 AACCCCCCATGTGCAGTCTGCTAAACTCCATTCACGATGTATTGTATAATTTTTCATATAGGGAT 66 AACCCCGCACGTGCAGTCTGCTAAACTCCACTGACGATGTATTGTATAATTTTTCTTATAGGGAT * * * * * * 15944 TATTATAAAATACACAGTCAGCGTAAATTTTGAACTCTATAAGCGGGTTAAGAAGTTGACACATA 131 TATTATACAATACACTGTCAGTGTAAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACATA * 16009 TCTCA 196 -CCCA * 16014 TTTCATAATTAATTAAATATTTAATATTAATAGATATTCCCTAAGGGGACACATGTCAACCCTTA 1 TTTCATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA * * * * 16079 AACCCCGCACGTCCAGTCTGCTAAACTCCACTAACTG-TGTATTGCATAATTTTTCTTATA-GTA 66 AACCCCGCACGTGCAGTCTGCTAAACTCCACTGAC-GATGTATTGTATAATTTTTCTTATAGGGA * * * * * 16142 TTATTATACAATACACTTTCGGTGTAAAATTTT-GACTCCATAAGCAGATTAAGACGTTGACACA 130 TTATTATACAATACACTGTCAGTGT-AAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACA * 16206 TAACCCG 194 T-ACCCA * 16213 TTTCATAATTAATTAAATATTTAATATTAATACATATTCTCTAAGGGGACACATGTCAACCCTTA 1 TTTCATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA * ** * * 16278 CACCCCATAGGTGCAGTCTACTAAACT 66 AACCCCGCACGTGCAGTCTGCTAAACT 16305 AATCAAACAT Statistics Matches: 616, Mismatches: 69, Indels: 13 0.88 0.10 0.02 Matches are distributed among these distances: 198 104 0.17 199 190 0.31 200 157 0.25 201 165 0.27 ACGTcount: A:0.34, C:0.19, G:0.13, T:0.33 Consensus pattern (199 bp): TTTCATAATTAATTAAATATTTAATATTAATACATATTCCCTAAGGGGACACATGTCAACCCTTA AACCCCGCACGTGCAGTCTGCTAAACTCCACTGACGATGTATTGTATAATTTTTCTTATAGGGAT TATTATACAATACACTGTCAGTGTAAATTTTGGACTCCATAAGCGGGTTAAGAGGTTGACACATA CCCA Found at i:16671 original size:10 final size:10 Alignment explanation

Indices: 16652--16711 Score: 61 Period size: 10 Copynumber: 5.9 Consensus size: 10 16642 TTGTTTTTTA * 16652 ATTATGAATT 1 ATTATTAATT 16662 ATTATTAATT 1 ATTATTAATT 16672 ATTAATT-ATT 1 ATT-ATTAATT 16682 AATTATT-ATT 1 -ATTATTAATT 16692 AATTATTAATT 1 -ATTATTAATT * 16703 ATAATTAAT 1 ATTATTAAT 16712 AATAACAATT Statistics Matches: 45, Mismatches: 2, Indels: 6 0.85 0.04 0.11 Matches are distributed among these distances: 10 36 0.80 11 9 0.20 ACGTcount: A:0.43, C:0.00, G:0.02, T:0.55 Consensus pattern (10 bp): ATTATTAATT Found at i:16671 original size:17 final size:17 Alignment explanation

Indices: 16652--16711 Score: 86 Period size: 17 Copynumber: 3.5 Consensus size: 17 16642 TTGTTTTTTA * 16652 ATTATGAATTATT-ATT 1 ATTATTAATTATTAATT 16668 AATTATTAATTATTAATT 1 -ATTATTAATTATTAATT 16686 ATTATTAATTATTAATT 1 ATTATTAATTATTAATT * 16703 ATAATTAAT 1 ATTATTAAT 16712 AATAACAATT Statistics Matches: 40, Mismatches: 2, Indels: 2 0.91 0.05 0.05 Matches are distributed among these distances: 17 37 0.93 18 3 0.08 ACGTcount: A:0.43, C:0.00, G:0.02, T:0.55 Consensus pattern (17 bp): ATTATTAATTATTAATT Found at i:16677 original size:24 final size:23 Alignment explanation

Indices: 16649--16709 Score: 104 Period size: 24 Copynumber: 2.6 Consensus size: 23 16639 TTTTTGTTTT 16649 TTAATTATGAATTATTATTAATTA 1 TTAATTAT-AATTATTATTAATTA 16673 TTAATTATTAATTATTATTAATTA 1 TTAATTA-TAATTATTATTAATTA 16697 TTAATTATAATTA 1 TTAATTATAATTA 16710 ATAATAACAA Statistics Matches: 36, Mismatches: 0, Indels: 3 0.92 0.00 0.08 Matches are distributed among these distances: 23 6 0.17 24 29 0.81 25 1 0.03 ACGTcount: A:0.43, C:0.00, G:0.02, T:0.56 Consensus pattern (23 bp): TTAATTATAATTATTATTAATTA Found at i:16716 original size:10 final size:10 Alignment explanation

Indices: 16674--16764 Score: 61 Period size: 10 Copynumber: 9.7 Consensus size: 10 16664 TATTAATTAT * 16674 TAATTATTAA 1 TAATTAATAA * * 16684 TTATTATTAA 1 TAATTAATAA * * 16694 TTATTAATTA 1 TAATTAATAA 16704 TAATTAATAA 1 TAATTAATAA * * 16714 TAA-CAAT-T 1 TAATTAATAA 16722 TAAATTAATAA 1 T-AATTAATAA 16733 TAA-T--TAA 1 TAATTAATAA 16740 TAATT-A-AA 1 TAATTAATAA 16748 TAATTAATAA 1 TAATTAATAA 16758 TAATTAA 1 TAATTAA 16765 AAAATAAAAA Statistics Matches: 65, Mismatches: 9, Indels: 14 0.74 0.10 0.16 Matches are distributed among these distances: 7 6 0.09 8 9 0.14 9 7 0.11 10 42 0.65 11 1 0.02 ACGTcount: A:0.54, C:0.01, G:0.00, T:0.45 Consensus pattern (10 bp): TAATTAATAA Found at i:16735 original size:29 final size:25 Alignment explanation

Indices: 16696--16773 Score: 84 Period size: 29 Copynumber: 2.9 Consensus size: 25 16686 ATTATTAATT * 16696 ATTAATTATAATTAATAATAACAATTTAA 1 ATTAATAATAATTAATAATAA-AA--T-A * 16725 ATTAATAATAATTAATAATTAAATA 1 ATTAATAATAATTAATAATAAAATA * 16750 ATTAATAATAATTAAAAAATAAAA 1 ATTAATAATAATT-AATAATAAAA 16774 AAAATAATTG Statistics Matches: 44, Mismatches: 4, Indels: 5 0.83 0.08 0.09 Matches are distributed among these distances: 25 14 0.32 26 9 0.20 28 2 0.05 29 19 0.43 ACGTcount: A:0.62, C:0.01, G:0.00, T:0.37 Consensus pattern (25 bp): ATTAATAATAATTAATAATAAAATA Found at i:16736 original size:22 final size:21 Alignment explanation

Indices: 16703--16760 Score: 73 Period size: 22 Copynumber: 2.7 Consensus size: 21 16693 ATTATTAATT 16703 ATAATTAATAATAACAATTTAA 1 ATAATTAATAATAACAA-TTAA * 16725 ATTAA-TAATAATTAATAATTAA 1 A-TAATTAATAA-TAACAATTAA 16747 ATAATTAATAATAA 1 ATAATTAATAATAA 16761 TTAAAAAATA Statistics Matches: 32, Mismatches: 1, Indels: 7 0.80 0.03 0.17 Matches are distributed among these distances: 21 6 0.19 22 18 0.56 23 8 0.25 ACGTcount: A:0.60, C:0.02, G:0.00, T:0.38 Consensus pattern (21 bp): ATAATTAATAATAACAATTAA Found at i:16742 original size:7 final size:7 Alignment explanation

Indices: 16665--16758 Score: 77 Period size: 7 Copynumber: 13.3 Consensus size: 7 16655 ATGAATTATT * 16665 ATTAATT 1 ATTAATA * 16672 ATTAATT 1 ATTAATA * 16679 ATTAATT 1 ATTAATA * 16686 ATTATTA 1 ATTAATA * 16693 ATTATTA 1 ATTAATA 16700 ATT-ATA 1 ATTAATA 16706 ATTAATA 1 ATTAATA * 16713 A-TAACA 1 ATTAATA 16719 ATTTAAATTA 1 A-TT-AA-TA 16729 A-TAATA 1 ATTAATA 16735 ATTAATA 1 ATTAATA 16742 ATTAAATA 1 ATT-AATA 16750 ATTAATA 1 ATTAATA 16757 AT 1 AT 16759 AATTAAAAAA Statistics Matches: 75, Mismatches: 5, Indels: 14 0.80 0.05 0.15 Matches are distributed among these distances: 6 13 0.17 7 49 0.65 8 9 0.12 9 2 0.03 10 2 0.03 ACGTcount: A:0.52, C:0.01, G:0.00, T:0.47 Consensus pattern (7 bp): ATTAATA Found at i:16772 original size:25 final size:25 Alignment explanation

Indices: 16724--16772 Score: 80 Period size: 25 Copynumber: 2.0 Consensus size: 25 16714 TAACAATTTA * * 16724 AATTAATAATAATTAATAATTAAAT 1 AATTAATAATAATTAAAAAATAAAT 16749 AATTAATAATAATTAAAAAATAAA 1 AATTAATAATAATTAAAAAATAAA 16773 AAAAATAATT Statistics Matches: 22, Mismatches: 2, Indels: 0 0.92 0.08 0.00 Matches are distributed among these distances: 25 22 1.00 ACGTcount: A:0.65, C:0.00, G:0.00, T:0.35 Consensus pattern (25 bp): AATTAATAATAATTAAAAAATAAAT Found at i:16854 original size:13 final size:13 Alignment explanation

Indices: 16838--16862 Score: 50 Period size: 13 Copynumber: 1.9 Consensus size: 13 16828 TGACAGAATT 16838 TTAGATCTACAAC 1 TTAGATCTACAAC 16851 TTAGATCTACAA 1 TTAGATCTACAA 16863 AATCCGACAT Statistics Matches: 12, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 13 12 1.00 ACGTcount: A:0.40, C:0.20, G:0.08, T:0.32 Consensus pattern (13 bp): TTAGATCTACAAC Found at i:16884 original size:12 final size:12 Alignment explanation

Indices: 16867--16891 Score: 50 Period size: 12 Copynumber: 2.1 Consensus size: 12 16857 CTACAAAATC 16867 CGACATGATTTT 1 CGACATGATTTT 16879 CGACATGATTTT 1 CGACATGATTTT 16891 C 1 C 16892 TTCAAGATTG Statistics Matches: 13, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 12 13 1.00 ACGTcount: A:0.24, C:0.20, G:0.16, T:0.40 Consensus pattern (12 bp): CGACATGATTTT Done.