Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01007853.1 Corchorus capsularis cultivar CVL-1 contig07874, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 21986
ACGTcount: A:0.32, C:0.16, G:0.18, T:0.34

Warning! 1 characters in sequence are not A, C, G, or T


Found at i:2284 original size:66 final size:65

Alignment explanation

Indices: 2093--2774 Score: 586 Period size: 66 Copynumber: 10.0 Consensus size: 65 2083 TTCTTACTAA * * 2093 ACTTAATTTCCCTGAATTAAGTTACTTATTGAAC-TACTTAATTACCCTGAATTAAGTTTCT-CA 1 ACTTAATTACCCTGAATTAAGTTA-TTACTG-ACTTACTTAATTACCCTGAATTAAG---CTAC- 2156 TTAACTC- 60 TT-AC-CG * * * 2163 ACTTAATTACCCTGAATTAAAGTTGATTACTGATTTGCTCAATTACCCTGAATTAAGCTACTTAC 1 ACTTAATTACCCTGAATT-AAGTT-ATTACTGACTTACTTAATTACCCTGAATTAAGCTACTTAC 2228 CG 64 CG * * * * * 2230 ACTTAATTACCCTGAATTAAGTCATTAACTGACTCACTTAATTACCCTGGATTAAGCTATTTACT 1 ACTTAATTACCCTGAATTAAGTTATT-ACTGACTTACTTAATTACCCTGAATTAAGCTACTTACC 2295 G 65 G * * * 2296 ACTTAATTACCCTGAATTAAGTTATTCGCTGACTCACTTAATTACCCTGAATTAAGTTGATTACT 1 ACTTAATTACCCTGAATTAAGTTATT-ACTGACTTACTTAATTACCCTGAATTAA---G-CTACT * * 2361 GACCC 61 TACCG * 2366 ACTTAATTACCCTGAATTAAGTTGATTACTGAATTACTTAATTACCCTGAATTAAGTTGCTTA-T 1 ACTTAATTACCCTGAATTAAGTT-ATTACTGACTTACTTAATTACCCTGAATTAA---GC-TACT * 2430 TACTG 61 TACCG * * * 2435 ACTCGCTTAATTACCCTGAATTAAGTCGATTACTGAATTACTTAATTACCCTGAATTAAGTTAC- 1 A----CTTAATTACCCTGAATTAAGT-TATTACTGACTTACTTAATTACCCTGAATTAAGCTACT * * 2499 TGCCTT 61 TACC-G * * * 2505 ACTTAATTTCCCTGAACTAAGTTACTAACTGACTTTACTTAATTACCCTGAATTAAGCTACTTAC 1 ACTTAATTACCCTGAATTAAGTTA-TTACTGAC-TTACTTAATTACCCTGAATTAAGCTACTTAC * 2570 TG 64 CG * * ** 2572 ACTTAATTACCCTGAATTAAGTTACCTA-TTACTTACTTAATTACCCTGAATTAAG-TTGTTGAC 1 ACTTAATTACCCTGAATTAAGTTA-TTACTGACTTACTTAATTACCCTGAATTAAGCTACTT-AC ** 2635 TT 64 CG * * 2637 ACTTAATTACCCTGAATTAAGTTATTTACTGACTTTCTTAATTACCCTGAATTAAGTTACCGGCT 1 ACTTAATTACCCTGAATTAAGTTA-TTACTGACTTACTTAATTACCCTGAATTAAGCTA----CT * 2702 TACTAACTT 61 TAC---C-G * * * * 2711 ACATAATTATCCTGAATTAAGTTATTCACTGACCTACTTAATTTACCCTGAATTAAGTTACTTA 1 ACTTAATTACCCTGAATTAAGTTATT-ACTGACTTACTTAA-TTACCCTGAATTAAGCTACTTA 2775 TTACTGATTC Statistics Matches: 515, Mismatches: 62, Indels: 69 0.80 0.10 0.11 Matches are distributed among these distances: 64 3 0.01 65 56 0.11 66 141 0.27 67 71 0.14 68 6 0.01 69 10 0.02 70 81 0.16 71 39 0.08 72 1 0.00 73 54 0.10 74 35 0.07 75 18 0.03 ACGTcount: A:0.31, C:0.20, G:0.10, T:0.39 Consensus pattern (65 bp): ACTTAATTACCCTGAATTAAGTTATTACTGACTTACTTAATTACCCTGAATTAAGCTACTTACCG Found at i:2591 original size:14 final size:15 Alignment explanation

Indices: 2543--2597 Score: 51 Period size: 14 Copynumber: 3.7 Consensus size: 15 2533 CTGACTTTAC 2543 TTAA-TTACCCTGAA 1 TTAAGTTACCCTGAA * * * 2557 TTAAGCTACTTACTGAC 1 TTAAGTTAC--CCTGAA 2574 TTAA-TTACCCTGAA 1 TTAAGTTACCCTGAA 2588 TTAAGTTACC 1 TTAAGTTACC 2598 TATTACTTAC Statistics Matches: 31, Mismatches: 6, Indels: 7 0.70 0.14 0.16 Matches are distributed among these distances: 14 12 0.39 15 8 0.26 16 3 0.10 17 8 0.26 ACGTcount: A:0.33, C:0.22, G:0.09, T:0.36 Consensus pattern (15 bp): TTAAGTTACCCTGAA Found at i:2718 original size:74 final size:75 Alignment explanation

Indices: 2633--2771 Score: 226 Period size: 74 Copynumber: 1.9 Consensus size: 75 2623 TAAGTTGTTG * * * * 2633 ACTTACTTAATTACCCTGAATTAAGTTATTTACTGACTTTCTTAA-TTACCCTGAATTAAGTTAC 1 ACTTACATAATTACCCTGAATTAAGTTATTCACTGACCTACTTAATTTACCCTGAATTAAGTTAC 2697 CGGCTTACTA 66 CGGCTTACTA * 2707 ACTTACATAATTATCCTGAATTAAGTTATTCACTGACCTACTTAATTTACCCTGAATTAAGTTAC 1 ACTTACATAATTACCCTGAATTAAGTTATTCACTGACCTACTTAATTTACCCTGAATTAAGTTAC 2772 TTATTACTGA Statistics Matches: 59, Mismatches: 5, Indels: 1 0.91 0.08 0.02 Matches are distributed among these distances: 74 40 0.68 75 19 0.32 ACGTcount: A:0.32, C:0.20, G:0.09, T:0.40 Consensus pattern (75 bp): ACTTACATAATTACCCTGAATTAAGTTATTCACTGACCTACTTAATTTACCCTGAATTAAGTTAC CGGCTTACTA Found at i:2781 original size:39 final size:35 Alignment explanation

Indices: 2093--2770 Score: 600 Period size: 35 Copynumber: 19.7 Consensus size: 35 2083 TTCTTACTAA * * * 2093 ACTTAATTTCCCTGAATTAAGTTACTTATTGAAC-T 1 ACTTAATTACCCTGAATTAAGTTATTTACTG-ACTT * * * * 2128 ACTTAATTACCCTGAATTAAGTT-TCTCATTAACTC 1 ACTTAATTACCCTGAATTAAGTTAT-TTACTGACTT * 2163 ACTTAATTACCCTGAATTAAAGTTGA-TTACTGATTT 1 ACTTAATTACCCTGAATT-AAGTT-ATTTACTGACTT * * * * * 2199 GCTCAATTACCCTGAATTAAGCTACTTAC---C-G 1 ACTTAATTACCCTGAATTAAGTTATTTACTGACTT * * * 2230 ACTTAATTACCCTGAATTAAGTCATTAACTGACTC 1 ACTTAATTACCCTGAATTAAGTTATTTACTGACTT * * 2265 ACTTAATTACCCTGGATTAAGCTATTTACTG---- 1 ACTTAATTACCCTGAATTAAGTTATTTACTGACTT ** * 2296 ACTTAATTACCCTGAATTAAGTTATTCGCTGACTC 1 ACTTAATTACCCTGAATTAAGTTATTTACTGACTT ** 2331 ACTTAATTACCCTGAATTAAGTTGA-TTACTGACCC 1 ACTTAATTACCCTGAATTAAGTT-ATTTACTGACTT * 2366 ACTTAATTACCCTGAATTAAGTTGA-TTACTGAATT 1 ACTTAATTACCCTGAATTAAGTT-ATTTACTGACTT * * 2401 ACTTAATTACCCTGAATTAAGTTGCTTATTACTGACTC 1 ACTTAATTACCCTGAATTAAGTT--AT-TTACTGACTT * * * 2439 GCTTAATTACCCTGAATTAAGTCGA-TTACTGAATT 1 ACTTAATTACCCTGAATTAAGT-TATTTACTGACTT * 2474 ACTTAATTACCCTGAATTAAG----TTACTGCCTT 1 ACTTAATTACCCTGAATTAAGTTATTTACTGACTT * * * * 2505 ACTTAATTTCCCTGAACTAAGTTACTAACTGACTTT 1 ACTTAATTACCCTGAATTAAGTTATTTACTGAC-TT * * 2541 ACTTAATTACCCTGAATTAAGCTACTTACTG---- 1 ACTTAATTACCCTGAATTAAGTTATTTACTGACTT ** * 2572 ACTTAATTACCCTGAATTAAGTTACCTA-TTACTT 1 ACTTAATTACCCTGAATTAAGTTATTTACTGACTT * 2606 ACTTAATTACCCTGAATTAAG-T-TGT--TGACTT 1 ACTTAATTACCCTGAATTAAGTTATTTACTGACTT 2637 ACTTAATTACCCTGAATTAAGTTATTTACTGACTT 1 ACTTAATTACCCTGAATTAAGTTATTTACTGACTT * * * 2672 TCTTAATTACCCTGAATTAAGTTACCGGCTTACTAACTT 1 ACTTAATTACCCTGAATTAAGTTA----TTTACTGACTT * * * * 2711 ACATAATTATCCTGAATTAAGTTATTCACTGACCT 1 ACTTAATTACCCTGAATTAAGTTATTTACTGACTT 2746 ACTTAATTTACCCTGAATTAAGTTA 1 ACTTAA-TTACCCTGAATTAAGTTA 2771 CTTATTACTG Statistics Matches: 531, Mismatches: 75, Indels: 73 0.78 0.11 0.11 Matches are distributed among these distances: 30 1 0.00 31 129 0.24 32 2 0.00 33 3 0.01 34 25 0.05 35 239 0.45 36 73 0.14 38 29 0.05 39 30 0.06 ACGTcount: A:0.31, C:0.20, G:0.10, T:0.38 Consensus pattern (35 bp): ACTTAATTACCCTGAATTAAGTTATTTACTGACTT Found at i:6967 original size:13 final size:13 Alignment explanation

Indices: 6932--7025 Score: 66 Period size: 13 Copynumber: 6.9 Consensus size: 13 6922 CAGAGACATG * 6932 TTTGTAA-TTATT 1 TTTGTAAGTAATT * * 6944 ATTGTATGTAATT 1 TTTGTAAGTAATT 6957 TTTGTAAGTAATT 1 TTTGTAAGTAATT * 6970 TTT-TATGTTAATTAT 1 TTTGTAAG-TAA-T-T * 6985 TATTGTATGTAATT 1 T-TTGTAAGTAATT 6999 TTTGTAAGTAATATT 1 TTTGTAAGT-A-ATT * 7014 TTTTTAAGTAAT 1 TTTGTAAGTAAT 7026 ATTACAACAA Statistics Matches: 66, Mismatches: 8, Indels: 15 0.74 0.09 0.17 Matches are distributed among these distances: 12 8 0.12 13 30 0.45 14 5 0.08 15 14 0.21 16 5 0.08 17 4 0.06 ACGTcount: A:0.30, C:0.00, G:0.12, T:0.59 Consensus pattern (13 bp): TTTGTAAGTAATT Found at i:6983 original size:42 final size:43 Alignment explanation

Indices: 6936--7016 Score: 155 Period size: 42 Copynumber: 1.9 Consensus size: 43 6926 GACATGTTTG 6936 TAATTATTATTGTATGTAATTTTTGTAAGTAAT-TTTTTATGT 1 TAATTATTATTGTATGTAATTTTTGTAAGTAATATTTTTATGT 6978 TAATTATTATTGTATGTAATTTTTGTAAGTAATATTTTT 1 TAATTATTATTGTATGTAATTTTTGTAAGTAATATTTTT 7017 TTAAGTAATA Statistics Matches: 38, Mismatches: 0, Indels: 1 0.97 0.00 0.03 Matches are distributed among these distances: 42 33 0.87 43 5 0.13 ACGTcount: A:0.30, C:0.00, G:0.11, T:0.59 Consensus pattern (43 bp): TAATTATTATTGTATGTAATTTTTGTAAGTAATATTTTTATGT Found at i:7465 original size:21 final size:22 Alignment explanation

Indices: 7427--7467 Score: 57 Period size: 21 Copynumber: 1.9 Consensus size: 22 7417 GCAAAAGTGT * * 7427 AAAAAGTGGGGCGGTGTTTAAC 1 AAAAAGTGGGACGATGTTTAAC 7449 AAAAAG-GGGACGATGTTTA 1 AAAAAGTGGGACGATGTTTA 7468 GCAACACCCA Statistics Matches: 17, Mismatches: 2, Indels: 1 0.85 0.10 0.05 Matches are distributed among these distances: 21 11 0.65 22 6 0.35 ACGTcount: A:0.37, C:0.07, G:0.34, T:0.22 Consensus pattern (22 bp): AAAAAGTGGGACGATGTTTAAC Found at i:9577 original size:23 final size:24 Alignment explanation

Indices: 9551--9610 Score: 77 Period size: 24 Copynumber: 2.5 Consensus size: 24 9541 TAATATTATA 9551 AATTTTAATT-AAACAATATTTCG 1 AATTTTAATTGAAACAATATTTCG ** ** 9574 AATTTTTTTTGGTACAATATTTCG 1 AATTTTAATTGAAACAATATTTCG 9598 AATTTTAATTGAA 1 AATTTTAATTGAA 9611 TATATAAATT Statistics Matches: 28, Mismatches: 8, Indels: 1 0.76 0.22 0.03 Matches are distributed among these distances: 23 8 0.29 24 20 0.71 ACGTcount: A:0.37, C:0.07, G:0.08, T:0.48 Consensus pattern (24 bp): AATTTTAATTGAAACAATATTTCG Found at i:11711 original size:15 final size:15 Alignment explanation

Indices: 11693--11744 Score: 50 Period size: 15 Copynumber: 3.3 Consensus size: 15 11683 ATGGTAATGA * 11693 TGGTTTTGGTGGATT 1 TGGTTTTGGTGGTTT 11708 TGGTGATTATGGTGGTTT 1 TGGT--TT-TGGTGGTTT ** 11726 TGGTGGTGGTGGTTT 1 TGGTTTTGGTGGTTT 11741 TGGT 1 TGGT 11745 CCTGCTCCGT Statistics Matches: 31, Mismatches: 3, Indels: 6 0.77 0.08 0.15 Matches are distributed among these distances: 15 17 0.55 17 2 0.06 18 12 0.39 ACGTcount: A:0.06, C:0.00, G:0.44, T:0.50 Consensus pattern (15 bp): TGGTTTTGGTGGTTT Found at i:11732 original size:9 final size:9 Alignment explanation

Indices: 11693--11744 Score: 56 Period size: 9 Copynumber: 6.1 Consensus size: 9 11683 ATGGTAATGA 11693 TGGTTTTGG 1 TGGTTTTGG * 11702 TGGATTTGG 1 TGGTTTTGG * * 11711 TGATTATGG 1 TGGTTTTGG 11720 TGGTTTTGG 1 TGGTTTTGG 11729 TGG---TGG 1 TGGTTTTGG 11735 TGGTTTTGG 1 TGGTTTTGG 11744 T 1 T 11745 CCTGCTCCGT Statistics Matches: 34, Mismatches: 6, Indels: 6 0.74 0.13 0.13 Matches are distributed among these distances: 6 6 0.18 9 28 0.82 ACGTcount: A:0.06, C:0.00, G:0.44, T:0.50 Consensus pattern (9 bp): TGGTTTTGG Found at i:11865 original size:21 final size:21 Alignment explanation

Indices: 11795--11867 Score: 65 Period size: 21 Copynumber: 3.5 Consensus size: 21 11785 TTGGTGATTA * 11795 TGGTGGGTATGGTGGTGGTGC 1 TGGTGGGTTTGGTGGTGGTGC ** ** ** 11816 TGCAGATTTTGGTGGTGGTTA 1 TGGTGGGTTTGGTGGTGGTGC * * 11837 TGGGGGGTTTGGTGCTGGTGC 1 TGGTGGGTTTGGTGGTGGTGC 11858 TGGTGGGTTT 1 TGGTGGGTTT 11868 TCTGGTTATC Statistics Matches: 37, Mismatches: 15, Indels: 0 0.71 0.29 0.00 Matches are distributed among these distances: 21 37 1.00 ACGTcount: A:0.05, C:0.05, G:0.51, T:0.38 Consensus pattern (21 bp): TGGTGGGTTTGGTGGTGGTGC Found at i:13781 original size:43 final size:43 Alignment explanation

Indices: 13724--13812 Score: 178 Period size: 43 Copynumber: 2.1 Consensus size: 43 13714 CTCAAAATCC 13724 AAACCAAGTTAAACTAGAATAGAAGAAACATTTCATATTTCCA 1 AAACCAAGTTAAACTAGAATAGAAGAAACATTTCATATTTCCA 13767 AAACCAAGTTAAACTAGAATAGAAGAAACATTTCATATTTCCA 1 AAACCAAGTTAAACTAGAATAGAAGAAACATTTCATATTTCCA 13810 AAA 1 AAA 13813 GGAAAAAAAG Statistics Matches: 46, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 43 46 1.00 ACGTcount: A:0.51, C:0.16, G:0.09, T:0.25 Consensus pattern (43 bp): AAACCAAGTTAAACTAGAATAGAAGAAACATTTCATATTTCCA Found at i:21050 original size:265 final size:265 Alignment explanation

Indices: 20569--21087 Score: 975 Period size: 265 Copynumber: 2.0 Consensus size: 265 20559 AAAAAAGAAA 20569 AAAACCCCAAAAAGATAGGCAAGTGTAGAAATGATCATTTGTCCTTGACAGTTAATACGGTCCAT 1 AAAACCCCAAAAAGATAGGCAAGTGTAGAAATGATCATTTGTCCTTGACAGTTAATACGGTCCAT 20634 TAAAACACACTAATGTGTGTGAACATAGTTAATCATCTAAAAAATAGTCAACACAACTGAAATTT 66 TAAAACACACTAATGTGTGTGAACATAGTTAATCATCTAAAAAATAGTCAACACAACTGAAATTT 20699 ACTTTCACAATCCAACACAAACCATATAGAACATAAGGATTATTAAGTAATTAGCAAGTGGACAA 131 ACTTTCACAATCCAACACAAACCATATAGAACATAAGGATTATTAAGTAATTAGCAAGTGGACAA * 20764 AAGACCAAATAGGACGAAAAGGTTATCCCAGGTGAAAAGTTGAAAAGAGCTTTCAGCAATACGGT 196 AAGACCAAACAGGACGAAAAGGTTATCCCAGGTGAAAAGTTGAAAAGAGCTTTCAGCAATACGGT 20829 CCATT 261 CCATT * * 20834 AAAACCCCAAAAAGATAGGCAAGTGTAGAAATGATCATTTGTCTTTGACAGTTAATATGGTCCAT 1 AAAACCCCAAAAAGATAGGCAAGTGTAGAAATGATCATTTGTCCTTGACAGTTAATACGGTCCAT 20899 TAAAACACACTAATGTGTGTGAACATAGTTAATCATCTAAAAAATAGTCAACACAACTGAAATTT 66 TAAAACACACTAATGTGTGTGAACATAGTTAATCATCTAAAAAATAGTCAACACAACTGAAATTT 20964 ACTTTCACAATCCAACACAAACCATATAGAACATAAGGATTATTAAGTAATTAGCAAGTGGACAA 131 ACTTTCACAATCCAACACAAACCATATAGAACATAAGGATTATTAAGTAATTAGCAAGTGGACAA * * * * 21029 AAGACCAAACGGGATGAAAAGGTTGTCCCAGGTGAAAAGTTGAAAGGAGCTTTCAGCAA 196 AAGACCAAACAGGACGAAAAGGTTATCCCAGGTGAAAAGTTGAAAAGAGCTTTCAGCAA 21088 GCACCGTCTT Statistics Matches: 247, Mismatches: 7, Indels: 0 0.97 0.03 0.00 Matches are distributed among these distances: 265 247 1.00 ACGTcount: A:0.43, C:0.17, G:0.17, T:0.24 Consensus pattern (265 bp): AAAACCCCAAAAAGATAGGCAAGTGTAGAAATGATCATTTGTCCTTGACAGTTAATACGGTCCAT TAAAACACACTAATGTGTGTGAACATAGTTAATCATCTAAAAAATAGTCAACACAACTGAAATTT ACTTTCACAATCCAACACAAACCATATAGAACATAAGGATTATTAAGTAATTAGCAAGTGGACAA AAGACCAAACAGGACGAAAAGGTTATCCCAGGTGAAAAGTTGAAAAGAGCTTTCAGCAATACGGT CCATT Done.