Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01010659.1 Corchorus capsularis cultivar CVL-1 contig10680, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 31386
ACGTcount: A:0.32, C:0.18, G:0.20, T:0.31


Found at i:2235 original size:17 final size:17

Alignment explanation

Indices: 2202--2234 Score: 50 Period size: 17 Copynumber: 2.0 Consensus size: 17 2192 TCTGGTCGAA * 2202 ATTTTTTTTATTATTTT 1 ATTTTATTTATTATTTT 2219 ATTTTATTTA-TATTTT 1 ATTTTATTTATTATTTT 2235 TCGATATAAC Statistics Matches: 15, Mismatches: 1, Indels: 1 0.88 0.06 0.06 Matches are distributed among these distances: 16 6 0.40 17 9 0.60 ACGTcount: A:0.21, C:0.00, G:0.00, T:0.79 Consensus pattern (17 bp): ATTTTATTTATTATTTT Found at i:4870 original size:33 final size:33 Alignment explanation

Indices: 4833--4985 Score: 195 Period size: 33 Copynumber: 4.7 Consensus size: 33 4823 CTAATTGTGA * * * 4833 TGAAAACAAATCTGTTTTGGTTGATCATAGCAT 1 TGAAAATAATTCTGTTTTGGTTGATCATAACAT * 4866 TGAAAATAATTCTGTTTTCGTTGATCATAACAT 1 TGAAAATAATTCTGTTTTGGTTGATCATAACAT * * 4899 TGCAAATAATTATGTTTTGGTTGATCATAACAT 1 TGAAAATAATTCTGTTTTGGTTGATCATAACAT * ** 4932 TGCAAATAATTCTGTTTTGGTTG---ATGGCAT 1 TGAAAATAATTCTGTTTTGGTTGATCATAACAT * 4962 TGAAAATAATACTGTTTTGGTTGA 1 TGAAAATAATTCTGTTTTGGTTGA 4986 AGGAAAGAGA Statistics Matches: 107, Mismatches: 12, Indels: 4 0.87 0.10 0.03 Matches are distributed among these distances: 30 26 0.24 33 81 0.76 ACGTcount: A:0.31, C:0.10, G:0.18, T:0.41 Consensus pattern (33 bp): TGAAAATAATTCTGTTTTGGTTGATCATAACAT Found at i:9541 original size:33 final size:33 Alignment explanation

Indices: 9488--9551 Score: 83 Period size: 33 Copynumber: 1.9 Consensus size: 33 9478 GTGTTTTAGA * 9488 TGTTATTTGCAATGATACTAAACCTAATTTGAG 1 TGTTATTTGCAATGACACTAAACCTAATTTGAG * * * * 9521 TGTTGTTTGCGATGACACTAAATCTATTTTG 1 TGTTATTTGCAATGACACTAAACCTAATTTG 9552 TATGCTAATT Statistics Matches: 26, Mismatches: 5, Indels: 0 0.84 0.16 0.00 Matches are distributed among these distances: 33 26 1.00 ACGTcount: A:0.28, C:0.12, G:0.17, T:0.42 Consensus pattern (33 bp): TGTTATTTGCAATGACACTAAACCTAATTTGAG Found at i:9603 original size:33 final size:33 Alignment explanation

Indices: 9566--9718 Score: 195 Period size: 33 Copynumber: 4.7 Consensus size: 33 9556 CTAATTGTGA * * * 9566 TGAAAACAAATCTGTTTTGGTTGATCATAGCAT 1 TGAAAATAATTCTGTTTTGGTTGATCATAACAT * 9599 TGAAAATAATTCTGTTTTCGTTGATCATAACAT 1 TGAAAATAATTCTGTTTTGGTTGATCATAACAT * * 9632 TGCAAATAATTATGTTTTGGTTGATCATAACAT 1 TGAAAATAATTCTGTTTTGGTTGATCATAACAT * ** 9665 TGCAAATAATTCTGTTTTGGTTG---ATGGCAT 1 TGAAAATAATTCTGTTTTGGTTGATCATAACAT * 9695 TGAAAATAATACTGTTTTGGTTGA 1 TGAAAATAATTCTGTTTTGGTTGA 9719 AGGAAAGAGA Statistics Matches: 107, Mismatches: 12, Indels: 4 0.87 0.10 0.03 Matches are distributed among these distances: 30 26 0.24 33 81 0.76 ACGTcount: A:0.31, C:0.10, G:0.18, T:0.41 Consensus pattern (33 bp): TGAAAATAATTCTGTTTTGGTTGATCATAACAT Found at i:14258 original size:19 final size:19 Alignment explanation

Indices: 14234--14273 Score: 80 Period size: 19 Copynumber: 2.1 Consensus size: 19 14224 AGCGCCATTT 14234 TTTGAAATTTTCCCATGAA 1 TTTGAAATTTTCCCATGAA 14253 TTTGAAATTTTCCCATGAA 1 TTTGAAATTTTCCCATGAA 14272 TT 1 TT 14274 AATCACGGGA Statistics Matches: 21, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 19 21 1.00 ACGTcount: A:0.30, C:0.15, G:0.10, T:0.45 Consensus pattern (19 bp): TTTGAAATTTTCCCATGAA Found at i:19180 original size:15 final size:15 Alignment explanation

Indices: 19160--19193 Score: 68 Period size: 15 Copynumber: 2.3 Consensus size: 15 19150 CTATGCCTCT 19160 ACCTTCGATTCAACA 1 ACCTTCGATTCAACA 19175 ACCTTCGATTCAACA 1 ACCTTCGATTCAACA 19190 ACCT 1 ACCT 19194 CCAGAGGTCA Statistics Matches: 19, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 15 19 1.00 ACGTcount: A:0.32, C:0.35, G:0.06, T:0.26 Consensus pattern (15 bp): ACCTTCGATTCAACA Found at i:22806 original size:19 final size:18 Alignment explanation

Indices: 22765--22812 Score: 69 Period size: 18 Copynumber: 2.6 Consensus size: 18 22755 TGTCCATGAT * 22765 TTCAATTAGTGATTTTTA 1 TTCAATTAGTAATTTTTA 22783 TTCAATTAGTAATTTTTA 1 TTCAATTAGTAATTTTTA * 22801 TCTCAACTAGTA 1 T-TCAATTAGTA 22813 TACCTTAGCT Statistics Matches: 27, Mismatches: 2, Indels: 1 0.90 0.07 0.03 Matches are distributed among these distances: 18 18 0.67 19 9 0.33 ACGTcount: A:0.31, C:0.10, G:0.08, T:0.50 Consensus pattern (18 bp): TTCAATTAGTAATTTTTA Found at i:22944 original size:17 final size:17 Alignment explanation

Indices: 22922--22954 Score: 50 Period size: 17 Copynumber: 1.9 Consensus size: 17 22912 CAACATTGCA 22922 TAAGTA-AAATCTGCATC 1 TAAGTAGAAA-CTGCATC 22939 TAAGTAGAAACTGCAT 1 TAAGTAGAAACTGCAT 22955 TTTAGGAGTT Statistics Matches: 15, Mismatches: 0, Indels: 2 0.88 0.00 0.12 Matches are distributed among these distances: 17 12 0.80 18 3 0.20 ACGTcount: A:0.42, C:0.15, G:0.15, T:0.27 Consensus pattern (17 bp): TAAGTAGAAACTGCATC Found at i:27450 original size:22 final size:22 Alignment explanation

Indices: 27422--27465 Score: 79 Period size: 22 Copynumber: 2.0 Consensus size: 22 27412 CCAAACTAAA * 27422 TTGCATTGTGTCTTCTTTACTT 1 TTGCATTGTGTCTTCTCTACTT 27444 TTGCATTGTGTCTTCTCTACTT 1 TTGCATTGTGTCTTCTCTACTT 27466 ATGGTCTTCT Statistics Matches: 21, Mismatches: 1, Indels: 0 0.95 0.05 0.00 Matches are distributed among these distances: 22 21 1.00 ACGTcount: A:0.09, C:0.20, G:0.14, T:0.57 Consensus pattern (22 bp): TTGCATTGTGTCTTCTCTACTT Found at i:27609 original size:13 final size:13 Alignment explanation

Indices: 27591--27617 Score: 54 Period size: 13 Copynumber: 2.1 Consensus size: 13 27581 ATTAGATACT 27591 TCTTTTCATTGCA 1 TCTTTTCATTGCA 27604 TCTTTTCATTGCA 1 TCTTTTCATTGCA 27617 T 1 T 27618 ACATAGGGCA Statistics Matches: 14, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 13 14 1.00 ACGTcount: A:0.15, C:0.22, G:0.07, T:0.56 Consensus pattern (13 bp): TCTTTTCATTGCA Found at i:30507 original size:35 final size:35 Alignment explanation

Indices: 30468--30690 Score: 324 Period size: 35 Copynumber: 6.3 Consensus size: 35 30458 AGTAATAAGC * 30468 AACTTAATTCAGGGTAATTAAGTAATTCAATAATT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * 30503 AACTTAATTCAGGGTAATTAAGTAATTCGGTAATT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * 30538 AACTTAATTCAGGGTAATTAAGTGAA-TCAGTAATAAGC 1 AACTTAATTCAGGGTAATTAAGT-AATTCAGTAAT---T 30576 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * * 30611 AACTTAATTCAGGGTAATTAAGTGAGTCAGTAATT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * * 30646 GACTTAATTCAGGGTAATTAAGTAATTCGGTAATT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * 30681 AA-GTAATTCA 1 AACTTAATTCA 30691 ATAATTAACT Statistics Matches: 170, Mismatches: 13, Indels: 11 0.88 0.07 0.06 Matches are distributed among these distances: 34 7 0.04 35 128 0.75 36 2 0.01 37 2 0.01 38 31 0.18 ACGTcount: A:0.39, C:0.09, G:0.17, T:0.35 Consensus pattern (35 bp): AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT Found at i:30651 original size:143 final size:141 Alignment explanation

Indices: 30467--31358 Score: 934 Period size: 143 Copynumber: 6.2 Consensus size: 141 30457 CAGTAATAAG * * * 30467 CAACTTAATTCAGGGTAATTAAGTAATTCAATAATTAACTTAATTCAGGGTAATTAAGTAATTCG 1 CAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATTAACTTAATTCAGGGTAATTAAGTAA-TCA * * 30532 GTAATTAACTTAATTCAGGGTAATTAAGTGAA-TCAGTAATAAGCAACTTAATTCAGGGTAATTA 65 GTAATCAACTTAATTCAGGGTAATTAAGT-AATTCAGTAATAA-TAACTTAATTCAGGGTAATTA * 30596 AGTAATTCAGTAAT 128 AGTAAGTCAGTAAT * * * * 30610 TAACTTAATTCAGGGTAATTAAGTGAGTCAGTAATTGACTTAATTCAGGGTAATTAAGTAATTCG 1 CAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATTAACTTAATTCAGGGTAATTAAGTAA-TCA * * * * * *** 30675 GTAATTAA-GTAATTCA--ATAATTAACTTAATTCAGGGTAATTAAGTAATTCAGTAATT-AACT 65 GTAATCAACTTAATTCAGGGTAATTAA-GTAATTCA--GTAA-TAA-TAA--C-TTAATTCAGGG * 30736 TAATTCAGGGTAATTAAGTGGGTCAGTAAT 122 TAA-T-----TAAGTAA----GTCAGTAAT * * 30766 CAACTTAATTCAGGGTAATTAAGTAATTCGGTAATTAACTTAATTCAGGGTAATTAAGTGAATCA 1 CAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATTAACTTAATTCAGGGTAATTAAGT-AATCA 30831 GTAATAAGCAACTTAATTCAGGGTAATTAAGTAATTCAGTAAT--TAACTTAATTCAGGGTAATT 65 GTAAT---CAACTTAATTCAGGGTAATTAAGTAATTCAGTAATAATAACTTAATTCAGGGTAATT * 30894 AAGTGAGTCAGTAAT 127 AAGTAAGTCAGTAAT * 30909 CAACTTAATTCAGGGTAATTAAGT-AGTTCGGTAATTAACTTAATTCAGGGTAATTAAGTGAATC 1 CAACTTAATTCAGGGTAATTAAGTAAG-TCAGTAATTAACTTAATTCAGGGTAATTAAGT-AATC * * * 30973 AGTAATAAGCAACTTAATTCAGGGTAATTAAGTAATTAAGTAAT--TAATTTAATTCAGAGTAAT 64 AGTAAT---CAACTTAATTCAGGGTAATTAAGTAATTCAGTAATAATAACTTAATTCAGGGTAAT * 31036 TAAGTGAGTCAGTAAT 126 TAAGTAAGTCAGTAAT * * * * ** 31052 CAACTTAATTTAGGGTAATTAAGTAATTCGGTAATTAACTTAATTCAGGATAATTAAGTGGGTCA 1 CAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATTAACTTAATTCAGGGTAATTAAGT-AATCA * * 31117 GTAATCAACTTAATTCAGGGTAATTAAGTATTTCGGTAAT--TAACTTAATTCAGGGTAATTAAG 65 GTAATCAACTTAATTCAGGGTAATTAAGTAATTCAGTAATAATAACTTAATTCAGGGTAATTAAG * 31180 TGAA-TCAGTAGT 130 T-AAGTCAGTAAT * * * 31192 CAACTTAATTGAGGGTAATTAAGTAAGTCAGTAATCAACTTAATTCAGGGTGATTAAGTAAGTCA 1 CAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATTAACTTAATTCAGGGTAATTAAGTAA-TCA * * * * 31257 GTAATAAATTTAATTCAGGGTAATTAAGTAAGTCA-T--TAATCAACTTAATTCAGGATAATTAA 65 GTAATCAACTTAATTCAGGGTAATTAAGTAATTCAGTAATAAT-AACTTAATTCAGGGTAATTAA * * * 31319 GTGAGTCAATAGT 129 GTAAGTCAGTAAT * 31332 TAACTTAATTCAGGGTAATTAAGTAAG 1 CAACTTAATTCAGGGTAATTAAGTAAG 31359 GGTAATTAAG Statistics Matches: 650, Mismatches: 65, Indels: 71 0.83 0.08 0.09 Matches are distributed among these distances: 137 1 0.00 139 3 0.00 140 210 0.32 141 5 0.01 142 8 0.01 143 281 0.43 144 7 0.01 146 5 0.01 147 11 0.02 152 12 0.02 153 5 0.01 155 3 0.00 156 69 0.11 157 2 0.00 158 1 0.00 159 6 0.01 160 7 0.01 161 7 0.01 162 7 0.01 ACGTcount: A:0.39, C:0.09, G:0.17, T:0.34 Consensus pattern (141 bp): CAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATTAACTTAATTCAGGGTAATTAAGTAATCAG TAATCAACTTAATTCAGGGTAATTAAGTAATTCAGTAATAATAACTTAATTCAGGGTAATTAAGT AAGTCAGTAAT Found at i:30713 original size:35 final size:35 Alignment explanation

Indices: 30674--31358 Score: 865 Period size: 35 Copynumber: 19.4 Consensus size: 35 30664 TAAGTAATTC * * * 30674 GGTAATTAAGTAATTCAATAATTAACTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG * * 30709 GGTAATTAAGTAATTCAGTAATTAACTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG ** 30744 GGTAATTAAGTGGGTCAGTAATCAACTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG * * * 30779 GGTAATTAAGTAATTCGGTAATTAACTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG 30814 GGTAATTAAGTGAA-TCAGTAATAAGCAACTTAATTCAG 1 GGTAATTAAGT-AAGTCAGTAAT---CAACTTAATTCAG * * 30852 GGTAATTAAGTAATTCAGTAATTAACTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG * 30887 GGTAATTAAGTGAGTCAGTAATCAACTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG * * 30922 GGTAATTAAGT-AGTTCGGTAATTAACTTAATTCAG 1 GGTAATTAAGTAAG-TCAGTAATCAACTTAATTCAG 30957 GGTAATTAAGTGAA-TCAGTAATAAGCAACTTAATTCAG 1 GGTAATTAAGT-AAGTCAGTAAT---CAACTTAATTCAG * * * * 30995 GGTAATTAAGTAATTAAGTAATTAATTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG * * * 31030 AGTAATTAAGTGAGTCAGTAATCAACTTAATTTAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG * * * 31065 GGTAATTAAGTAATTCGGTAATTAACTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG * ** 31100 GATAATTAAGTGGGTCAGTAATCAACTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG ** * * 31135 GGTAATTAAGTATTTCGGTAATTAACTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG * * 31170 GGTAATTAAGTGAA-TCAGTAGTCAACTTAATTGAG 1 GGTAATTAAGT-AAGTCAGTAATCAACTTAATTCAG 31205 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG * * * 31240 GGTGATTAAGTAAGTCAGTAATAAATTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG * 31275 GGTAATTAAGTAAGTCATTAATCAACTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG * * * * * 31310 GATAATTAAGTGAGTCAATAGTTAACTTAATTCAG 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG 31345 GGTAATTAAGTAAG 1 GGTAATTAAGTAAG 31359 GGTAATTAAG Statistics Matches: 567, Mismatches: 69, Indels: 28 0.85 0.10 0.04 Matches are distributed among these distances: 34 4 0.01 35 494 0.87 36 3 0.01 37 5 0.01 38 61 0.11 ACGTcount: A:0.39, C:0.09, G:0.18, T:0.34 Consensus pattern (35 bp): GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAG Found at i:31009 original size:8 final size:8 Alignment explanation

Indices: 30996--31040 Score: 54 Period size: 8 Copynumber: 5.2 Consensus size: 8 30986 TTAATTCAGG 30996 GTAATTAA 1 GTAATTAA 31004 GTAATTAA 1 GTAATTAA 31012 GTAATTAA 1 GTAATTAA * 31020 TTTAATTCAGA 1 -GTAATT-A-A 31031 GTAATTAA 1 GTAATTAA 31039 GT 1 GT 31041 GAGTCAGTAA Statistics Matches: 32, Mismatches: 2, Indels: 6 0.80 0.05 0.15 Matches are distributed among these distances: 8 19 0.59 9 6 0.19 10 6 0.19 11 1 0.03 ACGTcount: A:0.44, C:0.02, G:0.13, T:0.40 Consensus pattern (8 bp): GTAATTAA Found at i:31360 original size:14 final size:14 Alignment explanation

Indices: 31343--31369 Score: 54 Period size: 14 Copynumber: 1.9 Consensus size: 14 31333 AACTTAATTC 31343 AGGGTAATTAAGTA 1 AGGGTAATTAAGTA 31357 AGGGTAATTAAGT 1 AGGGTAATTAAGT 31370 TTAGCAAGAA Statistics Matches: 13, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 14 13 1.00 ACGTcount: A:0.41, C:0.00, G:0.30, T:0.30 Consensus pattern (14 bp): AGGGTAATTAAGTA Done.