Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01008054.1 Corchorus capsularis cultivar CVL-1 contig08075, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 23591
ACGTcount: A:0.31, C:0.17, G:0.21, T:0.32


Found at i:867 original size:50 final size:51

Alignment explanation

Indices: 661--934 Score: 224 Period size: 51 Copynumber: 5.5 Consensus size: 51 651 AAAGTTTAAG * * * * 661 CTTTTAAGTAATTTGTATATAAAGATTGAATTTTTAAGTAAAAGATTGAAT 1 CTTTAAAGTAATTTGTAAATAAAGATTGAATTTTTAATTGAAAGATTGAAT * * * * * 712 TTTTAAAGTGATTTGTAAATAAA-AGTGGGATTTTTAATT-AGAAGA-TGACT 1 CTTTAAAGTAATTTGTAAATAAAGA-TTGAATTTTTAATTGA-AAGATTGAAT * * * * 762 CTTTCAAGTAATTTGTAAATAGAGA-TGAACTTTTAATTGAAAGATT-AAG 1 CTTTAAAGTAATTTGTAAATAAAGATTGAATTTTTAATTGAAAGATTGAAT * * * * 811 CTTTTAAGTAATTTGTAAATAAAGATTGAGTTTTTAGTTGGAAA-ATTAAAT 1 CTTTAAAGTAATTTGTAAATAAAGATTGAATTTTTAATT-GAAAGATTGAAT * * * * * 862 CTTTAAAGTATTTTGTGAATAAAGATTAAATCTTTTAAGTAAAAGA-TGAAAT 1 CTTTAAAGTAATTTGTAAATAAAGATTGAAT-TTTTAATTGAAAGATTG-AAT * * 914 CTTTGAA-TAATATG-AAATAAA 1 CTTTAAAGTAATTTGTAAATAAA 935 AATGAAATCT Statistics Matches: 176, Mismatches: 36, Indels: 23 0.75 0.15 0.10 Matches are distributed among these distances: 49 38 0.22 50 46 0.26 51 76 0.43 52 16 0.09 ACGTcount: A:0.42, C:0.03, G:0.15, T:0.40 Consensus pattern (51 bp): CTTTAAAGTAATTTGTAAATAAAGATTGAATTTTTAATTGAAAGATTGAAT Found at i:932 original size:150 final size:150 Alignment explanation

Indices: 651--932 Score: 333 Period size: 150 Copynumber: 1.9 Consensus size: 150 641 AATCTGGTAC * * * * 651 AAAGTTTAAGCTTTTAAGTAATTTGTATATAAAGATTGAATTTTTAAGTAAAAGATTGAATTTTT 1 AAAGATTAAGCTTTTAAGTAATTTGTAAATAAAGATTGAATTTTTAAGTAAAAGATTAAATCTTT ** * * * * 716 AAAGTGATTTGTAAATAAAAGTGGGATTTTTAATTAGAAGATGACTCTTTCAAGTAATTTGTAAA 66 AAAGTGATTTGTAAATAAAAGTGAAATTTTTAAGTAAAAGATGAATCTTTCAAGTAATATGTAAA 781 TAGAGATGAACTTTTAATTG 131 TAGAGATGAACTTTTAATTG * * 801 AAAGATTAAGCTTTTAAGTAATTTGTAAATAAAGATTGAGTTTTT-AGTTGGAAA-ATTAAATCT 1 AAAGATTAAGCTTTTAAGTAATTTGTAAATAAAGATTGAATTTTTAAG-T-AAAAGATTAAATCT * * * 864 TTAAAGT-ATTTTGTGAAT-AAAGATTAAATCTTTTAAGTAAAAGATGAAATCTTTGAA-TAATA 64 TTAAAGTGA-TTTGTAAATAAAAG-TGAAAT-TTTTAAGTAAAAGATG-AATCTTTCAAGTAATA 926 TG-AAATA 125 TGTAAATA 933 AAAATGAAAT Statistics Matches: 111, Mismatches: 15, Indels: 12 0.80 0.11 0.09 Matches are distributed among these distances: 149 7 0.06 150 73 0.66 151 23 0.21 152 8 0.07 ACGTcount: A:0.41, C:0.03, G:0.16, T:0.40 Consensus pattern (150 bp): AAAGATTAAGCTTTTAAGTAATTTGTAAATAAAGATTGAATTTTTAAGTAAAAGATTAAATCTTT AAAGTGATTTGTAAATAAAAGTGAAATTTTTAAGTAAAAGATGAATCTTTCAAGTAATATGTAAA TAGAGATGAACTTTTAATTG Found at i:1472 original size:35 final size:35 Alignment explanation

Indices: 1430--2107 Score: 815 Period size: 35 Copynumber: 19.7 Consensus size: 35 1420 AGTAATAAGA 1430 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * 1465 AACTTAATTCAGGGTAATTAAG---TT-AGTAATC 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * * * 1496 AACTTAATTCAGGGTCATTAGGTAATTCAGTGATT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * * * 1531 AACTTAATTCAGGGTAATTAAGTGAGTCAGTAATC 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT 1566 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * * * * 1601 AACTTAAGTCAGGGTAATTAAGTGAGTCAGTAATC 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * * 1636 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAAGT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * * * * * * 1671 ACCTTAATTCAGAGTAATTAAGTGAGTCAGTTAGT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * * * 1706 AACTTAATTCAGGGTAATTAAGTAAAGTCAGTTAGT 1 AACTTAATTCAGGGTAATTAAGT-AATTCAGTAATT 1742 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * 1777 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATC 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * 1812 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATC 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * * * * 1847 AACTTAATTCAGGGCAATTAAATGATTCAGTAATC 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * 1882 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATC 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * * ** 1917 AACTTAATTCAGGGTAATT-A--AA-TGAGTCAGC 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * * ** 1948 AACTTAATTCAGGGTAATTAAGTAAGT-AATAGGT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT * * 1982 AACTTAATTTAGGGTAATTAAGTGAA-TCAGTAATC 1 AACTTAATTCAGGGTAATTAAGT-AATTCAGTAATT * * * * 2017 AACTTTAATTCAGGGCAATTAAGTGAGTC-G--AGT 1 AAC-TTAATTCAGGGTAATTAAGTAATTCAGTAATT * * * * 2050 AACTTAATTTAGGGTAATTAAGTAGTTCAATAAGT 1 AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT 2085 AACTTAATTCAGGGTAATTAAGT 1 AACTTAATTCAGGGTAATTAAGT 2108 TTAGTAAGAA Statistics Matches: 564, Mismatches: 63, Indels: 32 0.86 0.10 0.05 Matches are distributed among these distances: 31 51 0.09 32 25 0.04 33 4 0.01 34 31 0.05 35 399 0.71 36 54 0.10 ACGTcount: A:0.38, C:0.10, G:0.18, T:0.34 Consensus pattern (35 bp): AACTTAATTCAGGGTAATTAAGTAATTCAGTAATT Found at i:1768 original size:8 final size:8 Alignment explanation

Indices: 1755--1845 Score: 56 Period size: 8 Copynumber: 10.6 Consensus size: 8 1745 TTAATTCAGG 1755 GTAATTAA 1 GTAATTAA * 1763 GTAATTCA 1 GTAATTAA 1771 GTAATTAA 1 GTAATTAA * * 1779 CTTAATTCAGG 1 -GTAATT-A-A 1790 GTAATTAA 1 GTAATTAA * 1798 GTAATTCA 1 GTAATTAA * 1806 GTAATCAA 1 GTAATTAA * * 1814 CTTAATTCAGG 1 -GTAATT-A-A 1825 GTAATTAA 1 GTAATTAA * 1833 GTAATTCA 1 GTAATTAA 1841 GTAAT 1 GTAAT 1846 CAACTTAATT Statistics Matches: 62, Mismatches: 15, Indels: 12 0.70 0.17 0.13 Matches are distributed among these distances: 8 39 0.63 9 11 0.18 10 12 0.19 ACGTcount: A:0.41, C:0.09, G:0.14, T:0.36 Consensus pattern (8 bp): GTAATTAA Found at i:5515 original size:21 final size:21 Alignment explanation

Indices: 5490--5530 Score: 64 Period size: 21 Copynumber: 2.0 Consensus size: 21 5480 TCTTGAATGC * 5490 TTGAAGTCTATTGAAGATCAA 1 TTGAAGACTATTGAAGATCAA * 5511 TTGAAGAGTATTGAAGATCA 1 TTGAAGACTATTGAAGATCA 5531 TAAGCTAAGG Statistics Matches: 18, Mismatches: 2, Indels: 0 0.90 0.10 0.00 Matches are distributed among these distances: 21 18 1.00 ACGTcount: A:0.39, C:0.07, G:0.22, T:0.32 Consensus pattern (21 bp): TTGAAGACTATTGAAGATCAA Found at i:11444 original size:22 final size:22 Alignment explanation

Indices: 11419--11492 Score: 87 Period size: 22 Copynumber: 3.3 Consensus size: 22 11409 TGCATGGGCA 11419 TGGCCGGGTCATGTGGCCGGTG 1 TGGCCGGGTCATGTGGCCGGTG * ** 11441 TGGCAGGG-CATGTGCGACCGGCA 1 TGGCCGGGTCATGTG-G-CCGGTG * 11464 TGGCCGGGTCATGTAGCCGGTG 1 TGGCCGGGTCATGTGGCCGGTG 11486 TGGCCGG 1 TGGCCGG 11493 TCAAGTGCTT Statistics Matches: 42, Mismatches: 7, Indels: 6 0.76 0.13 0.11 Matches are distributed among these distances: 21 6 0.14 22 19 0.45 23 12 0.29 24 5 0.12 ACGTcount: A:0.09, C:0.24, G:0.47, T:0.19 Consensus pattern (22 bp): TGGCCGGGTCATGTGGCCGGTG Found at i:13840 original size:9 final size:10 Alignment explanation

Indices: 13814--13839 Score: 52 Period size: 10 Copynumber: 2.6 Consensus size: 10 13804 GAAAAATATT 13814 AAAAAAATAA 1 AAAAAAATAA 13824 AAAAAAATAA 1 AAAAAAATAA 13834 AAAAAA 1 AAAAAA 13840 TTTTCAACCA Statistics Matches: 16, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 10 16 1.00 ACGTcount: A:0.92, C:0.00, G:0.00, T:0.08 Consensus pattern (10 bp): AAAAAAATAA Found at i:19203 original size:21 final size:23 Alignment explanation

Indices: 19163--19204 Score: 70 Period size: 23 Copynumber: 1.9 Consensus size: 23 19153 AATGGAGCTA 19163 ATGGAGATCATGTCCGGATAAAC 1 ATGGAGATCATGTCCGGATAAAC 19186 ATGGAGAT-ATGT-CGGATAA 1 ATGGAGATCATGTCCGGATAA 19205 TCAAGAAGAT Statistics Matches: 19, Mismatches: 0, Indels: 2 0.90 0.00 0.10 Matches are distributed among these distances: 21 7 0.37 22 4 0.21 23 8 0.42 ACGTcount: A:0.36, C:0.12, G:0.29, T:0.24 Consensus pattern (23 bp): ATGGAGATCATGTCCGGATAAAC Found at i:19214 original size:21 final size:23 Alignment explanation

Indices: 19167--19214 Score: 55 Period size: 21 Copynumber: 2.2 Consensus size: 23 19157 GAGCTAATGG * * 19167 AGATCATGTCCGGATAAACATGG 1 AGATCATGTCCGGATAAACAAGA * 19190 AGAT-ATGT-CGGATAATCAAGA 1 AGATCATGTCCGGATAAACAAGA 19211 AGAT 1 AGAT 19215 GCCAAGGTTG Statistics Matches: 22, Mismatches: 3, Indels: 2 0.81 0.11 0.07 Matches are distributed among these distances: 21 14 0.64 22 4 0.18 23 4 0.18 ACGTcount: A:0.40, C:0.12, G:0.25, T:0.23 Consensus pattern (23 bp): AGATCATGTCCGGATAAACAAGA Found at i:22479 original size:22 final size:21 Alignment explanation

Indices: 22408--22481 Score: 69 Period size: 22 Copynumber: 3.3 Consensus size: 21 22398 TGCATGGGCA 22408 TGGCCGGGTCATGTGTCCGGTG 1 TGGCCGGGTCATGTG-CCGGTG * ** 22430 TGGTCGGG-CATGTGCGATCGGCA 1 TGGCCGGGTCATGTGC---CGGTG 22453 TGGCCGGGTCATGTAGCCGGTG 1 TGGCCGGGTCATGT-GCCGGTG 22475 TGGCCGG 1 TGGCCGG 22482 TCAAGTGAAG Statistics Matches: 41, Mismatches: 6, Indels: 10 0.72 0.11 0.18 Matches are distributed among these distances: 20 1 0.02 21 6 0.15 22 17 0.41 23 10 0.24 24 5 0.12 25 2 0.05 ACGTcount: A:0.08, C:0.23, G:0.46, T:0.23 Consensus pattern (21 bp): TGGCCGGGTCATGTGCCGGTG Done.