Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01015655.1 Corchorus capsularis cultivar CVL-1 contig15676, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 25408
ACGTcount: A:0.34, C:0.18, G:0.16, T:0.33


Found at i:6671 original size:21 final size:23

Alignment explanation

Indices: 6647--6691 Score: 58 Period size: 23 Copynumber: 2.0 Consensus size: 23 6637 ATTAATTATA 6647 TATAATT-TTTTTA-AGATAAAT 1 TATAATTATTTTTATAGATAAAT * * 6668 TATATTTATTTTTATATATAAAT 1 TATAATTATTTTTATAGATAAAT 6691 T 1 T 6692 TGATAGTATA Statistics Matches: 20, Mismatches: 2, Indels: 2 0.83 0.08 0.08 Matches are distributed among these distances: 21 6 0.30 22 6 0.30 23 8 0.40 ACGTcount: A:0.40, C:0.00, G:0.02, T:0.58 Consensus pattern (23 bp): TATAATTATTTTTATAGATAAAT Found at i:9678 original size:22 final size:22 Alignment explanation

Indices: 9653--9793 Score: 94 Period size: 22 Copynumber: 6.4 Consensus size: 22 9643 AAACACAATT * * 9653 TGAAAATTTAATAACCTCATTA 1 TGAAAATTTGATAACCTCACTA * 9675 TG-AAATTTCGATAACCTCCCTA 1 TGAAAATTT-GATAACCTCACTA * * 9697 TGAAAAATTGATAACCACACTA 1 TGAAAATTTGATAACCTCACTA * * 9719 TG-AAATTTTATTACCTGCACTA 1 TGAAAATTTGATAACCT-CACTA * * * 9741 TG-AAATTTCGATAAATCTCAATG 1 TGAAAATTT-GAT-AACCTCACTA * * 9764 TGAAATTTTGATAATCTGC-CTA 1 TGAAAATTTGATAACCT-CACTA 9786 T-AAAATTT 1 TGAAAATTT 9794 TAATAATTAC Statistics Matches: 93, Mismatches: 19, Indels: 15 0.73 0.15 0.12 Matches are distributed among these distances: 21 22 0.24 22 47 0.51 23 16 0.17 24 8 0.09 ACGTcount: A:0.39, C:0.16, G:0.09, T:0.35 Consensus pattern (22 bp): TGAAAATTTGATAACCTCACTA Found at i:9754 original size:44 final size:44 Alignment explanation

Indices: 9653--9745 Score: 107 Period size: 44 Copynumber: 2.1 Consensus size: 44 9643 AAACACAATT * * * * * 9653 TGAAAATTTAATAACCTCATTATGAAATTTCGATAACCTCCCTA 1 TGAAAAATTGATAACCACACTATGAAATTTCGATAACCTCACTA * * 9697 TGAAAAATTGATAACCACACTATGAAATTT-TATTACCTGCACTA 1 TGAAAAATTGATAACCACACTATGAAATTTCGATAACCT-CACTA 9741 TGAAA 1 TGAAA 9746 TTTCGATAAA Statistics Matches: 41, Mismatches: 7, Indels: 2 0.82 0.14 0.04 Matches are distributed among these distances: 43 6 0.15 44 35 0.85 ACGTcount: A:0.41, C:0.18, G:0.09, T:0.32 Consensus pattern (44 bp): TGAAAAATTGATAACCACACTATGAAATTTCGATAACCTCACTA Found at i:10087 original size:22 final size:22 Alignment explanation

Indices: 10062--10165 Score: 91 Period size: 22 Copynumber: 4.7 Consensus size: 22 10052 ACATCCCAAA * * 10062 GAAATTTTGGTAACCTTTTTAT 1 GAAATTTTGGTAACCTCTGTAT * 10084 GAAATTTTGGTAATCTCTGTAT 1 GAAATTTTGGTAACCTCTGTAT * * ** 10106 GAAATTTTGATAACTTACACTAT 1 GAAATTTTGGTAACCT-CTGTAT * ** * * 10129 GAAGTTTTAATAACTTCTATAT 1 GAAATTTTGGTAACCTCTGTAT 10151 GAAATTTTGGTAACC 1 GAAATTTTGGTAACC 10166 ACACTATAAA Statistics Matches: 65, Mismatches: 16, Indels: 2 0.78 0.19 0.02 Matches are distributed among these distances: 22 47 0.72 23 18 0.28 ACGTcount: A:0.33, C:0.11, G:0.13, T:0.43 Consensus pattern (22 bp): GAAATTTTGGTAACCTCTGTAT Found at i:10136 original size:23 final size:23 Alignment explanation

Indices: 10103--10185 Score: 84 Period size: 22 Copynumber: 3.7 Consensus size: 23 10093 GTAATCTCTG 10103 TATGAAATTTTGATAACTTACAC 1 TATGAAATTTTGATAACTTACAC * * 10126 TATGAAGTTTTAATAACTT-CTA- 1 TATGAAATTTTGATAACTTAC-AC * * 10148 TATGAAATTTTGGTAAC-CACAC 1 TATGAAATTTTGATAACTTACAC * 10170 TAT-AAAATTTGATAAC 1 TATGAAATTTTGATAAC 10186 CTTTCTATGT Statistics Matches: 49, Mismatches: 8, Indels: 8 0.75 0.12 0.12 Matches are distributed among these distances: 21 12 0.24 22 19 0.39 23 18 0.37 ACGTcount: A:0.40, C:0.12, G:0.10, T:0.39 Consensus pattern (23 bp): TATGAAATTTTGATAACTTACAC Found at i:10192 original size:45 final size:45 Alignment explanation

Indices: 10103--10202 Score: 107 Period size: 43 Copynumber: 2.3 Consensus size: 45 10093 GTAATCTCTG * ** 10103 TATGAAATTTTGATAACTTACACTATGAAGTTTTAATAACTTCTA 1 TATGAAATTTTGATAACTCACACTATGAAAATTTAATAACTTCTA * * * 10148 TATGAAATTTTGGTAAC-CACACTAT-AAAATTTGATAACCTT-TC 1 TATGAAATTTTGATAACTCACACTATGAAAATTTAATAA-CTTCTA * 10191 TATGTAATTTTG 1 TATGAAATTTTG 10203 GTTTGATTGT Statistics Matches: 47, Mismatches: 7, Indels: 4 0.81 0.12 0.07 Matches are distributed among these distances: 43 21 0.45 44 10 0.21 45 16 0.34 ACGTcount: A:0.36, C:0.12, G:0.10, T:0.42 Consensus pattern (45 bp): TATGAAATTTTGATAACTCACACTATGAAAATTTAATAACTTCTA Found at i:16557 original size:35 final size:35 Alignment explanation

Indices: 16510--16988 Score: 387 Period size: 35 Copynumber: 13.2 Consensus size: 35 16500 AAGATTTAAG * 16510 AAGTAAGA-TGGTAATCAACTTAATTGGGTGTAATT 1 AAGTAA-ATTGGTAATCAACTTAATTCGGTGTAATT * * * 16545 AAGTAATTTGGTAAAT-AACTAAATCCGGTGTAATT 1 AAGTAAATTGGT-AATCAACTTAATTCGGTGTAATT * * 16580 AGGTAAATTGGTAATCAATTTAATTCGGTGTAATT 1 AAGTAAATTGGTAATCAACTTAATTCGGTGTAATT * * * * 16615 AAATAATTTGGTAATCAACTTAATTCAGTGCAATT 1 AAGTAAATTGGTAATCAACTTAATTCGGTGTAATT * * * ** * 16650 AAGTAAATTGGAAATTAAATTAAGTAATTTG-GTAATC 1 AAGTAAATTGGTAATCAACTTAA-T--TCGGTGTAATT * * ** * * * 16687 AACTTAATTCGGTGTAATTGA-GTAATTTGGTAATCAATTCGGTGT 1 AAGTAAATT--G-GTAATCAACTTAATTCGGT-GT-AA-----T-T * 16732 AATTAAGCAATTTGGTAATCAACTTAATTCGGTGTAATT 1 AAGT-A--AAT-TGGTAATCAACTTAATTCGGTGTAATT ** 16771 AAGTAGTTTGGTAAAT-AACTTAATTCGGTGTAATT 1 AAGTAAATTGGT-AATCAACTTAATTCGGTGTAATT * * 16806 AAGTAAATTTGTAATCCACTTAATTCGGTGTAATT 1 AAGTAAATTGGTAATCAACTTAATTCGGTGTAATT 16841 AAGTAAATTGGTAA-CTAACTTAATTCGGTGTAATT 1 AAGTAAATTGGTAATC-AACTTAATTCGGTGTAATT 16876 AAGTAAATTGGTAA-CTAACTTAATTCGGTGTAATT 1 AAGTAAATTGGTAATC-AACTTAATTCGGTGTAATT ** 16911 AAGTAAATCAGTAATCAACTTAATTCGGTGTAATT 1 AAGTAAATTGGTAATCAACTTAATTCGGTGTAATT ** *** 16946 AAGTAAATCAGTAATTGGCTTAATTCGGTGTAATT 1 AAGTAAATTGGTAATCAACTTAATTCGGTGTAATT 16981 AAGTAAAT 1 AAGTAAAT 16989 AAATGGCTTA Statistics Matches: 364, Mismatches: 53, Indels: 54 0.77 0.11 0.11 Matches are distributed among these distances: 34 7 0.02 35 286 0.79 36 12 0.03 37 11 0.03 38 5 0.01 39 10 0.03 40 7 0.02 44 1 0.00 45 5 0.01 46 7 0.02 47 9 0.02 48 3 0.01 49 1 0.00 ACGTcount: A:0.37, C:0.08, G:0.18, T:0.37 Consensus pattern (35 bp): AAGTAAATTGGTAATCAACTTAATTCGGTGTAATT Found at i:16693 original size:21 final size:21 Alignment explanation

Indices: 16646--16693 Score: 60 Period size: 21 Copynumber: 2.3 Consensus size: 21 16636 AATTCAGTGC * 16646 AATTAAGTAAATTGGAAATTA 1 AATTAAGTAAATTGGAAATCA * * 16667 AATTAAGTAATTTGGTAATCA 1 AATTAAGTAAATTGGAAATCA * 16688 ACTTAA 1 AATTAA 16694 TTCGGTGTAA Statistics Matches: 23, Mismatches: 4, Indels: 0 0.85 0.15 0.00 Matches are distributed among these distances: 21 23 1.00 ACGTcount: A:0.48, C:0.04, G:0.12, T:0.35 Consensus pattern (21 bp): AATTAAGTAAATTGGAAATCA Found at i:16867 original size:105 final size:103 Alignment explanation

Indices: 16667--16986 Score: 427 Period size: 105 Copynumber: 3.1 Consensus size: 103 16657 TTGGAAATTA * 16667 AATTAAGTAATTTGGT-AATCAACTTAATTCGGTGTAATTGAGT-AATTTGGTAAT--C--AATT 1 AATTAAGTAATTTGGTAAAT-AACTTAATTCGGTGTAATTAAGTAAATTT-GTAATCACTTAATT * * 16726 CGGTGTAATTAAGCAATTTGGTAATCAACTTAATTCGGTGT 64 CGGTGTAATTAAGTAAATTGGTAAT-AACTTAATTCGGTGT * 16767 AATTAAGTAGTTTGGTAAATAACTTAATTCGGTGTAATTAAGTAAATTTGTAATCCACTTAATTC 1 AATTAAGTAATTTGGTAAATAACTTAATTCGGTGTAATTAAGTAAATTTGTAAT-CACTTAATTC 16832 GGTGTAATTAAGTAAATTGGTAACTAACTTAATTCGGTGT 65 GGTGTAATTAAGTAAATTGGTAA-TAACTTAATTCGGTGT * * ** 16872 AATTAAGTAAATTGGTAACTAACTTAATTCGGTGTAATTAAGTAAATCAGTAATCAACTTAATTC 1 AATTAAGTAATTTGGTAAATAACTTAATTCGGTGTAATTAAGTAAATTTGTAATC-ACTTAATTC ** ** 16937 GGTGTAATTAAGTAAATCAGTAATTGGCTTAATTCGGTGT 65 GGTGTAATTAAGTAAATTGGTAA-TAACTTAATTCGGTGT 16977 AATTAAGTAA 1 AATTAAGTAA 16987 ATAAATGGCT Statistics Matches: 197, Mismatches: 14, Indels: 13 0.88 0.06 0.06 Matches are distributed among these distances: 100 42 0.21 101 8 0.04 103 1 0.01 104 1 0.01 105 144 0.73 106 1 0.01 ACGTcount: A:0.36, C:0.09, G:0.17, T:0.38 Consensus pattern (103 bp): AATTAAGTAATTTGGTAAATAACTTAATTCGGTGTAATTAAGTAAATTTGTAATCACTTAATTCG GTGTAATTAAGTAAATTGGTAATAACTTAATTCGGTGT Found at i:16961 original size:16 final size:16 Alignment explanation

Indices: 16905--16961 Score: 51 Period size: 16 Copynumber: 3.4 Consensus size: 16 16895 TTAATTCGGT 16905 GTAATTAAGTAAATCA 1 GTAATTAAGTAAATCA * * * * 16921 GTAATCAACTTAATTCGGT 1 GTAATTAA-GTAAATC--A 16940 GTAATTAAGTAAATCA 1 GTAATTAAGTAAATCA 16956 GTAATT 1 GTAATT 16962 GGCTTAATTC Statistics Matches: 30, Mismatches: 8, Indels: 6 0.68 0.18 0.14 Matches are distributed among these distances: 16 13 0.43 17 5 0.17 18 5 0.17 19 7 0.23 ACGTcount: A:0.42, C:0.09, G:0.14, T:0.35 Consensus pattern (16 bp): GTAATTAAGTAAATCA Found at i:23364 original size:23 final size:24 Alignment explanation

Indices: 23334--23383 Score: 66 Period size: 24 Copynumber: 2.1 Consensus size: 24 23324 AATAATAGCA * 23334 ATTATTATTA-CGTTAAACGTTTT 1 ATTATTATAATCGTTAAACGTTTT * * 23357 ATTATTATAATTGTTAAACTTTTT 1 ATTATTATAATCGTTAAACGTTTT 23381 ATT 1 ATT 23384 CCTATCCGTT Statistics Matches: 23, Mismatches: 3, Indels: 1 0.85 0.11 0.04 Matches are distributed among these distances: 23 9 0.39 24 14 0.61 ACGTcount: A:0.32, C:0.06, G:0.06, T:0.56 Consensus pattern (24 bp): ATTATTATAATCGTTAAACGTTTT Found at i:24932 original size:46 final size:48 Alignment explanation

Indices: 24841--24934 Score: 138 Period size: 46 Copynumber: 2.0 Consensus size: 48 24831 ATGTAAGATG * * * 24841 TTAACATAAAGGGATTATATAAACCTTTGTTTTTTGATAGAACTATGA 1 TTAACATAAAGGGATTATACAAACCTTTATTTCTTGATAGAACTATGA * 24889 TTAACATAAAGGGA-T-TACAAACCTTTATTTCTTGATAGCACTATGA 1 TTAACATAAAGGGATTATACAAACCTTTATTTCTTGATAGAACTATGA 24935 CAATTTTTTA Statistics Matches: 42, Mismatches: 4, Indels: 2 0.88 0.08 0.04 Matches are distributed among these distances: 46 27 0.64 47 1 0.02 48 14 0.33 ACGTcount: A:0.37, C:0.12, G:0.14, T:0.37 Consensus pattern (48 bp): TTAACATAAAGGGATTATACAAACCTTTATTTCTTGATAGAACTATGA Found at i:25176 original size:2 final size:2 Alignment explanation

Indices: 25171--25202 Score: 64 Period size: 2 Copynumber: 16.0 Consensus size: 2 25161 GACCATTGCT 25171 TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA 1 TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA 25203 ATTTTTGCAG Statistics Matches: 30, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 2 30 1.00 ACGTcount: A:0.50, C:0.00, G:0.00, T:0.50 Consensus pattern (2 bp): TA Done.