Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01006412.1 Corchorus capsularis cultivar CVL-1 contig06433, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 13303
ACGTcount: A:0.34, C:0.18, G:0.18, T:0.31


Found at i:8345 original size:35 final size:35

Alignment explanation

Indices: 8294--8774 Score: 403 Period size: 35 Copynumber: 13.8 Consensus size: 35 8284 AGCAATAAGA 8294 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT * * * * 8329 AGCTTAATTCAAGGTAATTAATTAAGTTAGTAAGTCAGT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGT---T-AGT * * * * 8368 AACTTAATTCAGGGTAATAAAGAAATTCAGTTATT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT * * * * 8403 AATTTAATTCAGGGTAATTAAGTAATTTAG-TAAT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT * * 8437 CTACTTAGTTCAGGGTAATTAAGTAAGT-AG-TAGGT 1 -AACTTAATTCAGGGTAATTAAGTAAGTCAGTTA-GT * 8472 AACTTAATTCAGGGTAATTAAGTCAA-T-A---AAT 1 AACTTAATTCAGGGTAATTAAGT-AAGTCAGTTAGT * * * 8503 AGCTTAATTCAGGGTAATTAAGTAGGTTAGTTAGT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT 8538 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT * * 8573 AACTTAATTCAGGGTAATTAAGTGAGTTAGTAAGTCAGT 1 AACTTAATTCAGGGTAATTAAGT-A---AGTCAGTTAGT * * * * 8612 AACTTAATTCAGGGTAATTAAGAAATTTAGTTATT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT * * * * * * 8647 AATTTAGTTTAGGGTAATTAAGTAATTTAG-TAAT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT * * 8681 CAACTTATTTCAGGGTAA-T---TAAGTCAGTAAGT 1 -AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT * * * ** * 8713 AGCTTAATTCAGGGCAATTAAGCAAGTCAGCAAAT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT * * 8748 AACTTAATTAAGGGTAATTGAGTAAGT 1 AACTTAATTCAGGGTAATTAAGTAAGT 8775 AGCTTAATTC Statistics Matches: 363, Mismatches: 61, Indels: 44 0.78 0.13 0.09 Matches are distributed among these distances: 30 1 0.00 31 44 0.12 32 5 0.01 34 34 0.09 35 217 0.60 36 2 0.01 38 2 0.01 39 58 0.16 ACGTcount: A:0.38, C:0.08, G:0.19, T:0.35 Consensus pattern (35 bp): AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT Found at i:8419 original size:74 final size:71 Alignment explanation

Indices: 8294--8774 Score: 411 Period size: 74 Copynumber: 6.9 Consensus size: 71 8284 AGCAATAAGA * * * 8294 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGTAGCTTAATTCAAGGTAATTAATTAAGTTAG 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGTTAG 8359 TAAGTCAGT 66 TAA-TC--T * * * * * * 8368 AACTTAATTCAGGGTAATAAAGAAATTCAGTTATTAATTTAATTCAGGGTAATTAAGTAATTTAG 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGTTAG 8433 TAATCT 66 TAATCT * 8439 -ACTTAGTTCAGGGTAATTAAGTAAGT-AG-TAGGTAACTTAATTCAGGGTAATTAAGTCAA--T 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTA-GTAACTTAATTCAGGGTAATTAAGT-AAGTT 8499 A--AA--T 64 AGTAATCT * * * * 8503 AGCTTAATTCAGGGTAATTAAGTAGGTTAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGTCAG 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGTTAG * * 8568 TTA-GT 66 TAATCT * * * * 8573 AACTTAATTCAGGGTAATTAAGTGAGTTAGTAAGTCAGTAACTTAATTCAGGGTAATTAAGAAAT 1 AACTTAATTCAGGGTAATTAAGT-A---AGTCAGTTAGTAACTTAATTCAGGGTAATTAAGTAAG * 8638 TTAGTTAT-T 62 TTAGTAATCT * * * * * * * * 8647 AATTTAGTTTAGGGTAATTAAGTAATTTAG-TAATCAACTTATTTCAGGGTAA-T---TAAGTCA 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGT-AACTTAATTCAGGGTAATTAAGTAAGTTA * 8707 GTAA-GT 65 GTAATCT * * * ** * * * 8713 AGCTTAATTCAGGGCAATTAAGCAAGTCAGCAAATAACTTAATTAAGGGTAATTGAGTAAGT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGT 8775 AGCTTAATTC Statistics Matches: 335, Mismatches: 50, Indels: 48 0.77 0.12 0.11 Matches are distributed among these distances: 64 1 0.00 65 25 0.07 66 74 0.22 67 7 0.02 68 4 0.01 69 29 0.09 70 72 0.21 71 2 0.01 73 3 0.01 74 118 0.35 ACGTcount: A:0.38, C:0.08, G:0.19, T:0.35 Consensus pattern (71 bp): AACTTAATTCAGGGTAATTAAGTAAGTCAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGTTAG TAATCT Found at i:8625 original size:109 final size:109 Alignment explanation

Indices: 8505--8713 Score: 285 Period size: 109 Copynumber: 1.9 Consensus size: 109 8495 CAATAAATAG * * 8505 CTTAATTCAGGGTAATTAAGTAGGTTAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGTCAGTT 1 CTTAATTCAGGGTAATTAAGAAAGTTAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGTCAG-T * * * 8570 AGT-AACTTAATTCAGGGTAATTAAGTGAGTTAGTAAGTCAGTAA 65 AATCAACTTAATTCAGGGTAATTAAGTCAGTAAGTAAGTCAGTAA * * * * * * * 8614 CTTAATTCAGGGTAATTAAGAAATTTAGTTATTAATTTAGTTTAGGGTAATTAAGTAATTTAGTA 1 CTTAATTCAGGGTAATTAAGAAAGTTAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGTCAGTA * 8679 ATCAACTTATTTCAGGGTAATTAAGTCAGTAAGTA 66 ATCAACTTAATTCAGGGTAATTAAGTCAGTAAGTA 8714 GCTTAATTCA Statistics Matches: 86, Mismatches: 13, Indels: 2 0.85 0.13 0.02 Matches are distributed among these distances: 108 3 0.03 109 83 0.97 ACGTcount: A:0.36, C:0.07, G:0.20, T:0.37 Consensus pattern (109 bp): CTTAATTCAGGGTAATTAAGAAAGTTAGTTAGTAACTTAATTCAGGGTAATTAAGTAAGTCAGTA ATCAACTTAATTCAGGGTAATTAAGTCAGTAAGTAAGTCAGTAA Found at i:10291 original size:30 final size:30 Alignment explanation

Indices: 10251--10309 Score: 93 Period size: 30 Copynumber: 2.0 Consensus size: 30 10241 TGTCTTCAAG 10251 TCCATAATAAGTCCTT-GGCGCATCATTCCT 1 TCCATAATAAG-CCTTGGGCGCATCATTCCT * 10281 TCCATGATAAGCCTTGGGCGCATCATTCC 1 TCCATAATAAGCCTTGGGCGCATCATTCC 10310 CTCCCCCTTG Statistics Matches: 27, Mismatches: 1, Indels: 2 0.90 0.03 0.07 Matches are distributed among these distances: 29 4 0.15 30 23 0.85 ACGTcount: A:0.22, C:0.31, G:0.17, T:0.31 Consensus pattern (30 bp): TCCATAATAAGCCTTGGGCGCATCATTCCT Found at i:10719 original size:33 final size:33 Alignment explanation

Indices: 10653--10823 Score: 267 Period size: 33 Copynumber: 5.3 Consensus size: 33 10643 TCTTTTCATG * * 10653 CAAAACAGAATTATTTTCAATGC---CATCAAC 1 CAAAACAGAATTATTTGCAATGCTATGATCAAC 10683 CAAAACAGAATTATTTGCAATGCTATGATCAAC 1 CAAAACAGAATTATTTGCAATGCTATGATCAAC * 10716 CAAAACACAATTATTTGCAATGCTATGATCAAC 1 CAAAACAGAATTATTTGCAATGCTATGATCAAC * 10749 CAAAACAGAATTATTTGCAATGCTATGATAAAC 1 CAAAACAGAATTATTTGCAATGCTATGATCAAC * * 10782 CAAAAAAGAATTATTTGCAATGCTATGATCGAC 1 CAAAACAGAATTATTTGCAATGCTATGATCAAC 10815 CAAAACAGA 1 CAAAACAGA 10824 TTTGTTTTCA Statistics Matches: 129, Mismatches: 9, Indels: 3 0.91 0.06 0.02 Matches are distributed among these distances: 30 22 0.17 33 107 0.83 ACGTcount: A:0.44, C:0.19, G:0.11, T:0.26 Consensus pattern (33 bp): CAAAACAGAATTATTTGCAATGCTATGATCAAC Found at i:10851 original size:99 final size:96 Alignment explanation

Indices: 10653--10856 Score: 239 Period size: 99 Copynumber: 2.1 Consensus size: 96 10643 TCTTTTCATG * * * 10653 CAAAACAGAATTATTTTCAATGCCATCAACCAAAACAGAATTATTTGCAATGCTATGATCAACCA 1 CAAAACAGAATTATTTGCAATGCCATAAACCAAAAAAGAATTATTTGCAATGCTATGATCAACCA * * * 10718 AAACACAATTATTTGCAATGCTATGATCAAC 66 AAACACAATTATTTGCAATACAATGAGCAAC * * 10749 CAAAACAGAATTATTTGCAATGCTATGATAAACCAAAAAAGAATTATTTGCAATGCTATGATCGA 1 CAAAACAGAATTATTTGCAATGC---CATAAACCAAAAAAGAATTATTTGCAATGCTATGATCAA * * * * * * 10814 CCAAAACAGATTTGTTTTC-ATCACAATTAGCATC 63 CCAAAACACAATTATTTGCAAT-ACAATGAGCAAC 10848 CAAAACAGA 1 CAAAACAGA 10857 TTTAGTATCA Statistics Matches: 90, Mismatches: 14, Indels: 5 0.83 0.13 0.05 Matches are distributed among these distances: 96 22 0.24 98 2 0.02 99 66 0.73 ACGTcount: A:0.43, C:0.19, G:0.11, T:0.27 Consensus pattern (96 bp): CAAAACAGAATTATTTGCAATGCCATAAACCAAAAAAGAATTATTTGCAATGCTATGATCAACCA AAACACAATTATTTGCAATACAATGAGCAAC Found at i:10886 original size:33 final size:33 Alignment explanation

Indices: 10848--10944 Score: 131 Period size: 33 Copynumber: 2.9 Consensus size: 33 10838 AATTAGCATC * 10848 CAAAACAGATTTAGTATCATCACAAACAACACT 1 CAAAACAGATTTAGTATCATCGCAAACAACACT * * * 10881 TAAAACAGATTTAGTGTCATTGCAAACAACACT 1 CAAAACAGATTTAGTATCATCGCAAACAACACT ** * 10914 CAAATTAGGTTTAGTATCATCGCAAACAACA 1 CAAAACAGATTTAGTATCATCGCAAACAACA 10945 TCTAAAAGAC Statistics Matches: 54, Mismatches: 10, Indels: 0 0.84 0.16 0.00 Matches are distributed among these distances: 33 54 1.00 ACGTcount: A:0.44, C:0.21, G:0.10, T:0.25 Consensus pattern (33 bp): CAAAACAGATTTAGTATCATCGCAAACAACACT Found at i:12475 original size:8 final size:8 Alignment explanation

Indices: 12447--12480 Score: 50 Period size: 8 Copynumber: 4.1 Consensus size: 8 12437 GAATCGACTA 12447 TGAATTTT 1 TGAATTTT * 12455 TGAAGTTTC 1 TGAA-TTTT 12464 TGAATTTT 1 TGAATTTT 12472 TGAATTTT 1 TGAATTTT 12480 T 1 T 12481 CAAGAAGGGT Statistics Matches: 23, Mismatches: 2, Indels: 2 0.85 0.07 0.07 Matches are distributed among these distances: 8 16 0.70 9 7 0.30 ACGTcount: A:0.24, C:0.03, G:0.15, T:0.59 Consensus pattern (8 bp): TGAATTTT Done.