Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01014611.1 Corchorus capsularis cultivar CVL-1 contig14632, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 24079
ACGTcount: A:0.33, C:0.18, G:0.18, T:0.31


Found at i:705 original size:107 final size:107

Alignment explanation

Indices: 478--720 Score: 249 Period size: 107 Copynumber: 2.3 Consensus size: 107 468 TCAATGCTTC * ** * 478 AATGACCCAGGGTGGTCTATTCTTCAGTTCAGTTCAGAATGATCGAGGGTGGTCATTCTTCAGCT 1 AATGATCCAGGGTGGTC-ATTCTTCAGTTCAGTTCAGAATGATCGAGGGAAGTCATCCTTCAGCT * * 543 TATTTCAGTTAACCCAGGGCGGTCTTTCTCCAGTTTGAGTCGG 65 TATTTCAGTTAACCCAGGGCGGTCATTCTCCAGTTTCAGTCGG * * * * * * * 586 AACGATCGAGGGTGGTCGTTCTTTAGTTCAGTTCGGAATGATTGAGGGAAGTCGTCCTTCAGTCT 1 AATGATCCAGGGTGGTCATTCTTCAGTTCAGTTCAGAATGATCGAGGGAAGTCATCCTTCAG-CT * * ** * 651 GT-TTT-AGTTGAACCCCGGGTGGTCATTCTTTA-TTTCAGTTGG 65 -TATTTCAGTT-AACCCAGGGCGGTCATTCTCCAGTTTCAGTCGG * * 693 GATGATCCAGGGTGGTCCTTCTTCAGTT 1 AATGATCCAGGGTGGTCATTCTTCAGTT 721 ACTTATTTTA Statistics Matches: 109, Mismatches: 23, Indels: 7 0.78 0.17 0.05 Matches are distributed among these distances: 107 72 0.66 108 36 0.33 109 1 0.01 ACGTcount: A:0.18, C:0.19, G:0.28, T:0.35 Consensus pattern (107 bp): AATGATCCAGGGTGGTCATTCTTCAGTTCAGTTCAGAATGATCGAGGGAAGTCATCCTTCAGCTT ATTTCAGTTAACCCAGGGCGGTCATTCTCCAGTTTCAGTCGG Found at i:4980 original size:35 final size:35 Alignment explanation

Indices: 4941--5357 Score: 588 Period size: 35 Copynumber: 11.8 Consensus size: 35 4931 GGGTAATTTA * 4941 AGTAATCAACTTAATTCAGGGTAATTAAGTGAGTC 1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC * * * * 4976 AGTAAGT-AGCTTAATTCAGGGTAATTAAGCAAAATTA 1 AGTAA-TCAACTTAATTCAGGGTAATTAAG--TAAGTC * * 5013 AGTAATCAACTTAATTCAGGGTAATTAAGTGAGTG 1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC * * 5048 AGTAAGT-AGCTTAATTCAGGGTAATTAAGCAAAGTC 1 AGTAA-TCAACTTAATTCAGGGTAATTAAG-TAAGTC 5084 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC 1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC 5119 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC 1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC * 5154 AGTGATCAACTTAATTCAGGGTAATTAAGTAAGTC 1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC * * 5189 GGTAATCAACTTAATTCAGGGTAATTAAATAAGTC 1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC * * 5224 GGTAATCAACTTAATTCAGGGTGATTAAGTAAGTC 1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC 5259 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC 1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC * * * 5294 GGTAATTAACTTAATTCAGGGTTATTAAGTAAG-C 1 AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC * * 5328 TGGTAAACAACTTAATTCAGGGTAATTAAG 1 -AGTAATCAACTTAATTCAGGGTAATTAAG 5358 ATCGACTTAA Statistics Matches: 344, Mismatches: 30, Indels: 16 0.88 0.08 0.04 Matches are distributed among these distances: 34 1 0.00 35 283 0.82 36 32 0.09 37 28 0.08 ACGTcount: A:0.39, C:0.11, G:0.20, T:0.31 Consensus pattern (35 bp): AGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC Found at i:5379 original size:105 final size:104 Alignment explanation

Indices: 4860--5358 Score: 570 Period size: 105 Copynumber: 4.8 Consensus size: 104 4850 GTAAGTAATA * * * * * 4860 GGTAACTTAATTAAGTCAGTAAGT-AGCTTAATTCAGGGTAATTAAGCAAAATCAGTTAGT-AAC 1 GGTAA-TTAAGTAAGTCAGTAA-TCAACTTAATTCAGGGTAATTAAG-TAAGTCAG-TAATCAAC * * 4923 TTAGTTCAGGGTAATT------TAAGTAATCAACTTAATTCAG 62 TTAATTCAGGGTAATTAAGAAGTCAGTAATCAACTTAATTCAG * * * * * 4960 GGTAATTAAGTGAGTCAGTAAGT-AGCTTAATTCAGGGTAATTAAGCAAAATTAAGTAATCAACT 1 GGTAATTAAGTAAGTCAGTAA-TCAACTTAATTCAGGGTAATTAAG--TAAGTCAGTAATCAACT * * * 5024 TAATTCAGGGTAATTAAGTGAGTGAGTAAGT-AGCTTAATTCAG 63 TAATTCAGGGTAATTAAG-AAGTCAGTAA-TCAACTTAATTCAG * 5067 GGTAATTAAGCAAAGTCAGTAATCAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATCAACTTA 1 GGTAATTAAG-TAAGTCAGTAATCAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATCAACTTA * 5132 ATTCAGGGTAATTAAGTAAGTCAGTGATCAACTTAATTCAG 65 ATTCAGGGTAATTAAG-AAGTCAGTAATCAACTTAATTCAG * * * 5173 GGTAATTAAGTAAGTCGGTAATCAACTTAATTCAGGGTAATTAAATAAGTCGGTAATCAACTTAA 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATCAACTTAA * 5238 TTCAGGGTGATTAAGTAAGTCAGTAATCAACTTAATTCAG 66 TTCAGGGTAATTAAG-AAGTCAGTAATCAACTTAATTCAG * * * * * 5278 GGTAATTAAGTAAGTCGGTAATTAACTTAATTCAGGGTTATTAAGTAAG-CTGGTAAACAACTTA 1 GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAGGGTAATTAAGTAAGTC-AGTAATCAACTTA 5342 ATTCAGGGTAATTAAGA 65 ATTCAGGGTAATTAAGA 5359 TCGACTTAAT Statistics Matches: 355, Mismatches: 30, Indels: 24 0.87 0.07 0.06 Matches are distributed among these distances: 99 41 0.12 100 29 0.08 104 2 0.01 105 163 0.46 106 61 0.17 107 28 0.08 108 31 0.09 ACGTcount: A:0.38, C:0.10, G:0.20, T:0.31 Consensus pattern (104 bp): GGTAATTAAGTAAGTCAGTAATCAACTTAATTCAGGGTAATTAAGTAAGTCAGTAATCAACTTAA TTCAGGGTAATTAAGAAGTCAGTAATCAACTTAATTCAG Found at i:5449 original size:56 final size:57 Alignment explanation

Indices: 5363--5502 Score: 144 Period size: 58 Copynumber: 2.5 Consensus size: 57 5353 TTAAGATCGA * * * 5363 CTTAATTCAGGGTAATTAAGTTTAG-TAAGAAGCAAA-AATTAGGGAA-AATAA-AACGG 1 CTTAATTCAGGGTAATTGAG-TCAGTTAAGAAGCAAAGAA--AGAGAACAATAATAACGG * * * * * 5419 CTTAATCCAGGGTAATTGAGTCAGTTAAGAATCAAAGAAAGATAATCAGTAATAAGGG 1 CTTAATTCAGGGTAATTGAGTCAGTTAAGAAGCAAAGAAAGAGAA-CAATAATAACGG 5477 CTTAATTCAGGGTAATTGAGTCAGTT 1 CTTAATTCAGGGTAATTGAGTCAGTT 5503 GAAAACAAAA Statistics Matches: 70, Mismatches: 9, Indels: 8 0.80 0.10 0.09 Matches are distributed among these distances: 55 7 0.10 56 28 0.40 57 6 0.09 58 29 0.41 ACGTcount: A:0.41, C:0.09, G:0.22, T:0.27 Consensus pattern (57 bp): CTTAATTCAGGGTAATTGAGTCAGTTAAGAAGCAAAGAAAGAGAACAATAATAACGG Found at i:13297 original size:3 final size:3 Alignment explanation

Indices: 13291--13347 Score: 114 Period size: 3 Copynumber: 19.0 Consensus size: 3 13281 TAATATTACG 13291 TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA 1 TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA TAA 13339 TAA TAA TAA 1 TAA TAA TAA 13348 CAATGAGAGA Statistics Matches: 54, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 3 54 1.00 ACGTcount: A:0.67, C:0.00, G:0.00, T:0.33 Consensus pattern (3 bp): TAA Found at i:16707 original size:31 final size:29 Alignment explanation

Indices: 16633--16713 Score: 92 Period size: 29 Copynumber: 2.7 Consensus size: 29 16623 TAAACTTTTG * * 16633 ATAGCTAAGGGATTTATTTGGCCCAAAAA 1 ATAGATAAGGGATTTATTTGTCCCAAAAA * 16662 ATAGATCAGGGATTTATTTGTCCCGAAATGAA 1 ATAGATAAGGGATTTATTTGTCCC-AAA--AA * 16694 A-AGGTAAGGGATTTATTTGT 1 ATAGATAAGGGATTTATTTGT 16714 TATTTAAGCC Statistics Matches: 44, Mismatches: 5, Indels: 4 0.83 0.09 0.08 Matches are distributed among these distances: 29 21 0.48 30 3 0.07 31 17 0.39 32 3 0.07 ACGTcount: A:0.35, C:0.10, G:0.23, T:0.32 Consensus pattern (29 bp): ATAGATAAGGGATTTATTTGTCCCAAAAA Found at i:19318 original size:36 final size:36 Alignment explanation

Indices: 19271--19342 Score: 119 Period size: 36 Copynumber: 2.0 Consensus size: 36 19261 AGGAAGACAC * 19271 CAACTTGTGCTGGAATTGGCAGG-CCTGACTATCCCT 1 CAACTTATGCTGGAATTGGCAGGTCC-GACTATCCCT 19307 CAACTTATGCTGGAATTGGCAGGTCCGACTATCCCT 1 CAACTTATGCTGGAATTGGCAGGTCCGACTATCCCT 19343 GGGCGTCCAG Statistics Matches: 34, Mismatches: 1, Indels: 2 0.92 0.03 0.05 Matches are distributed among these distances: 36 32 0.94 37 2 0.06 ACGTcount: A:0.21, C:0.28, G:0.24, T:0.28 Consensus pattern (36 bp): CAACTTATGCTGGAATTGGCAGGTCCGACTATCCCT Found at i:23420 original size:21 final size:21 Alignment explanation

Indices: 23394--23446 Score: 72 Period size: 21 Copynumber: 2.6 Consensus size: 21 23384 GCACTAGAGT * * * 23394 ACATGGGTCGCGAGGCAAACC 1 ACATGGGGCGCCAAGCAAACC 23415 ACATGGGGCGCCAAGCAAACC 1 ACATGGGGCGCCAAGCAAACC 23436 ACAT-GGGCGCC 1 ACATGGGGCGCC 23447 CAGCGCTAGT Statistics Matches: 29, Mismatches: 3, Indels: 1 0.88 0.09 0.03 Matches are distributed among these distances: 20 7 0.24 21 22 0.76 ACGTcount: A:0.28, C:0.32, G:0.32, T:0.08 Consensus pattern (21 bp): ACATGGGGCGCCAAGCAAACC Done.