Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01015971.1 Corchorus capsularis cultivar CVL-1 contig15992, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 27110
ACGTcount: A:0.30, C:0.16, G:0.19, T:0.35


Found at i:2231 original size:63 final size:64

Alignment explanation

Indices: 2153--2280 Score: 188 Period size: 63 Copynumber: 2.0 Consensus size: 64 2143 GGATTTGATC * * 2153 AAATTTTTGTGGTAAAAGTTTAGTTTT-A-ATTATCATTCGATACTTGTTCCTTAAAGAAGGTTT 1 AAATTTTTGTGGTAAAAATTTAGTTTTAATATTATCATTC-ATACTTGTTCCTTAAACAAGGTTT * * 2216 AAATTTTTGTGGTAAAAATTTAGTTTTAATTATTATCATTCATCCTTGTTCCTTACACAAGGTTT 1 AAATTTTTGTGGTAAAAATTTAGTTTTAA-TATTATCATTCATACTTGTTCCTTAAACAAGGTTT 2281 TTCAATTTCT Statistics Matches: 58, Mismatches: 4, Indels: 4 0.88 0.06 0.06 Matches are distributed among these distances: 63 26 0.45 64 1 0.02 65 21 0.36 66 10 0.17 ACGTcount: A:0.30, C:0.10, G:0.13, T:0.47 Consensus pattern (64 bp): AAATTTTTGTGGTAAAAATTTAGTTTTAATATTATCATTCATACTTGTTCCTTAAACAAGGTTT Found at i:5281 original size:7 final size:7 Alignment explanation

Indices: 5269--5294 Score: 52 Period size: 7 Copynumber: 3.7 Consensus size: 7 5259 AGAATTATAT 5269 ATTTAAC 1 ATTTAAC 5276 ATTTAAC 1 ATTTAAC 5283 ATTTAAC 1 ATTTAAC 5290 ATTTA 1 ATTTA 5295 TAATAACACT Statistics Matches: 19, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 7 19 1.00 ACGTcount: A:0.42, C:0.12, G:0.00, T:0.46 Consensus pattern (7 bp): ATTTAAC Found at i:14764 original size:16 final size:16 Alignment explanation

Indices: 14743--14775 Score: 66 Period size: 16 Copynumber: 2.1 Consensus size: 16 14733 TCTGACTGAT 14743 AACCATTGTTTATGAC 1 AACCATTGTTTATGAC 14759 AACCATTGTTTATGAC 1 AACCATTGTTTATGAC 14775 A 1 A 14776 TAAAATGAAT Statistics Matches: 17, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 16 17 1.00 ACGTcount: A:0.33, C:0.18, G:0.12, T:0.36 Consensus pattern (16 bp): AACCATTGTTTATGAC Found at i:15907 original size:2 final size:2 Alignment explanation

Indices: 15902--15932 Score: 62 Period size: 2 Copynumber: 15.5 Consensus size: 2 15892 AGTGTGTATA 15902 TG TG TG TG TG TG TG TG TG TG TG TG TG TG TG T 1 TG TG TG TG TG TG TG TG TG TG TG TG TG TG TG T 15933 TAAACAAGCT Statistics Matches: 29, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 2 29 1.00 ACGTcount: A:0.00, C:0.00, G:0.48, T:0.52 Consensus pattern (2 bp): TG Found at i:22049 original size:2 final size:2 Alignment explanation

Indices: 22042--22075 Score: 59 Period size: 2 Copynumber: 17.0 Consensus size: 2 22032 GAGGGCATAC * 22042 AT AT AT AT GT AT AT AT AT AT AT AT AT AT AT AT AT 1 AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT 22076 CATACTTTCA Statistics Matches: 30, Mismatches: 2, Indels: 0 0.94 0.06 0.00 Matches are distributed among these distances: 2 30 1.00 ACGTcount: A:0.47, C:0.00, G:0.03, T:0.50 Consensus pattern (2 bp): AT Found at i:23327 original size:35 final size:34 Alignment explanation

Indices: 23283--23765 Score: 409 Period size: 35 Copynumber: 13.8 Consensus size: 34 23273 ATCAGTAATA * * * 23283 AGTATCTTAATTCAGGATAATTAAGTAGGTCAGT 1 AGTAACTTAATTCAGGGTAATTAAGTAAGTCAGT * * 23317 GAATAACTTAATTCAGGGTAATTAAGTAAGTTAGTAAGT 1 -AGTAACTTAATTCAGGGTAATTAAGT-A---AGTCAGT * 23356 CAGTAACTTAATTCAGGGTAATTAAGTAGGTCAGT 1 -AGTAACTTAATTCAGGGTAATTAAGTAAGTCAGT * * * * 23391 GAATAACTTAATTTAGGGTAATTAAGTTAGTAAGT 1 -AGTAACTTAATTCAGGGTAATTAAGTAAGTCAGT * * 23426 CAGTAACTTAATTCAGGGTAGTTAAGTAAGT-AAT 1 -AGTAACTTAATTCAGGGTAATTAAGTAAGTCAGT * * * 23460 AGGTAGCTTAATTCAGGGTAATTAATTAAGTTAGT 1 A-GTAACTTAATTCAGGGTAATTAAGTAAGTCAGT * 23495 AAGTAGCTTAATTCAGGGTAATTAAGTAAGTCAGCT 1 -AGTAACTTAATTCAGGGTAATTAAGTAAGTCAG-T * * 23531 AGTAACATGATTCAGGGTAATTAAGTAAGTCAGCT 1 AGTAACTTAATTCAGGGTAATTAAGTAAGTCAG-T * * 23566 AGTAACATGATTCAGGGTAATTAAGTAAAGTCAGTT 1 AGTAACTTAATTCAGGGTAATTAAGT-AAGTCAG-T * * 23602 AGTAACTTAATTCAGGGAAATTAAGTAAG---GC 1 AGTAACTTAATTCAGGGTAATTAAGTAAGTCAGT * * * * 23633 AGTAACTTTATTCA-GTTCAATTAAGTATACATCAGC 1 AGTAACTTAATTCAGGGT-AATTAAGTA-A-GTCAGT * * * * * 23669 AATCAACTTGATTCAGGGTAATTAAGAAATTTAGTT 1 AGT-AACTTAATTCAGGGTAATTAAGTAAGTCAG-T * * * * 23705 ATTAATTTAATTCAGGGTAATTAAGTAAGCCATT 1 AGTAACTTAATTCAGGGTAATTAAGTAAGTCAGT *** 23739 GACCGACTTAATTCAGGGTAATTAAGT 1 -AGTAACTTAATTCAGGGTAATTAAGT 23766 TTAGTAAGAA Statistics Matches: 371, Mismatches: 58, Indels: 38 0.79 0.12 0.08 Matches are distributed among these distances: 30 1 0.00 31 22 0.06 32 2 0.01 33 1 0.00 34 29 0.08 35 224 0.60 36 41 0.11 37 18 0.05 38 3 0.01 39 30 0.08 ACGTcount: A:0.37, C:0.09, G:0.20, T:0.33 Consensus pattern (34 bp): AGTAACTTAATTCAGGGTAATTAAGTAAGTCAGT Found at i:23570 original size:139 final size:139 Alignment explanation

Indices: 23283--23763 Score: 437 Period size: 139 Copynumber: 3.4 Consensus size: 139 23273 ATCAGTAATA * * * * * 23283 AGTATCTTAATTCAGGATAATTAAGTAGGTCAG-TGAATAACTTAATTCAGGGTAATTAAGTAAG 1 AGTAACTTAATTCAGGGTAATTAAGTAAGTCAGAT-AGTAACTTAATTCAGGGTAATTAATTAAG * * * 23347 TTAGTAAGTCAGTAACTTAATTCAGGGTAATTAAGTAGGTCAG-TGAATAACTTAATTTAGGGTA 65 TTAGTAAGT-AG---CTTAATTCAGGGTAATTAAGTAAGTCAGCT-AATAACTTGATTCAGGGTA * 23411 ATTAAGTTAGTAAGT 125 ATTAAGTAAGTAAGT * * 23426 CAGTAACTTAATTCAGGGTAGTTAAGTAAGT-A-ATAGGTAGCTTAATTCAGGGTAATTAATTAA 1 -AGTAACTTAATTCAGGGTAATTAAGTAAGTCAGATA-GTAACTTAATTCAGGGTAATTAATTAA * * 23489 GTTAGTAAGTAGCTTAATTCAGGGTAATTAAGTAAGTCAGCTAGTAACATGATTCAGGGTAATTA 64 GTTAGTAAGTAGCTTAATTCAGGGTAATTAAGTAAGTCAGCTAATAACTTGATTCAGGGTAATTA * 23554 AGTAAGTCAGCT 129 AGTAAGTAAG-T * * * 23566 AGTAACATGATTCAGGGTAATTAAGTAAAGTCAGTTAGTAACTTAATTCAGGG--A--AATTAAG 1 AGTAACTTAATTCAGGGTAATTAAGT-AAGTCAGATAGTAACTTAATTCAGGGTAATTAATTAAG * ** * * * * 23627 TAAGGCAGTAACTTTATTCA-GTTCAATTAAGTATACATCAGC-AATCAACTTGATTCAGGGTAA 65 TTAGTAAGTAGCTTAATTCAGGGT-AATTAAGTA-A-GTCAGCTAAT-AACTTGATTCAGGGTAA * * * 23690 TTAAGAAATTTAGTT 126 TTAAGTAAGTAAG-T * * * ** 23705 ATTAATTTAATTCAGGGTAATTAAGTAAGCCATTGACCG--ACTTAATTCAGGGTAATTAA 1 AGTAACTTAATTCAGGGTAATTAAGTAAGTCA--GATAGTAACTTAATTCAGGGTAATTAA 23764 GTTTAGTAAG Statistics Matches: 280, Mismatches: 40, Indels: 36 0.79 0.11 0.10 Matches are distributed among these distances: 136 2 0.01 137 31 0.11 138 21 0.08 139 132 0.47 140 9 0.03 141 16 0.06 142 7 0.03 143 36 0.13 144 26 0.09 ACGTcount: A:0.38, C:0.09, G:0.20, T:0.33 Consensus pattern (139 bp): AGTAACTTAATTCAGGGTAATTAAGTAAGTCAGATAGTAACTTAATTCAGGGTAATTAATTAAGT TAGTAAGTAGCTTAATTCAGGGTAATTAAGTAAGTCAGCTAATAACTTGATTCAGGGTAATTAAG TAAGTAAGT Found at i:23685 original size:174 final size:173 Alignment explanation

Indices: 23288--23765 Score: 448 Period size: 174 Copynumber: 2.7 Consensus size: 173 23278 TAATAAGTAT * * * * 23288 CTTAATTCAGGATAATTAAGTAGGTCAGTGAA-TAACTTAATTCAGGGTAATTAAGTAAGTTAGT 1 CTTAATTCAGGGTAATTAATTAAGTCAG-CAAGTAACTTAATTCAGGGTAATTAAGTAAGTTAG- * * * * 23352 AAGTCAGTAACTTAATTCAGGGTAATTAAGTAGGTCAGTGAATAACTTAATTTAGGGTAATTAAG 64 --CT-AGTAACTTAATTCAGGGTAATTAAGTAAGTCAGTGAATAACATAATTCAGGGTAATTAAG * * * * * 23417 TTAGTAAGTCAGTAACTTAATTCAGGGTAGTTAAGTAAGTAATAGGTAG 126 TAAGTAAGTCAGTAACTTAATTCAGGGAAATTAAGTAAG-AACAGGTAA * * * * 23466 CTTAATTCAGGGTAATTAATTAAGTTAGTAAGTAGCTTAATTCAGGGTAATTAAGTAAGTCAGCT 1 CTTAATTCAGGGTAATTAATTAAGTCAGCAAGTAACTTAATTCAGGGTAATTAAGTAAGTTAGCT * * * * 23531 AGTAACATGATTCAGGGTAATTAAGTAAGTCAGCT-AGTAACATGATTCAGGGTAATTAAGTAAA 66 AGTAACTTAATTCAGGGTAATTAAGTAAGTCAG-TGAATAACATAATTCAGGGTAATTAAGT-AA * * * 23595 GTCAGTTAGTAACTTAATTCAGGGAAATTAAGTAAG-GCA-GTAA 129 GTAAGTCAGTAACTTAATTCAGGGAAATTAAGTAAGAACAGGTAA * * * * * 23638 CTTTATTCA-GTTCAATTAAGTATACA-TCAGCAA-TCAACTTGATTCAGGGTAATTAAGAAATT 1 CTTAATTCAGGGT-AATTAA-T-TA-AGTCAGCAAGT-AACTTAATTCAGGGTAATTAAGTAAGT * * * * * *** * 23700 TAGTTATTAATTTAATTCAGGGTAATTAAGTAAGCCATTGACCGACTTAATTCAGGGTAATTAAG 61 TAGCTAGTAACTTAATTCAGGGTAATTAAGTAAGTCAGTGAATAACATAATTCAGGGTAATTAAG 23765 T 126 T 23766 TTAGTAAGAA Statistics Matches: 247, Mismatches: 44, Indels: 22 0.79 0.14 0.07 Matches are distributed among these distances: 171 2 0.01 172 17 0.07 173 4 0.02 174 133 0.54 175 36 0.15 177 2 0.01 178 53 0.21 ACGTcount: A:0.37, C:0.09, G:0.20, T:0.33 Consensus pattern (173 bp): CTTAATTCAGGGTAATTAATTAAGTCAGCAAGTAACTTAATTCAGGGTAATTAAGTAAGTTAGCT AGTAACTTAATTCAGGGTAATTAAGTAAGTCAGTGAATAACATAATTCAGGGTAATTAAGTAAGT AAGTCAGTAACTTAATTCAGGGAAATTAAGTAAGAACAGGTAA Done.