Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01006959.1 Corchorus capsularis cultivar CVL-1 contig06980, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 47379
ACGTcount: A:0.31, C:0.19, G:0.17, T:0.34


Found at i:7461 original size:20 final size:21

Alignment explanation

Indices: 7431--7469 Score: 62 Period size: 20 Copynumber: 1.9 Consensus size: 21 7421 TTAAAAGAAA 7431 AAAAAAGGAAAAACAAAATGG 1 AAAAAAGGAAAAACAAAATGG * 7452 AAAAAA-GAAAAAGAAAAT 1 AAAAAAGGAAAAACAAAAT 7470 AAAAGGAGAT Statistics Matches: 17, Mismatches: 1, Indels: 1 0.89 0.05 0.05 Matches are distributed among these distances: 20 11 0.65 21 6 0.35 ACGTcount: A:0.77, C:0.03, G:0.15, T:0.05 Consensus pattern (21 bp): AAAAAAGGAAAAACAAAATGG Found at i:16859 original size:41 final size:41 Alignment explanation

Indices: 16802--16919 Score: 236 Period size: 41 Copynumber: 2.9 Consensus size: 41 16792 GCCTTAAGCC 16802 CTTAAGATCACAAGATTCACAAACAATTAAGCAATTGAACA 1 CTTAAGATCACAAGATTCACAAACAATTAAGCAATTGAACA 16843 CTTAAGATCACAAGATTCACAAACAATTAAGCAATTGAACA 1 CTTAAGATCACAAGATTCACAAACAATTAAGCAATTGAACA 16884 CTTAAGATCACAAGATTCACAAACAATTAAGCAATT 1 CTTAAGATCACAAGATTCACAAACAATTAAGCAATT 16920 ACAATCTAAC Statistics Matches: 77, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 41 77 1.00 ACGTcount: A:0.48, C:0.19, G:0.09, T:0.23 Consensus pattern (41 bp): CTTAAGATCACAAGATTCACAAACAATTAAGCAATTGAACA Found at i:22026 original size:35 final size:35 Alignment explanation

Indices: 21977--22311 Score: 345 Period size: 35 Copynumber: 9.7 Consensus size: 35 21967 CATAATAAGC * 21977 AACTTAATTCAGGGTAATTAAGTCAGTCAGTAATT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT * * * 22012 AAGTTAATTCAGGGTAATTAAGTAATTCAGTTATT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT * * * * 22047 AATTTAATTCAGGGTAATTAAGTAATTTAGTAATC 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT * 22082 AACTTAATTCAGGGTAATTAAGT---T-AGTAAGT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT * * * * 22113 AGCTTAATGCAGGGTAATTAAGTAAGTCAGTTAGT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT * * * * 22148 AACTTAATTTAGGGTAATTAAGTGAGTCAGTTAGT 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT * ** * ** 22183 AACTTAACTCAGGGTAATTTTGCAAGTCAGTAACC 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT ** * 22218 AACTTAATTCAGGGTAATTAAGTGGGTCAGTAATC 1 AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT * * * * * 22253 AACTTAAAATCAGGGTAATCAAGTAAGTCATTGATC 1 AACTT-AATTCAGGGTAATTAAGTAAGTCAGTAATT * 22289 GACTTAATTCAGGGTAATTAAGT 1 AACTTAATTCAGGGTAATTAAGT 22312 TTAGTAAGAA Statistics Matches: 252, Mismatches: 43, Indels: 10 0.83 0.14 0.03 Matches are distributed among these distances: 31 26 0.10 32 1 0.00 34 1 0.00 35 196 0.78 36 28 0.11 ACGTcount: A:0.37, C:0.10, G:0.19, T:0.34 Consensus pattern (35 bp): AACTTAATTCAGGGTAATTAAGTAAGTCAGTAATT Found at i:22056 original size:17 final size:16 Alignment explanation

Indices: 21980--22093 Score: 75 Period size: 16 Copynumber: 6.6 Consensus size: 16 21970 AATAAGCAAC 21980 TTAATTCAGGGTAATTAA 1 TTAATTCA--GTAATTAA * * * 21998 GTCAGTCAGTAATTAA 1 TTAATTCAGTAATTAA 22014 GTTAATTCAGGGTAATTAA 1 -TTAATTCA--GTAATTAA * * 22033 GTAATTCAGTTATTAA 1 TTAATTCAGTAATTAA 22049 TTTAATTCAGGGTAATTAA 1 -TTAATTCA--GTAATTAA * * * 22068 GTAATTTAGTAATCAA 1 TTAATTCAGTAATTAA 22084 CTTAATTCAG 1 -TTAATTCAG 22094 GGTAATTAAG Statistics Matches: 74, Mismatches: 15, Indels: 15 0.71 0.14 0.14 Matches are distributed among these distances: 16 22 0.30 17 19 0.26 18 18 0.24 19 15 0.20 ACGTcount: A:0.38, C:0.08, G:0.16, T:0.39 Consensus pattern (16 bp): TTAATTCAGTAATTAA Found at i:22223 original size:136 final size:136 Alignment explanation

Indices: 21979--22311 Score: 375 Period size: 136 Copynumber: 2.4 Consensus size: 136 21969 TAATAAGCAA * * * * * 21979 CTTAATTCAGGGTAATTAAGTCAGTCAGTAATTAAGTTAATTCAGGGTAATTAAGTAATTCAGTT 1 CTTAATGCAGGGTAATTAAGTAAGTCAGTAAGTAACTTAATTCAGGGTAATTAAGTAAGTCAGTT * * * * * * * 22044 ATTAATTTAATTCAGGGTAATTAAGTAATTTAGTAATCAACTTAATTCAGGGTAATTAAGTTAGT 66 AGTAACTTAACTCAGGGTAATTAAGCAAGTCAGTAACCAACTTAATTCAGGGTAATTAAGTTAGT 22109 AAGTAG 131 AAGTAG * * * 22115 CTTAATGCAGGGTAATTAAGTAAGTCAGTTAGTAACTTAATTTAGGGTAATTAAGTGAGTCAGTT 1 CTTAATGCAGGGTAATTAAGTAAGTCAGTAAGTAACTTAATTCAGGGTAATTAAGTAAGTCAGTT ** 22180 AGTAACTTAACTCAGGGTAATTTTGCAAGTCAGTAACCAACTTAATTCAGGGTAATTAAGTGGGT 66 AGTAACTTAACTCAGGGTAATTAAGCAAGTCAGTAACCAACTTAATTCAGGGTAATTAAGT---T * 22245 CAGTAA-TCAA 128 -AGTAAGT-AG * * * * 22255 CTTAAAAT-CAGGGTAATCAAGTAAGTCATTGA-TCGACTTAATTCAGGGTAATTAAGT 1 CTT--AATGCAGGGTAATTAAGTAAGTCAGTAAGT-AACTTAATTCAGGGTAATTAAGT 22312 TTAGTAAGAA Statistics Matches: 166, Mismatches: 23, Indels: 11 0.83 0.12 0.05 Matches are distributed among these distances: 136 109 0.66 139 2 0.01 140 10 0.06 141 42 0.25 142 3 0.02 ACGTcount: A:0.36, C:0.10, G:0.20, T:0.34 Consensus pattern (136 bp): CTTAATGCAGGGTAATTAAGTAAGTCAGTAAGTAACTTAATTCAGGGTAATTAAGTAAGTCAGTT AGTAACTTAACTCAGGGTAATTAAGCAAGTCAGTAACCAACTTAATTCAGGGTAATTAAGTTAGT AAGTAG Found at i:24483 original size:141 final size:140 Alignment explanation

Indices: 24229--24535 Score: 483 Period size: 141 Copynumber: 2.2 Consensus size: 140 24219 TGGATTATCT * * * 24229 AATTACAACTTTAATTGGCAAAATTAATTAACAACATGTTCAATAATTTATTTTGTTGGTAACAT 1 AATTACAACTTTGATTGACAAAATTAACTAACAACATGTTCAATAATTTATTTTGTTGGTAACAT * * 24294 AATTACTAATTGATTTATTTATTTATGGTAATCTTTTTTATAGCGATTTTATGGTAAAATTATAT 66 AAATACTAATTGATTTATTTATTTATGGTAATCTTTTTTATAGCGA-TTTATGGTAAAATTAAAT 24359 AATCATCAATC 130 AATCATCAATC * * 24370 AATTACAACTTTGATTGACAAAATTAACTAACGACATGTTCAATAATTTATTTTTTTGGTAACAT 1 AATTACAACTTTGATTGACAAAATTAACTAACAACATGTTCAATAATTTATTTTGTTGGTAACAT * * 24435 AAATACTAATTGATTTATTTATTTATGTTAA-CTTTTTTTGTAGCGATTTATGGTAAAATTAAAT 66 AAATACTAATTGATTTATTTATTTATGGTAATC-TTTTTTATAGCGATTTATGGTAAAATTAAAT * 24499 AATTATCAATC 130 AATCATCAATC 24510 AATTACAACTTTGATTGGA-AAAATTA 1 AATTACAACTTTGATT-GACAAAATTA 24536 GACATATAAG Statistics Matches: 154, Mismatches: 10, Indels: 5 0.91 0.06 0.03 Matches are distributed among these distances: 140 51 0.33 141 103 0.67 ACGTcount: A:0.38, C:0.09, G:0.09, T:0.44 Consensus pattern (140 bp): AATTACAACTTTGATTGACAAAATTAACTAACAACATGTTCAATAATTTATTTTGTTGGTAACAT AAATACTAATTGATTTATTTATTTATGGTAATCTTTTTTATAGCGATTTATGGTAAAATTAAATA ATCATCAATC Found at i:25506 original size:13 final size:13 Alignment explanation

Indices: 25488--25512 Score: 50 Period size: 13 Copynumber: 1.9 Consensus size: 13 25478 AAATGTTTTA 25488 TTGTATTAGCAAG 1 TTGTATTAGCAAG 25501 TTGTATTAGCAA 1 TTGTATTAGCAA 25513 TGTCCTTATC Statistics Matches: 12, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 13 12 1.00 ACGTcount: A:0.32, C:0.08, G:0.20, T:0.40 Consensus pattern (13 bp): TTGTATTAGCAAG Found at i:27747 original size:135 final size:137 Alignment explanation

Indices: 27482--27730 Score: 328 Period size: 135 Copynumber: 1.8 Consensus size: 137 27472 AATTTTTAAG * * * 27482 TTTTGCTAATTAATATATTCTATAAGTATGATTCCAAATACTTTTCAATTAGTTGATTTAATCTC 1 TTTTGCTAATTAATATATTCTATAAATATGATTCCAAATACTTTTCAATTAGTCGATTTAATCCC * * * 27547 TCAATCATTTGATTCTATGCAATTTAATCCTTCACCATTTTTCTTTTGTCCTTTTTAATAATTCT 66 TCAAGCATTTGATTCTATGCAATTTAATCCTTCACCATTTTTCTTATATCCTTTTTAATAATTCT 27612 TCTTCAA 131 TCTTCAA * * * 27619 TTTTGCTCATTAA-A-ATTCTATAAATATGA-TCTCAAATACTTTTCTATTCGTCGA-TTAATTC 1 TTTTGCTAATTAATATATTCTATAAATATGATTC-CAAATACTTTTCAATTAGTCGATTTAA-TC * * * 27680 CCTCAAGCATTTGATTCTATGCAA-TTAGTGCTTCACCTTTATTTCTTATAT 64 CCTCAAGCATTTGATTCTATGCAATTTAATCCTTCACCATT-TTTCTTATAT 27731 TTTTTTTTAT Statistics Matches: 97, Mismatches: 12, Indels: 8 0.83 0.10 0.07 Matches are distributed among these distances: 134 19 0.20 135 65 0.67 136 1 0.01 137 12 0.12 ACGTcount: A:0.28, C:0.18, G:0.07, T:0.48 Consensus pattern (137 bp): TTTTGCTAATTAATATATTCTATAAATATGATTCCAAATACTTTTCAATTAGTCGATTTAATCCC TCAAGCATTTGATTCTATGCAATTTAATCCTTCACCATTTTTCTTATATCCTTTTTAATAATTCT TCTTCAA Found at i:28082 original size:1 final size:1 Alignment explanation

Indices: 28076--28105 Score: 60 Period size: 1 Copynumber: 30.0 Consensus size: 1 28066 CTAACATCAC 28076 TTTTTTTTTTTTTTTTTTTTTTTTTTTTTT 1 TTTTTTTTTTTTTTTTTTTTTTTTTTTTTT 28106 GGTGTAGTTT Statistics Matches: 29, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 1 29 1.00 ACGTcount: A:0.00, C:0.00, G:0.00, T:1.00 Consensus pattern (1 bp): T Found at i:36317 original size:2 final size:2 Alignment explanation

Indices: 36310--36349 Score: 66 Period size: 2 Copynumber: 21.0 Consensus size: 2 36300 GAAATTTGCT 36310 TA TA TA TA TA TA TA -A TA TA TA TA TA TA TA TA -A TA TA TA TA 1 TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA TA 36350 ATTTCATTTG Statistics Matches: 36, Mismatches: 0, Indels: 4 0.90 0.00 0.10 Matches are distributed among these distances: 1 2 0.06 2 34 0.94 ACGTcount: A:0.53, C:0.00, G:0.00, T:0.47 Consensus pattern (2 bp): TA Found at i:36330 original size:15 final size:14 Alignment explanation

Indices: 36310--36349 Score: 66 Period size: 13 Copynumber: 3.0 Consensus size: 14 36300 GAAATTTGCT 36310 TATATATATATATA 1 TATATATATATATA 36324 -ATATATATATATA 1 TATATATATATATA 36337 TATA-ATATATATA 1 TATATATATATATA 36350 ATTTCATTTG Statistics Matches: 25, Mismatches: 0, Indels: 3 0.89 0.00 0.11 Matches are distributed among these distances: 13 22 0.88 14 3 0.12 ACGTcount: A:0.53, C:0.00, G:0.00, T:0.47 Consensus pattern (14 bp): TATATATATATATA Found at i:36332 original size:17 final size:17 Alignment explanation

Indices: 36310--36349 Score: 80 Period size: 17 Copynumber: 2.4 Consensus size: 17 36300 GAAATTTGCT 36310 TATATATATATATAATA 1 TATATATATATATAATA 36327 TATATATATATATAATA 1 TATATATATATATAATA 36344 TATATA 1 TATATA 36350 ATTTCATTTG Statistics Matches: 23, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 17 23 1.00 ACGTcount: A:0.53, C:0.00, G:0.00, T:0.47 Consensus pattern (17 bp): TATATATATATATAATA Done.