Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01008179.1 Corchorus capsularis cultivar CVL-1 contig08200, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 10772
ACGTcount: A:0.35, C:0.13, G:0.13, T:0.39


Found at i:7 original size:2 final size:2

Alignment explanation

Indices: 1--58 Score: 116 Period size: 2 Copynumber: 29.0 Consensus size: 2 1 CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT 1 CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT CT 43 CT CT CT CT CT CT CT CT 1 CT CT CT CT CT CT CT CT 59 TGAAATGTAG Statistics Matches: 56, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 2 56 1.00 ACGTcount: A:0.00, C:0.50, G:0.00, T:0.50 Consensus pattern (2 bp): CT Found at i:114 original size:2 final size:2 Alignment explanation

Indices: 109--140 Score: 64 Period size: 2 Copynumber: 16.0 Consensus size: 2 99 CCTCATAATC 109 AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT 1 AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT AT 141 TTAAAACAAT Statistics Matches: 30, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 2 30 1.00 ACGTcount: A:0.50, C:0.00, G:0.00, T:0.50 Consensus pattern (2 bp): AT Found at i:2222 original size:26 final size:26 Alignment explanation

Indices: 2164--2227 Score: 83 Period size: 26 Copynumber: 2.5 Consensus size: 26 2154 ATATTGACGA * * 2164 AAGGTTACTAAAATTTGTAAGAATGC 1 AAGGTTACTAAAAATTATAAGAATGC * * 2190 AAAGTTATTAAAAATTATAAGAATGC 1 AAGGTTACTAAAAATTATAAGAATGC * 2216 GAGGTTACTAAA 1 AAGGTTACTAAA 2228 TTTATGTACT Statistics Matches: 31, Mismatches: 7, Indels: 0 0.82 0.18 0.00 Matches are distributed among these distances: 26 31 1.00 ACGTcount: A:0.47, C:0.06, G:0.17, T:0.30 Consensus pattern (26 bp): AAGGTTACTAAAAATTATAAGAATGC Found at i:3618 original size:199 final size:196 Alignment explanation

Indices: 2740--4026 Score: 1384 Period size: 199 Copynumber: 6.7 Consensus size: 196 2730 TATAAGTTCA * 2740 CTATAAGAAAAATTATACAATACATCGTCAGTGGAGTTTAGCTA-ACTGCACGTGCGGGGTTTGA 1 CTATAAGAAAAATTATACAATAC--CGTCAGTGGAGTTTAGC-AGACTGCACGTGC-GGGTTTAA * * 2804 GGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTTTGAAATGT 62 GGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAATGG * * 2869 GGTATGTG------TC---ACCCGCTTATGAAGTCCAAAATTTACACTGACAGTGTACTGTATAA 127 GGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTATAA 2925 TAATC 192 TAATC * * * * * 2930 ATATAAAAAAAATTATACAATACACTTTCAGTGGAGTTTAGCAGACTGTAAGTGCGGG----A-- 1 CTATAAGAAAAATTATACAATAC-C-GTCAGTGGAGTTTAGCAGACTGCACGTGCGGGTTTAAGG * * * 2989 -TT--TATGTGTACCCTTACGGAATATGTATTAATATTAAATA--T--TTAATTATGAAATGGGG 64 GTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAATGGGG * * * 3047 TACGTGTCAACTTCTTAACCCGTTTATGGAGTCCAAAATTCACACTGACAGTGTATTGTATAATA 129 TATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTATAATA * 3112 ATT 194 ATC * * 3115 CTATAAG-AAAATTATACAATACAACTTCAGTGGAGTTTAGCAGACTGCAAGTGCGGG----A-- 1 CTATAAGAAAAATTATACAATAC--CGTCAGTGGAGTTTAGCAGACTGCACGTGCGGGTTTAAGG * * 3173 -TT--TATGTGTACCCTTAGGGAATATGTATTAATATTAAATA--T--TTAATTATGAAATGGGG 64 GTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAATGGGG * * * * * 3231 TACGTGTCAACTTCTTAACCTGTTTATGGAGTCCAAAATTCACACAGACAGTGTATTGTATAATA 129 TATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTATAATA 3296 ATC 194 ATC * 3299 CTATAAG-AAAATT-TACAATACACCGTTAGTGGAGTTTAGCAGACTGCACGTGCGGGGTTTAAC 1 CTATAAGAAAAATTATACAAT--ACCGTCAGTGGAGTTTAGCAGACTGCACGTGC-GGG------ * 3362 TTTAAGGGTTGACATGTGTACCCTTAGGGAATATGTATTAATATTAAATA--T--TTAATTATGA 57 TTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGA * * * * 3423 AATGGGGTATGTGTTAACTTCTTATCCCGCTTATGGAGTCTAAAATTTACACTGACAGTGTATTA 122 AATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTG * 3488 TATAATAATT 187 TATAATAATC * * * * 3498 TTATAAGAAAAATTATACAATAGCCGTCAGTGGATTTTTAGCAGACTGCATGTGCAGGATTTAAG 1 CTATAAGAAAAATTATACAATA-CCGTCAGTGGA-GTTTAGCAGACTGCACGTGC-GGGTTTAAG * * * * 3563 AGTTGATATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATAAAATAGG 63 GGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAATGGG * * * 3628 GTATGTGTCAACTTTTTAACCCACTTATGGAGTTCAAAATTTACACTGACAGTGTATTGTATAAT 128 GTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTATAAT 3693 AATC 193 AATC * * * * ** 3697 ATATAAAAAAAATTATACAATACACCATCAGTGGAGTTTACCAGACTGCACGTGCGGGGTTTTTG 1 CTATAAGAAAAATTATACAAT--ACCGTCAGTGGAGTTTAGCAGACTGCACGTGC-GGG-TTTAA * * ** * ** * 3762 GGGTTGGCATGTTTCCTTTTAGGGAATATGTGTTAATATTTTATATTTAATTAATTATGAAATAG 62 GGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAATGG * * * * * * 3827 GGTATGTGTTAACTTCTTATCCCGCTTATGGAGTTCAAAATTTACCCTAACAATGTATTGTATAA 127 GGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTATAA 3892 TAATC 192 TAATC * * * * * 3897 CTATAA-AAAGATTATATAATACACCGTAAGTGGAGTTTAGCAGACTGTACGTGCATGGTTTAAG 1 CTATAAGAAAAATTATACAAT--ACCGTCAGTGGAGTTTAGCAGACTGCACGTGC-GGGTTTAAG * * 3961 GGTTGACATGTGTCTCCTTAGGAAATATGTATTAATATTAAATATTTAATTAATTATGAAATGGG 63 GGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAATGGG 4026 G 128 G 4027 CGGTAAGAAA Statistics Matches: 951, Mismatches: 105, Indels: 74 0.84 0.09 0.07 Matches are distributed among these distances: 176 20 0.02 178 1 0.00 180 35 0.04 182 4 0.00 183 33 0.03 184 185 0.19 185 56 0.06 189 5 0.01 190 45 0.05 194 1 0.00 195 47 0.05 197 3 0.00 198 60 0.06 199 277 0.29 200 152 0.16 201 27 0.03 ACGTcount: A:0.34, C:0.13, G:0.19, T:0.35 Consensus pattern (196 bp): CTATAAGAAAAATTATACAATACCGTCAGTGGAGTTTAGCAGACTGCACGTGCGGGTTTAAGGGT TGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAATGGGGTA TGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTATAATAAT C Found at i:3941 original size:398 final size:390 Alignment explanation

Indices: 2740--4025 Score: 1539 Period size: 398 Copynumber: 3.3 Consensus size: 390 2730 TATAAGTTCA * * * 2740 CTATAAGAAAAATTATACAATACATCGTCAGTGGAGTTTAGCTA-ACTGCACGTGCGGGGTTTGA 1 CTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGC-AGACTGCACGTGC-AGGTTTAA * * 2804 GGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTTTGAAATGT 64 GAGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAATG- * * 2869 GGTATGTGT---C-----ACCCGCTTATGAAGTCCAAAATTTACACTGACAGTGTACTGTATAAT 128 GGTATGTGTCAACTTTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTATAAT ** * * * 2926 AATCATATAAAAAAAATTATACAATACACTTTCAGTGGAGTTTAGCAGACTGTAAGTGC-GGG-A 193 AATCATATAAAAAAAATTATACAATACACCATCAGTGGAGTTTAGCAGACTGCACGTGCGGGGTT * * 2989 TTT---AT-G--TG-TACCCTTACGGAATATGTATTAATATTAAATATTTAATTATGAAATGGGG 258 TTTGGGTTGGCATGTTACCCTTAGGGAATATGTATTAATATTAAATATTTAATTATGAAATGGGG * * * * * * 3047 TACGTGTCAACTTCTTAACCCGTTTATGGAGTCCAAAATTCACACTGACAGTGTATTGTATAATA 323 TATGTGTTAACTTCTTATCCCGCTTATGGAGTTCAAAATTTACACTGACAGTGTATTGTATAATA 3112 ATT 388 ATT * * * 3115 CTATAAG-AAAATTATACAATACAACTTCAGTGGAGTTTAGCAGACTGCAAGTGC-GG-----GA 1 CTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGACTGCACGTGCAGGTTTAAGA * * 3173 -TT--TATGTGTACCCTTAGGGAATATGTATTAATATTAAATA--T--TTAATTATGAAATGGGG 66 GTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAAT-GGG * * * * * 3231 TACGTGTCAACTTCTTAACCTGTTTATGGAGTCCAAAATTCACACAGACAGTGTATTGTATAATA 130 TATGTGTCAACTT-TTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTATAATA * * * * 3296 ATCCTAT-AAGAAAATT-TACAATACACCGTTAGTGGAGTTTAGCAGACTGCACGTGCGGGGTTT 194 ATCATATAAAAAAAATTATACAATACACCATCAGTGGAGTTTAGCAGACTGCACGTGCGGGG-TT * 3359 AACTTTAAGGGTTGACATGTGTACCCTTAGGGAATATGTATTAATATTAAATATTTAATTATGAA 258 ---TTT--GGGTTGGCATGT-TACCCTTAGGGAATATGTATTAATATTAAATATTTAATTATGAA * 3424 ATGGGGTATGTGTTAACTTCTTATCCCGCTTATGGAG-TCTAAAATTTACACTGACAGTGTATTA 317 ATGGGGTATGTGTTAACTTCTTATCCCGCTTATGGAGTTC-AAAATTTACACTGACAGTGTATTG 3488 TATAATAATT 381 TATAATAATT * * * * 3498 TTATAAGAAAAATTATACAATA-GCCGTCAGTGGATTTTTAGCAGACTGCATGTGCAGGATTTAA 1 CTATAAGAAAAATTATACAATACACCGTCAGTGGA-GTTTAGCAGACTGCACGTGCAGG-TTTAA * * 3562 GAGTTGATATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATAAAATAG 64 GAGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAAT-G * * 3627 GGTATGTGTCAACTTTTTAACCCACTTATGGAGTTCAAAATTTACACTGACAGTGTATTGTATAA 128 GGTATGTGTCAAC-TTTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTATAA * 3692 TAATCATATAAAAAAAATTATACAATACACCATCAGTGGAGTTTACCAGACTGCACGTGCGGGGT 192 TAATCATATAAAAAAAATTATACAATACACCATCAGTGGAGTTTAGCAGACTGCACGTGCGGGGT * * * * * 3757 TTTTGGGGTTGGCATGTTTCCTTTTAGGGAATATGTGTTAATATTTTATATTTAATTAATTATGA 257 TTTT-GGGTTGGCATGTTACC-CTTAGGGAATATGTATTAATA--TTA-A-ATATTTAATTATGA * * * * 3822 AATAGGGTATGTGTTAACTTCTTATCCCGCTTATGGAGTTCAAAATTTACCCTAACAATGTATTG 316 AATGGGGTATGTGTTAACTTCTTATCCCGCTTATGGAGTTCAAAATTTACACTGACAGTGTATTG * 3887 TATAATAATC 381 TATAATAATT * * * * 3897 CTATAA-AAAGATTATATAATACACCGTAAGTGGAGTTTAGCAGACTGTACGTGCATGGTTTAAG 1 CTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGACTGCACGTGCA-GGTTTAAG * * * 3961 GGTTGACATGTGTCTCCTTAGGAAATATGTATTAATATTAAATATTTAATTAATTATGAAATGGG 65 AGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAATGGG 4026 GCGGTAAGAA Statistics Matches: 777, Mismatches: 79, Indels: 88 0.82 0.08 0.09 Matches are distributed among these distances: 360 20 0.03 361 1 0.00 362 1 0.00 363 1 0.00 364 36 0.05 366 2 0.00 367 36 0.05 368 11 0.01 369 48 0.06 372 2 0.00 373 4 0.01 374 42 0.05 375 7 0.01 378 1 0.00 381 2 0.00 382 1 0.00 383 123 0.16 384 32 0.04 385 2 0.00 391 2 0.00 392 2 0.00 394 40 0.05 395 30 0.04 396 4 0.01 397 6 0.01 398 171 0.22 399 107 0.14 400 43 0.06 ACGTcount: A:0.34, C:0.13, G:0.19, T:0.35 Consensus pattern (390 bp): CTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGACTGCACGTGCAGGTTTAAGA GTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAATGGGT ATGTGTCAACTTTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTATAATAAT CATATAAAAAAAATTATACAATACACCATCAGTGGAGTTTAGCAGACTGCACGTGCGGGGTTTTT GGGTTGGCATGTTACCCTTAGGGAATATGTATTAATATTAAATATTTAATTATGAAATGGGGTAT GTGTTAACTTCTTATCCCGCTTATGGAGTTCAAAATTTACACTGACAGTGTATTGTATAATAATT Found at i:6134 original size:22 final size:20 Alignment explanation

Indices: 6109--6153 Score: 54 Period size: 20 Copynumber: 2.1 Consensus size: 20 6099 ATCTTGAAAT * 6109 TACATGTCCTCTAAAATTATTA 1 TACATGTCCT-T-AAATTACTA * 6131 TACATTTCCTTAAATTACTA 1 TACATGTCCTTAAATTACTA 6151 TAC 1 TAC 6154 TTTCCGGCAT Statistics Matches: 21, Mismatches: 2, Indels: 2 0.84 0.08 0.08 Matches are distributed among these distances: 20 11 0.52 21 1 0.05 22 9 0.43 ACGTcount: A:0.36, C:0.20, G:0.02, T:0.42 Consensus pattern (20 bp): TACATGTCCTTAAATTACTA Found at i:6593 original size:22 final size:25 Alignment explanation

Indices: 6556--6603 Score: 66 Period size: 23 Copynumber: 2.0 Consensus size: 25 6546 TAAGGATGAG 6556 AAATAATTTATGAAT-AATTT-TTA 1 AAATAATTTATGAATAAATTTCTTA * 6579 AAATAA-TTATTAATAAATTTCTTA 1 AAATAATTTATGAATAAATTTCTTA 6603 A 1 A 6604 CAAATAAATT Statistics Matches: 22, Mismatches: 1, Indels: 3 0.85 0.04 0.12 Matches are distributed among these distances: 22 7 0.32 23 11 0.50 24 4 0.18 ACGTcount: A:0.50, C:0.02, G:0.02, T:0.46 Consensus pattern (25 bp): AAATAATTTATGAATAAATTTCTTA Found at i:8094 original size:27 final size:28 Alignment explanation

Indices: 8063--8117 Score: 76 Period size: 29 Copynumber: 2.0 Consensus size: 28 8053 CGTCTAGACT * 8063 TTTTGCCCCA-AACTTCAATTTTGGACA 1 TTTTGCCCCAGAACTTCAATGTTGGACA * 8090 TTTTGTCCCATGAACTTCAATGTTGGAC 1 TTTTGCCCCA-GAACTTCAATGTTGGAC 8118 CAAACCGCTG Statistics Matches: 24, Mismatches: 2, Indels: 2 0.86 0.07 0.07 Matches are distributed among these distances: 27 9 0.38 29 15 0.62 ACGTcount: A:0.24, C:0.24, G:0.15, T:0.38 Consensus pattern (28 bp): TTTTGCCCCAGAACTTCAATGTTGGACA Found at i:8239 original size:30 final size:30 Alignment explanation

Indices: 8203--8276 Score: 123 Period size: 29 Copynumber: 2.5 Consensus size: 30 8193 CGTTAGGTTG 8203 AGGGGGCAAAATGTCCCAAAATTGAAGTTC 1 AGGGGGCAAAATGTCCCAAAATTGAAGTTC * 8233 AGGGGGCAAAATGT-CCAAGATTGAAGTTC 1 AGGGGGCAAAATGTCCCAAAATTGAAGTTC * 8262 AGGGGACAAAATGTC 1 AGGGGGCAAAATGTC 8277 TAGACGCTAC Statistics Matches: 41, Mismatches: 2, Indels: 2 0.91 0.04 0.04 Matches are distributed among these distances: 29 27 0.66 30 14 0.34 ACGTcount: A:0.36, C:0.15, G:0.30, T:0.19 Consensus pattern (30 bp): AGGGGGCAAAATGTCCCAAAATTGAAGTTC Found at i:9510 original size:26 final size:27 Alignment explanation

Indices: 9457--9510 Score: 65 Period size: 26 Copynumber: 2.0 Consensus size: 27 9447 TATTATATTG * 9457 AAATTACTAAGAATATAAGATTACTAA 1 AAATTACTAAGAATATAAGATTAATAA * * * 9484 AAATT-CTAAGAATGTGAGGTTAATAA 1 AAATTACTAAGAATATAAGATTAATAA 9510 A 1 A 9511 TTTATGTAGA Statistics Matches: 23, Mismatches: 4, Indels: 1 0.82 0.14 0.04 Matches are distributed among these distances: 26 18 0.78 27 5 0.22 ACGTcount: A:0.52, C:0.06, G:0.13, T:0.30 Consensus pattern (27 bp): AAATTACTAAGAATATAAGATTAATAA Done.