Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01011670.1 Corchorus capsularis cultivar CVL-1 contig11691, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 12261
ACGTcount: A:0.33, C:0.20, G:0.15, T:0.31


Found at i:362 original size:199 final size:199

Alignment explanation

Indices: 1--937 Score: 1157 Period size: 199 Copynumber: 4.8 Consensus size: 199 * * * ** 1 AAGGGTTAACATGTGTCCCCCTAGGGAATATGTATTAATATTATATATTTAATTAAAGATGAAAT 1 AAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAAT * * * * 66 GAAGTATATGACAACTTCTTAACCCGCTTATGGAGTTCAAAATTTACATTGACAGTGTATTGTAT 66 GAGGTATATGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTAT * ** * 131 AATAATCATATAAGAAAAATTATATTATACACCGTCAGTGGATTTTAGCAGACTACACGTGCGGG 131 AATAATCCTATAAGAAAAATTATACAATACACCGTCAGTGGATTTTAGCAGACTACACGTGCAGG 196 GTTT 196 GTTT * * * * 200 TAGGGTTGTCATGTGTCCCCTTAGGGAATATGTATTAATAATAATTATTTAATTAATTATGAAAT 1 AAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAAT * * * * * * * 265 GTGGTATCTGCCAACTTTTTAACCCGCTTATGGAATCCAAATTTTACATTGACAGTGTATTGTAT 66 GAGGTATATGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTAT * * * * 330 AATAATCCTATAAGAACAATCT-TACAATACACCGTCAGTGGAGTTTAGCAGATTGCACGTGC-G 131 AATAATCCTATAAGAAAAAT-TATACAATACACCGTCAGTGGATTTTAGCAGACTACACGTGCAG 393 GGCTTT 195 GG-TTT * 399 AAGGG-TGACATGTGTCCCCTTA--G--TATGTA-T-ATATT-AATATTTTATTAATTATGAAAT 1 AAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAAT * * 456 GAGATATATGTCAACTTCTTAACCCGCTTATGGAGTCC-AAATCTTACACTGACATTGTATTGTA 66 GAGGTATATGTCAACTTCTTAACCCGCTTATGGAGTCCAAAAT-TTACACTGACAGTGTATTGTA * * ** 520 TAATAATTCTATAAGAAAAATTATACTATATACACCGTCAGTGGATTTTAACAGACTACACGTTT 130 TAATAATCCTATAAGAAAAATTATAC-A-ATACACCGTCAGTGGATTTTAGCAGACTACACGTGC * 585 AAGGTTT 193 AGGGTTT * * * * 592 AAGGGTTGACATGTGTCCCCTTAGAGAATATGTATTGATATTAAATATTTTATTAATTATGTAAT 1 AAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAAT * * * * * * 657 GGGGTATATGTCAAATTATTAAACCGCTTATGGAGTCTAAAATGTACACTGACAGTGTATTGTAT 66 GAGGTATATGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTAT * * * * 722 AATAATCCTATAAGAAAAATTATACTATGCACCGTCAGTCGAATTTAGCAGACTACACGTGCAGG 131 AATAATCCTATAAGAAAAATTATACAATACACCGTCAGTGGATTTTAGCAGACTACACGTGCAGG 787 GTTT 196 GTTT ** * * * 791 AAGGGTTGACATGTGTTTCCGTAAGGAATATGTATTAATATTAAATATTTAATTGATTATGAAAT 1 AAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAAT * * * ** * 856 GTGTTATGTGTCAACTTCTTAA----CTTATGGAGTGTAAAATTTACACTGAAAAGTGTATTGTA 66 GAGGTATATGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACACTG-ACAGTGTATTGTA * 917 TGATAATCCTATAAGAAAAAT 130 TAATAATCCTATAAGAAAAAT 938 AATATAAAGT Statistics Matches: 638, Mismatches: 83, Indels: 37 0.84 0.11 0.05 Matches are distributed among these distances: 190 4 0.01 191 93 0.15 192 5 0.01 193 39 0.06 194 25 0.04 195 23 0.04 196 34 0.05 198 25 0.04 199 283 0.44 200 6 0.01 201 97 0.15 202 4 0.01 ACGTcount: A:0.34, C:0.13, G:0.17, T:0.36 Consensus pattern (199 bp): AAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTATGAAAT GAGGTATATGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACACTGACAGTGTATTGTAT AATAATCCTATAAGAAAAATTATACAATACACCGTCAGTGGATTTTAGCAGACTACACGTGCAGG GTTT Found at i:783 original size:392 final size:395 Alignment explanation

Indices: 1--942 Score: 1183 Period size: 392 Copynumber: 2.4 Consensus size: 395 * * * ** 1 AAGGGTTAACATGTGTCCCCCTAGGGAATATGTATTAATATTATATATTTAATTAAAGATGAAAT 1 AAGGGTTGACATGTGTTCCCCTAAGG-ATATGTATTAATATTA-ATATTTAATTAATTATGAAAT * * 66 GA-AGTATATGACAACTTCTTAACCCGCTTATGGAGTTCAAAATTTACATTGACAGTGTATTGTA 64 GAGA-TATATGTCAACTTCTTAACCCGCTTATGGAG-TCAAAATTTACACTGACAGTGTATTGTA * * 130 TAATAA-TCATATAAGAAAAATTATATTATACACCGTCAGTGGATTTTAGCAGACTACACGTGCG 127 TAATAATTC-TATAAGAAAAATTATATTATACACCGTCAGTGGATTTTAACAGACTACACGTGCA * * * * * 194 GGGTTTTAGGGTTGTCATGTGTCCCCTTAGGGAATATGTATTAATAATAATTATTTAATTAATTA 191 AGGTTTAAGGGTTGACATGTGTCCCCTTAGAGAATATGTATTAATAATAAATATTTAATTAATTA * * * * * * * * 259 TGAAATGTGGTATCTGCCAACTTTTTAACCCGCTTATGGAATCCAAATTTTACATTGACAGTGTA 256 TGAAATGGGGTATATGCCAAATTATTAAACCGCTTATGGAATCCAAAATGTACACTGACAGTGTA * * * * * 324 TTGTATAATAATCCTATAAGAACAATCTTACAATACACCGTCAGTGGAGTTTAGCAGATTGCACG 321 TTGTATAATAATCCTATAAGAAAAATCTTACAATACACCGTCAGTCGAATTTAGCAGACTACACG 389 TGC-GGGCTTT 386 TGCAGGG-TTT * * 399 AAGGG-TGACATGTG-TCCCCTTA-G-TATGTA-T-ATATTAATATTTTATTAATTATGAAATGA 1 AAGGGTTGACATGTGTTCCCCTAAGGATATGTATTAATATTAATATTTAATTAATTATGAAATGA * * 458 GATATATGTCAACTTCTTAACCCGCTTATGGAGTCCAAATCTTACACTGACATTGTATTGTATAA 66 GATATATGTCAACTTCTTAACCCGCTTATGGAGTCAAAAT-TTACACTGACAGTGTATTGTATAA ** 523 TAATTCTATAAGAAAAATTATACTATATACACCGTCAGTGGATTTTAACAGACTACACGTTTAAG 130 TAATTCTATAAGAAAAATTATA-T-TATACACCGTCAGTGGATTTTAACAGACTACACGTGCAAG * * * 588 GTTTAAGGGTTGACATGTGTCCCCTTAGAGAATATGTATTGATATTAAATATTTTATTAATTATG 193 GTTTAAGGGTTGACATGTGTCCCCTTAGAGAATATGTATTAATAATAAATATTTAATTAATTATG * * * * 653 TAATGGGGTATATGTCAAATTATTAAACCGCTTATGGAGTCTAAAATGTACACTGACAGTGTATT 258 AAATGGGGTATATGCCAAATTATTAAACCGCTTATGGAATCCAAAATGTACACTGACAGTGTATT * * 718 GTATAATAATCCTATAAGAAAAAT-TATACTATGCACCGTCAGTCGAATTTAGCAGACTACACGT 323 GTATAATAATCCTATAAGAAAAATCT-TACAATACACCGTCAGTCGAATTTAGCAGACTACACGT 782 GCAGGGTTT 387 GCAGGGTTT * * * 791 AAGGGTTGACATGTGTTTCCGTAAGGAATATGTATTAATATTAAATATTTAATTGATTATGAAAT 1 AAGGGTTGACATGTGTTCCCCTAAGG-ATATGTATTAATATT-AATATTTAATTAATTATGAAAT * * * * * 856 GTGTTATGTGTCAACTTCTTAA----CTTATGGAGTGTAAAATTTACACTGAAAAGTGTATTGTA 64 GAGATATATGTCAACTTCTTAACCCGCTTATGGAGT-CAAAATTTACACTG-ACAGTGTATTGTA * * * 917 TGATAATCCTATAAGAAAAATAATAT 127 TAATAATTCTATAAGAAAAATTATAT 943 AAAGTGATTT Statistics Matches: 470, Mismatches: 57, Indels: 36 0.83 0.10 0.06 Matches are distributed among these distances: 389 6 0.01 390 91 0.19 391 11 0.02 392 212 0.45 393 18 0.04 394 5 0.01 395 2 0.00 396 24 0.05 397 51 0.11 398 6 0.01 399 5 0.01 400 39 0.08 ACGTcount: A:0.34, C:0.13, G:0.17, T:0.36 Consensus pattern (395 bp): AAGGGTTGACATGTGTTCCCCTAAGGATATGTATTAATATTAATATTTAATTAATTATGAAATGA GATATATGTCAACTTCTTAACCCGCTTATGGAGTCAAAATTTACACTGACAGTGTATTGTATAAT AATTCTATAAGAAAAATTATATTATACACCGTCAGTGGATTTTAACAGACTACACGTGCAAGGTT TAAGGGTTGACATGTGTCCCCTTAGAGAATATGTATTAATAATAAATATTTAATTAATTATGAAA TGGGGTATATGCCAAATTATTAAACCGCTTATGGAATCCAAAATGTACACTGACAGTGTATTGTA TAATAATCCTATAAGAAAAATCTTACAATACACCGTCAGTCGAATTTAGCAGACTACACGTGCAG GGTTT Found at i:1990 original size:14 final size:14 Alignment explanation

Indices: 1968--1999 Score: 55 Period size: 14 Copynumber: 2.3 Consensus size: 14 1958 ATTATGTGAC * 1968 TAATGAATAAATTA 1 TAATAAATAAATTA 1982 TAATAAATAAATTA 1 TAATAAATAAATTA 1996 TAAT 1 TAAT 2000 TTTAAATATT Statistics Matches: 17, Mismatches: 1, Indels: 0 0.94 0.06 0.00 Matches are distributed among these distances: 14 17 1.00 ACGTcount: A:0.59, C:0.00, G:0.03, T:0.38 Consensus pattern (14 bp): TAATAAATAAATTA Found at i:3360 original size:13 final size:14 Alignment explanation

Indices: 3342--3371 Score: 53 Period size: 13 Copynumber: 2.2 Consensus size: 14 3332 TCTTGATTGC 3342 TTACTTAGTTA-AT 1 TTACTTAGTTAGAT 3355 TTACTTAGTTAGAT 1 TTACTTAGTTAGAT 3369 TTA 1 TTA 3372 ATTTTAATTT Statistics Matches: 16, Mismatches: 0, Indels: 1 0.94 0.00 0.06 Matches are distributed among these distances: 13 11 0.69 14 5 0.31 ACGTcount: A:0.30, C:0.07, G:0.10, T:0.53 Consensus pattern (14 bp): TTACTTAGTTAGAT Found at i:12058 original size:3 final size:3 Alignment explanation

Indices: 12050--12080 Score: 62 Period size: 3 Copynumber: 10.3 Consensus size: 3 12040 GCCAAAAAAT 12050 ATA ATA ATA ATA ATA ATA ATA ATA ATA ATA A 1 ATA ATA ATA ATA ATA ATA ATA ATA ATA ATA A 12081 GACGAGAGAG Statistics Matches: 28, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 3 28 1.00 ACGTcount: A:0.68, C:0.00, G:0.00, T:0.32 Consensus pattern (3 bp): ATA Done.