Tandem Repeats Finder Program written by: Gary Benson Program in Bioinformatics Boston University Version 4.09 Sequence: AWUE01015410.1 Corchorus olitorius cultivar O-4 contig15443, whole genome shotgun sequence Parameters: 2 7 7 80 10 50 1000 Pmatch=0.80,Pindel=0.10 tuple sizes 0,4,5,7 tuple distances 0, 29, 159, 1000 Length: 2593 ACGTcount: A:0.36, C:0.18, G:0.15, T:0.32 Found at i:965 original size:331 final size:330 Alignment explanation
Indices: 88--1602 Score: 1839 Period size: 331 Copynumber: 4.6 Consensus size: 330 78 CCAAAGATTT * * * 88 TGCAAAACTGTGTCGGGGCCCAAGAACGCGTTTTTAACCAAAAACTGTGATGGTTAGTACACGAT 1 TGCAAAACTGTGCCGGGGCCCAAGAACGCGTTTTTAGCCAAAAACTATGATGGTTAGTACACGAT * * * * 153 TTCGGCCAAAATTTTGCGAAAACTGTCTCGAAAAGTTTTTACTCAATTTTTGGCCACAATACTCA 66 TTCGGCCAAAATTTTGCAAAAACTGTCCCGAAAAATTTTTCCTCAATTTTTGGCCACAATACTCA * * * 218 TAAAAAATATATAACTCAACGCCAATAAAATTTAAGGGCCTTTCAGGCTTCTAATATCATTTTTC 131 TAAAAAATATATAACTCAAAGCCAATAAAATTGAAGGGCTTTTCAGGCTTCTAATATCATTTTTC * 283 CTATTTTTCCGAATTAATTTCTAATTAAATCGAAA-ATATAATTTAGATGCTCGTAAAAAAATAT 196 CTATTTTTCCGAATTAATTTCTAATTAAATCGAAACA-A-AATTCAGATGCTCGTAAAAAAATAT * * 347 TCTTAAATCCATTGTGGT-TGAGATCT-GTTAGATGAATATAAATATTTTAAGGAGTCTTGCGGC 259 CCTTAAATCCATTGT-GTCTGAGATTTGGTTAGATGAATATAAATATTTTAAGGAGTCTTGC-GC 410 CAAAAATCA 322 CAAAAATCA ** * * * * 419 TGCAAAACTAAGTCGGGGCCCCAGAACGCGCAGTTTTAGCAAAAAAAC-A-GA--G--A-TACAC 1 TGCAAAACTGTGCCGGGGCCCAAGAACGCG--TTTTTAGC-CAAAAACTATGATGGTTAGTACAC * * * 477 GATTTCAGG-CAAAATTTTGCAAAAACTATCCCGAAAAATTTTTCCTCAATTTTTCGCCACAATG 63 GATTTC-GGCCAAAATTTTGCAAAAACTGTCCCGAAAAATTTTTCCTCAATTTTTGGCCACAATA * * * 541 CTCATAAAAAATATGTAACTCAAAGCCAATAAAA-TGTAATGGCTTTTCAGGCTTCTAATATAAT 127 CTCATAAAAAATATATAACTCAAAGCCAATAAAATTG-AAGGGCTTTTCAGGCTTCTAATATCAT * * ** 605 TTTTCCTACTTTTT-TGAATTAATTTCTAATTAAACCGAAACAAAATTCAGATGCTCGTAAAACC 191 TTTTCCTA-TTTTTCCGAATTAATTTCTAATTAAATCGAAACAAAATTCAGATGCTCGTAAAAAA * * * * * * 669 TTATCCTTAAATGCATTGTGTCTGAGATTTGGTTAAATGAAAATAGATATTTTAAGTAGTCTTGC 255 ATATCCTTAAATCCATTGTGTCTGAGATTTGGTTAGATGAATATAAATATTTTAAGGAGTCTTGC 734 AGCCAAAAATCA 320 -GCCAAAAATCA * * * 746 TGCAAAATTGTGCCGGGACCCAAGAACGCGTTATTAGCCAAAAACTATGATGGTTAGTACACGAT 1 TGCAAAACTGTGCCGGGGCCCAAGAACGCGTTTTTAGCCAAAAACTATGATGGTTAGTACACGAT * * * * * 811 TTCAGCCAAAATGTTGCAAAAATTGTCCCGAAAAACTTTTCCTCAATTTTTGGCCCCAA-ACTCA 66 TTCGGCCAAAATTTTGCAAAAACTGTCCCGAAAAATTTTTCCTCAATTTTTGGCCACAATACTCA * * * * * * 875 TAAAAATTATATAATTCAAATCCAA-AAAGACTGAAGGGC-TTTCGACGCTTC-AATTATCGTTT 131 TAAAAAATATATAACTCAAAGCCAATAAA-ATTGAAGGGCTTTTC-AGGCTTCTAA-TATCATTT * * * * 937 TCCCTATTTTTTCCGAATTACTTTCTAATTAAATCGAAACATAATTCAGATGCTCATAAAAACAA 193 TTCCTA-TTTTTCCGAATTAATTTCTAATTAAATCGAAACAAAATTCAGATGCTCGTAAAAA-AA * * * * * * * * * ** 1002 -ATCTTTATATCCAATGTGACTGAGAATTGGTTAGATGAATATAGATATCTCAATGACACTTGGC 256 TATCCTTAAATCCATTGTGTCTGAGATTTGGTTAGATGAATATAAATATTTTAAGGAGTCTT-GC * 1066 GCCAAAGATCA 320 GCCAAAAATCA * * * 1077 TGCAAATCTGTGCCGAGGCCCAAGAACGCGTTTTTAGCCAAAAACTCTGATGGTTAGTACACGAT 1 TGCAAAACTGTGCCGGGGCCCAAGAACGCGTTTTTAGCCAAAAACTATGATGGTTAGTACACGAT * * 1142 TTCGGCCAAAATTTTGCGAAAACTGTCCCGAAAAATTTTTCCTCAATTTTTGGCCACAACACTCA 66 TTCGGCCAAAATTTTGCAAAAACTGTCCCGAAAAATTTTTCCTCAATTTTTGGCCACAATACTCA * * * * 1207 TAAAAAATATATAACTGAACGCCAATAAAATTTAAGGGCTTTTCAGGCTTCTAATATCATTTTTT 131 TAAAAAATATATAACTCAAAGCCAATAAAATTGAAGGGCTTTTCAGGCTTCTAATATCATTTTTC * * * * 1272 CTATTTTTCAGAATTAATTTCTAAGTAAATCGAAACATAATTCAGATGCTCGTAAAAAAATATTC 196 CTATTTTTCCGAATTAATTTCTAATTAAATCGAAACAAAATTCAGATGCTCGTAAAAAAATATCC * * * 1337 TTAAATCCATTGTGGCTGAGATTTGGTTAGATGAATATAAATATTTTAAGGAATCTTGCTGCCTA 261 TTAAATCCATTGTGTCTGAGATTTGGTTAGATGAATATAAATATTTTAAGGAGTCTTGC-GCCAA 1402 AAATCA 325 AAATCA * * * * 1408 TGTAAAACTATGACGGGGCCCCAGAACGCGCATTTTTAG-CAACAAAC-AGTGAT-GTTAGTACA 1 TGCAAAACTGTGCCGGGGCCCAAGAACGCG--TTTTTAGCCAA-AAACTA-TGATGGTTAGTACA * ** 1470 CGATTTCGGCCAAAATTTTGCAAAAACTATCCCGAAAAATTTTTCCTCAATTTTTACCCACAATA 62 CGATTTCGGCCAAAATTTTGCAAAAACTGTCCCGAAAAATTTTTCCTCAATTTTTGGCCACAATA * * * * * * 1535 CTCATAAAAAATATGTAACTCAACGCCAATAAAATTTAAGGGATTTTCAGGCATCCAATATCATT 127 CTCATAAAAAATATATAACTCAAAGCCAATAAAATTGAAGGGCTTTTCAGGCTTCTAATATCATT 1600 TTT 192 TTT 1603 AAGCGTTTTT Statistics Matches: 1008, Mismatches: 142, Indels: 67 0.83 0.12 0.06 Matches are distributed among these distances: 324 6 0.01 325 9 0.01 326 44 0.04 327 213 0.21 328 10 0.01 329 9 0.01 330 60 0.06 331 432 0.43 332 189 0.19 333 30 0.03 334 6 0.01 ACGTcount: A:0.36, C:0.18, G:0.14, T:0.31 Consensus pattern (330 bp): TGCAAAACTGTGCCGGGGCCCAAGAACGCGTTTTTAGCCAAAAACTATGATGGTTAGTACACGAT TTCGGCCAAAATTTTGCAAAAACTGTCCCGAAAAATTTTTCCTCAATTTTTGGCCACAATACTCA TAAAAAATATATAACTCAAAGCCAATAAAATTGAAGGGCTTTTCAGGCTTCTAATATCATTTTTC CTATTTTTCCGAATTAATTTCTAATTAAATCGAAACAAAATTCAGATGCTCGTAAAAAAATATCC TTAAATCCATTGTGTCTGAGATTTGGTTAGATGAATATAAATATTTTAAGGAGTCTTGCGCCAAA AATCA Found at i:1724 original size:168 final size:168 Alignment explanation
Indices: 1456--1770 Score: 524 Period size: 168 Copynumber: 1.9 Consensus size: 168 1446 GCAACAAACA 1456 GTGATGTTAGTACACGATTTCGGCCAAAATTTTGCAAAAACTATCCCGAAAAATTTTTCCTCAAT 1 GTGATGTTAGTACACGATTTCGGCCAAAATTTTGCAAAAACTATCCCGAAAAATTTTTCCTCAAT ** * 1521 TTTTACCCACAATACTCATAAAAAATATGTAACTCAACGCCAATAAAATTTAAGGGATTTTCAGG 66 TAGTACCCACAATACTCATAAAAAATATATAACTCAACGCCAATAAAATTTAAGGGATTTTCAGG 1586 CATCCAATATCATTTTTAAGCGTTTTTAGCCAAAAATT 131 CATCCAATATCATTTTTAAGCGTTTTTAGCCAAAAATT * * 1624 GTGATTGTTAGTACACGATTTCGGCCAAAATTTTGCAAAAAC-ATCCCGAAAATTTTTTCGTCAA 1 GTGA-TGTTAGTACACGATTTCGGCCAAAATTTTGCAAAAACTATCCCGAAAAATTTTTCCTCAA ** * 1688 TTAGTGGCCACAATACTCATAAAAAATATATAACTCAACGCCAATAAAATTTAAGGGCTTTTCAG 65 TTAGTACCCACAATACTCATAAAAAATATATAACTCAACGCCAATAAAATTTAAGGGATTTTCAG * * 1753 GCTTCTAATATCATTTTT 130 GCATCCAATATCATTTTT 1771 CTGAATTAAT Statistics Matches: 136, Mismatches: 10, Indels: 2 0.92 0.07 0.01 Matches are distributed among these distances: 168 99 0.73 169 37 0.27 ACGTcount: A:0.36, C:0.19, G:0.12, T:0.33 Consensus pattern (168 bp): GTGATGTTAGTACACGATTTCGGCCAAAATTTTGCAAAAACTATCCCGAAAAATTTTTCCTCAAT TAGTACCCACAATACTCATAAAAAATATATAACTCAACGCCAATAAAATTTAAGGGATTTTCAGG CATCCAATATCATTTTTAAGCGTTTTTAGCCAAAAATT Found at i:2428 original size:330 final size:326 Alignment explanation
Indices: 1608--2534 Score: 985 Period size: 330 Copynumber: 2.8 Consensus size: 326 1598 TTTTTAAGCG * 1608 TTTTTAGCCAAAAATTGTGATTGTTAGTACACGATTTCGGCCAAAATTTTGCAAAAAC-ATCCCG 1 TTTTTAGCCAAAAAATGTGA-TGTTAGTACACGATTTCGGCCAAAATTTTGCAAAAACTATCCCG * ** * 1672 AAAATTTTTTCGTCAATTAGTGGCCACAATACTCATAAAAAATATATAACTCAACGCCAATAAAA 65 AAAATTTTTTCCTCAATTTTTGGCCACAATACTCATAAAAAATATATAACTCAAAGCCAA-AAAA * * * * * * 1737 TTTAAGGGCTTTTCAGGCTTC---T--AATATCAT-TTTTCTGAATTAA-TTCTAATTAAATCGA 129 TTGAAGGGCTTTTCATGCTTCATTTCGTATTTCCTATTTTCCGAATTAATTTCTAATTAAATCGA * * * * 1795 AACATAATTCAGATGCTCGTAAAAATTATTCTTAAATCCATTGTGGCTTAGATTTGGTTAGATGA 194 AACATAATTCAGATGCTCGTAAAACTTATCCTTAAATCCATTGTGGCTAAAATTTGGTTAGATGA * * * * * 1860 ATATAAATATTTTAAAGAGACTTGCTGCCAAAAATCAAGCAAAACTTAGTCGGGATCCCAGAACG 259 ATATAGATATTTTAAAGAGACTTGCTGCAAAAAATCAACCAAAACGTAGTCGGGAGCCCAGAAC- * 1925 CGCG 323 CGCA ** 1929 TTTTTAG-CAAAAAATAGTGATG---GTACACGATTTCGGCCAAAATTTTGCAAAAACTATCATG 1 TTTTTAGCCAAAAAAT-GTGATGTTAGTACACGATTTCGGCCAAAATTTTGCAAAAACTATCCCG * * * 1990 AAAATTTTTTCCTAAAATTTTGGCCACAATAGTCATAAAAAAT-TAATAACT-AAAGGCCAAAAA 65 AAAATTTTTTCCTCAATTTTTGGCCACAATACTCATAAAAAATAT-ATAACTCAAA-GCC-AAAA * * * 2053 AATTTG-AGGGCTTTTCATGCTTTTATAATATCGTTTTTACTATTTTCCGAATTAATTTCTAATT 127 AA-TTGAAGGGCTTTTCATGC-TTCAT--T-TCGTATTTCCTATTTTCCGAATTAATTTCTAATT * * 2117 AAATCGAAACATAATTCAGATGCTCGTAAAACCTTATCCTTGAATCCATTGTGTCTAAAATTTGG 187 AAATCGAAACATAATTCAGATGCTCGTAAAA-CTTATCCTTAAATCCATTGTGGCTAAAATTTGG * * * * 2182 TTAGATGAAAATAGATATTTTAAGGAGTCTTGCTGCAAAAAATCATCCAAAACCGT-GTCGGG-G 251 TTAGATGAATATAGATATTTTAAAGAGACTTGCTGCAAAAAATCAACCAAAA-CGTAGTCGGGAG 2245 CCCAGCAA-CGCA 315 CCCAG-AACCGCA * * * * * * 2257 TTTTTAGCCAAAAACTGTGATGGTTAGTAAACGATCTCGGCTAAAATTTTGCGAAAACTGTCCCG 1 TTTTTAGCCAAAAAATGTGAT-GTTAGTACACGATTTCGGCCAAAATTTTGCAAAAACTATCCCG ** * * * 2322 AAAAAATTTTCCTCAATTTTTGGCCACAACACTCATAAAAAATATATAATTCAAATCCAAAAAGA 65 AAAATTTTTTCCTCAATTTTTGGCCACAATACTCATAAAAAATATATAACTCAAAGCCAAAAA-A * ** * 2387 CTGAAGGGCTTTAGATGCTTCATTTTTCGTATTTCCTATTTTTTTCCTAATTAATTTCTAATTAA 129 TTGAAGGGCTTTTCATGCTTCA--TTTCGTATTTCCTA---TTTTCCGAATTAATTTCTAATTAA * ** * * 2452 ATCGAAACATGATTCAGATGCTCGTAAAAACAAATCCTTCAATCCAATT-TGGCTGAGAA-TTGG 189 ATCGAAACATAATTCAGATGCTCGT-AAAACTTATCCTTAAATCC-ATTGTGGCT-AAAATTTGG * 2515 TTAGATGAGTATAGATATTT 251 TTAGATGAATATAGATATTT 2535 CAATGACATT Statistics Matches: 503, Mismatches: 66, Indels: 62 0.80 0.10 0.10 Matches are distributed among these distances: 317 35 0.07 318 67 0.13 319 6 0.01 320 9 0.02 321 11 0.02 325 1 0.00 327 3 0.01 328 27 0.05 329 52 0.10 330 90 0.18 331 13 0.03 332 89 0.18 333 90 0.18 334 10 0.02 ACGTcount: A:0.36, C:0.17, G:0.14, T:0.33 Consensus pattern (326 bp): TTTTTAGCCAAAAAATGTGATGTTAGTACACGATTTCGGCCAAAATTTTGCAAAAACTATCCCGA AAATTTTTTCCTCAATTTTTGGCCACAATACTCATAAAAAATATATAACTCAAAGCCAAAAAATT GAAGGGCTTTTCATGCTTCATTTCGTATTTCCTATTTTCCGAATTAATTTCTAATTAAATCGAAA CATAATTCAGATGCTCGTAAAACTTATCCTTAAATCCATTGTGGCTAAAATTTGGTTAGATGAAT ATAGATATTTTAAAGAGACTTGCTGCAAAAAATCAACCAAAACGTAGTCGGGAGCCCAGAACCGC A Found at i:2520 original size:333 final size:328 Alignment explanation
Indices: 1638--2534 Score: 865 Period size: 333 Copynumber: 2.8 Consensus size: 328 1628 TTGTTAGTAC * * ** * * * 1638 ACGATTTCGGCCAAAATTTTGCAAAAAC-ATCCCGAAAATTTTTTCGT-CAATTAGTGGCCACAA 1 ACGATCTCGGCCAAAATTTTGCAAAAACTATCACGAAAAAATTTTCCTAAAATT-TTGGCCACAA * * * * * * * * 1701 TACTCATAAAAAA-TATATAACTCAACGCCAATAAAATTTAAGGGCTTTTCAGGC-TTC-TAATA 65 CACTCATAAAAAATTA-ATAACTAAAGGCCAAAAAAATCTGAGGGCTTTACATGCTTTCATAATA 1763 TC------A--TTTTT-CTGAATTAA-TTCTAATTAAATCGAAACATAATTCAGATGCTCGTAAA 129 TCGTTTTTACTTTTTTCCT-AATTAATTTCTAATTAAATCGAAACATAATTCAGATGCTCGTAAA * * * 1818 AA-TTATTCTTAAATCCATTGTGGCTTAGATTTGGTTAGATGAATATAAATATTTTAAAGAGACT 193 AACTTATCCTTAAATCCATTGTGGC-TAGAATTGGTTAGATGAATATAGATATTTTAAAGAGACT * * * * * 1882 TGCTGCCAAAAATCAAGCAAAACTTAGTCGGGATCCCAGAACGCGCGTTTTTAGCAAAAAATAGT 257 TGCTGCAAAAAATCAACCAAAACGTAGTCGGGAGCCCAGAAC-CGCATTTTTAGCAAAAAATAGT * 1947 GATGGTAC 321 GATGGTAA * * ** * 1955 ACGATTTCGGCCAAAATTTTGCAAAAACTATCATGAAAATTTTTTCCTAAAATTTTGGCCACAAT 1 ACGATCTCGGCCAAAATTTTGCAAAAACTATCACGAAAAAATTTTCCTAAAATTTTGGCCACAAC * * * * 2020 AGTCATAAAAAATTAATAACTAAAGGCCAAAAAAATTTGAGGGCTTTTCATGCTTTTATAATATC 66 ACTCATAAAAAATTAATAACTAAAGGCCAAAAAAATCTGAGGGCTTTACATGCTTTCATAATATC * * * 2085 GTTTTTACTATTTTCCGAATTAATTTCTAATTAAATCGAAACATAATTCAGATGCTCGTAAAACC 131 GTTTTTACTTTTTTCCTAATTAATTTCTAATTAAATCGAAACATAATTCAGATGCTCGTAAAAAC * * * * * * 2150 TTATCCTTGAATCCATTGTGTCTAAAATTTGGTTAGATGAAAATAGATATTTTAAGGAGTCTTGC 196 TTATCCTTAAATCCATTGTGGCTAGAA-TTGGTTAGATGAATATAGATATTTTAAAGAGACTTGC * * 2215 TGCAAAAAATCATCCAAAACCGT-GTCGGG-GCCCAGCAA-CGCATTTTTAGCCAAAAACT-GTG 260 TGCAAAAAATCAACCAAAA-CGTAGTCGGGAGCCCAG-AACCGCATTTTTAG-CAAAAAATAGTG 2276 ATGGTTAGTAA 322 AT-G---GTAA * * * * * * 2287 ACGATCTCGGCTAAAATTTTGCGAAAACTGTCCCGAAAAAATTTTCCTCAATTTTTGGCCACAAC 1 ACGATCTCGGCCAAAATTTTGCAAAAACTATCACGAAAAAATTTTCCTAAAATTTTGGCCACAAC * * * * * 2352 ACTCATAAAAAA-TATATAATTCAAA-TCCAAAAAGA-CTGAAGGGCTTTAGATGC-TTCAT-TT 66 ACTCATAAAAAATTA-ATAACT-AAAGGCCAAAAAAATCTG-AGGGCTTTACATGCTTTCATAAT * * * 2412 TTCGTATTTCCTATTTTTTTCCTAATTAATTTCTAATTAAATCGAAACATGATTCAGATGCTCGT 128 ATCGT-TTT--TACTTTTTTCCTAATTAATTTCTAATTAAATCGAAACATAATTCAGATGCTCGT ** * * 2477 AAAAACAAATCCTTCAATCCAATT-TGGCTGAGAATTGGTTAGATGAGTATAGATATTT 190 AAAAACTTATCCTTAAATCC-ATTGTGGCT-AGAATTGGTTAGATGAATATAGATATTT 2535 CAATGACATT Statistics Matches: 483, Mismatches: 65, Indels: 48 0.81 0.11 0.08 Matches are distributed among these distances: 317 28 0.06 318 70 0.14 319 8 0.02 320 7 0.01 326 1 0.00 328 25 0.05 329 56 0.12 330 81 0.17 331 13 0.03 332 93 0.19 333 95 0.20 334 6 0.01 ACGTcount: A:0.36, C:0.17, G:0.14, T:0.33 Consensus pattern (328 bp): ACGATCTCGGCCAAAATTTTGCAAAAACTATCACGAAAAAATTTTCCTAAAATTTTGGCCACAAC ACTCATAAAAAATTAATAACTAAAGGCCAAAAAAATCTGAGGGCTTTACATGCTTTCATAATATC GTTTTTACTTTTTTCCTAATTAATTTCTAATTAAATCGAAACATAATTCAGATGCTCGTAAAAAC TTATCCTTAAATCCATTGTGGCTAGAATTGGTTAGATGAATATAGATATTTTAAAGAGACTTGCT GCAAAAAATCAACCAAAACGTAGTCGGGAGCCCAGAACCGCATTTTTAGCAAAAAATAGTGATGG TAA Done.