Tandem Repeats Finder Program written by: Gary Benson Program in Bioinformatics Boston University Version 4.09 Sequence: AWUE01010185.1 Corchorus olitorius cultivar O-4 contig10217, whole genome shotgun sequence Parameters: 2 7 7 80 10 50 1000 Pmatch=0.80,Pindel=0.10 tuple sizes 0,4,5,7 tuple distances 0, 29, 159, 1000 Length: 2207 ACGTcount: A:0.35, C:0.15, G:0.16, T:0.34 Found at i:967 original size:333 final size:332 Alignment explanation
Indices: 1--2207 Score: 2403 Period size: 333 Copynumber: 6.7 Consensus size: 332 * * * 1 GCAGAACTAAGTCGGGGCCCTGGAACGCGTTTTTAGCAAAAAA-CGTGATGGTTAGTACACGATT 1 GCAGAACTGAGTCAGGGCCCTGAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGATT * * * * * 65 TCGGCTAAAATTTTGCAAAAAATGACCTGAAAAATTTTTCCTCATTTTTTTTGTCTAAAATAATC 66 TCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCA-ATTTTTAG-CTAAAATACTC * * * ** * * * * 130 GTGTAATTTATATAATTTAACTCCGAAATGATTGGAGGACTTTTCACGCTTTTCATATCGTTTTT 129 ATGTAATATATATAATTCAACTCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCG--TTT * * * * 195 TTTAATATTTTTTTCAGAGTTAATTTCTAATTAAATCGAAACAAGATTCAGATGCTCGTAAAAAC 192 TTT-CTA-CTTTTTCCGAATTAATTTCTAATTAAATCGAAACAAGATTCAGATGCTCGTAAAAAC * * 260 AAATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAGTATAGATATTTCAAGGAGTCTCGA 255 AAATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGA 325 CGCCGAAAATCAT 320 CGCCGAAAATCAT * * * 338 GCAGAACTGAGCCAGGG-CATCGAAACGCGTTTTTAGCAATAAATC--G-T-G---GTACACGAT 1 GCAGAACTGAGTCAGGGCCCT-GAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGAT * * * * * 395 TTCAGCTAAAATTTTGCAAAAAATGACCCGAAAAATTTTTTCCTCAATTTTTTGTATAAAATAAT 65 TTCGGCTAAAATTTTGCAAAAAATGACCCGAAAAA-TATTTCCTCAATTTTTAG-CTAAAATACT * * * * * * 460 CATGTAATTTATATAATTTAACTCCAAAATGATTGGAGGATTTTTCACGCTTTTCATATCG-TTT 128 CATGTAATATATATAATTCAACTCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCGTTTT * * * * 524 TTCATTAATTTTTTCGAATTAATTTCTAATTAAATCGAAACAAGATTCAGATACTCGTAAAGACA 193 TTC--TACTTTTTCCGAATTAATTTCTAATTAAATCGAAACAAGATTCAGATGCTCGTAAAAACA 589 AATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGAC 256 AATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGAC 654 GCCGAAAATCAT 321 GCCGAAAATCAT * * * 666 GCAGAACTGAGTCGGGGTCCCTG-AACGCGTTTTTAGCAAAAAATCGTGATGGTTAATAAACGAT 1 GCAGAACTGAGTCAGGG-CCCTGAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGAT * * * * * 730 TTCAGCTAAAATTTTGCAAAAATTGACCCGTAAGATATTTCCTCAATTTTTAGCAAAAATACTCA 65 TTCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCAATTTTTAGCTAAAATACTCA * * * 795 TAG-AGATATATATAATTCAACGTCAAAAAT-ATTGAAGGGTTTTTTACTCTTCTAATATCGTTT 130 T-GTA-ATATATATAATTCAAC-TCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCGTTT * * * * 858 TTTCTACTTTTTCCGAATTAATTTCAAATTAAATTGAAATAAGATAT-AGCTGCTCGTAAAAACA 192 TTTCTACTTTTTCCGAATTAATTTCTAATTAAATCGAAACAAGAT-TCAGATGCTCGTAAAAACA * 922 AATTCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGAC 256 AATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGAC * 987 GCCGAAAATCAC 321 GCCGAAAATCAT * 999 GCAGAACTGAGTCGGGGTCCC-GAAACGCGTTTTTAGCAAAAAATC--G-T-G-T-GTACACGAT 1 GCAGAACTGAGTCAGGG-CCCTGAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGAT * ** 1057 TTCGGCTAAAATTTTGCAAAAATTGACCCGAAAGGTATTTCCTCAATTTTTAGCTAAAATACTCA 65 TTCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCAATTTTTAGCTAAAATACTCA * * * * * 1122 TGCAGATATATATAATTCAACGCCAAAAAT-ATTGAAGGGTTTTTTACGCTTCTAATATCATTTT 130 TGTA-ATATATATAATTCAAC-TCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCGTTTT * * * * * * * * 1186 TCCAACTTTTTCCGAATTAATTTCTATTTAAGTTGAAACAATATAT-ACATGCTCGTAAAAAAAA 193 TTCTACTTTTTCCGAATTAATTTCTAATTAAATCGAAACAAGAT-TCAGATGCTCGTAAAAACAA * * * * * * 1250 ATTCTTAAAT-C----TGGCTGAGATTTCATTATATGAATATGGATATTTGAACGAGTCTCGATG 257 ATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGACG 1310 CCGAAAATCAT 322 CCGAAAATCAT * * * * 1321 GCAGAACTGAGT-AAGGCCCCGAAACGCGTTTTTAGGAAAAAAATTGTGATGGTTAGTACACGAT 1 GCAGAACTGAGTCAGGGCCCTGAAACGCGTTTTTA-GCAAAAAATCGTGATGGTTAGTACACGAT * * * * * * 1385 TTCAGCTAAAATTCTGCAAAAAATGATCC-TAAAATTTTTCCTCAATTTTT-GCCTAATATACTC 65 TTCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCAATTTTTAG-CTAAAATACTC * * * * * * * * 1448 GTGTAATATATATAATTTAACTCCAAAATGATTGGAGGACTTTTCACACTTTTCATATCG-TTTT 129 ATGTAATATATATAATTCAACTCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCGTTTTT * * 1512 TCATTAATTTTTCCGAATTAAATTCTAATTAAATCGAAACAAGATTCAGATGCTCGTAAAAACAA 194 TC--TACTTTTTCCGAATTAATTTCTAATTAAATCGAAACAAGATTCAGATGCTCGTAAAAACAA ** * * * * * * ** * 1577 AAACTTAAATGGAATTTGGCTGAAATTTGACTAGATGAATGTAGATACTTGAAATAGTCTCGAAG 257 ATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGACG 1642 CCGAAAATCAT 322 CCGAAAATCAT * 1653 GCAGAACTGAGTCAGTGCCAC-GAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGAT 1 GCAGAACTGAGTCAGGGCC-CTGAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGAT * * * * * 1717 TACGGCTAAAATTTTGCAAAAATTGACACGAAAGATATTTCCTCAATTTTTAGCTGAAATACTCA 65 TTCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCAATTTTTAGCTAAAATACTCA * * * * * * 1782 TAG-AGTTATATATAATTCAACGCCAGAAAT-ATTGAAGGGTTTTTTATGCTTCTAATATCGTTT 130 T-GTA-ATATATATAATTCAAC-TCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCGTTT * * * * * 1845 TTCCTACTTTCTCCGAATTAATTTCTAA-TAAAGTTGAAATAAGATAT-AGACGCTCGTAAAAAC 192 TTTCTACTTTTTCCGAATTAATTTCTAATTAAA-TCGAAACAAGAT-TCAGATGCTCGTAAAAAC * 1908 AAATCCTGAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGA 255 AAATCCTTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGA * 1973 TGCCGAAAATCAT 320 CGCCGAAAATCAT * * * * 1986 GCAGAACTGAGTCAGGGCCCCGAAATGTGTTTTTAGCAAAAAAAAATCGTGATGGTTAGTACACA 1 GCAGAACTGAGTCAGGGCCCTGAAACGCGTTTTTAGC---AAAAAATCGTGATGGTTAGTACACG * * * * * * * 2051 ATTTCGGCTAAAATTCTGTAAAAAATTATCCGAAAAAT-TTTCCTCTA-TTTTCGCCTAAAATTC 63 ATTTCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCAATTTTTAG-CTAAAATAC * * * * * * 2114 TC-GGTTAATATATATAATTTC-ACTCCAAAATGATTGGAGGACTTTTCACTCGTT-TCATATCG 127 TCATG-TAATATATATAA-TTCAACTCAAAAATGATTGAAGGATTTTTCACGC-TTCTAATATCG * * * 2176 -TTTTTCATTAATTTTTCGGTATTAATTTCTAA 189 TTTTTTC--TACTTTTTCCGAATTAATTTCTAA Statistics Matches: 1599, Mismatches: 210, Indels: 124 0.83 0.11 0.06 Matches are distributed among these distances: 320 3 0.00 321 16 0.01 322 74 0.05 324 1 0.00 325 12 0.01 326 42 0.03 327 280 0.18 328 203 0.13 329 4 0.00 330 4 0.00 331 119 0.07 332 129 0.08 333 381 0.24 334 133 0.08 335 106 0.07 336 57 0.04 337 34 0.02 338 1 0.00 ACGTcount: A:0.35, C:0.15, G:0.16, T:0.34 Consensus pattern (332 bp): GCAGAACTGAGTCAGGGCCCTGAAACGCGTTTTTAGCAAAAAATCGTGATGGTTAGTACACGATT TCGGCTAAAATTTTGCAAAAAATGACCCGAAAAATATTTCCTCAATTTTTAGCTAAAATACTCAT GTAATATATATAATTCAACTCAAAAATGATTGAAGGATTTTTCACGCTTCTAATATCGTTTTTTC TACTTTTTCCGAATTAATTTCTAATTAAATCGAAACAAGATTCAGATGCTCGTAAAAACAAATCC TTAAATGCAATGTGGCTGAGATTTGATTAGATGAATATAGATATTTGAAGGAGTCTCGACGCCGA AAATCAT Done.