Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: NTFQ01002064.1 Kokia drynarioides strain JFW-HI SEQ_113972, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 36468
ACGTcount: A:0.31, C:0.17, G:0.17, T:0.35


Found at i:178 original size:15 final size:15

Alignment explanation

Indices: 160--230 Score: 106 Period size: 15 Copynumber: 4.7 Consensus size: 15 150 AGTTTGGGCT 160 TTTGTAATTGGGCCA 1 TTTGTAATTGGGCCA * 175 TTTGTATTTGGGCCA 1 TTTGTAATTGGGCCA * * 190 TCTGTAACTGGGCCA 1 TTTGTAATTGGGCCA * 205 TTTGTTATTGGGCCA 1 TTTGTAATTGGGCCA 220 TTTGTAATTGG 1 TTTGTAATTGG 231 ACTTTGTTTT Statistics Matches: 48, Mismatches: 8, Indels: 0 0.86 0.14 0.00 Matches are distributed among these distances: 15 48 1.00 ACGTcount: A:0.17, C:0.14, G:0.27, T:0.42 Consensus pattern (15 bp): TTTGTAATTGGGCCA Found at i:302 original size:17 final size:16 Alignment explanation

Indices: 263--335 Score: 85 Period size: 17 Copynumber: 4.4 Consensus size: 16 253 TTGGACTTTC 263 TAAATTT-AATCTTATAA 1 TAAATTTAAAT-TTA-AA 280 TAAATTTAAATTTCAAA 1 TAAATTTAAATTT-AAA * 297 TGAATTTAAATTTAAAA 1 TAAATTTAAATTT-AAA * 314 TAAACTTAAATTTAAA 1 TAAATTTAAATTTAAA 330 TAAATT 1 TAAATT 336 CAATTTCCAA Statistics Matches: 49, Mismatches: 5, Indels: 5 0.83 0.08 0.08 Matches are distributed among these distances: 16 8 0.16 17 37 0.76 18 4 0.08 ACGTcount: A:0.52, C:0.04, G:0.01, T:0.42 Consensus pattern (16 bp): TAAATTTAAATTTAAA Found at i:303 original size:34 final size:33 Alignment explanation

Indices: 263--335 Score: 94 Period size: 34 Copynumber: 2.2 Consensus size: 33 253 TTGGACTTTC * * 263 TAAATTT-AATCTTATAATAAATTTAAATTTCAAA 1 TAAATTTAAAT-TTAAAATAAACTTAAATTT-AAA * 297 TGAATTTAAATTTAAAATAAACTTAAATTTAAA 1 TAAATTTAAATTTAAAATAAACTTAAATTTAAA 330 TAAATT 1 TAAATT 336 CAATTTCCAA Statistics Matches: 34, Mismatches: 4, Indels: 3 0.83 0.10 0.07 Matches are distributed among these distances: 33 8 0.24 34 23 0.68 35 3 0.09 ACGTcount: A:0.52, C:0.04, G:0.01, T:0.42 Consensus pattern (33 bp): TAAATTTAAATTTAAAATAAACTTAAATTTAAA Found at i:2397 original size:6 final size:6 Alignment explanation

Indices: 2386--2428 Score: 61 Period size: 6 Copynumber: 7.3 Consensus size: 6 2376 AAGCACAATG * * 2386 CAAAGC CAAAGC CAAAGC CAAAAC CAAAAC CAAAG- CAAAGC CA 1 CAAAGC CAAAGC CAAAGC CAAAGC CAAAGC CAAAGC CAAAGC CA 2429 TCACAATCCC Statistics Matches: 34, Mismatches: 2, Indels: 2 0.89 0.05 0.05 Matches are distributed among these distances: 5 5 0.15 6 29 0.85 ACGTcount: A:0.56, C:0.33, G:0.12, T:0.00 Consensus pattern (6 bp): CAAAGC Found at i:29149 original size:19 final size:19 Alignment explanation

Indices: 29113--29149 Score: 56 Period size: 19 Copynumber: 1.9 Consensus size: 19 29103 ATTAAAAATT ** 29113 CAACACTTAATATTTTTAA 1 CAACACTTAATAAATTTAA 29132 CAACACTTAATAAATTTA 1 CAACACTTAATAAATTTA 29150 GTAATCCAAG Statistics Matches: 16, Mismatches: 2, Indels: 0 0.89 0.11 0.00 Matches are distributed among these distances: 19 16 1.00 ACGTcount: A:0.46, C:0.16, G:0.00, T:0.38 Consensus pattern (19 bp): CAACACTTAATAAATTTAA Found at i:31741 original size:18 final size:19 Alignment explanation

Indices: 31718--31759 Score: 59 Period size: 19 Copynumber: 2.3 Consensus size: 19 31708 TGTTTTAAAG * 31718 TTTATAGTT-TGGTTTTAT 1 TTTATAGTTATGATTTTAT * 31736 TTTATAGTTATTATTTTAT 1 TTTATAGTTATGATTTTAT 31755 TTTAT 1 TTTAT 31760 CTTTTAAGAT Statistics Matches: 21, Mismatches: 2, Indels: 1 0.88 0.08 0.04 Matches are distributed among these distances: 18 9 0.43 19 12 0.57 ACGTcount: A:0.21, C:0.00, G:0.10, T:0.69 Consensus pattern (19 bp): TTTATAGTTATGATTTTAT Found at i:33552 original size:19 final size:20 Alignment explanation

Indices: 33503--33543 Score: 59 Period size: 20 Copynumber: 2.1 Consensus size: 20 33493 TGTTTTAAAG * 33503 TTTATAG-T-TTAGTTTTAT 1 TTTATAGTTATTATTTTTAT 33521 TTTATAGTTATTATTTTTAT 1 TTTATAGTTATTATTTTTAT 33541 TTT 1 TTT 33544 TATCTATTAA Statistics Matches: 20, Mismatches: 1, Indels: 2 0.87 0.04 0.09 Matches are distributed among these distances: 18 7 0.35 19 1 0.05 20 12 0.60 ACGTcount: A:0.22, C:0.00, G:0.07, T:0.71 Consensus pattern (20 bp): TTTATAGTTATTATTTTTAT Found at i:33691 original size:888 final size:878 Alignment explanation

Indices: 31545--34214 Score: 3144 Period size: 888 Copynumber: 3.0 Consensus size: 878 31535 TTAAATGTGA * * * * 31545 ATTTAGGTTAAAATTTAATTTTTTTAACTAATGAAAAAAAAAATCTCTTTTTCTATTGCTATTAA 1 ATTTAGATT-AAATTCAA-TTTGTTAACTAGTG-AAAAAAAAATCTCTTTTTCTATTGCTATTAA * * * * 31610 CAACTACTCTTATCAACA-TTTGTCCTTCAAACGCGACATCGAATTCATCTTCTAA-G-TATTTT 63 CAACTACTCTAATCAA-AGTTTGTCCTTCAAACGCGATATCGAGTTCATCTTCTAAGGTTTTTTT * * * 31672 TTTCATCTTTTTACAATTTTACTATTGTTTTTATTCTGTTTTAAAGTTTATAGTTTGGTTTTATT 127 TTTAATCTTTTTACAATTTTACTATTGTTTTTATTGTGTTTTAAAGTTTATAGTTTAGTTTTATT * 31737 TTATAGTTATTATTTTA-TTTTATCTTTTAAGATATTGTAGTTATGAAGTTGGAAACAATTGATT 192 TTATAGTTATTATTTTATTTTTATCTTTTAAGATATTGTAGTTATGAAG-TCGAAACAATTGATT * * * * * * 31801 CATTTTTTAAAAAGAAAAGTATAGGGACAACACAATCACCTTC-AGAGTCGTCACAAATTAAGAT 256 CGTTTTTTAAAAAGAAAAGTAAAGAGACAACACAATCACCTTCAAAAG-CGTCACAAATTGAGGT * * ** 31865 ACCACTTTCATCGTTTGCTCCTTTAAACTCTAATGCTCGTCCTTCTAAAATTCCTAGAGTTAAAG 320 ACCACCTTCATCGTTTGCTCCTTTAAACTCTGATGCTCGTCCTTCTAAAATTCCTAGAGTTGGAG * 31930 GTGAGACACTTGATTTGTCTAACTTAGAACGTGAACCTGGGTTACGTAAGCAAATATATGAGTAT 385 ATGAGACACTTGATTTGTCTAACTTAGAACGTGAACCTGGGTTACGTAAGCAAATATATGAGTAT * ** * * * * * * 31995 TCAGTTAATATGCATGATGAAATTCAAAGAG-TTGATATTAAGACTAAACCATCTTAATCTATTC 450 TCGGTTAATATGTGTGATGAAATTGAAA-AGCTT-ATATTAAGGCTGAACCATATCAACCTATTC * * * 32059 TTTC-GAAATATCCTTCTTCCAATTCAAAAAAACATCCTCATTATTTTCAACCATCATGATTTAA 513 TTTCAG-AATATCCTACTTCCAATTCAAAAAAAAATCCTCATTATTTTCAACCATCATGGTTTAA * * 32123 ATAATTTTCCTGGTTAGAATATTCATCTTCTAAAGATGCAGTATT--TAGAGG---TGA-CT-CT 577 ATAATTTTCCTGGTTAGAATATTCATCTTCTAAAGATGCAGTATTCAAAGAGGATCTGAGATGCT * * 32181 GTC-AGCC-CTCCTTAAAATTATAAAATTGAATATTTGTTATTTAACCCCTTAACTTTTGAAAAG 642 G-CAAGCCTCCCCCTAAAATTATAAAATTGAATATTTGTTATTTAACCCCTTAACTTTTGAAAAG * * * * * * 32244 TTTGGCCCCCTTTAAGTTGTTGTTCGGTCCCCTCCCAACTCTGAACATTAAAAGAAAATCTTTCA 706 TTTGGCCCCCTTTAAATTTTTGTTAGGACCCCTTCCAACTTTGAACATT-AAA-AAAATC--T-A * ** * ** * * 32309 ACTTTTAACATTAAAAAAAATATTTTTTT--ATTTTTTCCATATAAT-A-TATTTTAACTTTAAA 766 TCTTTT---ATT---TTAAAT-TTTTTTTCCATATCAT--ATATATTAACT-TTTTAATTTTAAA * * * * * * * 32370 TATTTATATAATATATTACAACTTTTTTTTTAGATTATAGTTATAAACTTTTTAATATAACATTA 821 TATTTATATAATATATTACAACTTTCTTTTT---TTAGA-TGAT-AACTGTTCACT-T----TTT 32435 AATGT 876 AA--T * * * 32440 GAATTTAGGTTAAAATTCAATTTGTTAACTAGTAAAAAAAAAAATCTCTTTTTCTACTGCTATTA 1 --ATTTAGATT-AAATTCAATTTGTTAACTAGT-GAAAAAAAAATCTCTTTTTCTATTGCTATTA * * * 32505 ACAATTACTCTCATCAAAGTTTGTCCTTCAAACGCGATATCGAGTTCATCTTCCAAGGTTTTTTT 62 ACAACTACTCTAATCAAAGTTTGTCCTTCAAACGCGATATCGAGTTCATCTTCTAAGGTTTTTTT ** * * * * 32570 TTTTTTCATTTTACAATTTTACTATTGTTTTTTTTGTGTTTTAAAGTTTATTGTTTAATTTTATT 127 TTTAATCTTTTTACAATTTTACTATTGTTTTTATTGTGTTTTAAAGTTTATAGTTTAGTTTTATT * * * 32635 TTATAGTAATTAATTT-TTTTTATCTCTTTAAGATATTGTAATTATGAAGTCGAAAACAATTGAT 192 TTATAGTTATTATTTTATTTTTATCT-TTTAAGATATTGTAGTTATGAAGTCG-AAACAATTGAT * * * * 32699 TTGATTTTTATAAAGAAAAGTAAAGAGACAGCACAATCACCTTCAGAAA-CGTCACAAATTGAGG 255 TCGTTTTTTAAAAAGAAAAGTAAAGAGACAACACAATCACCTTCA-AAAGCGTCACAAATTGAGG * * 32763 TACCACCTTCATCGTTTGCTCCTTTAAACTTTGATGCTCGTTCTTCTAAAATTCCTAGAGTTGGA 319 TACCACCTTCATCGTTTGCTCCTTTAAACTCTGATGCTCGTCCTTCTAAAATTCCTAGAGTTGGA * * 32828 GATGAGACACTTGATTTGTCTGACTTAAAACGTGAACCTGGGTTACGTAAGCAAATATATGAGTA 384 GATGAGACACTTGATTTGTCTAACTTAGAACGTGAACCTGGGTTACGTAAGCAAATATATGAGTA * * 32893 TCCGGTTAATATGTGTGATGAAATTGGAAAAGCTTATATTAAGGTTGAACCATATCAACCTATTC 449 TTCGGTTAATATGTGTGATGAAATT-GAAAAGCTTATATTAAGGCTGAACCATATCAACCTATTC * * 32958 ATTCAGAATGTCCTACTTCCAATT-AAAAAAAAATCCTCATTATTTTCAACCATCATGGTTTAAA 513 TTTCAGAATATCCTACTTCCAATTCAAAAAAAAATCCTCATTATTTTCAACCATCATGGTTTAAA * ** * * 33022 CAATTTTCCTAATTACAATATTCATCTTCTAAAGATGCAGTATTCAAAGACGGATCTGAGGTGCT 578 TAATTTTCCTGGTTAGAATATTCATCTTCTAAAGATGCAGTATTCAAAGA-GGATCTGAGATGCT 33087 AGCAAGGGCCTCACCCCCTAAAATTATAAAATTGAATATTTGTTATTTAACCCCTTAACTTTTGA 642 -GCAA--GCCT--CCCCCTAAAATTATAAAATTGAATATTTGTTATTTAACCCCTTAACTTTTGA * * * 33152 AAAGTTTGGCCCCTTTTAAATTTTTGTTTGGCCCCGCTTCCAACTTTGAACATTAAAAACAATCT 702 AAAGTTTGGCCCCCTTTAAATTTTTGTTAGGACCC-CTTCCAACTTTGAACATTAAAAA-AATCT * 33217 ATCTTTTATTTTAAATTTTTTTTCCATATCATATGTATTAACTTTTTAATTTTAAATATTTATAT 765 ATCTTTTATTTTAAATTTTTTTTCCATATCATATATATTAACTTTTTAATTTTAAATATTTATAT 33282 AATATATTACAACTTTCCTTTTTTTAGATGATAACTGTTCACTTTTTAAT 830 AATATATTACAACTTT-CTTTTTTTAGATGATAACTGTTCACTTTTTAAT * * ** 33332 ATTTAGATT-AATTCAATTTGTTAACTAGTGAAAAAGAAGTCTCTTTCACTATTGCTATTAACAA 1 ATTTAGATTAAATTCAATTTGTTAACTAGTGAAAAAAAAATCTCTTTTTCTATTGCTATTAACAA * * * * * 33396 CTACTCTAATCAATGTTTATCCTTCATACGTGGTATCGAGTTCATCTTCTAAGGTTTTTTTTTTA 66 CTACTCTAATCAAAGTTTGTCCTTCAAACGCGATATCGAGTTCATCTTCTAAGGTTTTTTTTTTA 33461 ATCTTTTTACAATTTTACTATTGTTTTTATTGTGTTTTAAAGTTTATAGTTTAGTTTTATTTTAT 131 ATCTTTTTACAATTTTACTATTGTTTTTATTGTGTTTTAAAGTTTATAGTTTAGTTTTATTTTAT * * * * 33526 AGTTATTATTTTTATTTTTATCTATTAAGATATTGTTGTTATGAAGTCGAAATTAGTTGATTCGT 196 AGTTATTA-TTTTATTTTTATCTTTTAAGATATTGTAGTTATGAAGTCGAAA-CAATTGATTCGT * * ** 33591 TTTTTAAAAAGAAAAGTACAGAGACAACACACTCACCTTCAAAAGCGTCACAAATTGAGGTGGCA 259 TTTTTAAAAAGAAAAGTAAAGAGACAACACAATCACCTTCAAAAGCGTCACAAATTGAGGTACCA * 33656 CCTTCATCGTTTGCTCCTTTAAACTCTGATGCTCGTCCTTCTAAAATTTCTAGAGTTGGAGATGA 324 CCTTCATCGTTTGCTCCTTTAAACTCTGATGCTCGTCCTTCTAAAATTCCTAGAGTTGGAGATGA * * * * 33721 GGCATTTGATTTGTCTAACTTAGAATGTGAACCTGGGTTACGTAAGCAAATATGTGAGTATTCGG 389 GACACTTGATTTGTCTAACTTAGAACGTGAACCTGGGTTACGTAAGCAAATATATGAGTATTCGG * * * 33786 TTAATATGTGTGATGAAATTCGAAGAGCTTATATTAAGGCTGGACCATATCAACTTATTCTTTCA 454 TTAATATGTGTGATGAAATT-GAAAAGCTTATATTAAGGCTGAACCATATCAACCTATTCTTTCA * * * * 33851 AAATATCCTGCTTCCAATTCAAAAAAAACATCCTCATTATTTTTAACCATCATAGTTTAAATAAT 518 GAATATCCTACTTCCAATTCAAAAAAAA-ATCCTCATTATTTTCAACCATCATGGTTTAAATAAT * * * * 33916 TTTCCTGGTTAGAATATTCACCTTCTAAAAATGCAGTATTCAGAA-ATGAATCT-AGAAAGCTGG 582 TTTCCTGGTTAGAATATTCATCTTCTAAAGATGCAGTATTCA-AAGA-GGATCTGAG-ATGCT-G * * 33979 CAAGCCT--TCCTAAAATTAT-AAATTGAATATTTGTTATTTAGCCCCTTAACTTTTGAAAAGTT 643 CAAGCCTCCCCCTAAAATTATAAAATTGAATATTTGTTATTTAACCCCTTAACTTTTGAAAAGTT * * ** * * **** * ** 34041 TGCCCCCCATCCAA-CTTTGAACATTAAAAGAAAATATTCCAACTTTTAACATTAAAAAAA-AAA 708 TGGCCCCCTTTAAATTTTTG----TT---AGGACCCCTTCCAACTTTGAACATTAAAAAAATCTA * 34104 TCTTTCT-TTTT---TTTTTTTTCCATATCATATATTTTAACTTTTTAATTTTAAATATTTATAT 766 TCTTT-TATTTTAAATTTTTTTTCCATATCATATATATTAACTTTTTAATTTTAAATATTTATAT * 34165 AATATATTACAACTTTC-TTTTTTAGATGATAATTGTTCACTTTTTAAT 830 AATATATTACAACTTTCTTTTTTTAGATGATAACTGTTCACTTTTTAAT 34213 AT 1 AT 34215 AATATTAAAT Statistics Matches: 1545, Mismatches: 178, Indels: 116 0.84 0.10 0.06 Matches are distributed among these distances: 881 32 0.02 882 5 0.00 883 115 0.07 884 11 0.01 886 12 0.01 887 161 0.10 888 329 0.21 889 20 0.01 890 91 0.06 891 2 0.00 892 1 0.00 894 4 0.00 895 1 0.00 896 89 0.06 897 18 0.01 898 165 0.11 899 278 0.18 900 12 0.01 901 8 0.01 902 12 0.01 903 42 0.03 904 13 0.01 905 1 0.00 906 6 0.00 907 2 0.00 909 9 0.01 910 1 0.00 911 2 0.00 912 87 0.06 913 16 0.01 ACGTcount: A:0.32, C:0.15, G:0.11, T:0.41 Consensus pattern (878 bp): ATTTAGATTAAATTCAATTTGTTAACTAGTGAAAAAAAAATCTCTTTTTCTATTGCTATTAACAA CTACTCTAATCAAAGTTTGTCCTTCAAACGCGATATCGAGTTCATCTTCTAAGGTTTTTTTTTTA ATCTTTTTACAATTTTACTATTGTTTTTATTGTGTTTTAAAGTTTATAGTTTAGTTTTATTTTAT AGTTATTATTTTATTTTTATCTTTTAAGATATTGTAGTTATGAAGTCGAAACAATTGATTCGTTT TTTAAAAAGAAAAGTAAAGAGACAACACAATCACCTTCAAAAGCGTCACAAATTGAGGTACCACC TTCATCGTTTGCTCCTTTAAACTCTGATGCTCGTCCTTCTAAAATTCCTAGAGTTGGAGATGAGA CACTTGATTTGTCTAACTTAGAACGTGAACCTGGGTTACGTAAGCAAATATATGAGTATTCGGTT AATATGTGTGATGAAATTGAAAAGCTTATATTAAGGCTGAACCATATCAACCTATTCTTTCAGAA TATCCTACTTCCAATTCAAAAAAAAATCCTCATTATTTTCAACCATCATGGTTTAAATAATTTTC CTGGTTAGAATATTCATCTTCTAAAGATGCAGTATTCAAAGAGGATCTGAGATGCTGCAAGCCTC CCCCTAAAATTATAAAATTGAATATTTGTTATTTAACCCCTTAACTTTTGAAAAGTTTGGCCCCC TTTAAATTTTTGTTAGGACCCCTTCCAACTTTGAACATTAAAAAAATCTATCTTTTATTTTAAAT TTTTTTTCCATATCATATATATTAACTTTTTAATTTTAAATATTTATATAATATATTACAACTTT CTTTTTTTAGATGATAACTGTTCACTTTTTAAT Done.