Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: NTFQ01011896.1 Kokia drynarioides strain JFW-HI SEQ_126893, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 38862
ACGTcount: A:0.33, C:0.17, G:0.17, T:0.33

Warning! 138 characters in sequence are not A, C, G, or T


Found at i:1950 original size:21 final size:21

Alignment explanation

Indices: 1911--1950 Score: 53 Period size: 21 Copynumber: 1.9 Consensus size: 21 1901 AATTATAAGA * * 1911 AAGATTAATTAAAAGTTAATT 1 AAGATTAACTAAAACTTAATT * 1932 AAGATTAACTAAACCTTAA 1 AAGATTAACTAAAACTTAA 1951 CTAAACATAT Statistics Matches: 16, Mismatches: 3, Indels: 0 0.84 0.16 0.00 Matches are distributed among these distances: 21 16 1.00 ACGTcount: A:0.53, C:0.07, G:0.07, T:0.33 Consensus pattern (21 bp): AAGATTAACTAAAACTTAATT Found at i:3379 original size:444 final size:443 Alignment explanation

Indices: 2520--3393 Score: 1304 Period size: 444 Copynumber: 2.0 Consensus size: 443 2510 AGTCATTGAC * * * 2520 GAGTAGATATTTGAATTGAATTACATTTGTCAAGATTGATTATCGAGACAAGAACTAAATTGAAT 1 GAGTAGATATTTGAATTGAATTAAATTTGTCAAGATTGATTATCAAGACAAGAACAAAATTGAAT ** * * 2585 AGTATAGAAATTTCGTGATTTAATTTATATATGATAATTGGTATGAAATTGAGTTGAAACAGTTT 66 AGTATAGAAATTTAATCATTTAATTTATATATGATAATTGGTATGAAATTGAGTTGAAACAATTT * 2650 GTATTATAAGATGAATTGACAATTAATTGATATTATAAAGTATGATTTGAATTGTTTATAATGAA 131 GTATTATAAGATGAATTGACAATTAATTGATATCATAAAGTATGATTTGAATTGTTTATAATGAA * * * * * * * 2715 AAAAATTTTGGTTACCTTGTTAGCTGTTCGAACAGAATCGGATATAGTTGGCATGGCATAGCGTT 196 AAAAAATGTGGTTACCCTGTTAGCTGTTCAAACAGAATCGGATATAGTTGGCATGCCATAACGTC * * ** 2780 AGACTATTGATTGAAAACCAGCGTTGTCAGACAACCCAGGGTGGTAGTATGTACATGTTAGCATC 261 AGACTATTGATTAAAAACCAGCATTACCAGACAACCCAGGGTGGTAGTATGTACATGTTAGCATC 2845 ATCATTGCCGAGCAACCTAGGGTGACGAATCCATGTATCCATTCTGAGTCAGTGTCTGGTTAATA 326 ATCATTGCCGAGCAACCTAGGGTGACGAATCCATGTATCCATTCTGAGTCAGTGTCTGGTTAATA * 2910 GGGTTAAAAATATACAAACTGATTAAATGATGACTGAAATCGAAATTCGTTGGT 391 GGGTTAAAAATATA-AAACTGATTAAATGATGAATGAAATCGAAATTCGTTGGT * * * 2964 GAGTAGATATTTGAATTGAATTAAATTTTTCGAGATTGATTATCAAGACAAGGACAAAATTGAAT 1 GAGTAGATATTTGAATTGAATTAAATTTGTCAAGATTGATTATCAAGACAAGAACAAAATTGAAT * 3029 AGTATAGAGATTTAATCATTTAATTTATATATGATAATTGGTATGAAATTGAGTTGAAACAATTT 66 AGTATAGAAATTTAATCATTTAATTTATATATGATAATTGGTATGAAATTGAGTTGAAACAATTT ** 3094 GTATTATAAGATGAATTGATGATTAATTGATATCATAAAGTATGATTTGAATTGTTTATAATGAA 131 GTATTATAAGATGAATTGACAATTAATTGATATCATAAAGTATGATTTGAATTGTTTATAATGAA * 3159 TAAAAAATGTGGTTACCCTGTTAGTTGTTCAAATC-GAATCGGATATAGTTGGCATGCCATAACG 196 -AAAAAATGTGGTTACCCTGTTAGCTGTTCAAA-CAGAATCGGATATAGTTGGCATGCCATAACG * * * 3223 TCAGATTATTGATTAAAAACCAGCATTACCATG-CAACCCTGGGTGGTTGTATGTACATGTTAGC 259 TCAGACTATTGATTAAAAACCAGCATTACCA-GACAACCCAGGGTGGTAGTATGTACATGTTAGC * * * * * * * * * * 3287 GTCATCGTTGCCGAGTAACCTTGGGTGATGAATTCATGTATCCATTTTGAGTCCGTTTTTGGTTA 323 ATCATCATTGCCGAGCAACCTAGGGTGACGAATCCATGTATCCATTCTGAGTCAGTGTCTGGTTA * * 3352 ATAGGGTATAAACATAT-AAATTGATTAAATGATGAATGAAAT 388 ATAGGGT-TAAAAATATAAAACTGATTAAATGATGAATGAAAT 3394 AAAATTGATG Statistics Matches: 384, Mismatches: 42, Indels: 8 0.88 0.10 0.02 Matches are distributed among these distances: 444 204 0.53 445 170 0.44 446 10 0.03 ACGTcount: A:0.35, C:0.10, G:0.20, T:0.35 Consensus pattern (443 bp): GAGTAGATATTTGAATTGAATTAAATTTGTCAAGATTGATTATCAAGACAAGAACAAAATTGAAT AGTATAGAAATTTAATCATTTAATTTATATATGATAATTGGTATGAAATTGAGTTGAAACAATTT GTATTATAAGATGAATTGACAATTAATTGATATCATAAAGTATGATTTGAATTGTTTATAATGAA AAAAAATGTGGTTACCCTGTTAGCTGTTCAAACAGAATCGGATATAGTTGGCATGCCATAACGTC AGACTATTGATTAAAAACCAGCATTACCAGACAACCCAGGGTGGTAGTATGTACATGTTAGCATC ATCATTGCCGAGCAACCTAGGGTGACGAATCCATGTATCCATTCTGAGTCAGTGTCTGGTTAATA GGGTTAAAAATATAAAACTGATTAAATGATGAATGAAATCGAAATTCGTTGGT Found at i:5570 original size:21 final size:21 Alignment explanation

Indices: 5546--5589 Score: 63 Period size: 21 Copynumber: 2.1 Consensus size: 21 5536 ATTATAAGAA * 5546 AAGATTAATGAAAAG-TTAATT 1 AAGATTAA-CAAAAGATTAATT 5567 AAGATTAACAAAAGATTAATT 1 AAGATTAACAAAAGATTAATT 5588 AA 1 AA 5590 ACATATATAA Statistics Matches: 21, Mismatches: 1, Indels: 2 0.88 0.04 0.08 Matches are distributed among these distances: 20 5 0.24 21 16 0.76 ACGTcount: A:0.57, C:0.02, G:0.11, T:0.30 Consensus pattern (21 bp): AAGATTAACAAAAGATTAATT Found at i:10445 original size:13 final size:13 Alignment explanation

Indices: 10427--10453 Score: 54 Period size: 13 Copynumber: 2.1 Consensus size: 13 10417 ATCAAAAGTC 10427 AGTAACCAATAAA 1 AGTAACCAATAAA 10440 AGTAACCAATAAA 1 AGTAACCAATAAA 10453 A 1 A 10454 AGAATTAAAG Statistics Matches: 14, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 13 14 1.00 ACGTcount: A:0.63, C:0.15, G:0.07, T:0.15 Consensus pattern (13 bp): AGTAACCAATAAA Found at i:32225 original size:22 final size:22 Alignment explanation

Indices: 32187--32243 Score: 62 Period size: 22 Copynumber: 2.6 Consensus size: 22 32177 ATTTAAATTC * * 32187 AATCATAATA-AAAAAATATTA 1 AATCATATTAGAAAAAATATAA * * 32208 TATCATATTAGAAAAAATGTAA 1 AATCATATTAGAAAAAATATAA * 32230 AATTATATTAGAAA 1 AATCATATTAGAAA 32244 GCACATTGCC Statistics Matches: 29, Mismatches: 6, Indels: 1 0.81 0.17 0.03 Matches are distributed among these distances: 21 8 0.28 22 21 0.72 ACGTcount: A:0.60, C:0.04, G:0.05, T:0.32 Consensus pattern (22 bp): AATCATATTAGAAAAAATATAA Found at i:33016 original size:19 final size:18 Alignment explanation

Indices: 32994--33043 Score: 64 Period size: 19 Copynumber: 2.7 Consensus size: 18 32984 ATCAAATATC 32994 TTTAAATTATGATTCAAAT 1 TTTAAATTAT-ATTCAAAT * * 33013 TTTAAATTGATCTTTAAAT 1 TTTAAATT-ATATTCAAAT 33032 TTTAAATTATAT 1 TTTAAATTATAT 33044 AAATTACATC Statistics Matches: 27, Mismatches: 3, Indels: 3 0.82 0.09 0.09 Matches are distributed among these distances: 18 3 0.11 19 22 0.81 20 2 0.07 ACGTcount: A:0.40, C:0.04, G:0.04, T:0.52 Consensus pattern (18 bp): TTTAAATTATATTCAAAT Found at i:33073 original size:31 final size:29 Alignment explanation

Indices: 33022--33087 Score: 105 Period size: 31 Copynumber: 2.2 Consensus size: 29 33012 TTTTAAATTG 33022 ATCTTTAAATTTTAAATTATATAAATTAC 1 ATCTTTAAATTTTAAATTATATAAATTAC * 33051 ATCTTTAAATTATTAAAATTATATAAATTAG 1 ATCTTTAAATT-TT-AAATTATATAAATTAC 33082 ATCTTT 1 ATCTTT 33088 TCGTTAATAA Statistics Matches: 34, Mismatches: 1, Indels: 2 0.92 0.03 0.05 Matches are distributed among these distances: 29 11 0.32 30 2 0.06 31 21 0.62 ACGTcount: A:0.44, C:0.06, G:0.02, T:0.48 Consensus pattern (29 bp): ATCTTTAAATTTTAAATTATATAAATTAC Found at i:33099 original size:31 final size:31 Alignment explanation

Indices: 33022--33101 Score: 92 Period size: 31 Copynumber: 2.6 Consensus size: 31 33012 TTTTAAATTG * 33022 ATCTTTAAATT--TTAAATTATATAAATTAC 1 ATCTTTAAATTAATAAAATTATATAAATTAC * * 33051 ATCTTTAAATTATTAAAATTATATAAATTAG 1 ATCTTTAAATTAATAAAATTATATAAATTAC *** 33082 ATCTTTTCGTTAATAAAATT 1 ATCTTTAAATTAATAAAATT 33102 TTTAATTTAA Statistics Matches: 43, Mismatches: 6, Indels: 2 0.84 0.12 0.04 Matches are distributed among these distances: 29 11 0.26 31 32 0.74 ACGTcount: A:0.44, C:0.06, G:0.03, T:0.47 Consensus pattern (31 bp): ATCTTTAAATTAATAAAATTATATAAATTAC Found at i:37699 original size:17 final size:18 Alignment explanation

Indices: 37676--37774 Score: 109 Period size: 17 Copynumber: 5.7 Consensus size: 18 37666 TCAAACTCAT 37676 TTTAAATTTATTTTAAGA 1 TTTAAATTTATTTTAAGA 37694 -TTAAATTTATTTT-AGAA 1 TTTAAATTTATTTTAAG-A * 37711 TTTAAATATATTTTAA-A 1 TTTAAATTTATTTTAAGA * 37728 TTTAAATTTAATTTAAG- 1 TTTAAATTTATTTTAAGA * 37745 TTTAAATTCATTTTCAA-A 1 TTTAAATTTATTTT-AAGA * 37763 TTTAAAATTATT 1 TTTAAATTTATT 37775 ATAAAATTAA Statistics Matches: 68, Mismatches: 7, Indels: 12 0.78 0.08 0.14 Matches are distributed among these distances: 16 2 0.03 17 41 0.60 18 24 0.35 19 1 0.01 ACGTcount: A:0.41, C:0.02, G:0.03, T:0.54 Consensus pattern (18 bp): TTTAAATTTATTTTAAGA Found at i:37723 original size:35 final size:34 Alignment explanation

Indices: 37676--37785 Score: 109 Period size: 35 Copynumber: 3.2 Consensus size: 34 37666 TCAAACTCAT * * 37676 TTTAAATTTATTTTAAGA-TTAAATTTATTTTAGAA 1 TTTAAATATATTTTAA-ATTTAAATTTAATTTA-AA * 37711 TTTAAATATATTTTAAATTTAAATTTAATTTAAG 1 TTTAAATATATTTTAAATTTAAATTTAATTTAAA * 37745 TTTAAAT-TCATTTTCAAATTTAAAATT-ATTATAAA 1 TTTAAATAT-ATTTT-AAATTTAAATTTAATT-TAAA * 37780 ATTAAA 1 TTTAAA 37786 ATAAATAAAA Statistics Matches: 65, Mismatches: 6, Indels: 8 0.82 0.08 0.10 Matches are distributed among these distances: 33 1 0.02 34 17 0.26 35 47 0.72 ACGTcount: A:0.45, C:0.02, G:0.03, T:0.51 Consensus pattern (34 bp): TTTAAATATATTTTAAATTTAAATTTAATTTAAA Found at i:37733 original size:52 final size:52 Alignment explanation

Indices: 37676--37785 Score: 143 Period size: 52 Copynumber: 2.1 Consensus size: 52 37666 TCAAACTCAT * * * 37676 TTTAAATTTATTTTAAGATTAAATTTATTTT-AGAATTT-AAATATATTTTAAA 1 TTTAAATTTAATTTAAGATTAAATTCATTTTCA-AATTTAAAAT-TATTATAAA * 37728 TTTAAATTTAATTTAAGTTTAAATTCATTTTCAAATTTAAAATTATTATAAA 1 TTTAAATTTAATTTAAGATTAAATTCATTTTCAAATTTAAAATTATTATAAA * 37780 ATTAAA 1 TTTAAA 37786 ATAAATAAAA Statistics Matches: 51, Mismatches: 5, Indels: 4 0.85 0.08 0.07 Matches are distributed among these distances: 52 46 0.90 53 5 0.10 ACGTcount: A:0.45, C:0.02, G:0.03, T:0.51 Consensus pattern (52 bp): TTTAAATTTAATTTAAGATTAAATTCATTTTCAAATTTAAAATTATTATAAA Found at i:38472 original size:12 final size:12 Alignment explanation

Indices: 38455--38521 Score: 54 Period size: 12 Copynumber: 6.0 Consensus size: 12 38445 ATTAAATAGT 38455 TATTAATAATAA 1 TATTAATAATAA 38467 TATTAATAATAA 1 TATTAATAATAA * ** 38479 -A-AAAT-ATTG 1 TATTAATAATAA * * 38488 TAATAATGATAA 1 TATTAATAATAA 38500 TATTAAT--TAA 1 TATTAATAATAA 38510 TATTAATAATAA 1 TATTAATAATAA 38522 AAAAGGTCGA Statistics Matches: 43, Mismatches: 7, Indels: 10 0.72 0.12 0.17 Matches are distributed among these distances: 9 2 0.05 10 14 0.33 11 4 0.09 12 23 0.53 ACGTcount: A:0.57, C:0.00, G:0.03, T:0.40 Consensus pattern (12 bp): TATTAATAATAA Found at i:38512 original size:10 final size:9 Alignment explanation

Indices: 38461--38520 Score: 54 Period size: 9 Copynumber: 6.9 Consensus size: 9 38451 TAGTTATTAA 38461 TAATAATAT 1 TAATAATAT 38470 TAATAATA- 1 TAATAATAT * 38478 -AAAAATAT 1 TAATAATAT * * 38486 T-GTAATAA 1 TAATAATAT * 38494 TGATAATAT 1 TAATAATAT 38503 TAATTAATAT 1 TAA-TAATAT 38513 TAATAATA 1 TAATAATA 38521 AAAAAGGTCG Statistics Matches: 40, Mismatches: 7, Indels: 8 0.73 0.13 0.15 Matches are distributed among these distances: 7 6 0.15 8 5 0.12 9 20 0.50 10 9 0.22 ACGTcount: A:0.57, C:0.00, G:0.03, T:0.40 Consensus pattern (9 bp): TAATAATAT Done.