Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: NTFQ01014820.1 Kokia drynarioides strain JFW-HI SEQ_129862, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 421648
ACGTcount: A:0.33, C:0.16, G:0.17, T:0.33

Warning! 294 characters in sequence are not A, C, G, or T


File 2 of 2

Found at i:421259 original size:21 final size:21

Alignment explanation

Indices: 421235--421343 Score: 73 Period size: 21 Copynumber: 5.3 Consensus size: 21 421225 GTATTGACTT * 421235 GGTGGTGGATGAACTTGAGTA 1 GGTGGTGGATGACCTTGAGTA * * * 421256 GGTGGCGTG-TGACCTCGAGTG 1 GGTGGTG-GATGACCTTGAGTA * * * * 421277 GGCGGTGAATG---TTGCGTT 1 GGTGGTGGATGACCTTGAGTA * 421295 GGTGGTGGATGAGCTTGAGTA 1 GGTGGTGGATGACCTTGAGTA * * * 421316 GGTGGTGTACGACCTTGAGTG 1 GGTGGTGGATGACCTTGAGTA 421337 GGTGGTG 1 GGTGGTG 421344 AGGACTGTGT Statistics Matches: 65, Mismatches: 18, Indels: 10 0.70 0.19 0.11 Matches are distributed among these distances: 18 13 0.20 21 51 0.78 22 1 0.02 ACGTcount: A:0.15, C:0.10, G:0.47, T:0.28 Consensus pattern (21 bp): GGTGGTGGATGACCTTGAGTA Found at i:421260 original size:60 final size:59 Alignment explanation

Indices: 421196--421366 Score: 184 Period size: 60 Copynumber: 2.8 Consensus size: 59 421186 GTATTGCGTT * * 421196 GGTGGTGGATGACTTTGAGTGGGCGGCGAGTATTGACTTGGTGGTGGATGAACTTGAGTA 1 GGTGGTGGATGACCTTGAGTGGGCGGTGAGTATTG-CTTGGTGGTGGATGAACTTGAGTA * * * * * 421256 GGTGGCGTG-TGACCTCGAGTGGGCGGTGAATGTTGCGTTGGTGGTGGATGAGCTTGAGTA 1 GGTGGTG-GATGACCTTGAGTGGGCGGTGAGTATTGC-TTGGTGGTGGATGAACTTGAGTA * * * * 421316 GGTGGTGTACGACCTTGAGTGGGTGGTGAGGACTGTG-TTGGTGGTGGATGA 1 GGTGGTGGATGACCTTGAGTGGGCGGTGAGTA-T-TGCTTGGTGGTGGATGA 421367 GTTTGAGTGG Statistics Matches: 91, Mismatches: 15, Indels: 10 0.78 0.13 0.09 Matches are distributed among these distances: 59 1 0.01 60 86 0.95 61 2 0.02 62 2 0.02 ACGTcount: A:0.15, C:0.09, G:0.46, T:0.29 Consensus pattern (59 bp): GGTGGTGGATGACCTTGAGTGGGCGGTGAGTATTGCTTGGTGGTGGATGAACTTGAGTA Found at i:421396 original size:39 final size:39 Alignment explanation

Indices: 421329--421413 Score: 107 Period size: 39 Copynumber: 2.2 Consensus size: 39 421319 GGTGTACGAC * ** * 421329 CTTGAGTGGGTGGTGAGGACTGTGTTGGTGGTGGATGAG 1 CTTGAGTGGGAGGTGAGGACTGCCTTGGTGGAGGATGAG * * * 421368 TTTGAGTGGGAGGTGAGTATTGCCTTGGTGGAGGATGAG 1 CTTGAGTGGGAGGTGAGGACTGCCTTGGTGGAGGATGAG 421407 CTTGAGT 1 CTTGAGT 421414 AGGTGGTTCA Statistics Matches: 38, Mismatches: 8, Indels: 0 0.83 0.17 0.00 Matches are distributed among these distances: 39 38 1.00 ACGTcount: A:0.15, C:0.06, G:0.47, T:0.32 Consensus pattern (39 bp): CTTGAGTGGGAGGTGAGGACTGCCTTGGTGGAGGATGAG Found at i:421436 original size:99 final size:99 Alignment explanation

Indices: 421272--421520 Score: 286 Period size: 99 Copynumber: 2.5 Consensus size: 99 421262 GTGTGACCTC * * * * * * 421272 GAGTGGGCGGTGAATGTTGCGTTGGTGGTGGATGAGCTTGAGTAGGTGGTGTACGACCTTGAGTG 1 GAGTGGGAGGTGAGTATTGCCTTGGTGGTGGATGAGCTTGAGTAGGTGGTGTACAAACTTGAGTG * ** 421337 GGTGGTGAG-GACTGTGTTGGTGGTGGATGAGTTT 66 GGTGGCGAGTG-CTGCATTGGTGGTGGATGAGTTT * * 421371 GAGTGGGAGGTGAGTATTGCCTTGGTGGAGGATGAGCTTGAGTAGGTGGT-TCACAAACTTTAGT 1 GAGTGGGAGGTGAGTATTGCCTTGGTGGTGGATGAGCTTGAGTAGGTGGTGT-ACAAACTTGAGT * * * 421435 GGGTGGCGTGTGTTGCATTGGTGGTGGATGTGTTT 65 GGGTGGCGAGTGCTGCATTGGTGGTGGATGAGTTT * * * * * * 421470 GAATGGGTGGCGAGTATTGCCTTGGTGGTGAATGTGTTTGAGTAGGTGGTG 1 GAGTGGGAGGTGAGTATTGCCTTGGTGGTGGATGAGCTTGAGTAGGTGGTG 421521 GATGTGTTTG Statistics Matches: 126, Mismatches: 21, Indels: 5 0.83 0.14 0.03 Matches are distributed among these distances: 98 1 0.01 99 124 0.98 100 1 0.01 ACGTcount: A:0.15, C:0.07, G:0.45, T:0.33 Consensus pattern (99 bp): GAGTGGGAGGTGAGTATTGCCTTGGTGGTGGATGAGCTTGAGTAGGTGGTGTACAAACTTGAGTG GGTGGCGAGTGCTGCATTGGTGGTGGATGAGTTT Found at i:421477 original size:39 final size:39 Alignment explanation

Indices: 421432--421648 Score: 211 Period size: 39 Copynumber: 5.5 Consensus size: 39 421422 CACAAACTTT * * 421432 AGTGGGTGGCGTGTGTTGCATTGGTGGTGGATGTGTTTG 1 AGTGGGTGGCGGGTATTGCATTGGTGGTGGATGTGTTTG * * * * 421471 AATGGGTGGCGAGTATTGCCTTGGTGGTGAATGTGTTTG 1 AGTGGGTGGCGGGTATTGCATTGGTGGTGGATGTGTTTG * * * * * * 421510 AGTAGGTGGTGGATGTGTTTG-AGTGGGTGGTGGATGAGCTTG 1 AGTGGGTGGCGG--GT-ATTGCA-TTGGTGGTGGATGTGTTTG * * * 421552 TGTGGGTGGCGGGTATTGCGTTGGTGGAGGATGTGTTTG 1 AGTGGGTGGCGGGTATTGCATTGGTGGTGGATGTGTTTG * * * * * 421591 AATGGGTGGCGGGTATAGCCTTGGTGGTGGATGAGCTTG 1 AGTGGGTGGCGGGTATTGCATTGGTGGTGGATGTGTTTG 421630 AGTGGGTGGCGGGTATTGC 1 AGTGGGTGGCGGGTATTGC Statistics Matches: 140, Mismatches: 33, Indels: 10 0.77 0.18 0.05 Matches are distributed among these distances: 39 109 0.78 40 2 0.01 41 2 0.01 42 27 0.19 ACGTcount: A:0.12, C:0.06, G:0.48, T:0.34 Consensus pattern (39 bp): AGTGGGTGGCGGGTATTGCATTGGTGGTGGATGTGTTTG Found at i:421478 original size:21 final size:21 Alignment explanation

Indices: 421454--421599 Score: 97 Period size: 21 Copynumber: 7.2 Consensus size: 21 421444 GTGTTGCATT * 421454 GGTGGTGGATGTGTTTGAATG 1 GGTGGTGGATGTGTTTGAGTG * * ** * 421475 GGTGG-CGA-GT-ATTGCCTT 1 GGTGGTGGATGTGTTTGAGTG * * 421493 GGTGGTGAATGTGTTTGAGTA 1 GGTGGTGGATGTGTTTGAGTG 421514 GGTGGTGGATGTGTTTGAGTG 1 GGTGGTGGATGTGTTTGAGTG * * * 421535 GGTGGTGGATGAGCTTGTGTG 1 GGTGGTGGATGTGTTTGAGTG * * * * 421556 GGTGGCGG--GT-ATTGCGTT 1 GGTGGTGGATGTGTTTGAGTG * * 421574 GGTGGAGGATGTGTTTGAATG 1 GGTGGTGGATGTGTTTGAGTG 421595 GGTGG 1 GGTGG 421600 CGGGTATAGC Statistics Matches: 93, Mismatches: 26, Indels: 12 0.71 0.20 0.09 Matches are distributed among these distances: 18 21 0.23 19 4 0.04 20 6 0.06 21 62 0.67 ACGTcount: A:0.12, C:0.04, G:0.49, T:0.35 Consensus pattern (21 bp): GGTGGTGGATGTGTTTGAGTG Found at i:421518 original size:60 final size:58 Alignment explanation

Indices: 421454--421638 Score: 167 Period size: 60 Copynumber: 3.1 Consensus size: 58 421444 GTGTTGCATT * 421454 GGTGGTGGATGTGTTTGAATGGGTGGCGAGTATTGCCTTGGTGGTGAATGTGTTTGAGTA 1 GGTGGTGGATGTGTTTGAATGGGTGGCG-GTATTGCCTTGGTGGTG-ATGAGTTTGAGTA * * * ** * * * 421514 GGTGGTGGATGTGTTTGAGTGGGTGGTGG-A-TGAGCTTGTGTGGGTGGCGGGTATTGCGTT 1 GGTGGTGGATGTGTTTGAATGGGTGGCGGTATTG-CCTTG-GT-GGTGATGAGT-TTGAGTA * * * * 421574 GGTGGAGGATGTGTTTGAATGGGTGGCGGGTATAGCCTTGGTGGTGGATGAGCTTGAGTG 1 GGTGGTGGATGTGTTTGAATGGGTGGC-GGTATTGCCTTGGTGGT-GATGAGTTTGAGTA 421634 GGTGG 1 GGTGG 421639 CGGGTATTGC Statistics Matches: 98, Mismatches: 19, Indels: 16 0.74 0.14 0.12 Matches are distributed among these distances: 57 2 0.02 58 5 0.05 59 6 0.06 60 72 0.73 61 7 0.07 62 5 0.05 63 1 0.01 ACGTcount: A:0.12, C:0.05, G:0.49, T:0.34 Consensus pattern (58 bp): GGTGGTGGATGTGTTTGAATGGGTGGCGGTATTGCCTTGGTGGTGATGAGTTTGAGTA Found at i:421518 original size:120 final size:120 Alignment explanation

Indices: 421394--421638 Score: 303 Period size: 120 Copynumber: 2.0 Consensus size: 120 421384 GTATTGCCTT * * * 421394 GGTGGAGGATGAGCTTGAGTAGGTGGTTCACAAACTT-TAGTGGGTGGCGTGTGTTGCATTGGTG 1 GGTGGAGGATGAGCTTGAGTAGGTGGTGCACAAACTTGT-GTGGGTGGCGGGTATTGCATTGGTG * * * * 421458 GTGGATGTGTTTGAATGGGTGGCGAGTATTGCCTTGGTGGTGAATGTGTTTGAGTA 65 GAGGATGTGTTTGAATGGGTGGCGAGTATAGCCTTGGTGGTGAATGAGCTTGAGTA * * * * * ** * * 421514 GGTGGTGGATGTGTTTGAGTGGGTGGTGGATGAGCTTGTGTGGGTGGCGGGTATTGCGTTGGTGG 1 GGTGGAGGATGAGCTTGAGTAGGTGGTGCACAAACTTGTGTGGGTGGCGGGTATTGCATTGGTGG * * * 421579 AGGATGTGTTTGAATGGGTGGCGGGTATAGCCTTGGTGGTGGATGAGCTTGAGTG 66 AGGATGTGTTTGAATGGGTGGCGAGTATAGCCTTGGTGGTGAATGAGCTTGAGTA 421634 GGTGG 1 GGTGG 421639 CGGGTATTGC Statistics Matches: 105, Mismatches: 19, Indels: 2 0.83 0.15 0.02 Matches are distributed among these distances: 120 104 0.99 121 1 0.01 ACGTcount: A:0.14, C:0.07, G:0.47, T:0.33 Consensus pattern (120 bp): GGTGGAGGATGAGCTTGAGTAGGTGGTGCACAAACTTGTGTGGGTGGCGGGTATTGCATTGGTGG AGGATGTGTTTGAATGGGTGGCGAGTATAGCCTTGGTGGTGAATGAGCTTGAGTA Done.