Tandem Repeats Finder Program written by: Gary Benson Program in Bioinformatics Boston University Version 4.09 Sequence: NTFQ01004987.1 Kokia drynarioides strain JFW-HI SEQ_118737, whole genome shotgun sequence Parameters: 2 7 7 80 10 50 1000 Pmatch=0.80,Pindel=0.10 tuple sizes 0,4,5,7 tuple distances 0, 29, 159, 1000 Length: 34514 ACGTcount: A:0.32, C:0.16, G:0.17, T:0.35 Warning! 1 characters in sequence are not A, C, G, or T Found at i:4144 original size:10 final size:9 Alignment explanation
Indices: 4124--4148 Score: 50 Period size: 9 Copynumber: 2.8 Consensus size: 9 4114 CAAGGAGTGC 4124 AAAATAAAA 1 AAAATAAAA 4133 AAAATAAAA 1 AAAATAAAA 4142 AAAATAA 1 AAAATAA 4149 TTTGTTATAA Statistics Matches: 16, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 9 16 1.00 ACGTcount: A:0.88, C:0.00, G:0.00, T:0.12 Consensus pattern (9 bp): AAAATAAAA Found at i:24009 original size:38 final size:37 Alignment explanation
Indices: 23936--24022 Score: 104 Period size: 38 Copynumber: 2.3 Consensus size: 37 23926 AGTGATTGTA * * 23936 TGGTGTTTATTAGGCTTAGTGCCTAAAAGGATATGTG 1 TGGTGTTTATCAGACTTAGTGCCTAAAAGGATATGTG * * 23973 CTGGTGTTTATCAGACTTAGTGCCTAGCAA-GCTATGTG 1 -TGGTGTTTATCAGACTTAGTGCCTA-AAAGGATATGTG 24011 TCGGTGTTTATC 1 T-GGTGTTTATC 24023 GGGCTCAGTG Statistics Matches: 43, Mismatches: 4, Indels: 4 0.84 0.08 0.08 Matches are distributed among these distances: 37 1 0.02 38 40 0.93 39 2 0.05 ACGTcount: A:0.21, C:0.14, G:0.28, T:0.38 Consensus pattern (37 bp): TGGTGTTTATCAGACTTAGTGCCTAAAAGGATATGTG Found at i:24618 original size:43 final size:43 Alignment explanation
Indices: 24566--24967 Score: 486 Period size: 43 Copynumber: 9.3 Consensus size: 43 24556 TTGTGAGGAA * * * * 24566 AAACGCCGCTAAATAATATGGTCTATAGCGACGCTTTTACCAC 1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTACCAC * * * * 24609 AAATGCCGCTAAAGAGCATGGTCTTTAGCAGCGC-TTTCCACAC 1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTAC-CAC * 24652 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTCTACCAC 1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTACCAC * * 24695 AAACGCCGCTAAAAAACATGGTCTTTAGCGGCGCTTCTACCAC 1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTACCAC * * * 24738 AAACGCCGTTAAAAAACATGGTCTTTAGCGGCGCATTTACCAC 1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTACCAC * 24781 AAACGCCGCTAAAGAACAAGGTCTTTAGCGGCGC-TTTACCCAC 1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTA-CCAC ** * * 24824 AAACGCCGCTAAAGAACATGGTCTTTAGCAACACTTTTNCCAC 1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTACCAC * * * * * 24867 AAACGCCACTAAAGAACATGATCTTTAGTGGCACTTTTACCCAT 1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTA-CCAC * * ** * 24911 AAACGCCGCTATAGATA-ATGTTCTTTAGCGGCATTTTTTCCAC 1 AAACGCCGCTAAAGA-ACATGGTCTTTAGCGGCGCTTTTACCAC 24954 AAACGCCGCTAAAG 1 AAACGCCGCTAAAG 24968 TTAGCAGATT Statistics Matches: 313, Mismatches: 40, Indels: 12 0.86 0.11 0.03 Matches are distributed among these distances: 42 8 0.03 43 264 0.84 44 40 0.13 45 1 0.00 ACGTcount: A:0.31, C:0.27, G:0.18, T:0.24 Consensus pattern (43 bp): AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTACCAC Found at i:30963 original size:26 final size:24 Alignment explanation
Indices: 30934--31071 Score: 112 Period size: 26 Copynumber: 5.7 Consensus size: 24 30924 TATAATTAAA 30934 TAATTAAATATTTTTAATTAAATATT 1 TAATTAAATA--TTTAATTAAATATT * 30960 TAATTAAACA--TAATTAAATAATT 1 TAATTAAATATTTAATTAAAT-ATT * * 30983 AAATATAATTATTTAATTAAATATTT 1 TAAT-TAAATATTTAATTAAATA-TT 31009 TAAATTAAATATTTAATTAAATA-- 1 T-AATTAAATATTTAATTAAATATT 31032 TAATT-AA-A--TAATTAAATCATT 1 TAATTAAATATTTAATTAAAT-ATT 31053 TAAATTAAATATTTTAATT 1 T-AATTAAATA-TTTAATT 31072 GAAGAGAGTT Statistics Matches: 91, Mismatches: 6, Indels: 29 0.72 0.05 0.23 Matches are distributed among these distances: 18 9 0.10 19 1 0.01 20 1 0.01 21 3 0.03 22 17 0.19 23 9 0.10 24 5 0.05 25 1 0.01 26 37 0.41 27 8 0.09 ACGTcount: A:0.51, C:0.01, G:0.00, T:0.47 Consensus pattern (24 bp): TAATTAAATATTTAATTAAATATT Found at i:30988 original size:44 final size:47 Alignment explanation
Indices: 30925--31041 Score: 141 Period size: 44 Copynumber: 2.4 Consensus size: 47 30915 GGTGTTTTTT 30925 ATAATTAAATAATTAAATATT-TTTAATTAAATA-TTT-AATTAAAC 1 ATAATTAAATAATTAAATATTATTTAATTAAATATTTTAAATTAAAC * 30969 ATAATTAAATAATTAAATATAATTATTTAATTAAATATTTTAAATTAAAT 1 ATAATTAAATAATT-AA-AT-ATTATTTAATTAAATATTTTAAATTAAAC 31019 ATTTAATTAAATATAATTAAATA 1 A--TAATT-AA-ATAATTAAATA 31042 ATTAAATCAT Statistics Matches: 62, Mismatches: 1, Indels: 13 0.82 0.01 0.17 Matches are distributed among these distances: 44 14 0.23 45 2 0.03 46 2 0.03 47 3 0.05 48 12 0.19 49 3 0.05 50 8 0.13 51 1 0.02 52 7 0.11 53 4 0.06 54 6 0.10 ACGTcount: A:0.54, C:0.01, G:0.00, T:0.45 Consensus pattern (47 bp): ATAATTAAATAATTAAATATTATTTAATTAAATATTTTAAATTAAAC Found at i:30990 original size:62 final size:62 Alignment explanation
Indices: 30924--31048 Score: 214 Period size: 62 Copynumber: 2.0 Consensus size: 62 30914 GGGTGTTTTT * 30924 TATAATTAAATAATTAAATATTTTTAATTAAATATTTAATTAAACATAATTAAATAATTAAA 1 TATAATTAAATAATTAAATATTTTAAATTAAATATTTAATTAAACATAATTAAATAATTAAA ** * 30986 TATAATTATTTAATTAAATATTTTAAATTAAATATTTAATTAAATATAATTAAATAATTAAA 1 TATAATTAAATAATTAAATATTTTAAATTAAATATTTAATTAAACATAATTAAATAATTAAA 31048 T 1 T 31049 CATTTAAATT Statistics Matches: 59, Mismatches: 4, Indels: 0 0.94 0.06 0.00 Matches are distributed among these distances: 62 59 1.00 ACGTcount: A:0.54, C:0.01, G:0.00, T:0.46 Consensus pattern (62 bp): TATAATTAAATAATTAAATATTTTAAATTAAATATTTAATTAAACATAATTAAATAATTAAA Found at i:31016 original size:18 final size:19 Alignment explanation
Indices: 30959--31060 Score: 79 Period size: 18 Copynumber: 5.2 Consensus size: 19 30949 AATTAAATAT * 30959 TTAATTAAACATAATTAAA 1 TTAATTAAATATAATTAAA * 30978 -TAATTAAATATAATT-AT 1 TTAATTAAATATAATTAAA 30995 TTAATTAAATATTTTAAATTAAATA 1 TTAATTAAATA---T-AATT-AA-A 31020 TTTAATTAAATATAATTAAA 1 -TTAATTAAATATAATTAAA 31040 -TAATTAAATCAT--TTAAA 1 TTAATTAAAT-ATAATTAAA 31057 TTAA 1 TTAA 31061 ATATTTTAAT Statistics Matches: 69, Mismatches: 3, Indels: 23 0.73 0.03 0.24 Matches are distributed among these distances: 17 6 0.09 18 36 0.52 19 2 0.03 20 1 0.01 21 3 0.04 22 8 0.12 23 1 0.01 24 1 0.01 26 11 0.16 ACGTcount: A:0.54, C:0.02, G:0.00, T:0.44 Consensus pattern (19 bp): TTAATTAAATATAATTAAA Found at i:31044 original size:44 final size:45 Alignment explanation
Indices: 30978--31071 Score: 147 Period size: 44 Copynumber: 2.1 Consensus size: 45 30968 CATAATTAAA ** 30978 TAATTAAATATAATTATTTAATTAAAT-ATTTTAAATTAAATA-TT 1 TAATTAAATATAATTAAATAATTAAATCA-TTTAAATTAAATATTT 31022 TAATTAAATATAATTAAATAATTAAATCATTTAAATTAAATATTT 1 TAATTAAATATAATTAAATAATTAAATCATTTAAATTAAATATTT 31067 TAATT 1 TAATT 31072 GAAGAGAGTT Statistics Matches: 46, Mismatches: 2, Indels: 3 0.90 0.04 0.06 Matches are distributed among these distances: 44 38 0.83 45 8 0.17 ACGTcount: A:0.51, C:0.01, G:0.00, T:0.48 Consensus pattern (45 bp): TAATTAAATATAATTAAATAATTAAATCATTTAAATTAAATATTT Found at i:31058 original size:22 final size:21 Alignment explanation
Indices: 30922--31063 Score: 101 Period size: 22 Copynumber: 6.6 Consensus size: 21 30912 TTGGGTGTTT 30922 TTTATAATTAAATAATTAAATA 1 TTTA-AATTAAATAATTAAATA * * * 30944 TTTTTAATTAAATATTTAATTA 1 -TTTAAATTAAATAATTAAATA *** 30966 AACATAATTAAATAATTAAATA 1 TTTA-AATTAAATAATTAAATA ** 30988 --T-AATTATTTAATTAAATA 1 TTTAAATTAAATAATTAAATA * * 31006 TTTTAAATTAAATATTTAATTA 1 -TTTAAATTAAATAATTAAATA ** 31028 AATATAATTAAATAATTAAATCA 1 TTTA-AATTAAATAATTAAAT-A 31051 TTTAAATTAAATA 1 TTTAAATTAAATA 31064 TTTTAATTGA Statistics Matches: 90, Mismatches: 22, Indels: 15 0.71 0.17 0.12 Matches are distributed among these distances: 18 15 0.17 21 3 0.03 22 66 0.73 23 6 0.07 ACGTcount: A:0.53, C:0.01, G:0.00, T:0.46 Consensus pattern (21 bp): TTTAAATTAAATAATTAAATA Found at i:33609 original size:23 final size:23 Alignment explanation
Indices: 33577--33630 Score: 99 Period size: 23 Copynumber: 2.3 Consensus size: 23 33567 TAGCGCAAAT * 33577 CAGTAGGCACACGAAGTGCGAAA 1 CAGTAAGCACACGAAGTGCGAAA 33600 CAGTAAGCACACGAAGTGCGAAA 1 CAGTAAGCACACGAAGTGCGAAA 33623 CAGTAAGC 1 CAGTAAGC 33631 GCGCTAGCGT Statistics Matches: 30, Mismatches: 1, Indels: 0 0.97 0.03 0.00 Matches are distributed among these distances: 23 30 1.00 ACGTcount: A:0.41, C:0.22, G:0.28, T:0.09 Consensus pattern (23 bp): CAGTAAGCACACGAAGTGCGAAA Done.