Tandem Repeats Finder Program written by: Gary Benson Program in Bioinformatics Boston University Version 4.09 Sequence: NTFQ01005913.1 Kokia drynarioides strain JFW-HI SEQ_120278, whole genome shotgun sequence Parameters: 2 7 7 80 10 50 1000 Pmatch=0.80,Pindel=0.10 tuple sizes 0,4,5,7 tuple distances 0, 29, 159, 921 Length: 1535 ACGTcount: A:0.22, C:0.33, G:0.22, T:0.24 Warning! 1 characters in sequence are not A, C, G, or T Found at i:418 original size:230 final size:231 Alignment explanation
Indices: 4--990 Score: 1326 Period size: 230 Copynumber: 4.3 Consensus size: 231 1 GTT ** * 4 CGATGCTCCTACACATCGAAGGCACCATGGTACCGATACTTCC-CGATGGTCCCGCTCCACCATC 1 CGATGCTCCCGCACATCGAAGGCACCATGGTACCGATACTTCCTCGATGGTCCCGCACCACCATC * * 68 GGCCTTAGCTGCCAATACGATGGTGTCCGATGCTTCCCGATGGTCCCGCACCACCATCGGCCTAA 66 GGCCTTAGCTACCAATACGATGGTGTCCGATGCTTCCCGATGGTCCCGCACCACCATCAGCCTAA *** * * * * * 133 GTTGTTGATGGTCTCCGATGCTCTCGCACATCTAAGGCACTAACGTGCCGATGGATCACGATTGT 131 GTTACCGATGGTGTCCGATGCTCTCGCACATCCAAGGCACCAAGGTGCCGATGGATCCCGATTGT * * 198 CTCGCACCACCATTAGCCTAAGCTGCCGAAGGTGTC 196 CCCGCACCACCATTAGCCTAAGCTGCCGATGGTGTC * * ** * 234 CGATGCTCCCGCACATCGAAAGCTCCATGGTGTCGATACTTCCTC-ATGGTCCCGCACTACCATC 1 CGATGCTCCCGCACATCGAAGGCACCATGGTACCGATACTTCCTCGATGGTCCCGCACCACCATC * * * * 298 GGCCTTAGCTGCCATTACGATGGTGTCCGATGCTTCCCGATTGTCCCACACCACCATCAGCCTAA 66 GGCCTTAGCTACCAATACGATGGTGTCCGATGCTTCCCGATGGTCCCGCACCACCATCAGCCTAA * * * * * * 363 GTTACCGATGGTATACGATGCTCTCGCACATCCAAGGTACCAAGGTGCTGATGGATCCCAATTAT 131 GTTACCGATGGTGTCCGATGCTCTCGCACATCCAAGGCACCAAGGTGCCGATGGATCCCGATTGT * * * 428 CCCACACCACCATAAACCTAAGCTGCCGATGGTGTC 196 CCCGCACCACCATTAGCCTAAGCTGCCGATGGTGTC * 464 CGATGCTCCCGCACATCGAAGGCACCATGGTACCGATACTT-TTCGATGGTCCC-CTACCACCAT 1 CGATGCTCCCGCACATCGAAGGCACCATGGTACCGATACTTCCTCGATGGTCCCGC-ACCACCAT * * * 527 CGGCCTTAGCTACCAATACGATGGTGTCTGATGCTTCCCAATGGTCCCGCACCACCATTAGCCTA 65 CGGCCTTAGCTACCAATACGATGGTGTCCGATGCTTCCCGATGGTCCCGCACCACCATCAGCCTA * * 592 AGTTGCCGATGGTGTCCGATGCTCTCGCACATCCAAGGCACCAATGTGCCGATGGATCCCGATTG 130 AGTTACCGATGGTGTCCGATGCTCTCGCACATCCAAGGCACCAAGGTGCCGATGGATCCCGATTG * * 657 TCCCGCACCACCATCAGCCTAAGCTGCTGATGGTGTC 195 TCCCGCACCACCATTAGCCTAAGCTGCCGATGGTGTC * * * * 694 CGATGCTCTCACACATCGAAGGCACCATGGTGCCGATACTT-CTCGATGGTCCCGCACCACCAAC 1 CGATGCTCCCGCACATCGAAGGCACCATGGTACCGATACTTCCTCGATGGTCCCGCACCACCATC * * * 758 GGCCATAGCTACCAATACGATGGTGTCCGATGCTTCCTGATGGTCCCGCACCACCATCAG-C-NA 66 GGCCTTAGCTACCAATACGATGGTGTCCGATGCTTCCCGATGGTCCCGCACCACCATCAGCCTAA * * * * * 821 GTTACCGATGGTGTCCGATGCTCTCGCACATTCAAGGTACCAAGGTACTGATGGATCCTGATTGT 131 GTTACCGATGGTGTCCGATGCTCTCGCACATCCAAGGCACCAAGGTGCCGATGGATCCCGATTGT * * * * * 886 CCCGTACCATCATT-GACCTAAGCTACTGATGGTGTT 196 CCCGCACCACCATTAG-CCTAAGCTGCCGATGGTGTC * * * * 922 CGATGCTCCCGCACATCGAAGGCACCATGGTTCCGATAGTTCAT-GATGGTCTCGCACCACCATC 1 CGATGCTCCCGCACATCGAAGGCACCATGGTACCGATACTTCCTCGATGGTCCCGCACCACCATC * 986 AGCCT 66 GGCCT 991 CAGTTACCGA Statistics Matches: 664, Mismatches: 87, Indels: 14 0.87 0.11 0.02 Matches are distributed among these distances: 227 1 0.00 228 146 0.22 229 5 0.01 230 510 0.77 231 2 0.00 ACGTcount: A:0.22, C:0.33, G:0.22, T:0.23 Consensus pattern (231 bp): CGATGCTCCCGCACATCGAAGGCACCATGGTACCGATACTTCCTCGATGGTCCCGCACCACCATC GGCCTTAGCTACCAATACGATGGTGTCCGATGCTTCCCGATGGTCCCGCACCACCATCAGCCTAA GTTACCGATGGTGTCCGATGCTCTCGCACATCCAAGGCACCAAGGTGCCGATGGATCCCGATTGT CCCGCACCACCATTAGCCTAAGCTGCCGATGGTGTC Found at i:643 original size:43 final size:43 Alignment explanation
Indices: 595--730 Score: 106 Period size: 43 Copynumber: 3.2 Consensus size: 43 585 TAGCCTAAGT 595 TGCCGATGGTGTCCGATGCTCTCGCACATCCAAGGCACCAATG 1 TGCCGATGGTGTCCGATGCTCTCGCACATCCAAGGCACCAATG * * * 638 TGCCGATGGAT-CCCGATTG-TCCCGCACCA-CCATCA-GC-CTAA-G 1 TGCCGATGG-TGTCCGA-TGCTCTCGCA-CATCCA--AGGCACCAATG * * * 680 CTGCTGATGGTGTCCGATGCTCTCACACATCGAAGGCACC-ATGG 1 -TGCCGATGGTGTCCGATGCTCTCGCACATCCAAGGCACCAAT-G 724 TGCCGAT 1 TGCCGAT 731 ACTTCTCGAT Statistics Matches: 70, Mismatches: 10, Indels: 26 0.66 0.09 0.25 Matches are distributed among these distances: 41 1 0.01 42 9 0.13 43 51 0.73 44 8 0.11 45 1 0.01 ACGTcount: A:0.21, C:0.33, G:0.25, T:0.21 Consensus pattern (43 bp): TGCCGATGGTGTCCGATGCTCTCGCACATCCAAGGCACCAATG Found at i:670 original size:144 final size:144 Alignment explanation
Indices: 418--681 Score: 343 Period size: 144 Copynumber: 1.8 Consensus size: 144 408 TGCTGATGGA * * 418 TCCCAATTATCCCACACCACCATAAACCTAAGCTGCCGATGGTGTCCGATGCTCCCGCACATCGA 1 TCCCAATGATCCCACACCACCATAAACCTAAGCTGCCGATGGTGTCCGATGCTCCCGCACATCCA * ** * * 483 AGGCACCATGGTACCGATACTTTTCGATGGTCCCCTACCACCATCGGCCTTAGCTACCAATACGA 66 AGGCACCATGGTACCGATACATCCCGATGGTCCCCTACCACCATCAGCCTAAGCTACCAATACGA 548 TGGTGTCTGATGCT 131 TGGTGTCTGATGCT * * * * * * 562 TCCCAATGGTCCCGCACCACCATTAGCCTAAGTTGCCGATGGTGTCCGATGCTCTCGCACATCCA 1 TCCCAATGATCCCACACCACCATAAACCTAAGCTGCCGATGGTGTCCGATGCTCCCGCACATCCA * ** * 627 AGGCACCAAT-GTGCCGATGGATCCCGATTGTCCCGC-ACCACCATCAGCCTAAGCT 66 AGGCACC-ATGGTACCGATACATCCCGATGGTCCC-CTACCACCATCAGCCTAAGCT 682 GCTGATGGTG Statistics Matches: 101, Mismatches: 17, Indels: 4 0.83 0.14 0.03 Matches are distributed among these distances: 144 98 0.97 145 3 0.03 ACGTcount: A:0.23, C:0.35, G:0.20, T:0.22 Consensus pattern (144 bp): TCCCAATGATCCCACACCACCATAAACCTAAGCTGCCGATGGTGTCCGATGCTCCCGCACATCCA AGGCACCATGGTACCGATACATCCCGATGGTCCCCTACCACCATCAGCCTAAGCTACCAATACGA TGGTGTCTGATGCT Found at i:676 original size:86 final size:86 Alignment explanation
Indices: 562--755 Score: 273 Period size: 86 Copynumber: 2.3 Consensus size: 86 552 GTCTGATGCT * * * * 562 TCCCAATGGTCCCGCACCACCATTAGCCTAAGTTGCCGATGGTGTCCGATGCTCTCGCACATCCA 1 TCCCGATGGTCCCGCACCACCATCAGCCTAAGCTGCCGATGGTGTCCGATGCTCTCACACATCCA ** 627 AGGCACCAAT-GTGCCGATGGA 66 AGGCACC-ATGGTGCCGATACA * * * 648 TCCCGATTGTCCCGCACCACCATCAGCCTAAGCTGCTGATGGTGTCCGATGCTCTCACACATCGA 1 TCCCGATGGTCCCGCACCACCATCAGCCTAAGCTGCCGATGGTGTCCGATGCTCTCACACATCCA * 713 AGGCACCATGGTGCCGATACT 66 AGGCACCATGGTGCCGATACA * 734 TCTCGATGGTCCCGCACCACCA 1 TCCCGATGGTCCCGCACCACCA 756 ACGGCCATAG Statistics Matches: 95, Mismatches: 12, Indels: 2 0.87 0.11 0.02 Matches are distributed among these distances: 85 2 0.02 86 93 0.98 ACGTcount: A:0.21, C:0.36, G:0.22, T:0.21 Consensus pattern (86 bp): TCCCGATGGTCCCGCACCACCATCAGCCTAAGCTGCCGATGGTGTCCGATGCTCTCACACATCCA AGGCACCATGGTGCCGATACA Found at i:1003 original size:86 final size:86 Alignment explanation
Indices: 777--1498 Score: 636 Period size: 86 Copynumber: 8.5 Consensus size: 86 767 TACCAATACG * * 777 ATGGTGTCCGAT-GCTTCCTGATGGTCCCGCACCACCATCAG-C-NAGTTACCGATGGTGTCCGA 1 ATGGT-TCCGATAG-TTCCCGATGGTCCCGCACCACCATCAGCCTAAGTTACCGATGGTGTCCGA * * 839 TGCTCTCGCACATTC-AAGGTACC 64 TGCTCCCGCACA-TCGAAGGCACC * * * * * * * * * * * * * 862 AAGGTACTGATGGATCCTGATTGTCCCGTACCATCAT-TGACCTAAGCTACTGATGGTGTTCGAT 1 ATGGTTCCGATAGTTCCCGATGGTCCCGCACCACCATCAG-CCTAAGTTACCGATGGTGTCCGAT 926 GCTCCCGCACATCGAAGGCACC 65 GCTCCCGCACATCGAAGGCACC ** * * 948 ATGGTTCCGATAGTTCATGATGGTCTCGCACCACCATCAGCCTCAGTTACCGATGGTGTCCGATG 1 ATGGTTCCGATAGTTCCCGATGGTCCCGCACCACCATCAGCCTAAGTTACCGATGGTGTCCGATG * 1013 CTCCTGCACATCGAAGGCACC 66 CTCCCGCACATCGAAGGCACC * * * * * * * 1034 AAGGTACCGAT-GCTTCCCAATGGTTCTGCGCCACCATCGGCCTCAA-TTACCGATGGTGTCCGA 1 ATGGTTCCGATAG-TTCCCGATGGTCCCGCACCACCATCAGCCT-AAGTTACCGATGGTGTCCGA * 1097 TGCTCCCACACATCGAAGGCACC 64 TGCTCCCGCACATCGAAGGCACC * * * * * 1120 ATGGTACCGATACTTCCCGATGGTCCCGCACCACCATTAGCCTTAGTTACCGATGGTGTCCAATG 1 ATGGTTCCGATAGTTCCCGATGGTCCCGCACCACCATCAGCCTAAGTTACCGATGGTGTCCGATG 1185 CTCCCGCACATCGAAGGCACC 66 CTCCCGCACATCGAAGGCACC * * * * * 1206 AT-GTTGCCGATACTTCCCGATGGTCCGGCACCACCATTAGCCGT-AGTTACCGATGGTATCTGA 1 ATGGTT-CCGATAGTTCCCGATGGTCCCGCACCACCATCAGCC-TAAGTTACCGATGGTGTCCGA * ** * * 1269 TCCTCTTGCACATCAAAGGTACC 64 TGCTCCCGCACATCGAAGGCACC * ** 1292 ATGGTGT-CGATACTTCCCGATGGTCCCGCACCACCATTGGCCTAAGTTACCGATGGTGTCCGAT 1 ATGGT-TCCGATAGTTCCCGATGGTCCCGCACCACCATCAGCCTAAGTTACCGATGGTGTCCGAT * * * 1356 GCTCTCGCAAATCCAAGG---C 65 GCTCCCGCACATCGAAGGCACC * * * * * * * * 1375 A----T-CGATAGATCACGATTGTCCTGCACCACCATC-GACCTAAGCTACCTATAGTGTCTGAT 1 ATGGTTCCGATAGTTCCCGATGGTCCCGCACCACCATCAG-CCTAAGTTACCGATGGTGTCCGAT * * 1434 GCTCCCGTACATCGAAGGTACC 65 GCTCCCGCACATCGAAGGCACC * * * * 1456 ATGGTACCGATACTTCCTGATGGTCCCGCACCACCATCGGCCT 1 ATGGTTCCGATAGTTCCCGATGGTCCCGCACCACCATCAGCCT 1499 TAGCTACCAA Statistics Matches: 519, Mismatches: 93, Indels: 49 0.79 0.14 0.07 Matches are distributed among these distances: 77 1 0.00 78 60 0.12 81 2 0.00 83 3 0.01 84 24 0.05 85 13 0.03 86 409 0.79 87 6 0.01 88 1 0.00 ACGTcount: A:0.22, C:0.32, G:0.22, T:0.24 Consensus pattern (86 bp): ATGGTTCCGATAGTTCCCGATGGTCCCGCACCACCATCAGCCTAAGTTACCGATGGTGTCCGATG CTCCCGCACATCGAAGGCACC Found at i:1043 original size:43 final size:43 Alignment explanation
Indices: 995--1130 Score: 109 Period size: 43 Copynumber: 3.2 Consensus size: 43 985 CAGCCTCAGT 995 TACCGATGGTGTCCGATGCTCCTGCACATCGAAGGCACCAAGG 1 TACCGATGGTGTCCGATGCTCCTGCACATCGAAGGCACCAAGG * * * * * * * * 1038 TACCGATGCT-TCCCAATGGTTCTGCGCCA-CCATCGGC-CTCAA-T 1 TACCGATGGTGT-CCGATGCTCCTGC-ACATCGA-AGGCAC-CAAGG ** * 1081 TACCGATGGTGTCCGATGCTCCCACACATCGAAGGCACCATGG 1 TACCGATGGTGTCCGATGCTCCTGCACATCGAAGGCACCAAGG 1124 TACCGAT 1 TACCGAT 1131 ACTTCCCGAT Statistics Matches: 66, Mismatches: 19, Indels: 16 0.65 0.19 0.16 Matches are distributed among these distances: 42 8 0.12 43 49 0.74 44 9 0.14 ACGTcount: A:0.22, C:0.33, G:0.24, T:0.21 Consensus pattern (43 bp): TACCGATGGTGTCCGATGCTCCTGCACATCGAAGGCACCAAGG Found at i:1171 original size:43 final size:42 Alignment explanation
Indices: 1124--1259 Score: 109 Period size: 43 Copynumber: 3.2 Consensus size: 42 1114 GGCACCATGG 1124 TACCGATACTTCCCGATGGTCCCGCACCACCATTAGCCTTAGT 1 TACCGATACTTCCCGATGGTCCCGCACCACCATTAGCC-TAGT ** * * * * 1167 TACCGATGGTGT-CCAATGCTCCCGCA-CATCGA--AGGCACCATGT 1 TACCGATACT-TCCCGATGGTCCCGCACCA-CCATTA-GC-CTA-GT * * 1210 TGCCGATACTTCCCGATGGTCCGGCACCACCATTAGCCGTAGT 1 TACCGATACTTCCCGATGGTCCCGCACCACCATTAGCC-TAGT 1253 TACCGAT 1 TACCGAT 1260 GGTATCTGAT Statistics Matches: 68, Mismatches: 15, Indels: 20 0.66 0.15 0.19 Matches are distributed among these distances: 41 1 0.01 42 6 0.09 43 54 0.79 44 6 0.09 45 1 0.01 ACGTcount: A:0.21, C:0.35, G:0.21, T:0.24 Consensus pattern (42 bp): TACCGATACTTCCCGATGGTCCCGCACCACCATTAGCCTAGT Found at i:1281 original size:258 final size:258 Alignment explanation
Indices: 797--1498 Score: 718 Period size: 258 Copynumber: 2.8 Consensus size: 258 787 ATGCTTCCTG * * * * * 797 ATGGTCCCGCACCACCATCAG-C-NAGTTACCGATGGTGTCCGATGCTCTCGCACATTCAAGGTA 1 ATGGTCCCGCACCACCATCGGCCTAAGTTACCGATGGTGTCCGATGCTCCCACACATTCAAGGCA * ** * * * * * * * 860 CCAAGGTACTGATGGATCCTGATTGTCCCGTACCATCATTGACCTAAGCTACTGATGGTGTTCGA 66 CCAAGGTACCGATACATCCCGATGGTCCCGCACCACCATTGACCTAAGCTACCGATGGTGTCCAA * * 925 TGCTCCCGCACATCGAAGGCACCATGGTTCCGATAGTTCATGATGGTCTCGCACCACCATCAGCC 131 TGCTCCCGCACATCGAAGGCACCATGGTTCCGATACTTCACGATGGTCTCGCACCACCATCAGCC * * * * 990 TCAGTTACCGATGGTGTCCGATGCTCCTGCACATCGAAGGCACCAAGGTACCGATGCTTCCCA 196 TCAGTTACCGATGGTATCCGATCCTCCTGCACATCAAAGGCACCAAGGTACCGATACTTCCCA * * * 1053 ATGGTTCTGCGCCACCATCGGCCTCAA-TTACCGATGGTGTCCGATGCTCCCACACA-TCGAAGG 1 ATGGTCCCGCACCACCATCGGCCT-AAGTTACCGATGGTGTCCGATGCTCCCACACATTC-AAGG * * * * 1116 CACCATGGTACCGATACTTCCCGATGGTCCCGCACCACCATT-AGCCTTAGTTACCGATGGTGTC 64 CACCAAGGTACCGATACATCCCGATGGTCCCGCACCACCATTGA-CCTAAGCTACCGATGGTGTC * 1180 CAATGCTCCCGCACATCGAAGGCACCAT-GTTGCCGATACTTCCCGATGGTC-CGGCACCACCAT 128 CAATGCTCCCGCACATCGAAGGCACCATGGTT-CCGATACTTCACGATGGTCTC-GCACCACCAT * * * * * ** 1243 TAGCCGT-AGTTACCGATGGTATCTGATCCTCTTGCACATCAAAGGTACCATGGTGTCGATACTT 191 CAGCC-TCAGTTACCGATGGTATCCGATCCTCCTGCACATCAAAGGCACCAAGGTACCGATACTT * 1307 CCCG 255 CCCA * * * * * 1311 ATGGTCCCGCACCACCATTGGCCTAAGTTACCGATGGTGTCCGATGCTCTCGCAAATCCAAGG-- 1 ATGGTCCCGCACCACCATCGGCCTAAGTTACCGATGGTGTCCGATGCTCCCACACATTCAAGGCA * * * * * * * ** 1374 -C-A--T--CGATAGATCACGATTGTCCTGCACCACCATCGACCTAAGCTACCTATAGTGTCTGA 66 CCAAGGTACCGATACATCCCGATGGTCCCGCACCACCATTGACCTAAGCTACCGATGGTGTCCAA * * * * * 1433 TGCTCCCGTACATCGAAGGTACCATGGTACCGATACTTC-CTGATGGTCCCGCACCACCATCGGC 131 TGCTCCCGCACATCGAAGGCACCATGGTTCCGATACTTCAC-GATGGTCTCGCACCACCATCAGC 1497 CT 195 CT 1499 TAGCTACCAA Statistics Matches: 369, Mismatches: 63, Indels: 35 0.79 0.13 0.07 Matches are distributed among these distances: 249 2 0.01 250 95 0.26 251 4 0.01 252 1 0.00 255 1 0.00 256 17 0.05 257 10 0.03 258 236 0.64 259 3 0.01 ACGTcount: A:0.22, C:0.32, G:0.22, T:0.24 Consensus pattern (258 bp): ATGGTCCCGCACCACCATCGGCCTAAGTTACCGATGGTGTCCGATGCTCCCACACATTCAAGGCA CCAAGGTACCGATACATCCCGATGGTCCCGCACCACCATTGACCTAAGCTACCGATGGTGTCCAA TGCTCCCGCACATCGAAGGCACCATGGTTCCGATACTTCACGATGGTCTCGCACCACCATCAGCC TCAGTTACCGATGGTATCCGATCCTCCTGCACATCAAAGGCACCAAGGTACCGATACTTCCCA Done.