Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: NTFQ01004987.1 Kokia drynarioides strain JFW-HI SEQ_118737, whole genome shotgun sequence
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 34514
ACGTcount: A:0.32, C:0.16, G:0.17, T:0.35
Warning! 1 characters in sequence are not A, C, G, or T
Found at i:4144 original size:10 final size:9
Alignment explanation
Indices: 4124--4148 Score: 50
Period size: 9 Copynumber: 2.8 Consensus size: 9
4114 CAAGGAGTGC
4124 AAAATAAAA
1 AAAATAAAA
4133 AAAATAAAA
1 AAAATAAAA
4142 AAAATAA
1 AAAATAA
4149 TTTGTTATAA
Statistics
Matches: 16, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
9 16 1.00
ACGTcount: A:0.88, C:0.00, G:0.00, T:0.12
Consensus pattern (9 bp):
AAAATAAAA
Found at i:24009 original size:38 final size:37
Alignment explanation
Indices: 23936--24022 Score: 104
Period size: 38 Copynumber: 2.3 Consensus size: 37
23926 AGTGATTGTA
* *
23936 TGGTGTTTATTAGGCTTAGTGCCTAAAAGGATATGTG
1 TGGTGTTTATCAGACTTAGTGCCTAAAAGGATATGTG
* *
23973 CTGGTGTTTATCAGACTTAGTGCCTAGCAA-GCTATGTG
1 -TGGTGTTTATCAGACTTAGTGCCTA-AAAGGATATGTG
24011 TCGGTGTTTATC
1 T-GGTGTTTATC
24023 GGGCTCAGTG
Statistics
Matches: 43, Mismatches: 4, Indels: 4
0.84 0.08 0.08
Matches are distributed among these distances:
37 1 0.02
38 40 0.93
39 2 0.05
ACGTcount: A:0.21, C:0.14, G:0.28, T:0.38
Consensus pattern (37 bp):
TGGTGTTTATCAGACTTAGTGCCTAAAAGGATATGTG
Found at i:24618 original size:43 final size:43
Alignment explanation
Indices: 24566--24967 Score: 486
Period size: 43 Copynumber: 9.3 Consensus size: 43
24556 TTGTGAGGAA
* * * *
24566 AAACGCCGCTAAATAATATGGTCTATAGCGACGCTTTTACCAC
1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTACCAC
* * * *
24609 AAATGCCGCTAAAGAGCATGGTCTTTAGCAGCGC-TTTCCACAC
1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTAC-CAC
*
24652 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTCTACCAC
1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTACCAC
* *
24695 AAACGCCGCTAAAAAACATGGTCTTTAGCGGCGCTTCTACCAC
1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTACCAC
* * *
24738 AAACGCCGTTAAAAAACATGGTCTTTAGCGGCGCATTTACCAC
1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTACCAC
*
24781 AAACGCCGCTAAAGAACAAGGTCTTTAGCGGCGC-TTTACCCAC
1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTA-CCAC
** * *
24824 AAACGCCGCTAAAGAACATGGTCTTTAGCAACACTTTTNCCAC
1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTACCAC
* * * * *
24867 AAACGCCACTAAAGAACATGATCTTTAGTGGCACTTTTACCCAT
1 AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTA-CCAC
* * ** *
24911 AAACGCCGCTATAGATA-ATGTTCTTTAGCGGCATTTTTTCCAC
1 AAACGCCGCTAAAGA-ACATGGTCTTTAGCGGCGCTTTTACCAC
24954 AAACGCCGCTAAAG
1 AAACGCCGCTAAAG
24968 TTAGCAGATT
Statistics
Matches: 313, Mismatches: 40, Indels: 12
0.86 0.11 0.03
Matches are distributed among these distances:
42 8 0.03
43 264 0.84
44 40 0.13
45 1 0.00
ACGTcount: A:0.31, C:0.27, G:0.18, T:0.24
Consensus pattern (43 bp):
AAACGCCGCTAAAGAACATGGTCTTTAGCGGCGCTTTTACCAC
Found at i:30963 original size:26 final size:24
Alignment explanation
Indices: 30934--31071 Score: 112
Period size: 26 Copynumber: 5.7 Consensus size: 24
30924 TATAATTAAA
30934 TAATTAAATATTTTTAATTAAATATT
1 TAATTAAATA--TTTAATTAAATATT
*
30960 TAATTAAACA--TAATTAAATAATT
1 TAATTAAATATTTAATTAAAT-ATT
* *
30983 AAATATAATTATTTAATTAAATATTT
1 TAAT-TAAATATTTAATTAAATA-TT
31009 TAAATTAAATATTTAATTAAATA--
1 T-AATTAAATATTTAATTAAATATT
31032 TAATT-AA-A--TAATTAAATCATT
1 TAATTAAATATTTAATTAAAT-ATT
31053 TAAATTAAATATTTTAATT
1 T-AATTAAATA-TTTAATT
31072 GAAGAGAGTT
Statistics
Matches: 91, Mismatches: 6, Indels: 29
0.72 0.05 0.23
Matches are distributed among these distances:
18 9 0.10
19 1 0.01
20 1 0.01
21 3 0.03
22 17 0.19
23 9 0.10
24 5 0.05
25 1 0.01
26 37 0.41
27 8 0.09
ACGTcount: A:0.51, C:0.01, G:0.00, T:0.47
Consensus pattern (24 bp):
TAATTAAATATTTAATTAAATATT
Found at i:30988 original size:44 final size:47
Alignment explanation
Indices: 30925--31041 Score: 141
Period size: 44 Copynumber: 2.4 Consensus size: 47
30915 GGTGTTTTTT
30925 ATAATTAAATAATTAAATATT-TTTAATTAAATA-TTT-AATTAAAC
1 ATAATTAAATAATTAAATATTATTTAATTAAATATTTTAAATTAAAC
*
30969 ATAATTAAATAATTAAATATAATTATTTAATTAAATATTTTAAATTAAAT
1 ATAATTAAATAATT-AA-AT-ATTATTTAATTAAATATTTTAAATTAAAC
31019 ATTTAATTAAATATAATTAAATA
1 A--TAATT-AA-ATAATTAAATA
31042 ATTAAATCAT
Statistics
Matches: 62, Mismatches: 1, Indels: 13
0.82 0.01 0.17
Matches are distributed among these distances:
44 14 0.23
45 2 0.03
46 2 0.03
47 3 0.05
48 12 0.19
49 3 0.05
50 8 0.13
51 1 0.02
52 7 0.11
53 4 0.06
54 6 0.10
ACGTcount: A:0.54, C:0.01, G:0.00, T:0.45
Consensus pattern (47 bp):
ATAATTAAATAATTAAATATTATTTAATTAAATATTTTAAATTAAAC
Found at i:30990 original size:62 final size:62
Alignment explanation
Indices: 30924--31048 Score: 214
Period size: 62 Copynumber: 2.0 Consensus size: 62
30914 GGGTGTTTTT
*
30924 TATAATTAAATAATTAAATATTTTTAATTAAATATTTAATTAAACATAATTAAATAATTAAA
1 TATAATTAAATAATTAAATATTTTAAATTAAATATTTAATTAAACATAATTAAATAATTAAA
** *
30986 TATAATTATTTAATTAAATATTTTAAATTAAATATTTAATTAAATATAATTAAATAATTAAA
1 TATAATTAAATAATTAAATATTTTAAATTAAATATTTAATTAAACATAATTAAATAATTAAA
31048 T
1 T
31049 CATTTAAATT
Statistics
Matches: 59, Mismatches: 4, Indels: 0
0.94 0.06 0.00
Matches are distributed among these distances:
62 59 1.00
ACGTcount: A:0.54, C:0.01, G:0.00, T:0.46
Consensus pattern (62 bp):
TATAATTAAATAATTAAATATTTTAAATTAAATATTTAATTAAACATAATTAAATAATTAAA
Found at i:31016 original size:18 final size:19
Alignment explanation
Indices: 30959--31060 Score: 79
Period size: 18 Copynumber: 5.2 Consensus size: 19
30949 AATTAAATAT
*
30959 TTAATTAAACATAATTAAA
1 TTAATTAAATATAATTAAA
*
30978 -TAATTAAATATAATT-AT
1 TTAATTAAATATAATTAAA
30995 TTAATTAAATATTTTAAATTAAATA
1 TTAATTAAATA---T-AATT-AA-A
31020 TTTAATTAAATATAATTAAA
1 -TTAATTAAATATAATTAAA
31040 -TAATTAAATCAT--TTAAA
1 TTAATTAAAT-ATAATTAAA
31057 TTAA
1 TTAA
31061 ATATTTTAAT
Statistics
Matches: 69, Mismatches: 3, Indels: 23
0.73 0.03 0.24
Matches are distributed among these distances:
17 6 0.09
18 36 0.52
19 2 0.03
20 1 0.01
21 3 0.04
22 8 0.12
23 1 0.01
24 1 0.01
26 11 0.16
ACGTcount: A:0.54, C:0.02, G:0.00, T:0.44
Consensus pattern (19 bp):
TTAATTAAATATAATTAAA
Found at i:31044 original size:44 final size:45
Alignment explanation
Indices: 30978--31071 Score: 147
Period size: 44 Copynumber: 2.1 Consensus size: 45
30968 CATAATTAAA
**
30978 TAATTAAATATAATTATTTAATTAAAT-ATTTTAAATTAAATA-TT
1 TAATTAAATATAATTAAATAATTAAATCA-TTTAAATTAAATATTT
31022 TAATTAAATATAATTAAATAATTAAATCATTTAAATTAAATATTT
1 TAATTAAATATAATTAAATAATTAAATCATTTAAATTAAATATTT
31067 TAATT
1 TAATT
31072 GAAGAGAGTT
Statistics
Matches: 46, Mismatches: 2, Indels: 3
0.90 0.04 0.06
Matches are distributed among these distances:
44 38 0.83
45 8 0.17
ACGTcount: A:0.51, C:0.01, G:0.00, T:0.48
Consensus pattern (45 bp):
TAATTAAATATAATTAAATAATTAAATCATTTAAATTAAATATTT
Found at i:31058 original size:22 final size:21
Alignment explanation
Indices: 30922--31063 Score: 101
Period size: 22 Copynumber: 6.6 Consensus size: 21
30912 TTGGGTGTTT
30922 TTTATAATTAAATAATTAAATA
1 TTTA-AATTAAATAATTAAATA
* * *
30944 TTTTTAATTAAATATTTAATTA
1 -TTTAAATTAAATAATTAAATA
***
30966 AACATAATTAAATAATTAAATA
1 TTTA-AATTAAATAATTAAATA
**
30988 --T-AATTATTTAATTAAATA
1 TTTAAATTAAATAATTAAATA
* *
31006 TTTTAAATTAAATATTTAATTA
1 -TTTAAATTAAATAATTAAATA
**
31028 AATATAATTAAATAATTAAATCA
1 TTTA-AATTAAATAATTAAAT-A
31051 TTTAAATTAAATA
1 TTTAAATTAAATA
31064 TTTTAATTGA
Statistics
Matches: 90, Mismatches: 22, Indels: 15
0.71 0.17 0.12
Matches are distributed among these distances:
18 15 0.17
21 3 0.03
22 66 0.73
23 6 0.07
ACGTcount: A:0.53, C:0.01, G:0.00, T:0.46
Consensus pattern (21 bp):
TTTAAATTAAATAATTAAATA
Found at i:33609 original size:23 final size:23
Alignment explanation
Indices: 33577--33630 Score: 99
Period size: 23 Copynumber: 2.3 Consensus size: 23
33567 TAGCGCAAAT
*
33577 CAGTAGGCACACGAAGTGCGAAA
1 CAGTAAGCACACGAAGTGCGAAA
33600 CAGTAAGCACACGAAGTGCGAAA
1 CAGTAAGCACACGAAGTGCGAAA
33623 CAGTAAGC
1 CAGTAAGC
33631 GCGCTAGCGT
Statistics
Matches: 30, Mismatches: 1, Indels: 0
0.97 0.03 0.00
Matches are distributed among these distances:
23 30 1.00
ACGTcount: A:0.41, C:0.22, G:0.28, T:0.09
Consensus pattern (23 bp):
CAGTAAGCACACGAAGTGCGAAA
Done.