Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: scaffold_864 ID=scaffold_864-JGI_221_v2.0
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 3153
ACGTcount: A:0.20, C:0.29, G:0.28, T:0.17
Warning! 198 characters in sequence are not A, C, G, or T
Found at i:620 original size:43 final size:42
Alignment explanation
Indices: 548--1504 Score: 766
Period size: 43 Copynumber: 22.5 Consensus size: 42
538 CTCTTCTTTA
* *
548 TCCCGCAC-ATCCCAGGGACCAAGGTGCCGATGGGTGCCCGAGGC
1 TCCCGCACGA-CCAAGGG-CCAAGTTGCCGAT-GGTGCCCGAGGC
** * *
592 TCCCGCAC-ATCCAAGCACCAAGTTGCCGATTGTGTCCGAGGC
1 TCCCGCACGA-CCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC
* ** * * *
634 TCCCGCAC-ATCCTAGCCACCGAGGTGCCGATGCTGCCCGAGGC
1 TCCCGCACGA-CCAAG-GGCCAAGTTGCCGATGGTGCCCGAGGC
* ** * *
677 TCCCGCAC-ATCCGAGCCACCAAGGTGCCGATGGTGGCCGAGGC
1 TCCCGCACGA-CCAAG-GGCCAAGTTGCCGATGGTGCCCGAGGC
* * * *
720 TCCCGCACGACCAATGGCCGAGGTGCCGATGGTGGCCGAGGC
1 TCCCGCACGACCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC
* ** *
762 CCCCGCACGACCAAGGGCCTATTTTACCGATGGTGCCCGAGGC
1 TCCCGCACGACCAAGGGCC-AAGTTGCCGATGGTGCCCGAGGC
** *
805 TCCCGCACGACCAAGGGCTTAGTTTGCCGATGGTGCCCGAGCC
1 TCCCGCACGACCAAGGGCCAAG-TTGCCGATGGTGCCCGAGGC
* * *
848 TCTCGCACGACCAAGGGCCTAGGTTGCCGATGGTGCCCGAGGT
1 TCCCGCACGACCAAGGGCC-AAGTTGCCGATGGTGCCCGAGGC
** * * *
891 TCCCGCAC-ATCCAAGCACCAAGGTGTCGATGGTGCTCGAGGC
1 TCCCGCACGA-CCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC
* ** *
933 TCCCGCACGACCAAGGGCCTAGGTTGCCGACAGTGTCCGAGGC
1 TCCCGCACGACCAAGGGCC-AAGTTGCCGATGGTGCCCGAGGC
* *
976 TCCCGCACGACCAAGGGCCTAGTTTGCCGATGGTGTCCGAGGC
1 TCCCGCACGACCAAGGGCCAAG-TTGCCGATGGTGCCCGAGGC
* ** * ** * *
1019 TCCCGCAC-ATCCCAGCACCTAGGGGCCGATGGCGGCCGAGGC
1 TCCCGCACGA-CCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC
* * * *
1061 ACCCGCACGACCAAGGGCCTATTTTCTCGATGGTGCCCGAGGC
1 TCCCGCACGACCAAGGGCCAAGTTGC-CGATGGTGCCCGAGGC
** *
1104 TCCCGCACGACCAAGGGCTTAGTTTGCCGATGGTGCCCGAGCC
1 TCCCGCACGACCAAGGGCCAAG-TTGCCGATGGTGCCCGAGGC
* * *
1147 TCTCGCACGACCAAGGGCCTAGGTTGCCGATGGTGCCCGAGGT
1 TCCCGCACGACCAAGGGCC-AAGTTGCCGATGGTGCCCGAGGC
** * *
1190 TCCCGCAC-ATCCAAGCACCAAGGTGCCGATGGTGCTCGAGGC
1 TCCCGCACGA-CCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC
* ** *
1232 TCCCGCACGACCAAGGGCCTAGGTTGCCGACAGTGTCCGAGGC
1 TCCCGCACGACCAAGGGCC-AAGTTGCCGATGGTGCCCGAGGC
* ** * * *
1275 TCCCGCAC-ATCATAGCACCGAGGTGCTGATGGTGCCCGAGGC
1 TCCCGCACGACCA-AGGGCCAAGTTGCCGATGGTGCCCGAGGC
*
1317 TCCCGCACGACCAAGGGCCTAGGTTGCCGATGGTGCCCGAGGC
1 TCCCGCACGACCAAGGGCC-AAGTTGCCGATGGTGCCCGAGGC
* ** * * *
1360 TCCCGCAC-ATCGAAGCACCGAGGTGCCGATGGCGCCCGAGGC
1 TCCCGCACGA-CCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC
** * * ** * *
1402 TCCTTCATGGCCAAGGGCTTAGTTTGCCGATGGTGTCCGGGGC
1 TCCCGCACGACCAAGGGCCAAG-TTGCCGATGGTGCCCGAGGC
* * **
1445 TCCTGCAC-ATCCTAGCACCAAG-TGCCGATGGTGCCCGAGGC
1 TCCCGCACGA-CCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC
*
1486 TCCCGCACGACCAATGGCC
1 TCCCGCACGACCAAGGGCC
1505 TATGCTACCG
Statistics
Matches: 730, Mismatches: 158, Indels: 53
0.78 0.17 0.06
Matches are distributed among these distances:
41 29 0.04
42 232 0.32
43 449 0.62
44 20 0.03
ACGTcount: A:0.18, C:0.35, G:0.31, T:0.16
Consensus pattern (42 bp):
TCCCGCACGACCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC
Found at i:745 original size:85 final size:84
Alignment explanation
Indices: 569--1506 Score: 929
Period size: 85 Copynumber: 11.0 Consensus size: 84
559 CCAGGGACCA
* * *
569 AGGTGCCGATGGGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGTTGCCGATTGTGTCCGAGGC
1 AGGTGCCGAT-GGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCCCGAGGC
* ** *
634 TCCCGCAC-ATCCTAGCCACCG
65 TCCCGCACGA-CCAAG-GGCCT
* * *
655 AGGTGCCGATGCTGCCCGAGGCTCCCGCACATCCGAGCCACCAAGGTGCCGATGGTGGCCGAGGC
1 AGGTGCCGATGGTGCCCGAGGCTCCCGCACATCCAAG-CACCAAGGTGCCGATGGTGCCCGAGGC
* *
720 TCCCGCACGACCAATGGCCG
65 TCCCGCACGACCAAGGGCCT
* * ** *** *
740 AGGTGCCGATGGTGGCCGAGGCCCCCGCACGA-CCAAGGGCCTATTTTACCGATGGTGCCCGAGG
1 AGGTGCCGATGGTGCCCGAGGCTCCCGCAC-ATCCAAGCACC-AAGGTGCCGATGGTGCCCGAGG
*
804 CTCCCGCACGACCAAGGGCTT
64 CTCCCGCACGACCAAGGGCCT
* * * ** *
825 AGTTTGCCGATGGTGCCCGAGCCTCTCGCACGA-CCAAGGGCCTAGGTTGCCGATGGTGCCCGAG
1 AG-GTGCCGATGGTGCCCGAGGCTCCCGCAC-ATCCAAGCACCAAGG-TGCCGATGGTGCCCGAG
* ** *
889 GTTCCCGCAC-ATCCAAGCACCA
63 GCTCCCGCACGA-CCAAGGGCCT
* * ** * ** *
911 AGGTGTCGATGGTGCTCGAGGCTCCCGCACGA-CCAAGGGCCTAGGTTGCCGACAGTGTCCGAGG
1 AGGTGCCGATGGTGCCCGAGGCTCCCGCAC-ATCCAAGCACCAAGG-TGCCGATGGTGCCCGAGG
975 CTCCCGCACGACCAAGGGCCT
64 CTCCCGCACGACCAAGGGCCT
* * * * * * *
996 AGTTTGCCGATGGTGTCCGAGGCTCCCGCACATCCCAGCACCTAGGGGCCGATGGCGGCCGAGGC
1 AG-GTGCCGATGGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCCCGAGGC
*
1061 ACCCGCACGACCAAGGGCCT
65 TCCCGCACGACCAAGGGCCT
** * ** ** *
1081 ATTTTCTCGATGGTGCCCGAGGCTCCCGCACGA-CCAAGGGCTTAGTTTGCCGATGGTGCCCGAG
1 AGGTGC-CGATGGTGCCCGAGGCTCCCGCAC-ATCCAAGCACCAAG-GTGCCGATGGTGCCCGAG
* *
1145 CCTCTCGCACGACCAAGGGCCT
63 GCTCCCGCACGACCAAGGGCCT
* *
1167 AGGTTGCCGATGGTGCCCGAGGTTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCTCGAGGC
1 AGG-TGCCGATGGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCCCGAGGC
1232 TCCCGCACGACCAAGGGCCT
65 TCCCGCACGACCAAGGGCCT
** * * *
1252 AGGTTGCCGACAGTGTCCGAGGCTCCCGCACAT-CATAGCACCGAGGTGCTGATGGTGCCCGAGG
1 AGG-TGCCGATGGTGCCCGAGGCTCCCGCACATCCA-AGCACCAAGGTGCCGATGGTGCCCGAGG
1316 CTCCCGCACGACCAAGGGCCT
64 CTCCCGCACGACCAAGGGCCT
* * *
1337 AGGTTGCCGATGGTGCCCGAGGCTCCCGCACATCGAAGCACCGAGGTGCCGATGGCGCCCGAGGC
1 AGG-TGCCGATGGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCCCGAGGC
** * * *
1402 TCCTTCATGGCCAAGGGCTT
65 TCCCGCACGACCAAGGGCCT
* * * * *
1422 AGTTTGCCGATGGTGTCCGGGGCTCCTGCACATCCTAGCACCAA-GTGCCGATGGTGCCCGAGGC
1 AG-GTGCCGATGGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCCCGAGGC
*
1486 TCCCGCACGACCAATGGCCT
65 TCCCGCACGACCAAGGGCCT
1506 A
1 A
1507 TGCTACCGGA
Statistics
Matches: 713, Mismatches: 121, Indels: 38
0.82 0.14 0.04
Matches are distributed among these distances:
84 41 0.06
85 454 0.64
86 215 0.30
87 3 0.00
ACGTcount: A:0.18, C:0.35, G:0.31, T:0.16
Consensus pattern (84 bp):
AGGTGCCGATGGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCCCGAGGCT
CCCGCACGACCAAGGGCCT
Found at i:792 original size:128 final size:126
Alignment explanation
Indices: 569--1506 Score: 843
Period size: 128 Copynumber: 7.3 Consensus size: 126
559 CCAGGGACCA
** * * * *
569 AGGTGCCGATGGGTGCCCGAGGCTCCCGCAC-ATCCAAGCACCAAGTTGCCGATTGTGTCCGAGG
1 AGGTGCCGAT-GGTGCCCGAGGCTCCCGCACGA-CCAAGGGCCTAGGTGCCGATGGTGCCCGAGG
* * * * **
633 CTCCCGCACATCCTAGCCACCGA-GGTGCCGATGCTGCCCGAGGCTCCCGCAC-ATCCGAGCCAC
64 CTCCCGCACA-CCAAG-CACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGA-CCAAG-GGC
*
696 CA
125 CT
* * * * *
698 AGGTGCCGATGGTGGCCGAGGCTCCCGCACGACCAATGGCCGAGGTGCCGATGGTGGCCGAGGCC
1 AGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTAGGTGCCGATGGTGCCCGAGGCT
** *** * *
763 CCCGCACGACCAAGGGCCTATTTTACCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCTT
66 CCCGCAC-ACCAAGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCT
* * *
825 AGTTTGCCGATGGTGCCCGAGCCTCTCGCACGACCAAGGGCCTAGGTTGCCGATGGTGCCCGAGG
1 AG-GTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTAGG-TGCCGATGGTGCCCGAGG
* * * *
890 TTCCCGCACATCCAAGCACC-AAGGTGTCGATGGTGCTCGAGGCTCCCGCACGACCAAGGGCCT
64 CTCCCGCACA-CCAAGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCT
** * * *
953 AGGTTGCCGACAGTGTCCGAGGCTCCCGCACGACCAAGGGCCTAGTTTGCCGATGGTGTCCGAGG
1 AGG-TGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTAG-GTGCCGATGGTGCCCGAGG
* * * *
1018 CTCCCGCACATCCCAGCACCTAGGG-GCCGATGGCGGCCGAGGCACCCGCACGACCAAGGGCCT
64 CTCCCGCACA-CCAAGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCT
** * * * *
1081 ATTTTCTCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCTTAGTTTGCCGATGGTGCCCGAGC
1 AGGTGC-CGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTAG-GTGCCGATGGTGCCCGAGG
* ** * * ** *
1146 CTCTCGCACGACCAAGGGCCTAGGTTGCCGATGGTGCCCGAGGTTCCCGCAC-ATCCAAGCACCA
64 CTCCCGCAC-ACCAAGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGA-CCAAGGGCCT
* ** *
1210 AGGTGCCGATGGTGCTCGAGGCTCCCGCACGACCAAGGGCCTAGGTTGCCGACAGTGTCCGAGGC
1 AGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTAGG-TGCCGATGGTGCCCGAGGC
* * *
1275 TCCCGCACATCATAGCACCGA-GGTGCTGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCT
65 TCCCGCACACCA-AGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCT
* ** * *
1337 AGGTTGCCGATGGTGCCCGAGGCTCCCGCAC-ATCGAAGCACCGAGGTGCCGATGGCGCCCGAGG
1 AGG-TGCCGATGGTGCCCGAGGCTCCCGCACGA-CCAAGGGCCTAGGTGCCGATGGTGCCCGAGG
** ** ** * ** * * * * **
1401 CTCCTTCATGGCCAAGGGCTTAGTTTGCCGATGGTGTCCGGGGCTCCTGCAC-ATCCTAGCACC-
64 CTCCCGCA-CACCAAGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGA-CCAAGGGCCT
* *
1464 AAGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAATGGCCTA
1 AGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTA
1507 TGCTACCGGA
Statistics
Matches: 655, Mismatches: 131, Indels: 49
0.78 0.16 0.06
Matches are distributed among these distances:
126 33 0.05
127 76 0.12
128 466 0.71
129 80 0.12
ACGTcount: A:0.18, C:0.35, G:0.31, T:0.16
Consensus pattern (126 bp):
AGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTAGGTGCCGATGGTGCCCGAGGCT
CCCGCACACCAAGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCT
Found at i:1573 original size:25 final size:25
Alignment explanation
Indices: 1512--1589 Score: 122
Period size: 25 Copynumber: 3.2 Consensus size: 25
1502 GCCTATGCTA
* *
1512 CCGGAACGGTTCGCCGGAGCACCGC
1 CCGGGACGGATCGCCGGAGCACCGC
1537 CC-GGACGGATCGCCGGAGCACCGC
1 CCGGGACGGATCGCCGGAGCACCGC
*
1561 CCGGGACGGATCGTCGGAGCACCGC
1 CCGGGACGGATCGCCGGAGCACCGC
1586 CCGG
1 CCGG
1590 AACCTAACTC
Statistics
Matches: 49, Mismatches: 3, Indels: 2
0.91 0.06 0.04
Matches are distributed among these distances:
24 22 0.45
25 27 0.55
ACGTcount: A:0.15, C:0.40, G:0.38, T:0.06
Consensus pattern (25 bp):
CCGGGACGGATCGCCGGAGCACCGC
Found at i:2056 original size:42 final size:41
Alignment explanation
Indices: 1855--2140 Score: 177
Period size: 42 Copynumber: 6.7 Consensus size: 41
1845 NNNNNNNNNN
*
1855 GCTCCCGCACATCCAAGCACCAAGGTACCGATGGTG-CTCGAG
1 GCTCCCGCACATCC-AGCACCAAGGTGCCGATGGTGTC-CGAG
** * **
1897 GCTCCCCGCACGA-CCAAGGGCCTAGGTTGCCGACAGTGTCCGAG
1 GCT-CCCGCAC-ATCC-AGCACCAAGG-TGCCGATGGTGTCCGAG
* * * * *
1941 ATCTCCCGTACATCATAGCACCCGAGGTGCCGATGGTCTCCGAG
1 -GCTCCCGCACATC-CAGCA-CCAAGGTGCCGATGGTGTCCGAG
* * * ** * *
1985 GCTTCC-CACAACCAAGGGCA-TAATTTGCCGATCGTGTCCGAT
1 GCTCCCGCACATCC-A--GCACCAAGGTGCCGATGGTGTCCGAG
2027 GCTCCCGCACATCCATGCACCAAGGTGCCGATGGTG-CTCGAG
1 GCTCCCGCACATCCA-GCACCAAGGTGCCGATGGTGTC-CGAG
* * *
2069 GCTCCCGCACATCCAAGCATCAAGGTTACCGATGGTGTCTGAG
1 GCTCCCGCACATCC-AGCACCAAGG-TGCCGATGGTGTCCGAG
*
2112 GCTCCCACACATCCGAGCCACCAAGGTGC
1 GCTCCCGCACATCC-AG-CACCAAGGTGC
2141 TGGAGGCTCT
Statistics
Matches: 184, Mismatches: 42, Indels: 35
0.70 0.16 0.13
Matches are distributed among these distances:
41 4 0.02
42 66 0.36
43 59 0.32
44 47 0.26
45 8 0.04
ACGTcount: A:0.22, C:0.35, G:0.26, T:0.17
Consensus pattern (41 bp):
GCTCCCGCACATCCAGCACCAAGGTGCCGATGGTGTCCGAG
Done.