Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: scaffold_864 ID=scaffold_864-JGI_221_v2.0

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 3153
ACGTcount: A:0.20, C:0.29, G:0.28, T:0.17

Warning! 198 characters in sequence are not A, C, G, or T


Found at i:620 original size:43 final size:42

Alignment explanation

Indices: 548--1504 Score: 766 Period size: 43 Copynumber: 22.5 Consensus size: 42 538 CTCTTCTTTA * * 548 TCCCGCAC-ATCCCAGGGACCAAGGTGCCGATGGGTGCCCGAGGC 1 TCCCGCACGA-CCAAGGG-CCAAGTTGCCGAT-GGTGCCCGAGGC ** * * 592 TCCCGCAC-ATCCAAGCACCAAGTTGCCGATTGTGTCCGAGGC 1 TCCCGCACGA-CCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC * ** * * * 634 TCCCGCAC-ATCCTAGCCACCGAGGTGCCGATGCTGCCCGAGGC 1 TCCCGCACGA-CCAAG-GGCCAAGTTGCCGATGGTGCCCGAGGC * ** * * 677 TCCCGCAC-ATCCGAGCCACCAAGGTGCCGATGGTGGCCGAGGC 1 TCCCGCACGA-CCAAG-GGCCAAGTTGCCGATGGTGCCCGAGGC * * * * 720 TCCCGCACGACCAATGGCCGAGGTGCCGATGGTGGCCGAGGC 1 TCCCGCACGACCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC * ** * 762 CCCCGCACGACCAAGGGCCTATTTTACCGATGGTGCCCGAGGC 1 TCCCGCACGACCAAGGGCC-AAGTTGCCGATGGTGCCCGAGGC ** * 805 TCCCGCACGACCAAGGGCTTAGTTTGCCGATGGTGCCCGAGCC 1 TCCCGCACGACCAAGGGCCAAG-TTGCCGATGGTGCCCGAGGC * * * 848 TCTCGCACGACCAAGGGCCTAGGTTGCCGATGGTGCCCGAGGT 1 TCCCGCACGACCAAGGGCC-AAGTTGCCGATGGTGCCCGAGGC ** * * * 891 TCCCGCAC-ATCCAAGCACCAAGGTGTCGATGGTGCTCGAGGC 1 TCCCGCACGA-CCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC * ** * 933 TCCCGCACGACCAAGGGCCTAGGTTGCCGACAGTGTCCGAGGC 1 TCCCGCACGACCAAGGGCC-AAGTTGCCGATGGTGCCCGAGGC * * 976 TCCCGCACGACCAAGGGCCTAGTTTGCCGATGGTGTCCGAGGC 1 TCCCGCACGACCAAGGGCCAAG-TTGCCGATGGTGCCCGAGGC * ** * ** * * 1019 TCCCGCAC-ATCCCAGCACCTAGGGGCCGATGGCGGCCGAGGC 1 TCCCGCACGA-CCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC * * * * 1061 ACCCGCACGACCAAGGGCCTATTTTCTCGATGGTGCCCGAGGC 1 TCCCGCACGACCAAGGGCCAAGTTGC-CGATGGTGCCCGAGGC ** * 1104 TCCCGCACGACCAAGGGCTTAGTTTGCCGATGGTGCCCGAGCC 1 TCCCGCACGACCAAGGGCCAAG-TTGCCGATGGTGCCCGAGGC * * * 1147 TCTCGCACGACCAAGGGCCTAGGTTGCCGATGGTGCCCGAGGT 1 TCCCGCACGACCAAGGGCC-AAGTTGCCGATGGTGCCCGAGGC ** * * 1190 TCCCGCAC-ATCCAAGCACCAAGGTGCCGATGGTGCTCGAGGC 1 TCCCGCACGA-CCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC * ** * 1232 TCCCGCACGACCAAGGGCCTAGGTTGCCGACAGTGTCCGAGGC 1 TCCCGCACGACCAAGGGCC-AAGTTGCCGATGGTGCCCGAGGC * ** * * * 1275 TCCCGCAC-ATCATAGCACCGAGGTGCTGATGGTGCCCGAGGC 1 TCCCGCACGACCA-AGGGCCAAGTTGCCGATGGTGCCCGAGGC * 1317 TCCCGCACGACCAAGGGCCTAGGTTGCCGATGGTGCCCGAGGC 1 TCCCGCACGACCAAGGGCC-AAGTTGCCGATGGTGCCCGAGGC * ** * * * 1360 TCCCGCAC-ATCGAAGCACCGAGGTGCCGATGGCGCCCGAGGC 1 TCCCGCACGA-CCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC ** * * ** * * 1402 TCCTTCATGGCCAAGGGCTTAGTTTGCCGATGGTGTCCGGGGC 1 TCCCGCACGACCAAGGGCCAAG-TTGCCGATGGTGCCCGAGGC * * ** 1445 TCCTGCAC-ATCCTAGCACCAAG-TGCCGATGGTGCCCGAGGC 1 TCCCGCACGA-CCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC * 1486 TCCCGCACGACCAATGGCC 1 TCCCGCACGACCAAGGGCC 1505 TATGCTACCG Statistics Matches: 730, Mismatches: 158, Indels: 53 0.78 0.17 0.06 Matches are distributed among these distances: 41 29 0.04 42 232 0.32 43 449 0.62 44 20 0.03 ACGTcount: A:0.18, C:0.35, G:0.31, T:0.16 Consensus pattern (42 bp): TCCCGCACGACCAAGGGCCAAGTTGCCGATGGTGCCCGAGGC Found at i:745 original size:85 final size:84 Alignment explanation

Indices: 569--1506 Score: 929 Period size: 85 Copynumber: 11.0 Consensus size: 84 559 CCAGGGACCA * * * 569 AGGTGCCGATGGGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGTTGCCGATTGTGTCCGAGGC 1 AGGTGCCGAT-GGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCCCGAGGC * ** * 634 TCCCGCAC-ATCCTAGCCACCG 65 TCCCGCACGA-CCAAG-GGCCT * * * 655 AGGTGCCGATGCTGCCCGAGGCTCCCGCACATCCGAGCCACCAAGGTGCCGATGGTGGCCGAGGC 1 AGGTGCCGATGGTGCCCGAGGCTCCCGCACATCCAAG-CACCAAGGTGCCGATGGTGCCCGAGGC * * 720 TCCCGCACGACCAATGGCCG 65 TCCCGCACGACCAAGGGCCT * * ** *** * 740 AGGTGCCGATGGTGGCCGAGGCCCCCGCACGA-CCAAGGGCCTATTTTACCGATGGTGCCCGAGG 1 AGGTGCCGATGGTGCCCGAGGCTCCCGCAC-ATCCAAGCACC-AAGGTGCCGATGGTGCCCGAGG * 804 CTCCCGCACGACCAAGGGCTT 64 CTCCCGCACGACCAAGGGCCT * * * ** * 825 AGTTTGCCGATGGTGCCCGAGCCTCTCGCACGA-CCAAGGGCCTAGGTTGCCGATGGTGCCCGAG 1 AG-GTGCCGATGGTGCCCGAGGCTCCCGCAC-ATCCAAGCACCAAGG-TGCCGATGGTGCCCGAG * ** * 889 GTTCCCGCAC-ATCCAAGCACCA 63 GCTCCCGCACGA-CCAAGGGCCT * * ** * ** * 911 AGGTGTCGATGGTGCTCGAGGCTCCCGCACGA-CCAAGGGCCTAGGTTGCCGACAGTGTCCGAGG 1 AGGTGCCGATGGTGCCCGAGGCTCCCGCAC-ATCCAAGCACCAAGG-TGCCGATGGTGCCCGAGG 975 CTCCCGCACGACCAAGGGCCT 64 CTCCCGCACGACCAAGGGCCT * * * * * * * 996 AGTTTGCCGATGGTGTCCGAGGCTCCCGCACATCCCAGCACCTAGGGGCCGATGGCGGCCGAGGC 1 AG-GTGCCGATGGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCCCGAGGC * 1061 ACCCGCACGACCAAGGGCCT 65 TCCCGCACGACCAAGGGCCT ** * ** ** * 1081 ATTTTCTCGATGGTGCCCGAGGCTCCCGCACGA-CCAAGGGCTTAGTTTGCCGATGGTGCCCGAG 1 AGGTGC-CGATGGTGCCCGAGGCTCCCGCAC-ATCCAAGCACCAAG-GTGCCGATGGTGCCCGAG * * 1145 CCTCTCGCACGACCAAGGGCCT 63 GCTCCCGCACGACCAAGGGCCT * * 1167 AGGTTGCCGATGGTGCCCGAGGTTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCTCGAGGC 1 AGG-TGCCGATGGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCCCGAGGC 1232 TCCCGCACGACCAAGGGCCT 65 TCCCGCACGACCAAGGGCCT ** * * * 1252 AGGTTGCCGACAGTGTCCGAGGCTCCCGCACAT-CATAGCACCGAGGTGCTGATGGTGCCCGAGG 1 AGG-TGCCGATGGTGCCCGAGGCTCCCGCACATCCA-AGCACCAAGGTGCCGATGGTGCCCGAGG 1316 CTCCCGCACGACCAAGGGCCT 64 CTCCCGCACGACCAAGGGCCT * * * 1337 AGGTTGCCGATGGTGCCCGAGGCTCCCGCACATCGAAGCACCGAGGTGCCGATGGCGCCCGAGGC 1 AGG-TGCCGATGGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCCCGAGGC ** * * * 1402 TCCTTCATGGCCAAGGGCTT 65 TCCCGCACGACCAAGGGCCT * * * * * 1422 AGTTTGCCGATGGTGTCCGGGGCTCCTGCACATCCTAGCACCAA-GTGCCGATGGTGCCCGAGGC 1 AG-GTGCCGATGGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCCCGAGGC * 1486 TCCCGCACGACCAATGGCCT 65 TCCCGCACGACCAAGGGCCT 1506 A 1 A 1507 TGCTACCGGA Statistics Matches: 713, Mismatches: 121, Indels: 38 0.82 0.14 0.04 Matches are distributed among these distances: 84 41 0.06 85 454 0.64 86 215 0.30 87 3 0.00 ACGTcount: A:0.18, C:0.35, G:0.31, T:0.16 Consensus pattern (84 bp): AGGTGCCGATGGTGCCCGAGGCTCCCGCACATCCAAGCACCAAGGTGCCGATGGTGCCCGAGGCT CCCGCACGACCAAGGGCCT Found at i:792 original size:128 final size:126 Alignment explanation

Indices: 569--1506 Score: 843 Period size: 128 Copynumber: 7.3 Consensus size: 126 559 CCAGGGACCA ** * * * * 569 AGGTGCCGATGGGTGCCCGAGGCTCCCGCAC-ATCCAAGCACCAAGTTGCCGATTGTGTCCGAGG 1 AGGTGCCGAT-GGTGCCCGAGGCTCCCGCACGA-CCAAGGGCCTAGGTGCCGATGGTGCCCGAGG * * * * ** 633 CTCCCGCACATCCTAGCCACCGA-GGTGCCGATGCTGCCCGAGGCTCCCGCAC-ATCCGAGCCAC 64 CTCCCGCACA-CCAAG-CACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGA-CCAAG-GGC * 696 CA 125 CT * * * * * 698 AGGTGCCGATGGTGGCCGAGGCTCCCGCACGACCAATGGCCGAGGTGCCGATGGTGGCCGAGGCC 1 AGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTAGGTGCCGATGGTGCCCGAGGCT ** *** * * 763 CCCGCACGACCAAGGGCCTATTTTACCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCTT 66 CCCGCAC-ACCAAGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCT * * * 825 AGTTTGCCGATGGTGCCCGAGCCTCTCGCACGACCAAGGGCCTAGGTTGCCGATGGTGCCCGAGG 1 AG-GTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTAGG-TGCCGATGGTGCCCGAGG * * * * 890 TTCCCGCACATCCAAGCACC-AAGGTGTCGATGGTGCTCGAGGCTCCCGCACGACCAAGGGCCT 64 CTCCCGCACA-CCAAGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCT ** * * * 953 AGGTTGCCGACAGTGTCCGAGGCTCCCGCACGACCAAGGGCCTAGTTTGCCGATGGTGTCCGAGG 1 AGG-TGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTAG-GTGCCGATGGTGCCCGAGG * * * * 1018 CTCCCGCACATCCCAGCACCTAGGG-GCCGATGGCGGCCGAGGCACCCGCACGACCAAGGGCCT 64 CTCCCGCACA-CCAAGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCT ** * * * * 1081 ATTTTCTCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCTTAGTTTGCCGATGGTGCCCGAGC 1 AGGTGC-CGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTAG-GTGCCGATGGTGCCCGAGG * ** * * ** * 1146 CTCTCGCACGACCAAGGGCCTAGGTTGCCGATGGTGCCCGAGGTTCCCGCAC-ATCCAAGCACCA 64 CTCCCGCAC-ACCAAGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGA-CCAAGGGCCT * ** * 1210 AGGTGCCGATGGTGCTCGAGGCTCCCGCACGACCAAGGGCCTAGGTTGCCGACAGTGTCCGAGGC 1 AGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTAGG-TGCCGATGGTGCCCGAGGC * * * 1275 TCCCGCACATCATAGCACCGA-GGTGCTGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCT 65 TCCCGCACACCA-AGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCT * ** * * 1337 AGGTTGCCGATGGTGCCCGAGGCTCCCGCAC-ATCGAAGCACCGAGGTGCCGATGGCGCCCGAGG 1 AGG-TGCCGATGGTGCCCGAGGCTCCCGCACGA-CCAAGGGCCTAGGTGCCGATGGTGCCCGAGG ** ** ** * ** * * * * ** 1401 CTCCTTCATGGCCAAGGGCTTAGTTTGCCGATGGTGTCCGGGGCTCCTGCAC-ATCCTAGCACC- 64 CTCCCGCA-CACCAAGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGA-CCAAGGGCCT * * 1464 AAGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAATGGCCTA 1 AGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTA 1507 TGCTACCGGA Statistics Matches: 655, Mismatches: 131, Indels: 49 0.78 0.16 0.06 Matches are distributed among these distances: 126 33 0.05 127 76 0.12 128 466 0.71 129 80 0.12 ACGTcount: A:0.18, C:0.35, G:0.31, T:0.16 Consensus pattern (126 bp): AGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCTAGGTGCCGATGGTGCCCGAGGCT CCCGCACACCAAGCACCTAGGGTGCCGATGGTGCCCGAGGCTCCCGCACGACCAAGGGCCT Found at i:1573 original size:25 final size:25 Alignment explanation

Indices: 1512--1589 Score: 122 Period size: 25 Copynumber: 3.2 Consensus size: 25 1502 GCCTATGCTA * * 1512 CCGGAACGGTTCGCCGGAGCACCGC 1 CCGGGACGGATCGCCGGAGCACCGC 1537 CC-GGACGGATCGCCGGAGCACCGC 1 CCGGGACGGATCGCCGGAGCACCGC * 1561 CCGGGACGGATCGTCGGAGCACCGC 1 CCGGGACGGATCGCCGGAGCACCGC 1586 CCGG 1 CCGG 1590 AACCTAACTC Statistics Matches: 49, Mismatches: 3, Indels: 2 0.91 0.06 0.04 Matches are distributed among these distances: 24 22 0.45 25 27 0.55 ACGTcount: A:0.15, C:0.40, G:0.38, T:0.06 Consensus pattern (25 bp): CCGGGACGGATCGCCGGAGCACCGC Found at i:2056 original size:42 final size:41 Alignment explanation

Indices: 1855--2140 Score: 177 Period size: 42 Copynumber: 6.7 Consensus size: 41 1845 NNNNNNNNNN * 1855 GCTCCCGCACATCCAAGCACCAAGGTACCGATGGTG-CTCGAG 1 GCTCCCGCACATCC-AGCACCAAGGTGCCGATGGTGTC-CGAG ** * ** 1897 GCTCCCCGCACGA-CCAAGGGCCTAGGTTGCCGACAGTGTCCGAG 1 GCT-CCCGCAC-ATCC-AGCACCAAGG-TGCCGATGGTGTCCGAG * * * * * 1941 ATCTCCCGTACATCATAGCACCCGAGGTGCCGATGGTCTCCGAG 1 -GCTCCCGCACATC-CAGCA-CCAAGGTGCCGATGGTGTCCGAG * * * ** * * 1985 GCTTCC-CACAACCAAGGGCA-TAATTTGCCGATCGTGTCCGAT 1 GCTCCCGCACATCC-A--GCACCAAGGTGCCGATGGTGTCCGAG 2027 GCTCCCGCACATCCATGCACCAAGGTGCCGATGGTG-CTCGAG 1 GCTCCCGCACATCCA-GCACCAAGGTGCCGATGGTGTC-CGAG * * * 2069 GCTCCCGCACATCCAAGCATCAAGGTTACCGATGGTGTCTGAG 1 GCTCCCGCACATCC-AGCACCAAGG-TGCCGATGGTGTCCGAG * 2112 GCTCCCACACATCCGAGCCACCAAGGTGC 1 GCTCCCGCACATCC-AG-CACCAAGGTGC 2141 TGGAGGCTCT Statistics Matches: 184, Mismatches: 42, Indels: 35 0.70 0.16 0.13 Matches are distributed among these distances: 41 4 0.02 42 66 0.36 43 59 0.32 44 47 0.26 45 8 0.04 ACGTcount: A:0.22, C:0.35, G:0.26, T:0.17 Consensus pattern (41 bp): GCTCCCGCACATCCAGCACCAAGGTGCCGATGGTGTCCGAG Done.