Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: scaffold_495 ID=scaffold_495-JGI_221_v2.0

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 6436
ACGTcount: A:0.29, C:0.18, G:0.23, T:0.31


Found at i:1250 original size:23 final size:23

Alignment explanation

Indices: 1222--1585 Score: 530 Period size: 23 Copynumber: 16.2 Consensus size: 23 1212 TATTAATTGA 1222 TTAATTAGGTTAGGGTTTTTAAT 1 TTAATTAGGTTAGGGTTTTTAAT * 1245 TTAATTAGGTTAGGGTTTTTAAG 1 TTAATTAGGTTAGGGTTTTTAAT * 1268 TTAA--GGGTTAGGGTTTTTAAT 1 TTAATTAGGTTAGGGTTTTTAAT * 1289 TTAATTAGGTTAGAGTTTTT-AT 1 TTAATTAGGTTAGGGTTTTTAAT * 1311 GTTAATTAGGTTAGGGTTTTTAAG 1 -TTAATTAGGTTAGGGTTTTTAAT * 1335 TTAA--GGGTTAGGGTTTTTAAT 1 TTAATTAGGTTAGGGTTTTTAAT 1356 TTAATTAGGTTAGGGTTTTTAAT 1 TTAATTAGGTTAGGGTTTTTAAT * * 1379 TTAATTAGGTTAGAGTTTTTAAG 1 TTAATTAGGTTAGGGTTTTTAAT * 1402 TTAA--GGGTTAGGGTTTTTAAT 1 TTAATTAGGTTAGGGTTTTTAAT * 1423 TGAATTAGGTTAGGGTTTTTAAT 1 TTAATTAGGTTAGGGTTTTTAAT * 1446 TTAATTAGGTTAGGGTTTTTAAG 1 TTAATTAGGTTAGGGTTTTTAAT 1469 TTAATTAGGTTAGGGTTTTTAAT 1 TTAATTAGGTTAGGGTTTTTAAT * * 1492 TTAA--GGGTTAGGATTTTTAAT 1 TTAATTAGGTTAGGGTTTTTAAT 1513 TTAATTAGGTTAGGGTTTTTAAT 1 TTAATTAGGTTAGGGTTTTTAAT * 1536 TTAATTAGGTTAGGGTTTTTAAG 1 TTAATTAGGTTAGGGTTTTTAAT * 1559 TTAATTAGGTTAGGGTTTTTAAG 1 TTAATTAGGTTAGGGTTTTTAAT 1582 TTAA 1 TTAA 1586 GGGTATTAAT Statistics Matches: 306, Mismatches: 25, Indels: 20 0.87 0.07 0.06 Matches are distributed among these distances: 21 74 0.24 22 2 0.01 23 229 0.75 24 1 0.00 ACGTcount: A:0.26, C:0.00, G:0.24, T:0.49 Consensus pattern (23 bp): TTAATTAGGTTAGGGTTTTTAAT Found at i:1295 original size:67 final size:67 Alignment explanation

Indices: 1222--1585 Score: 572 Period size: 67 Copynumber: 5.4 Consensus size: 67 1212 TATTAATTGA 1222 TTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTAAGGGTTAGGGTTTTTA 1 TTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTAAGGGTTAGGGTTTTTA 1287 AT 66 AT * 1289 TTAATTAGGTTAGAGTTTTT-ATGTTAATTAGGTTAGGGTTTTTAAGTTAAGGGTTAGGGTTTTT 1 TTAATTAGGTTAGGGTTTTTAAT-TTAATTAGGTTAGGGTTTTTAAGTTAAGGGTTAGGGTTTTT 1353 AAT 65 AAT * 1356 TTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGAGTTTTTAAGTTAAGGGTTAGGGTTTTTA 1 TTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTAAGGGTTAGGGTTTTTA 1421 AT 66 AT * * 1423 TGAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTAATTAGGTTAGGGTTTT 1 TTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTAA--GGGTTAGGGTTTT 1488 TAAT 64 TAAT * * * * 1492 TTAA--GGGTTAGGATTTTTAATTTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTT 1 TTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTAA--GGGTTAGGGTTTT * 1555 TAAG 64 TAAT * 1559 TTAATTAGGTTAGGGTTTTTAAGTTAA 1 TTAATTAGGTTAGGGTTTTTAATTTAA 1586 GGGTATTAAT Statistics Matches: 277, Mismatches: 14, Indels: 10 0.92 0.05 0.03 Matches are distributed among these distances: 66 2 0.01 67 236 0.85 68 2 0.01 69 37 0.13 ACGTcount: A:0.26, C:0.00, G:0.24, T:0.49 Consensus pattern (67 bp): TTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTAAGGGTTAGGGTTTTTA AT Found at i:1586 original size:90 final size:90 Alignment explanation

Indices: 1229--1589 Score: 559 Period size: 90 Copynumber: 4.0 Consensus size: 90 1219 TGATTAATTA * * * 1229 GGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTAA--GGGTTAGGGTTTTTAATTTA 1 GGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTA * * 1292 ATTAGGTTAGAGTTTTTATGTTAATTA 66 ATTAGGTTAGAGTTTTTAAGTTAA--G * * * 1319 GGTTAGGGTTTTTAAGTTAA--GGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAATTTA 1 GGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTA 1382 ATTAGGTTAGAGTTTTTAAGTTAAG 66 ATTAGGTTAGAGTTTTTAAGTTAAG * 1407 GGTTAGGGTTTTTAATTGAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTA 1 GGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTA * * 1472 ATTAGGTTAGGGTTTTTAATTTAAG 66 ATTAGGTTAGAGTTTTTAAGTTAAG * 1497 GGTTAGGATTTTTAATTTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTA 1 GGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTA * 1562 ATTAGGTTAGGGTTTTTAAGTTAAG 66 ATTAGGTTAGAGTTTTTAAGTTAAG 1587 GGT 1 GGT 1590 ATTAATTGTT Statistics Matches: 252, Mismatches: 15, Indels: 8 0.92 0.05 0.03 Matches are distributed among these distances: 88 37 0.15 90 215 0.85 ACGTcount: A:0.26, C:0.00, G:0.25, T:0.49 Consensus pattern (90 bp): GGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAATTTAATTAGGTTAGGGTTTTTAAGTTA ATTAGGTTAGAGTTTTTAAGTTAAG Found at i:1666 original size:25 final size:25 Alignment explanation

Indices: 1637--1684 Score: 87 Period size: 25 Copynumber: 1.9 Consensus size: 25 1627 ATTCAAAAAT 1637 TTCTACTTTATTACATCAAATAAAC 1 TTCTACTTTATTACATCAAATAAAC * 1662 TTCTATTTTATTACATCAAATAA 1 TTCTACTTTATTACATCAAATAA 1685 TATCAAAATA Statistics Matches: 22, Mismatches: 1, Indels: 0 0.96 0.04 0.00 Matches are distributed among these distances: 25 22 1.00 ACGTcount: A:0.40, C:0.17, G:0.00, T:0.44 Consensus pattern (25 bp): TTCTACTTTATTACATCAAATAAAC Found at i:2136 original size:18 final size:18 Alignment explanation

Indices: 2113--2152 Score: 71 Period size: 18 Copynumber: 2.2 Consensus size: 18 2103 GACTCGGAAA * 2113 AGGATACATATAAGGGTT 1 AGGATACATATAAGGGGT 2131 AGGATACATATAAGGGGT 1 AGGATACATATAAGGGGT 2149 AGGA 1 AGGA 2153 AACGCACCTG Statistics Matches: 21, Mismatches: 1, Indels: 0 0.95 0.05 0.00 Matches are distributed among these distances: 18 21 1.00 ACGTcount: A:0.40, C:0.05, G:0.33, T:0.23 Consensus pattern (18 bp): AGGATACATATAAGGGGT Found at i:2817 original size:7 final size:7 Alignment explanation

Indices: 2801--2831 Score: 53 Period size: 7 Copynumber: 4.4 Consensus size: 7 2791 TATTATTTAT * 2801 ATACTTA 1 ATACTAA 2808 ATACTAA 1 ATACTAA 2815 ATACTAA 1 ATACTAA 2822 ATACTAA 1 ATACTAA 2829 ATA 1 ATA 2832 TCAATCGACT Statistics Matches: 23, Mismatches: 1, Indels: 0 0.96 0.04 0.00 Matches are distributed among these distances: 7 23 1.00 ACGTcount: A:0.55, C:0.13, G:0.00, T:0.32 Consensus pattern (7 bp): ATACTAA Found at i:3039 original size:20 final size:20 Alignment explanation

Indices: 3002--3039 Score: 51 Period size: 20 Copynumber: 1.9 Consensus size: 20 2992 TTTATTTTTA * 3002 AAAATCTATGTAATAATTGT 1 AAAATCTATATAATAATTGT 3022 AAAATCTAATATAA-AATT 1 AAAATCT-ATATAATAATT 3040 TTTCTCGTTA Statistics Matches: 16, Mismatches: 1, Indels: 2 0.84 0.05 0.11 Matches are distributed among these distances: 20 11 0.69 21 5 0.31 ACGTcount: A:0.53, C:0.05, G:0.05, T:0.37 Consensus pattern (20 bp): AAAATCTATATAATAATTGT Found at i:3953 original size:12 final size:12 Alignment explanation

Indices: 3936--3976 Score: 57 Period size: 12 Copynumber: 3.5 Consensus size: 12 3926 TTTACAGTTT 3936 AAAAAAATTTTA 1 AAAAAAATTTTA 3948 AAAAAAATTTTA 1 AAAAAAATTTTA ** 3960 AAAATTA-TTTA 1 AAAAAAATTTTA 3971 AAAAAA 1 AAAAAA 3977 GGGAGTTAAG Statistics Matches: 25, Mismatches: 4, Indels: 1 0.83 0.13 0.03 Matches are distributed among these distances: 11 8 0.32 12 17 0.68 ACGTcount: A:0.68, C:0.00, G:0.00, T:0.32 Consensus pattern (12 bp): AAAAAAATTTTA Found at i:4065 original size:11 final size:11 Alignment explanation

Indices: 4045--4095 Score: 77 Period size: 11 Copynumber: 4.6 Consensus size: 11 4035 CAGAGAATTT 4045 TTGA-AGGAAA 1 TTGAGAGGAAA 4055 TTGAGAGGAAA 1 TTGAGAGGAAA 4066 TTGAGAGGAAA 1 TTGAGAGGAAA * 4077 TTGAGAAGAAA 1 TTGAGAGGAAA 4088 TTTGAGAG 1 -TTGAGAG 4096 AGGATTAGTT Statistics Matches: 37, Mismatches: 2, Indels: 2 0.90 0.05 0.05 Matches are distributed among these distances: 10 4 0.11 11 27 0.73 12 6 0.16 ACGTcount: A:0.45, C:0.00, G:0.33, T:0.22 Consensus pattern (11 bp): TTGAGAGGAAA Found at i:5102 original size:127 final size:125 Alignment explanation

Indices: 4819--5263 Score: 581 Period size: 125 Copynumber: 3.5 Consensus size: 125 4809 GATAAAATCA * * * * * 4819 AAGCAGGATGCTTTATCAGAAGAATTTCTGAAGTCGCGCCCACGTGTACGCGCTTTTGCTATAGT 1 AAGCAGGATGCTTTATCAGAAGAATTTGTGAAATCGCGCCCACGTGGACGCACTTTTGCTACAGT * * 4884 AGGTCCTGTAAAAATAATTTCGAGTTGACGTTTCTGAGTAAATAG-TATAAAAAATGCTTC 66 AGGTCCTGGAAAAATAATTTCGACTTGACGTTTCTGAGTAAATAGTTA-AAAAAATGCTTC * * ** 4944 AAGCAGGATGGTTTATGAGAAGAATTTGTGAAATCGCGCCCTTGTGGACGCACTTTTGCTACAGT 1 AAGCAGGATGCTTTATCAGAAGAATTTGTGAAATCGCGCCCACGTGGACGCACTTTTGCTACAGT * 5009 AGGTCCTGGAAGAAATAATTTCGACTTGACGTTTCTGAGTAAATAGTTTAAAAAAACGCTTC 66 AGGTCCTGGAA-AAATAATTTCGACTTGACGTTTCTGAGTAAATAG-TTAAAAAAATGCTTC * * * * * 5071 AAGTAGGATGCTTTATGAGAAGAATTTGTGAAATCGCG-CCATCGTGGATGCGCTTTTCCTACAG 1 AAGCAGGATGCTTTATCAGAAGAATTTGTGAAATCGCGCCCA-CGTGGACGCACTTTTGCTACAG * * * * * * * 5135 TAGGTCCTAGAAAAAAGAAATTCAACTTGATGTTTCTGAGCAAATAG-TATAAAAATGCTTC 65 TAGGTCCT-GGAAAAATAATTTCGACTTGACGTTTCTGAGTAAATAGTTAAAAAAATGCTTC * * * 5196 AAGCAAGATGCTTTATCATAAGAATTTGTGAAATCGTGCCCACGTGGACGCACTTTTGCTACAGT 1 AAGCAGGATGCTTTATCAGAAGAATTTGTGAAATCGCGCCCACGTGGACGCACTTTTGCTACAGT 5261 AGG 66 AGG 5264 GCTGAGGCTA Statistics Matches: 279, Mismatches: 35, Indels: 12 0.86 0.11 0.04 Matches are distributed among these distances: 125 134 0.48 126 38 0.14 127 102 0.37 128 5 0.02 ACGTcount: A:0.31, C:0.16, G:0.22, T:0.30 Consensus pattern (125 bp): AAGCAGGATGCTTTATCAGAAGAATTTGTGAAATCGCGCCCACGTGGACGCACTTTTGCTACAGT AGGTCCTGGAAAAATAATTTCGACTTGACGTTTCTGAGTAAATAGTTAAAAAAATGCTTC Done.