Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: scaffold_48 ID=scaffold_48-JGI_221_v2.0

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 35838
ACGTcount: A:0.22, C:0.12, G:0.13, T:0.21

Warning! 11703 characters in sequence are not A, C, G, or T


Found at i:3833 original size:9 final size:9

Alignment explanation

Indices: 3819--4240 Score: 120 Period size: 9 Copynumber: 48.7 Consensus size: 9 3809 AAGGTATACA 3819 TTATGTAAG 1 TTATGTAAG 3828 TTATGTAAG 1 TTATGTAAG * 3837 TTGTGTAAG 1 TTATGTAAG ** 3846 TTGCGTAAG 1 TTATGTAAG * * 3855 ATGTGT-A- 1 TTATGTAAG * * 3862 TTATGAAAC 1 TTATGTAAG 3871 TTATGTAAG 1 TTATGTAAG * 3880 TTATGT--C 1 TTATGTAAG 3887 TTATGTAAG 1 TTATGTAAG * 3896 TTATGTAAA 1 TTATGTAAG * 3905 ATATGT-A- 1 TTATGTAAG * 3912 TTATTTACA- 1 TTATGTA-AG * 3921 -CATGTAAG 1 TTATGTAAG * 3929 TTATGT--C 1 TTATGTAAG 3936 TTATGTAAG 1 TTATGTAAG ** 3945 TTGCGTAAG 1 TTATGTAAG * 3954 TTGTGT-A- 1 TTATGTAAG * 3961 TTATGAAAG 1 TTATGTAAG * 3970 TTATGT--C 1 TTATGTAAG 3977 TTATGTAAG 1 TTATGTAAG * 3986 TTATGTAGG 1 TTATGTAAG * 3995 GTATGTATTA- 1 TTATGTA--AG * 4005 TTATGTAAC 1 TTATGTAAG * * 4014 TTATTTAAT 1 TTATGTAAG * 4023 TTATGTAAC 1 TTATGTAAG * * 4032 TTATTTAAT 1 TTATGTAAG * 4041 TTATGTAGG 1 TTATGTAAG * * 4050 GTATGCATTA- 1 TTATG--TAAG * 4060 TTATGTAAC 1 TTATGTAAG * * 4069 TTATTTAAT 1 TTATGTAAG * 4078 TTATGTAGG 1 TTATGTAAG * 4087 GTATGTATTA- 1 TTATGTA--AG * 4097 TTATGTAAC 1 TTATGTAAG * * 4106 TTATTTAAT 1 TTATGTAAG * 4115 TTATGTAGG 1 TTATGTAAG * 4124 GTATGTAAG 1 TTATGTAAG 4133 TTATGTAAG 1 TTATGTAAG * * 4142 CTCTGT-A- 1 TTATGTAAG * * 4149 TTATTTACG 1 TTATGTAAG * 4158 -CATGTAAG 1 TTATGTAAG * 4166 TTGTGT-A- 1 TTATGTAAG 4173 TTATGTATTA- 1 TTATGTA--AG * * 4183 TTACGTAAC 1 TTATGTAAG * 4192 TTATTTAAG 1 TTATGTAAG * 4201 TTATGCAAG 1 TTATGTAAG * 4210 TTATAT-A- 1 TTATGTAAG * * 4217 TTAAGTAGG 1 TTATGTAAG 4226 TTATGTAAG 1 TTATGTAAG 4235 TTATGT 1 TTATGT 4241 GTTACGTAAA Statistics Matches: 294, Mismatches: 87, Indels: 64 0.66 0.20 0.14 Matches are distributed among these distances: 7 42 0.14 8 22 0.07 9 206 0.70 10 23 0.08 11 1 0.00 ACGTcount: A:0.30, C:0.05, G:0.19, T:0.46 Consensus pattern (9 bp): TTATGTAAG Found at i:3889 original size:16 final size:16 Alignment explanation

Indices: 3870--3991 Score: 82 Period size: 16 Copynumber: 8.0 Consensus size: 16 3860 TATTATGAAA 3870 CTTATGTAAGTTATGT 1 CTTATGTAAGTTATGT 3886 CTTATGTAAGTTATGT 1 CTTATGTAAGTTATGT ** * 3902 AAAATATGT-A-TTATTT 1 --CTTATGTAAGTTATGT ** 3918 ACACATGTAAGTTATGT 1 -CTTATGTAAGTTATGT 3935 CTTATGTAAG-T-TG- 1 CTTATGTAAGTTATGT * 3948 C----GTAAGTTGTGT 1 CTTATGTAAGTTATGT * * 3960 ATTATGAAAGTTATGT 1 CTTATGTAAGTTATGT 3976 CTTATGTAAGTTATGT 1 CTTATGTAAGTTATGT 3992 AGGGTATGTA Statistics Matches: 82, Mismatches: 13, Indels: 22 0.70 0.11 0.19 Matches are distributed among these distances: 9 5 0.06 10 1 0.01 11 2 0.02 13 1 0.01 14 2 0.02 15 7 0.09 16 53 0.65 17 6 0.07 18 5 0.06 ACGTcount: A:0.30, C:0.06, G:0.19, T:0.46 Consensus pattern (16 bp): CTTATGTAAGTTATGT Found at i:3964 original size:25 final size:25 Alignment explanation

Indices: 3823--3972 Score: 97 Period size: 25 Copynumber: 6.0 Consensus size: 25 3813 TATACATTAT * * 3823 GTAAGTTATGTAAGTTGTGTAAGTTGC 1 GTAAGTTATGT-A-TTATGTAAGTTAC * * * * * 3850 GTAAGATGTGTATTATGAAACTTAT 1 GTAAGTTATGTATTATGTAAGTTAC * * 3875 GTAAGTTATGTCTTATGTAAGTTAT 1 GTAAGTTATGTATTATGTAAGTTAC ** * * * 3900 GTAAAATATGTATTATTTACA--CAT 1 GTAAGTTATGTATTATGTA-AGTTAC * * 3924 GTAAGTTATGTCTTATGTAAGTTGC 1 GTAAGTTATGTATTATGTAAGTTAC * * 3949 GTAAGTTGTGTATTATGAAAGTTA 1 GTAAGTTATGTATTATGTAAGTTA 3973 TGTCTTATGT Statistics Matches: 92, Mismatches: 28, Indels: 8 0.72 0.22 0.06 Matches are distributed among these distances: 23 1 0.01 24 17 0.18 25 63 0.68 26 2 0.02 27 9 0.10 ACGTcount: A:0.31, C:0.05, G:0.21, T:0.43 Consensus pattern (25 bp): GTAAGTTATGTATTATGTAAGTTAC Found at i:4002 original size:41 final size:41 Alignment explanation

Indices: 3926--4005 Score: 115 Period size: 41 Copynumber: 2.0 Consensus size: 41 3916 TTACACATGT * * * 3926 AAGTTATGTCTTATGTAAGTTGCGTAAGTTGTGTATTATGA 1 AAGTTATGTCTTATGTAAGTTACGTAAGGTATGTATTATGA * * 3967 AAGTTATGTCTTATGTAAGTTATGTAGGGTATGTATTAT 1 AAGTTATGTCTTATGTAAGTTACGTAAGGTATGTATTAT 4006 TATGTAACTT Statistics Matches: 34, Mismatches: 5, Indels: 0 0.87 0.13 0.00 Matches are distributed among these distances: 41 34 1.00 ACGTcount: A:0.28, C:0.04, G:0.24, T:0.45 Consensus pattern (41 bp): AAGTTATGTCTTATGTAAGTTACGTAAGGTATGTATTATGA Found at i:4048 original size:55 final size:55 Alignment explanation

Indices: 3976--4084 Score: 191 Period size: 55 Copynumber: 2.0 Consensus size: 55 3966 AAAGTTATGT * 3976 CTTATGTAAGTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATGTAA 1 CTTATGTAAGTTATGTAGGGTATGCATTATTATGTAACTTATTTAATTTATGTAA * * 4031 CTTATTTAATTTATGTAGGGTATGCATTATTATGTAACTTATTTAATTTATGTA 1 CTTATGTAAGTTATGTAGGGTATGCATTATTATGTAACTTATTTAATTTATGTA 4085 GGGTATGTAT Statistics Matches: 51, Mismatches: 3, Indels: 0 0.94 0.06 0.00 Matches are distributed among these distances: 55 51 1.00 ACGTcount: A:0.30, C:0.05, G:0.15, T:0.50 Consensus pattern (55 bp): CTTATGTAAGTTATGTAGGGTATGCATTATTATGTAACTTATTTAATTTATGTAA Found at i:4129 original size:37 final size:37 Alignment explanation

Indices: 4023--4130 Score: 207 Period size: 37 Copynumber: 2.9 Consensus size: 37 4013 CTTATTTAAT * 4023 TTATGTAACTTATTTAATTTATGTAGGGTATGCATTA 1 TTATGTAACTTATTTAATTTATGTAGGGTATGTATTA 4060 TTATGTAACTTATTTAATTTATGTAGGGTATGTATTA 1 TTATGTAACTTATTTAATTTATGTAGGGTATGTATTA 4097 TTATGTAACTTATTTAATTTATGTAGGGTATGTA 1 TTATGTAACTTATTTAATTTATGTAGGGTATGTA 4131 AGTTATGTAA Statistics Matches: 70, Mismatches: 1, Indels: 0 0.99 0.01 0.00 Matches are distributed among these distances: 37 70 1.00 ACGTcount: A:0.30, C:0.04, G:0.17, T:0.50 Consensus pattern (37 bp): TTATGTAACTTATTTAATTTATGTAGGGTATGTATTA Found at i:4152 original size:92 final size:92 Alignment explanation

Indices: 3976--4205 Score: 265 Period size: 92 Copynumber: 2.6 Consensus size: 92 3966 AAAGTTATGT * * * 3976 CTTATGTAAGTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATGTAACTTATTTAAT 1 CTTATGTAAGTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATGTAACGTATGTAAG * * 4041 TTATGTAGGGTATGCATTATTATGTAA 66 TTATGTAAGCTATGCATTATTATGTAA * * ** 4068 CTTATTTAATTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATGTAGGGTATGTAAG 1 CTTATGTAAGTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATGTAACGTATGTAAG * * 4133 TTATGTAAGCTCTG---TATTAT-TTA 66 TTATGTAAGCTATGCATTATTATGTAA ** * * * * 4156 CGCATGTAAGTTGTGTA--TTATGTATTATTACGTAACTTATTTAAGTTATG 1 CTTATGTAAGTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATG 4206 CAAGTTATAT Statistics Matches: 119, Mismatches: 19, Indels: 6 0.83 0.13 0.04 Matches are distributed among these distances: 86 30 0.25 88 14 0.12 89 6 0.05 92 69 0.58 ACGTcount: A:0.29, C:0.05, G:0.17, T:0.49 Consensus pattern (92 bp): CTTATGTAAGTTATGTAGGGTATGTATTATTATGTAACTTATTTAATTTATGTAACGTATGTAAG TTATGTAAGCTATGCATTATTATGTAA Found at i:4343 original size:41 final size:41 Alignment explanation

Indices: 4298--4529 Score: 94 Period size: 46 Copynumber: 5.1 Consensus size: 41 4288 ATTTAAGTTA 4298 TAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG 1 TAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG ** * ** * 4339 TAAATGAATATATGTA-TAATATTAAA-AAAAATAGTAATACTTATTTAAG 1 TAAAT---T-TAT-TATTAATA--AAATTTAAATA-T-A-GCTTACATACG 4388 TTATAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG 1 ---TAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG ** * ** * 4432 TAAATGAATATATGTA-TAATATTAAA-AAAAATAGTAATACTTATTTAAG 1 TAAAT---T-TAT-TATTAATA--AAATTTAAATA-T-A-GCTTACATACG 4481 TTATAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG 1 ---TAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG 4525 TAAAT 1 TAAAT 4530 GANNNNNNNN Statistics Matches: 137, Mismatches: 24, Indels: 60 0.62 0.11 0.27 Matches are distributed among these distances: 41 15 0.11 44 16 0.12 45 18 0.13 46 22 0.16 47 22 0.16 48 18 0.13 49 16 0.12 52 10 0.07 ACGTcount: A:0.49, C:0.05, G:0.06, T:0.40 Consensus pattern (41 bp): TAAATTTATTATTAATAAAATTTAAATATAGCTTACATACG Found at i:4395 original size:52 final size:52 Alignment explanation

Indices: 4339--4488 Score: 137 Period size: 46 Copynumber: 3.1 Consensus size: 52 4329 CTTACATACG 4339 TAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTA 1 TAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTA ** * ** * 4391 TAAAT---T-TAT-TATTAATA--AAATTTAAATA-T-A-GCTTACATACG--- 1 TAAATGAATATATGTA-TAATATTAAA-AAAAATAGTAATACTTATTTAAGTTA 4432 TAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTA 1 TAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTA 4484 TAAAT 1 TAAAT 4489 TTATTATTAA Statistics Matches: 71, Mismatches: 12, Indels: 30 0.63 0.11 0.27 Matches are distributed among these distances: 41 5 0.07 44 8 0.11 45 9 0.13 46 11 0.15 47 11 0.15 48 9 0.13 49 8 0.11 52 10 0.14 ACGTcount: A:0.51, C:0.03, G:0.07, T:0.39 Consensus pattern (52 bp): TAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTA Found at i:4401 original size:93 final size:93 Alignment explanation

Indices: 4243--4531 Score: 562 Period size: 93 Copynumber: 3.1 Consensus size: 93 4233 AGTTATGTGT * 4243 TACGTAAATGAATATATGTATATTATT-AAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT 1 TACGTAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT 4307 TATTAATAAAATTTAAATATAGCTTACA 66 TATTAATAAAATTTAAATATAGCTTACA 4335 TACGTAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT 1 TACGTAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT 4400 TATTAATAAAATTTAAATATAGCTTACA 66 TATTAATAAAATTTAAATATAGCTTACA 4428 TACGTAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT 1 TACGTAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT 4493 TATTAATAAAATTTAAATATAGCTTACA 66 TATTAATAAAATTTAAATATAGCTTACA 4521 TACGTAAATGA 1 TACGTAAATGA 4532 NNNNNNNNNN Statistics Matches: 195, Mismatches: 1, Indels: 1 0.99 0.01 0.01 Matches are distributed among these distances: 92 26 0.13 93 169 0.87 ACGTcount: A:0.49, C:0.04, G:0.07, T:0.40 Consensus pattern (93 bp): TACGTAAATGAATATATGTATAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTAT TATTAATAAAATTTAAATATAGCTTACA Found at i:4407 original size:48 final size:48 Alignment explanation

Indices: 4355--4500 Score: 142 Period size: 48 Copynumber: 3.1 Consensus size: 48 4345 AATATATGTA 4355 TAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTATTAT 1 TAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTATTAT ** * ** * * * * 4403 TAATA--AAATTTAAATA-T-A-GCTTACATACGTAAATGAATATATGTA- 1 TAATATTAAA-AAAAATAGTAATACTTATTTAAGT-TATAAATTTAT-TAT 4448 TAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTATTAT 1 TAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTATTAT 4496 TAATA 1 TAATA 4501 AAATTTAAAT Statistics Matches: 71, Mismatches: 18, Indels: 18 0.66 0.17 0.17 Matches are distributed among these distances: 44 8 0.11 45 14 0.20 46 11 0.15 47 11 0.15 48 19 0.27 49 8 0.11 ACGTcount: A:0.50, C:0.03, G:0.05, T:0.41 Consensus pattern (48 bp): TAATATTAAAAAAAATAGTAATACTTATTTAAGTTATAAATTTATTAT Found at i:14303 original size:15 final size:15 Alignment explanation

Indices: 14283--14314 Score: 55 Period size: 15 Copynumber: 2.1 Consensus size: 15 14273 CATTTCACTA * 14283 TTATGTCTTTTGTAT 1 TTATGTCTTTTATAT 14298 TTATGTCTTTTATAT 1 TTATGTCTTTTATAT 14313 TT 1 TT 14315 TGCATGCATA Statistics Matches: 16, Mismatches: 1, Indels: 0 0.94 0.06 0.00 Matches are distributed among these distances: 15 16 1.00 ACGTcount: A:0.16, C:0.06, G:0.09, T:0.69 Consensus pattern (15 bp): TTATGTCTTTTATAT Found at i:35264 original size:43 final size:44 Alignment explanation

Indices: 35154--35265 Score: 138 Period size: 44 Copynumber: 2.6 Consensus size: 44 35144 GAAGAATTTT * * ** * 35154 AGATCTTATCTCCCTGAGGTTACAGTGGAGCAGATTGAAGCCAG 1 AGATCTTATCTCCCTGAAGTTACAGCGGAGCAGATCCAAGACAG 35198 AGATCTTATCTCCCTG-AGATTACAGCGGAGCAGATCCAAGACA- 1 AGATCTTATCTCCCTGAAG-TTACAGCGGAGCAGATCCAAGACAG ** 35241 CTATCTTATCTCCCTGAAGTTACAG 1 AGATCTTATCTCCCTGAAGTTACAG 35266 TNNNNNNNNN Statistics Matches: 59, Mismatches: 7, Indels: 5 0.83 0.10 0.07 Matches are distributed among these distances: 43 21 0.36 44 38 0.64 ACGTcount: A:0.29, C:0.24, G:0.21, T:0.26 Consensus pattern (44 bp): AGATCTTATCTCCCTGAAGTTACAGCGGAGCAGATCCAAGACAG Done.