Tandem Repeats Finder Program written by: Gary Benson Program in Bioinformatics Boston University Version 4.09 Sequence: AWUE01017795.1 Corchorus olitorius cultivar O-4 contig17828, whole genome shotgun sequence Parameters: 2 7 7 80 10 50 1000 Pmatch=0.80,Pindel=0.10 tuple sizes 0,4,5,7 tuple distances 0, 29, 159, 1000 Length: 7921 ACGTcount: A:0.36, C:0.14, G:0.14, T:0.36 Warning! 1 characters in sequence are not A, C, G, or T Found at i:326 original size:36 final size:36 Alignment explanation
Indices: 279--348 Score: 113 Period size: 36 Copynumber: 1.9 Consensus size: 36 269 TCCAATAACC * * 279 TTACATCTTTTGTGATTTTGGTTATCATATTTCTTA 1 TTACATCTTTTGTAATTTTGATTATCATATTTCTTA * 315 TTACATTTTTTGTAATTTTGATTATCATATTTCT 1 TTACATCTTTTGTAATTTTGATTATCATATTTCT 349 CAAAAATCTC Statistics Matches: 31, Mismatches: 3, Indels: 0 0.91 0.09 0.00 Matches are distributed among these distances: 36 31 1.00 ACGTcount: A:0.21, C:0.10, G:0.09, T:0.60 Consensus pattern (36 bp): TTACATCTTTTGTAATTTTGATTATCATATTTCTTA Found at i:1204 original size:206 final size:201 Alignment explanation
Indices: 829--1240 Score: 734 Period size: 206 Copynumber: 2.0 Consensus size: 201 819 GCTTAATAAC * 829 TTTATCAATGGTGAATGTTATTAATTTTTTTAGTCTAAGATTACTAACAAAGTTGTAGTGAATAA 1 TTTATCAATGGTGAATGTTATTAATTTTTTAAGTCTAAGATTACTAACAAAGTTGTAGTGAATAA 894 GATACAACACATTATTATTATATATAAAACTATACCAAAAAAAAGTAGTTGAACATTAGTGGTTG 66 GATACAACACATTATTATTATATATAAAACTATACCAAAAAAAAGTAGTTGAACATTAGTGGTTG 959 ATTTACTAAATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAAGATC 131 ATTTACTAAATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATT-AAGATC 1024 CGATTTA 195 CGATTTA 1031 TTTATCAATGGTGAATGTTATTAATTTTTTAAGTCTAAGATTACTAACAAAGTTGTAGTGAATAA 1 TTTATCAATGGTGAATGTTATTAATTTTTTAAGTCTAAGATTACTAACAAAGTTGTAGTGAATAA * * * 1096 GATACAACATATTACTATTATATATATATAGAACTATACCAAAAAAAATTAGTTGAACATTAGTG 66 GATACAACACA-T--TATTAT-TATATATAAAACTATACCAAAAAAAAGTAGTTGAACATTAGTG * 1161 GTTGATTTATTAAATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAG 127 GTTGATTTACTAAATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAG 1226 ATCCGATTTA 192 ATCCGATTTA 1236 TTTAT 1 TTTAT 1241 TATTAAGGAA Statistics Matches: 201, Mismatches: 5, Indels: 5 0.95 0.02 0.02 Matches are distributed among these distances: 202 74 0.37 203 1 0.00 205 24 0.12 206 102 0.51 ACGTcount: A:0.44, C:0.08, G:0.11, T:0.37 Consensus pattern (201 bp): TTTATCAATGGTGAATGTTATTAATTTTTTAAGTCTAAGATTACTAACAAAGTTGTAGTGAATAA GATACAACACATTATTATTATATATAAAACTATACCAAAAAAAAGTAGTTGAACATTAGTGGTTG ATTTACTAAATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAGATCC GATTTA Found at i:1347 original size:25 final size:24 Alignment explanation
Indices: 1313--1359 Score: 85 Period size: 25 Copynumber: 1.9 Consensus size: 24 1303 ACGTTTGCAC 1313 AAATACCTAAGAATTTGAATTAAAA 1 AAATACCTAAGAATTT-AATTAAAA 1338 AAATACCTAAGAATTTAATTAA 1 AAATACCTAAGAATTTAATTAA 1360 TATAAGTATT Statistics Matches: 22, Mismatches: 0, Indels: 1 0.96 0.00 0.04 Matches are distributed among these distances: 24 6 0.27 25 16 0.73 ACGTcount: A:0.55, C:0.09, G:0.06, T:0.30 Consensus pattern (24 bp): AAATACCTAAGAATTTAATTAAAA Found at i:1693 original size:413 final size:402 Alignment explanation
Indices: 1174--1975 Score: 1392 Period size: 413 Copynumber: 2.0 Consensus size: 402 1164 GATTTATTAA 1174 ATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAGATCCGATTTATTT 1 ATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAGATCCGATTTATTT * 1239 ATTATTAAGGAAACAATATTTCTTTTTTTTTTTGCCAACAAAACAATATTTC-TTTTTAGTC-AA 66 ATTATTAAGGAAACAATATTTCTTTTTTTTTTTACCAACAAAACAATATTTCTTTTTTAGTCAAA 1302 TACGTTTGCACAAATACCTAAGAATTTGAATTAAAAAAATACCTAAGAATTTAATTAATATAAGT 131 TACGTTTGCACAAATACCTAAGAATTTGAATTAAAAAAATACCTAAGAATTTAATTAATATAAGT 1367 ATTTCAGTTATTATAGTATTACATTTAATTAATGTAAGTATTTTAGTTATTATATATATATTACA 196 ATTTCAGTTATTATAGTATTACATTTAATTAATGTAAGTATTTTAGTTA-T-TATATATATTACA 1432 TAGGAATTAAAAATTAATTGAAATAACGGTGCGGTAAAAGAAATTATAAATTTTAATATAATAAT 259 TAGGAATTAAAAATTAATTGAAATAACGGTGCGGTAAAAGAAATTATAAATTTTAATATAATAAT * * 1497 ATGATTTAATTTAATTGAGAAATGAAATTACATATTGAATCTTAATAGTTTAATTTGATAAATAC 324 AT-ATTTAATTTAATTGAGAAATGAAATTACATATTGAACCTTAAAAGTTTAATTTGATAAATAC 1562 ATTAGTGGTTGATTT 388 ATTAGTGGTTGATTT * * 1577 ATTAAATTAGATCAATGTCAAACTAAAAATTTCCAAAAAATTTATAAAAAGNTATTTAATGATCT 1 ATTAAATTAGATCAATGTCAAAC--AAAATTT-C--AAAA-TTAT-AAAAGATA-TTAA-GATCC * 1642 GATTTATTTGTTATTAATGGAAACAATATTTCTTTTTTTTTTTACCAACAAAACAATATTTCTTT 57 GATTTATTTATTATTAA-GGAAACAATATTTCTTTTTTTTTTTACCAACAAAACAATATTTCTTT 1707 TTTAGTCAAATACGTTTGCACAAATACCTAAGAATTTGAATTAAAAAAATACCTAAGAATTTAAT 121 TTTAGTCAAATACGTTTGCACAAATACCTAAGAATTTGAATTAAAAAAATACCTAAGAATTTAAT 1772 TAATATAAGTATTTCAGTTATTATAGTATTACATTTAATTAATGTAAGTATTTTAGTTATTATAT 186 TAATATAAGTATTTCAGTTATTATAGTATTACATTTAATTAATGTAAGTATTTTAGTTATTATAT * * 1837 ATATTACATAGGAATTAAAAGTTAATTGAAATAAGGGTGCGGTAAAAGAAATTATAAATTTTAAT 251 ATATTACATAGGAATTAAAAATTAATTGAAATAACGGTGCGGTAAAAGAAATTATAAATTTTAAT * 1902 ATAATAATATATTTAATTTAATTGATAAATGAAATTACATATTGAACCTTAAAAGTTTAATTTGA 316 ATAATAATATATTTAATTTAATTGAGAAATGAAATTACATATTGAACCTTAAAAGTTTAATTTGA 1967 TAAATACAT 381 TAAATACAT 1976 ATTTACCCTT Statistics Matches: 378, Mismatches: 9, Indels: 15 0.94 0.02 0.04 Matches are distributed among these distances: 403 23 0.06 405 7 0.02 406 1 0.00 408 4 0.01 409 4 0.01 410 7 0.02 411 4 0.01 412 81 0.21 413 121 0.32 414 10 0.03 415 116 0.31 ACGTcount: A:0.43, C:0.07, G:0.09, T:0.40 Consensus pattern (402 bp): ATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAGATCCGATTTATTT ATTATTAAGGAAACAATATTTCTTTTTTTTTTTACCAACAAAACAATATTTCTTTTTTAGTCAAA TACGTTTGCACAAATACCTAAGAATTTGAATTAAAAAAATACCTAAGAATTTAATTAATATAAGT ATTTCAGTTATTATAGTATTACATTTAATTAATGTAAGTATTTTAGTTATTATATATATTACATA GGAATTAAAAATTAATTGAAATAACGGTGCGGTAAAAGAAATTATAAATTTTAATATAATAATAT ATTTAATTTAATTGAGAAATGAAATTACATATTGAACCTTAAAAGTTTAATTTGATAAATACATT AGTGGTTGATTT Found at i:1762 original size:25 final size:24 Alignment explanation
Indices: 1728--1774 Score: 85 Period size: 25 Copynumber: 1.9 Consensus size: 24 1718 ACGTTTGCAC 1728 AAATACCTAAGAATTTGAATTAAAA 1 AAATACCTAAGAATTT-AATTAAAA 1753 AAATACCTAAGAATTTAATTAA 1 AAATACCTAAGAATTTAATTAA 1775 TATAAGTATT Statistics Matches: 22, Mismatches: 0, Indels: 1 0.96 0.00 0.04 Matches are distributed among these distances: 24 6 0.27 25 16 0.73 ACGTcount: A:0.55, C:0.09, G:0.06, T:0.30 Consensus pattern (24 bp): AAATACCTAAGAATTTAATTAAAA Found at i:1820 original size:39 final size:40 Alignment explanation
Indices: 1765--1845 Score: 128 Period size: 39 Copynumber: 2.0 Consensus size: 40 1755 ATACCTAAGA * 1765 ATTTAATTAATATAAGTATTTCAGTTATTATA-GTATTAC 1 ATTTAATTAATATAAGTATTTCAGTTATTATATATATTAC * * 1804 ATTTAATTAATGTAAGTATTTTAGTTATTATATATATTAC 1 ATTTAATTAATATAAGTATTTCAGTTATTATATATATTAC 1844 AT 1 AT 1846 AGGAATTAAA Statistics Matches: 38, Mismatches: 3, Indels: 1 0.90 0.07 0.02 Matches are distributed among these distances: 39 30 0.79 40 8 0.21 ACGTcount: A:0.38, C:0.04, G:0.07, T:0.51 Consensus pattern (40 bp): ATTTAATTAATATAAGTATTTCAGTTATTATATATATTAC Found at i:4672 original size:19 final size:19 Alignment explanation
Indices: 4648--4687 Score: 80 Period size: 19 Copynumber: 2.1 Consensus size: 19 4638 TTAGGGATCC 4648 AGTAGATAATTATTTGAAT 1 AGTAGATAATTATTTGAAT 4667 AGTAGATAATTATTTGAAT 1 AGTAGATAATTATTTGAAT 4686 AG 1 AG 4688 ACATTAGAAT Statistics Matches: 21, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 19 21 1.00 ACGTcount: A:0.42, C:0.00, G:0.17, T:0.40 Consensus pattern (19 bp): AGTAGATAATTATTTGAAT Found at i:6375 original size:22 final size:22 Alignment explanation
Indices: 6146--6729 Score: 178 Period size: 22 Copynumber: 26.4 Consensus size: 22 6136 CTCCAACATA * ** 6146 GAAATATTGATAACCACACCGT 1 GAAATTTTGATAACCACACTAT * * * * * 6168 GAAAATTCGATAACCTCATTGT 1 GAAATTTTGATAACCACACTAT * * * 6190 GAAATTTCGATAACCTCCCTAT 1 GAAATTTTGATAACCACACTAT * * * 6212 GAAAATTTGATAACCACAATGT 1 GAAATTTTGATAACCACACTAT * 6234 GAAATTTTGATAACCACACTGT 1 GAAATTTTGATAACCACACTAT * * 6256 GAAATTCTGATAACCACACAAT 1 GAAATTTTGATAACCACACTAT * * 6278 GAAGTTTTGATAACCTCATTGTCTAT 1 GAAATTTTGATAACCACA----CTAT * * 6304 GAAATTTTGATAATCACATTAT 1 GAAATTTTGATAACCACACTAT * * * * 6326 -AAA-ATTGCTAATCGCACTAT 1 GAAATTTTGATAACCACACTAT * 6346 GAAAATTTTGATAACCACACCAT 1 G-AAATTTTGATAACCACACTAT * * * 6369 GAAATTTCGAGAACTTCCCTA-TAAGAAT 1 GAAATTTTGATAAC--CAC-ACT----AT * ** * 6397 GAAATTGTGATATTCTCTA-TAT 1 GAAATTTTGATAACCAC-ACTAT * * * * 6419 GTAATTTTGATAACCTCTCCAT 1 GAAATTTTGATAACCACACTAT * * * * * 6441 -AATAATTTCATAAGCTCCCTAT 1 GAA-ATTTTGATAACCACACTAT * * 6463 GAAATTTTGTTAACCATC-CTAG 1 GAAATTTTGATAACCA-CACTAT * 6485 GAAATTTTGATAA-GA-AC--- 1 GAAATTTTGATAACCACACTAT **** 6502 -AAATTTTGATAA-CGTTTTAAT 1 GAAATTTTGATAACCACACT-AT * * 6523 -TAATTTTGATAATCACACTAT 1 GAAATTTTGATAACCACACTAT * ** * * 6544 AAAATTTCAATAACCTTC-GTAT 1 GAAATTTTGATAACC-ACACTAT * 6566 GAAATTTTGATAATCTC-CA-TAA 1 GAAATTTTGATAA-C-CACACTAT * **** 6588 GAGATTTTGATAACCTTTTTTAT 1 GAAATTTTGATAACC-ACACTAT * * ** 6611 GAAATTTTGGTAACCTCTGTAT 1 GAAATTTTGATAACCACACTAT ** 6633 GAAATTTTGATAATTACACTAT 1 GAAATTTTGATAACCACACTAT * * 6655 GAAGTTTTGATAACCTC-CATAT 1 GAAATTTTGATAACCACAC-TAT * 6677 GAAATTTTGGTAACCACACTAT 1 GAAATTTTGATAACCACACTAT * ** 6699 GAAATTTTAATAACCTTACTAT 1 GAAATTTTGATAACCACACTAT * 6721 GTAATTTTG 1 GAAATTTTG 6730 GTTTGATTGT Statistics Matches: 413, Mismatches: 114, Indels: 70 0.69 0.19 0.12 Matches are distributed among these distances: 16 12 0.03 20 15 0.04 21 20 0.05 22 294 0.71 23 34 0.08 24 3 0.01 25 1 0.00 26 23 0.06 28 11 0.03 ACGTcount: A:0.37, C:0.16, G:0.11, T:0.36 Consensus pattern (22 bp): GAAATTTTGATAACCACACTAT Done.