Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: AWUE01017795.1 Corchorus olitorius cultivar O-4 contig17828, whole genome shotgun sequence
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 7921
ACGTcount: A:0.36, C:0.14, G:0.14, T:0.36
Warning! 1 characters in sequence are not A, C, G, or T
Found at i:326 original size:36 final size:36
Alignment explanation
Indices: 279--348 Score: 113
Period size: 36 Copynumber: 1.9 Consensus size: 36
269 TCCAATAACC
* *
279 TTACATCTTTTGTGATTTTGGTTATCATATTTCTTA
1 TTACATCTTTTGTAATTTTGATTATCATATTTCTTA
*
315 TTACATTTTTTGTAATTTTGATTATCATATTTCT
1 TTACATCTTTTGTAATTTTGATTATCATATTTCT
349 CAAAAATCTC
Statistics
Matches: 31, Mismatches: 3, Indels: 0
0.91 0.09 0.00
Matches are distributed among these distances:
36 31 1.00
ACGTcount: A:0.21, C:0.10, G:0.09, T:0.60
Consensus pattern (36 bp):
TTACATCTTTTGTAATTTTGATTATCATATTTCTTA
Found at i:1204 original size:206 final size:201
Alignment explanation
Indices: 829--1240 Score: 734
Period size: 206 Copynumber: 2.0 Consensus size: 201
819 GCTTAATAAC
*
829 TTTATCAATGGTGAATGTTATTAATTTTTTTAGTCTAAGATTACTAACAAAGTTGTAGTGAATAA
1 TTTATCAATGGTGAATGTTATTAATTTTTTAAGTCTAAGATTACTAACAAAGTTGTAGTGAATAA
894 GATACAACACATTATTATTATATATAAAACTATACCAAAAAAAAGTAGTTGAACATTAGTGGTTG
66 GATACAACACATTATTATTATATATAAAACTATACCAAAAAAAAGTAGTTGAACATTAGTGGTTG
959 ATTTACTAAATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAAGATC
131 ATTTACTAAATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATT-AAGATC
1024 CGATTTA
195 CGATTTA
1031 TTTATCAATGGTGAATGTTATTAATTTTTTAAGTCTAAGATTACTAACAAAGTTGTAGTGAATAA
1 TTTATCAATGGTGAATGTTATTAATTTTTTAAGTCTAAGATTACTAACAAAGTTGTAGTGAATAA
* * *
1096 GATACAACATATTACTATTATATATATATAGAACTATACCAAAAAAAATTAGTTGAACATTAGTG
66 GATACAACACA-T--TATTAT-TATATATAAAACTATACCAAAAAAAAGTAGTTGAACATTAGTG
*
1161 GTTGATTTATTAAATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAG
127 GTTGATTTACTAAATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAG
1226 ATCCGATTTA
192 ATCCGATTTA
1236 TTTAT
1 TTTAT
1241 TATTAAGGAA
Statistics
Matches: 201, Mismatches: 5, Indels: 5
0.95 0.02 0.02
Matches are distributed among these distances:
202 74 0.37
203 1 0.00
205 24 0.12
206 102 0.51
ACGTcount: A:0.44, C:0.08, G:0.11, T:0.37
Consensus pattern (201 bp):
TTTATCAATGGTGAATGTTATTAATTTTTTAAGTCTAAGATTACTAACAAAGTTGTAGTGAATAA
GATACAACACATTATTATTATATATAAAACTATACCAAAAAAAAGTAGTTGAACATTAGTGGTTG
ATTTACTAAATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAGATCC
GATTTA
Found at i:1347 original size:25 final size:24
Alignment explanation
Indices: 1313--1359 Score: 85
Period size: 25 Copynumber: 1.9 Consensus size: 24
1303 ACGTTTGCAC
1313 AAATACCTAAGAATTTGAATTAAAA
1 AAATACCTAAGAATTT-AATTAAAA
1338 AAATACCTAAGAATTTAATTAA
1 AAATACCTAAGAATTTAATTAA
1360 TATAAGTATT
Statistics
Matches: 22, Mismatches: 0, Indels: 1
0.96 0.00 0.04
Matches are distributed among these distances:
24 6 0.27
25 16 0.73
ACGTcount: A:0.55, C:0.09, G:0.06, T:0.30
Consensus pattern (24 bp):
AAATACCTAAGAATTTAATTAAAA
Found at i:1693 original size:413 final size:402
Alignment explanation
Indices: 1174--1975 Score: 1392
Period size: 413 Copynumber: 2.0 Consensus size: 402
1164 GATTTATTAA
1174 ATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAGATCCGATTTATTT
1 ATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAGATCCGATTTATTT
*
1239 ATTATTAAGGAAACAATATTTCTTTTTTTTTTTGCCAACAAAACAATATTTC-TTTTTAGTC-AA
66 ATTATTAAGGAAACAATATTTCTTTTTTTTTTTACCAACAAAACAATATTTCTTTTTTAGTCAAA
1302 TACGTTTGCACAAATACCTAAGAATTTGAATTAAAAAAATACCTAAGAATTTAATTAATATAAGT
131 TACGTTTGCACAAATACCTAAGAATTTGAATTAAAAAAATACCTAAGAATTTAATTAATATAAGT
1367 ATTTCAGTTATTATAGTATTACATTTAATTAATGTAAGTATTTTAGTTATTATATATATATTACA
196 ATTTCAGTTATTATAGTATTACATTTAATTAATGTAAGTATTTTAGTTA-T-TATATATATTACA
1432 TAGGAATTAAAAATTAATTGAAATAACGGTGCGGTAAAAGAAATTATAAATTTTAATATAATAAT
259 TAGGAATTAAAAATTAATTGAAATAACGGTGCGGTAAAAGAAATTATAAATTTTAATATAATAAT
* *
1497 ATGATTTAATTTAATTGAGAAATGAAATTACATATTGAATCTTAATAGTTTAATTTGATAAATAC
324 AT-ATTTAATTTAATTGAGAAATGAAATTACATATTGAACCTTAAAAGTTTAATTTGATAAATAC
1562 ATTAGTGGTTGATTT
388 ATTAGTGGTTGATTT
* *
1577 ATTAAATTAGATCAATGTCAAACTAAAAATTTCCAAAAAATTTATAAAAAGNTATTTAATGATCT
1 ATTAAATTAGATCAATGTCAAAC--AAAATTT-C--AAAA-TTAT-AAAAGATA-TTAA-GATCC
*
1642 GATTTATTTGTTATTAATGGAAACAATATTTCTTTTTTTTTTTACCAACAAAACAATATTTCTTT
57 GATTTATTTATTATTAA-GGAAACAATATTTCTTTTTTTTTTTACCAACAAAACAATATTTCTTT
1707 TTTAGTCAAATACGTTTGCACAAATACCTAAGAATTTGAATTAAAAAAATACCTAAGAATTTAAT
121 TTTAGTCAAATACGTTTGCACAAATACCTAAGAATTTGAATTAAAAAAATACCTAAGAATTTAAT
1772 TAATATAAGTATTTCAGTTATTATAGTATTACATTTAATTAATGTAAGTATTTTAGTTATTATAT
186 TAATATAAGTATTTCAGTTATTATAGTATTACATTTAATTAATGTAAGTATTTTAGTTATTATAT
* *
1837 ATATTACATAGGAATTAAAAGTTAATTGAAATAAGGGTGCGGTAAAAGAAATTATAAATTTTAAT
251 ATATTACATAGGAATTAAAAATTAATTGAAATAACGGTGCGGTAAAAGAAATTATAAATTTTAAT
*
1902 ATAATAATATATTTAATTTAATTGATAAATGAAATTACATATTGAACCTTAAAAGTTTAATTTGA
316 ATAATAATATATTTAATTTAATTGAGAAATGAAATTACATATTGAACCTTAAAAGTTTAATTTGA
1967 TAAATACAT
381 TAAATACAT
1976 ATTTACCCTT
Statistics
Matches: 378, Mismatches: 9, Indels: 15
0.94 0.02 0.04
Matches are distributed among these distances:
403 23 0.06
405 7 0.02
406 1 0.00
408 4 0.01
409 4 0.01
410 7 0.02
411 4 0.01
412 81 0.21
413 121 0.32
414 10 0.03
415 116 0.31
ACGTcount: A:0.43, C:0.07, G:0.09, T:0.40
Consensus pattern (402 bp):
ATTAAATTAGATCAATGTCAAACAAAATTTCAAAATTATAAAAGATATTAAGATCCGATTTATTT
ATTATTAAGGAAACAATATTTCTTTTTTTTTTTACCAACAAAACAATATTTCTTTTTTAGTCAAA
TACGTTTGCACAAATACCTAAGAATTTGAATTAAAAAAATACCTAAGAATTTAATTAATATAAGT
ATTTCAGTTATTATAGTATTACATTTAATTAATGTAAGTATTTTAGTTATTATATATATTACATA
GGAATTAAAAATTAATTGAAATAACGGTGCGGTAAAAGAAATTATAAATTTTAATATAATAATAT
ATTTAATTTAATTGAGAAATGAAATTACATATTGAACCTTAAAAGTTTAATTTGATAAATACATT
AGTGGTTGATTT
Found at i:1762 original size:25 final size:24
Alignment explanation
Indices: 1728--1774 Score: 85
Period size: 25 Copynumber: 1.9 Consensus size: 24
1718 ACGTTTGCAC
1728 AAATACCTAAGAATTTGAATTAAAA
1 AAATACCTAAGAATTT-AATTAAAA
1753 AAATACCTAAGAATTTAATTAA
1 AAATACCTAAGAATTTAATTAA
1775 TATAAGTATT
Statistics
Matches: 22, Mismatches: 0, Indels: 1
0.96 0.00 0.04
Matches are distributed among these distances:
24 6 0.27
25 16 0.73
ACGTcount: A:0.55, C:0.09, G:0.06, T:0.30
Consensus pattern (24 bp):
AAATACCTAAGAATTTAATTAAAA
Found at i:1820 original size:39 final size:40
Alignment explanation
Indices: 1765--1845 Score: 128
Period size: 39 Copynumber: 2.0 Consensus size: 40
1755 ATACCTAAGA
*
1765 ATTTAATTAATATAAGTATTTCAGTTATTATA-GTATTAC
1 ATTTAATTAATATAAGTATTTCAGTTATTATATATATTAC
* *
1804 ATTTAATTAATGTAAGTATTTTAGTTATTATATATATTAC
1 ATTTAATTAATATAAGTATTTCAGTTATTATATATATTAC
1844 AT
1 AT
1846 AGGAATTAAA
Statistics
Matches: 38, Mismatches: 3, Indels: 1
0.90 0.07 0.02
Matches are distributed among these distances:
39 30 0.79
40 8 0.21
ACGTcount: A:0.38, C:0.04, G:0.07, T:0.51
Consensus pattern (40 bp):
ATTTAATTAATATAAGTATTTCAGTTATTATATATATTAC
Found at i:4672 original size:19 final size:19
Alignment explanation
Indices: 4648--4687 Score: 80
Period size: 19 Copynumber: 2.1 Consensus size: 19
4638 TTAGGGATCC
4648 AGTAGATAATTATTTGAAT
1 AGTAGATAATTATTTGAAT
4667 AGTAGATAATTATTTGAAT
1 AGTAGATAATTATTTGAAT
4686 AG
1 AG
4688 ACATTAGAAT
Statistics
Matches: 21, Mismatches: 0, Indels: 0
1.00 0.00 0.00
Matches are distributed among these distances:
19 21 1.00
ACGTcount: A:0.42, C:0.00, G:0.17, T:0.40
Consensus pattern (19 bp):
AGTAGATAATTATTTGAAT
Found at i:6375 original size:22 final size:22
Alignment explanation
Indices: 6146--6729 Score: 178
Period size: 22 Copynumber: 26.4 Consensus size: 22
6136 CTCCAACATA
* **
6146 GAAATATTGATAACCACACCGT
1 GAAATTTTGATAACCACACTAT
* * * * *
6168 GAAAATTCGATAACCTCATTGT
1 GAAATTTTGATAACCACACTAT
* * *
6190 GAAATTTCGATAACCTCCCTAT
1 GAAATTTTGATAACCACACTAT
* * *
6212 GAAAATTTGATAACCACAATGT
1 GAAATTTTGATAACCACACTAT
*
6234 GAAATTTTGATAACCACACTGT
1 GAAATTTTGATAACCACACTAT
* *
6256 GAAATTCTGATAACCACACAAT
1 GAAATTTTGATAACCACACTAT
* *
6278 GAAGTTTTGATAACCTCATTGTCTAT
1 GAAATTTTGATAACCACA----CTAT
* *
6304 GAAATTTTGATAATCACATTAT
1 GAAATTTTGATAACCACACTAT
* * * *
6326 -AAA-ATTGCTAATCGCACTAT
1 GAAATTTTGATAACCACACTAT
*
6346 GAAAATTTTGATAACCACACCAT
1 G-AAATTTTGATAACCACACTAT
* * *
6369 GAAATTTCGAGAACTTCCCTA-TAAGAAT
1 GAAATTTTGATAAC--CAC-ACT----AT
* ** *
6397 GAAATTGTGATATTCTCTA-TAT
1 GAAATTTTGATAACCAC-ACTAT
* * * *
6419 GTAATTTTGATAACCTCTCCAT
1 GAAATTTTGATAACCACACTAT
* * * * *
6441 -AATAATTTCATAAGCTCCCTAT
1 GAA-ATTTTGATAACCACACTAT
* *
6463 GAAATTTTGTTAACCATC-CTAG
1 GAAATTTTGATAACCA-CACTAT
*
6485 GAAATTTTGATAA-GA-AC---
1 GAAATTTTGATAACCACACTAT
****
6502 -AAATTTTGATAA-CGTTTTAAT
1 GAAATTTTGATAACCACACT-AT
* *
6523 -TAATTTTGATAATCACACTAT
1 GAAATTTTGATAACCACACTAT
* ** * *
6544 AAAATTTCAATAACCTTC-GTAT
1 GAAATTTTGATAACC-ACACTAT
*
6566 GAAATTTTGATAATCTC-CA-TAA
1 GAAATTTTGATAA-C-CACACTAT
* ****
6588 GAGATTTTGATAACCTTTTTTAT
1 GAAATTTTGATAACC-ACACTAT
* * **
6611 GAAATTTTGGTAACCTCTGTAT
1 GAAATTTTGATAACCACACTAT
**
6633 GAAATTTTGATAATTACACTAT
1 GAAATTTTGATAACCACACTAT
* *
6655 GAAGTTTTGATAACCTC-CATAT
1 GAAATTTTGATAACCACAC-TAT
*
6677 GAAATTTTGGTAACCACACTAT
1 GAAATTTTGATAACCACACTAT
* **
6699 GAAATTTTAATAACCTTACTAT
1 GAAATTTTGATAACCACACTAT
*
6721 GTAATTTTG
1 GAAATTTTG
6730 GTTTGATTGT
Statistics
Matches: 413, Mismatches: 114, Indels: 70
0.69 0.19 0.12
Matches are distributed among these distances:
16 12 0.03
20 15 0.04
21 20 0.05
22 294 0.71
23 34 0.08
24 3 0.01
25 1 0.00
26 23 0.06
28 11 0.03
ACGTcount: A:0.37, C:0.16, G:0.11, T:0.36
Consensus pattern (22 bp):
GAAATTTTGATAACCACACTAT
Done.