Tandem Repeats Finder Program written by:
Gary Benson
Program in Bioinformatics
Boston University
Version 4.09
Sequence: AWUE01024320.1 Corchorus olitorius cultivar O-4 contig24353, whole genome shotgun sequence
Parameters: 2 7 7 80 10 50 1000
Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000
Length: 3653
ACGTcount: A:0.27, C:0.20, G:0.18, T:0.36
Found at i:295 original size:154 final size:153
Alignment explanation
Indices: 9--2100 Score: 2716
Period size: 154 Copynumber: 13.5 Consensus size: 153
1 CTTGAGCT
* * *
9 TATCGGGGCCCATTAGTGACGTTTTGAATCGACTTCGATATGGAAAGAAACCCTCGATGCTTTTC
1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGAT-TTG---GAAACCCTCAATGCTTTTC
* * * *
74 TTTCCATTGTTTATGCCCCAACTATAATCATTTTGCTGAGATTAGTCCACTATGAAGGTTTTAGC
62 TTTCCATTGTTTATGGCCTAACTATAATCATTTTG-TGAGATTAGTCCACTGTGAAGTTTTTAGC
* *
139 TCATTTGGAACGCTTGTTATTTTGTGCT
126 TCATTTGGAACACTTGTTATTTTGTGCC
* * * * *
167 TTTCGGGGCCCATTAGT-TCTGTTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCATTTATTT
1 TATCGGGGCCCATTAGTGAC-GTTTTGAATCGTCTTCGATTTGGAAACCCTCAATGCTTTTCTTT
* *
231 CCATTGTTTAAGGCCTAACTATAATCATTTTGTTTAGATTAGTCCACTGTGAAGTTTTTAGCTCA
65 CCATTGTTTATGGCCTAACTATAATCATTTTG-TGAGATTAGTCCACTGTGAAGTTTTTAGCTCA
296 TTTGGAACACTTGTTATTTTGTGCC
129 TTTGGAACACTTGTTATTTTGTGCC
* * * *
321 TTTCGGGGCCCATTAGT-TCTGTTTTGAATCGTCTTCGTTTTGGAAAACCTCAATGC-TTTCTTT
1 TATCGGGGCCCATTAGTGAC-GTTTTGAATCGTCTTCGATTTGGAAACCCTCAATGCTTTTCTTT
*
384 CCATTGTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAA-ATTTTAGCTCA
65 CCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAGCTCA
*
448 TTTGGAACACCTGTTATTTTGTGCC
129 TTTGGAACACTTGTTATTTTGTGCC
* * * * * *
473 TATCAGGGCCCATTAGTGAGGTTTTGAACCGTTTTCGATTT-GACAAACCTCAATGCTTTTCTTA
1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGA-AACCCTCAATGCTTTTCTTT
* * *
537 ACATTCTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAA-ATTTTAGCTCA
65 CCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAGCTCA
* *
601 TTTGGAACACCTGTTATTTTATGCC
129 TTTGGAACACTTGTTATTTTGTGCC
* * * * * * *
626 TATCAGGGCCCATTAATGACGTTTTGAACCGTCTACGATTT-GACAAACTTCAATTCTTTTCTTT
1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGA-AACCCTCAATGCTTTTCTTT
*
690 CCATTGTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAAGTTTTTATCTCA
65 CCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAGCTCA
755 TTTGGAACACTTGTTATTTTGTGCC
129 TTTGGAACACTTGTTATTTTGTGCC
* * *
780 GT-TCGGGGCCCATTAGT-TCTGTTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTT
1 -TATCGGGGCCCATTAGTGAC-GTTTTGAATCGTCTTCGATTTGGAAACCCTCAATGCTTTTCTT
* *
843 TCCATTATTTATGGCCTAACTATAATCATTTTGGTGAGATTAGTCCACTGTAAAGTTTTTAGCTC
64 TCCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAGCTC
* *
908 ATTTGGAACACTCGTTATTTTGGGCC
128 ATTTGGAACACTTGTTATTTTGTGCC
* ** * *
934 TATCAGGGCCCATTAGTGAATTTTTGAATCGTCTTCGATTTTGCAAA-CCTCCATGCTTTTCTTT
1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGA-TTTGGAAACCCTCAATGCTTTTCTTT
* * * *
998 CTAATGTTTATGGCCTAAGTATAATCATTTTAGTGAGATCAGTCCACTGTGAAGTTTTTAGCTCA
65 CCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAGCTCA
* *
1063 TTTGGAACACCTGTTATTTTGGGCC
129 TTTGGAACACTTGTTATTTTGTGCC
* * *
1088 TATCAGGGCCCCTTAGTGACGTTTTGAATCGTCTTCGATTTGGCAAA-CCTCAATGCGTTTCTTT
1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGG-AAACCCTCAATGCTTTTCTTT
* *
1152 CCATTGTTTATGGCCTAACTATAATCATTTTGGTGAGATTAGTCCACTGTAAAGTTTTTAGATTC
65 CCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAG-CTC
*
1217 ATTTGGAACTACTTGTTATTTTGGGCC
128 ATTTGGAAC-ACTTGTTATTTTGTGCC
* * * * *
1244 TATCAGGGCCCATT-GTTGACGTTTTGGAATCGTCTTCCATTTGGTCTAAA-CCTTAAGGGTTTT
1 TATCGGGGCCCATTAG-TGACGTTTT-GAATCGTCTTCGATTTGG---AAACCCTCAATGCTTTT
* * ** * *
1307 CTTTTCCATTGTTTATGGCCTAACTATAATAATTTTGTTGAGGTTAGGGCTCTGTGTAAATTTTT
61 C-TTTCCATTGTTTATGGCCTAACTATAATCATTTTG-TGAGATTAGTCCACTGTG-AAGTTTTT
*
1372 AGCTCATTTGGAACACTTGTTATTTTGGGCC
123 AGCTCATTTGGAACACTTGTTATTTTGTGCC
* *
1403 TTTCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGCAAA-CCTCAAT-TTTTTCTTT
1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGG-AAACCCTCAATGCTTTTCTTT
*
1466 CCATTGTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAA-ATTTTAGCTCA
65 CCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAGCTCA
*
1530 TTTGGAACACCTGTTATTTTGTGCC
129 TTTGGAACACTTGTTATTTTGTGCC
* * * *
1555 TATCAGGGCCCATTAGTGACGTTTTGAACCGTCTTCGATTT-GACAACCCTCGATGCCTTTCTTT
1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGA-AACCCTCAATGCTTTTCTTT
*
1619 CCATTGTTTATGGCCTATCTATAATCATTTTGCTGAGATTAGTCCACTGTGAAGTTTTTAGCTCA
65 CCATTGTTTATGGCCTAACTATAATCATTTTG-TGAGATTAGTCCACTGTGAAGTTTTTAGCTCA
1684 TTTGGAACACTTGTTATTTTGTGCC
129 TTTGGAACACTTGTTATTTTGTGCC
* * * * *
1709 TTTCGGGGCCCATTAGT-TCTATTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTTT
1 TATCGGGGCCCATTAGTGAC-GTTTTGAATCGTCTTCGATTTGGAAACCCTCAATGCTTTTCTTT
* *
1773 CCATTGTTTATGGCCTAACTATAATTATTTTGCTGA-ATTTAGTCCACTATGAAGTTTTTAGCTC
65 CCATTGTTTATGGCCTAACTATAATCATTTTG-TGAGA-TTAGTCCACTGTGAAGTTTTTAGCTC
1837 ATTTGGAACACTTGTTATTTTGTGCC
128 ATTTGGAACACTTGTTATTTTGTGCC
* * * * *
1863 TTTCGGGGCCCATTAGT-TCTGTTTTGAATCATCTTCGATTTGGAAACCCTCGATGCCTTTCTTT
1 TATCGGGGCCCATTAGTGAC-GTTTTGAATCGTCTTCGATTTGGAAACCCTCAATGCTTTTCTTT
* * *
1927 CCACTGTTTATGGCCTAACTATAATTATTTTGCTGA-ATTTAGTCCACTATGAAGTTTTTAGCTC
65 CCATTGTTTATGGCCTAACTATAATCATTTTG-TGAGA-TTAGTCCACTGTGAAGTTTTTAGCTC
* *
1991 ATTTGGAACACTTGTTATTTTGAGCT
128 ATTTGGAACACTTGTTATTTTGTGCC
*
2017 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGCAAA-CCTTAATGCTTTTCTTT
1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGG-AAACCCTCAATGCTTTTCTTT
*
2081 CCAATGTTTATGGCCTAACT
65 CCATTGTTTATGGCCTAACT
2101 GATACGAATC
Statistics
Matches: 1748, Mismatches: 152, Indels: 72
0.89 0.08 0.04
Matches are distributed among these distances:
150 1 0.00
151 5 0.00
152 157 0.09
153 322 0.18
154 993 0.57
155 34 0.02
156 46 0.03
157 20 0.01
158 51 0.03
159 52 0.03
160 58 0.03
161 9 0.01
ACGTcount: A:0.22, C:0.19, G:0.18, T:0.41
Consensus pattern (153 bp):
TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGAAACCCTCAATGCTTTTCTTTC
CATTGTTTATGGCCTAACTATAATCATTTTGTGAGATTAGTCCACTGTGAAGTTTTTAGCTCATT
TGGAACACTTGTTATTTTGTGCC
Found at i:1856 original size:929 final size:922
Alignment explanation
Indices: 9--2100 Score: 3112
Period size: 929 Copynumber: 2.3 Consensus size: 922
1 CTTGAGCT
* * * *
9 TATCGGGGCCCATTAGTGACGTTTTGAATCGACTTCGATATGGAAAGAAACCCTCGATGCTTTTC
1 TATCGGGGCCCATTAGTGACTTTTTGAATCGTCTTCGATTTTG---GAAACCCTCGATGCTTTTC
* * * *
74 TTTCCATTGTTTATGCCCCAACTATAATCATTTTGCTGAGATTAGTCCACTATGAAGGTTTTAGC
63 TTTCCAATGTTTATGGCCTAACTATAATCATTTTGCTGAGATTAGTCCACTATGAAGTTTTTAGC
* * * *
139 TCATTTGGAACGCTTGTTATTTTGTGCTTTTCGGGGCCCATTAGT-TCTGTTTTGAATCGTCTTC
128 TCATTTGGAACACTTGTTATTTTGAGCTTATCGGGGCCCATTAGTGAC-GTTTTGAATCGTCTTC
* * * * *
203 GATTTGG-AAACCCTCGATGCATTTATTTCCATTGTTTAAGGCCTAACTATAATCATTTTGTTTA
192 GATTTGGCAAA-CCTCAATGCATTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTGGTGA
* * * *
267 GATTAGTCCACTGTGAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGTGCCTTTCGGGGCCC
256 GATTAGTCCACTGTAAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGGGCCTATCAGGGCCC
** *
332 ATTAGTTCTGTTTTGAATCGTCTTCGTTTTGGAAAACCTCAATGCTTTCTTTCCATTGTTTATGG
321 ATTAGTTCTGTTTTGAATCGTCTTCCATTTGGAAAACCTCAAGGCTTTCTTTCCATTGTTTATGG
* *
397 CCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAAATTTTAGCTCATTTGGAACACCTGT
386 CCTAACTATAATAATTTTAGTGAGATTAGGCCACTGTGAAATTTTAGCTCATTTGGAACACCTGT
* * *
462 TATTTTGTGCCTATCAGGGCCCATTAGTGAGGTTTTGAACCGTTTTCGATTTGACAAACCTCAAT
451 TATTTTGGGCCTATCAGGGCCCATTAGTGACGTTTTGAACCGTCTTCGATTTGACAAACCTCAAT
527 GCTTTTCTTAACATTCTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAAAT
516 GCTTTTCTTAACATTCTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAAAT
592 TTTAGCTCATTTGGAACACCTGTTATTTTATGCCTATCAGGGCCCATTAATGACGTTTTGAACCG
581 TTTAGCTCATTTGGAACACCTGTTATTTTATGCCTATCAGGGCCCATTAATGACGTTTTGAACCG
* * *
657 TCTACGATTTGACAAACTTCAATTCTTTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTA
646 TCTACGATTTGACAAACCTCAATGCCTTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTA
*
722 GTGAGATTAGTCCACTGTGAAGTTTTTATCTCATTTGGAACACTTGTTATTTTGTGCCGTTCGGG
711 GTGAGATTAGTCCACTGTGAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGTGCCGTTCGGG
*
787 GCCCATTAGTTCTGTTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTTTCCATTATT
776 GCCCATTAGTTCTATTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTTTCCATTATT
* *
852 TATGGCCTAACTATAATCATTTTGGTGAGATTAGTCCACTGTAAAGTTTTTAGCTCATTTGGAAC
841 TATGGCCTAACTATAATCATTTTGCTGAGATTAGTCCACTATAAAGTTTTTAGCTCATTTGGAAC
917 ACTCGTTATTTTGGGCC
906 ACTCGTTATTTTGGGCC
* * * *
934 TATCAGGGCCCATTAGTGAATTTTTGAATCGTCTTCGATTTTGCAAA-CCTCCATGCTTTTCTTT
1 TATCGGGGCCCATTAGTGACTTTTTGAATCGTCTTCGATTTTGGAAACCCTCGATGCTTTTCTTT
* * * *
998 CTAATGTTTATGGCCTAAGTATAATCATTTTAG-TGAGATCAGTCCACTGTGAAGTTTTTAGCTC
66 CCAATGTTTATGGCCTAACTATAATCATTTT-GCTGAGATTAGTCCACTATGAAGTTTTTAGCTC
* * * * *
1062 ATTTGGAACACCTGTTATTTTGGGCCTATCAGGGCCCCTTAGTGACGTTTTGAATCGTCTTCGAT
130 ATTTGGAACACTTGTTATTTTGAGCTTATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGAT
*
1127 TTGGCAAACCTCAATGCGTTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTGGTGAGATT
195 TTGGCAAACCTCAATGCATTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTGGTGAGATT
*
1192 AGTCCACTGTAAAGTTTTTAGATTCATTTGGAACTACTTGTTATTTTGGGCCTATCAGGGCCCAT
260 AGTCCACTGTAAAGTTTTTAG-CTCATTTGGAAC-ACTTGTTATTTTGGGCCTATCAGGGCCCAT
* * *
1257 T-GTTGAC-GTTTTGGAATCGTCTTCCATTTGGTCTAAACCTTAAGGGTTTTCTTTTCCATTGTT
323 TAGTT--CTGTTTT-GAATCGTCTTCCATTTGG--AAAACCTCAA-GGCTTTC-TTTCCATTGTT
* * *
1320 TATGGCCTAACTATAATAATTTT-GTTGAGGTTAGGGCTCTGTGTAAATTTTTAGCTCATTTGGA
381 TATGGCCTAACTATAATAATTTTAG-TGAGATTAGGCCACTGTG-AAA-TTTTAGCTCATTTGGA
* * * * *
1384 ACACTTGTTATTTTGGGCCTTTCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGCAA
443 ACACCTGTTATTTTGGGCCTATCAGGGCCCATTAGTGACGTTTTGAACCGTCTTCGATTTGACAA
* ** *
1449 ACCTCAAT-TTTTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCAC
508 ACCTCAATGCTTTTCTTAACATTCTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCAC
* *
1513 TGTGAAATTTTAGCTCATTTGGAACACCTGTTATTTTGTGCCTATCAGGGCCCATTAGTGACGTT
573 TGTGAAATTTTAGCTCATTTGGAACACCTGTTATTTTATGCCTATCAGGGCCCATTAATGACGTT
* * * *
1578 TTGAACCGTCTTCGATTTGACAACCCTCGATGCCTTTCTTTCCATTGTTTATGGCCTATCTATAA
638 TTGAACCGTCTACGATTTGACAAACCTCAATGCCTTTCTTTCCATTGTTTATGGCCTAACTATAA
1643 TCATTTT-GCTGAGATTAGTCCACTGTGAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGTG
703 TCATTTTAG-TGAGATTAGTCCACTGTGAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGTG
*
1707 CCTTTCGGGGCCCATTAGTTCTATTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTT
767 CCGTTCGGGGCCCATTAGTTCTATTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTT
* * *
1772 TCCATTGTTTATGGCCTAACTATAATTATTTTGCTGA-ATTTAGTCCACTATGAAGTTTTTAGCT
832 TCCATTATTTATGGCCTAACTATAATCATTTTGCTGAGA-TTAGTCCACTATAAAGTTTTTAGCT
* *
1836 CATTTGGAACACTTGTTATTTTGTGCC
896 CATTTGGAACACTCGTTATTTTGGGCC
* * * *
1863 TTTCGGGGCCCATTAGT-TCTGTTTTGAATCATCTTCGA-TTTGGAAACCCTCGATGCCTTTCTT
1 TATCGGGGCCCATTAGTGACT-TTTTGAATCGTCTTCGATTTTGGAAACCCTCGATGCTTTTCTT
* *
1926 TCCACTGTTTATGGCCTAACTATAATTATTTTGCTGA-ATTTAGTCCACTATGAAGTTTTTAGCT
65 TCCAATGTTTATGGCCTAACTATAATCATTTTGCTGAGA-TTAGTCCACTATGAAGTTTTTAGCT
1990 CATTTGGAACACTTGTTATTTTGAGCTTATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGA
129 CATTTGGAACACTTGTTATTTTGAGCTTATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGA
* * *
2055 TTTGGCAAACCTTAATGCTTTTCTTTCCAATGTTTATGGCCTAACT
194 TTTGGCAAACCTCAATGCATTTCTTTCCATTGTTTATGGCCTAACT
2101 GATACGAATC
Statistics
Matches: 1047, Mismatches: 99, Indels: 38
0.88 0.08 0.03
Matches are distributed among these distances:
921 200 0.19
922 22 0.02
923 33 0.03
924 17 0.02
925 37 0.04
926 8 0.01
927 6 0.01
928 59 0.06
929 584 0.56
930 81 0.08
ACGTcount: A:0.22, C:0.19, G:0.18, T:0.41
Consensus pattern (922 bp):
TATCGGGGCCCATTAGTGACTTTTTGAATCGTCTTCGATTTTGGAAACCCTCGATGCTTTTCTTT
CCAATGTTTATGGCCTAACTATAATCATTTTGCTGAGATTAGTCCACTATGAAGTTTTTAGCTCA
TTTGGAACACTTGTTATTTTGAGCTTATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATT
TGGCAAACCTCAATGCATTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTGGTGAGATTA
GTCCACTGTAAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGGGCCTATCAGGGCCCATTAG
TTCTGTTTTGAATCGTCTTCCATTTGGAAAACCTCAAGGCTTTCTTTCCATTGTTTATGGCCTAA
CTATAATAATTTTAGTGAGATTAGGCCACTGTGAAATTTTAGCTCATTTGGAACACCTGTTATTT
TGGGCCTATCAGGGCCCATTAGTGACGTTTTGAACCGTCTTCGATTTGACAAACCTCAATGCTTT
TCTTAACATTCTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAAATTTTAG
CTCATTTGGAACACCTGTTATTTTATGCCTATCAGGGCCCATTAATGACGTTTTGAACCGTCTAC
GATTTGACAAACCTCAATGCCTTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTAGTGAG
ATTAGTCCACTGTGAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGTGCCGTTCGGGGCCCA
TTAGTTCTATTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTTTCCATTATTTATGG
CCTAACTATAATCATTTTGCTGAGATTAGTCCACTATAAAGTTTTTAGCTCATTTGGAACACTCG
TTATTTTGGGCC
Done.