Tandem Repeats Finder Program written by: Gary Benson Program in Bioinformatics Boston University Version 4.09 Sequence: AWUE01024320.1 Corchorus olitorius cultivar O-4 contig24353, whole genome shotgun sequence Parameters: 2 7 7 80 10 50 1000 Pmatch=0.80,Pindel=0.10 tuple sizes 0,4,5,7 tuple distances 0, 29, 159, 1000 Length: 3653 ACGTcount: A:0.27, C:0.20, G:0.18, T:0.36 Found at i:295 original size:154 final size:153 Alignment explanation
Indices: 9--2100 Score: 2716 Period size: 154 Copynumber: 13.5 Consensus size: 153 1 CTTGAGCT * * * 9 TATCGGGGCCCATTAGTGACGTTTTGAATCGACTTCGATATGGAAAGAAACCCTCGATGCTTTTC 1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGAT-TTG---GAAACCCTCAATGCTTTTC * * * * 74 TTTCCATTGTTTATGCCCCAACTATAATCATTTTGCTGAGATTAGTCCACTATGAAGGTTTTAGC 62 TTTCCATTGTTTATGGCCTAACTATAATCATTTTG-TGAGATTAGTCCACTGTGAAGTTTTTAGC * * 139 TCATTTGGAACGCTTGTTATTTTGTGCT 126 TCATTTGGAACACTTGTTATTTTGTGCC * * * * * 167 TTTCGGGGCCCATTAGT-TCTGTTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCATTTATTT 1 TATCGGGGCCCATTAGTGAC-GTTTTGAATCGTCTTCGATTTGGAAACCCTCAATGCTTTTCTTT * * 231 CCATTGTTTAAGGCCTAACTATAATCATTTTGTTTAGATTAGTCCACTGTGAAGTTTTTAGCTCA 65 CCATTGTTTATGGCCTAACTATAATCATTTTG-TGAGATTAGTCCACTGTGAAGTTTTTAGCTCA 296 TTTGGAACACTTGTTATTTTGTGCC 129 TTTGGAACACTTGTTATTTTGTGCC * * * * 321 TTTCGGGGCCCATTAGT-TCTGTTTTGAATCGTCTTCGTTTTGGAAAACCTCAATGC-TTTCTTT 1 TATCGGGGCCCATTAGTGAC-GTTTTGAATCGTCTTCGATTTGGAAACCCTCAATGCTTTTCTTT * 384 CCATTGTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAA-ATTTTAGCTCA 65 CCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAGCTCA * 448 TTTGGAACACCTGTTATTTTGTGCC 129 TTTGGAACACTTGTTATTTTGTGCC * * * * * * 473 TATCAGGGCCCATTAGTGAGGTTTTGAACCGTTTTCGATTT-GACAAACCTCAATGCTTTTCTTA 1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGA-AACCCTCAATGCTTTTCTTT * * * 537 ACATTCTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAA-ATTTTAGCTCA 65 CCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAGCTCA * * 601 TTTGGAACACCTGTTATTTTATGCC 129 TTTGGAACACTTGTTATTTTGTGCC * * * * * * * 626 TATCAGGGCCCATTAATGACGTTTTGAACCGTCTACGATTT-GACAAACTTCAATTCTTTTCTTT 1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGA-AACCCTCAATGCTTTTCTTT * 690 CCATTGTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAAGTTTTTATCTCA 65 CCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAGCTCA 755 TTTGGAACACTTGTTATTTTGTGCC 129 TTTGGAACACTTGTTATTTTGTGCC * * * 780 GT-TCGGGGCCCATTAGT-TCTGTTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTT 1 -TATCGGGGCCCATTAGTGAC-GTTTTGAATCGTCTTCGATTTGGAAACCCTCAATGCTTTTCTT * * 843 TCCATTATTTATGGCCTAACTATAATCATTTTGGTGAGATTAGTCCACTGTAAAGTTTTTAGCTC 64 TCCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAGCTC * * 908 ATTTGGAACACTCGTTATTTTGGGCC 128 ATTTGGAACACTTGTTATTTTGTGCC * ** * * 934 TATCAGGGCCCATTAGTGAATTTTTGAATCGTCTTCGATTTTGCAAA-CCTCCATGCTTTTCTTT 1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGA-TTTGGAAACCCTCAATGCTTTTCTTT * * * * 998 CTAATGTTTATGGCCTAAGTATAATCATTTTAGTGAGATCAGTCCACTGTGAAGTTTTTAGCTCA 65 CCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAGCTCA * * 1063 TTTGGAACACCTGTTATTTTGGGCC 129 TTTGGAACACTTGTTATTTTGTGCC * * * 1088 TATCAGGGCCCCTTAGTGACGTTTTGAATCGTCTTCGATTTGGCAAA-CCTCAATGCGTTTCTTT 1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGG-AAACCCTCAATGCTTTTCTTT * * 1152 CCATTGTTTATGGCCTAACTATAATCATTTTGGTGAGATTAGTCCACTGTAAAGTTTTTAGATTC 65 CCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAG-CTC * 1217 ATTTGGAACTACTTGTTATTTTGGGCC 128 ATTTGGAAC-ACTTGTTATTTTGTGCC * * * * * 1244 TATCAGGGCCCATT-GTTGACGTTTTGGAATCGTCTTCCATTTGGTCTAAA-CCTTAAGGGTTTT 1 TATCGGGGCCCATTAG-TGACGTTTT-GAATCGTCTTCGATTTGG---AAACCCTCAATGCTTTT * * ** * * 1307 CTTTTCCATTGTTTATGGCCTAACTATAATAATTTTGTTGAGGTTAGGGCTCTGTGTAAATTTTT 61 C-TTTCCATTGTTTATGGCCTAACTATAATCATTTTG-TGAGATTAGTCCACTGTG-AAGTTTTT * 1372 AGCTCATTTGGAACACTTGTTATTTTGGGCC 123 AGCTCATTTGGAACACTTGTTATTTTGTGCC * * 1403 TTTCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGCAAA-CCTCAAT-TTTTTCTTT 1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGG-AAACCCTCAATGCTTTTCTTT * 1466 CCATTGTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAA-ATTTTAGCTCA 65 CCATTGTTTATGGCCTAACTATAATCATTTT-GTGAGATTAGTCCACTGTGAAGTTTTTAGCTCA * 1530 TTTGGAACACCTGTTATTTTGTGCC 129 TTTGGAACACTTGTTATTTTGTGCC * * * * 1555 TATCAGGGCCCATTAGTGACGTTTTGAACCGTCTTCGATTT-GACAACCCTCGATGCCTTTCTTT 1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGA-AACCCTCAATGCTTTTCTTT * 1619 CCATTGTTTATGGCCTATCTATAATCATTTTGCTGAGATTAGTCCACTGTGAAGTTTTTAGCTCA 65 CCATTGTTTATGGCCTAACTATAATCATTTTG-TGAGATTAGTCCACTGTGAAGTTTTTAGCTCA 1684 TTTGGAACACTTGTTATTTTGTGCC 129 TTTGGAACACTTGTTATTTTGTGCC * * * * * 1709 TTTCGGGGCCCATTAGT-TCTATTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTTT 1 TATCGGGGCCCATTAGTGAC-GTTTTGAATCGTCTTCGATTTGGAAACCCTCAATGCTTTTCTTT * * 1773 CCATTGTTTATGGCCTAACTATAATTATTTTGCTGA-ATTTAGTCCACTATGAAGTTTTTAGCTC 65 CCATTGTTTATGGCCTAACTATAATCATTTTG-TGAGA-TTAGTCCACTGTGAAGTTTTTAGCTC 1837 ATTTGGAACACTTGTTATTTTGTGCC 128 ATTTGGAACACTTGTTATTTTGTGCC * * * * * 1863 TTTCGGGGCCCATTAGT-TCTGTTTTGAATCATCTTCGATTTGGAAACCCTCGATGCCTTTCTTT 1 TATCGGGGCCCATTAGTGAC-GTTTTGAATCGTCTTCGATTTGGAAACCCTCAATGCTTTTCTTT * * * 1927 CCACTGTTTATGGCCTAACTATAATTATTTTGCTGA-ATTTAGTCCACTATGAAGTTTTTAGCTC 65 CCATTGTTTATGGCCTAACTATAATCATTTTG-TGAGA-TTAGTCCACTGTGAAGTTTTTAGCTC * * 1991 ATTTGGAACACTTGTTATTTTGAGCT 128 ATTTGGAACACTTGTTATTTTGTGCC * 2017 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGCAAA-CCTTAATGCTTTTCTTT 1 TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGG-AAACCCTCAATGCTTTTCTTT * 2081 CCAATGTTTATGGCCTAACT 65 CCATTGTTTATGGCCTAACT 2101 GATACGAATC Statistics Matches: 1748, Mismatches: 152, Indels: 72 0.89 0.08 0.04 Matches are distributed among these distances: 150 1 0.00 151 5 0.00 152 157 0.09 153 322 0.18 154 993 0.57 155 34 0.02 156 46 0.03 157 20 0.01 158 51 0.03 159 52 0.03 160 58 0.03 161 9 0.01 ACGTcount: A:0.22, C:0.19, G:0.18, T:0.41 Consensus pattern (153 bp): TATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGAAACCCTCAATGCTTTTCTTTC CATTGTTTATGGCCTAACTATAATCATTTTGTGAGATTAGTCCACTGTGAAGTTTTTAGCTCATT TGGAACACTTGTTATTTTGTGCC Found at i:1856 original size:929 final size:922 Alignment explanation
Indices: 9--2100 Score: 3112 Period size: 929 Copynumber: 2.3 Consensus size: 922 1 CTTGAGCT * * * * 9 TATCGGGGCCCATTAGTGACGTTTTGAATCGACTTCGATATGGAAAGAAACCCTCGATGCTTTTC 1 TATCGGGGCCCATTAGTGACTTTTTGAATCGTCTTCGATTTTG---GAAACCCTCGATGCTTTTC * * * * 74 TTTCCATTGTTTATGCCCCAACTATAATCATTTTGCTGAGATTAGTCCACTATGAAGGTTTTAGC 63 TTTCCAATGTTTATGGCCTAACTATAATCATTTTGCTGAGATTAGTCCACTATGAAGTTTTTAGC * * * * 139 TCATTTGGAACGCTTGTTATTTTGTGCTTTTCGGGGCCCATTAGT-TCTGTTTTGAATCGTCTTC 128 TCATTTGGAACACTTGTTATTTTGAGCTTATCGGGGCCCATTAGTGAC-GTTTTGAATCGTCTTC * * * * * 203 GATTTGG-AAACCCTCGATGCATTTATTTCCATTGTTTAAGGCCTAACTATAATCATTTTGTTTA 192 GATTTGGCAAA-CCTCAATGCATTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTGGTGA * * * * 267 GATTAGTCCACTGTGAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGTGCCTTTCGGGGCCC 256 GATTAGTCCACTGTAAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGGGCCTATCAGGGCCC ** * 332 ATTAGTTCTGTTTTGAATCGTCTTCGTTTTGGAAAACCTCAATGCTTTCTTTCCATTGTTTATGG 321 ATTAGTTCTGTTTTGAATCGTCTTCCATTTGGAAAACCTCAAGGCTTTCTTTCCATTGTTTATGG * * 397 CCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAAATTTTAGCTCATTTGGAACACCTGT 386 CCTAACTATAATAATTTTAGTGAGATTAGGCCACTGTGAAATTTTAGCTCATTTGGAACACCTGT * * * 462 TATTTTGTGCCTATCAGGGCCCATTAGTGAGGTTTTGAACCGTTTTCGATTTGACAAACCTCAAT 451 TATTTTGGGCCTATCAGGGCCCATTAGTGACGTTTTGAACCGTCTTCGATTTGACAAACCTCAAT 527 GCTTTTCTTAACATTCTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAAAT 516 GCTTTTCTTAACATTCTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAAAT 592 TTTAGCTCATTTGGAACACCTGTTATTTTATGCCTATCAGGGCCCATTAATGACGTTTTGAACCG 581 TTTAGCTCATTTGGAACACCTGTTATTTTATGCCTATCAGGGCCCATTAATGACGTTTTGAACCG * * * 657 TCTACGATTTGACAAACTTCAATTCTTTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTA 646 TCTACGATTTGACAAACCTCAATGCCTTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTA * 722 GTGAGATTAGTCCACTGTGAAGTTTTTATCTCATTTGGAACACTTGTTATTTTGTGCCGTTCGGG 711 GTGAGATTAGTCCACTGTGAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGTGCCGTTCGGG * 787 GCCCATTAGTTCTGTTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTTTCCATTATT 776 GCCCATTAGTTCTATTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTTTCCATTATT * * 852 TATGGCCTAACTATAATCATTTTGGTGAGATTAGTCCACTGTAAAGTTTTTAGCTCATTTGGAAC 841 TATGGCCTAACTATAATCATTTTGCTGAGATTAGTCCACTATAAAGTTTTTAGCTCATTTGGAAC 917 ACTCGTTATTTTGGGCC 906 ACTCGTTATTTTGGGCC * * * * 934 TATCAGGGCCCATTAGTGAATTTTTGAATCGTCTTCGATTTTGCAAA-CCTCCATGCTTTTCTTT 1 TATCGGGGCCCATTAGTGACTTTTTGAATCGTCTTCGATTTTGGAAACCCTCGATGCTTTTCTTT * * * * 998 CTAATGTTTATGGCCTAAGTATAATCATTTTAG-TGAGATCAGTCCACTGTGAAGTTTTTAGCTC 66 CCAATGTTTATGGCCTAACTATAATCATTTT-GCTGAGATTAGTCCACTATGAAGTTTTTAGCTC * * * * * 1062 ATTTGGAACACCTGTTATTTTGGGCCTATCAGGGCCCCTTAGTGACGTTTTGAATCGTCTTCGAT 130 ATTTGGAACACTTGTTATTTTGAGCTTATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGAT * 1127 TTGGCAAACCTCAATGCGTTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTGGTGAGATT 195 TTGGCAAACCTCAATGCATTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTGGTGAGATT * 1192 AGTCCACTGTAAAGTTTTTAGATTCATTTGGAACTACTTGTTATTTTGGGCCTATCAGGGCCCAT 260 AGTCCACTGTAAAGTTTTTAG-CTCATTTGGAAC-ACTTGTTATTTTGGGCCTATCAGGGCCCAT * * * 1257 T-GTTGAC-GTTTTGGAATCGTCTTCCATTTGGTCTAAACCTTAAGGGTTTTCTTTTCCATTGTT 323 TAGTT--CTGTTTT-GAATCGTCTTCCATTTGG--AAAACCTCAA-GGCTTTC-TTTCCATTGTT * * * 1320 TATGGCCTAACTATAATAATTTT-GTTGAGGTTAGGGCTCTGTGTAAATTTTTAGCTCATTTGGA 381 TATGGCCTAACTATAATAATTTTAG-TGAGATTAGGCCACTGTG-AAA-TTTTAGCTCATTTGGA * * * * * 1384 ACACTTGTTATTTTGGGCCTTTCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATTTGGCAA 443 ACACCTGTTATTTTGGGCCTATCAGGGCCCATTAGTGACGTTTTGAACCGTCTTCGATTTGACAA * ** * 1449 ACCTCAAT-TTTTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCAC 508 ACCTCAATGCTTTTCTTAACATTCTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCAC * * 1513 TGTGAAATTTTAGCTCATTTGGAACACCTGTTATTTTGTGCCTATCAGGGCCCATTAGTGACGTT 573 TGTGAAATTTTAGCTCATTTGGAACACCTGTTATTTTATGCCTATCAGGGCCCATTAATGACGTT * * * * 1578 TTGAACCGTCTTCGATTTGACAACCCTCGATGCCTTTCTTTCCATTGTTTATGGCCTATCTATAA 638 TTGAACCGTCTACGATTTGACAAACCTCAATGCCTTTCTTTCCATTGTTTATGGCCTAACTATAA 1643 TCATTTT-GCTGAGATTAGTCCACTGTGAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGTG 703 TCATTTTAG-TGAGATTAGTCCACTGTGAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGTG * 1707 CCTTTCGGGGCCCATTAGTTCTATTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTT 767 CCGTTCGGGGCCCATTAGTTCTATTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTT * * * 1772 TCCATTGTTTATGGCCTAACTATAATTATTTTGCTGA-ATTTAGTCCACTATGAAGTTTTTAGCT 832 TCCATTATTTATGGCCTAACTATAATCATTTTGCTGAGA-TTAGTCCACTATAAAGTTTTTAGCT * * 1836 CATTTGGAACACTTGTTATTTTGTGCC 896 CATTTGGAACACTCGTTATTTTGGGCC * * * * 1863 TTTCGGGGCCCATTAGT-TCTGTTTTGAATCATCTTCGA-TTTGGAAACCCTCGATGCCTTTCTT 1 TATCGGGGCCCATTAGTGACT-TTTTGAATCGTCTTCGATTTTGGAAACCCTCGATGCTTTTCTT * * 1926 TCCACTGTTTATGGCCTAACTATAATTATTTTGCTGA-ATTTAGTCCACTATGAAGTTTTTAGCT 65 TCCAATGTTTATGGCCTAACTATAATCATTTTGCTGAGA-TTAGTCCACTATGAAGTTTTTAGCT 1990 CATTTGGAACACTTGTTATTTTGAGCTTATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGA 129 CATTTGGAACACTTGTTATTTTGAGCTTATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGA * * * 2055 TTTGGCAAACCTTAATGCTTTTCTTTCCAATGTTTATGGCCTAACT 194 TTTGGCAAACCTCAATGCATTTCTTTCCATTGTTTATGGCCTAACT 2101 GATACGAATC Statistics Matches: 1047, Mismatches: 99, Indels: 38 0.88 0.08 0.03 Matches are distributed among these distances: 921 200 0.19 922 22 0.02 923 33 0.03 924 17 0.02 925 37 0.04 926 8 0.01 927 6 0.01 928 59 0.06 929 584 0.56 930 81 0.08 ACGTcount: A:0.22, C:0.19, G:0.18, T:0.41 Consensus pattern (922 bp): TATCGGGGCCCATTAGTGACTTTTTGAATCGTCTTCGATTTTGGAAACCCTCGATGCTTTTCTTT CCAATGTTTATGGCCTAACTATAATCATTTTGCTGAGATTAGTCCACTATGAAGTTTTTAGCTCA TTTGGAACACTTGTTATTTTGAGCTTATCGGGGCCCATTAGTGACGTTTTGAATCGTCTTCGATT TGGCAAACCTCAATGCATTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTGGTGAGATTA GTCCACTGTAAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGGGCCTATCAGGGCCCATTAG TTCTGTTTTGAATCGTCTTCCATTTGGAAAACCTCAAGGCTTTCTTTCCATTGTTTATGGCCTAA CTATAATAATTTTAGTGAGATTAGGCCACTGTGAAATTTTAGCTCATTTGGAACACCTGTTATTT TGGGCCTATCAGGGCCCATTAGTGACGTTTTGAACCGTCTTCGATTTGACAAACCTCAATGCTTT TCTTAACATTCTTTATGGCCTAACTATAATCATTTTAGTGAGATTAGTCCACTGTGAAATTTTAG CTCATTTGGAACACCTGTTATTTTATGCCTATCAGGGCCCATTAATGACGTTTTGAACCGTCTAC GATTTGACAAACCTCAATGCCTTTCTTTCCATTGTTTATGGCCTAACTATAATCATTTTAGTGAG ATTAGTCCACTGTGAAGTTTTTAGCTCATTTGGAACACTTGTTATTTTGTGCCGTTCGGGGCCCA TTAGTTCTATTTTGAATCGTCTTCGATTTGGAAACCCTCGATGCCTTTCTTTCCATTATTTATGG CCTAACTATAATCATTTTGCTGAGATTAGTCCACTATAAAGTTTTTAGCTCATTTGGAACACTCG TTATTTTGGGCC Done.