Tandem Repeats Finder Program written by:

                 Gary Benson
      Program in Bioinformatics
          Boston University

Version 4.09

Sequence: AWWV01014591.1 Corchorus capsularis cultivar CVL-1 contig14612, whole genome shotgun sequence

Parameters: 2 7 7 80 10 50 1000

Pmatch=0.80,Pindel=0.10
tuple sizes 0,4,5,7
tuple distances 0, 29, 159, 1000

Length: 25968
ACGTcount: A:0.34, C:0.16, G:0.17, T:0.33


Found at i:125 original size:21 final size:21

Alignment explanation

Indices: 84--127 Score: 61 Period size: 21 Copynumber: 2.1 Consensus size: 21 74 GCAAAAGTGT ** 84 AAAAAGGGGGCGGTATTTAGC 1 AAAAAGGGGGCGGTAAATAGC * 105 AAAAGGGGGGCGGTAAATAGC 1 AAAAAGGGGGCGGTAAATAGC 126 AA 1 AA 128 TAAGCATCTG Statistics Matches: 20, Mismatches: 3, Indels: 0 0.87 0.13 0.00 Matches are distributed among these distances: 21 20 1.00 ACGTcount: A:0.39, C:0.09, G:0.39, T:0.14 Consensus pattern (21 bp): AAAAAGGGGGCGGTAAATAGC Found at i:7053 original size:29 final size:31 Alignment explanation

Indices: 6996--7057 Score: 92 Period size: 33 Copynumber: 2.0 Consensus size: 31 6986 ATGTAAGAGT 6996 GTTTTATTTTACATAAAACTGTCAGTTATCATA 1 GTTTTATTTTACATAAAAC--TCAGTTATCATA 7029 GTTTTATTTTACATAAAAC-C-GTTATCATA 1 GTTTTATTTTACATAAAACTCAGTTATCATA 7058 ATTAATTGAA Statistics Matches: 29, Mismatches: 0, Indels: 4 0.88 0.00 0.12 Matches are distributed among these distances: 29 9 0.31 30 1 0.03 33 19 0.66 ACGTcount: A:0.34, C:0.13, G:0.08, T:0.45 Consensus pattern (31 bp): GTTTTATTTTACATAAAACTCAGTTATCATA Found at i:10161 original size:199 final size:198 Alignment explanation

Indices: 9809--11150 Score: 1760 Period size: 199 Copynumber: 6.8 Consensus size: 198 9799 AAATTTGAAT * * * 9809 GTGCGGGGTTTAAGGGTTGACATGTGTCCCCTTAGGAAATATGTATTAATATTAAATATTTAAAT 1 GTGC-GGGTTTAAGGGTTGACATGTGTTCCCTTAGGGAATATGTATTAATATTAAATATTTAATT * * * * * 9874 AATTATGAAATGAAGTATGTGCCAACTTCTTGACCCGCTTTTGGAGTTCAAAATTTACATTGACA 65 AATTATGAAATGAGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACATTGACA * * * * 9939 ATGTATTGTATAATAAACCTATAAGAACAATTATACAATGCACCGTCAGTGGAGTTTAGCAGACT 130 GTGTATTGTATAATAATCCTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGACT * 10004 GCAA 195 GCAC * * * * 10008 GCGCAAGGTTTAAGGGTTGACATGTGTTCCCTTAGGGAATATATATTAATATTATATATTTAATT 1 GTGC-GGGTTTAAGGGTTGACATGTGTTCCCTTAGGGAATATGTATTAATATTAAATATTTAATT * * * ** * 10073 AATGATGAAATGAGGTATGTGTCAACTTCTTAACTCGCTTATAGAGTTTAAAATTTACAATGACA 65 AATTATGAAATGAGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACATTGACA * * * 10138 GCGTGTTGTATAATAATCCTATAAGAAAAATTATATAATACACCGTCAGTGGAGTTTAGCAGACT 130 GTGTATTGTATAATAATCCTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGACT 10203 GCAC 195 GCAC * 10207 GTGCGGGATTTGAGGGTTGACATGTG-TCCCTTTAGGGAATATGTATTAATATT-AA-A-TTAAT 1 GTGCGGG-TTTAAGGGTTGACATGTGTTCCC-TTAGGGAATATGTATTAATATTAAATATTTAAT * * * * * 10268 TAATTATGAAATGGGGTATATGTCAACTTCCTAACCCGCTTATGGAATCCAAAATTTACATAGAC 64 TAATTATGAAATGAGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACATTGAC * * * * * 10333 AGTGTATTGTATACTAATTCTATAAGAACAATTATACAATGCACCGTCAGTGGAGTTTAGTAGAC 129 AGTGTATTGTATAATAATCCTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGAC 10398 TGCAC 194 TGCAC * 10403 GTGCGGGCTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAGTA 1 GTGCGGG-TTTAAGGGTTGACATGTGTTCCCTTAGGGAATATGTATTAATATTAAATATTTA--A * * * 10468 TTAATTATGAAATGGGGTATGTGACAACTTCTTAACCCGTTTATGGAGTCCAAAATTTACATTGA 63 TTAATTATGAAATGAGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACATTGA * * 10533 CAGTGTATTGTATAATAATTCTATAAGAAAAATTATGCAATACACCGTCAGTGGAGTTTAGCAGA 128 CAGTGTATTGTATAATAATCCTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGA 10598 CTGCAC 193 CTGCAC * * 10604 GTGCGGGGTTTAAGGGTTGACATGTATTCCTTTAGGGAATATGTATTAATA-T---TATTTAATT 1 GTGC-GGGTTTAAGGGTTGACATGTGTTCCCTTAGGGAATATGTATTAATATTAAATATTTAATT * * * 10665 AATTATGAAAT-AGGGTATGTGTCAACTTTTTAACCCGCTTATGGAATCCAAAATTTACACTGAC 65 AATTATGAAATGA-GGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACATTGAC * * * * * * 10729 AGTCTATTGTGTAATAATCATATAAAAAAAATTATATAATACACCGT-AGTGGAATTTAGCAGAC 129 AGTGTATTGTATAATAATCCTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGAC 10793 TACACGCAC 194 T----GCAC * ** ** 10802 G-GGGGGTTTTTGGGGTTGACATGTG-TCCTCTTAGGGAATATGTATTAATATTTTTATATTTAA 1 GTGCGGG-TTTAAGGGTTGACATGTGTTCC-CTTAGGGAATATGTATTAATA-TTAAATATTTAA * * * * 10865 TTAATTATGAAAT-AGGATATGTGTCAACTTCTTATCCCGCTTATGGAGTTCAGAATTTATC-CT 63 TTAATTATGAAATGAGG-TATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTA-CATT * * * 10928 AACAGTGTATTGTATAATAATCTTATTAA-AAAGATTATACAATACACCGTCAGTGGAGTTTAGC 126 GACAGTGTATTGTATAATAATCCTA-TAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGC 10992 AGACTGCAC 190 AGACTGCAC * * * 11001 ATGCATGGTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATT 1 GTGC-GGGTTTAAGGGTTGACATGTGTTCCCTTAGGGAATATGTATTAATATTAAATATTTAATT * 11066 AATTATGAAATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACATTGACA 65 AATTATGAAATGAGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACATTGACA * 11131 TTGTATTGTATAATAATCCT 130 GTGTATTGTATAATAATCCT 11151 TATTATAAAG Statistics Matches: 1000, Mismatches: 113, Indels: 60 0.85 0.10 0.05 Matches are distributed among these distances: 194 17 0.02 195 100 0.10 196 173 0.17 197 48 0.05 198 14 0.01 199 307 0.31 200 41 0.04 201 176 0.18 202 103 0.10 203 21 0.02 ACGTcount: A:0.33, C:0.13, G:0.19, T:0.35 Consensus pattern (198 bp): GTGCGGGTTTAAGGGTTGACATGTGTTCCCTTAGGGAATATGTATTAATATTAAATATTTAATTA ATTATGAAATGAGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACATTGACAG TGTATTGTATAATAATCCTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGACTG CAC Found at i:10870 original size:397 final size:394 Alignment explanation

Indices: 9809--11148 Score: 1784 Period size: 397 Copynumber: 3.4 Consensus size: 394 9799 AAATTTGAAT * * 9809 GTGCGGGGTTTAAGGGTTGACATGTGTCCCCTTAGGAAATATGTATTAATATTAAATATTTAAAT 1 GTGCGGGGTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATT--ATATTTAATT ** * * * * * 9874 AATTATGAAATGAAGTATGTGCCAACTTCTTGACCCGCTTTTGGAGTTCAAAATTTACATTGACA 64 AATTATGAAATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAATCCAAAATTTACATTGACA * * 9939 ATGTATTGTATAATAAACCTATAAGAACAATTATACAATGCACCGTCAGTGGAGTTTAGCAGACT 129 GTGTATTGTATAAT-AATCTATAAGAACAATTATACAATGCACCGTCAGTGGAGTTTAGCAGACT * * * 10004 --GCAAGCGCAAGGTTTAAGGGTTGACATGTGTTCCCTTAGGGAATATATATTAATATTATATAT 193 CAGC-A-CGGAGGGTTTAAGGGTTGACATGTG-TCCCTTAGGGAATATGTATTAATATTATATAT * * * * * 10067 TTAATTAATGATGAAATGAGGTATGTGTCAACTTCTTAACTCGCTTATAGAGTTTAAAATTTACA 255 TTAATTAATTATGAAATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTTCAAAATTTACA * * * * 10132 ATGACAGCGTGTTGTATAATAATCCTATAAGAAAAATTATATAATACACCGTCAGTGGAGTTTAG 320 ATGACAGTGTATTGTATAATAATTCTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAG 10197 CAGACTGCAC 385 CAGACTGCAC * * * * 10207 GTGCGGGATTTGAGGGTTGACATGTGTCCCTTTAGGGAATATGTATTAATATTA-AATTAATTAA 1 GTGCGGGGTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTATATTTAATTAA * * * 10271 TTATGAAATGGGGTATATGTCAACTTCCTAACCCGCTTATGGAATCCAAAATTTACATAGACAGT 66 TTATGAAATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAATCCAAAATTTACATTGACAGT * * 10336 GTATTGTATACTAATTCTATAAGAACAATTATACAATGCACCGTCAGTGGAGTTTAGTAGACT-- 131 GTATTGTATAATAA-TCTATAAGAACAATTATACAATGCACCGTCAGTGGAGTTTAGCAGACTCA * * 10399 GCACGTGCGGGCTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTT 195 GCACG-GAGGG-TTTAAGGGTTGACATGTGT-CCCTTAGGGAATATGTATTAATATTATATATTT * * * 10464 AGTATTAATTATGAAATGGGGTATGTGACAACTTCTTAACCCGTTTATGGAGTCCAAAATTTACA 257 A--ATTAATTATGAAATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTTCAAAATTTACA * * 10529 TTGACAGTGTATTGTATAATAATTCTATAAGAAAAATTATGCAATACACCGTCAGTGGAGTTTAG 320 ATGACAGTGTATTGTATAATAATTCTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAG 10594 CAGACTGCAC 385 CAGACTGCAC * * * 10604 GTGCGGGGTTTAAGGGTTGACATGTATTCCTTTAGGGAATATGTATTAATA-T-TATTTAATTAA 1 GTGCGGGGTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTATATTTAATTAA * * * 10667 TTATGAAATAGGGTATGTGTCAACTTTTTAACCCGCTTATGGAATCCAAAATTTACACTGACAGT 66 TTATGAAATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAATCCAAAATTTACATTGACAGT * * * * * * * 10732 CTATTGTGTAATAATCATATAAAAAAAATTATATAATACACCGT-AGTGGAATTTAGCAGACTAC 131 GTATTGTATAATAATC-TATAAGAACAATTATACAATGCACCGTCAGTGGAGTTTAGCAGACT-C * ** * 10796 ACGCACGGGGGGTTTTTGGGGTTGACATGTGTCCTCTTAGGGAATATGTATTAATATTTTTATAT 194 A-GCACGGAGGG-TTTAAGGGTTGACATGTGTCC-CTTAGGGAATATGTATTAATA-TTATATAT * * * * 10861 TTAATTAATTATGAAATAGGATATGTGTCAACTTCTTATCCCGCTTATGGAGTTCAGAATTTATC 255 TTAATTAATTATGAAATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTTCAAAATTTA-C * * * 10926 -CTAACAGTGTATTGTATAATAA-TCTTATTAA-AAAGATTATACAATACACCGTCAGTGGAGTT 319 AATGACAGTGTATTGTATAATAATTC-TA-TAAGAAAAATTATACAATACACCGTCAGTGGAGTT 10988 TAGCAGACTGCAC 382 TAGCAGACTGCAC * ** 11001 ATGCATGGTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATT 1 GTGCGGGGTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATT--ATATTTAATT * 11066 AATTATGAAATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACATTGACA 64 AATTATGAAATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAATCCAAAATTTACATTGACA * 11131 TTGTATTGTATAATAATC 129 GTGTATTGTATAATAATC 11149 CTTATTATAA Statistics Matches: 832, Mismatches: 89, Indels: 39 0.87 0.09 0.04 Matches are distributed among these distances: 393 2 0.00 394 6 0.01 395 189 0.23 396 106 0.13 397 334 0.40 398 96 0.12 399 14 0.02 401 85 0.10 ACGTcount: A:0.33, C:0.13, G:0.19, T:0.35 Consensus pattern (394 bp): GTGCGGGGTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTATATTTAATTAA TTATGAAATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAATCCAAAATTTACATTGACAGT GTATTGTATAATAATCTATAAGAACAATTATACAATGCACCGTCAGTGGAGTTTAGCAGACTCAG CACGGAGGGTTTAAGGGTTGACATGTGTCCCTTAGGGAATATGTATTAATATTATATATTTAATT AATTATGAAATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTTCAAAATTTACAATGACA GTGTATTGTATAATAATTCTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGACT GCAC Found at i:11069 original size:596 final size:593 Alignment explanation

Indices: 9814--11150 Score: 1903 Period size: 596 Copynumber: 2.2 Consensus size: 593 9804 TGAATGTGCG * * 9814 GGGTTTAAGGGTTGACATGTGTCCCCTTAGGAAATATGTATTAATATTAAATATTTAAATAATTA 1 GGGTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTA ** * * * 9879 TGAAATGAAGTATGTGCCAACTTCTTGACCCGCTTT-TGGAGTTCAAAATTTACATTGACAATGT 66 TGAAATGGGGTATGTGACAACTTCTTAACCCG-TTTATGGAGTCCAAAATTTACATTGACAATGT * * * 9943 ATTGTATAATAAACCTATAAGAACAATTATACAATGCACCGTCAGTGGAGTTTAGCAGACTGCAA 130 ATTGTATAATAATCCTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGACTGCAA * 10008 GCGCAAGGTTTAAGGGTTGACATGTGTTCCCTTAGGGAATATATATTAATATTATATATTTAATT 195 GCGCAAGGTTTAAGGGTTGACATGTATTCCCTTAGGGAATATATATTAATATTATATATTTAATT * * ** 10073 AATGATGAAATGAGGTATGTGTCAACTTCTTAACTCGCTTATAGAGTTTAAAATTTACAATGACA 260 AATGATGAAATGAGGTATGTGTCAACTTCTTAACCCGCTTATAGAATCCAAAATTTACAATGACA * * * * 10138 GCGTGTTGTATAATAATCCTATAAGAAAAATTATATAATACACCGTCAGTGGAGTTTAGCAGACT 325 GCGTATTGTATAATAATCATATAAAAAAAATTATATAATACACCGTCAGTGGAATTTAGCAGACT 10203 GCACGTGCGGGATTTGAGGGTTGACATGTGTCCCTTTAGGGAATATGTATTAATATTAAATTAAT 390 GCACGTGCGGGATTTGAGGGTTGACATGTGTCCCTTTAGGGAATATGTATTAATATTAAATTAAT * * 10268 TAATTATGAAATGGGGTATATGTCAACTTCCTAACCCGCTTATGGAATCCAAAATTTACATAGAC 455 TAATTATGAAATAGGATATATGTCAACTTCCTAACCCGCTTATGGAATCCAAAATTTACATAGAC * * * 10333 AGTGTATTGTATACTAATTCTATAAGAACAATTATACAATGCACCGTCAGTGGAGTTTAGTAGAC 520 AGTGTATTGTATAATAATTCTATAAGAACAATTATACAATACACCGTCAGTGGAGTTTAGCAGAC * 10398 TGCACGTGC 585 TGCACATGC 10407 GGGCTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAGTATTAA 1 GGG-TTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTA--ATTAA * 10472 TTATGAAATGGGGTATGTGACAACTTCTTAACCCGTTTATGGAGTCCAAAATTTACATTGACAGT 63 TTATGAAATGGGGTATGTGACAACTTCTTAACCCGTTTATGGAGTCCAAAATTTACATTGACAAT * * 10537 GTATTGTATAATAATTCTATAAGAAAAATTATGCAATACACCGTCAGTGGAGTTTAGCAGACTGC 128 GTATTGTATAATAATCCTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGACTGC * * ** * * 10602 ACGTGCGGGGTTTAAGGGTTGACATGTATTCCTTTAGGGAATATGTATT-A-A-TAT-TATTTAA 193 AAGCGCAAGGTTTAAGGGTTGACATGTATTCCCTTAGGGAATATATATTAATATTATATATTTAA * * * * 10663 TTAATTATGAAAT-AGGGTATGTGTCAACTTTTTAACCCGCTTATGGAATCCAAAATTTACACTG 258 TTAATGATGAAATGA-GGTATGTGTCAACTTCTTAACCCGCTTATAGAATCCAAAATTTACAATG * 10727 ACAGTC-TATTGTGTAATAATCATATAAAAAAAATTATATAATACACCGT-AGTGGAATTTAGCA 322 ACAG-CGTATTGTATAATAATCATATAAAAAAAATTATATAATACACCGTCAGTGGAATTTAGCA * * 10790 GACTACACGCACG-GGGGGTTTTTG-GGGTTGACATGTGT-CCTCTTAGGGAATATGTATTAATA 386 GACT----GCACGTGCGGG-ATTTGAGGGTTGACATGTGTCCCT-TTAGGGAATATGTATTAATA * * * * * * 10852 TTTTTATATTTAATTAATTATGAAATAGGATATGTGTCAACTTCTTATCCCGCTTATGGAGTTCA 445 ---TTA-AATTAATTAATTATGAAATAGGATATATGTCAACTTCCTAACCCGCTTATGGAATCCA * * 10917 GAATTTATCCTA-ACAGTGTATTGTATAATAA-TCTTATTAA-AA-AGATTATACAATACACCGT 506 AAATTTA-CATAGACAGTGTATTGTATAATAATTC-TA-TAAGAACA-ATTATACAATACACCGT 10978 CAGTGGAGTTTAGCAGACTGCACATGC 567 CAGTGGAGTTTAGCAGACTGCACATGC * 11005 ATGGTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATT 1 -GGGTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATT * * * 11070 ATGAAATGGGGTATGTGTCAACTTCTTAACCCGCTTATGGAGTCCAAAATTTACATTGACATTGT 65 ATGAAATGGGGTATGTGACAACTTCTTAACCCGTTTATGGAGTCCAAAATTTACATTGACAATGT 11135 ATTGTATAATAATCCT 130 ATTGTATAATAATCCT 11151 TATTATAAAG Statistics Matches: 669, Mismatches: 54, Indels: 39 0.88 0.07 0.05 Matches are distributed among these distances: 591 18 0.03 592 104 0.16 593 10 0.01 594 92 0.14 595 13 0.02 596 245 0.37 597 6 0.01 598 173 0.26 599 8 0.01 ACGTcount: A:0.33, C:0.13, G:0.19, T:0.35 Consensus pattern (593 bp): GGGTTTAAGGGTTGACATGTGTCCCCTTAGGGAATATGTATTAATATTAAATATTTAATTAATTA TGAAATGGGGTATGTGACAACTTCTTAACCCGTTTATGGAGTCCAAAATTTACATTGACAATGTA TTGTATAATAATCCTATAAGAAAAATTATACAATACACCGTCAGTGGAGTTTAGCAGACTGCAAG CGCAAGGTTTAAGGGTTGACATGTATTCCCTTAGGGAATATATATTAATATTATATATTTAATTA ATGATGAAATGAGGTATGTGTCAACTTCTTAACCCGCTTATAGAATCCAAAATTTACAATGACAG CGTATTGTATAATAATCATATAAAAAAAATTATATAATACACCGTCAGTGGAATTTAGCAGACTG CACGTGCGGGATTTGAGGGTTGACATGTGTCCCTTTAGGGAATATGTATTAATATTAAATTAATT AATTATGAAATAGGATATATGTCAACTTCCTAACCCGCTTATGGAATCCAAAATTTACATAGACA GTGTATTGTATAATAATTCTATAAGAACAATTATACAATACACCGTCAGTGGAGTTTAGCAGACT GCACATGC Found at i:11503 original size:16 final size:16 Alignment explanation

Indices: 11478--11508 Score: 53 Period size: 16 Copynumber: 1.9 Consensus size: 16 11468 TCTACATATT 11478 ATAAAGATTTAGTAAA 1 ATAAAGATTTAGTAAA * 11494 ATAAATATTTAGTAA 1 ATAAAGATTTAGTAA 11509 TATTTTTCAA Statistics Matches: 14, Mismatches: 1, Indels: 0 0.93 0.07 0.00 Matches are distributed among these distances: 16 14 1.00 ACGTcount: A:0.55, C:0.00, G:0.10, T:0.35 Consensus pattern (16 bp): ATAAAGATTTAGTAAA Found at i:12604 original size:10 final size:10 Alignment explanation

Indices: 12589--12628 Score: 53 Period size: 10 Copynumber: 4.0 Consensus size: 10 12579 TGAGAAACGA 12589 GATGGGACGG 1 GATGGGACGG * 12599 GATGGGACGA 1 GATGGGACGG * 12609 GATAGGACGG 1 GATGGGACGG * 12619 GACGGGACGG 1 GATGGGACGG 12629 AAGGTCTTTT Statistics Matches: 25, Mismatches: 5, Indels: 0 0.83 0.17 0.00 Matches are distributed among these distances: 10 25 1.00 ACGTcount: A:0.25, C:0.12, G:0.55, T:0.07 Consensus pattern (10 bp): GATGGGACGG Found at i:12610 original size:20 final size:20 Alignment explanation

Indices: 12585--12627 Score: 68 Period size: 20 Copynumber: 2.1 Consensus size: 20 12575 GGATTGAGAA * * 12585 ACGAGATGGGACGGGATGGG 1 ACGAGATAGGACGGGACGGG 12605 ACGAGATAGGACGGGACGGG 1 ACGAGATAGGACGGGACGGG 12625 ACG 1 ACG 12628 GAAGGTCTTT Statistics Matches: 21, Mismatches: 2, Indels: 0 0.91 0.09 0.00 Matches are distributed among these distances: 20 21 1.00 ACGTcount: A:0.28, C:0.14, G:0.51, T:0.07 Consensus pattern (20 bp): ACGAGATAGGACGGGACGGG Found at i:15977 original size:45 final size:45 Alignment explanation

Indices: 15911--16049 Score: 207 Period size: 45 Copynumber: 3.2 Consensus size: 45 15901 AACAACAATT 15911 AATATTA-ACTTTATTTTGATGAATTATCTAGAGATGGAGGAGTAG 1 AATATTAGA-TTTATTTTGATGAATTATCTAGAGATGGAGGAGTAG * 15956 AGTATTAGATTTATTTTGATGAATTATCTAGAGATGGAGGAGTAG 1 AATATTAGATTTATTTTGATGAATTATCTAGAGATGGAGGAGTAG * * 16001 AATATTAGCTTTATTTTGATGAATTACCTAGAGAT--A-GAGTAG 1 AATATTAGATTTATTTTGATGAATTATCTAGAGATGGAGGAGTAG 16043 AAT-TTAG 1 AATATTAG 16050 GTAATGCACT Statistics Matches: 89, Mismatches: 4, Indels: 6 0.90 0.04 0.06 Matches are distributed among these distances: 41 4 0.04 42 9 0.10 43 1 0.01 45 74 0.83 46 1 0.01 ACGTcount: A:0.35, C:0.04, G:0.22, T:0.38 Consensus pattern (45 bp): AATATTAGATTTATTTTGATGAATTATCTAGAGATGGAGGAGTAG Found at i:18866 original size:3 final size:3 Alignment explanation

Indices: 18858--18886 Score: 58 Period size: 3 Copynumber: 9.7 Consensus size: 3 18848 AAATACTAAT 18858 TAA TAA TAA TAA TAA TAA TAA TAA TAA TA 1 TAA TAA TAA TAA TAA TAA TAA TAA TAA TA 18887 CCACCTTGTA Statistics Matches: 26, Mismatches: 0, Indels: 0 1.00 0.00 0.00 Matches are distributed among these distances: 3 26 1.00 ACGTcount: A:0.66, C:0.00, G:0.00, T:0.34 Consensus pattern (3 bp): TAA Found at i:20724 original size:2 final size:2 Alignment explanation

Indices: 20677--20711 Score: 61 Period size: 2 Copynumber: 17.0 Consensus size: 2 20667 ACAAAAATAG 20677 TA TA TA GTA TA TA TA TA TA TA TA TA TA TA TA TA TA 1 TA TA TA -TA TA TA TA TA TA TA TA TA TA TA TA TA TA 20712 CACTAGCATA Statistics Matches: 32, Mismatches: 0, Indels: 2 0.94 0.00 0.06 Matches are distributed among these distances: 2 30 0.94 3 2 0.06 ACGTcount: A:0.49, C:0.00, G:0.03, T:0.49 Consensus pattern (2 bp): TA Done.