diff --git a/example_files/hmpv.fasta b/example_files/hmpv.fasta new file mode 100644 index 0000000..f6f5adc --- /dev/null +++ b/example_files/hmpv.fasta @@ -0,0 +1,207 @@ +>PV498543.1 Human metapneumovirus isolate USA/WA-UW-1b519/2023, partial genome +CGCGTATAAATTAAGTTACAAAAAAACATGGGACAAGTGAAAATGTCTCTTCAGGGGATTCACCTGAGTG +ATCTATCATACAAGCATGCTATATTAAAAGAGTCTCAGTACACAATAAAGAGAGATGTAGGCACAACAAC +AGCAGTGACACCCTCATCATTGCAACAAGAAATAACACTGTTATGTGGAGAAATTCTATATGCTAAGCAT +ACTGATTACAAATATGCTGCAGAAATAGGAATACAATATATCAGCACAGCTCTAGGGTCAGAGAGAGTAC +AGCAGATCCTAAGAAACTCAGGCAGTGAAGTTCAAGCGGTTTTAACCAGAACATACTCTTTGGGGAAAGT +TAAAAACAATAAAGGAGAAGATTTACAGATGCTAGACATACATGGAGTAGAAAAAAGCTGGGTGGAAGAG +ATAGACAAAGAAGCAAGAAAAACAATGGCAACTTTACTTAAGGAATCATCAGGCAATATCCCACAAAACC +AGAGGCCTTCAGCACCAGACACACCTATAATCTTATTATGTGTAGGTGCCTTAATATTTACCAAACTAGC +ATCAACTATAGAAGTGGGATTAGAGACCACAGTCAGAAGAGCTAACCGTGTGCTAAGTGATGCACTCAAA +AGATACCCTAGAATGGACATACCAAAAATCGCTAGATCCTTCTATGACTTATTTGAACAAAAGGTGTATT +ACAGAAGTTTGTTCATTGAGTATGGCAAAGCATTAGGCTCATCCTCTACAGGCAGCAAAGCAGAAAGTTT +ATTCGTTAATATATTCATGCAAGCTTATGGTGCTGGTCAAACAATGCTGAGGTGGGGGGTCATCGCCAGA +TCATCTAACAATATAATGTTAGGACATGTATCTGTACAGGCTGAGTTAAAACAGGTCACAGAAGTCTATG +ATCTAGTGCGAGAAATGGGCCCAGAATCTGGGCTCCTACATTTAAGGCAAAGCCCAAAAGCTGGATTGTT +ATCCTTAGCCAATTGTCCCAACTTTGCAAGTGTTGTTCTCGGCAATGCCTCAGGCTTAGGCATAATAGGT +ATGTATCGAGGGAGAGTGCCAAACACAGAACTATTTTCAGCAGCAGAAAGCTATGCCAAGAGTTTGAAAG +AAAGTAATAAAATCAACTTTTCTTCATTAGGACTCACAGATGAAGAAAAAGAGGCTGCAGAACACTTTCT +AAATGTGAGTGACGACAGTCAAAATGATTATGAGTAATTAAAAAAGTGGGACAAGTCAAAATGTCGTTCC +CTGAAGGAAAAGATATTCTTTTCATGGGTAATGAAGCAGCAAAATTGGCAGAAGCTTTCCAGAAATCATT +AAGAAAACCTAGTCATAAAAGATCTCAATCTATTATAGGAGAAAAAGTGAGCACTGTATCTGAAACATTG +GAATTACCTACTATCAGTAGACCTACCAAACCAACCATACCGTCAGAGCTGAAATTAGCATGGACAGACA +AAGGTGGAGCAATCAGAACTGAAGCAAAGCAAACAATCAAAATTATGGATCCTATTGAAGAAGAAGAATC +CACTGAGAAAAMGGTGCTACCCTCTAGTGACGGGAAAACTCCTTCAGAAAAGAAGTTGAAACCATCAACC +AACACTAAAAAGAAAGTTTCATTTACACCGAATGAACCAGGAAAATACACAAAGTTGGAGAAAGATGCTC +TAGACTTGCTTTCRRASRATGAAGWTGAAGATTCTGCATCTTCAATCTTAACCTTCGAAGAAAGAGATAC +TTCATCATTAAGCATTGAGGCTAGACTAGAATCGATTGAGGAGAAATTAAGCATGATATTAGGGCTATTA +AGAACACTCAACATTGCCACAGCAGGACCCACAGCAGCAAGAGATGGGATCAGAGATGCAATGATTGGCA +TAAGGGAAGAACTAATAGCAGACATAATAAAAGAAGCCAGGGGAAAAGCAGCAGAAATGATGGAAGAGGA +AATGAACCAACGGACAAAAATAGGAAATGGTAGTGTTAAATTAACTGAAAAGGCAAAGGAGCTCAACAAA +ATTGTTGAAGATGAAAGCACAAGTGGAGAATCTGAAGAAGAAGAAGAACCAAAAGACCTACAGGATAATA +ATCAGGAAGATGACATTTACCAGTTAATTATGTAGTTTAATAAAAATAAACAATGGGACAAGTAAAAATG +GAGTCCTATCTGGTAGACACCTATCAGGGCATCCCTTACACAGCAGCTGTTCAAGTTGATCTAGTAGAAA +AAGACCTGTTACCTGCAAGCCTAACAATATGGTTTCCTTTGTTTCAGGCCAATACACCACCAGCTGTTCT +GCTTGATCAGCTAAAGACTCTGACAATAACTACTCTGTATGCTGCATCACAAAGTGGTCCAATACTAAAG +GTGAATGCATCAGCCCAAGGTGCAGCAATGTCTGTACTTCCCAAAAGGTTTGAAGTCAATGCGACTGTAG +CACTTGACGAATATAGCAAATTAGAATTTGACAAACTCACAGTCTGTGAGGTAAAAACAGTTTACTTAAC +AACTATGAAACCATATGGGATGGTATCAAAATTTGTGAGCTCGGCCAAATCAGTTGGCAAAAAAACACAT +GATCTAATTGCATTATGTGATTTTATGGATCTAGAAAAGAACACACCAGTTACAATACCAGCATTTATCA +AATCAGTTTCTATCAAAGAGAGTGAATCAGCCACTGTTGAAGCTGCAATAAGCAGTGAAGCAGACCAAGC +TCTAACACAAGCCAAAATTGCACCTTATGCGGGGCTGATCATGATTATGACCATGAACAATCCCAAAGGC +ATATTCAAGAAGCTTGGAGCTGGGACACAAGTTATAGTGGAACTAGGAGCATATGTCCAGGCTGAAAGCA +TAAGTAAAATATGCAAGACTTGGAGCCATCAAGGGACAAGATATGTGCTGAAGTCCAGATAACAACCAAG +CAACCTGACCAAGAACTATCAACTCTATTCTATANACTAAAAARTTGCTGTTTTAGTTATATAAAAATCA +AATTAGAGTAAGAATTAAATCAATCAAGAGTGGGACAAATAAAAATGTCTTGGAAAGTGGTGATTATTTT +TTCATTGCTAATAACACCTCAACACGGTCTTAAAGAGAGCTACTTAGAAGAATCATGTAGCACTATAACT +GAGGGTTATCTCAGTGTTCTGAGGACAGGTTGGTATACCAACGTTTTTACATTAGAGGTGGGTGATGTAG +AAAACCTCACATGTGCTGATGGACCTAGCCTAATAAAAACAGAATTAGATCTGACCAAAAGTGCACTTAG +AGAGCTCAAAACAGTTTCTGCTGACCAATTGGCAAGAGAAGAACAAATTGAAAATCCCAGACAATCTAGA +TTCGTTCTAGGAGCAATAGCACTCGGTGTTGCAACAGCAGCTGCAGTTACGGCAGGTGTTGCAATTGCAA +AAACCATCCGGCTTGAGAGTGAAGTTACAGCAATTAAGAATGCCCTCAAAAAGACCAATGAAGCAGTATC +TACATTGGGGAATGGGGTTCGAGTGTTAGCGACCGCAGTGAGAGAACTGAAAGATTTTGTGAGCAAGAAT +TTAACTCGTGCAATCAACAAAAACAAGTGCGACATTGATGACCTAAAAATGGCTGTTAGTTTCAGCCAGT +TCAACAGAAGGTTTCTAAATGTTGTGCGGCAATTTTCAGACAATGCTGGAATAACACCAGCAATATCTTT +AGACTTAATGACAGATGCTGAACTAGCCAGAGCTGTTTCCAACATGCCGACATCTGCAGGACAAATAAAA +TTGATGTTGGAAAACCGTGCAATGGTGCGGAGGAAGGGGTTTGGAATCCTGATAGGGGTCTACGGGAGCT +CCGTAATTTACATGGTGCAGCTGCCAATCTTTGGCGTTATAGATACGCCTTGCTGGATAGTGAAAGCAGC +CCCTTCTTGCTCTGAAAAAAAGGGAAACTATGCTTGCCTCCTAAGAGAAGACCAGGGGTGGTATTGTCAA +AATGCAGGGTCAACTGTCTACTACCCAAATGAGAAGGACTGTGAAACAAGGGGAGATCATGTCTTTTGCG +ACACAGCAGCAGGAATTAATGTTGCTGAGCAATCAAAGGAGTGCAACATCAACATATCCACTACAAATTA +CCCATGTAAAGTCAGCACAGGAAGGCATCCTATCAGTATGGTTGCACTGTCCCCTCTTGGGGCTCTGGTT +GCTTGTTACAAAGGAGTAAGCTGTTCCATTGGCAGCAATAGAGTAGGGATCATCAAGCAGCTGAACAAAG +GTTGCTCTTATATTACCAATCAGGATGCAGACACAGTGACAATAGACAATACTGTATATCAGCTAAGCAA +AGTTGAGGGTGAACAACATGTTATAAAAGGCAGACCAGTGTCAAGCAGCTTTGATCCAGTCAAATTTCCT +GAAGATCAGTTCAATGTTGCACTGGACCAAGTTTTTGAGAACATTGAAAACAGCCAGGCCTTGGTGGATC +AATCAAACAGAATCCTAAGCAGTGCAGAGAAAGGGAACACAGGCTTCATCATTGTGATAATTCTAATTGC +TGTCCTTGGCTCCAGTATGATCCTAGTGAGCATCTTCATTATAATCAAGAAAACAAGGAAACCAACAGGA +GCACCTCCAGAGCTGAGTGGTGTCACAAACAACGGCTTCATACCACACAGTTAGTTAATTAAAAATAAAA +CAAAATTTGGGACAAATCATAATGTCTCGCAAGGCCCCATGCAAATATGAAGTGCGGGGCAAATGCAATA +GAGGAAGTGAGTGTAAGTTTAACCACAATTACTGGAGTTGGCCAGATAGATACTTATTAATAAGATCAAA +TTATCTATTAAATCAGCTTTTAAGGAACACTGATAGAGCTGATGGCCTATCAATAATATCAGGCGCAGGC +AGAGAAGACAGAACTCAAGATTTTGTTCTAGGTTCCACCAATGTGGTTCAAGGTTATATTGATGATAACC +AAAGCATAACAAAGGCTGCAGCCTGCTACAGTCTACACAACATAATCAAACAACTACAAGAAGTTGAAGT +TAGACAGGCTAGAGATAACAAACTATCTGACAGCAAGCATGTGGCACTCCACAACTTAATCTTATCTTAC +ATGGAGATGAGCAAAACTCCTGCATCTTTAATCAACAATCTTAAAAGACTGCCGAGAGAAAAACTGAAAA +AATTAGCAAAGCTGATAATTGACTTATCAGCAGGTGCTGACAATGACTCTTCATATGCCCTGCAAGACAG +TGAAAGCACTAATCAAGTGCAGTGAGCATGGTCCTGTTTTCATCACTATAGAGGTTGATGACATGATATG +GACTCAAAAAGAATTAAAAGAAGCTTTATCCGATGRGATAGTGAAGTCTCATACCAACATTTACAATTGT +TATTTAGAAAACATAGAAATTATATATGTCAAGGCTTACCTAAGTTAGTAAAAACACATCAGGTTGGGAT +AAATGACAATGATAACATTAGATGTCATTAAAAATGATGGGTCTTCAAAAACATGTACTCACCTCAAAAA +AATAATTAAAGACCACTCTGGTAAAGTGCTTATTGCACTCAAGTTAATATTAGCTTTACTAACATTTTTC +ACAGTAACAATCACTATAAATTATATAAAAGTAGAAAACAATCTGCAAATATGCCAGTCAAAAACTGANN +NAGACAAAGAAGACTCACCATCAAACACCACATCTGTCACAACCAAGACCACTCCAGACCATGATATAAC +ACAGTATTTTAAAAGATTGATTCAAAGATATACAGATTCTGTAATAAACAAGGACACATGCTGGAAAATA +AGCAGAAATCAATGCACAAATATAACAACATATAAATTTTTATGTTTCAAACCTGAAGACTCAAAAATCA +GCAGTTGTGACAGACTGACAGATTTATGCAGAAACAAATCAAAACCAGCAGTTGAAGCATATCACATAAT +AGAATGCCACTGTATATACACAATCGAATGGAAGTGCTATCATCATTCAACAGACAAGACTCAACCCTGA +ATGTTAAGACTAGATCAGGATCCGTCCAAGACTATTAGTTCAATAGTTTAGTTATTTAAAAATATTTTGA +AAAACAGGTAGGTTTCTATGACACCTTACAGCAGTAGGCAATAATTAATAACTTAATTACACTTAAAACA +TTATTTAAAACCATAACTAATTAATTTATAAAGTAAAAACAAAAATATGGGACAAGTAGTTATGGAGGTG +AAGGTAGAGAACATTCGAGCAATAGACATGCTCAAAGCAAGAGTTAAAAATCGTGTGGCACGCAGCAAAT +GCTTTAGGAATGCTTCTTTAATCCTCATAGGAATAACTGCTATGAGTATAGCCCTCAATATCTATCTGAT +CATAAACTACACAATACAAAAAACTGCATCCGAATCAGAGCACCACACTAGCTCTCCACCCACAGAATCC +AACAAAGAAACTCCAACAATCCCTATAGACAACTCAGACATTAATCCAAGCTCACAGCTTCCAACTCAAC +AGTCCACAGAAAGCCCCACACTCAACTCCGCAGCCTCGGTGAGCCCATCAGAAACAGAGCCAACATCAAC +ATCAGACACAACAAATCGTCTGCCCTCTGTAGACAGATCCACAACACAACCAAGTGAAAGCAGAACAAAG +ACAAAATCGACAGCCCACAGAAGAAACATCCCAAGTACAGTCCCCAAAACACAACTCCCATCACGGGCAA +CAACGAAGGCGGCCCCCAGAGCCACCACCCTCAGAACAAAAACAAAATCGACAGCCCACAGAAGAAACAT +CCCAAGCACAGTCTCCAGAACACAACTCCCATCACGGGCAACAACGAAGGCGGCCTCCAGAGCCACCACC +CTCCGCACGAGCAGCGCAACAAGGAGACCAACTGCAACATCAGTCCAGTCCGACAGCAGCGCCACAGCTC +AAAAACATGAAGAAACAGGTTCAGTGAACCCACAGGCATCTTCAAGCACAATGCAAAAATAGCACACCAA +CATTGTAAAAACAAATTAGTTAACAAAAAATATGAAACAGCTCCAAAGTAAAACATGTAGGTACTAACAA +TCAAGAAATCAAAAGACAACTCATAATCCACCCAAGACAGCAACAACATCATATCAACTTTGCTCAAATC +ACCCTGAAAGTTCCTCTCAGCTCCACACTGACAATATCACAATCATCTCAAGAAAATAATCTGGGCAAAA +CAGCACCAAAGAGACAAATAACAATGGATCCTCTTAATGAATCCACTGTTAATGTCTATCTCCCTGATTC +GTACCTTAAAGGAGTAATATCTTTCAGTGAAACTAATGCAATTGGTTCATGTCTCTTAAAAAGACCTTAC +TTAAAAAATGACAACACTGCAAAAGTTGCCATAGAGAATCCTGTTATTGAGCATGTTAGACTCAAAAATG +CAGTCAATTCTAAAATGAAAATATCAGATTACAAGGTAGTAGAACCAGTAAACATGCAACATGAAATAAT +GAAGAATGTACACAGTTGTGAACTCACACTATTGAAACAGTTTTTAACAAGGAGTAAAAACATTAGCACT +CTCAAGTTAAATATGATATGTGATTGGCTGCAATTAAAGTCTACATCAGATGATACCTCAATCCTAGGTT +TTATAGATGTAGAATTTATACCTAGTTGGGTAAGTAACTGGTTTAGTAATTGGTACAATCTCAACAAGTT +AATTTTAGAATTCAGAAGAGAGGAAGTAATAAGAACTGGTTCAATCTTGTGTAGATCATTGGGCAAGTTA +GTTTTTATTGTATCATCATATGGATGTATCGTCAAGAGCAACAAAAGCAAAAGAGTGAGCTTCTTCACAT +ACAATCAACTGTTAACATGGAAAGATGTGATGCTAAGTCGATTCAATGCAAATTTCTGTATATGGGTGAG +CAACAGTCTGAATGAAAATCAGGAAGGGCTAGGGTTGAGAAGTAATCTGCAAGGTATGTTAACTAATAAA +TTATATGAAACTGTAGATTATATGTTAAGTTTATGTTGCAATGAAGGTTTCTCACTTGTGAAAGAGTTCG +AAGGTTTTATTATGAGTGAAATCCTTAGGATTACTGAACATGCTCAATTCAGTACTAGATTTAGAAATAC +TTTATTAAATGGATTAACAGATCAATTAACAAAATTAAAAAATAAAAACAGGCTCAGAGTTCATGGTACC +GTATTAGAAAATAATGATTATCCAATGTATGAGGTTGTACTCAAATTATTAGGAGATACTCTGAGATGTA +TCAAATTATTAATCAACAAAAACTTAGAGAATGCTGCAGAATTATACTATATATTCAGAATTTTTGGTCA +CCCAATGGTAGATGAAAGAGATGCAATGGATGCTGTAAAACTAAACAATGAAATCACAAAAATCCTTAGG +TTGGAGAGCTTGACTGAACTAAGAGGGGCATTCATATTAAGGATCATCAAAGGATTTGTGGATAACAATA +AAAGGTGGCCCAAAATTAAAAACCTAAAAGTGCTTAGCAAAAGATGGACTATGTACTTCAAAGCAAAAAG +TTACCCCAGTCAACTCGAATTAAGTGAACAAGACTTTCTGGAGCTTGCTGCAATACAATTTGAACAAGAG +TTTTCTGTTCCTGAAAAAACCAATCTTGAGATGGTATTAAATGATAAAGCTATATCACCTCCTAAAAGAT +TAATATGGTCTGTGTATCCCAAGAATTACTTACCTGAGACGATAAAAAACCGATATCTAGAAGAAGCTTT +CAATGCAAGTGATAGCCTTAAAACAAGGAGAGTGCTAGAGTACTATTTGAAAGATAATAAATTTGATCAA +AGAGAGCTTAAGAGTTATGTAGTTAGACAAGAATATTTAAATGATAAAGAACACATTGTCTCATTAACTG +GAAAAGAAAGAGAATTAAGTGTAGGTAGAATGTTTGCTATGCAACCAGGGAAACAACGACAAATACAAAT +ATTAGCAGAGAAATTGTTAGCTGATAACATTGTACCTTTCTTCCCAGAAACTTTAACAAAGTATGGTGAT +CTAGATCTTCAGAGAATAATGGAAATCAAATCGGAACTTTCTTCTATTAAAACCAGAAGAAATGATAGTT +ATAATAATTACATTGCAAGAGCATCCATAGTAACTGATTTAAGCAAGTTCAACCAAGCCTTTAGATATGA +AACTACAGCAATCTGCGCAGATGTAGCGGACGAATTACATGGAACACAAAGCTTATTCTGTTGGTTACAT +CTTATCGTTCCTATGACTACAATGATATGTGCCTATAGACATGCACCACCAGAAACAAAGGGTGAATATG +ATATAGATAAGATAGAAGAGCAAAGTGGTTTATATAGATATCATATGGGTGGTATTGAAGGATGGTGTCA +AAAACTCTGGACAATGGAAGCTATATCTTTATTGGATGTTGTATCTGTAAAAACACGGTGTCAAATGACA +TCTTTATTAAACGGTGACAACCAATCAATAGATGTAAGTAAACCAGTCAAGTTATCTGAAGATTTAGATG +AAGTGAAGGCAGATTACCGCTTGGCAGTAAAAATGCTAAAAGAAATAAGAGATGCATACAGAAATATAGG +CCATAAACTTAAAGAAGGGGAAACATATATATCAAGGGATCTTCAGTTTATAAGCAAGGTGATTCAATCT +GAAGGGGTAATGCATCCTACTCCTATAAAAAAGATCCTAAGAGTAGGACCGTGGATAAATACAATATTAG +ATGACATTAAAACTAGTGCTGAGTCAATAGGGAGTCTATGTCAAGAATTAGAATTTAGGGGAGAAAGCAT +AATAGTTAGTCTGATATTAAGAAATTTCTGGCTGTATAACTTATACATGCATGAATCAAAGCAACATCCT +CTGGCAGGGAAGCAGTTATTTAAACAACTAAATAAAACACTAACAACAGTGCAGAGATTTTTTGAAATCA +AAAAGGAAAATGAAGTAGTAGATCTATGGATGAACATACCAATGCAATTTGGTGGAGGAGATCCAGTAGT +CTTCTATAGATCTTTCTATAGAAGGACTCCTGATTTTTTAACTGAGGCAATCAGCCATGTGGATATTCTG +TTAAAAATATCAACTAACATAAAAAATGAAACAAAAATAAGTTTTTTCAAAGCCTTACTATCAATAGAGA +AAAATGAGCGTGCTACATTGACAACACTAATGAGAGATCCTCAGGCTGTTGGATCAGAACGACAAGCAAA +AGTAACCAGTGATATCAATAGAACAGCAGTCACCAGTATCTTAAGTCTTTCCCCAAATCAACTTTTCAGT +GATAGTGCTATACATTACAGCAGAAATGAAGAAGAAGTAGGAATCATTGCAGAAAACATAACACCCGTTT +ATCCTCATGGGCTAAGAGTTTTATATGAATCATTACCCTTTCACAAAGCTGAAAAAGTTGTAAACATGAT +ATCAGGGACAAAATCTATAACTAACTTATTACAGAGAACATCTGCTATTAATGGTGAAGATATTGACAGG +GCTGTATCTATGATGTTGGAGAATCTAGGATTATTATCTAGAATATTGTCAATAGTTGTTGATAGTATAG +AAATTCCAACCAAATCTAATGGTAGGCTGATATGTTGTCAAATTTCTAGAACTTTAAGAGAGACATCATG +GAATAATATGGAAATAGTTGGAGTAACATCTCCTAGCATCACTACATGCATGAATGTCATATATGCAACT +AGTTCTCATTTGAAGGGGATAATTATTGAGAAGTTCAGCACTGACAGAACTACAAGAGGTCAAAGAGGTC +CAAAAAGCCCTTGGGTAGGGTCGAGTACACAAGAGAAAAAATTAGTACCTGTTTATAACAGACAAATTCT +CTCAAAACAACAAAGAGAACAGCTAGAAGCAATTGGAAAAATGAGATGGGTGTATAAAGGAACACCAGGA +TTGCGACGATTACTCAACAAGATCTGTCTTGGGAGTTTAGGCATTAGTTATAAGTGTGTAAAACCTTTAT +TACCTAGATTTATGAGTGTAAATTTCTTACATAGATTATCTGTCAGTAGTAGACCTATGGAATTCCCAGC +ATCAGTTCCAGCTTATAGAACAACAAATTACCATTTTGACACTAGTCCCATTAATCAAGCACTAAGTGAG +AGATTTGGGAATGAAGATATTAACTTGGTCTTCCAAAATGCAATCAGCTGTGGTATTAGCATCATGAGTG +TAGTAGAACAATTAACAGGTAGGAGCCCAAAACAGTTAGTTTTAATACCCCAACTAGAGGAAATAGACAT +TATGCCACCACCAGTGTTTCAAGGAAAATTCAATTATAAACTAGTAGATAAGATAACTTCTGATCAACAT +ATCTTCAGTCCGGACAAAATAGATATGTTAACATTAGGGAAAATGCTCATGCCCACTATAAAAGGTCAGA +AAACAGATCAGTTCTTAAATAAGAGAGAGAATTATTTCCATGGAAATAATCTTATTGAGTCTTTATCAGC +AGCATTAGCATGCCATTGGTGTGGGATATTGACAGAACAATGCATAGAAAATAATATTTTCAAGAAAGAC +TGGGGTGATGGATTTATATCAGATCATGCTTTTATGGACTTCAAAATATTCTTATGTGTCTTTAAAACTA +AACTTTTATGTAGTTGGGGATCCCAAGGGAAAAACATTAAAGATGAAGATATAATAGATGAATCAATAGA +TAAATTGTTAAGGATTGATAATACTTTTTGGAGAATGTTCAGCAAGGTTATGTTTGAACCAAAAGTTAAG +AAGAGGATAATGTTATATGATGTAAAATTCCTATCACTAGTAGGTTACATAGGGTTTAAGAACTGGTTTA +TAGAGCAGTTGAGGTCAGCTGAGTTGCATGAAATACCTTGGATTGTCAATGCAGAAGGTGACTTGGTTGA +GATCAAGTCAATTAAGATCTATTTGCAGCTGATAGAACAAAGCTTATTTTTGAGAATAACTGTCCTGAAC +TATACAGATATGGCACATGCTCTCACGCGATTAATCAGAAAGAAGTTGATGTGTGATAATGCACTGTTAA +CCCCAATTTCATCTCCAATTGTTAACTTAACTCAAGTTATTGATCCAACAACACAGTTAGATTACTTCCC +CAAGATAACATTCGAAAGGCTAAAAAATTATGNNACAAGTTCAAATTATGCTAAAGGGAAGCTAACAAGA +AATTACATGATACTGTTGCCATGGCAGCATGTTAATAGATATAACTTTGTCTTTAGTTCTACTGGATGTA +AAGTTAGTCTGAAAACATGTATTGGAAAACTTATGAAAGACTTAAATCCTAAAGTTTTGTACTTCATTGG +AGAAGGAGCAGGAAATTGGATGGCCAGAACAGCATGTGAATATCCTGATATCAAGTTTGTATATAGAAGT +CTGAAAGATGACCTTGATCATCATTACCCTTTAGAATACCAGAGAGTGATAGGTGAATTAAGCAGAATCA +TAGATAGTGGTGAAGGGCTTTCAATGGAAACAACAGACGCAACTCAAAAAACTCATTGGGATTTGATACA +CAGAGTAAGCAAAGATGCTTTATTGATAACTTTATGTGATGCAGAATTTAAGGACAGAGATGATTTTTTT +AAGATGGTAATTCTATGGAGAAAACATGTATTATCATGCAGAATTTGCACTACTTATGGGACAGACCTCT +ATTTATTCGCAAAGTATCACGCTAAAGACTGCAATGTAAAATTACCCTTTTTTGTGAGATCAGTTGCTAC +TTTTATTATGCAAGGTAGTAAGCTGTCAGGTTCAGAATGCTACATACTCTTAACACTAGGCCATCACAAC +AGTTTACCTTGCCATGGAGAAATACAGAATTCTAAGATGAAAATAGCAGTGTGTAATGATTTTTATGCTG +CAAAGAAACTCGACAATAAATCGATTGAAGCTAATTGTAAATCACTTCTGTCAGGGCTAAGGATACCTAT +AAATAAGAAGGAACTAGATAGACAGAGAAGGTTATTAACACTACAAAGCAACCATTCTTCTGTAGCAACA +GTTGGTGGTAGCAAGATCATAGAATCTAAATGGCTAACAAACAAAGCAAGTACAATAATTGATTGGTTAG +AGCATATTTTAAATTCTCCAAAAGGCGAACTAAATTATGATTTTTTTGAAGCATTAGAGAACACTTACCC +TAATATGATTAAGCTAATAGATAACCTAGGGAATGCAGAGATTAAAAAATTGATCAAAGTAACTGGATAC +ATGCTTGTAAGTAAGAAATGAGAAATGATGAAGATGATAAAATAGATAACAAATTCATACCATTCTAAAG +TAATTGTTTGATTATGCAACTATATGGTAGTTAATTAAAAATTAAAATTAAAAATCAAAAGGTAAAGTTT +AAAACYTAWCRTTAAGTTTATTAAAAATAAGAAACTATAATTGAATGTATACGG +>PV541782.1 Human metapneumovirus isolate An.Ma-3 nucleoprotein gene, partial cds +AGAGATGTAGGCACAACAACAGCAGTGACACCCTCATCATTGCAACAAGAAATAACACTGTTATGTGGAG +AAATTTTATATGCTAAGCATATTGATTACAAATATGCTGCAGAAATAGGAATACAATATATCAGCACAGC +TCTAGGGTCAGAGAGAGTACAGCAGATCCTAAGAAACTCAGGCAGTGAAGTTCAAGCGGTTTTAACCAGA +ACATACTCTTTGGGGAAAGTTAAAAACAATAAAGGAGAAGATTTACAGATGCTAGACATACATGGAGTAG +AAAAAAGCTGGGTGGAAGAGATAGACAAAGAAGCAAGAAAAACAATGGCAACTTTACTTAAGGAATCATC +AGGCAATATCCCACAAAACCAGAGGCCTTCAGCACCAGACACACCTATAATCTTATTATGTGTAGGTGCC +TTAATATTTACCAAACTAGCATCAACTATAGAAGTGGGATTAGAGACCACAGTCAGAAGAGCTAACCGTG +TGCTAAGTGATGCACTCAAAAGATACCCTAGAATGGACATACCAAAAATCGCTAGATCTTTCTATGACTT +ATTTGAACAAAAGGTGTATTACAGAAGTTTGTTCATTGAGTATGGCAAAGCATTAGGCTCATCCTCTACA +GGCAGCAAAGCAGAAAGTTTATTCGTTAATATATTCATGCAAGCTTATGGTGCTGGTCAA + + + diff --git a/example_files/hmpv_metadata.xlsx b/example_files/hmpv_metadata.xlsx new file mode 100644 index 0000000..7095eee Binary files /dev/null and b/example_files/hmpv_metadata.xlsx differ diff --git a/example_files/rsv_a.fasta b/example_files/rsv_a.fasta new file mode 100644 index 0000000..28ac240 --- /dev/null +++ b/example_files/rsv_a.fasta @@ -0,0 +1,220 @@ +>LC871580.1 Human respiratory syncytial virus A HRSV/A/Japan/18RS019iso/2018 viral cRNA, complete sequence +GTAAACCAAAAAAATGGGGCAAATAAGAATTTGATAAGTACCACTTAAATTTAACTCCTTTGGTTAGAGA +TGGGCAGCAACTCATTGAGTATGATAAAAGTTAGATTGCAAAATCTGTTTGACAATGATGAAGTAGCATT +GTTAAAAATAACATGCTATACTGACAAATTAATACAGTTAACTAATGCTTTGGCTAAGGCAGTTATACAT +ACAATCAAATTGAATGGCATTGTATTTGTGCATGTTATTACAAGTAGTGATATTTGCCCTAATAATAATA +TTGTAGTGAAATCCAATTTCACAACAATGCCAGTATTACAAAATGGAGGTTATATATGGGAAATGATGGA +ATTAACACACTGCTCTCAACCAAATGGCCTAATAGATGACAATTGTGAAATTAAATTCTCCAAAAAACTA +AGTGATTCAACAATGACCAATTATATGAATCAATTATCTGAATTACTTGGATTTGACCTCAATCCATAAA +TCATAATAAATATCAACTAGCAAATCAATGTCACTAACACCATTAGTTAATATAAAACTTGACAGAAGAT +AAAAATGGGGCAAATAAATCAATTCAGCCGACCCAACCATGGACACAACACACAATGATACCACACCACA +AAGACTGATGATCACAGACATGAGACCATTATCACTTGAGACTATAATAACATCTCTAACCAGAGATATC +ATAACACATAAATTTATATACTTGATAAATCATGAATGCATAGTGAGAAAACTTGATGAAAGACAGGCCA +CATTTACATTTCTGGTCAACTATGAAATGAAACTATTGCACAAAGTGGGAAGCACTAAATATAAAAAATA +TACTGAATACAACACAAAATATGGCACTTTCCCTATGCCAATATTTATCAATCATGATGGGTTCTTAGAA +TGCATTGGCATTAAGCCTACCAAGCACACACCCATAATATACAAGTATGATCTCAATCCATGAATATCAA +ACCAAGATTCAAACAATCCGAAATAACAACTTTATGCATAATCACATTCCATAGTCCAGATGGAGCCTGA +AAATTATAGTTATTTAAAAAATTAGGAGAGACATAAGATGAAAGATGGGGCAAATACAAAAATGGCTCTT +AGCAAAGTCAAGTTGAATGATACACTCAACAAAGATCAACTTCTATCATCCAGCAAATATACCATCCAAC +GGAGCACAGGAGACAGCATTGACACTCCTAATTATGATGTGCAGAAACACATTAATAAGTTATGTGGCAT +GTTATTAATCACAGAAGATGCTAATCATAAATTCACTGGGTTAATAGGTATGTTATATGCTATGTCTAGA +TTAGGAAGAGAAGACACCATAAAAATACTCAAAGATGCGGGATATCATGTTAAGGCAAATGGAGTGGATG +TAACAACACATCGTCAAGACATTAATGGGAAAGAAATGAAATTTGAAGTGTTAACATTAGCAAGCTTAAC +AACTGAAATTCAAATCAACATTGAGATAGAATCTAGAAAATCCTACAAAAAAATGCTAAAAGAAATGGGA +GAGGTGGCTCCAGAATACAGGCATGACTCTCCTGATTGTGGGATGATAATATTATGTATAGCAGCATTAG +TAATAACCAAATTAGCAGCAGGAGATAGATCAGGTCTTACAGCTGTGATTAGGAGAGCTAATAATGTCCT +AAAAAATGAAATGAAACGTTATAAAGGTTTATTACCCAAGGATATAGCCAACAGCTTCTATGAAGTGTTT +GAAAAATATCCTCACTTTATAGATGTTTTTGTTCATTTTGGTATAGCACAATCTTCTACCAGAGGTGGCA +GTAGAGTTGAAGGGATTTTTGCAGGATTGTTTATGAATGCCTATGGTGCAGGGCAAGTGATGTTACGGTG +GGGGGTCTTAGCAAAATCAGTTAAAAACATTATGTTAGGACACGCTAGTGTACAAGCAGAAATGGAACAA +GTTGTGGAGGTGTATGAGTATGCTCAGAAATTGGGTGGAGAAGCAGGATTCTACCATATATTGAACAACC +CAAAAGCATCACTATTATCTTTGACTCAATTTCCTCACTTCTCTAGTGTAGTATTGGGCAATGCTGCTGG +CCTAGGCATAATGGGAGAATACAGAGGTACACCAAGGAATCAAGATTTATATGATGCTGCAAAAGCATAT +GCTGAACAACTCAAAGAAAATGGTGTGATTAACTACAGTGTATTAGATTTGACAGCAGAAGAACTAGAGG +CTATCAAACATCAGCTTAATCCAAAAGATAATGATGTAGAGCTTTGAGTTAATAAAAAGGTGGGGCAAAT +AAATCATCATGGAAAAGTTTGCTCCTGAATTCCATGGAGAAGATGCAAACAACAGAGCCACCAAATTCCT +AGAATCAATAAAGGGCAAATTCACATCACCCAAAGATCCCAAGAAAAAAGATAGTATCATATCTGTCAAC +TCAATAGATATAGAAGTAACCAAAGAAAGCCCTATAACATCAAATTCAACCATTATAAACCCAATAAATG +AGACAGATGATACTGTAGGGAACAAGCCCAATTATCAAAGAAAGCCTCTAGTAAGTTTCAAAGAAGACCC +TACGCCAAGTGATAATCCTTTTTCAAAACTATACAAAGAAACCATAGAAACATTTGATAACAATGAAGAA +GAATCTAGCTATTCATATGAAGAAATAAATGATCAGACAAACGATAATATAACAGCAAGATTAGATAGGA +TTGATGAGAAATTAAGTGAAATACTAGGAATGCTTCACACATTAGTAGTAGCAAGTGCAGGACCCACATC +TGCTCGGGATGGTATAAGAGATGCTATGGTTGGTTTAAGAGAAGAAATGATAGAAAAAATCAGAACTGAA +GCATTAATGACCAATGACAGACTAGAAGCTATGGCAAGACTCAGGAATGAAGAAAGTGAAAAGATGGCAA +AAGACACATCAGATGAAGTGTCTCTCAATCCAACATCAGAGAAACTGAACAACCTGTTGGAAGGGAATGA +TAGTGACAATGATCTATCACTTGAAGATTTCTGATTAGCTACCAAACTGTACATCAAAACACAACACCAA +TAGAAAACCAACAAACAAACCAACTCACCCATCCAACCAAACATCTATCTGCTGATTAGCCAACCAGCCA +AAAAACAACCAGCCAATCTTAAACTAGCCACCCGGAAAAAGTCGATACTATAGTTACAAAAAAAGATGGG +GCAAATATGGAAACATACGTGAATAAACTTCACGAGGGCTCCACATACACAGCTGCTGTTCAATACAATG +TCCTAGAAAAAGACGATGATCCTGCATCACTTACAATATGGGTGCCCATGTTCCAATCATCCATGCCAGC +AGATCTACTCATAAAAGAACTAGCCAATGTCAATATACTAGTGAAACAAATATCCACACCCAAGGGACCC +TCATTAAGAGTCATGATAAACTCAAGAAGTGCAGTGCTAGCACAAATGCCCAGCAAATTTACCATATGTG +CCAATGTGTCCTTGGATGAAAGAAGCAAGCTGGCATATGATGTAACCACACCCTGTGAAATTAAGGCATG +CAGTCTAACATGCCTAAAATCAAAAAATATGTTAACTACAGTTAAAGATCTCACTATGAAAACACTCAAC +CCAACACATGACATCATTGCTTTATGTGAATTTGAAAATATAGTAACATCAAAAAAAGTCATAATACCAA +CATACCTAAGATCTATCAGCGTCAGAAATAAAGATCTGAACACACTTGAAAATATAACAACCACTGAATT +CAAAAATGCCATTACAAATGCAAAAATCATCCCTTACTCAGGATTACTGTTAGTCATCACAGTGACTGAC +AACAAAGGAGCATTCAAATACATAAAGCCACAAAGTCAATTCATAGTAGATCTTGGAGCTTACCTAGAAA +AAGAAAGTATATATTATGTTACAACAAATTGGAAGCACACAGCTACACGTTTTGCAATCAAACCCATGGA +AGATTAACCTTTTTCCTCTACATTAATGAGTAGATTCATACAAACTTTCTAACTACATTCTTCACTTCAC +AATCATAATCACCAACCCTCTGTGGTTCAATCAATCAAACAAAATTCACCAGGAGTTCCAGATCATCCCA +AGTCATTGTTCATCAGATCCAGTACTCAAATAAGTTAATAAAAAATCCACATGGGGCAAATAATCATTGA +GGTTAATCCAACTAATCACAACATCTGTCAACATAGACAAGTCAACACGTTAGATAAAATCAACCAATGG +AAAATACATCCATAACTATAGAATTCTCAAGCAAATTCTGGCCTTACTTTACACTAATACACATGATAAC +AACAATAATCTCTTTGATAATCATAATCTCCATCATGATTGCAATACTAAACAAACTCTGCGAATATAAT +GTATTCCATAACAAAACCTTTGAGCTACCAAGAGCTCGAGTCAATACATAGCATTTATCAATCTGATAGC +TCAAAACAGTAACCTTGCCTTTGCAAATGAACTACCCTCACATCTTCACAAAACCACATCAACATCTCAC +CATGCAAACCATCATCTATACCACAAAGTAGTTAATTAAAAAATAGTCATAACAATGAACTAGGATATTA +AGACCAAAAACAACGCTGGGGCAAATGCAAACATGTCCAAAACCAAGGACCAACGCACCGCCAAGACACT +AGAAAGGACCTGGGACACTCTCAATCATCTATTATTCATATCATCGTGCTTATACAAGTTAAATCTTAAA +TCTATAGCACAAATCACATTATCTATTTTGGCAATGATAATCTCAACCTCACTTATAATTGCAGCCATCA +TATTCATAGCTTCGGCAAACCACAAAGTCACACTAACAACTGCAATCATACAAGATGCAACGAACCAGAT +CAAGAACACAACCCCAACATACCTCACTCAGAATCCCCAGCTTGGAATCAGCTTCTCCAATCTGTCCGGA +ACTACATCACAATCCACCACCATACTAGCTTCAACAACACCAAATGCTGAGTCAACCCCACAATCCACAA +TAGTCAAGATCAAAAACACAACAACAACCCAAATATTACCTAGCAAACCCACCACAAAACAACGCCAAAA +TAAACCACAAAACAAACCCAATAATGATTTTCACTTTGAAGTGTTCAATTTTGTACCCTGCAGCATATGC +AGCAACAATCCAACCTGCTGGGCCATCTGCAAGAGAATACCAAACAAAAAACCTGGAAAGAAAACCACCA +CCAAGCCCACAAAAAAACCAACCCTCAAGACAACCAAAAAAGATCCCAAACCTCAAACCACAAAACCAAT +GGAAGTACTCACTACCAAACCTACAGGAAAGCCAACCATCAACACCACTAAAACAAACATCAGAACTACA +CCGCTCACCTCCAACACCAAAGAAAATCCAGAACACACAAGTCAAGAAGAAACCCTCCACTCAACCACCT +CCGAAGGCTATCCAAGCCCATCCCAAATCTATAAAACATCCGGTCAAGAGGAAACCCTCCACTCAACCAC +CTCCGAAGGCTATCCAAGCCCATCACAAGTCTACACAACATCCGAGTACCTATCACAATCTCTATCTTCA +TCCAACACAACAAAAGGATAGTCATTAAAAAGCATATTGTTGCAAAAAGCCATGACCAAATCAAACAGAA +TCAAAATCAACTCTGGGGCAAATAACAATGGAGTTGCCAATCCTCAAAACAAATGCTATTACCACAATCC +TTGCTGCAGTCACACTTTGTTTTGCTTCCAGTCAAAACATCACTGAAGAATTTTATCAATCAACATGCAG +TGCAGTTAGCAAAGGCTATCTTAGTGCTCTAAGAACTGGTTGGTATACTAGTGTTATAACTATAGAATTA +AGTAACATCAAGGAAAATAAGTGTAATGGTACGGACGCTAAGGTAAAATTAATAAAACAAGAATTAGATA +AATACAAAAATGCTGTAACAGAATTGCAGTTACTCATGCAAAGCACACCAGCAGCCAACAGTCGAGCCAG +AAGAGAACTACCAAGATTTATGAATTATACACTCAACAATACCAAAAACACCAATGTAACATTAAGTAAG +AAAAGGAAGAGAAGATTTCTTGGATTTTTGTTAGGTGTTGGATCTGCAATCGCCAGTGGCATTGCCGTAT +CCAAGGTCCTGCACCTAGAAGGGGAAGTGAACAAAATCAAAAGTGCTCTACTATCCACAAACAAGGCTGT +AGTCAGCTTATCTAATGGAGTCAGTGTCTTAACCAGCAAGGTGTTAGATCTCAAAAACTATATAGATAAA +CAGTTGTTACCTATTGTTAACAAGCAAAGCTGCAGCATATCAAACATTGAAACCGTGATAGAGTTCCAAC +AAAAGAACAACAGACTATTAGAGATTACCAGAGAATTTAGTGTTAATGCAGGTGTAACTACACCTGTAAG +CACTTATATGTTAACTAATAGTGAGTTATTATCATTAATCAATGATATGCCTATAACAAATGATCAGAAA +AAGTTAATGTCCAGCAATGTTCAAATAGTTAGACAGCAAAGTTACTCTATCATGTCAATAATAAAAGAGG +AAGTCTTAGCATATGTAGTACAATTACCACTATATGGTGTAATAGATACTCCTTGTTGGAAACTACACAC +ATCCCCTCTATGTACAACCAACACAAAGGAAGGATCCAACATTTGCTTAACAAGAACCGACAGAGGATGG +TACTGTGACAATGCAGGATCAGTATCCTTTTTCCCACAAGCTGAAACATGTAAAGTTCAATCGAATCGGG +TGTTTTGTGACACAATGAACAGTTTAACATTACCAAATGAGGTAAATCTCTGCAACATTGACATATTCAA +CCCCAAATATGATTGCAAAATTATGACTTCAAAAACAGATGTAAGCAGCTCTATTATCACATCTCTAGGA +GCCATTGTGTCATGCTATGGCAAAACCAAATGTACAGCATCCAATAAAAATCGTGGGATCATAAAGACAT +TCTCTAACGGGTGTGATTATGTATCAAATAAGGGGGTGGATACTGTGTCTGTAGGTAATACATTATATTA +TGTAAATAAGCAAGAAGGCAAAAGTCTCTATGTAAAAGGTGAACCAATAATAAATTTCTATGATCCATTA +GTGTTCCCCTCTGATGAATTTGATGCATCAATATCTCAAGTCAATGAGAAAATTAATCAGAGTCTAGCAT +TTATCCGTAAATCAGATGAATTATTACATAATGTAAATGCTGGTAAATCCACCACAAATATCATGATAAC +TACCATAATTATAGTAATTATAGTAATATTGTTAGCATTAATTGCAGTTGGACTGCTTCTATACTGCAAG +GCCAGAAGCACACCAGTCACATTAAGTAAGGATCAACTGAGTGGTATAAATAATATTGCATTTAGTAACT +GAATAAAAATAGCACCTAATCATATTCTTACAATGGTTCGCTATTTGACCATAGATAACCCATCTATCAT +TAGATTATCCTAAAATTTGAACTTCATCACAACTTTCATCTATAAACCATCTCACTTACACTTTTTAAGT +AGATTCCTATTTTATAGTTATATAAAACAATTGAATACCAAATTAACTTACTATTTGTAAAAATGAGAAC +TGGGGCAAATATGTCACGAAGGAATCCTTGCAAATTCGAAATTCGAGGTCATTGCTTGAATGGTAAAAGG +TGTCATTTTAGTCATAATTATTTTGAATGGCCACCCCATGCACTGCTTGTAAGACAAAACTTTATGTTAA +ACAGAATACTTAAGTCTATGGATAAAAGCATAGATACTTTGTCAGAAATAAGTGGAGCTGCAGAGTTGGA +CAGAACAGAAGAGTATGCCCTCGGTGTAGTTGGAGTGCTAGAGAGTTATATAGGATCAATAAATAATATA +ACTAAACAATCAGCATGTGTTGCCATGAGTAAACTCCTTACTGAACTCAACAGCGATGACATCAAAAAAC +TAAGGGACAATGAAGAGCCAAACTCACCCAAAGTAAGAGTGTACAATACTGTCATATCATATATTGAAAG +CAACAGGAAGAACAATAAACAAACTATCCATCTGTTAAAAAGATTGCCAGCAGACGTATTGAAGAAAACC +ATCAAAAACACATTGGATATCCACAAGAGCATAACCATCAATAACCCAAAAGAATCAACTGTTAGTGATA +CGAACGACCATGCCAAAAATAATGATACTACCTGACAAATATCCTTGTAGTATAAATTCCATACTAATAA +CAAGTAATTGTAGAGTCACTATGTATAATCAAAAAAACACACTATATATCAATCAAAACAACCAAAATAA +CCATATATACCCACCGGATCAACCATTCAATGAAATCCATTGGACCTCTCAAGACTTGATTGATGCAACT +CAAAATTTTCTACAACATCTAGGTATTACTGATGATATATACACAATATATATATTAGTGTCATAATACT +CAATCCTAATACTTACCACATCATCAAATTATTAACTCAAACAATTCAAGCTATGGGACAAAATGGATCC +CATTATTAGTGGAAATTCTGCTAATGTTTATCTAACTGATAGTTATTTAAAAGGTGTTATTTCTTTCTCA +GAATGTAACGCTTTAGGAAGTTACATATTCAATGGTCCTTATCTCAAAAATGATTATACCAACTTAATTA +GTAGACAAAATCCATTAATAGAACACATAAATCTAAAGAAACTAAATATAACACAGTCCTTAATATCTAA +GTATCATAAAGGTGAAATAAAAATAGAAGAACCTACTTACTTTCAGTCATTACTTATGACATACAAGAGT +ATGACCTCGTCAGAACAGACTACTACTACTAATTTACTTAAAAAGATAATAAGAAGAGCTATAGAAATCA +GTGATGTCAAAGTCTATGCTATATTGAATAAACTGGGGCTCAAAGAAAAAGACAGGATTAAATCCAATAA +TGGACAAGATGAAGACAACTCAGTCATTACTACCATAATCAAAGATGATATACTTTTAGCTGTCAAGGAT +AATCAATCTCATCTTAAAGCAGACAAAAATCAATCCACAAAACAAAAAGATACAATCAAAACAACACTTT +TGAAGAAATTAATGTGTTCAATGCAACATCCTCCATCATGGTTAATACATTGGTTTAATTTATACACAAA +ATTAAACAGCATATTAACACAATATCGATCTAGTGAGGTAAAAAACCATGGTTTTATATTGATAGATAAT +CATACTCTTAGTGGATTCCAATTTATTTTGAATCAATATGGTTGTATAGTTTATCATAAGGAACTCAAAA +GAATTACTGTGACAACTTATAATCAATTCTTGACATGGAAAGATATTAGCCTTAGTAGATTAAATGTTTG +TTTGATTACATGGATTAGTAACTGCCTGAACACATTAAACAAAAGCTTAGGCTTAAGATGTGGATTCAAT +AATGTTATCTTGACACAATTATTCCTTTATGGAGATTGTATACTAAAACTATTCCACAATGAGGGGTTCT +ACATAATAAAAGAGATAGAGGGATTTATTATGTCTCTAATTTTAAATATAACAGAAGAAGATCAATTCAG +AAAACGGTTTTATAATAGTATGCTCAACAACATCACAGATGCCGCCAACAAAGCTCAAAAAAATCTGCTA +TCAAGAGTATGTCATACATTATTAGATAAGACAATATCAGACAATATAATAAATGGCAGATGGATAATTC +TATTGAGCAAGTTCCTAAAATTAATTAAGCTTGCAGGTGACAACAACCTCAACAATCTGAGTGAATTATA +TTTTTTGTTCAGGATATTTGGACACCCAATGGTAGATGAAAGACAAGCCATGGATGCTGTTAAAGTTAAT +TGCAACGAGACCAAATTTTACTTGTTAAGTAGTTTGAGTATGTTAAGAGGAGCTTTTATATATAGAATTA +TAAAAGGGTTTGTAAATAATTACAACAGATGGCCTACTTTAAGAAATGCCATTGTCTTACCCTTAAGATG +GTTAACTTACTATAAACTAAACACTTATCCTTCCTTGTTGGAACTTACAGAAAGAGATTTGATTGTTCTA +TCAGGACTACGTTTCTATCGAGAGTTTCGGTTGCCTAAAAAAGTGGATCTTGAAATGATCATAAATGATA +AAGCTATATCACCTCCTAAAAATTTAATATGGACTAGTTTCCCTAGAAATTATATGCCGTCACACATACA +AAATTATATAGAACACGAAAAATTAAAATTCTCTGATAGTGATAAATCAAGAAGAGTATTAGAGTATTAT +TTAAGAGATAACAAATTCAATGAATGTGATTTACACAACTGTGTAGTTAATCAAAGTTATCTTAACAACC +CGAATCATGTGGTATCATTGACAGGCAAAGAAAGAGAACTCAGTGTAGGTAGAATGTTTGCAATGCAACC +AGGAATGTTCAGACAAGTTCAAATATTAGCAGAGAAAATGATAGCAGAAAACATATTACAATTTTTCCCT +GAAAGTCTTACAAGATATGGTGATCTAGAACTACAGAAAATATTAGAATTGAAAGCAGGAATAAGTAACA +AATCAAATCGTTACAATGATAATTACAACAATTACATTAGTAAGTGCTCTATCATCACAGATCTCAGCAA +ATTCAATCAAGCATTTCGATATGAAACTTCATGTATTTGTAGTGATGTACTGGATGAACTGCATGGTGTA +CAATCTCTATTTTCCTGGTTACATTTAACTATTCCTCATGTCACAATAATATGCACATATAGGCATGCAC +CTCCCTATATAAAGGATCATATTGTAGATCTTAACAATGTAGATGAGCAAAGTGGACTATATAGATATCA +TATGGGTGGTATCGAAGGGTGGTGTCAAAAACTATGGACTATAGAAGCTATATCACTATTAGATCTAATA +TCTCTCAAAGGGAAATTCTCAATTACTGCTTTAATTAATGGTGACAATCAATCAATAGATATAAGTAAAC +CAGTCAGACTCATGGAAGGTCAAACTCATGCTCAAGCAGATTATTTGCTAGCATTAAATAGTCTCAAATT +ACTGTATAAAGAGTATGCAGGAATAGGCCACAAATTAAAAGGAACTGAGACTTATATATCGAGAGATATG +CAATTTATGAGTAAAACGATCCAACATAACGGTGTATATTACCCAGCTAGTATAAAGAAAGTCCTAAGAG +TGGGACCGTGGATAAACACTATACTTGATGACTTCAAAGTGAGTCTAGAATCTATAGGTAGTTTGACACA +AGAATTAGAATATAGAGGTGAAAGTCTATTATGCAGTTTAATATTTAGGAATGTATGGTTATATAATCAA +ATTGCATTACAACTTAAAAATCATGCATTATGTAACAACAAATTATATTTGGATATATTAAAAGTTCTAA +AACACTTAAAAACCTTTTTTAATCTTGATAACATTGATACAGCATTAACATTGTATATGAATTTGCCCAT +GTTATTTGGTGGTGGTGATCCCAACTTGTTATATCGAAGTTTCTATAGAAGAACTCCTGATTTCCTCACA +GAGGCTATAGTTCACTCTGTGTTCATACTTAGTTATTATACAAACCATGATTTAAAAGATAAACTTCAAG +ATCTGTCAGATGATAGATTGAATAAGTTCTTAACATGCATAATCACGTTTGATAAAAACCCCAATGCTGA +ATTCGTTACATTGATGAGAGATCCTCAAGCTTTAGGATCTGAGAGGCAAGCTAAAATTACTAGCGAAATC +AATAGACTGGCAGTTACCGAGGTTTTGAGCACAGCTCCAAACAAAATATTTTCCAAAAGTGCACAACACT +ATACCACTACAGAGATAGATCTTAATGATATTATGCAAAATATAGAACCTACATATCCTCACGGGCTAAG +AGTTGTTTATGAAAGTTTACCCTTTTATAAAGCAGAGAAAATAGTAAATCTTATATCCGGTACAAAATCT +ATAACTAACATACTGGAAAAGACTTCTGCCATAGACTTAACAGATATTGATAGAGCCACTGAGATGATGA +GGAAAAACATAACTTTGCTTATAAGGATATTACCATTAGATTGTAACAGAGATAAAAGAGAAATATTGAG +TATGGAAAACTTAAGTATTACTGAATTAAGCAAATACGTTAGAGAAAGATCTTGGTCGTTATCCAATATA +GTTGGTGTTACATCACCCAGTATCATGTATACAATGGATATAAAATATACAACAAGCACTATAGCTAGTG +GCATAATCATAGAGAAATATAATGTCAACAGTTTAACACGTGGTGAGAGAGGACCCACTAAACCATGGGT +TGGTTCATCTACACAAGAGAAAAAGACAATGCCAGTTTATAATAGACAAGTTTTAACCAAAAAACAGAGA +GATCAAATAGATCTATTAGCAAAATTGGATTGGGTGTATGCATCTATAGATAACAAGGATGAATTTATGG +AGGAACTTAGCATAGGAACTCTTGGGTTAACATATGAGAAGGCCAAAAAATTATTCCCACAATATTTAAG +TGTTAACTATTTGCATCGTCTTACAGTCAGTAGTAGACCATGTGAATTCCCTGCATCTATACCAGCTTAT +AGAACTACAAATTATCACTTTGATACTAGCCCTATTAATCGCATATTAACAGAAAAGTATGGTGATGAAG +ATATTGATATAGTATTCCAAAACTGTATAAGCTTTGGCCTTAGCTTAATGTCTGTAGTAGAACAATTTAC +TAATGTGTGTCCTAACAGAATTATTCTCATACCCAAGCTTAATGAGATACATTTGATGAAACCTCCCATA +TTCACAGGTGATGTTGATATTCACAAGTTAAAACAAGTGATACAAAAACAACATATGTTTTTACCAGACA +AAATAAGTTTGACTCAATATGTGGAATTATTCTTAAGTAATAAAACACTCAAATCTGGATCTAATGTTAA +TTCTAATTTAATATTGGCGCATAAGATATCTGACTATTTTCATAATACTTACATTTTAAGTACTAATTTA +GCTGGACATTGGATTCTTATTATACAACTTATGAAAGATTCTAAGGGTATTTTTGAAAAGGATTGGGGAG +AGGGATATATAACTGATCATATGTTCATTAATTTGAAAGTTTTCTTCAATGCTTATAAGACATATCTCTT +GTGTTTTCATAAAGGTTACGGCAGAGCAAAGCTGGAGTGTGATATGAATACTTCAGATCTCTTATGTGTA +TTGGAATTAATAGACAGTAGTTATTGGAAGTCTATGTCTAAGGTGTTTTTAGAACAAAAAGTTATCAAAT +ACATTCTTAGCCAGGATGCAAGTTTACGTAGAGTAAAAGGATGTCATAGCTTCAAACTATGGTTTCTTAA +ACGTCTTAATGTAGCAGAATTCACGGTTTGCCCTTGGGTTGTTAACATAGATTATCATCCAACACATATG +AAAGCAATATTAACTTATATTGATCTTGTTAGAATGGGATTGATAAATATAGATAGAATATACATTAAAA +ATAAACACAAGTTCAATGATGAGTTTTATACTTCTAATCTGTTTTACATTAATTATAACTTCTCAGATAA +TACTCATCTATTAACTAAACATATAAGGATTGCTAATTCCGAATTAGAAAGTAATTACAACAAATTATAT +CATCCCACACCAGAAACCCTAGAAAATATACTAACCAATCCGGTTAAAAGTAATGGAAAAAATACACTGA +GTGACTATTGTATAGGTAAAAATGTTGACTCAATAATGTTACCATCGTTATCTAATAAGAAGCTTATTAA +ATCGTCTACAATGATTAGAACCAATTACAGTAGACAAGATTTGTATAATTTATTTCCTACGGTTGTGATT +GATAAAATTATAGATCATTCAGGTAATACAGCCAAATCTAACCAACTTTACACTACTACTTCTCATCAAA +TATCCTTAGTGCACAATAGCACATCGCTTTATTGCATGCTTCCTTGGCATCATATTAATAGATTCAATTT +TGTATTTAGTTCTACAGGTTGTAAAATTAGTATAGAGTATATTTTAAAAGATCTTAAAATTAAGGATCCT +AACTGTATAGCATTCATAGGTGAAGGAGCAGGGAATTTATTACTGCGTACAGTAGTGGAACTTCATCCTG +ATATAAGATATATTTACAGAAGTCTGAAAGATTGCAATGATCATAGTTTACCAATTGAGTTTTTAAGGCT +GTACAATGGACATATCAACATTGATTATGGTGAAAATTTGACCATTCCTGCTACAGATGCAACCAACAAC +ATTCATTGGTCTTATTTACATATAAAGTTTGCTGAACCTATCAGTCTTTTTGTCTGTGATGCTGAATTGC +CTGTAACAGTCAACTGGAGTAAGATTATAATAGAGTGGAGCAAGCATGTAAGAAAATGCAAGTACTGTTC +TTCAGTTAATAAATGTACATTAATAGTAAAATATCATGCTCAAGATGATATCGATTTCAAATTAGACAAC +ATAACTATATTAAAAACTTATGTATGCTTAGGCAGTAAGTTAAAGGGATCTGAAGTTTACTTAGTCCTTA +CAATAGGTCCTGCAAATGTGTTCCCAGTATTTAATGTAGTACAAAATGCTAAATTGATACTATCAAGAAC +CAAAAATTTCATCATGCCTAAAAAAGCTGATAAAGAGTCTATTGATGCGAATATTAAGAGTTTGATACCC +TTTCTTTGTTACCCTATAACAAAAAAAGGAATTAATACTGCATTGTCTAAATTAAAGAGTGTTGTTAGTG +GAGATATACTATCATATTCTATAGCTGGACGTAATGAAGTTTTCAGCAATAAACTTATAAATCATAAGCA +TATGAACATCTTAAAGTGGTTCAATCATGTTTTAAATTTCAGATCAACAGAATTAAACTATAATCATTTA +TATATGGTAGAATCTACTTATCCTCATCTAAGTGAATTGTTAAACAGCTTGACTACCAATGAACTTAAAA +AACTGATTAAAATCACAGGTAGTTTGTTATACAACTTTTATAATGAATAATGAGCAAAAATCTTATAACA +AAAATAGCTACACACTAACATTGTATTCAATTATAGTTATTTAAAATTAATAATTATATAATTTTTGATA +ACTTCTAGTGAACTAATCCTAAAATTATCATTTTGATCTAGGAAGAATAAGTTTAAATCCAAATCTAATT +GGTTTATATGTATATTAACTAAATTACGAGATATTA + diff --git a/example_files/rsv_a_metadata.xlsx b/example_files/rsv_a_metadata.xlsx new file mode 100644 index 0000000..dab18cb Binary files /dev/null and b/example_files/rsv_a_metadata.xlsx differ diff --git a/example_files/rsv_b.fasta b/example_files/rsv_b.fasta new file mode 100644 index 0000000..87e6edd --- /dev/null +++ b/example_files/rsv_b.fasta @@ -0,0 +1,219 @@ +>PV546158.1 Human respiratory syncytial virus B isolate MN-MDH-RSVB-02822, partial genome +TTAATCAGAAATGGGGTGCAATTCACTGAGCATGATAAAGGTTAGATTACAAAATTTGTTTGATAATGAC +GAAGTAGCATTGTTAAAGATAACATGTTATACTGACAAATTAATTCTTCTGACTAATGCATTAGCCAAAG +CAACAATACATACAATTAAATTAAACGGCATAGTTTTTATACATGTTATAACAAGCAGTGAAGTGTGCCC +TGATAACAATATTGTAGTGAAATCTAACTTTACAACAATGCCAATATTACAAAATGGAGGATACATATGG +GAATTGATTGAATTGACACACTGCTCTCAATTAAATGGTCTAATAGATGATAATTGTGAAATCAAATTTT +CTAAAAGACTAAGTGACTCAGTAATGACTGATTATATGAATCAAATATCTGATTTACTTGGGCTTGATCT +CCATTCATGAATTATGTTTAGTCTAATTCAATAGACATGTGTTTATTACCATTTTAGTTAATATAAAACC +TCATCAAAGGGAAATGGGGCAAATAAACTCACCCAATCAATCAAACCATGAGCACTACAAACGACAACAC +CACCATGCAAAGATTGATGATCACAGACATGAGACCCCTGTCAATGGATTCAATAATGACATCTCTCACC +AAAGAAATCATTACACACAAATTCATATACTTGATAAACAATGAATGTATTGTAAGAAAACTCGATGAAA +GACAAGCTACATTTACATTCCTAGTCAATTATGAAATGAAGCTATTGCACAAAGTAGGGAGTACCAAATA +CAAGAAATACACCGAATATAATACAAAATATGGCACATTCCCTATGCCTATATTTATCAATCATGGCGGG +TTTCTAGAATGTATTGGCATTAAGCCTACAAAACATACTCCTATAATATACAAATATGACCTCAACCCGT +AACCTCCAACAAAAAACCAACTCATCCAAACCAAGCCATTATCCAAACAACAATGCTCAACAGTTAAGAA +GGAGCCAATCCATTTTAGTAATTAAAAATAAGGGTGAAACCAGTAACATAAATTGGGGCAAATACAAAGA +TGGCTCTTAGCAAAGTCAAGTTGAATGATACATTAAATAAGGATCAGCTGCTGTCATCCAGCAAATACAC +TATTCAACGTAGTACAGGAGATAATATTGACACTCCCAATTATGATGTGCAAAAACACCTAAACAAACTA +TGTGGTATGCTATTAATCACTGAAGATGCAAATCATAAATTCACAGGATTAATAGGTATGCTATATGCTA +TGTCCAGATTAGGAAGGGAAGACACTATAAAGATACTTAAAGATGCTGGATATCATGTTAAAGCTAATGG +AGTAGATATAACAACATATCGTCAAGATATAAATGGAAAGGAAATGAAATTCGAAGTATTAACATTATCA +AGCTTGACATCAGAAATACAAGTCAATATTGAGATAGAATCTAGAAAGTCCTACAAAAAAATGCTAAAAG +AGATGGGAGAAGTGGCTCCAGAATATAGGCATGATTCTCCAGACTGTGGGATGATAATACTGTGTATAGC +TGCCCTTGTAATAACCAAATTAGCAGCAGGAGATAGATCAGGTCTTACAGCAGTAATTAGGAGGGCAAAC +AATGTCTTAAAAAACGAAATAAAACGCTACAAGGGCCTAATACCAAAAGACATAGCCAACAGTTTTTATG +AAGTATTTGAAAAATACCCTCATCTTATAGATGTTTTTGTGCACTTTGGCATAGCACAATCATCCACAAG +AGGGGGCAGTAGAGTTGAAGGAATCTTTGCAGGATTGTTTATGAATGCCTATGGTTCAGGACAAGTAATG +CTAAGATGGGGAGTTTTAGCCAAATCTGTAAAAAATATCATGCTAGGACATGCTAGTGTCCAAGCAGAAA +TGGAGCAAGTTGTGGAAGTCTATGAGTATGCACAGAAGTTGGGAGGAGAAGCTGGTTTCTACCATATATT +GAACAATCCAAAAGCATCATTGCTGTCATTAACTCAATTTCCTAACTTCTCAAGTGTGGTCCTAGGCAAT +GCAGCAGGTCTAGGCATAATGGGAGAGTATAGAGGTACACCAAGAAACCAAGATCTCTATGATGCAGCCA +AAGCATATGCAGAGCAACTCAAAGAAAATGGAGTAATAAACTACAGTGTATTAGACTTAACAACAGAAGA +ATTGGAAGCCATAAAGCATCAACTCAACCCCAAAGAAGATGACGTAGAGCTTTAAGTTAACAAAAAATAC +GGGGCAAATAAGTCAACATGGAGAAGTTTGCACCTGAATTTCATGGAGAAGATGCAAATAACAAAGCTAC +CAAATTCCTAGAATCAATAAAAGGCAAGTTTGCATCATCCAAAGATCCCAAGAAGAAAGATAGCATAATA +TCTGTCAACTCAATAGACATAGAAGTCACCAAAGAGAGCCCGATAACATCTGGCACCAACATTATCAATC +CAACAAGTGAAGCCGACAGTACCCCAGAAACTAAAGCCAACTACCCAAGAAAACCCTTAGTAAGCTTCAA +AGAAGATCTCACCCCAAGTGATAACCCTTTCTCTAAGTTGTACAAAGAAACCATAGAAACATTTGATAAC +AATGAAGAAGAATCTAGCTACTCATATGAGGAGATCAATGACCAAACAAATGATAACATTACAGCAAGAC +TAGATAGAATTGATGAAAAATTAAGTGAAATATTAGGAATGCTCCATACATTAGTAGTTGCAAGTGCAGG +ACCTACTTCGGCTCGTGACGGAATAAGAGATGCTATGGTTGGTCTAAGAGAAGAAATGATAGAAAAAATA +AGAGCAGAAGCATTAATGACCAATGATAGGTTAGAGGCCATGGCTAGACTTAGGAATGAGGAAAGCGAAA +AAATGGCAAAAGACACTTCAGATGAAGTGTCTCTCAATCCAACCTCCAAAAAATTGAGTGACTTGTTGGA +AGACAACGATAGCGACAATGATCTATCACTTGATGATTTTTGATCAGTCATCAACTCACTCAGCAATCAA +CAGCATCAACAAAACAGACACCAATCCATTGGATCAACCGCCAGACTGAAAAAACAAACATCCATCAGCA +GAACCACCAACCAATCAATCAACCAATTGATCAATCAGCACTCTGACAAAATCAACAACATAGTAACAAA +AAAAGAACAAGATGGGGCAAATATGGAAACATACGTGAACAAGCTTCACGAAGGCTCCACATACACAGCA +GCTGTCCAGTACAATGTTCTAGAAAAAGATGATGATCCCGCATCACTAACAATATGGGTGCCTATGTTCC +AGTCATCTGTGCCAGCCGACTTGCTCATAAAAGAACTTGCAAGCATCAACATACTAGTAAAGCAGATCTC +TACGCCCAAAGGACCTTCACTACGAGTCACAATCAACTCAAGAAGTGCWGTGCTGGCTCAAATGCCTAGT +AATTTCACCATAAGTGCAAATGTATCATTAGATGAAAGAAGCAAATTAGCATATGATGTAACGACACCTT +GTGAAATCAAAGCATGCAGTTTAACATGCTTGAAAGTAAAAAGTATGTTAACTACAGTCAAAGATCTAAC +CATGAAGACATTCAACCCCACTCATGAGATCATTGCTCTATGTGAATTTGAAAATATTATGACATCAAAA +AGAGTAATAATACCAACCTATCTAAGATCAATCAGTGTCAAAAACAAGGATCTGAACTCACTGGAAAATA +TAGCAACCACCGAATTCAAAAATGCTATCACCAATGCTAAAATTATTCCCTATGCAGGATTAGTGTTAGT +TATCACGGTTACTGATAATAAAGGAGCATTCAAGTATATCAAACCACAGAGTCAATTTATAGTGGATCTT +GGTGCTTACCTAGAAAAAGAGAGCATATATTATGTGACTACTAATTGGAAGCATACAGCTACACGTTTTT +CAATCAAGCCACTAGAGGATTAAACTCAATTATCAACATCAAATGACAGGTTCACATATATCCTCAACTG +CACACTATATCTAAACATCATAAACATCTACACTACACACTTCATCACACAAACCAATCCCACTCAAAAT +CTAAAATCACTTCCAGCCATTATCTGCCAGACCTAGAGTGCGAATAGGTAAATAAAACAAGAATATGGGG +TAAATAGATATCAGTTAGAGTTCAACCAATCTCAACAACCATCTATACCGCCAATCCAATACATACATTG +CAAATCTTAAAATGGGAAACACATCCATCACAATAGAATTCACAAGCAAATTTTGGCCCTATTTTACACT +AATACATATGATCTTAACTCTAATCTCTTTACTAATTATAATCACTATTATGATTGCAATACTAAATAAG +CTAAGTGAACATAAAATATTCTGCAACAAAACTCTTGAACAAGGACAGATGTATCAAATCGACACATAGT +GTTCTCCCATTATGCTGTATCAAATTATAATCTTGTGTATATAAATAAACAAATCCAATCTTCTCACAGA +GTCATGGCATCACAAAACCATGCCAACCATCATGGTAGCATAGAGTAGTTATTAAAAAATTAACATAATG +ATGAATTATTAGTATGGGATCAAAAACAACATTGGGGCAAATGCAACAATGTCCAAAAACAAGAATCAAC +GCACTGCCAGGACTCTAGAAAAGACCTGGGATACTCTTAATCATCTAATTGTAATATCCTCTTGTTTATA +CAAATTAAATTTAAAATCTATAGCACAAATAGCACTATCAGTTTTGGCAATGATAATCTCAACCTCTCTT +ATAATTGCAGCCATAATATTCATCATCTCTGCCAATCACAAAGTTACATTAACAACTGTCACAGTTCAAA +CAATAAAAAACCACACTGAGAAAAACACAACCACTTACTTTACCCAAGTCTCACCAGAAAGGGTTGGCCC +ATCCAAACAACCCACAGCTACTCCACCAATCCACACAAACTCAGCCACAATATCACCCAACACAAAATCA +GAAACACACCATACAACAGCACAAACCAAAGGCACAACCTCTACCCCAACACAGAACAACAAGCCAAGCA +CAAAACCACGTCCAAAAAATCCACCAAAAAAAGATGATTACCATTTTGAAGTGTTCAACTTTGTTCCCTG +TAGTATATGTGGCAACAATCAACTCTGCAAATCCATCTGCAAAACAATACCAAGCAATAAACCAAAGAAA +AAACCAACCACAAAACCCACAAACAAACCACCTACCAAAACCACAAACAAAAGAGACTCCAAAACACCAG +CCAAAACACTGAAAAAAGAAACCACCATCAACCCAACAAAAAAACCAACCCCCAAGACTACAGAAAGAGA +CACCAGCACCCCACAATCCACTGTGCTCGACACAACCACATCAAACCACACAGAAAGGGACACCAGCACC +TCACAATCCACTGCGCTCGACACAACCACACCAAAACACACAACCCAACAGCAATCTCTCCACTCAACCA +TCCCCGAAAACACACCCAACTCTACACAAACACCCACAGCATTCGAGCCCTCCACATCAAACTCTATCCA +AAAACTCCAGTCATATGCTTAGTTATTTAAAAACTACATCTTAGCAGAGAACCGTGATCCCTCAAGCAAG +AACGAAATTAAATCTGGGGCAAATAACCATGGAGTTGCTGATCCATAGATCAAGTGCAATCTTCCTAACT +CTTGCTATTAATGCATTGTACCTTACCTCAAGTCAGAACATAACTGAGGAGTTTTACCAATCAACATGTA +GTGCAGTTAGCAAAGGTTACTTGAGTGCTTTAAGAACTGGTTGGTATACCAGTGTCATAACAATAGAATT +AAGTAATATAAAAGAAACCAAATGCAATGGAACTGACACTAAAGTTAAACTTATAAAACAAGAATTAGAT +AAGTATAAGAATGCAGTAACTGAATTACAGTTACTTATGCAAAACACACCAGCTGTCAACAACCGGGCCA +GAAGAGAAGCACCACAGTATATGAACTATACAATCAATACCACCAAAAACCCAAATGTATCAATAAGCAA +GAAGAGGAAACGAAGATTTCTGGGCTTCTTGTTAGGTGTAGGATCTGCAATAGCAAGTGGTATAGCTGTA +TCCAAAGTTCTACACCTTGAAGGAGAAGTGAACAAGATCAAAAATGCTTTGCAGCTTACGAACAAAGCTG +TAGTCAGTCTATCAAATGGGGTCAGTGTTTTAACCAACAGAGTGTTAGATCTCAAGAATTATATAAACAA +CCAATTATTACCTATGGTAAATCGACAGAATTGTCGCATATCCAACATTGAGACAGTTATAGAATTCCAG +CAGAAGAACAGCAGATTGTTGGAAATCACCAGAGAATTTAGTGTCAATGCAGGTGTAACGACACCTTTAA +GCACTTACATGTTAACAAACAGTGAGTTACTATCATTAATCAATGATATGCCTATAACAAATGATCAGAA +AAAATTAATGTCAAGCAATGTTCAGATAGTAAGGCAACAAAGTTATTCTATCATGTCTATAATAAAGGAA +GAAGTCCTTGCATATGTTGTACAGCTACCTATCTATGGTGTAATTGATACACCTTGCTGGAAATTACACA +CATCACCTCTGTGCACCACCAACATCAAAGAAGGATCAAATATTTGTTTAACAAGGACTGATAGAGGATG +GTATTGTGATAATGCAGGATCAGTATCCTTCTTTCCACAAGCTGACACTTGTAAAGTACAGTCCAATCGA +GTATTTTGTGACACTATGAACAGTTTGACATTACCAAGTGAAGTCAGCCTTTGTAACACTGACATATTCA +ATCCCAAGTATGACTGCAAAATTATGACATCAAAAACAGACATAAGCAGCTCAGTAATCACTTCTCTAGG +AGCTATAGTGTCATGCTATGGTAAGACTAAATGTACTGCATCCAACAAAAATCGTGGAATTATAAAGACA +TTTTCTAATGGCTGTGATTATGTGTCAAATAAAGGAGTAGATACTGTATCAGTGGGCAACACTTTATATT +ATGTCAACAAGCTGGAAGGCAAAAACCTTTATGTAAAAGGGGAACCTATAATAAATTACTATGACCCTCT +AGTGTTTCCTTCTGATGAGTTTGATGCATCAATATCTCAAGTCAATGAAAAAATTAATCAAAGTTTAGCT +TTTATTCGTAGATCCGATGAATTATTACATAATGTAAATACTGGAAAATCTACTACAAATATTATGATAA +CTGCAATTATTATAGTAATCATTGTAGTATTGTTATCATTAATAGCTATTGGTTTACTGTTGTATTGCAA +AGCCAAAAACACACCAGTTACATTAAGCAAAGACCAACTAAGTGGGATCAATAATATTGCATTCAGCAAA +TAGACAAAAAACCACCTGATCATGTTCCAACAACAATCTGCTGACCATCAATCCCAAATCAACTTACAAC +AGATACATTAACATCACAGCACAGGCTGAATCATCTCCTCGCATCATGCTACCCACACAACTAAGCTAGA +TCCTTAATTCATAGTTACATAAAAGCCTCAAATATCGCAATCAACACTAAATCAACACATCATTCACAAA +ACTAACAGCTGGGGCAAATATGTCGCGAAGAAATCCCTGCAAATTTGAGATTAGAGGTCATTGCTTGAAT +GGTAGAAGATGCCACTACAGTCATAATTACTTTGAATGGCCTCCTCATGCATTGCTAGTGAGGCAAAACT +TCATGTTAAACAAGATACTCAAGTCAATGGACAAGAGCATAGACACTTTGTCTGAAATAAGTGGAGCTGC +TGAACTTGATAGAACAGAAGAATATGCTCTTGGTATAGTTGGAGTGCTAGAGAGCTACATAGGATCTATA +AACAACATAACAAAACAATCAGCATGTGTTGCTATGAGTAAACTTCTTATTGAGATCAATAGTGATGACA +TTAAAAAGCTGAGAGATAATGAAGAACCCAATTCACCTAAGATAAGAGTGTACAATACTGTTATATCATA +CATCGAGAGCAATAGAAAAAACAGCAAGCAAACCATCCATCTGCTTAAACGATTACCAGCAGACGTGCTG +AAGAAGACAATAAAGAACACATTAGATATCCACAAAAGCATAACCATAAGCAACCCAAAAGAGTCAACCA +TAAGTGATCAAAATGACCAAACCAAAAATAATGATATTACCGGATAAATATCCTTGTAGTATATCATCCA +TATTGATCTCAAGTGAAAGCACGATTGCTACATTCAATCATAAAAACATATTACAATTTAACCACAACCA +TTTAGATAACCACCAGTTTTTATTAAATCATATATTTGATGAAATTCATTGGACACCTAAAAACTTATTA +GATGCCACTCAACAATTTCTCCAACATCTTAACATCCCTGAAGATATATATACAGTATATATATTAGTGT +CATAATGCTTGATCATAACGATTCTATATCATCCAACCACAAAACTGTCTTAATAAAGTTATGGGACAAA +ATGGATCCCATTATTAATGGAAGCTCTGCTAATGTATATCTAACTGATAGTTATCTAAAAGGTGTTATCT +CTTTTTCAGAATGTAATGCTTTAGGGAGTTACCTTTTTAACGGCCCTTATCTTAAAAATGATTATACCAA +CTTAATTAGTAGACAAAGCCCACTAATAGAGCATATGAATCTAAAAAAACTAACTATAACACAGTCATTA +ATATCTAGATACCATAAAGGTGAACTGAAATTAGAAGAACCAACTTATTTCCAGTCATTACTTATGACAT +ATAAAAGCATGTCCTCGTCTGAACAAATTGCTACAACTAACTTACTTAAAAAAATAATACGAAGAGCTAT +AGAAATAAGTGATGTAAAAGTGTACGCCATCTTAAATAAACTAGGACTAAAGGAAAAGGACAGAGTTAAG +CCCAACAACAATTCAGATGATGAAAACTCAGTACTTACAACCATAATTAAAGATGATATACTCTCAGCTG +TGGAAAACAATCAATCATATACAAATTCAGATAAAAATTACTCAGTAAATCAAAATATCAATATCAAAAC +AACACTCTTAAAAAAGTTGATGCGTTCAATGCAACATCCTCCATCATGGTTANNNNNNNNNNNNNNNNNN +NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN +NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTTATTTTAAATCAATATGGTTGCATTGTTTATCATAAAGG +GCTCAAAAAAATTACAACTACTACATACAATCAATTTTTGACATGGAAAGACATCAGCCTCAGTAGATTA +AATGTTTGCTTAATTACTTGGATAAGTAATTGTTTAAATACATTAAATAAAAGCTTAGGGTTGAGATGCG +GATTCAATAATGTTGTGCTATCACAATTATTCCTTTACGGAGATTGTATACTGAAATTATTTCATAATGA +AGGCTTTTACATAATAAAAGAAGTAGAAGGATTTATTATGTCTTTAATTCTAAACATAACAGAAGAAGAT +CAATTTAGGAAACGATTTTATAATAGCATGCTAAACAACATCACAGATGCAGCTATTAAGGCTCAAAAGG +ATCTACTATCAAGAGTATGTCACACATTATTAGACAAGACAGTGTCTGATAATATCATAAATGGTAAATG +GATAATTCTATTGAGTAAATTCCTTAAATTGATTAAGCTTGCAGGTGATAATAATCTCAATAACTTGAGT +GAGCTATATTTTCTCTTCAGAATCTTTGGACATCCAATGGTTGATGAAAGACAAGCAATGGATGCTGTAA +GAATTAACTGCAATGAAACTAAGTTCTATTTATTAAGTAGCCTAAGTACGTTGAGAGGTGCTTTCATTTA +TAGAATCATAAAAGGGTTTGTAAATACCTACAACAGATGGCCCACTTTAAGGAATGCTATTGTCCTACCT +CTAAGATGGTTAAACTATTATAAACTTAATACTTATCCATCTCTACTTGAAATCACAGAAAATGATTTGA +TTATTTTATCAGGATTGCGGTTCTATCGTGAGTTTCATCTGCCTAAAAAAGTGGATCTTGAAATGATAAT +AAATGACAAAGCTATTTCTCCTCCAAAAGATCTAATATGGACTAGTTTTCCTAGAAATTACATGCCATCA +CATATACAAAATTATATAGAACATGAAAGGTTGAAGTTCTCTGAAAGCGACAGATCAAGAAGAGTACTAG +AGTATTACTTGAGAGATAATAAATTCAATGAATGTGACCTATACAATTGTGTAGTTAATCAAAGCTATCT +CAACAACTCTAATCATGTGGTATCACTAACTGGTAAAGAAAGAGAGCTCAGTGTGGGTAGAATGTTTGCT +ATGCAACCAGGTATGTTTAGGCAAATCCAAATCTTAGCAGAAAAAATGATAGCCGAAAATATTTTACAAT +TCTTCCCTGAGAGTTTGACAAGATATGGTGATCTAGAGCTTCAAAAGATATTAGAATTAAAAGCAGGAAT +AAGCAACAAGTCAAATCGTTATAATGATAACTACAACAATTATATCAGTAAATGTTCTATAATAACAGAT +CTTAGCAAATTTAATCAAGCATTTAGATATGAAACATCATGTGTCTGCAGTGATGTATTAGACGAACTGC +ATGGAGTACAATCTCTATTCTCTTGGTTGCATTTAACAATACCTCTTGTCACAATAATATGTACATATAG +ACATGCACCTCCTTTTATAAAGGATCATGTTGTCAATCTTAATGAAGTTGATGAACAAAGTGGGTTATAC +AGATATCATATGGGTGGTATTGAGGGCTGGTGTCAAAAACTGTGGACCATTGAAGCCATATCATTATTAG +ATCTAATATCTCTTAAAGGTAAATTCTCCATCACAGCTCTGATAAATGGTGATAATCAGTCAATTGATAT +AAGTAAACCAGTTAGACTTATAGAGGGTCAGACCCATGCTCAAGCAGATTATTTGTTAGCATTAAATAGC +CTTAAATTGCTATATAAAGAGTATGCAGGTATAGGCCATAAGCTTAAGGGAACTGAGACCTATATATCTC +GAGATATGCAGTTCATGAGCAAAACAATCCAGCACAATGGAGTGTACTATCCAGCCAGTATCAAAAAAGT +CCTGAGAGTAGGTCCATGGATAAATACAATACTTGATGATTTTAAAGTTAGTTTAGAATCTATAGGTAGC +TTAACACAGGAGTTAGAATACAGAGGAGAAAGCTTATTATGCAGTTTAATATTTAGGAATATTTGGTTAT +ACAATCAAATTGCTCTGCAACTCCGTAATCATGCTTTATGTAATAATAAGCTATATTTAGATATATTGAA +AGTATTAAAACACTTAAAAACCTTTTTTAATCTTGATAGTATCGATACGGCGTTATCATTGTATATGAAC +TTGCCTATGCTATTTGGTGGTGGTGATCCTAATTTGTTATATCGAAGCTTTTATAGGAGAACTCCAGACT +TCCTTACAGAAGCTATAGTACATTCAGTGTTTGTGTTGAGCTATTATACTGGTCACGATCTACAAGATAA +GCTCCAGGATCTTCCAGACGATAGACTGAACAAATTCTTGACTTGTGTCATCACATTTGATAAAAATCCA +AATGCCGAGTTTGTAACATTGATGAGGGATCCACAGGCTTTAGGGTCTGAAAGGCAAGCTAAAATTACTA +GTGAGATTAATAGATTAGCAGTAACAGAAGTCTTAAGTATAGCTCCAAACAAAATATTTTCTAAAAGTGC +GCAACACTATACTACCACTGAGATTGATCTAAATGACATTATGCAAAATATAGAACCAACTTANNNNNNN +NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN +NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN +NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN +NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGAAAGATCTTGGTCATTAT +CCAATATAGTAGGAGTAACATCACCTAGTGTTATGTTCACAATGGACATTAAATATACAACTAGCACTAT +AGCCAGTGGTATAATTATAGAAAAATATAATGTTAATGGTTTAACTCGTGGTGAAAGAGGACCTACTAAG +CCATGGGTAGGTTCATCCACACAGGAGAAAAAAACAATGCCAGTGTACAATAGACAAGTTTTAACCAAAA +AGCAAAGAGACCAAATAGATTTATTAGCAAAATTAGATTGGGTATATGCATCCATAGACAATAAAGATGA +ATTCATGGAAGAACTGAGTACTGGAACACTTGGACTGTCATATGAAAAGGCCAAAAAGTTGTTTCCACAA +TATCTAAGTGTCAATTATTTACACCGGTTAACAGTCAGTAGTAGACCATGCGAATTTCCTGCCTCAATAC +CAGCTTATAGAACAACAAATTATCATTTTGACACTAGTCCTATCAATCATGTATTAACAGAAAAGTATGG +AGATGAAGATATCGACATTGTGTTTCAAAATTGCATAAGTTTTGGTCTTAGCTTGATGTCAGTTGTGGAA +CAATTCACAAACATATGTCCTAATAGAATTATTCTCATACCGAAGCTGAATGAGATACATTTGATGAAAC +CTCCTATATTTACAGGAGATGTTGATATCATCAAGTTGAAGCAAGTGATACAAAAACAGCATATGTTCCT +ACCAGATAAAATAAGTTTAACCCAATATGTAGAATTATTCTTAAGTAACAAAGCACTTAAATCTGGATCT +CATATCAACTCTAATTTAATATTAGCACATAAAATGTCTGATTATTTTCATAATGCATATATTTTAAGTA +CTAATTTAGCTGGACATTGGATTCTGATTATTCAACTTATGAAAGATTCAAAAGGTATTTTTGAAAAAGA +TTGGGGAGAGGGGTATATAACTGATCATATGTTCATTAATTTGAATGTTTTCTTTAATGCTTATAAGACT +TATTTGCTATGTTTTCATAGAGGTTATGGTAAAGCAAAATTAGAATGTGATATGAACACTTCAGATCTTC +TTTGTGTTTTGGAGTTAATAGACAGTAGCTACTGGAAATCTATGTCTAAAGTTTTCCTAGAACAAAAAGT +CATAAAATACATAGTCAATCAAGACACAAGTTTGCATAGAATAAAAGGTTGTCACAGTTTTAAGTTGTGG +TTTTTAAAACGCCTTAATAATGCTAAATTTACCGTATGCCCTTGGGTTGTTAACATAGATTATCACCCAA +CACACATGAGAGCTATATTATCTTACATAGATTTAGTTAGAATGGGGTTAATAAATGTAGATAAATTAAC +CATTAAAAATAAAAACAAATTCAATGATGAATTTTACACATCAAATCTCTTTTACATTAGTTACAACTTT +TCAGACAACACTCATCTGCTAACAAAACAAATAAGGATAGCTAATTCAGAATTAGAAGATAATTATAACA +AACTATATCACCCAACCCCAGAAGCTTTAGAAAATGTATCATTAATCCCTGTTAAAAGTAATAATAGAAA +CAAACCTAAATTTTGTATAAGTGGAAGTACTGAATCTATGATGACGTCAACATTCTCTAATAAAATGCAT +ATTAAATCTTCCACTGTTACCACAAAATTCAATTATAGCAGACAAGACTTGTACAATTTATTTCCAGTTG +TTGTGATAGACAGGATTATAGATCATTCAGGTAATACAGAAAAATCTAACCAACTTTACACCACCACTTC +ACATCAGACATCTTTAGTAAGGAATAGTGCATCACTTTATTGCATGCTTCCTTGGCATCATGTCAATAGA +TTTAACTTTGTATTTAGTTCCACAGGATGCAAGATCAGTATAGAATATATTTTAAAAGATCTTAAGATTA +AAGATCCCAGTTGTATAGCATTCATAGGTGAAGGAGCTGGTAACTTATTATTACGTACGGTAGTAGAACT +TCATCCTGACATAAGATATATTTACAGAAGTTTAAAAGATTGCAATGATCATAGTTTACCTATTGAATTT +CTAAGGTTATACAACGGGCATATAAACATAGATTATGGTGAGAATTTAACCATTCCTGCTACAGATGCAA +CTAACAACATACATTGGTCTTATTTACATATAAAATTTGCAGAACCTATTAGTATCTTTGTCTGTGATGC +TGAATTACCTGTCACAGCCAATTGGAGTAAAATCATAATTGAATGGAGTAAGCATGTAAGAAAGTGCAAA +TACTGTTCTTCTATAAATAGATGCATTTTAATTGCAAAATACCATGCTCAAGATGATATTGATTTCAAAT +TAGATAACATAACTATATTAAAAACTTATGTGTGCCTAGGCAGCAAGTTAAAAGGATCTGAAGTTTACTT +AGTCCTTACAATAGGCCCTGCAAATATACTTCCTGTTTTTGATGTTGTGCAAAATGCTAAATTGATTCTT +TCAAGAACTAAAAATTTCATTATGCCTAAAAAGATTGACAAGGAATCTATCGATGCAAATATTAAAAGCT +TAATACCTTTCCTTTGTTACCCTATAACAAAAAATGGAATTAAGACTTCATTGTCAAAATTGAAGAGTAT +AGTTAATGGAGATATATTATCATATTCTATAGCTGGACGTAATGAAGTATTCAGTAACAAGCTTATAAAC +CACAAGCATATGAATATCTTAAAATGGCTGGATCATGTTTTAAACTTTAGATCAGCTGAACTTAATTACA +ATCATTTATACATGATAGAGTCCACATATCCTTACTTGAGTGAATTATTAAATAGTTTAACAACCAATGA +GCTCAAGAAGCTGATTAAAATAACAGGTAGTGTACTATACAACTTTCCTAATGAACAGTAACTTAAAATA +TCATTAACAAGTTTGGTCAAATTTAGATGCTAACACATTATTATATTATAGTTATTAAAAAATATATATG +CAAACTTTTCAATAATTTAGCATATTGATTCCAAAATTATCATTTTAATCTTAAGGGATTAAATAAAAGT +CTAAAACTAACAATCACACAT + diff --git a/example_files/rsv_b_metadata.xlsx b/example_files/rsv_b_metadata.xlsx new file mode 100644 index 0000000..b210307 Binary files /dev/null and b/example_files/rsv_b_metadata.xlsx differ