Skip to content

Commit 9662ed0

Browse files
authored
Merge pull request #1 from pfizer-opensource/expand-ist
ist18-25
2 parents 773181b + ec25734 commit 9662ed0

File tree

4 files changed

+319
-8
lines changed

4 files changed

+319
-8
lines changed

README.md

Lines changed: 25 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,5 +1,29 @@
11
# Lyme-In-Silico-Typing-Tool (LISTT)
2-
a computational pipeline for typing the Borrelia OspA protein
2+
a computational pipeline for typing the *Borrelia* OspA protein
3+
4+
LISTT assigns *in-silico* types based on sequence of the OspA protein. Illumina NGS reads of a *Borrelia* isolate or its genome sequence can be provided as input.
5+
25 *in-silico* types (ISTs) can currently be assigned, with ISTs 1-8 corresponding to the canonical OspA serotypes 1-8:
6+
7+
| Genospecies | OspA *in-silico* type |
8+
| ------------- | ------------- |
9+
| *B. burgdorferi s.s.* | 1 |
10+
| *B. afzelii* | 2 |
11+
| *B. garinii* | 3, 5, 6, 7, 8, 11, 12 |
12+
| *B. bavariensis* | 4, 9, 10 |
13+
| *B. spielmanii* | 13|
14+
| *B. mayonii* | 14 |
15+
| *B. valaisiana* | 15, 25 |
16+
| *B. turdi* | 16, 24 |
17+
| *B. yangtzensis* | 17 |
18+
| *B. americana* | 18 |
19+
| *B. bissettiae* | 19 |
20+
| *B. carolinensis* | 20 |
21+
| *B. finlandensis* | 21 |
22+
| *B. japonica* | 22 |
23+
| *B. lusitaniae* | 23 |
24+
25+
26+
The full method for IST assignment is described in the publication: [https://pubmed.ncbi.nlm.nih.gov/38787376/](https://pubmed.ncbi.nlm.nih.gov/38787376/)
327

428
## Installation
529
Clone the repository and enter the directory:

variants/ospA_protein.fas

Lines changed: 247 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -459,4 +459,250 @@ MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVLVSKEKDKDGKYSLMATVDK
459459
LELKGTSDKNNGSGTLEGEKTDKSKAKLTISDDLSKTTFEVFKEDGKTLVSRKVNSKDKS
460460
STEEKFNAKGELSEKVVTRANGNRLEYTEMKSDGSGKAKEVLKDFALEGTLTADGKTTLT
461461
IQEGTVTLKKEIEKAGTVKLFLDDTSSGSTKKTAVWSDTSNTLTVSADSKKIKDFVFLTD
462-
GTITVQNYDTAGTKLAGTATEIKDLAALKTALK
462+
GTITVQNYDTAGTKLAGTATEIKDLAALKTALK
463+
>ospA_protein_78
464+
MKKYLLGIGLILALIACKQNVSSLDEKNSASVDLPGEMKVLVSKEKDKDGKYSLMATVDK
465+
VELKGTSDKNNGSGMLEGVKDDKSKVKLTISDDLSKTTLETFKEDGKTLVSRKVNSKDKS
466+
STVEKFNEKGELSEKTITRENGTRLEYTEIKSDGTGKAKEVLKDFTLEGTLAADKTTLEV
467+
KDGTVTLSKHIPNSGEVTVEINDTSSTQATKKTGKWDAKTSTLTIVVDSKNKKNLVFTKQ
468+
DTITVQNYDSAGTSLEGTAVEIKTLDELKNALK
469+
>ospA_protein_79
470+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMTVLVSKEKDKDGKYSLEATVDK
471+
LELKGTSDKNNGSGTLEGEKTDKSKVKLTIADDLSQTKFEIFKEDGKTLVSKKVTLKDKS
472+
STEEKFNEKGETSEKTIVRANGTRLEYTDIKSDGSGKAKEVLKDFTLEGTLAADGKTTLK
473+
VTEGTVVLSKNILKSGEITVALDDSDTTQATKKTGKWDSKTSTLTISVNSQKTKNLVFTK
474+
EDTITVKKYDSAGTNLEGKAVEITTLKELKDALK
475+
>ospA_protein_80
476+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMKVLVSKEKDKDGKYSLMATVEK
477+
LELKGTSDKSNGSGVLEGEKADKSKAKLTISQDLNQTTFEIFKEDGKTLVSRKVNSKDKS
478+
STEEKFNDKGKLSEKVVTRANGTRLEYTDIQDDGSGNAKEVLKGLTLEGTLTADGETKLT
479+
VKEGTVTLSKNISKSGEITVTLGDTDSSADKKTGEWKSDTSTLTIIKNSKKTKQFVFTKE
480+
DTITVQKYNTAGTALEGNPAEIKDLTELKTALK
481+
>ospA_protein_81
482+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMTVLVSKEKDKDGKYSLEATVDK
483+
LELKGTSDKNNGSGTLEGEKTDKSKVKLTIADDLSQTKFEIFKEDGKTLVSKKVTLKDKS
484+
STEEKFNEKGETSEKTIVRANGTRLEYTDIKSDGSGKAKEVLKDFTLEGTLAADGKTTLK
485+
VTEGTVVLSKNILKSGEITVALDDSDTTQATKKTGKWDSKTSTLTISVNSKKTKNLVFTK
486+
EDTITVQKYDSAGTNLEGKAVEITTLKELKDALK
487+
>ospA_protein_82
488+
MKKYLLGIGLILALIACKQNVSSLDEKNSASVDLPGEMKVLVSKEKDKDGKYSLVATVDK
489+
VELKGTSDKNNGSGTLKGVKDDKSKVKLTISDDLGETKLETFKEDGTLVSRKVNFKDKSF
490+
TEEKFNEKGEVSEKILTRSNGTTLEYSQMTDAENATKAVETLKNGIKLPGNLVGGKTTLK
491+
ITEGTVTLSKHIAKSGEVTVEINDTSSTPNTKKTGKWDARNSTLTIIVDSKNKTKLVFTK
492+
QDTITVQSYNPAGNKLEGTAVEIKTLQELKNALK
493+
>ospA_protein_83
494+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVLVSKEKDKDGKYSLMATVEK
495+
IELKGTSDKSNGSGVLEGEKADKSKVKLTIADDLSQTKFEIFKEDGKTLVSKKVTLKDKS
496+
STEEKFNEKGETSEKTIVRANGTRLEYTDIKSDGSGKAKEVLKDFTLEGTLAADGKTTLK
497+
VTEGTVVLSKNILKSGEITVALDDSDTTQATKKTGKWDSKTSTLTISVNSQKTKNLVFTK
498+
EDTITVQKYDSAGTNLEGKAVEITTLKELKDALK
499+
>ospA_protein_84
500+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMKVLVSKEKDKDGKYSLMATVEK
501+
LELKGTSDKNNGSGTLEGEKTDKSKVKLTIAEDLSKTTFEIFKEDGKTLVSKKVTLKDKS
502+
STEEKFNEKGEISEKTIVRANGTRLEYTDIKSDKTGKAKEVLKDFTLEGTLAADGKTTLK
503+
VTEGTVTLSKNISKSGEITVALDDTDSSGNKKSGTWDSGTSTLTISKNRQKTKQLVFTKE
504+
DTITVQNYDLAGTKLEGKAVEITTLKELKDALK
505+
>ospA_protein_85
506+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMKVLVSKEKDKDGKYSLMATVEK
507+
LELKGTSDKNNGSGTLEGEKTDKSKVKLTIAEDLSKTTFEIFKEDGKTLVSKKVTLKDKS
508+
STEEKFNEKGEISEKKITRSNNTTIEYTEMTDADNASKAVETLKNGITLEGSLVGGKTTL
509+
TIKEGTVTLKKEIEKAGTVKLFLDDTASGATKKTAVWNDTSNTLTVSADSKKIKDFAFLT
510+
DGTITVQNYNKAGTTLEGKATEIKDLEALKAALK
511+
>ospA_protein_86
512+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVLVSKEKDKDGKYSLMATIDK
513+
LELKGTSDKNNGSGVLEGVKADKSKVKLTISDDLDETKLETFKEDGTTLVSRKVTLKDKS
514+
STEEKFDAKGAAVTEKVITRKDGTRLEYTGMKSDGSGKAKEVLKNFALDGTLDTSGKTTL
515+
TVKQDTVTLTKEIDKDGKVKISLEDTASSPKKTGAWVDATNTLTISANNKKTKDLVFTKE
516+
NTITVQSYDSGGTTLTGKAVEITTLENLKNALK
517+
>ospA_protein_87
518+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEIKVLVSKEKNKDGKYSLMATVDK
519+
LELKGTSDKNNGSGVLEGVKADKSKVKLTVSDDLGQTTLEVLKEDGKTLVSRKVTSKDKS
520+
STEEKFNEKGELAEKIMTRANGTRLEYTEIKSDGSGKAKEVLKDYVLEGTLTAEKTTLVV
521+
KEGTVTLSKHISKSGEVTAELNDTESSSATKKTAAWNSGTSTLTITVNSKKTKDLVFTKE
522+
NTITVQKYDTAGTNLEGSAVEIKKLDELKNALK
523+
>ospA_protein_88
524+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVLVSKEKDKDGKYSLEATVDK
525+
LELKGTSDKNNGSGVLEGVKADKSKAKLTIADDLSQTKFEIFKEDGKTLVSKKVTLKDKS
526+
STEEKFNDKGKLSEKVVTRANGTRLEYTEIQNDGSGKAKEVLKSLTLEGTLTADGETKLT
527+
VEAGTVTLSKNISESGEITVELKDTETTPADKKSGTWDSKTSTLTISKNSQKTKQLVFTK
528+
ENTITVQKYNTAGTKLEGSPAEIKDLEALKAALK
529+
>ospA_protein_89
530+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMTVLVSKEKDKDGKYSLEATVDK
531+
LELKGTSDKNNGSGTLEGEKTDKSKVKLTIADDLSQTKFEIFKEDGKTLVSKKVTLKDKS
532+
STEEKFNEKGETSEKTIVRANGTRLEYTDIKSDGSGKAKEVLKDFTLEGTLAADGKTTLK
533+
VTEGTVVLSKNILKSGEITVALDDSDTIGTKKTGKWDSKTSTLTISVNSQKTKNLVFTKE
534+
DTITVQKYDSAGTNLEGKAVEITTLKELKDALK
535+
>ospA_protein_90
536+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVLVSKEKDKDGKYSLMATVEK
537+
IELKGTSDKSNGSGVLEGEKADKSKVKLTIADDLSQTKFEIFKEDGTTLVSRKVNSKDKS
538+
STEEKFNDKGKLSEKVVTRKDGTRLEYTDIQSNGSGKAKEVLKGLTLEGTLTADGETKLT
539+
VEEGTVTLSKNISKSGEITVALDDTASADKKSGTWDSDTSTLTISKNSQKTKQLVFTKEN
540+
TITVQKYNTAGTKLEGSPAEIKDLTELKTALK
541+
>ospA_protein_91
542+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVLVSKEKDKDGKYSLMATVDK
543+
LELKGTSDKSNGSGVLEGVKTDKSKAKLTIADDLSQTKFEIFKEDGTTLVSRKVTLKDKS
544+
STEEKFNAKGELSEKTIVRANGTRLEYTDIKNGTGKAKEVLKDLALEGTLTADGKTTLTI
545+
QEGTVTLKKEIEKAGTVKLFLDDTTSGSTKKTAVWSDTSNTLTVSADSKKIKDFVFLTDG
546+
TITVQNYDTAGTTLAGTATEIKDLTALKTALK
547+
>ospA_protein_92
548+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMKVLVSKEKDKDGKYSLMATVDK
549+
LELKGTSDKSNGSGVLEGEKTDKSKAKLTISQDLNQTTFEIFKEDGKTLVSRKVNSKDKS
550+
STEEKFNDKGKLSEKVVTRANGTRLEYTEIQNDGSGKAKEVLKGLTLEGTLTADGETKLT
551+
VTEDTVTLSKNISKSGEITVALKDTASADKKTGEWEEGTSTLTISKNSQKTKQLVFTKEN
552+
TITVQKYNTAGTKLEGSPAEIKDLTELKAALK
553+
>ospA_protein_93
554+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMKVLVSKEKDKDGKYSLMATVEK
555+
LELKGTSDKSNGSGVLEGEKADKSKAKLTISQDLNQTTFEIFKEDGKTLVSRKVNSKDKS
556+
STEEKFNDKGKLSEKVVTRKDGTRLEYTGIQNDGSGKAKEVLKGLTLEGTLTADGETKLT
557+
VTEKTVTLSKNISKSGEITVDLKDTDSSADKKSGTWDSDTSTLTIIKNSLKTKQLVFTKE
558+
NTITVQNYNRAGNALEGSPAEIKDLAELQAALK
559+
>ospA_protein_94
560+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMKVLVSKEKDKDGKYSLMATVEK
561+
LELKGTSDKSNGSGVLEGEKADKSKAKLTISQDLNQTTFEIFKEDGKTLVSRKVNSKDKS
562+
STEEKFNDKGKLSEKVVTRANGTRLEYTDIQNDGSGKAKEVLKGLTLEGTLTAGGETKLT
563+
VTEDTVTLSKNISKSGEITVDLKDTDSSADKKSGTWDSDNSTLTISKNSRKTKQLVFTKE
564+
NTITVQKYNTAGNALEGSPAEIKDLAELQAALK
565+
>ospA_protein_95
566+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVLVSKEKDKDGKYSLMATVDK
567+
LELKGTSDKSNGSGILEGEKADKSKAKLTISQDLNQTTFEIFQEDGKTLVSRKVNSKDKS
568+
STEEKFNDKGKLSEKVVTRKDGTRLEYTEIQNDGSGKAKEVLEGLTLEGTLAADGKTTLT
569+
VTEGTVTLNKHISKSGEITADLKDTDSSSGNKKSGTWDSDTSTLTIIKNSQKTKQLVFTK
570+
ENTITVQNYNTAGNALEGSPDEIKDLAKLQAALK
571+
>ospA_protein_96
572+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMKVLVSKEKDKDGKYSLMATVDK
573+
LELKGASDKNNGSGTLEGEKTDKSKAKLTIAEDLSKTTFEIFKEDGKTLVSKKVTLKDKS
574+
STEEKFNAKGEASEKTIVRANGTRLEYTDIKSDKTGKAKEVLKDFALEGTLAADGKTTLK
575+
VTEGTVVLSKHISNSGEITVELNDSDTTQATKKTGTWDSKTSTLTISVNSRKTKNLVFTK
576+
EDTITVQKYDSAGTNLEGKAVEITTLKELKDALK
577+
>ospA_protein_97
578+
MKKYLLGIGLILALIACKQNVSSLDEKNSASVDLPGEMKVLVSKEKDKDGKYSLKATVDK
579+
IELKGTSDKDNGSGVLEGTKDDKSKAKLTIADDLSKTTFELFKEDGKTLVSRKVSSKDKT
580+
STDEMFNEKGELSAKTMTRENGTKLEYTEMKSDGTGKAKEVLKNFTLEGKVANDKVTLEV
581+
KEGTVTLSKEIAKSGEVTVALNDTNTTQATKKTGAWDSKTSTLTISVNSKKTTQLVFTKQ
582+
DTITVQKYDSAGTNLEGTAVEIKTFDELKNALK
583+
>ospA_protein_98
584+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMKVLVSKEKDKDGKYSLMATVDK
585+
LELKGTSDKNNGSGTLEGEKTDKSKVKLTIADDLSQTKFEIFKEDGKTLVSKKVTLKDKS
586+
STEEKFNEKGETSEKTIVRANGTRLEYTDIKSDGSGKAKEVLKDFTLEGTLAADGKTTLK
587+
VTEGTVVLSKNILKSGEITVALDDSDTIGTKKTGKWDSKTSTLTISVNSQKTKNLVFTKE
588+
DTITVQKYDSAGTNLEGKAVEITTLKELKDALK
589+
>ospA_protein_99
590+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVLVSKEKDKDGKYELMATVDK
591+
LELKGTSEKSNGSGVLEGVKADKSKVKLTISDDLSQTTLEVFKEDGKTLVSKKVTSKDKS
592+
STEEKFNEKGEVSEKTITRADGTRLEYTEIKSDGSGKAKEVLKGYTLEGTSTAEKTTFMI
593+
KEGTVTLSKNISKSGEVSVELNDTDSTAGTKKTGAWNSGTSTLTITVNSKKTKDLVFTKE
594+
NTITVQKYDSNGTKLEGSAVELKTLDEIKAALK
595+
>ospA_protein_100
596+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDVPGGMTVRVSKEKNKEGKYDLMATVDK
597+
LELKGTSDKNNGSGILEGVKADKSKVKLTVADDLSKTTLEVLKEDGKTVVSRKVTSKDKS
598+
TTEAKFNEKGEVSEKTMTRANGTTLEYSQMTNEDNAAKAVETLKNGIKFEGKLVSGKTAV
599+
EIKESTVTLKREIDKNGKVTVSLNDTGSKKTASWQESTSTLTISASSKKTKDLVFLTNGT
600+
ITVQNYDSAGTNLEGSATEIKTLDELKNALK
601+
>ospA_protein_101
602+
MKKYLLGIGLILALIACKQNVSGLDEKNSVSVDLPGEMKVLVSKEKDKDGKYSLMATVDK
603+
LELKGTSDKNNGSGILEGVKADKSKVKLTVSEDLSTTTLEVLKEDGKTLVSKKTTSKDKS
604+
STEEKFNDKGELAEKTMVRANGTRLEYTEVKSDGSGKAKETLKDYALEGTLTAEKATLVV
605+
KEGTVTLSKHISKSGEVTAELNDTDSAQATKKTGKWDAGTSTLTISVNSKKTKNLVFTKQ
606+
DTITVQKYDSAGTNLEGTAVEIKTLDELKNALK
607+
>ospA_protein_102
608+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVLVSKEKDKDGKYSLMATVDN
609+
LELKGTSEKNNGSGVLEGVKADKSKVKLTVSEDLSTTTLEVLKEDGKTFVSKKTTSKDKS
610+
STEEKFNDKGELSEKTMVRANGTRLEYTEIKNDGSGKAKETLKEYVLEGTLTAEKATLTV
611+
KEGTVTLSKHISKSGEVTAELNDTDSAQATKKTGKWDAGTSTLTIIVNSKKTKDLVFTKQ
612+
DTITVQKYDSAGTNLEGTAVEIKTLDELKNALK
613+
>ospA_protein_103
614+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEIKVLVSKEKNKDGKYSLMATVDK
615+
LELKGTSDKNNGSGVLEGVKADKSKVKLTVSDDLGQTTLEVLKEDGKTLVSRKVTSKDKS
616+
STEEKFNEKGELAEKIMTRANGTRLEYTEIKSDGSGKAKEVLKDYVLEGTLTAEKATLVV
617+
KEGTVTLSKHISKSGEVTAELNDTESSSATKKTAAWNSGTSTLTITVNSKKTKDLVFTKE
618+
NTITVQKYDTAGTNLEGSAVEIKKLDELKNALK
619+
>ospA_protein_104
620+
MKKYLLGIGLILALIACKQNVSKLDDKNSTSVDLPGGVKVLVSKEKDKDGKYTLMATVDK
621+
LELKGTSDKNNGSGTLEGAKTDKSKVKLTISDDLSKTTLETLKEDGKTLVSRKVNSKDMS
622+
SEEEKFNDKGELAEKVILRDNGTRLEYTEIKSDGTGKAKEVLKNFTLEGTLANDKTTLTV
623+
VEATVTLNKHIEKSGKITVDLNDTSTTAATKKTAEWDPNNSTLTISINNKKTTQLVFTKQ
624+
DTITMQKYNTNGDALEGVAVEITTLDALKNALK
625+
>ospA_protein_105
626+
MKKYLLGIGLILALIACKQNVSGLDEKNSVSVDLPGEMKVLVSKEKDKDGKYSLMATVDK
627+
LELKGTSDKNNGSGVLEGVKADKSKVKLTVSDDLSQTTLEVLKEDGKTLVSRKVTSKDKS
628+
KTEEKFNEKGELSEKIMTRANGTRLEYTEIKSDGSGKAKEVLKDYTLEGTLAAEKTTLVV
629+
KEGTVTLSKNISKSGEVTVELNDTDSTPATKKTGAWNSGTSTLTITVNSKKTKDLVFTKE
630+
NTITVQKYDGAGTKLEGSAVEIKTLNELKNALK
631+
>ospA_protein_106
632+
MNKYLLGIGLILALISCKQNVSSLDEKNSSTVGLPGDMKVLVSREKDKDGKYSLMATVDG
633+
VELKGTSDKNNGSGVLEGTKADKSKVKLTISDDLEETILEVSKEDGKTLVSRKTNSKDKS
634+
ILDEKFNEQGELSERVLTRENGSKLESTEIKSDGTGKAKEISKDLILEGTLANDKATLTV
635+
VEGTVTLNKHIAKDGEITVDLNDTSTTSGTKKTATWDSNNHTLTITVNNLKTKDLVFTKE
636+
GTITVQKYNTAGDALEGTPAEIKTLDELKDALK
637+
>ospA_protein_107
638+
MKKYLLGIGLILALIACKQNVSSLDEKNSDSVDLPGEMKVLVSKEKDKDGKYSLTATVDK
639+
IELKGTSDKNNGSGVLEGLKADKNKVKLTISDDLSKTTFEIFKEDGKTLVLKRVNSKDKS
640+
STEEKFNEKGELYEKILTRENGTRLEYTEIKSDGTGKAKEVLKDFTLEGTLAAEKATLMV
641+
KEGTVTLSKNIAKSGEVTVEIADTNSDASTKKSGKWDSNTSTLTIAINSKNKKNLVFTKQ
642+
DTITVQNYDSAGTKLEGTAVEIKTLDELKNALK
643+
>ospA_protein_108
644+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVLVSKEKDKDGKYSLMATIGK
645+
LELKGTSDKSNGSGVLEGVKADKSKAKLTIADDLSQTKFEIFKEDGTTLVSRKVTLKDKS
646+
STEEKFDAKGAAVTEKVIIRKDGTRLEYTEMQNDGSGKAKEVLKTLTLEGTLDASGKTTL
647+
TVKEGTVTLNKHISKSGEITADLNDTETTPADKKTGAWDSGTSTLKISKNSKKTKQLVFT
648+
KENTITVQNYDSAGTNLEGKAVEITTLENLKDALK
649+
>ospA_protein_109
650+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVLVSKEKDKDGKYSLMATIGK
651+
LELKGTSDKSNGSGVLEGVKADKSKAKLTIADDLSQTKFEIFKEDGTTLVSRKVTLKDKS
652+
STEEKFDAKGAAVTEKVITRKDGTRLEYTEMKNDGSGKAKEVLKTLTLEGTLDASGKTTL
653+
TVKEGTVTLNKHISKSGEITADLNDTETTPADKKTGAWDSGTSTLKISKNSKKTKQLVFT
654+
KENTITVQSYDSAGTNLEGKAVEITTLENLKNALK
655+
>ospA_protein_110
656+
MKKYLLGIGLILALIACKQNVSSLDEKNSTSVDLPGEMKVLVSKEKDKDGKYSLMATVDK
657+
VELKGTSDKNNGSGTLEGVKDDKSKVKLTISDDLGETKLETFKEDGKTLVSRKVNFKNKS
658+
FTEEKFNEKGELSEKVLTRENGTKLEYTEIKNNGTGKAKEVLKNFTLEGTLAADKATLKI
659+
TEGTVTLSKHIANSGEVTVEINDTSSTQATKKTGKWDAKTSTLTIVVDSKNKKNLVFTKQ
660+
DTITIQSYDSAGTNLEGTAVEIKTLDELKNALK
661+
>ospA_protein_111
662+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVLVSKEKGKDGKYSLMATIDK
663+
LELKGTSDKNNGSGVLEGVKADKSKVKLTISDDLDETKLETFKEDGTTLVSRKVTLKDKS
664+
STEEKFDAKGAAVTEKVITRKDGTRLEYTGMKSDGSGKAKEVLKNFALDGTLDTSGKTTL
665+
TVKQDTVTLTKEIDKDGKVKISLEDTASSPKKTGAWVDATNTLTISANNKKTKDLVFTKE
666+
NTITVQSYDSGGTTLTGKAVEITTLENLKNALK
667+
>ospA_protein_112
668+
MKKYLLGIGLILALIACKQNVSSLDEKNSASVDLPGEMKVLVSKEKDKDGKYSLMATVDK
669+
VELKGTSDKNNGSGMLEGVKDDKSKVKLTISDDLSKTTLETFKEDGKTLVSRKVNSKDKS
670+
STVEKFNEKGELSEKIITRENGTRLEYTEIKSDGTGKAKEVLKDFTLEGTLAADKATLEV
671+
KEGTVTLSKHIAKSGEVTAEINDTSTTQATKKTGKWDANTSTLTIVVDSKNKKNLVFTKQ
672+
DTITVQNYDAAGTNLEGTAVEIKTFDELKNALK
673+
>ospA_protein_113
674+
MKKYLLGISLILALIACKQNAGDTASTDGKTSVDLPSGEKVLVSKEKNKDGKYELMATVD
675+
NLELKGTSDKNDGSGTLEGVKDDKSKVKLTVSDDLSETKLETLKEDGTPVSTKTTSKDKS
676+
VTEEKFDDKGELTDKIITRANGTKLELTEITKEGKAKVKETLKHLTLEGTLADKKITLAV
677+
KEGTVTLSKEIDENEKVTVSVKDTSTTDATKKTGAWDENTSTLTITVNSKKTKDIVFLAD
678+
GTITKQSYNTNGDKLEGQAEEVKTLDDLKTALK
679+
>ospA_protein_114
680+
MKKYLLGISLILALIACKQNAGDTASGDSNTSSSVELSSGEKVLVSKEKNKDGKYELMAT
681+
VGNLELKGTSDKNDGSGTLEGVKDDNSKVKLTVSDDLETTLEITKADGKKVSKKTTAKDK
682+
SSTEEIFDANGEYVTEKTITRANGTKLELTEMTKEGKGKAKEALKNFTLEGAVENNKIKL
683+
EVKEGTVTLAKEIDENDGKVTISVEDTNTTQASKKTGDWDENTSTLTITVNSKKTKDLVF
684+
TKEGTITQQSYNTNGDKLEGQAEEIKTLDDLKTALK
685+
>ospA_protein_115
686+
MKKYLLGISLILALIACKQNAGDTASGDSNTSSSVELSSGEKVLVSKEKNKDGKYELMAT
687+
VGNLELKGTSDKNDGSGTLEGVKDDNSKVKLTVSDDLETTLEITKADGKKVSKKTTAKDK
688+
SSTEEIFDANGEYVTEKTITRANGTKLELTEMTKEGKGKAKEALKNFTLEGAVENNKIKL
689+
EVKEGTVTLAKEIDENDGKVTISVEDTNTTQASKKTGDWDENTSTLTITVNSKKTKALVF
690+
TKEGTITQQSYDTNGDNLTGQAEEIKTLDDLKTALK
691+
>ospA_protein_116
692+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGEMKVFVSKEKDKDGKYSLMATIDK
693+
LELKGTSDKNNGSGVLEGVKADKSKVKLTISDDLDETKLETFKEDGTTLVSRKVTLKDKS
694+
STEEKFDAKGAAVTEKVITRKDGTRLEYTGMKSDGSGKAKEVLKNFALDGTLDTSGKTTL
695+
TVKQDTVTLTKEIDKDGKVKISLDDTASSSKKTGAWVDATNTLTISANSKKTKDLVFTKE
696+
NTITVQSYDSGGTTLTGKAVEITTLENLKNALK
697+
>ospA_protein_117
698+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMKVLVSKEKDKDGKYSLMATVEK
699+
LELKGTSDKSNGSGVLEGEKADKSKAKLTIAEDLSKTTFEIFKEDGKTLVSKKVTLKDKS
700+
STEEKFNAKGEVSEKTIVRANGTRLEYTEIQNDGSGKAKEVLKGLTLEGTLAVDGETKLT
701+
VKEGTVTLSKNISNSGEITVELNDSDTTQATKKTGKWDSDTSTLTISVNSKKTKQFVFTK
702+
EDTITVQKYNTAGTALEGSPAEIKDLTELKTALK
703+
>ospA_protein_118
704+
MKKYLLGIGLILALIACKQNVSSLDEKNSVSVDLPGGMKVFVSKEKDKDGKYSLIATVEK
705+
LELKGTSDKSNGSGVLEGEKADKSKAKLTISQDLNQTTFEIFKEDGKTLVSRKVNSKDKS
706+
STEEKFNDKGKLSEKVVTRANGTRLEYTEIKNDGSGNAKEVLKGLTLEGTLTADGETKLT
707+
VTEGTVTLSKNISKSGEITVALNDTETTPADKKTGEWKSDTSTLTISKNSQKTKQLVFTK
708+
ENTITVQNYNRAGTTLEGSPAEIKDLAELKAALK

variants/serotypes.csv

Lines changed: 39 additions & 6 deletions
Original file line numberDiff line numberDiff line change
@@ -39,13 +39,13 @@
3939
38,3,B. garinii
4040
39,3,B. garinii
4141
40,17,B. yangtzensis
42-
41,unk,B. americana
43-
42,unk,B. carolinensis
44-
43,unk,B. Japonica
42+
41,18,B. americana
43+
42,20,B. carolinensis
44+
43,22,B. japonica
4545
44,unk,B. californiensis
4646
45,unk,B. kurtenbachii
4747
46,9,B. bavariensis
48-
47,unk,B. bissettiae
48+
47,19,B. bissettiae
4949
48,1,B. burgdorferi
5050
49,11,B. garinii
5151
50,14,B. mayonii
@@ -83,5 +83,38 @@
8383
83,6,B. garinii
8484
84,5,B. garinii
8585
85,10,B. garinii
86-
86,16,B. valaisiana
87-
87,unk,B. finlandensis
86+
86,25,B. valaisiana
87+
87,21,B. finlandensis
88+
88,7,B. garinii
89+
89,6,B. garinii
90+
90,unk,B. garinii
91+
91,10,B. bavariensis
92+
92,3,B. garinii
93+
93,3,B. garinii
94+
94,3,B. garinii
95+
95,3,B. garinii
96+
96,12,B. garinii
97+
97,2,B. afzelii
98+
98,6,B. garinii
99+
99,18,B. americana
100+
100,unk,B. andersonii
101+
101,19,B. bissettiae
102+
102,20,B. carolinensis
103+
103,21,B. finlandensis
104+
104,22,B. japonica
105+
105,unk,B. lanei
106+
106,unk,B. sinica
107+
107,unk,B. tanukii
108+
107,unk,B. tanukii
109+
107,unk,B. tanukii
110+
108,24,B. turdi
111+
109,24,B. turdi
112+
110,15,B. valaisiana
113+
111,25,B. valaisiana
114+
112,17,B. yangtzensis
115+
113,23,B. lusitaniae
116+
114,23,B. lusitaniae
117+
115,23,B. lusitaniae
118+
116,25,B. valaisiana
119+
117,unk,B. garinii
120+
118,3,B. garinii

variants/thresholds.csv

Lines changed: 8 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -16,3 +16,11 @@ Serotype,Threshold
1616
15,90.29
1717
16,90.29
1818
17,91.9
19+
18,97.0
20+
19,97.0
21+
20,98.17
22+
21,97.0
23+
22,97.0
24+
23,80.14
25+
24,90.29
26+
25,97.0

0 commit comments

Comments
 (0)