8 26231
seq1       ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
seq2       AVKKSVGDLD LEGKRVFVRA DLNVPLDLAI TDDTRIRAAV PTLKYLLDNG AKVLLTSHLG
seq3       TTKKSIKDLD IAGKRVLVRC DLNVPLDKTI TDDTRIRASV PTIKFLMEAG AKVLLSSHLG
seq4       LAKKSVKNLD LKGKRVFIRC DLNVPLDMKI TDDTRIRAAV PTIQYLASKG AKVLVTSHLG
seq5       ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
seq6       AKKKSVGDLD LKGQTVFVRC DLNVPMDLNI TDDTRIRAAI PTLEYLAKNG AKVLVTSHLG
seq7       TAKKSIKDLD LAGKRVLVRC DLNVPLDKTI TDDTRIRASI PTIEYLTAAG AKVLLSSHLG
seq8       ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RPKGLTPVVA RLSELLVTKV DDCIGEVEKA VGAMKNGELL LLENVRFYKE EEKNEFAKKL
           RPKDLSPVAA RLTQLLVTMA PDCIGGVTKI VSGMANGDVT LLENVRFYKE ETKNDFAKKL
           RPKSLTP-AA RLSELLVKKT NDCIGEVESA VAAMSEGDVI LLENVRFYPE EEKNDFAKKL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RPKNLTPVGA RLSEKLVTKV DDCVGEVAKA VASMPNGSVC LLENTRFYKE EEKNDFAKKL
           RPKSLAPVAT RLSELLVKMA PDCIGGVAEI VSGMSNGDVT LLENVRFYKE ETANDFAKKL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AANADLYVND AFGTAHRAHA STEGVTKFLK PSVAGFLLQK ELDYLDGAVS NPKRPFVAIV
           AANADFFVND AFGTAHRAHG STAGVTAHLK PSVAGLLLEK ELAYLAGTVS DPARPFAAIV
           AANADLYVND AFGTAHRAHG STAGVTAYLK PSVAGFLLEK ELEYLAGAVD EPVRPLVAIV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AGSATIFVND AFGTAHRAHA STEGVTKYCK TNVAGFLLQK ELDYLDGAVS NPERPFCAIV
           AANADMFVND AFGTAHRAHG STAGVTEFLR PSVAGLLLEK ELAYLAGAVS NPKRPFAAIV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GGSKVSSKIT VIEALMEKCD KIIIGGGMIF TFYKARGLKV GSSLVEDKIE LAKKLEEMAK
           GGSKVSSKIG VIDSLLQKVD KLIIGGGMVF TFLKAKGLNV GSSLVEDKLE LARELVKTAE
           GGSKVSSKIG VIESLLNKCD KLII-GGMVF TFYKARGLPT GSSLVEDKVE LAKKLEEVAK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GGSKVSSKIG VIESLLQKTD KIILGGGMIF TFYKALGKSV GASLVEDKID LAKELMAKAE
           GGSKVSSKIG VIESMLDKVD KLVIVGGMVF TFLKARGLST GSSLVEDKIE LAKELEEIAA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AKGVQLLLPT DVVVADKFDA NANTQTVPIT AIPDGWMGLD IGPDSVKTFN DALADAKTVV
           AKGVSIILPT DVVLADKFAA DANTQVTSVD SIPDGWMGLD QGEDSTKLIQ NELKECKTVI
           AKGVEILLPT DVLLADKFDP EANTQVVDAD KIPDGWMGLD IGPKSIESFS KALSDAKTVI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AKGVKILLPT DVVVADKFAE DAKTQIVSVD NIPEGWMGLD IGPDSLKAFQ GELNECKSVI
           KKGVKIILPV DVVAADKFAP DAKTQLVSVD AIPDDTMGLD QGPKSTELIN AELADCKTVL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           WNGPMGVFEF PKFANGTVSI ANTLAGLGCI TIIGGGDSVA AVEQAGVAEK MSHISTGGGA
           WNGPMGVFEM EKFAKGTFAI ADTLADLGCI TIIGGGDSVA AVEKAGLAEK MSHISTGGGA
           WNGPMGVFEF DKFAKGTFAI ADLLAELGCK TIIGGGDSVA AVEKAGLAEK MSHISTGGGA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           WNGPMGVFEM DAFAKGTFGI ADTLANL--I TIIGGGDSVA AVEKAGLADK MSHISTGGGA
           WNGPAGVFEF DAFATGTYAI ANTLAEVGAT TIIGGGDSVA AVEKAGLAEK MSHISTGGGA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SLELLEGKVL PGVAALDKAK LFNETVDRIT RRFGDGSIMS VTANIETFPS GSLTLDAALG
           SLELLEGKVL PGVAALDRKT ALSTLPLHI- -----ASLHS ATAPLRPLRT GYDALDIALH
           SLELLEGKVL PGVAALD??? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SLELLEGKVL PGVAALDKKK ALARVLDEID SNFGAGAIMA GKAKVATFPS GAMTLDIALG
           SLELLEGKVL PGVAALD??? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GGYPRGRIIE VYGPEASGKT TLAMHACAEI QRLGGTVAYI DVEHAFDRTY AERLGINLNN
           GGLPRGGLAE IYGPPGSGKT TLSLSLLASV VASGGKALHI DCDGS----F HAKRFLELLS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GGLPRGRIVE IYGPESSGKT TLALHAMAEM QKLGGTVAMI DAEHAFDPEY SQRLGLNVDD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           FWYAQPMTGE EALEVMDELC RSNVCDLVVI DSVAALVPRA ELEGDIGSVQ IGSQARLLSQ
           RFECEKGNAS ARLQVLPGLM REGGVQLVVI DSLTFMFRLA E--------G AAVSKRLEAF
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VIVCQPETGE MALEVVDTLV RSSAVDLICV DSVAALVPRS EIEGEIGMVQ VGAHARLMSQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ALRKLSASAS KSKTTLFFIN QLRNKIETTS GGNALKYYSS VRIDIRKKET LAYANRVRAK
           AMR-MHEAAA QVEASVVLVN HGKKS-VVAA MGEAWQHVCA TRLCVTRDE- -------VVE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ALRKINVNAA KAGTTIIFLN QLRSKVEVTT GGNALKYYSS VRLDIRRKEV IDTGVRCKVK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VVKNKVASPH KEALFEIYYG RGIDFLGGLI DTAERLKVLT RRGAFYYYGD QRLGQGREKV
           IIKSPLAKRT R-----IPF- ---------- -------TIT LEGMEHPYPD ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VAKNKVAPPY KIAEFDMLFG RGVSRDGCML DAGEQVGTIE RKGAYYYFNG EKLGQGREKT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LAALREDAER TAAIEAAVRD VLVTFFNTMS KSKELFVSMY VCGVTVYDYS HIGHARVYVA
           ?????????? ?????????? ??LLLYNTLS RTKEAFVRFY SCGPTVYDYA HIGNFRAFLT
           ?????????? ?????????? ??------MS REKEVFVRFY SCGPTVYNFA HIGNFRAFLT
           ?????????? ?????????? ??FKIYNTLS RDKETFVKMY TCGPTIYDFA HIGNFRAFLT
           LSFLDENPEM KATIETDVRA RL------MT RKKEIFVQMY VCGVTVYDYS HIGHARVYVA
           ?????????? ?????????? ??------MT RSKDVFVTFY SCGPTVYDRA HIGNFRAFLV
           ?????????? ?????????? ??------MS REKEVFLSMY VCGVTAYDYS HIGHARVYVF

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           FDVLYRFLAC GYKVTYVRNF TDIDDKIIAR ALTERFIDEF NKDMAALNVL PPALEPRATA
           YDVIKRWLCR GYDIKHVMNL TDIDDKIIRK VLTNKYADAF FADLDLLNVI PAQQYPRATE
           YDVLKRYLYR GYEVTHV--- ---------- -LTGTYTEAF FADMRTLNIA PADVYPRATD
           YDVLKRWLYC GYDVDHICNL TDVDDKIIQR MLTEKFADAF FDDLKRLNII PARKYPRATE
           FDVLYRQLRL GYDVTYCRNF TDIDDKIIKR SLTDKFIEAF HEDMAALGCL RPTLEPRATE
           YDVAKRWLAR GYTVNHVMNL TDVDDKIITK VLTHKYADAF FDDLSKLNVV PATTYPRATD
           FDVLYRYFFM GYEVTYVRNF TDIDDKIIKR ALSNRFCDEF HRDMASLRCL APSLEPRVSR

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           FVPQMISTIT DIIANGHAYG DVFFDVSGRQ QEDNRAGERV AVKRSPADFA LWKAAKPGWG
           HIKEIEETVG GLVKRGYAYG STYFSVAQL- -EKREKGSRT AAKADMRDFA LWKSYKTNLG
           HVPEMIAM-- ---------G SVYFSVARLD FDGMQLGASV DAKASPRDFV LWKSWKEA--
           HIDDIVEMIN GLVQKGNAYG SYYFDVARLD FDNMMDGASE GGKKSSKDFA LWKAYKPELS
           CVDDIIAFIE RLIAKGNAYG DVYFSVSGRN QEDNRAGERV AVKKNPADFA LWKTAKPGWG
           HIPEMEELIG GLLRKGVAYG STYFSVARLP PPSQTLTPTA GARGDARDFA LWKAWKPALG
           NIDQIIKMIS QILENGYGYG DVYFSLSGRK LDDNRAGERV AVKLNPGDFV LWKAN--GWG

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PGRPGWHIEC SSMIRELMGP VIDIHGGGRD LVFPHHENEL AQSQADFVRY WLHNGFVNVE
           KGRPGWHIEC TCMAIKYLGP ELDIHGGGID LVFPHHENEL AQSEAPFSRF WVHNGFVNIE
           ---------- ---------G ELDIHSGGVD LVFPHHENEI AQSEAPFARY WIHNGFVNIE
           KGRPGWHIEC SAMSRRYLGD SFDIHAGGVD LTFPHHENEI AQSEAQYCRY WVHNGFVNIE
           EGRPGWHIEC SAMIEKMLGP TIDIHGGGQD LVFPHHENEL AQSSAPFVRY WVHNGFVKVE
           RGRPGWHIEC TCMALKYLGT TIDIHGGGVD LVFPHHENER AQAE?????? ??????????
           AGRPGWHIEC SAMSGATLGS SFDIHGGGMD LIFPHHENEI VQSRASNVTY WMHNGFVTVE

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KMSKSLGNFF TIRDVLPLAL RWFLVSSQYR APLNYSDKGL EDASGRLYYV AQARVLSALA
           KMSKSLGNFQ TLRDIAARAF RYLVVSSQYR SALAFTDQSL KSARSTVKRL DALRFARGMD
           KARGGGAGRG AGRGEV---- ---------- -PGQLRDDVG EAAQ------ ----FLRHM-
           KMSKSLGNFL TLREAFCRAF RYLVVSSQYR AALNFAPDVL QGARNTLKRL DKRRLDGGMM
           KMSKSLGNFF TIREVLPFVL RFMLLGAHYR APINYTQRAL EEASDRVYYL YQTVVSEALN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KMSKSLGNFF TIREVFPLAL RWFLLCTHYR SPINYSESQL QNASQRLFYL YQTLLRSSLA

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DDLNTPAAVG ALSAPLRTIN DLLTLAQLHC AMCRVMQLLG MVQAAIRTEA RAAKLAAKGV
           DDFNTPRAAA AMFSVVNAAE KMLKAGSCLK CLDDMDRVFG ILVKLLRKTA RKAKVSAEGF
           NDLNTPRATA AIFELVKAEQ ALRKAGAVVG LLEDVDSVLG IWERLIRAAA RKGKFAAAGY
           DDLNTPRACA ALFTFIKSTE KLLNTVSCLD LL???????? ?????????? ??????????
           DDMNTPGVIA TLSAPLKSMN DFMTLQSLLS TVEGLMEAVG MLLAKIRNKA RDAKLSARGV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DDLNTPVTIG ALSEPLKLMN ELLHLDLLRL EVEQALEVLG FLLLQIRAAA RASKLSSLGI

           ?????????? ?VKDMSQADF GRLELELAEV EMPGLMACRT EFSQPFKGAR ITGSLHMTIQ
           LLLDPEG-TS WVKDIAEADF GRLEIDLAEA EMPGLMACRS EFAQPFKGAK ITGSLHMTIQ
           AIVDPQG-PK LVADMSLAEY GRKEMDIAEI EMPGLMACRE EMKKPLTGAK VMGSLHMTIQ
           VLLDPTG-TR W????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?VKDMSLAEF GRKELDIAEV EMPGLMNTRE EFKKPLKGVR IMGSLHMTIQ
           GLMDSA--VP WVRDMAQADF GRMEIELAQV EMPGLMSCIA EFAQPLAGAN ISGSLHMTIQ
           ?????????? ?VADMSLAAY GRAELAIAEV EMPGLMALRE EMAKPLAGAR VMGSLHMTVQ
           SLMDGGDETL WVKDMSQADF GRLEIELAEV EMPGLMACRT EFAQPFKGAR ITGSLHMTIQ

           TAVLIETLTA LGAENIFSTQ DHAAAAIARD -SA------- ---------- ----------
           TAVLIETLTA LGAENIFSTQ DHAAAAIARD -SAAVFAWKG ETLEEYWWCT EQALPDLLVD
           TAVLIETLKE LGADNIFSTQ DHAAAAVVAE -GTSVFAWKG ESLEEYWWCT ERALPDIIVD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TAVLIETLYE LGADNIFSTQ DHAAAAVVAK KTSKVFAWKG ETLEEYWWCT LQALPQMIVD
           TAVLIETLVA LGANNIFSTQ DHAAAAVARD -SAAVFAWKG ETLEEYWWCT DQMLLDIIVD
           TAVLIETLKE LGADNIFSTQ DHSAAAIVAA -GTPVFAWKG ETLEEYWWCT NRALPDLIVD
           TAVLIETLTA LGAENIFSTQ DHAAAAIARD -SAAVFAWKG ENLQEYWWCT ERALPDLIVD

           ----GVSEET TTGVKRLYQM QQNGTLLFPA INVNDSVTKS KFDNLYGCRH SLPDGLMRAT
           DGGDGVSEET TTGVKRLYEM QANGSLLFPA INVNDSVTKS KFDNVYGCRH SLPDGIMRAT
           DGGDGVSEET TTGVHRLIER AREGSLLCPA INVNDCVTKS KFDNVYGCRH SLPDGIMRAT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DGGDGVSEET TTGVHRLYEM EKSGTLLFPA INVNDSCTKS KFDNLYGCRH SLPDSIMRAT
           DGGDGVSEET TTGVKRLYEM QKAGELLFPA INVNDSVTKC KFDNLYGCRH SLPDGIMRAT
           DGGDGVSEET TTGVHRLIER AREGSLLFPA INVNDCVTKS KFDNVYGCRH SLPDGIMRAT
           DGGDGVSEET TTGVKRLYQM QSNGSLLFPA INVNDSVTKS KFDNLYGCRH SLPDGLMRAT

           DVMIAGKVAV ICGYGDVGKG CAAAMKTAGA RVIVTEIDPI CALQALMEGL QVDIFVTTTG
           DVMIAGKTAF IAGYGDVGKG CASAMKAAGA RTIVSEIDPI CALQAAMEGY QVDIFITTTG
           DVMLAGKTIM ICGYGDVGKG SAQAMKAAGA RCLVAEIDPI CALQATMEGF QVDIIITTTG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DVMIAGKVAV ICGFGDVGKG CAMAMKAAGA RTIVTEIDPI CALQACMEGY EVDIFITTTG
           DVMIASKTCW VAGYGDVGKG SAAALKAAGA RVIVSEIDPI CALQAAMEGY QVDIFITTTG
           DVMLAGKTVL ICGYGDVGKG SAQAMKAAGA RTMIAEVDPI CALQACMEGF QVDIVITTTG
           DVMIAGKVAV VAGYGDVGKG CASAMKAAGA RVIVTEIDPI CALQALMEGL EVDIFVTTTG

           NKDIIMVDHM RKMKNNAIVC NIGHFDNEID MLGLIKPQTD RWVFIVLAEG RLMNLGCATG
           NKDIIMAEHM AKMKNNAIVG NIGHFDNEVD MAGLIKPQVD RFIFIVLAEG RLLNLGCATG
           NKGIVTVDHM AKMKNNAIVG NIGHFDNEID IAGLVKPQVH RWVFIMLAEG RLLNLGCATG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NKGIIMFEHM QRMKNNAIVG NIGHFDNEID MAGLIKPQVD RFVKILLAEG RLCNLGCATG
           NKDIIMVQHM EKMKNNAIVG NIGHFDNEID MAGLIKPQCD RFEFIMLAEG RLLNLGCATG
           NKDIIMKDDM AKMKNNAIVG NIGHFDNEID MAGLVKPQVH RFVFIVLAEG RLLNLGCATG
           NKDIIMVDHM KKMKNNAIVC NIGHFDNEID MLGLIKPQTD RWVFIVLAEG RLMNLGCATG

           HPSFVMSCSF TNQVIAQLEL PKHLDEKVAL LHLGKLGARL TKLSKDQSDY VSIPIEG???
           HPSFVMSCSF TNQVIAQLEL PKHLDEKVAA LHLPKLGVKL TKLSADQAAY INVPVDGKYV
           HPSFVMSCSF TNQTLAQVEL PKVLDEKVAR LHLKHLNAKL TELSPEQAEY IGVKADGKFV
           ?????????? ?????????? ?????????? ?????????? ?????????? ???????KYV
           HPSFVMSCSF TNQAMAQLEI PKVLDEKVAR LHLGHCGAKL TTLSKEQADY IGVPVGG---
           HPSFVMSCSF TNQAIAQLEL PKHLDEKVAM LHLAKIGVKL TKLSTDQAQY INVPVEGKYV
           HPSFVMSCSF TNQTLAQVEL PKVLDEKVAR LHLGKLGAKL TELSSSQASY IGVKPEGKYV
           HPSFVMSCSF TNQVIAQLEL PKHLDEKVAA LHLPKLGAKL TKLSADQAAY INVPVEG???

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LVTGGVVSGL GKGVTASSVG VLLKNCGYRV TSIKIDPYIN VDAGTMSPFE HGEVFVLDDG
           LVSGGVISGI GKGLTASSLG VLLKSCGWRV TAIKIDPYLN RDAGTMSPFE HGEVFVLDDG
           IVTGGVISGI GKGVTASCIG VLLKHCGLRV TSIKIDPYLN IDAGTMSPFE HGEVFVLHDG
           ------MSGL GKGITASSIA VLLQGCGWKV NMIKIDPYLN VDAGTMSPFE HGETFVLDDG
           VVSGGVVSGL GKGVTASSIG VLLKASGLRV TSVKIDPYIN IDAGTMSPFE HGETYVLDDG
           LVSGGVISGI GKGLTASSIG VLLKACGWRV TAVKVDPYLN CDAGTMSPFE HGEVFVLDDG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GEADLDLGNY ERFLDITLTR DNNITTGKIY QAVIERERRG DYLGKTVVVP HITDAIQDWI
           GEADLDLGNY ERFLDVTLSS DNNITTGKIY SHVMERERMG SYLGKTVVVP HITDAIQEWI
           GEVDLDLGNY ERFLDIRLTK DNNITTGKIY EHVLKKERRG DYLGRTVVVP HITNAIMEWI
           GETDLDLGNY ERFLDISLTA DNNITTGKIY KLVIEKERKG EYLGKTVVVP HITGAIADWI
           GESDLDLGNY ERFVDVSLTR DHNITTGKVY QSVISKEREG KYLGKTVVVP HITDEIQDWI
           GEVDLDLGNY ERFLDVTLNR SNNITTGKVY QAVLTAERRG DYLGKTVVVP HVTDAIITWI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QRVAHVCVIE LGGTVGDIES APFVEALRQF CIRVGDANIC NVHVSLVPVI GVVGEKTKPT
           MRVAEICVIE LGGTVGDIES MPFVEALRQL RYNVGDVNFC SVFVSLVPVL GVVGEKTKPT
           ERVADVCVVE LGGTVGDMES MPFVEALRHL QYKYSDRNFC FVHVSLVPVV GAVGEKTKPT
           ENVADVCVIE LGGTVGDIES MPFIEALRQL QYRLGPENMF IVQVTLVPTM S--DEKTKPT
           ERVADVCVIE LGGTVGDIES MPFIEALRQF QFRVGTENFC LIHVSLVPVV GAVGEKTKPT
           RRVAEVVVIE LGGTVGDIES MPFIEALRQL RYAVGEANFC SVFVSLVPEL GVVGEKTKPT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QHSVQVLRSL GITPTLIACR SQEPLEESVR TKLALFCNVP EGCVLSLHDV SNIWRVPLLM
           QHGVKSISSM GLSPQLIVCR SEQPLHADTR RKLAMFCQVA PDAVASVHDV SNTYRIPMML
           QHGIRELRAL GINPDIITCR SEKPLTQQLK HKLGLYCQVP PAAVISVHDV SNMYRVPMML
           QHAVKELRSA GFAPDMICCR CETELQSEQR KKLGLFCQVG AESIISVHNV SDIYKVPLLL
           QHSIQALRSA GLSPHMLACR SKHPLEQSVM DKLALFCHVN PKCIINLCDV SNIWHVPLVM
           QHGVKNLSMS GLAPQLIVCR STRPLLAETK AKLGLFCQVP PDAVVSVHDV SNTYRIPLML
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QEQNVHHLLC TKLGLITLIG KYTNLSDAYL SVLKSLQHAC MEARVRLQLE WVEAALHEAD
           QEQGVCNLLI RSLHLICLVG KYTGLCDAYL SVIRALQHAG MAVGRTVKVV WIESS-SSAN
           DEQGVSRIIF EKLGMIAMVG KYTGLQDSYL SV-------- ---------- -------EAD
           KSQNVAEIIS NKLKIIALVG KYTSGTDAYL SVCKALQHAA IAVNRKLEIS WVLSELKDAD
           LEQDALRNIM SQLQLIALVG KYTGLGDSYL SVTKALLHSS IACDRKLDLL WVEASVKKAQ
           HAQGVCNLLI RSLRL--YVG YHV??????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GILVPGGFGN RGVEGKILAA NYARLNKKPY LGICLGMQIA VIEFARNVLG ANSTEFAPCP
           GSVI------ ---------- ---------- ---------- ---------- ----------
           GVLVPGGFGD RGVEGKIAAA GYARQAGKPY LGICLGMQVA VIEYCRSALG ANSTEFNETP
           GILVPGGFGD RGTEGKIMSV EFARTQKKPF LGICLGMQLA VIEAARNLLG AKSEEFDKTS
           GILVPGGFGG RGTEGKMIAA KYARENKVPY LGICLGMQCM VIEYARNVLG AHSTEMEPTK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           HPAVVFMPEI ST-THLGGTM RLGGRRTCMS AKLYERHRHR YEVNPDLVPK LEEGLLFVGR
           ---------- ---SEQGG-- -------SGA WWVW?????? ?????????? ??????????
           HPVVIFMPEG SR-ERMGGTM RLGSRRTSLA CRLYERHRHR YEVNPELIAA IEEAFRFVGR
           CPVIIFMPEG SK-THMGGTM RLGTRRTCLT AKLYERHRHR YEVNPEKVAD LEKGLKFVGM
           NPAVIFMPEG SK-THMGGTM RLGSRRTCIS SRLYERHRHR YEVNPEMVPQ LEAGCKFVGK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????YSSRI TPKSQGGSQA
           DETGERMEIL ELSDHPYYVA AQFHPEFKSR PGKPSPLFLG FILASFSSRI TPKYQGASQA
           ?????????? ?????????? ?????????? ?????????? ?????RSSGL VWNKRTATRA
           DEAGERMEIV ELSGHPFFLA CQFHPEFKSR PIRPSPPFFG LVLAA????? ??????????
           DETGQRMEIV EYSEHPYFVA AQFHPEFKSR VMCPAPLFYG FLRAAYSRTL TKKSQGASQA
           DDTQLRMEIC EVDGHPFMVG CQYHPEYKSR PGRPSPLFMG LILAAWSRKI TPKSQGASQA
           ?????????? ?????????? ?????????? ?????????? ?????RSQQL VWIKRTAARA
           ?????????? ?????????? ?????????? ?????????? ?????YSSRV TPKSQGASQA

           ILHGVGLDDD LLKPQIGISS VWYEGNTCNM HLLKLSEAVK EGVENAGMVG FRFNTIGVSD
           MLFATGLEED MIKPQVGISS VWYEGNPCNM HLMDLAAEVK KGVEAMGMVG FRFNTIGVSD
           MLRAVDFDED FGKPIITLAC THTNATPCNA HMNELGEALQ KEVESIGGKA FVFGTPVISD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MLYATGLPED MNKAQVGISS VWYEGNPCNM HLLDLAGEVK KGVEAAGMVG YRFNTIGVSD
           MLYATGLEAD MNKPQIGVSS VWWQGNPCNK HLLDLAGKVA EGVKAADMVS FQFNTVGVSD
           MLRAVDFSED FDKPIVTVAC THTTATPCNA HIDQLGRLVG DAVSVAGGKS FLFGTPVISD
           VLYGVGLDED MSKAQVGISS VWYEGNTCNM HLLKLSEAVK EGVREAGMVG FRFNTVGVSD

           AISMGTRGMC FSLQSRDLIA DSIETVMSAQ WYDGNISIPG CDKNMPGTIM AMGRLNRPGI
           GISMGTDGMS FSLQSRDLIA DSIETVMSAQ WYDANISLPG CDKNMPGTLM AMARLNRPSL
           GETMGTLGMR YSLVSRDLIA DCIETMHEGY LADGMITLGG CDKSIPGALM PILRNDSIGV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GISMGTDGMS YSLQSRDIIA DSIETVVCGQ WYDGNIALPG CDKNMPGTII AMARHNRPSI
           GISMGTPGMS FSLQSRDLIA DSIETVMGGQ WYDGNISLPG CDKNMPGTIM AMGRLNRPSL
           GETMGTSGMR YSLVSRDLIA DCIETMHEGY LADGMLTLGG CDKSIPGALM PILRHDSIGV
           AISMGTEGMC YSLQSRDLIA DSIETVMGGQ WYDANVSIPG CDKNMPGTLI AMGRLNRPSI

           MVYGGTIKPG HTYDIVSAFQ SYGEFVSGSI SDEQRLHHSC PGAGACGGMY TANTMASAIE
           MIYGGTIKPG HVLDIVSAFQ SYGAYSAGLI NEAQRVRNSC PGAGACGGMY TANTMASAIE
           MLYGGSILPG HDLTVISSFE AIGARGAGKI DDKELERNSC PGSGACGGMF TANTMSSIIE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MIYGGTIRAG SVLDIVSAFQ SYGEFQYGKI TEEQRVQKSC PGPGACGGMY TANTMATSIE
           MIYGGTIRPG HTLDIVSAFQ SYGQFVTGAI TEEQRVRNSC PGSGACGGMY TANTMASCIE
           MLYGGSILPG RDLTVVSSFE AIGARGAGKI DDARLEEASC PGHGSCGGMF TANTMASVIE
           MVYGGTIKPG ITYDIVSAFQ SYGEYVGGHI SDEQRLQHSC PGAGACGGMY TANTMASAIE

           AMGMSLPYSS SIPAEDLKLD ECRLAGKYLL ELLLKPRDII TPKSLRNAMV SVMALGGSTN
           ALGMTLPYSS SIPAEDLKKD ECRMAGRYML ELLLKPLDIM TYKAFENAMV LVMATGGSTN
           AMGMSVPYSA AHTAVDDKLE DCKRSVEALF TCMITSRQIC TKKAFENGIT VCMALGGSTN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ALGMSLPYSS SYPADSEKKM ECYNSGKAMM KLLLKPRDIM TREAFENAMV MVMATGGSTN
           ALGMTLPYSS SIPAEDLKMD ECFMAGAAMK HLLLKPRDIM TRAAFENAMV TVIALGGSTN
           AMGMSVPYSA AHTAVTDKAA DVEASVAALF TCLITARQVC TREAFENAIV VMMALGGSTN
           ALGMSLPYSS SIPAEDLKLQ ECRLVGKHLL ELLLKPKDII TKESLHNAMV VVMALGGSTN

           AVLHLIAIAR SVGLELTLDD FQKVSDAVPF LADLKPSGKY VMEDIHKIGG TPAVLRYLLG
           AVLHFIAMAR ACGVPLTLDD FQRVSDRTPF ICDLKPSGRY VMEDIHKVGG TPAVLKYLDG
           AVLHCLALAH EAEVDLTIDD FNRIGDRVPL IGDFKPSGTY VMADLEKIGG IPLVMKYLLG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AVLHLIAMAR SVGIKLTVDD FQRVSDRVPM LADMKPSGKY VMEDIQNIGG TPAVMKYLVN
           AVLHLIAMAH SVGIKLTLDD FQAVSNKTPF IADLKPSGKY VMEDVHKVGG TPAVLKYLMG
           AVLHLLALAH EAEVPLTIDD FNTIADKVPL LGDFKPYGKY VMADLERLGG LPMVMKYLLG
           AVLHLIAIAR SVNVPLTLDD FQKVSDKVPF IADLKPSGKY VMEDLHKIGG TPGVLKYLLG

           LMDGDCMTVT GQTLAQNLQE IIRPLSNPIK ETGHIQILRG DLAPDGSVAK ITGKEGLFSG
           YINRDCMTVT GKTMGGNLQD VVLPVEKPIK QTGHIQILYG NLAPEGSVAK ITGKEGLFEG
           MLHGDCMTVT GKTMAENLQT IIRHLENPYA PPGHLVVMRG NLAPDGAVIK LSGKEISHRG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LFDDSQMTVT GKTIRENLQK IILPVEAPIK KTGHLQILYG NVAPEGSVAK ITGKEGEFSG
           MIDGSCMTVT GKTLAENLQD VILPVSTPIK KTGHLQCLYG NIAQGGSVAK ITGKEGLFKG
           LLHGDCLTVT GKTVAENVQD VIFPMEAPFA PAGHVVVMRG NLAPEGAVIK LSGKALKHAG
           YLNGDCITVT GKTLSENIQD VIHPLDRPIK STGHIQILYG NLAPEGSVAK ITGKEGLFSG

           PALVFEGEES MLAAISADMS FKGTVVVIRG EGPKGGPGMP EMLTPTSAIM GAGLGKECAL
           EALVFDNEED MITMVGAENK FRGKVVVIRY EGPKGGPGMP EMLTPTSAIM GAGLGKECAL
           PARVFESEEM AMDAILTGQI VENDVVVIRQ EGPKGGPGMR EMLSPSSAIM GAGLGKTVAL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TAAVFDSEED MLAALDRKEI KAGMVVVIRY EGPKGGPGMP EMLTPTSAIM GAGLGNDVAL
           FAKCYDSEEE MLEALAADES FKGSVIVIRY EGPKGGPGMP EMLTPTSAIM GAGLGNDCAL
           PARVFDSEEA ALNAILAGSI VPGDVVVIRY EGPVGGPGMR EMLSPSAAIM GAGLGKDVAL
           PARVFEGEEA MLSALSENQS FKGAVIVIRG EGPKGGPGMP EMLTPTSAIM GAGLGKEVAL

           LTDGRFSGGS HGFVVGHICP EAQEGGPIGL IKNGDIITID ITQVSPEEMN DRRWTAPAYK
           ITDGRFSGGS HGFVIGHVTP EAQVGGPIAL VKNGDKIVID VMKISDQELA ARKWKAPPLK
           ITDGRFSGGT HGIVVGHIAP EAAVGGPIGL VEEGDIVVLD VVEVGEAEME SRRWTPYVKS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ITDGRFSGGT HGFCIGHVTP EAQVGGPIAL IRNGDPIQID AVLVSDEEMA KRKWKAPPLK
           ITDGRFSGGS HGFVIGHVTP EAQVGGNIGL IKDGDIIEID APDVTDAEWE KRRWKAPPLE
           ITDGRFSGGT HGIMVGHISP EAAVGGPIGL IEEGDLIRLN PVYVSDEVLA QRR???????
           LTDGRFSGGS HGFVVGHICP EAQVGGPIAL VRDGDRITLD ILGVAEDELA ARKWTAPPLK

           VGVLYKYIKN VQSASDGCVT DLEAIAVLTT IIVVHESGHF LAASLQGIHV SKFAIGFEYS
           AGTLYKYIKN VSSASTGCVT DVQAVGVLAA IVAVHEAGHF AAARLQGIRV ARFAVGFEYC
           NGVLKKYRQL VSSASKGAVT HGAGIFLLGF IIFVHESGHF LAARLQGIRV KNFSIGFEFT
           ?????????? ?????????? ?LTAVSVLAT TILVHEL-HF WAARAQGIRV SSFSLGF-YS
           AGTLYKYIKA VSTASEGCVT DLSGAAVLCG VVAFHEAGHF LAAKVQGIKI NDFCIGFEYS
           AGTLYKYCKL VASASEGCIT DITAIGVLAV IITAHECGHF FAARARGIHV NAFAVGFEYS
           ?????????? ?????????? ?VTGLAVLAF IIVVHEAGHF AAARAQGIRV KNFSIGFEFT
           AGTLYKYIKN VKSASEGCVT DLQAVGVLTV IILVHEAGHF LAARLQNIHV SKFSIGFEYS

           LRAFPLGGFV LLKNRPTLDR SIVVSAGIIA NVIFAYAIIF VQASRDGLLS GDVILAVDGT
           LNAVPLGGYV LLKNRPIPQR ALVISAGVIA NVLFAYLVLL AQAARGGIRS GDIILRLGDV
           VRLLPLGGYV LLQNRPLFDR ALVISAGVIA NVILAWGCIF ASGAKAGVKA GDVILRVDGN
           VRAFPLGGFV LLQNRPVRDR AIVISAGVIA NLIFSYFTLF GQAQRAGIKA GDVILAVDGA
           LRLLPLGGYV LIQNRPALQR AFVISAGVLF NMLLAWGAIF GSGARYGMKP GDIIVEIDGK
           LKAIPLGGYV LLRNRPTSDR ALVVSAGIIA NVLFAFGILY NQARDAGIEA GDIILSVDGE
           LRALPLGGYV LLQNRPLLDR ALVLSAGVAA NIVLAYAAVL LSGARSGIRA GDVILSLDGT
           IRAIPLGGYV LLKNRPILDR VLVMSAGVFA NIVFAYTLLF TQAARAGVRP ADVILALDGQ

           ELGTGKIGVQ L-----KVAG PVAIIAVGAL YQFAALLNIN LAVINLLPLP ALDGGTLALI
           VVGGGRMGVQ LGLKQIQLSG PVAIVAAGSL FQFAAIVNIN LAAVNILPLP ALDGGYLFLL
           EVGNAAMGVQ LGLTSINLSG PIGVVSMGAL LTFCAVISIN LALINSLPLP ALDGGQMTFL
           PLGERRLGIV IGLSQLSIAG PIGVVAAGSL FSYAALLSIN L-VINILPLP ALDGGQLLFV
           DIGDGVIGVK LGFGKLNLAG PVGVMQMGAI LAFIALISIN LGIMNALPIP ALDGGQLVMV
           KLGDGKVGVK LSLSGLQVSG PIAIVATGAL YQFAAVININ LAIVNLLPLP ALDGGFLLLI
           KV-------- -GLTAINLSG PIGVVSIGAL LTFAAVISLN LAVMNSLPLP ALDGGQLAFL
           EVGYGRIGVQ LGLAQVKVSG PVAIVAVGAL FQFAALLNLN LAVVNILPLP ALDGGYLALI

           LLEAVRGKKL PVEVEQGIMS SGIMLVIFLG LFLIVKDTAV AARESSRKLQ ALSSEDRKKI
           AVEAVRGRKL PAAVEGGIMA SGFLLLTALG LGLVVRDTAV RARTASRQLQ ALSSEERSQL
           LIEALRGAPV SLRVQDAINR TALLLFLAFS GVLVFGDLAR RARVASRAML SVSSSEKDAA
           LIEA------ --KLQDQIQR VAVLALLLLS VFLIFRDAAK RAREAALQLS ACSAEKRDAA
           LVEAIRRRPL NSEVTRTVNG AFLAILLGAS LTLLVGDL?? ?????????? ??????????
           AIEAARGKKI PLEIEQSITG AGVLFLLISG ASLILRDTAR KARDASRKLQ QLPSRERAAL
           VVEAVRGKAV STKVQERVNQ TALLMFVALS GALFLGDLGV RARAAALAMA RVGGLAKDAA
           ALEALRGKKL PDKIEQGIMS SGILLILALG IVLMVRDTAV AARDSSRRLQ SLTSGERQNI

           LLDIADALEA NVTTIKAENE LDVASAKISS LAASVRKLAD MDPIGRVLKK TEVAGLVLEK
           LLKVADALLA AQEDILKANA RDVQEAKIAQ LAEGIRAIAA QEPLGRLLRK VEVAGLILDK
           LSAMREQLSK SKDRILEANV ADISAAKFDG VLTGIASVRS LDPVGECSLS RQIDGLQLYR
           L---AAALID SKDAILAANK ADKDAAKFEA VLQGIDEVKA LDPVG-VTLS TRLSGLDMYR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LRAVANALER RESEIQAAND EDLRRAKVKQ LADGARAIAN MEPIGKPLSA MELAGLTLTK
           LTAVHAALAS AKADILAANG RDKAAAKFDA LLQGVTSVRA LDPVGTVSRA TRLDGLDLYR
           LYDVADALER NEETIRSENQ ADVRLAKIAD LAKAVRALAD MEPIGSILQR TEVANLTLDK

           PLGVLLIVFE SRPDALVQIA SLAIRSGNGL LLKGGKEARR SNAILHKVIT DAIIGLVTSR
           PIGVLLVIFE ARPDALPQIA SLAIRSGNGL LLKGGKEATH SNAALHKVIV EALIALVTSR
           PIGVICVIFE ARPEAAVQIA SLAVKSANAV ILKGGKEAEK SNAALVEAIR AGLVQLVATR
           PIGVICMIFE ARPEAAVQIA SLTIKSANAV ILKGGKEAQK SNDALIAAIR AGLVQLVHGR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PLGVLLIIFE SRPDALPQIA SLALRTGNGL LLKGGKEAAS SNAKLREVIV DEFVCLIEGR
           PIGVIAVVFE ARPEAAVQIA ALAIKSANAV ILKGGKEAEA SNAILVQCIR KGLVQLVATR
           PLGVILVIFE SRPDALVQIA SLAIKSGNGL LLKGGKEAAR SNAILHKVIT EALIGLVTSR

           EEIPDLLKLD DVIDLVIPRG SNKLVTQIKN TTKIPVLGHA DGICHVYVDK ACDIVSDAKL
           EEIESLLALD DVVDLVIPRG SNALVSHIKR NTRIPVLGHA DGICHVYVDA AADIVLDAKT
           EEVRELLDQS KCIDLIIPRG SNALVKYITN NTRIPVMGHA DGICSVYVDE TASIVVDAKA
           EEIATLLGLD RYIDLVIPRG SNSL-----D NTRIPVLGHA DGICSVYLDE AEAVVVDAKT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EAVADLLKLD DVIDLVIPRG SNSLVTYIQN NTKIPVLGHA DGVVHVYVDK DANCAIDSKI
           GEVAQLLSLN THIDLVIPRG SNALVKYITE NTKIPVMGHA DGLCAVYVDA AADIVVDAKA
           DEIPDLLKLD DVIDLVIPRG SNKLVSQIKE STKIPVLGHA DGICHVYVDK AARIAIDSKV

           DYPAACNAME TLLVHLNELI FALQSNGVTL YGGPEARSFH EYCAKACTVE VVEDVYGAID
           DYPAACNAVE KVLIHVKAIY EALHQAGVEV HAGPPPPAPH EYSALAVTLE LVDNMEVAID
           QYPAVCNAAE TMLVHLPVVG AALAEAGVEL RADVSAVDYT EFLELILAVK VVDSVDEAIA
           QYPAACNAAE TLLVHLPK-- ---------- -----DGDFF EFLDHVMAVK -----SEAAA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DYPAACNALE TLLIHAAELM TALRAAGVEL FGGPAAPALH EYGGMQCSVE LVSSMDNAID
           QYPAVCNAAE TVLVHLPRLA AGLAAAGVEL RADACADDWT EFLELTVALG VVESLDAAVD
           DYPAACNAME TLLVHLETLA SALKSAGVTL NGGPKMTKFH EYSGLACTVE VVKDVHAAIN

           HIHRHGSAHT DCIVTEDHEV AELFLRQVDS AAVFHNASTR FSDGFRFGLG AEVGVSTGRI
           HIHKYGSAHT DCIVTTDGGR AEAFLRGVDS ACVFHNASTR FADGFRFGLG AEVGISTSRI
           HINEHGSGHT DCIITEDEGA ARRFLGMVDS AGVYHNASTR FADGFRLGFG AEVGVSTHRT
           HINAHGSHHT DSIVSP???? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YIHANGSAHT DCIITSNQKT ADEFIARVDS ACVFHNASTR FSDGFRFGLG AEVGISTSRI
           HINAHGSHHT DAIVTEDSAA AGAFLARVDS AGVFHNASTR FADGFRYGFG AEVGVSTHRT
           HIHEHGSAHT DCIVTEDKEV AELFLQQLDS AAVFHNASTR FSDGTRFGLG AEVGISTSRI

           HARVGVEGLL TTRWIMRGKG ?????????? ?????????? ?????????? ??????????
           HARVGVEGLL TTKWVLRGEG TIFDKIVSKE IPANIIYEDD EALAFRDIQP QAPVHFLVIP
           HARVGLEGLM IYKYKLLGNG ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? TIFAKIIRKE IPAKIVYEDD -ILAFRDVSP QAPI-ILIIP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           HARVGVEGLL TTRCLLRGKG TIFDKIVAKE IPATILYEDA LAMAFRDVNP QAKTHFLVIP
           HARVGLEGLL IYKYRLYGQG CSFSKIIRKE IPADVVHEDD QCLAFKDVNP QAPVHILVIP
           HARVGVEGLL TTRWLLRGNG ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ???????TGS SYGTHFRVST
           KNGLTRLSKA LLGHLMWVAQ HVAGFRVVVN DGPNGCQSVY HLHLHIMAGS TYGNNFRVTT
           ?????????? ?????????? ?????????? ?????????? ???????LGN TFGRILRIST
           KKFIQRMATV LLGHMMVKAS EIAGYRLVVN DGNDGGQSVY HLHLHLM??? ??????????
           ?????????? ?????????? ?????????? ?????????? ???????-MS SFGTFFRVTT
           KAGLTRLSKA LLGHLMYTAS VVAGYRCVIN DGVEGCQSVY HLHVHVIAGS TFGRIFRVTT
           KKPISQLSLA LLGHLMSTAS AVAGFRVVVN DGKDGCQSVY HLHLHVL--- ----------
           ?????????? ?????????? ?????????? ?????????? ???????VGN TFGNLFRVTT

           FGESHGGGVG CIIDGCPPRI PLTESDLQFD LDRRRPGQST TPRKETDTCR ISSGVMTTGT
           FGESHGKGVG CVIDGVPPRL AITEDEIQLE LDRRKPGQST TPRKEDDIAE ILSGVVTLGT
           WGESHGGGVG VTVDGVPPRL ALSREEVQLD LDRRRPGQSV TPRNEPDAVE ILSGVVCIGT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           FGESHCAGVG CIVDGVPPRM QLSEADVQVQ LSRRRPGQAS TGRNEEDAVQ ILSGTFTLGT
           FGESHGGGVG CVVDGVPPRL RVTREELQFE LDRRRPGQST TPRNEEDSCE ILSGVVTLGT
           ---------- ---------- ---------- ---------- ---------- ----------
           FGESHGGGVG CVIDGCPPRL NLTEEDMQED LDRRRPGQST TPRKETDTCK ILSGVMTLGT

           PIHVFVPNTD QRGLDYRPSH ADATYDMKYG VRSVQGGGRS SARETIGRVA PGALAKKILK
           PIAIVVRNKD QKSQDYRPSH ADATYDFKYG IRAVAGGGRS SARETIGRVA AGAVAKKLLK
           PIAMLVRNKD HRSQDYRPSH ADAAYDAKYG IRAVAGGGRS SARETIGRVA AGAIAKKILR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PIGMFVRNKD MRPHDYRPSH ADFTYQMKYG FRAASGGGRS SARETIGRVA AGAIAEKFLK
           PVAVLVRNKD QRSQDYRPSH ADATYDMKYG VRAIAGGGRS SARETIGRVA AGAIAKKVLK
           ---------- ---------- ---------- ---------- ---------A GGAVAKKILA
           PIAVLVPNTD QRGGDYRPSH ADATYDFKYG IRAVQGGGRS SARETIGRVA AGAIAKKLLK

           QFAGTEILAY VSQVHHVLTL EQIENNIVRC PNPEYAMIAA INSVGGVVTC IVRNAPRGLG
           VIGDTEILAY VSKVRDIFTM ADVESNIVRC PDQAAAMIDA IESCGGEVTC VVRRCPKGLG
           EYAAVEVIAY VKSVRDIVTQ EQVEANIIRC PHEETAMIAY VNSVGGVVEV VARNVPAGLG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ERYGVEIVSW VSGVGDIISR EQVDQHMVRC PCLETAMTEC IDSVGGVVSC VIRNVPIGLG
           EVAGTEILAY VSAVRDVMTM DDVESNIVRC PDESCAMIDA IDSCGGVVTC VVRNPPRGLG
           AYAGVEIVGY VQRVLDVVSI ADVEANIIRC PDAATAMIGL VNSVGGVVEV VARNVPAGLG
           QQCGTEVLAY VSRVHQVLTL EQVESNIVRC PDQDMAMIAA IDSVGGVVTC IARNVPRGLG

           TPVFDKLEAE LAKACMSLPA TKGFEFGSGF AGTFLTGLEH NDEFRTRTNR SGGIQGGISN
           SPVFDKLEAE LGKAMMSLPA TKGFEIGSGF AGAAMLGSEH NDEFRTRTNR SGGVQGGLSN
           SPVFDKLEAD LAKACMSLPA SKGFEIGSGF EGTMLTGLEH NDAFRTASNR SGGVQGGISN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EPCFDKLEAV LAHAMMSIPA TKGFEIGSGF AGARMRGSQH NDMFVTETNY SGGIQGGISN
           APAFDKLEAD LAKAMLSLPA TKGFEIGSGF DGTLQKGSEH NDEFRTRTNR SGGIQGGISN
           SPVFDKLEAD LAKACMSLPA SKGFEVGSGF DGTRLTGFDH NDPFRAASNR SGGIQGGIAN
           TPVFDKLEAE LAKALMSLPA TKGFEIGSGF EGTKMTGSEH NDEFRTRTNR SGGIQGGISN

           GEIINMRVAF KPTSTIGRKQ NTVTMIARGR HDPCVVPRAV PMVEAMVALV LVDQLMAQYA
           GEDIVIRVAF KPTSTIGIKQ NTVTLRARGR HDPCVVPRAV PMVESMVALV LADQLLQHFA
           GEAIVCRVAF KATSTIGKKQ KTVTLRGKGR HDPCVLPRAV PMVESMVALT LADHLLQQIA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GMPIVFRMAF KPPATIGKAQ NTADLEAKGR HDPCVVPRAI PIVETMAALV IADMCLMQEA
           GEMIEMKIAF KPTSTITQAQ NTVNLKARGR HDPCVVPRAV PMVEAMVALT LVDHLMLQHA
           GETIVVRVAF KPTSTIGRVQ QTVTLRGKGR HDPCVLPRAV PMVEAMVALV LADALMAQVA
           GETIVMRIAF KPTSTITKFQ KTVTLRARGR HDPCVVPRAV PMVEAMVALV LADQLLQNYA

           QSQVALAAIL YSEFLSKDGS VVPNDPDLID ILVDISVSEA FGGLFLLFRR AQPMDFGRSK
           QPKAALASLL YSEFVSKDGS QLPNDPDLVD ILVDISVSEA FGGLFFLFRR SQAMDFGRSK
           QAEAKRAASY YSEFISADGQ RLPNDPDLLK TLVDVTVLPL FGGLFLLSRR AGPMDLQRSG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RDDVRRQMAA YSEFMSADGR RVPNDPTLLD TLVDVTVLPL FGGLFLLSRR GGPMDLGRSG
           Q????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QTKSKTALMA YSEFISADGQ RAPGDPDLLS TLVDVTVLPL FGGLFFLSRR AGPMDLAKSG
           Q--------- YSEFLSRDGS VLPNDPDLVD ILVDISVSEA FGGLFLLFRR AQPMDFGRSK

           SKFQEVPETG VSFADVAGAD QAKLELQEVV DFLKNPDKYT ALGAKIPKGC LLVGPPGTGK
           SKFQEVPETG VVFDDVAGCD GAKLELQEVV DFLKNPDKYT ALGAKIPKGC LLVGPPGTGK
           ARVAMVPETG ITFQDVAGVD GAKLELQEVV QFLKESERFT ELGARIPRGV ILEGPPGTGK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AKVQMQPDTG VTFNDVVGVD GAKIELEEVV QFLKESERFT EIGARIPRGL ILEGPPGTGK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ARVAMVPETG VTFKDVAGVD QAKLELQEVV QFLKESERFT DLGAKIPRGV ILEGPPGTGK
           SKFQEVPETG VTFADVAGAD QAKLELQEVV DFLKNPEKYT ALGAKIPKGC LLVGPPGTGK

           TLLARAVAGE AGVPFFSCAA SEFVELFVGV GASRVRDLFE KAKSKAPCIV FIDEIDAVGR
           TLLAKAVAGE AGTPFFSCAA SEFVEVFVGV GASRVRDLFE KAKSKAPCII FIDEIDAVGR
           TLLARAVAGE AGVPFFSISG SEFVEMFVGV GASRVRDLFA NAKKNAPCII FIDEIDAVGR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TLLARAVAGE AGVPFFSISG SEFVEMFVGV GASRVRDLFS QAKKNAPCII FIDEIDAVGR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TLLARAVAGE AGVPFFSISG SEFVEMFVGV GASRVRDLFS NAKKNAPCII FIDEIDAVGR
           TLLARAVAGE AGVPFFSCAA SEFVELFVGV GASRVRDLFE KAKGKAPCIV FIDEIDAVGR

           QRGAGMGGGN DEREQTINQL LTEMDGFSGN SGVIVLAATN RPDVLDSALL RPGRFDRQVT
           QRGAGMGGGN DEREQTINQL LTEMDGFEGN TGVIVLAATN RPDVLDQALL RPGRFDRQVT
           QRGAGIAGGN DEREQTLNQM LTEMDGFEGN SGVIVIAATN RADVLDQALL RPGRFDRRII
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QRGAGIAGGN DEREQTLNQI LTEMDGFEGN PGIIVIAATN RADVLDPALL RPGRFDRRIV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QRGAGIAGGN DEREQTLNQM LTEMDGFEGN AGVIVIAATN RADVLDSALL RPGRFDRRVM
           QRGAGLGGGN DEREQTINQL LTEMDGFSGN SGVIVLAATN RPDVLDSALL RPGRFDRQVT

           VDRPDVAGRV KILQVHSRGK ALGKDVDFDK VARRTPGFTG ADLQNLMNEA AILAARRELK
           VDRPDVQGRV SILKVHSRGK ALGKDVDLEK IARRTPGFTG ADLQNLMNEA AILAARRNLK
           VDLPDFSGRL AILKVHARGK PLAKDVDLEQ ISRRTPGFSG ASLQNLLNEA AIFTARRKKT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VDLPDFAGRV AILGVHSRGK PLGDDIDLNQ IARRTPGFSG ASLANLMNEA AIFAARKNKV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VDLPDWSGRV SILKVHARNK PMAADVDIEN VARRTPGFSG ASLQNLLNEA AIFTARRKKT
           VDRPDVAGRV RILEVHSKGK SLGKDVDFEK IARRTPGFTG ADLQNLMNEA AILAARRDLK

           EISKDEISDA LERIIAGPEK KNAVVSEEKK RLVAYHEAGH ALVGALMPEY DPVAKISIIP
           EISKEEIADA LERIIAGPEK KGAVMSDKKR RLVAYHEAGH ALVGALMPEY DPVTKISIVP
           EIGPDEVSDA IDRITVGAEK KDAVMTPRRQ KLVAYHEAGH AVVGALTPDY DQVAKISIIP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SIGNDEISDA LDRVTLGPEK KNAVVSLQKK ELVAYHEAGH AIVGALTPDY DQVAKITITP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EIGAEEVDDA LDRLTIGAEK KDPVLSVQRK ELVAFHEAGH AVVGALTPGY DEVAKISIMP
           EISKDEISDA LERIIAGPEK KNAVVSEERK KLVAYHEAGH ALVGALMPEY DPVAKISIIP

           RQAGGLTFFA PSEERLESGL YSRSYLENQM AVALGGRVAE EVIFGDENVT TGASNDFMQV
           RAAGGLTFFA PSEERLESGL YSRTYLENQM AVALGGRIAE ELIFGEDDIT TGASGDFQQV
           RGAGGLTFFA PNEQRVDSGL YSRQFLEGQL AVALGGRIAE EIIYGDDEVT TGASNDLQRV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RGAGGLTFFA PNEDRVDSGL YSRQFLESQM AVALGGRIAE EIVFGEDEVT TGASNDLERV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RGAGGLTFFA PNEARLDSGL YSRSYLEGML SVALGGRAAE ELIFGTSAVT TGASNDFERT
           RGAGGLTFFA PSEERLESGL YSRSYLENQM AVALGGRIAE EVIFGPENVT TGASNDFQQV

           VARQMIERFG FSGQVAVGGP GNPFMGQQMD YSMATADIVD AEVRELVEKA YKRATEIITT
           IARLMVTQLG LSGQVAWSNQ GASFLGASAD FSQSTADEID SEVKELVERA YRRAKDLVEQ
           VAKQMVTRFG MSGQLVVSSE SNPFLGRQMQ LSSVMRTDID DEVRRLVNVA YTRAKSLLTN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TAKMMVTRFG MSGQVALAQD GSPFLGRQMV MSGETKALID SEVSRLVSGA YNRAKQLLLD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VARGLVTQYG MSGEIAVDTS GNPFMGRQMP VSSMVKADID AEVLRLVDGA YTRAMDVLKG
           VARQMVERFG FSGQVALGGS GNPFLGQQLD YSMATADVVD AEVRELVESA YARAKHLITT

           HIDILHKLAQ LLIEKETVDG EEFMSLF??? ?????????? ?????????? ??????????
           NIDILHKVAA VLIEKENIDG DEFQQIVGLK EVRDRIASVK NTQKITDAMK LVAAAKVRRA
           NRPLLDALAE MLIEKETVSA EEFQRLIQLR EIRDRISSVK NTQKITDAMR LVAAAKVRRA
           ?????????? ?????????? ???????NLR AIRDRMGTVK NTQKITEAMR LVAAAK----
           NREALDELAR LLVEKETVTA EEFQQLLGIK ELRDRVTSVK NTKKITSAMR LVAAAKVRRA
           ?????????? ?????????? ???????SPK EMRDRIASVG NTKKITDAMK LVAAAKVRKA
           NRALLDNLAK MLVEKEVVSS EDFQKLINIR EMRERISTVK NTEKITEAMR LVSAAKVRRA
           HVEILHKLAN LLIEKETVDG EEFLSLFSLK DLRDRIDTVK NTQKITDAMK LVAAAKVRRA

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QEAVVNGRPF SENLVKVLYG VNQRVLLVVL TGDRGLCGGY NNFIIKKTEA RYRELTAMGV
           QDAVLRTRPF SEVLQKVLGG LINRVLLVVI TGDRGLCGGY NNYVIKKTEN RIKELKAAGI
           -DAVLQGRPF ADKIVQVLYG LQNRIGILVI GGDRGLCGGY NAFLMKAVAM RCKELDEQGI
           QDAVLKTRPF SETLQKVLGG LIQRVLLVIM TGDRGLCGGY NSYAIKKAEG RIRELLAQNV
           QDAVIGARPF SESLVKVLFA INSRAMLVVC TGDRGLCGGF NNFIIRKTEQ RVAELKAQGI
           QDAVLKTRPF SETLQKVLGG LIKRVVLVVI SGDRGLCGSY NNYIIKKTEA RIKELKAEGV
           QEAVVNGRPF SEALVQVLYN VNERVALVVV TGDRGLCGGF NNTVLKKAEE RMRQLKDT-I

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           CVGRKGAQYF ARRAAPSTKE AQGIADEIFA SFIADKVELV FTKFISLINS NPTIQTLLPM
           TIGLKGQTYF KSRQAPTAEQ ATSISDQLLA EFLSDRIELV YTRFVSLIAS EAALRTILPL
           TVGRKADQFF SRRAAPTPMQ SLMIADECLS LFLSDKVELI YTRFISLISS KPVTQTLLPL
           TIGNKGNQYF KKRNSPTADQ ATPIAQNLLA TYLADRVELL YTKFTSLISS EPSVRTMLPL
           TVGKKGGVYF NRRQAPSTQD AQTIADEIFA EFTSDKVEMI YSRFVSLIAA EPTVQTILPL
           CVGTKANTYF RRRQAPSAEN ASSITDELLA EYLSDRIELL YTRFVSLISC EASIRTLLPL
           SIGKKGNAYF TRRSAPTTSE AQAIADELFA LFVSDKVELL YTKFVSLIKS EPVIHTLLPL

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TPMGDEIFKL TTKGGEFSLI FEQEPAQILD ALLPLYMSSC LLRSLQEALA SELAARMNAM
           SPQGDEIFQL TTVDGALDMI FEQDPLQILN AILPLYLNGQ ILRTLQESVA SELAARMSAM
           DISGDEIFRL TTAQKLVTAL FDQDPITLLN ALLPLYLNAQ IYRALQEAVA SELSARMTAM
           SPTGDEIFLM TSKDGSFDMI FEQDPEQILS AILPLYFNGQ ILRQMQESVA SELAARMTAM
           SKEGDEIFKL TTEDGKFVMQ FEQDPNQILD ALMPLYMNSQ ILRALQESLA SELAARMNAM
           SPSGDEIFQL TSVGGQFDMI FEQEPLQILN AILPLYLNGQ LLRTLQESVA SELASRMSAM
           SPQGDEMFRL TTKDGKLVMI FEQEPVQILD ALLPLYLNSQ LLRALQESVA SELASRMNAM

           ?????????? ?????????? ?????????? ????????SM SANDIKAGTN IEVDGAPWRV
           NNASDNAKEL KKGLTVYNKQ RQAKITQELA EIVGGAAATV STNDFKNGLT VEIDSAPYKV
           SNASDNAKEL GKDLSLYNRG RQAAITQEIS EICAGAMI?? ?????????? ??????????
           QAATDNAKAV VKNLGLYNRA RQAAITQEIL EVVGGAEAAA SSNDLRNGTN LVMDGQIYKV
           QSASDNASDL IRDLTRMNRQ RQAAITQEIS EIVAGASSPI SSNDFRPGTT IQFDGNVYKV
           STASDNAKEL KKTLSLYNRA RQAKITSEII ELVAGASA?? ?????????? ??????????
           SSASDNAKDL GKSLSKYESG EERCIACKLC EAICPAQA-- ---------- ----------
           NNASENASDL KKSLSIYNRQ RQAKITGEIL EIVAGATA-V SSNDFKTGTE IEIDNAPWRV

           LEFLHVKPGK GAAFVRTKIR NYVNGSTVER TFRAGISVEE ANIYKETKQF TYFVFMDLTT
           IEFLHVKPGK GAAFVRSKLK NFLTGGVVEK TFRAGEQVNT ADVQKREGQF TYYVFMDTES
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           L-FLHVKPGK GAAFVRTKLK NMSTGSTVEK TFRAGEPVET AQTEKKEMQH TYFVFMDMET
           LEFLHVKPGK GAAFVRTKLK NLTTGGNLEK TFRAGEMVDG AEVIKSDVQF NYYVFMDMES
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ---AGESVKQ ASLEKISMQH TYYVFMNMET
           IEFLHVKPGK GSAFVRTKLK NCITGNTVER TFRAGEVLED ATVQKNVKQF TYYVFMDMVS

           YEETRLNESD MGEKTKWLKE GMDCILLYWI DFDLPITVKL KVVDVDPGLR GDTVQGGSKP
           YEETRLKKD- --DWAQFLKE GTTVELLFYI SVDVPQFMDL KIVATSPNVK GNTVSGGSKP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YEEARLSEKD IGAQSQWLSE GMTVNVLYWL DVELPTSIVL EITYTEPGVK GNTATGATKP
           FETQSVSAEV LGDSTIWMKE GVDVKIVKFL DIEIPQTMVL EVTETEPGVK GNTAQGGDKP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YDEERLTAKV IGDRVKYMKE GLDVEVLKHL DVDLPTTITL RVADTEPGVR GNTANNALKP
           FEESRLNAKE IGDKANWLRE GMDCTVVSWL EVDLPIAVKY KVVQTDPGVK GNRESGGTKP

           ATMETGAIVA VPLFINVGEE IFVDTRTGAY MNR??????? ?????????? ??????????
           ATVETGAVVS VPLFINEGET IKVDTRTGQY LSRFDSISSA LADLAAGKVV VVIDDEDREN
           ?????????? ?????????? ?????????? ???EQSGRDA WRDVAAGRFI VVVDDEHREN
           ATVSTGAIVQ VPLFIEQGEK IKIDTRSGEY LSR??????? ?????????? ??????????
           ATLETGAVVR VPLFIKTGEK VKVDTTSKKY LSRKQSVTDA IEAVRNGQMV IVVDDEDREN
           ?????????? ?????????? ?????????? ???FAAVADA LEDVAKGKFV VVLDDEDREN
           AKLETGATVM VPLFIEIDEL VSVNTVEGKY LSR------- ---------- VVTDDEGREN
           ATLDTGAVVN VPLFVDEGEE IIIDTRTGEY MSRFSSVAEA LEAFKQGKMV IVVDDEDREN

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EGDLIMNADK VTTETMAFFV EYTSGVVCIS MEGQDLDRLK LPLMIMYTAF TVTVDL--RD
           EGDLILAADK ATPEAIAFMV KHTSGVICCA MEGHDLDRLQ LTQMVKNTAF TITCDL--KE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EGDLIMAAEK ATKETIAFMI KHTSGVICCA IEGERAVDLQ LPQMVKCTAF TVSVDL--RH
           EGDLIGAADK MTAESLAFMI RHTSGLVCVS LEDSRADALD LPLMVMKTAF TVSVDLA---
           EGDLILAADA ATPKAIAFMV RHTSGVLCCA LPEPTAARLG LAPMVKHTAF TVSVDV--KA
           EGDLIMAASM VTPEKVEFLR SHCTGIICVP MKGEILDRLD VKLMVLSTAF TIPVDG---Q

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DITTGISASD RAKTIRRLAD PSATWTDFRR PGHIFPLRYR PGGVIVRPGH TEAAVDLARL
           GTSTGISAAD RARTLQALAD PNVQPDDFNR PGHIFPLRYR EGGVLKRAGH TEASVDVARL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GITTGISASD RAATLRALGS KESKASDFTR PGHIFPLRGV PGGVLSREGH TEASIDLSVL
           TSTTGISASE RAMTINALGS DETTAAAFVR PGHVFPLRYR AGGVLKRAGH TEAAVDLARM
           GTSTGISASD RAATLRALGA DDSVADDFNR PGHIFPLTAR EGGVLKRAGH TEAAVDFARL
           GTTTGVSSED RARTISMLAS PNATASDFKK PGHVYPLRYR EGGVLKRAGH TEAAVDLAVL

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SGSFPAGVLC EIVNGSMSRT PQLLEFAKRH GLKCITIADL IRYRLRNEAT AASGARLTAQ
           AGCTPVGVLS EIVNGSMARL PELKVFAKEH GLVLTSIADL VKYRSMQEKL PTRYGTFDAF
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AGCTPAGVLC EIVTSEMMRV PELKVFAKKH SLVFTSIQDL KMYRRSLD-- ----------
           AGSSPVGVLC EIVNGSMARL PQLKVFAEKH GLKMVLISDM IRYRRAREKL PTEYGNFTCV
           AGRAPAGVLS EIVRGEMARL PELRTFAATH GLVLTSIADL IRWRRGREKL PTRHGEFTAF
           SGMPPVGVIC ELVNGSMQRL PQLQVFAEKH NLHIISIADM VRYRRKREKL PTRWGLFKAY

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AFVDGTEHVA FVHVLLHVHH ERTVADLLDC GAADCSLDGA LRSVAAAGAG VVVYLRQSAR
           AYLDGVEHVA LVVVLVRVHS ECCTGDVFGS LRCDCQLDFA LEEIAKEGRG ILVYLRQEGR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ---------- ---------- ----------
           SYLDGHEHVA FLYMLVRVHS ECLTGDIFKS ARCDCQLDMA MRRIAGEGKG CIVYLRQEGR
           GFVDDVDHLA LVAVLVRVHS ECCTGDVFGS LRCDCQLDYA LAAVAAAGRG VVVYLRQEGR
           SYLDGIEHIA IVKVLVRVHS ECLTGDVFGS KRCDCQLEIA MMQIEKAGRG VLVYLRHEGR

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GLPPSAELAA LGSGGAGAGA L-------YS CDLKDAAVVA LRQLGVRSVS LAGGEGATAL
           GIGLAHKMRA YALQDRGRDT VQANEELGLP VDSREYGIGA LSDLNVSQII LMTNNPASGL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- -AAN?????? ?????????? ?????????? ??????????
           GIGLGHKLRA YNLQDEGRDT VQANEDLGFP ADTREYGVGA LQDLGVTSLR LMTNNPANGL
           GIGLGHKMRA YALQDAGRDT VQANEELGLP VDSREYGIGA LAELGVSQLR LMTNNPASGL
           GIGLGHKLRA YNLQDEGRDT VEANVELGLP VDSREYGIGA LRDVGVRTMK LMTNNPAMGL

           ?????????? ?????????? ?????????? ???IVPFELH KEATESYMSY ALSVLLGRAL
           RSCGLAVRAA AAAGGAGAAT QHVNGNGASS NGHVEDRELV DETHDSYMSY AMSVIVSRAL
           GGYGLKIVRR PVHISPNPEN VKYLQTKKLK LGHIVPADLK QEMTRSYMEY AMSVILGRAM
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ???IINTELQ NEMAKSYMEY ALSVIYGRAL
           SGYGLKVTRV PLFAPVTMEN KRYIDTKRMK MGHIIDVELA SEAKTSYLSY AMSVIVGRAL
           RGYGLEIVRV PVQVVPNVEN LGYLRTKREK MGH------- --MSRSYLEY SLSVILGRAL
           KGYGLAITRV SVISTITDEN KRYLETKREK MGHTLLVELH KEASESYLSY AMSVIVGRAL

           PDVRDGLKPV HRRILFAMHE LGMSSKKPYK KCARVVGEVL GKFHPHGDTA VYDSLVRMAQ
           PDVRDGLKPV HRRILYAMHE LGLVATKPYK KCARVVGEVL GKFHPHGDNA VYDSLVRLAQ
           PDVRDGLKPV HRRILFAMHE LGLSPGGQFR KSARVVGEVL GKYHPHGDTA VYDALVRMAQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PDIRDGLKPV HRRILFAMYE LNLVPEAPYR KCARVVGEVL GKYHPHGDTA VYDSLVRMSQ
           PDARDGLKPV HRRILYGMHE LGLRADKPHR KCARVVGDVL GKYHPHGDGS VYEALVRLAQ
           PDVRDGLKPV HRRILYAMHG LKLDASGVFR KWXGL----- ---------- ----------
           PDVRDGLKPV HRRILYAMNE LGLASKKPHR KCARVVGEVL GKFHPHGDTA VYDALVRLAQ

           SFSLRCPLIQ GHGNFGSIDA DPPAAMRYTE CRLDPLAEAV LLSDLDQDTV DFVANFDNSQ
           DFSMRVPLVQ GHGNFGSVDA DPAAAMRYTE CRLAPAAEGL LLGDLGAATV EWRDTFDASQ
           PFAMSIPLVN GHGNFGSTDG DPAAAMRYTE CKLAHLTRDV FLADMGRDTV SYSPNFDGSE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EFSMRKVLIL GHGNFGSIDH DPPAAMRYTE CKLSNLSVDT LLKELDFKTV EYVYNFDGSS
           DFSMSAPLVD GHGNFGSLDD DPPAAMRYTE CRLNKLAEKG LLADIGNECV NFTETFDGSQ
           ---------- ---------- ---------- ---------- LLADIDRDT- ----------
           SFSLRSPLIS GHGNFGSLDG DPAAAMRYTE CRLHPLSEAM LLADLDLDTV DFIPNFDGSQ

           KEPAVLPARL PALLLNGASG IAVGMATNIP PHNLGELVDV LCALIHNATL QELLMPAPDF
           QEPVVLPAVV PNLLVNGSQG IAVGLASTIP PHNLGEVVAA LRRLIANVTT EELMVRGPDY
           SEPLVLPAKV PNLLVNGSSG IAVGMATNIP PHNLGEVVAA LKAIIADLSD DDLLVPAPDF
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           IEPSIMPSVI PSILLNGSSG IAVGMATSIP PHNLGEIVRS CLALIDNITN QELILPCPDF
           TEPEVLPARV PNLLINGSSG IAVAVATNMA PHNLGESVDA LCALAKNCSL DELMLPAPDF
           ---------- ---------- ---------- ---------- ---------- ----------
           KEPVVMPARL PNVLINGASG IAVGMATNIP PHNLSEVVDA LCALIKNATV EELMLPGPDF

           PTGGIIMGVL DAYRTGRGRV VVRGKAEVEP KTKRNAVIIT EIPYQTNKAT LVQKIAELVE
           PTGGQLIELL AAYRTGRGSV VLRGTATIEA DGGPELIVIT ELPYSVCKAQ LVADIAHMAA
           PTGGQILGAR DMHMEGRGRI VVRACVHPER RQQREAIVVT ELPYQVNKAT LVGKIAELVN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PTGGLIISCK DLYEKGISSI ILRGKINVEK KVSKYNLIIT EIPFQINKSM LIAKLADLVN
           PTGGVVTGMK EIYETGKGGV TLRGRATIEG SLDKDAVVIS EIPYQTNKAR LVEQIADHVN
           ---------- ---------- ---------- -----AIVVT ELPYQVNKAT LVAKIADLVN
           PTGGQILGIA DAFRTGRGTI TVRGKADFEG KISRSAIVIT EIPYGTNKST LVAKIAELVN

           NKEGISDIRD ESDRNGMRVV IELKRGGDPA LVLNNLYRHT ALQSSFSCNM VGIPKLMGLK
           PREGVADVRD ESDRTGMRVV VEVKMGWNAE LLLAQLFKDT RLQISQSFNC VALPVQLGLK
           DKDGVADLRD ESDRNGTRIV IELKRDAMLE VVLNNLFKKT QLQSSFSANV MALPIRLTLR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SKQGISDIRD ESDRKGIRIV IEIKRDYDPI KIVKIILKKS SLQITFSSYM LCIPILVNLK
           GRDGISDIRD ESDRDGMRVV IEIKRGYDAA SVLEELYAKT KLEVKFFVNN VALPTVMPLR
           DRDGIADLRD ESDRDGMRVV VELKRDAVPA VVLANLLAKT PLQSSFSANV VALPERLSLR
           SKEGVSDIRD ESDRAGMRIV VELKRGAVAA VVLNNLYKHT ALQSRFSYNL VGIPEVFSIK

           ELLQAFIDFR CSVVERRARF KLSHAQQRKH IIEGIVVGLV DEVIELITKA SSHSSALSEK
           DMLAAFLEFR CEVVTRRTQA ALAAAQQRLH LVDGFLAVLL DAVVADIRAA ADGAAALSEA
           NCLEKFLKFR RETIRRRVQF DLRKAEDRFH IVQGFLIVQI DSAIADIRGS QDSAEALSAR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EILSLFLHFR RKIIRKNIKF ELKNILKKKN ILKGISISLI DLTIEKIKKS INNLEALSQE
           QILDEFIKFR VDTIERRTRF MLSKAQDRKH LVEGFSIVLA DGVVKIIRKS KDGPSALSDI
           ACIDAFIEFR VDTVRARARH DLARATDRAH VVDGFLSAVM DDVVAAIRGA ADAPGALSAA
           RLLEIFLDFR CSVVQRRAQC ELTRAEARDH LLEGFLKGLL DDVVKVLKSA KDSASALSAA

           QAEAILEITL RRLTALERKK FTDESSSLTE QITKLEQLLS TRTNILKLIE QEAIELKPRR
           QAEAVLGLTL RRLTGLEAAK LEAERQQLHE TSSGLSHILG SRAALLAVVE AEAAAAAPRR
           QADSVLAMQL KRLTSLEKNR LVDESETLQG DIAKYKGILS TPTELDAIIV DELTDISPRR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QSEAILNLQL RRLTKLESKK IDNDFEITKS SLNELKCILS SNILIDGIIK NQIKNISPRK
           QADSILAMPL RRLTGLEADK LDAELKELNE QIAHFQGLLS NKSKVIDVLV QEAMEAKPRR
           QADAVLTMQL RRLTALERER LEAEAATLSA TIELLTATLA DRSVVVAVIV TELEEARARR
           QAEALLGMPL RRITSLERNK ILEEHNSLLA QASDLRELLS NKQRVLKVVE KEALALKPRR

           SMLDVIPNEE MLMAVSEKGY VKRMKADTFN LQHRGTIGKS VRVDDAMSDF LVCHAHDHVL
           TSVALTPNEP CLVVASRRGF LRRLPGEALA AQNRNTRGKS GRSGDALACL ASGRDHDRLL
           SKISLFSNER SVITVTEKGY VKRMPTSAFE NQNRGGRGKR GREGDRIVHF FSCMSHDSLI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TLLETIENYE SVIMIT-QYY IKKMFLESFE SQTRGTKGKR GSDGDEISHF FSCNNRDDLI
           TSVDDSPPKD NILTLSERGY VKRICPKNFG AQNRGTRGKR MRANDELSKA MHCKDSDQIL
           SEISLIANSR SVVVVTSQGY VKRMPVGDFD AQSRGTRGKA GKNDDVVAHF FSCYDHDTLL
           TVLDVIPNNE SFLTLSEKGY IKRMQPDTFL AQRRGTTGKS GKSNDGMVDS FMCRNHDHVL

           FFSDRGIVYS TRAYSRNAAG TPLVQILSER VTSIVPVLLM LTVNGCIKKV SLKLFSGIRS
           LLTPDGRAFA TTAMAPSPSG ASVANVLKFP IAALLPVVVL CSRRGLIKRI ALP--TKITR
           AISKSGVAYK ISAHSLGSRG VPLFQLLPEA AASVLSVLVL LTRNGYVKKT AASVFESLNA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AISSGGIAYK IKVSKRNSKG TPILSILKNQ ISSIIATLVL LTQKGLIKRT SISNFNNISS
           FFSDRGRVQK LSAKELNTIG VPATSLLNQN VTAMLSTVVM LTSQGKV--S VASAASMLGH
           VISEAGAAHA LPAHTREARG TPLFQLLPDS VAAILPVILL LTEAAYVKRT PLAAFASPPS
           VFSERGVVYS FRAYSRTSTG VPIIQVLSER ITSIFPLLVM LTSKGYIKRT ELPAFSSIRP

           TGIIAIDELK WVRDLVAMAS QGMVALSVRT LSRNTKGVTA MRLIASMDII GPWLLFVCEN
           VGLPVMDELG WALDVVVAVT AGQAVLFLRR SGRSSLGVKA VALIADLTIL GPCLLLVTAQ
           GGKRIIDELK WVRDSMLIAS QGYIIRFLRA SGRQSRGVRS MRLIADMDIM ASYVLAVTRH
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RGLIILDSLK WVRDSVIIST KGKLLRFLKS TGRTSKGIKS IDLISDFDII TNFIILLTEM
           KGKKVIDRLQ QVMDHLFITG TGLILHCVKS ACRPISGIKT MGETVGMAIV GPFILFTTKK
           RGLKIIDRLR WVADSVIVAS AGLGIRFLRP SGRTSRGVRA MKLVVDVDVL YTYLLAVTSS
           QGIVAIDELK WVRDRIFIGS RGMAMQAFRS MRRGARGLRA MRIIAAIDIV APWLLFVSEN

           GYGKRVPLSS FRRSRLNRVG LSGYKFDRLA AVFVVQVVLV SQSGTVNRSR RARGVILMRL
           GSGKRVLLSQ LSLGHRAKAG RKVIRLDRLV CCLVVEVVVA SRNGVLVRGL YSRGTFLMSL
           GAGKRIDANS FRMQCRGGRG MIGMKFDCIV SLQTCSVMVV TCDGTIVRRR YSRGVRIQRL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GYGKRIKVTE LKIQKRGKKG IKVISLDYLI SSRFCEILIS TSYGNVVKKK NSKGIIIQRL
           GKGKVVAANS YRLLGRGRSG VMCMKFDALA TITLVEVLLS TTGGISNRDP LALGAAIIKL
           GYGKRLRASE FRLQARGGIG LKILKFPSLV ALRSVEVMLI TRRGTLVRSR TATGVRVQRL
           GMAKRVPITS FPRHGLNKVG VIGCKFDRLA SMFVVEIVVG TQGGIFNRSR MGRGIKLMKL

           DGKIQSASLI SKKRVVSGVQ PTGSVHLGNY LGAIKNWVAL QTLFIIVDHH A---------
           DDEVADVALA PRKRILSGVQ PTGRPTLGNY LGAMKNWVAL QNYFCVVDLH AITVPHDPVE
           GDTVAAVAIL PRKRVLSGVQ PTGALHLGNY LGAMRQWTAN QNFFFVVDLH AVTTPHDRKT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TDKVSKISII NRKRVLSGVQ PTGNLHLGNY LGAIRQWVKN QNYFCVVDLH AITAPHVPSE
           DDALKSANLL PALRVLSGVQ PTGSIHLGNY FGAIKNYVKL QAFYCVVDLH AITAGHDPTA
           ADDVVTVTSL PKLRVLSGGQ PTGSLHLGNY LGAIAQWTAA QSRFCIVDLH AITVPHDAKT
           DDKVKSVSVV ARKRVVSGVQ PTGTIHLGNY LGAIKNWIEL QTYFFVVDLH AITLPHVPEE

           ---ATTDTAA LYLACGIDVS KASVFVQSHV PAWLLCSSTP IGWLQKMIQF KEKSRKASVG
           LRAATRSMAA TYIAAGIDPE RATIFVQSHV PAWLLSCVTP LGWLGRMIQF KEKSRKVRTG
           LSDTTLSSAA MYIAAGIDPK KSRIFVQSHV RAWLLNCSTP MGWVERMIQY KEKARRVSVG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LQKSSLDIAA LYLASGIDPA KSKVFIQSHV PAWLLNCVTP MNWMEKMIQY KEKAKKVSIG
           LEASTRTSAA IYLAAGVSPE KANVFVQSHV PAWLLNCAAP IGWLEKMIQF KEKARKVSVG
           LSADTIDAAA TYLACGIDPA KASIFVQSHV RAWLLNCITP VGWLERMIQY KEKAVKVGVG
           LLKATKAAAA MYLACGVDPS KAAMFVQSHV KAWLLSCVTP ISWLNKMIQF KEKSRRVGTG

           LFTYPDLMTA DILLYQSDFV PVGEDQKQHI ELAREIARVN HLYLFKIPEP LIPQARVMSL
           LMTYPVLMAA DILLYQADLV PVGEDQKQHL ELTRDIAKFN NEFVFKVPEV FIPPARIMSL
           LFDYPVLMAA DVLLYQADLV PVGEDQRQHI ELARNIARYN DIYTFREPKA LMRTTRVMSL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LFDYPILMAA DILLYQAQLV PVGEDQRQHL ELARDIARFN DQYVFREPEA LIVKERVMSL
           LLDYPVLMAA DILLYKADLV PVGEDQRQHL ELTRDIARVN SLYVLMVPEA FTPKERVMSL
           LFGYPVLMAA DILLYQADLV PVGEDQRQHL ELARDIARFN DLYVMREPKA LILDARVMAL
           LLTYPLLMAS DILLYQTDLV PVGDDQRQHL ELTRDVARIN STYMFQVPEA LIPKTRIMSL

           TDGLSKMSKS APSDQSRINL LDSKDLIVDK IKRCKTDSFA GLEFDNAERP ECNNLLSIYQ
           QDGTAKMSKS AENDNTRINL TDTPDQIANK IKRCKTDAVD GLEWGHPDRP EATNLLTIYS
           EDGTSKMSKS DENDASRINL TDPPNVIRKK IKRCKTDSQE GLQFDDPQRP ECNNLLAIYQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QDGTSKMSKS DPSDLSRINL LDPPEVIGGR I--------- --EWDNPERP ECTNLLNIYQ
           TDGTAKMSKS NPAEGSRINV LDTPDEIAKK LKRCKTDAFE GLEFGNPERP EANNLLTMYQ
           DDGTSKMSKS APNDGSRINL VDSADVIARK VKRCKTDMGV GLTFSDPSRP ECRNLLTIYA
           TDGTSKMSKS AASDQSRINM LDTRDDIAYK IKRCKTDSLT GMEFDNPERP ECSNLLSVYQ

           IVSVMEECKD MSWGTFKPLL ADALIEHLSP IQARYQEIIA EPEYLDKILS EGADRAEELG
           LCTVLADVGG MRWGGFKPVL TEAVVEHLRP LQTKYGQLMS DVSYIDSVLA AGAEAAAATA
           IMAVQRECGD MRWGQFKPLL ADAVAEHISP IQDKYNELLQ DKSYLAS--- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SVTILSEVQH MQWGQFKPLL SEAVIAHLAP IQVKYKDLME DQTYLKQVLL DGANSADLIA
           LCTVLAECGS MRWGDFKPHL TDAVIAHLSP IQGRYKEIMD EPGYLEDVLK RGAENANEVA
           AVTVEAEVGG FRWGEFKPRL AEALIAHLSP IQARHAELSA EPGYLYDILR RGAEEANEAA
           LVSVEAECKD LTWGAFKILL TDALVEHLDP IQKSYTEVMS DESYLDQVLC DGAAKANAIA

           AVTMRNMYQA MGLDNLGPQP GSRKKQKRKG RGISAGQGAS CGFGMRGQKS RSGPGIMRGF
           DRTLADARDA MGLHNLSPEP GSRRDEKRKG RGYAAGQGGT CGFGNRGQKA RSGPSVRPGF
           --------RD MGLTNLRPAP GSRKRKKRKG RGHSAGQGGS CGFGMRGQKS RSGRGVRPGF
           ?????????? ??LGSLSPAK GSNRAAKRKG RGISAGQGAT CGF-MRGQKS RSGRSTRPGF
           GQTLSWTKNA MGLGKLAPAP GSRRAKTRKG RGIAAGQGAT CGFGMRGQKS RAGRPTRPGF
           NLTLRDVRDA MGLHNLSPLK GSRREKKRIG RGYGAGQGGS CGDGMRGQRA RSGPGVRPGF
           EVTLEGVKRR MGLSNLRPAP GSAHRKKRKG RGDAAGQGAS CGFGMRGQKS RSGRPTRAGF
           KRTLTDLYEA MGLHNLAPQP GSRHKNKRKG RGHSAGQGGS CGFGMRGQKS RAGPKVRPGF

           EGGQTALYRR LPKLRYLPVN IKDIFQEGDE VSLETLLTFK ARAFSTQAKE KLEASGC???
           EGGQTPLYRR LPKLRFVVVN LDDLFNAGED VTLAAVLNVH ATAFSESAKA AIEAAGGRLI
           EGGQTPLYRR IPKFVYALMK IEFLCEEGSV VTFEGLLTVK AHAFTTSAVD AIEGAGGRAR
           EGGQNPLYRR VPKLKHNELN VGDLLAPNTV VDMESLITVR AEAVSESARA KIEAAGGALT
           EGGQMPLYRR LPKLVYGLLK ISVLCEPNSE VSYESCLTVK AHAFTASAVR QIEEKGGRCN
           EGGQTPMYRR FPKLKFVTVN VGDLLDASAE ITIEALLKVK AASFSQSASE KLTAAGGALK
           EGGQTPLYRR LPKFVYALVK LGHLMAEGST VDVDVLLTVR AHAFTATARA AIEGAGG???
           EGGQMPLYRR LPKLKYVAVN IRDIFNDGEE VSLETLLSIK ARSFSASAKV KLEAAGCLVG

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LAYDGTDYCG WQLQTVQAKL EAAAGRTDSG VHARGQVVQF PVDKLAYKLN AVLPPDIRVM
           VAYDGTLYRG WQYQTVQGAL EDAASRTDTG VHARGQAMHF SERKFHYTLN QMLPPDVRVP
           AHMEGIVGLG GQRRTVEGVV LKAAGRTDAG VHALGQLVSF DHAAIRAAID ACCPGALRVT
           VMYDGTNYNG FQLQSIQGLL ETVAGRTDSG VHSRGQVVHF DLQKFQHGMN LMLPLDVKIC
           ISYDGERYNG FQYQTIQREL ERAAGRTDAG VHARGQVAHF DLTRCQKAMN GMLPKDIRVD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           IEYIGTRFSG WQRQTVQGTL EDASSRTDAG VHALRNVFHV PPDVIVRAVN HFLSADVQVV

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GVRRTFSVTC SPIGKYHYNI TNSEAHDPLR HRYAYHVRKP LDLGMRAAAA LLVGHDFTQF
           VLSVAWHAIY NAKGKYTYRI STSPVFDPLG RLYRYHTKFG FSELLREASA KFVGHDFSAF
           FVRETFHAVF SARWRYAYYV DAGAGL---- ---------- -DVLLDRMLG RLL-RDMTAF
           GLEHVWHAIY SARKKYSYRI FIGKVQDPIT RHSRHHEYRN VDLLLREVAA MFEGHDFSAF
           AFWEPFHSRF HASGKYHYYV DARATSSPFT RKYAHQGWRP CDVLLRQAAQ LFVGMDYKGF
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DARFVFHARF RAKERYYYRI LAGSCRSLFE RDRAWHVEEP LNLAMQSACQ VLLGHDFSSF

           ?????????? ?????????? ?????????? ?????????? ??MEKTIETL RTSFNSIRTG
           SNIEVEGNGF LYKMVRHISG VLVAVGERPP GIVGLTLHEV MYMKKCLAVV GDGFNTIRTG
           TNSEFVINGA MYRMIRNIMG TILSVSCGDI SNIGLCLEKV IYMGKTLDSV QSAFSTVRTG
           ARD------- ---AVRVLAS TAVREA--AG SDEGLRVMQX ??MKKTLD-V QGNFNSVRTG
           SNTDFELDGA LYKMVRNIVG TILAVGGTTF QWL??????? ??MKKTVENT REALATIRTG
           CNTEVEGDGF LYRQVRNMVG ALLVVASGDL AYLGLFLHEV FYMEKTMDAI ANDFSTVRTG
           ?????????? ?????????? ?????????? ?????????? ??MEKTLESV RNNFNTIRTG
           RASTARAQSF LYHQVRLMVG TLKGVGAGTV EDVGLFLADV KYMEKTIETV KSNFNTIRTG

           RSNAAMLDKI EVEYYGSPVS LKSIAQISTP DGSSLLLQPY DKSSLKAIEK AIVNSDLGVT
           RANPAILDKI TVDYFGAPTP LKQMGTVTVP DASTLMITPF DKTSLRDIER AIQESDIGIN
           RASTSMVDRV MVSYYDVETP LNQLASVSLS GTSTILVEPY DKSCMGDVER GIMESDVGIT
           RANVSLMDRI VVDYYGAPTP LKSLASVATP DASTIVVSVF DKGA------ AIQTSDLGLT
           RPSPNIFDKV LVDYYDVPTP LPQIASIQIQ SASMISIDPF EKSALKNIEK AIMASDLGLN
           RANAAVLDRI EVDYYGAPTP LKTIANASTP DAQTITIQPF DKSAIKDIER AINESDLGMN
           RAAPSILDRV MVDYYGAETP LQSLASISAT SSTTLTIDAF DKGCVKDIER ALMESDLGMM
           RASPALLDRV EVEYYGTLVL LKTIAQISTP DGSTILVQPF DRSSLSAIDK AITKSDLGLT

           PNNDGDVIRL SLPPLTSDRR KELSKVVAKQ SEEGKVALRN IRRDALKSYD KLEKEKKLSE
           PNNDGERIRL IMPPMTQERR KDLAKQVSKM AEDGKVAVRN VRKDALKKVD KVE----LPK
           PNNDGSCIRL SVPPLTEDRR KELVKQVKGL AEEGRVALRN IRRDAVDSLK KLEKKKELGK
           PNTDGSTIRL SVPPLTTERR KELAKTVKKL AEDGKARPAP L????????? ??????????
           PNNDGAIIRI SIPPLTAETR QNYVKQAKNV AEEGKVALRN IRRTGVDAVK KLEKDSVVSE
           PSNDGNIIRL NVPPLTAERR KELAKLVSKL GEDGKVALRN VRRDAMKAYE KLEKAGSFGE
           PNSDGVVIRL TVPQLTKERR KELSKQAKAL AEDGRVACRN VRRDVIDKVK KQEKAAELGK
           PSNDGIVIRL NIPQLTAERR KELLKLVAKL TEEGKVALRN VRRDAIKSYE KLEKEKKIST

           DNVKDLSSDL QKLIDVYMKK IEELYKQKEK ELMKVVESPV VVITGASRGI GKAIALALGK
           DDKKALEDDI QKLTDTYVKK VEDAAKAKTE EVMKLAERPV CLVTGASRGI GKAIALALGK
           DESKTLQSEV QKITDKHVKR IDELLKQKEA DILKVDDAKV AVVTGSSRGI GRAIAEALGA
           ?????????? ?????????? ?????????? ?????AHAPV ALVTGGSRGI GRAVCLALAS
           DQSKSTQDDI QKLTDSSSKE IDNLCAAKEK DLSTV????? ?????????? ??????????
           DEIAKLKKSM EDLTASYVKK VDELTKAKET ELQKVASGPV CVVTGASRGI GAAIALALGQ
           DMSKDLQDKI SKLTDKYVGM IDKAFEEKEK DIMKVGEADM VVTQGETRRQ FEVLARRLAR
           DNVKDLSTEM QRLTDEYVKT VDDLFKQKEK ----VVEAPV SVVTGASRGI GKAIALALGA

           AGCKVLVNSA KEAEEVAKQI EEYGGQAITF GGDVSKATDV DAMMKTALDK WGTIDVVVNN
           QGARVAINSA GAAEEVAAAV VAAGGEAMVV GANVGKREEI DRMFKEVMDK WGRVDVLVNN
           AGCKVVINSA EAAEDAVAKV KQLGGDAVAI RGNMSDPDQV ANLFKGAVDA FGRVDVLVNN
           AGWRVVVNSE RGALEVVERV GA--ASAAAI RANVGSESDV RALFAETRDR FGRLDALVNS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QGARVVVNSE GPANEVCEKI KAAGGDAIAV KANVAVPEDV DALFKATMDK FGEVNVLVNN
           TLGKVARNLF GVTVAILQSV RPLFGE---- --DEDAERDV GALFAAAIDA YGRVDVLVNN
           AGGKVLVNSS KEAEDVASQI EELGGSALVY GGDVSKEEDV EALFKAVIDK WGTIDILVNN

           AGITRDTLLI RMKQSQWDEV IALNLTGVFL CTQAAVKIMM KKKRGRIINI SSVVGLIGNI
           AGITRDTLMM RMKPEMWDDV IATNLSGVFY CTQNATKIMG KQKKGRIINI TSVVGIVGNA
           AGITRDGLLL RMKPSQWQEV IDLNLTGVFM CTQAAAKLML KQRSGRIVNI ASVVGLIGNA
           AGIRRDGLLL RTSAAAWQDV VDVNLRGAFL CTKAAAEIM- --RSGRIVNI CSVVGMRGNA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AGITRDTLMM RMKLQQWQEV IDLNLTGVFL CTQAATKAMG KKKSGRIINI TSVVGVTGNA
           AGITRDTLLM RMKQTQWQEV IDLNLTGVFL CTQAAAKLMI KARSGRIVNI SSVVGQIGNP
           AGITRDTLLM RMKKSQWDEV INLNLSGVFL CTQAATKVMM KKKKGRIINI SSVVGVTGNA

           GQANYAAAKG GVISFSKTAA REGASRNINV NVVCPGFIAS DMTILGTIPL GRYGKAEEVA
           GQANYSAAKA GVIGLTKTTA REYSGRTITC NAVAPGFIAS DMTILKGIPL GRYGQPEEVA
           GQVNYGAAKA GVIGLTMSAA RECAPRGVTV NAVAPGFINS DMTIAEMIPM KRLGEPEEVA
           GQAAYAASKA GLIGLTKTTA LELASRGILA NAVAPGYVDT DMTLQLSIPL GRFGTAEEVA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GQANYSAAKA GVIGLTKTVA REYAGRNIQC NAIAPGFIAS DMTILTTIPA GRYGQPEEIA
           GQVNYAAAKG GVIGLTMATA KEVASRGVTV NAVAPGFIAS DMTIKAMIPL GRLGEASEVA
           GQANYSAAKA GVIGFTKTVA REYAGRSITA NAIAPGFIAS DMTILQTIPL GRYGQPEEVA

           GLVEFLALSP AASYITGQAF TIDGGIAIIS GLIKLPGSKS LSNRILLLAA LSGTTVVDNL
           GLVRFLALDP AAAYITGQVY NVDGGMVMIA GTVKLPGSKS LSNRILLLAA LSGTTLVKNL
           GLVKYLALDP SSAYITGHTF SVDGGIAILR GVIDLPGSKS LSNRVLLLAA LAGRTTIRNL
           GL-------- --------TF VIDGGLCTVN GVLDLPGSKS LSNRILLLSA LSGTTMVENL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GLVKFLAMDP AAAYITGQTL HVDGGMVMIE GTVRLPGSKS LSNRILLLAA LAGTTKVENL
           GLVRFLATDP AAAYMTGHTF NVDGGIAIFY GTVTLPGSKS LSNRVLLLAA LCGETVIRNL
           GLVKFLALDP AAAYITGQVF NIDGGMVMIS GTVKLPGSKS LSNRTLLLAA LAGTTFVENL

           LNSDDINYML DALKILGLNV VEGCG-GVFS DIELYLGNAG TAMRPLTAAV TYVLDGVPRM
           LDSDDIRYMV GALKALNVKL VHGCG-GRFA GAELFLGNAG TAMRPLTAAV VFVLDGVARM
           LVSDDIRYMQ EALKALSVSY VDGCA-GAWQ TAELFLGNAG TAMRPLTAAL CFVLDGTPRM
           LDSDDVRMMV GALHTMKIPL VTGCG-GKWE GAELFLGNAG TAMRPLTAAV CFVLDGIQRM
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LDSDDIRYMV DALKVLGLSF ITGCG-GKLE GAELFLGNAG TAMRPLTAAV AFILDGVERM
           LVSDDITYMK NALSGLGVPL VQGQG-GEWA SATLFLGNAG TAMRPLTAAL AYILDGTPRM
           LDSDDVRYMV AALKTLGLDV VVGCG-GKFE GIELFLGNAG TAMRPLTAAV AYILDGVPRM

           RERPIGDLVV GLKQLGADVE CTPPVRVLPG GKVKLSISSQ YLTALLMAAP IEIVDKLISV
           RERPIEDLVD GLVQLGVDAK CTPPVEVLPT GKVYLSVSSQ YLTALLMAAP IIIKDELVSQ
           RERPINDLID ALQQLGADVE CSPPVRILPG GVARVSISSQ YLSALLIAAP IRITDELVSV
           RERPIIDLVD GLQQLGVKIS CSPPVVVLPG GETRLSISSQ FLSAILMAAP IVIKDKLVSV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RERPIQDLVD GLVQLGVKAE CTPPVKVLPG GRVELSVSSQ YLTALLMAAP IVIVDELISK
           RERPISDLID ALRGLGAHVT CSPPVVVLPG GTTRVSISSQ YLSALLMAAP IEVTDELISK
           RERPIGDLVD GLKQLGADVE CNPPVTVLPG GNIKLSVSSQ YLTALLLSAP IEIVDKLISV

           PYTLKLMERF GVAYVEGDAS SASYFLAGTG ETVTVEGCGT TSLQGDFAEV LEKMGCVSWT
           PYTVKLMERF GVAYVEGDAS SASYFLAGTG GTVTVEGCGS DSLQGDFAEV MGLLGAVEWS
           PYTINLMNKF GVYFVEGDAS SASYFLAGTG GPVTVRGCGS ESVQGDFARI MGLMGAVEWE
           PYTVRLMERF GVAFVEGDAS SASYFLSLTG GSVTLKGCGT ESLQGDYAKV MEMMGAVEWT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PYTITLMERF GVAFVEGDAS SASYFLAGTG GTVTVIGCGS ESIQGDFAYT MEQMGALEWG
           PYTVKLMKQF GVAFVEGDAS SASYFLAGTG GNVTVVGCGS DSLQGDFASV LEKMGAVTWT
           PYTLKLMERF GVAYVEGDAS SASYFLAGTG GTVKVEGCGT TSLQGDFAKV LEKMGAVEWT

           ESVTVTGPSR DAF-VNMNKM P---DVAMTL AVVALFADGP TTIRDVASWR VKETERMIAI
           PSITITGPSA ----HDCNDI P---DAAMTL AVAALFADRP TAIRNVYNWR VKETERMVAI
           ASITVSREP- ----VDCVDI P---DAAMSL ATTALFAEGP TAIRNVYNWR VKETERMKAI
           PSVALTG--- ----IDMNAM P----AAMSL AVVALFAKGR TAIRNIYNWR VKETERMVAV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PSVTCTGP-- ----VNMNAM P---DAAMTL AVAALFADGI TTIRDVASWR VKETERMIAI
           PSITVRRSR- ----EDCGDI P---DAAMTL AVAALFAQGR TTIRNVYNWR VKETERMKAI
           ESVTVTGPPV SAK-VNMNAM P---DVAMTL AVVALYADGP TAIRDVASWR VKETERMIAI

           CTELATVEEG SDYCVITPAE IDTYDDHRMA MAFSLAACA- VPITINDPGC TRKTFPDYFQ
           VTELAEVEEG RDYCIVTPVG IDTYDDHRMA MAFSLVAAA- VPVVIRDPGC TRKTFPTYFK
           VTELAEVEEG RDYCVIHPVP IDTYDDHRMA MAFSLVACG- VPVVIRDPKC TTKTFPTYFD
           ATELATVEEG EDYIVIDPAA IDTYDDHRMA MAFSLAACG- AEA??????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           CTELCDVFEG ADYCVITPVD IDTYDDHRMA MAFALAACG- VDVVINDPKC TKKTFPTYFD
           TTELAVVEEG SDSCVITPVA VETYDDHRMA MAFALAACG- VGVDICDPGC TTKTFPAYFD
           CTELATVEEG PDYCIITPAA IDTYDDHRMA MAFSLAACG- TPITINDPSC VRKTFPTYFD

           VLSRTELCGE LSVNDVGKRV HLCGWVALHR VHGGLTFLNL RDHTGIVQVR TLPDEFPEAH
           VFSRSHGCGA VTTADIGSKV TICGWVDRNR DMGGVQFFDV RDHSGLLQVI CEPQSAPEVS
           ELLRSHTCGQ LRASHVGEQV RLHGWAHAVR DRGGVLFVLL RDRYGVVQVT IGDQSPKEAV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VLSRDRLAGT LRDGDVGAEA TLCGWIDKSR DMGGIAFADV RDHSGIAQIV ADEDASAEVR
           QL???????? ?????????? ?????????? ?????????? ?????????? ??????????
           VF-------- ---------V QASSWI---- ----VIF--- ---------- -----PFLIS

           GLINDMRLEY VVLVEGTVRS RPNESVNKKM KTGVEVVAEH VEILNPVRTK LPFLVTEEIR
           RTASRLRNEY VVCVKGVLRA R--KDPNPKI PTGLEVLAES VDILNVVTRS LPFPISEDTR
           ETGKNIRLEY VVGVEGTVTR RDAAVVNLEM KTGIEIVATD VKIVSR-TKP MPFMIADDTR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ETFGNLRQEC VVRARGTVRA R--KSVNKKT KTGVELVVTE LKILNSVGKS LPFAVSEETR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KLHARLRIEY VVAVEGTVRS RPQGAANTNL KTGVEIIADK VEVLNPVTLN LPFLVTEEVR

           LRFRCLDLRR QQMKNNIVLR HNVVKLIRRY LEDRHGFIEI ETPILSRSTP EGARDYLVPS
           LKNRVLDLRR PKMAANLRLR HKLLRLIRTF LEDRHGFMEV ETPILTRSTP EGARDYLVPS
           LKYRYLDLRK PTLQENLLLR HRATMATRNF L-DASGFIEV ETPILTKATP EGARDYLVPS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LEHRVLDLRR PQMARNLKLR HDTLRALRKV MEDDYGFLEV ETPMLTRSTP EGARDYLVPS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LRYRHLDLRR PQLNANLRLR HRIVKLMRRY LEDVHGFVEV ETPILSRSTP EGARDYLVPS

           RIQSGTFYAL PQSPQLFKQM LMVSGFDKYY QIARCFRDED LRADRQPEFT QLDMEMAFMP
           RVQPGEWYAL PQSPQLFKQM LMVAGMDRYY QIARCFRDED LRADRQPEFT QLDIEVSFMD
           RVHPGSWYAL PQSPQIYKQL LMVSGFDRYF QITRCFRDED LRQDRQPEFT QIDLEMSFVE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RLQPGGAYAL PQSPQLFKQM LMVAGVDRYY QVARCFRDED LRADRQPEFT QLDIEMAFTD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RVQPATFYAL PQSPQLFKQM LMVSGFDRYF QFARCFRDED LRADRQPEFT QLDMELAFTP

           MEDMLKLNED LIRKVFSEIK GIPFPRLTYA DAMDRYGSDR PDTRFDLELK DVSNFRVFTE
           DKALQSLMEE LVLQVFDQIL GVPFRRISYA EAMDKYGSDK PDLRYGLEFV DVSPFKVFAG
           RESVLEVAEG IVKCMFAKVL GKEIPRIPYK EAMDRFGVDA PDMRFGMELK DITDFSPIKK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DAGIMKLAED LMRAAFKSGV DVSFPQMTYA HAMEKYGSDK PDLRYGLEMT TLDDFKIFAD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LEDMLELNED LIRLVFREIK GVPFPRLTYA EAMSKYGSDK PDTRFGMQLV ELSDFAPFAT

           ALGGIIKVLC VPLGAKKYSN SALK-KGDIY NEAMKSGAKG LPFLKVGIAA LVAGKINFVK
           AVGGVVKAIR VPDG-KRISN TRIKPKGDIA NEAVAAGAAG LASIRVAAKA IKEQAAQLMA
           ALKGMVKAMV ITGA---AKA SSRKVLDGYT AFVKSYGLSG LLYAKV--GP LSGFEDFVAS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ALNGTVKALV VDDD-KKIPN SKLKPKGDVF NEALAAGAGG LAFARVGAKG LVAHAAAMIS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AIGGVVKAIT VCGGGKSITA TRLK-KGDIY QEAVRCGAKG LPFLKVGSTA LKETRDNFLA

           QCGAAPGDLI LFGVGPVTSV NKTLDSILWV TDFPMFEWNE PEQRLEALHH PFTAPKPEDL
           ATGAQPGDLL LLAAGPRDTV HRALDSLLWV VDFPMFEFNP EEGRYQAIHH PFTAPRPDDY
           ALNARLGDVI LVACGTPAAV NAGLGAFCWV VDFPLFEFDE GAGRYVSVHH PFTSPLPSQI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ASGAKPGDLM LFAAGNKALV NKTLDAVLWI TEFPMFEFNE DENRYEAMHH PFTAPNQDDL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KCDAKPGDVI IFANGPTSLV NATLGDILWI TDFPMFEWND AEKRLEALHH PFTAPRPEDL

           PSARALAYDM VYNGVEIGGG SLRIYKRDVQ EKVLEIIGIS PEEAESKFGY LLEALDMGAP
           VNARALAYDL VYNGVEIGGG SLRIYRRDIQ QKVFELIGLT PAEAQSKFGY LLDCFEYGAP
           GDIMSDAYDL VCNGSEIGGG SIRIHNPEVQ QNIFKVLGIS EAEQTEKFGF LLDALSFGAP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TGARAIAYDL VYNGVEIGGG SLRIYRRDVQ EKVFRAIGLS DEEAENKFGY LMEAFQYGAP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SSARALAYDM VYNGVEIGGG SLRIHRRDVQ QKVLEASGLS AQEAEDKFGY LLEALELGAP

           PHGGIAYGLD RMVMMLGGAS SIRDVIAFPK TTTAQCALTR TPSEVDPKQL QDLSIRTKID
           PHGGLAFGLD RLAMLLAGAP SIRDVIAFPK TTQAQCALTG APAAVADKQL VELSIASTVD
           PHGGLALGLE RCIMIMAKAD SIRDVVAFPK TTSASDLMAG APAPVSSEQL EELSVESTID
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ????????LN
           PHGGLAFGLD RLVMMLAGAK SIRDVIAFPK TAAGQCLLTE APGQVSDAQY ADLHVRSVVD
           ?????????? ?????????? ?????????? ?????????? ?????????? ????????VD
           PHGGIAYGVD RLVMLLAGEK SIRDVIAFPK TTAAHCSLTR TPSTVDPRQL QELRLQCTID

           LRGKRAFIAG IADDNGYGWA IAKSLAAAGA EILTWVPAGK FDQ-NPEDVG SIDILVHSL-
           LRGKKAFIAG VADDQGFGWA IAKALAEAGA EISVWVPAGK FDE-TMADVG NIDILVHSL-
           LRGKKALVTG IANNRSIAWG IAQQLHAAGA EIGAFLPMDK VEAKVPCDVG GIDIFVHCLA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LQGKVAFVAG IADANGYGWA ISRQLCNAGA SVLTWPPAG- FGD-EPEEIG KIDILVHAV-
           LRGKKAFVAG VADDNGFGWA ISKALSEAGA EVITWVPAGK FDE-AMDDVG KIDVLVHSL-
           LRGKKALVTG IANNRSIAWG VAQQLSAAGA DVGAYLPLDK VTAKVPCDVG GVDVIIHCLA
           LTGKRAFIAG VADDQGYGWA IAKTLASAGA EILTWVPAGK FDE-CPEDVG SIDILVHSL-

           -ANGPEVKPL LETSRKGYLA AISASSYSFV SLLRHFGASI SLTYIASERI IPGYGGMSSA
           -ANGPEVKPL LEVSRKGYLA ALSASSYSLI SMVQRFGAVI SLTYNASNRI IPGYGGMSSA
           FADRSDLGNF SATKKAGFEK ALDISAYSLI EMTGALASVV TMSYIGSSRV VPNYNVMGVA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           -ANAPEVKPL IDTSREGYLA AVSASSYSWV SMVRHFGSCL SLSFIASERV IPGYGGMSSA
           -ANGPEVKPL LETSRKGYLA AISASSYSNV SMIQHFGAAI SLTYLASEQI IPGYGGMSSA
           FANREDLGDF SATSAAGFST ALNISAFSLV EMCGTLASVV TLSYLGATKV VPNYNVMGVA
           -ANGPEVKPL LETSRKGYLA ASSASAYSHV SLLRHFGSVI SLTYMASEKT IPGYGGMSSA

           KAALESDTRV LAYEAGRIRV NTISAGPLGS RAAKAIGFID TMIEYSYNNG PIQKTLTADE
           KAALESDTRV LAYEAGRVRV NTISAGPLGS RAAKAIGFID DMIRYSYENS PIQKELAAIE
           KAALEASVRY LASELGPVRV NAVSAGPIRT LASSAIGGIQ TMIKHVESSA PLRRTVTQIE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KAQLESDTRV LAYEAGRIRV NSISAGPLLS RAASAIEFIH SYIKFHEEHS PLQRKMDADD
           KAALESDTRV LAYEAGRIRV NTISAGPLGS RAAKAIGFID KMINYSLSNA PLEKPLEAIE
           KAALEASVRY LASELGPVRV NAISAGPIRT LASSAIAGFV GMLKQIEAVA PLRRTVKQKE
           KAALESDTRV LAFEAGRIRV NTISAGPLKS RAAKAIGFIE KMIDYSKANS PLQRDLEADD

           VGNAAAFLAS PLASAITGAT IYVDNGL--- --RVLVVTND RVAYLDKTID ALTRGNVTVE
           VGNVAAFLCS PLSSAVTGHV MFVDNGLVEV DLRVLIVTNE TIAYLERVRA ALLEGGLQVD
           VGNAASFLLS SAGSGITGQV LYVDGGYLHV DAKALVVTNT TVAYLDRVTA ALAAAGVAVF
           ?????????? ?????????? ???????LTV GLTCLIVTNT TVGYLQKVVD TLRADGLKVE
           VGRAALALCS DLSTAVTGVC LHVDNGM--- --AYILIADE NVFYGEKFIQ KFSKTGKTLH
           IGNTAAFLCS PLASGITGAT IYVDNGLVNV DLTALVVTNE TIAYLDRTVK ALTAKDLRVE
           VGTTAAFLAS DASSGITGQV IFVDCGYLTV AAKCLVVTNT TVGYAEQVVA ALTALGKTVS
           IGNAATFLAS PLASAISGTV FYVDNGLVDV DLNVLVVTNT TVAYLEKVVG LLKANGINVE

           SVILPDGEKY KDMDTLMKVF DKAIESRLDR RCTFVALGGG VIGDMCGYAA ASYLRGVNFI
           EVVLPDGEEY KSMEVLGKVW DKALESRMDR GVTFLALGGG VVGDMTGFAA SCYQRGVHFV
           VEVLPDGEEF KSLEYAAKIW DACMRHRLDR KSTLVALGGG VIGDITGFAA AAFVRGVPFI
           TVELPDGEEY KTLQVLDQIF TACLEKRLDR RTTLVALGGG VVGDMTGFAA AAYQRGVKFI
           VKVLPSGETT KDRKVKEEVE DYMLEMKMNR DSCCIAMGGG VIGDLTGYIA ATYMRGVPFV
           TVVLPDGEEH KNLEVLNAVY TRALETRLDR GTTFVALGGG VIGDMTGYAA ASYQRGVKFV
           VLELPDGEEY KDMQRLNTIL DRAMELRLDR KSTLLALGGG VVGDITGFAA AVYVRGVPFV
           SVILPDGEKY KDMGTLMKVF DKAVETRMDR RCTFVALGGG VIGDMCGFAA AAFLRGVNFI

           QIPTTVMAQV DSSVGGKTGI NHRLGKNLIG AFYQPQCVLV DTDTLNTLPD REMASGLAEV
           QVPTTVMAQV DSSVGGKTGV NHPLGKNMIG AFYQPRVVLV DTDTLATLPD RELASGISEV
           QVPTTLLAVV DSSVGGKTAV NHPMGKNMIG AFYQPHAVVV DTDVLATLDD RQLAAGIAEV
           QVPTTLLAMV DSSVGGKTGV NHPLGKNMIG AFHQPQC--- ---------- ---------V
           QIPTTLLAMV DASVGGKTAV NTPMGKNLIG AFHQPVVVYM DMAFLDGFAE REFRAGIAEI
           QIPTTVMAMV DSSVGGKTGV NHALGKNMIG AFYQPECVLI DIDSLKTLPD REFASGIAEV
           QLPTTLLAVV DSAVGGKTAV NHPLGKNMIG AFYQPRAVLV DATVLATLDD RQLAAGIAEV
           QIPTTLMAQV DSSVGGKTGV NHPLGKNLIG AFYQPQCVVI DTDTLSTLPE RELCSGIAEV

           IKYGDAEFFE WQELAFAIKR SCENKADVVS QDEKEGLRAT LNLGHTGHAI ETGFGYHGEA
           IKYGDAPFFE WLEIAYAVER SCINKAEVVA ADEREGVRAT LNLGHTGHAI ETGTGYHGEA
           VKYGDWQFFE WCELRYAMVQ SCKHKADIVA ADEREGVRAT LNLGHTGHAI EACMGYHGEA
           IKYSDLPFLD WLELAYAVER SCRRKAEIVE ADETEGMRAL ---PRRPDAG GAGMGYHGEA
           IKTGDASLFE VCELNEIVRR SVAIKAEVVT LDPKEGLRAI LNWGHTGHAV EGLCGMHGEC
           VKYGDGPFFE WLEIAYAVER SCVNKAEVVA ADEREGVRAT LNLGHTGHAI ETGLGYHGEA
           VKYGDLPLLD WLELEHAMLA SCANKAAVVA ADEREGVRAT LNLGHTGHAI EAAMGYHGEA
           VKYGDAKFFE WQELAYAIKR SCENKAEVVS LDEKEGLRAT LNLGHTGHAI ETGIGYHGEA

           VAAGTVMARV NKILVRAKLP TTPPMAVDKK VADGLLRLIL LKLGNCVFYD REALDATLMR
           VAAGTVMARI VALMQRARLP ILPPMAVDKK VLAGKLRLIL LRLGNCVVFD PAKLEETLMR
           VAAGMVMARV ERVFARASLP IRPPISVDKK VEAGVLRLIL LEPGKAVLFP ESVLFDTIWM
           VAAGMCMARA TAIVERARLP TRPPMSVDKK VADGQLSLVL MRLGESVLYT QEQLVATLHM
           VAIGMVLERI IRCIQAYNLP IKIPMMGDKK NTGGKLKCVL LDIGHCYEVD VELVRMVC--
           VSAGMCMART IALLNKCKTP IDVPMAVDKK AANGKLRLIL LKLGECVFFD QSKLQETLMR
           VAAGMVMARV EALLARAGLP VRPPMSVDKK VESGVLKLVL LRVGDAVVYD KEVLYDTIWL
           VAAGTVMARI LNLLKRAKVP VAPPMAVDKK VVDGDLRLIL LKLGNCVFYD TKALEETLMR

           CFDRAKIYVR AGDGGNGVVA FRREKFVPFG GPSGGDGGRG GNVYVEVDGS MNSLLPFRKS
           CFDTARIYLK GGDGGNGCVA FRREKFVEHG GPSGGNGGRG GNVWAVVDPN LNSLSVFRGQ
           FYDVARVLVK GGTGGDGCLA FRREKGIPKG GPAGGSGGSG GSVNFVATGG ANTLAKFRGG
           FFDRSYINVK GGDGGNGCVA FLRLRETAR- ---GGTGGKG GDVIFEVDPG LNTLLKFRGQ
           --DVNRVFVK GGDGGNGEVA FRREAHVDMG GPFGGNGGNG GDVIFVADEG DNTLAHVRSC
           CFDTAKIYVK AGDGGDGQVA FRREKFVPQG GPSGGNGGIG GAVYIVADKN MNSLDGFRKK
           FSDVAKINVT AGDGGNGVMA FRREKGVPKG GPFGGSGGLG GHVHLVADKG LNTLARFRGR
           CFDRAKIYVK AGDGGNGEVA FRREKYIPHG GPSGGNGGRG GNIYIEVDPS LNSLLCFRKS

           VHFRAGRGEH GRGKMQSGAK GDNVVVKVAP GTELLHPGQR ALLLPGGRGG RGNASFKSGM
           VHFRAEGGVN GQGSNCEGAD AEDLIVPVPA GTELLKPGEK ALLAVGGRGG RGNFSFKTSR
           AAFRAVDGLN GTGKGRTGHC AKDMTVAVPL GTDLSEEGQT FRAATGGRGG RGNEAFKTER
           VHFRATSGKN GQGKHKAGSY GIDRIVRVPP GTDLSGDRTR AVVARGGRGG RGNAAFKSTR
           LHIVAECGRR GQGKGKDSPA APDTEIRVPL GTDLRTPGQK LVVARGGLGG RGNLAMRTER
           VHHRAEAGKR GLGSKCAGRN GRDLEILVPP GTEITKAEQR VMVLAGGRGG RGNASFKTAK
           VHFRAEGGNN GLGKGKHGAG GRDTTVLVPV GTDLSDHGSS VRVARGGRGG RGNMAFKTDR
           VHFRAGRGSH GLGKSQDGAF GDDCVVKVPP GTEMTKAGHR ELLLPGGRGG RGNAAFKSAK

           NKVPRIAENG EEGPEMWLDL ELKLVADVGI VGAPNAGKST LLSVISAAQP TIANYPFTTL
           DRAPTIAEKG EKGEELWVDL ELKVVADAGI IGVPNAGKST LLSVITAARP KIANYPFTTL
           NRAPRVCEQG EPGVERWLQM ELKLVADVAL VGFPNAGKST VLDAVSNARP KIADYPFTTI
           NVAPRLAEKG EPGEERWLNL ELKLIADVGL VGVPNAGKST LLAALTAAKP KIADYPFTTI
           DRCPGFAELG EKATPRWVDL QLKMIADIGI VGMPNAGKSS LLASITNAKP KIADYPFTTI
           NKAPMIAELG EKGREFWAEM ELKLVADVGI IGIPNAGKST LLASVSAAKP KIADYPFTTI
           NRAPRMCERG EPGVSRWLKL ELKLVADAGL VGVPNAGKST LLSRVSAARP KIADYPFTTV
           NKTPQLAERG EQGAEMWVDL ELKLVADVGI IGVPNAGKST LLSAISAARP AIAAYPFTTL

           LPNLGVVDST MVVADLPGLL EGAHRGFGLG HEFLRHTERC SALVHVVDQP ELEFEAVRLE
           VPNLGVCYST TVFADVPGLL EGAHEGLGLG HEFLRHVQRC RVLVHVVDDP VGDFNAINLE
           VPNLGVVIEG MVIADVPGII EGAHRGVGMG VSFLRHVERC KVVVHIVDDI IQRYKAIRLE
           TPNLGVAGDT AVLVDVPGLL EGAHDGVGMG VQFL-HVERC RLILHLINDP LGDFDAIRTE
           VPNLGVCRRS IVLADIPGLI EGAHNGIGLG QAFLRHVERC RILLHVIDDP IKNFNCIQNE
           VPNLGVVYER MVFADIPGLL EGASEGIGLG FEFLRHTKRT RVLIHVIDTC FEAYDAIRTE
           VPQLGVVSRS MVLVDIPGLL EGAHSGVGMG TAFLRHIERC RAIVHVVDDP VGDYQAICSE
           LPNLGVVDAT MVIADLPGLL EGAHAGYGLG HEFLRHTERC RVLIHVIDQP EFEYDAVRLE

           LELFSPEIPY VVAYNKMDMS AVQREGTVYE LLVRVRFAPS PTGLHVGGAR TALFNYLFAR
           LELFNPDLPQ LVAYNKVDIS AATGQGVVRG VLVRVRFAPS PTGLHVGGAR TALFNWLYAR
           MELFDERLKE VVLVNKVDVS AKSREGLLSV LVVRVRFAPS PTGLHVGGAR TALYNWLLAR
           LALFNPRIPP PPAWGRAGVS SATGDGLVSR VL???????? ?????????? ??????????
           LKLFSPKLPQ VILINKMDIS AATSTNILRS ML???????? ?????????? ??????????
           LELFDEALPE IVALNKVDVS AVTGEGVVQA ALVRVRFAPS PTGLHVGGAR TALFNYLYAK
           LELFNPRLPS VVLLNKMDVS AVSGEGLLTD LVTRVRFAPS PTGLHVGGAR TALFNYLLAQ
           LELFDPRLPS IVAFNKMDMS AATMEGTAYK LLVRVRFAPS PTGLHVGGAR TALFNYLFTK

           GKFVLRIEDT DLERSTRESE AAVLQDLSWL GLDWDEGPYR QSERYKQYAE KLLESGHVYR
           GKFILRVEDT DTARSTRASE EAMVRDLKWL GLDWDEGPYR QSERYKEMAD KLVAEGKAYP
           GAFLVRVEDT DVVRSTRESE DMVLEDLTWL GLHWDEGPYR QSERYVELAD KLVREGKAYP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GKFVLRVEDT DQARSTRASE DSMVADLKWL GLDWDEGPYR QSERYKALAE KLVASGHVYP
           GAFIVRVEDT DVARSTRESE AEVLADLRWL GLEWDEGPYR QSERYKKLAA RLVEEGKAYP
           GKFILRIEDT DIERSTKESE NAMLQDLEWL GLDWDEGPYR QSERYQNYAQ KLLESGHVYK

           CFCSSEELVK MKENAKLKQL PPVYTGKASD AEIEQELEKG TPFTYRFRVL KINDLIRGWN
           CFCTDEELEA MKKDAEEKKL PPIYRGKATA AEVEAAKAQG LPYCYRFRVV KIHDLIRGWN
           CFCTEEELDR KREEAEREGR PPQYDGTADP EEVKKRIDNG EQYTVRFKVV IIDDAVRGWD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           CFCTDEELEA MKAEAEEKKL PPKYMGKASE AEVKEMMDKG VPFTYRFRVI EIDDMVRGWD
           CFCTEEELDA KRLAAEADGR PPQYDGTADA EVVAAKVAAG EPYTTRFRVV VIDDAVRGWD
           CFCSDEELAR MKELAELKKL PPRYTGKASK QEVDAEIARG TPYTYRFRVV TINDLIRGWK

           LD-TLGDFVV MRGQPVYNFC VTVDDATMAI SHVIRAEEHL PNTLRQALIY KALKFPMPQF
           TD-TLGDFVL LRGMPVYNFC VAVDDALMGI THVLRAEEHL PNTLRQMLIY QALGFPVPTF
           ADSTVGDFII LRGVPVYNFC VAVDDALMGV STVLRAEEHL TNTLRQVLIL RALDFETPEY
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TN-TLGDFVV LRGMPVYNFC VAVDDATMGI THVLRAEEHL PNTLRQALVY NALGFPLPTF
           ANATVGDFIL TRGVPVYNFC VAVDDATMGV STVVRAEEHL TNTLRQVLIL EALGFSPPAY
           HD-VLGDFVI LRGQPVYNFC VAIDDACMKI THVIRAEEHL SNTLRQVLIY KALNLPVPRF

           AHVSLILAPD RSKRHGVGQY REMGYLPQGM VNYLALLGWT LEDLVEKFSI ERVNKSGAIF
           GHVSLILAPD KSKRHGVGEF RTQGYLAPAM INFLSLLGWS VEELTTKFSL DRITKSAAVF
           AHCSLILGSD RSKRHGVTLF REEGYLPVAM INYLAMLGWT VEELIEVFDI HRITKSPAMF
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AHMSLILAPD RSKRHGVGQF KDEGYLSKTM VNYLSLLGWE KAELEKLFSV ERINKSPAVF
           AHVSLILGED RSKRHGVSQF REEGYLPEAM TNYLALLGWT LPELIDAFDL SRVTKSPAVF
           GHVSLILAPD RSKRHGVGQF REMGYLPDAM VNYLALLGWT KDELMEKFSL ERITKSAAIF

           DSTKLRWMNG QHFVNEAVEL LKDGIELVTD SDKVLLNLLK LHEVARKGKS LFMPLRVLLT
           DKVKLGWMNG QHFAKAAVKL VSKSMELVTD VEPEVRKLLG FAEVARKGKK LFMPARVAIT
           DGDKLRYING QHLAQAAVAL VRGSLELVND ANEEMQKAFG FNEVARKGKR LFHPLRLALT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DKVKLNWMNG QHTVQAIIPL IKESIELVED AVPQVQAMFD FEPIVRKGKR LFMPFRIALT
           DGDKLRWMNG QYAVAEATSL VRGSLELVGD AVPELDAALG FDEVARKGAR IFHPLRLALT
           DQTKLSWLNG KYFTKEAVEL LKDGIDVVAR SEVPLLKLLN LREVARKGKR LFMPLRMLLT

           GKLHGPEMGT SIVLIPDTKV YGIIGKPVSH SKSPIVHNQA GFSCTIPHKE AALQCCEVDP
           GRMAGPDVGD QLEVLAATKV FGIIGNPVAQ SKSPLIHNTA GFSVTIPHKE AALRAADVDP
           GKMSGPDVGE ILQILVDTPM YGVIGNPVSH SASPAVHNAA GFSVTIPGKL VAMEAMKIDD
           ?????????? ?????PETAV YGVIASPVGH SMSPALHNAA GYSVTIPHKE TIMALCEIDP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GRMQGPDVGE VLTLLAATKV MGVIGNPIGH SKSPALHNPC GFSVTIPHKE DALECCEVDP
           GKMSGPDVGA VLRVL????? ?????????? ?????????? ?????????? ??????????
           GELHGSDLGS SMVLLCDTRV YGIIGNPVGH SKGPYLHNPA GFSVTIPFKE DALKCCEVES

           LAKSIGAVNT GYNTDCIGSI SAIVIGAGGA GKALAYGAKE KGVVIANRVL ANTTSMGMFD
           VAAQIGAVNT GYNTDWEAAI SAIVIGAGGA GRALAFGAAA RGVLIANRVL ANSTSVGMFD
           VARRIGAINT GYNTDWVAAL SAVCIGAGGA GRGLAFGALE RGVVVANRVI MNTTSVGMFD
           VAKAIGAANT ATNTDWLAAI SAAVLGAGGA GRALAFGALE RGVLVSNRVV LNATAVGMFD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VAKQIGAVNT GYNTDYVAAI EAIVIGAGGA GKALAFGAKF KGVVIANRVL ANSTSVGMFD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SAKAIGAVNT GYNTDCEAAI SAIVIGAGGA GKALAFGAKH RGVVIANRIL ANSTSVGMFD

           AVYTPRITRL LREAEESGVS GSEMFVRQAY EQFEIFKELY WQIMKPISIV GSTGSIGTQT
           AVYNPLWTRL LLDAKAGGVD GLQMFVGQAL EQFRLFAELM ERTVKRFSVL GSTGSIGTQT
           AVYNPLETRM LKEATAAGVS GLEMFVRQAG EQFKLWVGAM REVVRRIAVL GSTGSIGTQT
           SVYNPLETRL LREARAAGVG GIEMFVGQAA AQFEGWAALM RDTV?????? ??????????
           ?????????? ?????????? ?????????? ?????????? ????KKVTLL GSTGSIGTQT
           AVYTPLETRL LREAKASGAS GLDMFVGQAA RQFELFVELM RDAVKKISLL GSTGSIGTQT
           ?????????? ?????????? ?????????? ?????????? ????KRITLL GSTGSIGTQT
           AVYTPLETRL LREAKESGVS GLEMFIRQAI GQFELFKSVM REIVKPISLL GSTGSIGTQT

           LDIVAENPDK FRVVALAAGS NVTLLADQIR RFKPALVAVR NESLINELLE IIPGGVIEVA
           LDIMAEFPDK FKLVALAAGS NVKLLAEQIR KFKPEMVAVK DASKIAELPV ILAGGAVEVA
           LDIVREAPHI FSVSSLTAGS NVELLVRQAR EFRPHVVCIL DESRRDELIR VVCGGVVECA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LDIVKNVPER FEIEGLAAGG NVALLAQQIK EFNPKIVSVR DESVLKELPE LVFGGIAEVA
           LDICEEHPDK FEVVALSAGR NVTLVAEQCA KFSPKLVSVQ NGEDVAKLPE IMYGGMVEVA
           LDIVAACPDA FSIVGLAAGG NVDLLVEQAV LFRPAIVAIR DASKYGALCE VVAGGVVAVA
           LDIVSENPDR FKVVGLAAGS NVTLLADQVR RFKPSMVGIR DASLIDELPE IVVGGTVQIA

           RHPEAVTVVT GIVGCAGLKP TVAAIEAGKD IALANKETLI AGGPFVLPLA NKHNVKILPA
           RHPNAESVVT GIVGCAGLLP TVAAIKARKE ICLANKETLI AGGPFILPLA QEYGSKILPA
           AETDADVVVT GIVGCAGLLP TVAAIKAGKD IALANKETLI AGGPVVVPLV KKHGVSMTAA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KYGDSDVVVT GIVGCAGLLP TVEAIKAGKD IALANKETLI SGGPVILPLL KEYGVKMTPA
           RHADCDSVVT GIVGCAGLPP TVAAIEAGKN ICLANKETLI AGGPAIVPLA VKHGVKILPA
           AYGDADVVVT GIVGVAGLQP TLAAIRAGKD IALANKETLI AGGPVVLPLL KEHGVTMTPA
           CHPEAVEVVT GIVGCAGLKP TVAAIAAGKD IALANKETLI AGGPYVLPLA KKHGINILPA

           DSEHSAIFQC IQGALRKIIL TASGGAFRDW PVEKLKEVKV ADALKHPNWN MGKKITVDSA
           DSEHSAIFQV MQGGLRRIIL TASGGAFRDW PVEKLREVTV AQATSHPNWS MGKKITVDSA
           DSEHSAIFQC LQGALRKIIL TASGGAFRDR PAKDLASVTL ADALKHPNWS MGAKITIDSA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DSEHSAIFQS LQGGLRKVIL TASGGAFRDF SADELLELCE KDATTHPNWD MGAKITVDSA
           DSEHSALFQC IQGALRRIIL TASGGAFRDM DLATMRELAV SDATTHPNWD MGAKITCDSA
           DSEHSAIFQC LQGSLSKVIL TASGGAFRDW NAADLEKVQL SDALKHPNWS MGAKITIDSA
           DSEHSAIFQC IQGGMRRIVL TASGGAFRDW PVERLKDVKP ADALKHPNWS MGKKITVDSA

           TLFNKGLEVI EAHYLFGAEY DDIEIVIHPQ SIIHSMIETQ DSSVLAQLGW PDMRLPILYT
           TLMNKGLEVI EAHYLFGVDY DNIDIVIHPQ SIIHSMIETQ DSSVLAQLGW PDMRLPIMYT
           SLYNKAAEVI EAHYLFGLDY DNIEAVIHKQ SIIHSMVEFE DSSVLAQLGW ADMRLPLLYS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TLMNKGLEVI EAHYLFGVSY DDIEVVVHPQ SILHSAIETR DSSVIGQLGW PDMRLPLVYS
           TLMNKALEVI EAHYLYGTSY DNIDVIVHPQ SIVHSMVETS DSSVLAQLGW PDMRLPILYT
           TMMNKGLEVI EAHYLFGAAY DDIDIVVHPQ SIVHSMVEMA DTSVIAQLGW PDMRLPLLYA
           TLMNKGLEVI EAHYLFGADY DDIDIVIHPQ SIIHSMIETQ DSSILAQLGW PDMRLPILYT

           MSWPDRVPCW PRLDLCKLGS LTFKKPDNVK YPSMDLAYAA GRAGGTMTGV LSAANEKAVE
           MSWPERVPVW PRLDFTKANN LTFRAPDRAK YPSMDLAYAA GRAAGTMTGV LSAANEQAVQ
           MSWPHRVSMF KPLDLVEIGS LTFQEIDRQK YPNMDLAYIA GRKAGTMTCV LNAANEAAVE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MSWPYRLEMY EPLDFAKLGK MTFMAPDRKK YPSLDLSYSA GRTGGTMTAV LNAANEQANE
           MSWPNRVECW PRLDFVKMGD LTFRAPDFEK YPSLTMGYAA GRAGGTMTGV FSAANEQAVA
           IAWPARVSMY ERLDLVKVGA LTFRAPDHAK YPCIELAYAA GRLGGSATAV INAANEAAVE
           LSWPDRVPCW PRLDFVKTGS LTFKAPDRAK YPSMDISYAA GRMGGTMTGV MSAANEKAVE

           MFIDEKISYL DIFKVVELTC DKHLVTSPSL EEIVHYDLWA REYAIRSATV RLIQQNMLGL
           MFIDEKIHYL DIMKLNEACC EAHLVASPDL DTIVHYDAWA RRWVITVKEV FVLDRAPLGA
           MFREEKIHFL DIPKINQAMM DSHFLQYPTL DDIVHFDTVT RIHAINYPQI RLISGNLLGI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MFRNGEIGYL DIFKVIEKAM EAHLSMKPSL DDIVEIDGWA RNFVIPFDEI RVVRDEMLGI
           MFLDKKMGYF DIYKVIELAM EAHLVLDPSL DDIVHYDLWA RDHVIEFDEL RVLDKEMLGV
           LFRQDKVHYL AIPKLIEATL DAHWLANPSL DDIVALDSYA RTVV?????? ??????????
           LFLDEKIGYF DIIRLIEKTC ETHFVKEPSL DDILTSDRWA RIYAIRAPIL RLIDSQQIGI

           VSKDEAVRMA DDELDLVILS PDADPPVVKM MDYSKYRYEQ QKRKKDQQKK TTLKELKMGY
           MPTSRAQALA DEKEDLLLIN PDASPPVARI IAWSKYKYEL EKGAKERKAK STTKEVRLRP
           YSSTEALNIA IKGLDLVVIS DKSNPPVCKI VDYGKYKFIQ EKKAKEARRK QHIKEVKMRY
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MSKDEALAQA EDGQDLVLMS PDAKPPVCKI INYDKLRYEN EKREKMKKKN SKLKEVKLSY
           MSTDEALELA AEELDLVVMS PDAEPPLARI MNYSKYKYEK EKKDREARKK AAIKELKMRY
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VPREDAFQRA ERELDLVLIS ADSDPPVAKL MDYSKYKYEQ QKKKRDQQKK AAIKELKMRY

           NIDQHDYSVR LRAAQKFLQD GDKVKVIVSM KGRENEFRNI AIELLRRFQT EIESK-NRDR
           STDSGDLAVK IKSCQKFLAK GDRVKLVMKF EGRELQFREQ GKEVLLGFIA ELEGPLNKTG
           KIEEHDYRVR INQALRFLQS GDKVKATVTF RGREIQHTNL AIELLQKMAN DLQQLPSDGR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KIDVHDYEVR KRATIKFLTK GDKVKASIRF KGREVAHQRL AESTFARLME DTEKKPMEGR
           NIDTHDYGVR LRAAQKFLEG GDKVKVICQF RGRENDFREI GREMFARFVE DVESKPSEGN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NIDTHDYEVR LKQAKNFLKD GDKVKVFMPF RGREAQFKDL GVKLLRKFEE DIENKLAEGR

           NMFIILVPNK ALISLSDKRD LASLGNGLQ- ELGYTIVSTG GTASTLENAG VSVTKVEKLT
           TYTIMLQPTA ?????????? ?????????? ?????????? ?????????? ??????????
           YMIMILSPKK ALISVSDKNC LLGLARVLA- ERGVEILSTG GTFRVLQEAD IPVNDVSQYT
           ?????????? ---------- ---------- ---------- ---------- ----------
           QMQMILCPLP ALISVSDKTD LLVLAAALKD AQSVEVLSTG GTAKALKEAG LPVTDVSDYT
           SMTMLLAPTV ---------- MNELARGLA- GLGYEIVSTG GSAKAIEASG TAVTSVDAVT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TMYMTLAPNK ALLSLSDKRN LDVLATGLR- ELGYTLISTG GTAKALETAG FEVTRVEELT

           HFPEMLDGRV KTLHPNIHGG ILARRDVEHH MEALNEHGIG TFDVVVVNLY PFYEKVISFE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GFPELMGGRV KTLHPKIHGG LLAVRDDPDH AAAMEEHDIL PIDLVVVNLY PFEATVKSFE
           ---------- ---------- ---------- ---------- ---------- ----------
           GFPEMMDGRV KTLHPKVHGA LLSIRNNPEH EKACKEHGIE YIDMLVVNLY PFQATVADFD
           GFPEMLDGRV KTLHPGVHGG ILAKREDASH MEAIAKHGID TIDVVAVNLY PFRETVGDFA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NFPEMLDGRV KTLHPAVHGG ILARRDLDSH MDALDTHGIG TIDVVVVNLY PFYDTVASFE

           DGIENIDIGG PAMIRAAAKN HKDVLIVVDS GDYRRKLAWK AFQHVAAYDS AVSSLRYGEN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ECVENIDVGG PTMIRGASKN FRYVTVVTDV QQYRRKLAAA AFGKLAAYDA AVQSLRYGEN
           ---------- --MIRSACKN HRSVVVLTDA AGD------- ----VPAEDG GGQTLRYGEN
           TCIENVDIGG PAMIRAASKN HPSVTVITSV TQYRRSLAAA AYAHTAAYDA AIFPLKYGCN
           QCVENIDIGG PAMIRAAAKN HPHVYVVVDP NDYKRELAWK AFQHCASYDS VVAALRYGEN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KGVENIDIGG PAMIRAAAKN HKHVLVVVDP ADYRRKFAWK AFQHVSSYDS AVSSLRYGEN

           PHQKAAFYGI ATAIQHHGKE MSYNNYLDAD AAWNCVSEFT CVVVKHTNPC GVAAYRLAVK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PHQLAAFYGL ASAEQVQGKA LSFNNISDTD AAFELVSEFV CAIIKHANPC GVAAYLRALA
           PHQAAAFY-- -------GKE LSYNNLNDTD AAFELVAEFA CAIIKHANPC GVAAYLKALK
           PHQLPANIGA LPFKVLNGKP -GYINLLDAL NSWALVKEAA AASFKHVSPA GAAAYLRARN
           PHQPAAVYGV ARSIQHHGKE MSYNNYLDAD AAYGCACDYT CVIVKHTNPC GIAAYRMAVR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PHQKAAFYGI ATAVQHHGKE MSYNNYLDAD AAWNCVCEFT CVVVKHTNPC GVAAYRLAVE

           ADPVSAFGGI VAFNVEVDEV LAREIFYEIV VAPKYTAKGL EVLKGKTLRI LEARQVGGGW
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           CDPTSAFGGI VALNVTVDLH VAEEIFTEVV IAPDATVEAL EILSKKNLRV MLTKSVSGGM
           SDPVSAFGGI IALNRPLDEA TAKEIFVEVV IAPGVDEAAR AIMAPKNVRV LVVKSLSGGF
           ADPMCSFGDW AALSDVVDEQ TANYLVSDGI IAPGYTPEAL AILSQKTGSF IVLREINGCV
           ADPISAFGGI VAFNCTVDAD MAREIFYEIV IAPSYTPEGL EVLKGKTLRI LETRQVGGGW
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ADSVSAFGGI VAFNCEVDEA LAREIFYEIV VAPKYTEKGL QVLKGKALRI LEARQVGGGW

           LAQDSDAKFA WLCVKHVKSN AIVIAKNNCM LGMGSGQPNR VESLRIAFGE EAKGAALASD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LLQTRDLLFA WKVCKHVKSN AIVYVRNMAT VGTGAGQMSR VDASRIAAES RTVGSVVASD
           LFQNRDLMFG FVVCKHVKSN AIVYVKDGMT VGIGAGQMSR LDSTRVA--- ---GSVAASD
           FAQRGHQVLA TVAIKYTQSN SVGYAINGMM IGVGAGQQSR VDCVKLAGMK KLDGVVISSD
           LEQASDLKFA WRAVKHVKSN AITVATTGRL LGMGSGQPNR VNSVRIALGE EAQGAVLASD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LVQDADAKFA WVCVKHVKSN AIVVAKDNSM LGMGSGQPNR IKSLEIAIGS AVKGAALASD

           AFFPFADAVE EACQMGIGVI AEPGGSIRDQ DAIDCCKKYG VSLLFTNVRH FRHYEAVIGI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AFFPFADGLL AAADAGATAV IQPGGSKRDA EVIAAADERG IAVVLTGMRH FKHYEPVIGI
           AFFPFPDGLL TLAEAGCTAV IQPGGSVKDD DVIAAANEKG LAMIFSGMRH FRHFEVVIGL
           AFFPFRDSID TCIKYGVKYV AQPGGSVQDE GVTEACDQYG MVQCHHGMRL FHH???????
           AFFPFADSVE IACQAGIKAI AHPGGSMRDQ DAVDVCNKYG VALVTTGHRH FRHFEAVIGI
           ?????????? ?????????? ?????????? ?????????? ?????????? ???YEPVIGI
           AFFPFADAVE EACKAGVSVI VQPGGSIRDQ DAIDCCNKYG VAMVFTDVRH FRHFEAVIGV

           ETHVQLSTLT KAFCSCSNPN TSICPVCMGL PGALPVLNSK VVEFGVRLGL ALNCKSKFDR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EFHVQLATKT KAYCSCSTPN VNVCPVCMGH PGALPVVNSK VVELAAKAGM ALGCYSRYDR
           ELHAQILASS KLFSAAA-PN SRVALFDAAI PGTLPRVNAW CVEQAVRTAV ALGCRSSFER
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ETHVQLNSRT KAFCRCAYPN TRVCPTCMGH PGTLPVLNSA VVKKGIAIGT ALGATSKFDR
           EVHVQLATAS KAFCGCATPN NHVCPVCLGH PGSLPRLNGR MVELAAKAGM ALNCVSIFDR
           ETHVQLGTAT KAFCGCLSPN SNVCPVCMGL PGALPVLNER VVDFAVKLGL ALNCRSKFDR

           KQYFYPDLPK GYQISQFDIP IASGGYVDVD RRFGITRVHM EEDAGKLLHS ----GDYSQV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KNYYYVDTAK NYQITQDLFP IATKGSVQLP GVIGVTRLHM EEDSAKMSHE RLTDSTHSLV
           KHYSYPDLPL GYQITQ-RAP IAKSGTVRFR ---GLERA-- --DSAKSVH- ---GETATLV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KQYFYPDLPK GYQISQFDEP LCYDGSIDVV KRVGITRAHL EEDAGKLTHA --DGKKYSYA
           KNYFYADTPK NYQISQYDRP LATGGYVTL- KHIGVTRLHV EEDSGKMNHV SVTDADYSLI
           KQYFYADLPK GYQISQFDIP IARHGSIEVD RKFGITRVHI EEDAGKLVHA RLSGSPYSLV

           DLNRAGVPLL EIVSEPDMRS GIEAAEYACE MQRIARYLGV SNGNMQEGSL RCDVNISIRP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DFNRSGIPLV EIVSEPDIRS GLEAAEYGQE VQRILRYVGT SNCNMQDGSM RCDVNVSLRL
           DLNRAGSALM EIVTEADLRS GEDAATFLRE MQRLLRCIGT CDGNMEEGSL RVDANISVRR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DFNRAGVALL EIVTEPDLRT GREVAAYGSE LRRIVRFLDA CDGDMSRGSM RNDVNVSIRP
           DYNRAGVGLA EIVSEPEMRS GAEAAEYGRE LQRVLRYVGV SDGNMQDGSL RCDVNVSLRR
           DLNRAGVPLL EIVSEPDMRT GIEAAEYAAE VARVVKCLGI GSGSMAEGSL RCDVNVSVRP

           IGFGTKVEIK NLNAFSAISR AIDFEISRQA LLTETRLWEE QKTVTMRKKE GLADYRYFPE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KGFGTKIELK NLNSFSAAHK SIDFEIERQA EIMETRTWDE NETRTMRVKE GAADYRYFPE
           KDRSAPVEVK NLSGMSHVAS QSPCGVRKIC QI-------- --------EA MAEQYRGGNT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VGFGTKVEVK NMNSFNAMAR AIDYEIARQE ELQETRTWDE QKTVAMRKKE GLADYRYFPE
           RPFGTKVELK NVNSFAAVHR GVEYEITRQA AVQETRTWDD ASTILLRVKE GDADYRYFPE
           RGFGTKVEIK NMNSCAAMHR AIDFEILRQV ALQETRLWEE QRTVTMRAKE GLADYRYFPE

           PDLPEVILLP ELPEAKRRRY E-AMGLGMQD VLFLANDVSV AEYFDAVIGK LAANWIMSDI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PDIPPLNLLP ELPNEKRVKY QEEFGLSGYD AFLLSDDTQV AKYFEDSIAK QAANLIMGDI
           RVLGPMVA-P PLVSASLQRL L--------- ---------- ---------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PDIPKLRLMP ELPSMVRARY A-ALGLPPAD VQVLVEDKEL VTYFDAALSK QVANWLTGDI
           PDLPPLTLLP ELPAEKRARY VADLGLSEYD AWVLADDGDT ARYFDAVVAK AAANWVMGDL
           PDLLELVLLP ELPNETRRRY E-ALGLSMQD VLVLADDKSV SEYFDSTLEK MAANWIMGDI

           AAYLLTPQEL AELIAAIKDG TISGKIGKEV --GS------ ----QSTNSS S---------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TKVLLTAEGL AEMIGMIDGG VISNKIAKDL VPGNPAQIVE ERDLLISDPD VIRKIIEGVP
           ---------- ---------- ---------- ---------- ---------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MAHLLSPEAL GEFCAMIDAG EISGKIGKDL LPGSAKKLVA DRGLQVSDPR EIEALVDGVA
           LKEVLPPEAL AEMIILITDG VISGKIAKSL LPGSPAAMVE ERGLQITDPE EIGALVTGVA
           TAYLISPSVL AELVSLIKDG TISGKIGKE- ---------- -----ISDEA EIASLVDKVP

           ---------- ------FAX? ?????????? ?????????? ??-------A YFLAKEDGIV
           ?????????? ?????????? ?????????? ?????????? ??IKAALDEA TFLAKADGVL
           KELESYKQGK TRLLGFFVGK TLSASGSKAD PTTTNKILKE ILASSWLLEA DIFLKSGAVL
           ---------- ---------- ---------D PX???????? ??QAELVKEA NLLGKGHGVL
           ?????????? ?????????? ?????????? ?????????? ??LELARDET KVMSRAELVT
           GQLEQYRAGK TKLKGFFVGA CLKASGGRAN PSLVDRILQA KLVRAALEEA TLLAKATGTL
           KEVDLYRN?? ?????????? ?????????? ?????????? ?????????? ??????????
           KQLEAFKKGK TKLQGFFEGQ VMRSTNGRVN PILMKKVVAQ KLIQLALSEA RFLAKENGVI

           AGVALADMIF EHVGNAHKIV VAERVLLNFM QRMSGIATLT KLMADAAS-- PACILETRKT
           AGLGVADEVL AIVGSARSIL VAERIMLNFM QRMSGIATAT AAMVAALEGL PTKVLETRKT
           AGRAFVDAVF RELGAARKVL LGERVALNAL AECCAVATAA RAAARQKAGW GGRVAGTRKT
           AGVPFFNEVF RQLGKARHIL MGERTGLNIL ARACGIATVA RKVVDDVVGW KGSLAGTRKT
           AGLAVLPEAA KIFGPSHQML RLERVALNMI GRLSGIATKT NQFHQEMQDC RAKLLDTRKT
           AGEHLGSVVL AAVGSARSIL RAERVVLNFM QRMSGIATMT AAYAAAAA-- PAIMLETRKT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AGIALADMVF QELGNARSIL TAERVVLNFM QRMSGIATAT KKMADAAK-- PARILETRKT

           APGLRLVDKW AVLIGGGRNH RMGLFDMVMI KDNHIIVNAV DEYLKQKMDV EVETRTLEEV
           APGLRLTDKW AVLIGGGSNH RMGLYDMMMI KDNHIIRAAV EEYIRSAMCI EVETSTLAEV
           TPGFRLVQKF GMAAGGMDTH RMDLSGMVML KDNHVVGGAV RAVVGFSVKI DVECARVEEA
           TPGFRSVE-- ---------- ---------- ---------- ---------- --------DA
           TPGLRVLEKY AVRCGGGYCH RMGLHEAVLI KDNHI????? ?????????? ??????????
           VPGLRVLDKW AVLIGGGKNH RIGLFDMVMI KDNHIIAAAV EKYLLENVKI EVEARTMDEV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           APGLRLIDKW AVLIGGGENH RMGLYDMVMV KDNHIIENAI TKYLEEKIGV EVETRTLDEV

           KEVTRIMLDN MLKDAVELIT EASGNVTLET VHKIGQSGVT FISSGALTHS VKALDISL--
           DEVTRVMLDN MMAEAVGRIT EGSGNVSLNS IRTIAATGVT FVSVGALTHS VIALDISL??
           FEADVVMLDN FFCEAARAVV EGSGGITMET LKGYMVEEAD VVSF-SINRY VKAVDVSM--
           KTADIVMLDN LLKIAAKDVL EASGGITPDT VKNFACDNVD IISLGCLTQG VPTVDISL??
           ?????????? ?????????? ?????????? ?????????? ?????????? ????????--
           KTVTRLMLDN MMTAAVRLIT EASGNVTLDT VHAIGQTGVT YISSGALTHS VTALDISL--
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RRVTRIMLDN MLREAVEIVT EASGNVTLST VGKIGSTGVT YISSGALTHS VSALDISC--

           -MSLL----- ---------- ---------- ---------- ---------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           -----SSQSE TP-------- ---------- ---------- ---------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ---------- ---------- ----------
           ---------- ---------- ---------- ---------- ---------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ---------- ---------- ----------

           ---------- -----ITVP- ---------- ---------- ---LCS---- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ---------- ---------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ---------- ---------- ----------
           ---------- ---------- ---------- ---------- ---------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ---------- ---------- ----------

           ---------- FPP----PRR L------SLR LRRF---TRK S--------- --SSLLP---
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---SVPCPVH VAFVPSTIPR FRTHSRTSSL S-NRTTTRRP RPASIPD---
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ---------- ---------- ----------
           ---------- ---------- ---FNDGISA WDTFRTSMDS S--------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ---------- ---------- ----------

           -LVAVSS--- ---------- ---LLNERIR R--------- ---DLGKRET ARPAM-----
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           FFLPLDDATS PAAPTSPPHL GRFLIPQSPS QNARVSSSGV RAKTTTRKPQ KR---NASGV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ---------- ---------- ----------
           A--------- ---------- ---------- ---------- ---------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ---------- ---------- ----------

           ---------K EQQERGLLKG ---IRQGSYK VDPYSLSGDY VVHKKVGIGR FVGILEYVFI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           IDISATRQP- ---------- -----KRPLP SDDATVPGDL VSHSRHGIGR FRGVQEYAVI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---PGGTMS- -------IKP ESQVKEATTT ADPTSLQNEL VVHSQHGIAK YLRVKPFMVL
           ---------S AAEVEEKRVR DGYVEDANNA IDPFKLTGEY VVHRKYGIGQ FLGMKPFLFL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- -------SYN VDPEKLSGEY IVHKKVGIGQ FVSLQKYVYL

           EYADGAKLPL KQLYRYNRTL SRWERRKTKG KVAIQKMVVD LMELYLHRLR RYPYPKN-PI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EYRDGVYVPF SHIRRLSDRL DTKHVARERT RAKIRKQLIN LHGLYAERTT RPPFPVDEEA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QFADGLKESF TQVTKYFPKL DHWTKRKAKA KRTLKKLAHD VIKLQAVRKQ REPYKMPGH-
           KYQDAAKISP EALYRFCPKL NKWDLRERKT EATIRRLVVN QMVVYLQRLQ REPYPLPDPR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RYADGAKLPA KQLYRYFPAL SKWEKRRTEG SLDAQRRVVK MIDVYIRRLK RPVYSKDVPA

           MADFAAQFPY NATPDQKQAF LDVEKDLTPM DRLICGDVGF GKTEVALRAI FCVVSTGKQA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EQRFNLECGF VLTEDQEAAT KQIMRDMRPM DRLLCGDVGF GKTEVAVRAA FRVLAAGKQV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KTDFDDLFPH EPTADQLKAF RDIEQDLIPM DRLVCGDVGF GKTEVAMRAL FLCVSQQRQA
           AKQFDASFPF TLTPDQTSAI QEITEDLAPM DRLVIGDVGF GKTEVAMRAM FHVASSGGGV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MSKFAGKFPY TPTPDQIKAF LDVERDLTPM DRLICGDVGF GKTEVAMRAI FYAVSAKKQV

           MVLAPTIVLA KQHYDVISER FSLIKVGLLS RFQTKAEKEE YLEMIKTGHL NIIVGTHSLL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AILAPTTILA QQHYDTFRSR FEGVKIAMAT RFTSRKINIE NRDRVCSGEV RVAIGTHMLL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ILLAPTTVLA IQHFRTVQSR FKSLRPALLN RFVPAKTRRE LLQQVADGEV DILVGTHAVL
           FMMAPTTVLA KQHAANLAVR FRPINVELVT RHIQAAKQNT IFDDFRDGKV QIIVGTHKLV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MVLAPTTVLA KQHHESIKER FANIKVALLS RFQNNVDRRA VIAGINDGVV NIAVGTHSLL

           SRVVYSNLGL LVVDEEQRFG VKQKEKIASF KTSVDVLTLS ATPIPRTLYL ALTGFRDASL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DKCIFPDLGL LIVDEEHRFG VNQKEKIRAR YRGIDALFMS ATPIPRTLHL TLSGLRDASV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SKISFRSLGL VVIDEEQRFG VNQKEKLKTL SVGIDVLTLS ATPIPRTLHM AMSGLRDMTV
           EQEYYKQLRL LVIDEEQRFG VKHKDQISAL KAEVDVLTLS ATPIPRTLHM AMSGFRDASL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NNIQYEKVGL LVVDEEQRFG VAQKEKISTL KTTVDILTLS ATPIPRTLHM ALSGFRDASL

           ISTPPPERIP IKTHLSSFRK EKVIEAIKNE LDRGGQVFYV LPRIKGLEEV MDFLEEAFPD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LRTPPPGRKP VITKVSPSGA GIVRAAITRE VERGGQVFFV VPRIEGIEAL ADWVRDLFPG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MRTPPRSKKE VETHVAKFSE RLLLKALQLE LDRAGQTFCV VPRIADIDQV VATLYRLAPA
           VQTPPPERRP INTVLAPQND DDIRKAIEYE ISRNGQIYYI VPRINMMRDA CDRLLRLFPN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MTTPPPERRP IKTHVCVYSQ DMVKDAIKAE LDRQGQVFYV VPRIQGMEST EKKLKLLVPG

           IDIAMAHGKQ QLEETMERFA QGKIKILICT NIVESGLDIQ NANTIIIQDV QQFGLAQLYQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LKVLVAHGSI DLEHRIWAFA QKEYDVLVCT TIIENGINMP DVNTIIVQDA GKFGLAQLHQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ARVLVAHGEL DLEERLIKFS EGGADVLVCT PIIESGLDIH TANTIFVFNS HYFGLSSLYQ
           LQIMTAHGQM AIDDAMESFS NGSADVLIAT TIVESGLDIP NCNTIIIENV QFFGLASLYQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VQVSIAHGKK ELEATMTKFT EKGTSILLCT NIIESGLDIP TVNTIIVENV QMFGLAQIYQ

           LRGRVGRADK EAHAYLFYAL ERLSALEECR ELGQGFQLAE KDMGIRGFGT IFGEQQTGDV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LRGRVGRSDV QAYAFLLYTL DRLRALERYS DLGAGFAIAQ RDMEMRGVGT ILGVEQHGN-
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LRGRVGRGST QAHAYFTFSQ QRLAAITRYT SLGSGYELAQ RDLEIRGAGS LLGAEQSGEA
           LRGRVGRAGR QAYAYMFYAQ ERLAALEECC GLGEGFRLSE RDMGIRGVGT MFGEKQSGDV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LRGRVGRADK VAHAYMLHAL ERLSALEDCC ALGQGFQLAE RDMAIRGIGS IFGEKQSGEF

           GNVGIDLFFE MLFESLSKVE YVNYLENPME IIHEAEKAAE SLMQFTENLR RQYGKEPYSM
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NSIEGEEYAM MLSEELEHAD YITDFDQKMT AYGQLSRALS AVNSVVKGLE SRYGPLPTST
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NEVGVELYMQ MLKEIVAEI? ?????????? ?????????? ?????????? ??????????
           DSVGADLYLE LLYKQLQRIF YIATTEASDE VKATIDSITA QVHDVLALMR DTFGEPDEFS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SKVGVDLYAE MLFEAISKVE AVTDSAEE-- -----AAKKG DLVRFTENLR SERGKEPPPL

           EIILKKLYVR RMAADLGVNR ISKKVFKLIT DSMSLIYEGD QIMAELLLLN WMEKPREECG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??RVTPRMCG
           RRHVSVMELK LSGKPLGITR IDEPAFNCLV AFLEHKVDEE RVIIRGLQLA KLDSLHEECG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??--------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??RRYNEKCG
           LSCVFAREMR ILAGDLGIQG ISIMVKELLV EGIEIIDT-- GIRLKTMKVM YTDGAARACG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??DSLREECG
           EALLKTIYAK RMAADLGIHH INADAFQVLH CSMSLSFSNG RLELHSLQLE RLRAWGEECG

           VVGIYGASRL CYLALHALQH RGQEGAGIVT TGVGLVSEVF LDQLPGDIAI GHVRYSTAGS
           IIGIFKANVE LYEGLLMLQH RGQDSAGMVT KENGLVKDVF MDSMKGHCGI AHVRYPTAGS
           VVGVWGSAAV AYYALHALQH RGQEGAGIVT KGLGLVSEVF GDSLAGESAI AHNRYSTSGE
           ---------- ---------- ---------- ---------- ---------- ----------
           VFGVFNASHT CYYGLVGLQH RGQEGSGMVT KGMGLVTDTF LNTLKGNCAV GHTRYSTAGG
           IIGVVTVAAE IYEGLLMLQH RGQDSAGMVT KDNGLVKDVF MKYLDGHIGM GHVRYPTAGG
           VVGVWGSAAT VYYGLHALQH RGQEGAGIVT KGLGLVSEVF LERLTGHAAI GHNRYSTAGA
           VVGIYGASRL CYLALHALQH RGQEGAGIVS TGLGLVSEVF LSKLPGSSAI GHVRYGTAGD

           SNVQPFVAGY RFGVGVAHNG NLVNYTKLRA DLTSSDTEVV LHLIRIVDAC EKLQGAYSMV
           SEAQPFFVNS PLGIYLIHNG NLTNTEELRD LLTESDSEVL LNILAGEMTM RLLKGAYSLA
           KNVQPFRASF REGVAVAHNG NLTNADVLRV ELTSSDTEVV LHLMKAADAL NRVEGAYSIL
           ---------- ---------- ---------- ---------- ---------- ----------
           KGYQPFAVRY ALGLALAHNG NLSNFNELRT FFTSVDSELF LHLIQIFDAM TQAEGAFSCV
           LEAQPFFVNQ PLGIYLIHNG NLTNTDELRA KETGSDSEVL LNVFAVTVTM GKVKGAYSIS
           KNVQPLVATF RDGVSVAHNG NLTNAPRLRV ELTSSDTEVI LHLMRVADAL GRVEGAYSVL
           SNVQPFVAGY RFGVGVAHNG NLVNYNELRI MLTSSDTEVV LHLIRLVHAC EQLEGAYSLV

           FVTEDKLVAV RDPHGFRPLV MGVFASETCA LDLIEATYER EVYPGEVLVV DCIFEHIYFS
           LVKGVGLVAF RDPHGIRPLV LGCVASEDCA FGPIGFERVR DVQPGEMVII TCIFEYIYLA
           ILTKETLIAV RDPYGFRPLV MGVFASETCA LDIVEAKFMR EVEPGEMVSI DCVFEHIYFS
           ---------- ---------- ---------- ---------- ---------- -CVFEHIYFA
           VMTDESMICV RDPNGFRPLV LGCVASETCA LDLCKAEYVR DVEPGEMIVI NCIFEYVYFA
           LINGQGMFAF RDPNGIRPLV LGCVASEDAA FGPLGFTTVR DVNPGEAILI TCIFEYIYLA
           ILSRESLVAV RDPRGFRPLV LGMLASESCA LDLAGASLVR EVEPGEMLVL SCVFEHIYFS
           FLTEDKLVAA RDPYGFRPLV MGVFASETCA LGLIEAEFQR EVNPGEVIVV DCIFEHIYFA

           LPNSIVFGRS VYESRHVFGE ILATEDVVIA VPDSGVVAAL GYAAKAGVAF QQGLIRSHYV
           RPDSVLNGIP VYNFQLKLGT ALANRDIVCP VPDGSRPAAI QIAAELGLPY REGLVKNRYV
           KPSSVVFGRS VYMSRFRFGE LLATSDAIVP VPESGVPAAL GYASASGIQF QQAIIRSHYV
           RPNSVVFGRS VYQTRFRFGE VLAK-DAVIP IPDSGIAAAL GYSAASGIPF QNGLIRSHYV
           RPDSMVFGDY VTKVRRAHGR QLAREPVVIP VPDSATHATI GFVEESACIQ DLGFFRNPYV
           RPDSQINGIS VYEFQLELGR RLAKRDTIVP VPDGSRPSAI EVASALDLPY REGLVKNRYV
           KPSSVVFGRS VYASRVRFGE LLAATDVVVP VPESGVPAAL GFSAASGVPF QQGILRSHYV
           LPNSVVFGLS VYQTRYRIGE VLAEEDVVIA VPDSGMVAAL GYAYKSGVPF QQGLIRSHYV

           GRTFIEPSQK IRDFGVKLKL SPVRGVLEGK RVVVVDDSIV RGTTSSKIVR LLREAGAKEV
           GRTFIMPDQR LREMSVRRKL NAMPAVFEGK SVLLIDDSIV RGTTMTQIVD MVRRAGARKV
           GRTFIQPTQV ARDIGVRLKL APVEALIRGR SVVVVDDSIV RGTTSKKIVR MLRDAGAREV
           GRTFIEPSQS IRDFGVKLKL STVRAIIEGK SIVVVDDSLV RGTTSKKIVN LLREAGAKEV
           GRSFIAPSQE YRDLKVRCKF NPLTHVCKDR VVVLLDDSIV RGTTARQLIG LVRSAGAKEV
           GRTFIMPDQR IRELSVRRKL NAMRSVFNGK RVLLIDDSIV RGTTMNQIVQ MCRAAGAVKV
           GRTFIQPSQG VRDIGVKLKL APVRSVIAGK VVVAVDDSIV RGTTSKKIVL MLRDAGATEV
           GRTFIEPHQK IRDFGVKLKL SPVKEVLEGK RVVVVDDSIV RGTTSSKIVR LIKEAGAKEV

           HMRIASPPII ASCYYGVDTP SSNELISNVD EIRDYIGCDS LAFLSFETLF CYACFTGIHN
           YLASASPPVV YPNVYGVDMP SRKEFVANID QVCTLLKADG LIYQEVDDLF DASCFTGGRG
           HFRIACPPIT GGCFYGVDTP DKEKLLSNDA EACEYIGADS LAFLPLDAMF CDACFSG???
           HMRICSPPMI GSCHFGVDIP SQEGLIAYIE QIRSYIAADS LAYLPLEAMF CDACFSC???
           HFRVASPPVT DPCFFGMDFP SKGELLFNIP SMAAWLGVKT MGYLSANGLF CRACFTG???
           YLASAAPPVR FPNVYGVDMP SRKEFVADED EICATLGADG LIYQTVEDLF DASCFDGGRG
           HMRIACPPII GSCYYGVDTP DRESLISFVE ATREYIGADS LGFLPLDGLF CDACFSG???
           HLRIASPPIT GSCYYGVDTP SREELISHID ETCAFIGADS LAFLPLERLF CDACFSGEPV

           IETVLLVNKP TSFTVCGKLR KKVGHAGTLD PMATGLLIVC VGKAKGYSGV FRLGEATSTL
           ASGVILVDKP TSFDVCGKIR KKVGHAGTLD PNASGLLIVC TGKGKEYSGT LRLGEFTPSY
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ??-------- ---------- ---------- ---------- ----KAYRAT IRF-VVTDTD
           ??GIFPVHKP TSYDVVAKIR IKVGHGGTLD PMATGVLVIG VGSGKAYEAV MQNKTVVRLC
           KGMTILMDKP TSFDVVARVR KKVGHCGTLD PMATGLLILC VGKAKTYTGT IKLGEGTPSQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VLTVVLIDKP TSFSVCAKLR KKVGHAGTLD PMATGLLIVC VGKAKFYSGT LRLGEATPSY

           DADSFLGEIQ VPPMFSAIKV GGEKMYEKAR RGESPRRISI VICSKGTYIR SLCADLAKAL
           DAESYVGNIQ VPPMFSAIKV GGMKMYQLAR EGQPPRPVTI VHCSKGTYIR SLAHDLGRAL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DLDGFVGHLQ IPPAYSAISV NGQRLYKLAR AGKPPRDVLV VTVTTRTSNL EQARDMGRLL
           SPIGYIGDIQ RPPMYSAVKI QGVRAYELAR KGVKPRPVRV VDCGGGTYIR SLISDIALDL
           DADELTGAIQ LPPMYSAIKV NGKRLYKSAR EGVKHRDVVI AHVSKGTYVR TLAYDLCKSL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DGDTFVGTIQ VPPLYSALKV EGERLYEKAR RGEPPRIISI VACSKGTYVR SLCYDLGRAL

           GSCAHLTALE YSANDA???? ?????YSSEQ IQVLEGLDPV RKRPGMYIGS TGSRGLHHLV
           GSHAHLVALD YRVSDAA??? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????----- ---------- -----MYIGS TGPRGLHHLV
           GTGGTLASLG FHLSEAFRFF RAVHL????? ?????????? ?????????? ??????????
           GTAAHMTKLR RSIPLSSRPP SPVSLYNANN ITVLEGLEPV RRRPGVFIGS TGLKGFHHLV
           GTTGHLTALE FDVEDAE??? ?????YDAGS IQVLQGLEPV RKRPGMYIGS TSTKGLHHLV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NTCAHLVALE FSVDDACSKT PPITVYDAGK IQVLEGLEPV RRRPGMYIGS TGPRGLHHLI

           YEILDNAIDE AQAGYASKVD VVLHVVDNGR GIPTDLHPTK KSSLETVLTV LHAGGKFGSG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           FEVVDNAVDE ALAGHCTRVT VVLHVRDDGR GIPVEKHSTG KSALETVMTV LHAGGKFGSG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YEIVDNSVDE SMAGFCEKVD VIINIRDNGR GIPTDLHPTN KTALETVLTI LHAGGKFGGG
           WEVLDNSVDE VQAGHASHVR VVVEVVDDGR GIPTDVHPTG KSSLETVLTI LHAGGKFGSG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YEVLDNAIDE VQAGFATQVD VVLHITDNGR GIPTDVHPTG KSTLETVLTV LHAGGKFGSG

           YSVSGGLHGV GLSVVNALSE ALEVSVWRDG MEHKQNYSRG KPITTLGTSI RFWPDKEVFF
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YKVSGGLHGV GVSVVNALSE WLTVRVWRGG RQFVMDFRRG EPQGDIGTQV RFMPDKTIFL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YKVSGGLHGV GVSVVNGLSE YLNINTQRNQ RKIGMRFVRG KKISECGTTI NFKPDYQIFF
           YHVSGGLHGV GISVVNALSE LVEVTVWRNG NEYIQSFSRG IALGPMGTMI RFKPDDQIFF
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YTVSGGLHGV GVSVVNALSK RLEATVWRNG QEYRQVFQRG KAVGSLGTCV KFLPDDEVFF

           DHNTIAGRIR ELAFLNPKVT ISLKKEDSEY SFAGGLTEYV SWLNTDKNPI HD-VLGFEIN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DPATLGQRLE ELAFLNAGLE IVLSDEGRTF RHDGGIGEYV DALSLGKHAL HTPATMVEKN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DSYVIGGRLN ELAFLNSNLK LLLEDRRSLF LHDGGIMEYI NEMTINKKRL HNPIIL-IFN
           DPTIIRTRMK ELAFLNSGTE LHLRTFDEKL LFAEGLKDYV LDLTSDATRL HEPITF-TMD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DPNIVSSRLR EVAFLNPEVT INLKEESEVF HFGGGLVEYV EWLNQDKTKI HD-PISFEKD

           GATVDVALQW CSDAYSDTML GYANSIRTID GGTHIEGVKA SLTRTLNTLA KKSKTVKEKD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DVQVEVALRW NSDSYSDKLM GFANNIRTGD GGTHVEGLRT ALTRTINQVA RKSGKLKDNA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NSQIEIGFVW SSEQYQENIL SFVNNIRTVE GGTHVDGFKQ GITKLVNLLS KKKIKSKEKL
           GVRVEGALCW TADSYSDTLL GYANSIRTTD GGTHLDGLKY SLTKTLNVVS RKAKLLKDSD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DISVNVSMQW CSDAYSDTLL GYANSIRTAD GGTHLDGLKM GLTRTLNILG RRSKAIREKG

           ISLSGEHVRE GLTCIVSVKV PNPEFEGQTK TRLGNPEVRK IVDQSVQEYL EFLELHPDIL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SNIGGEYIRE GLTAIISVKV PNPEFEGQTK SRLGNPEVRS TVDGVVSRSL DFFEFNPNIL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NSISGEFIRE GLTCLINVKT SEPEFEGQIK SKLGNPDIKF LVENLIKEEG HFIENNSNLL
           PNLGGDHIRE GLSGVIAVWV PEPEFEGQTK TRLGNSEVRR IVENIANDAV GHMEFNPSVL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DNLSGEHARE GLTCVISVKV PEPEFEGQTK TRLGNVEVRK IVEQAVIEQV EYLEFRPDTL

           ESIISKSLNA YKAALAAKRA RELVRSKSVL KSSSLPGKLA DCSSTDPEVS EIFIVEGDSA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SAIVEKALSA FAAAEAARRA REVVRKKTVL ESSTLPGKLA DCASRDPSLS EVFLVEGESA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NIVLEKAISA MNAYEASKKA KELVRKKSIL EGITLPGKLS DCSEKNPQFS EIFIVEGDSA
           KSIFAKAQSA FKAAEAAKRA REMVRRKTVL TSNRLPGKLS DCSSSDADQT EIFLVEGDSA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EAILSKALQA YKAAEAAKKA RELVRRKNVL KTSTLPGKLA DCTSSDPRVS EIFIVEGESA

           GGSAKQGRDR RFQAILPLRG KILNIERKDE AAMYKNEEIQ NLILGLGLGV KGEDFKKENL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GGSAKQARDR EFQAILPLRG KILNIEKTDD ARIYENNEIQ ALITALGLGI RGDDFNKDQL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GGSAKQARDR RFQAILPLRG KIINIEKNDE KKIYNNTEIQ SLISALGLGV RGNDEDLSNL
           GGSCKQGRDR GFQAVLPLRG KIMNVERKDA AALYKNTEIT NMISALGLGG MGEDLDTTAL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GGSAKQGRDR AFQAILPLKG KILNIERKDD AAIYKNQEIQ DLIVALGLGT RGEEFHKDTL

           RYHKIIILTD ADVDGAHIRT LLLTFFFRYQ RALFDAGCIY VGVPPLFKVE ASYNIQRFKG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RYHRIIIMTD ADVDGAHIRT LLLTFFFRYQ RSLIEEGYVY IACPPLYKVE SKYTLQRFKG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RYHKIIIMTD ADVDGAHIRT LLLTFFYRYQ KELIDKGFVY IACPPLYKIE FNKNIQRFKG
           RYSKIIILTD ADVDGAHIRT LLLTFLYRYQ RDLFEKGYVY AAVPPLYKVV GAKHIQRFKG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RYHKIIILTD ADVDGAHIRT LLLTFFFRYQ RALFDGGYIY VGVPPLYKVE APYNIQRFKG

           LGEMMPEQLW ETTMNPETRI LKQLVVDDIA EANMTFSSLM GARVDVRKEL IKNLQRLDII
           ?????????? ?????????? ?????????? ?????????? ?????????? ?????????I
           LGEMMPTQLW TTTMNPAVRQ LKKVEIEDAI IADQVFTVLM GDKVAPRREF IEALDDIDFI
           ?????????? ?????????? ?????????? ?????????? ?????????? ?????????I
           LGEMMPEQLW KTTMSPEMRI LKKIKLSDAK RADKIFEVLM GSKVPERKKF IQIIDSLDII
           LGEMMPEQLW STTLNPKTRV LKRLTVDDAS AANHMFSTLM SKDVEPRRKL ITD-ASIDIV
           ?????????? ?????????? ?????????? ?????????? ?????????? ?????????V
           LGEMMPLQLW DTTLDPSKRM LKKLTLEDAV EASFTFSRLM GDKVEPRKEL ILKQQNLDVI

           QGKNLELSEP IKQHVEEKVG KSVQKHSVRE VDVRLSVVTL FTVVRAEEDA ETVYACIDLV
           QGRKLPVTDA IKLYVEEKVA KAVANFSLKE VDVTLSAVTI YTVVRVEDAE NNLYAAIDLV
           TGNNITLTDA LRSYINEKLG KVMRRFAIAK MDVHLTVVVA FAILRKEVRT DDMYASIDAL
           TG-GIELTEA IRAYVEEKIG HSVETFKVTG VDVHLQVVTV YAVLRASERT ENLYASIDLV
           SGNNVELTPA LKQYINEKLT NTLSKVGVTR CDAHLTVVVV SVVMRASKST HDMYASIDAV
           QGLHLEITPA IDEYCRAKIG KACSHVDIRE VDVRCSAVTV LMTLHADGTG ENLYATIDSC
           TGNNIDLTDS LRDYVTTKIG KPLETFSLTG ADVHLSVVVV YTVLRQQVKS ADMYASIDSV
           QGKHLELTEA LKAYVEDKVG KAVHNHAVME VDVRLSVVTM FTVVRAEEAT DSMYSAIDRV

           STIIQRKLRK IKEVRTKTFE MPPLTVAEAV EQLELVSHDF YGFQNETGEI NIVYKRKEGG
           CDKIRAKLQK IKEMRSKTVV LDPITVEEAI DALEAVGHSF YVFRETTDTV QIVYKRESGG
           EERIARTIRK YKE------- ------AEAV LCCEYVDHPW YLFRNETKEI SLVYKRNHGG
           SEKIGRNLRK YKEVKKKQFP MPAMTVDDAL ECLGYLDHDF YVFRNATNEI NVVYERHEGG
           ADSVKRKLRK YKEMKKKTFP MEPISVEDAV LCLDYIEHDF YVFKNENGKI AVVYKRNHGG
           ADIVTRAIRK HKE------- ---------- ---------- ---------- ----------
           ADKLTRKLRK YKEVKRKVFA MPPQSLEDAV MCLEMLDHDF YVYRNDTEEI NVVYKRNHGG
           SDVVARKLRK IKEVRTKIFD MPPLKINDAM DHMANIGHDF YAFRNESGEV NILYKRKEGG

           YGLIIPKVVL AYSGGLDTSV IVPWLKENYG -CEVVCFTAD VGQKELEGLE QKAKASGASQ
           YGVIVPKVVL AYSGGLDTSI ILKWLQDTYG -CEVVTFTAD LGQEELEPAR AKAEKMGVKQ
           YGLIEP???? ?????????? ?????????? ?????????? ?????????? ??????????
           YGLIEPEKVL LYSGGLDTSC ILAWLIDK-G -FEVICMVAD LGQEDWPAIQ KKAAQGGAIK
           VGLIEPRLVL AYSGGLDTST QLRWLADK-G -YEVIAFTAN LGQEDFSGIE EKALKSGAVK
           -----PAVVL AYSGGLDTSI ILKWLQDTYG -CEVVTFTAD LGQEELEPAR AKAAQFGVKE
           IGHIQPKVVL AYSGGLDTSV ILKWLQDQ-G -YEVICFIAD VGQDDFEAAR VKALSLGATK
           YGIIIPKVVL AYSGGLDTSV IVPWLRENYG -CDVVCFTAD VGQGELEGLE AKAKASGASQ

           LVVKDLTEEF VKDFIFPCLR AGAIYERKYL LGTSMARPVI AKAMVDVAAE VGADAVAHGC
           IFIDDLREEF VRDYVFPMFR ANALYEGTYL LGTSIARPLI AKRQIEIAKE VGADAVSHGA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           CYIEDLKHEF VTKYVFEAIK ANAIYEGRYL LGTSLARPCI AKRMVELAVK EGCKYVAHGA
           AYVLDLQEDF VKNYVFPIIR SNAIYESRYL LGTSLARPCI SKAQVAIAKK EGCKYVSHGS
           IFVDDLREEF VRDYVFPMFR ANALYEGTYL LGTSIARPLI AKRQIEIAKQ VGADAVCHGA
           VYVENLRKEF VTDFIFPAVK VNAIYESRYL LGTSLARPCI ARRQIQIAIA EKAQFVSHGA
           LIIKDLKEEF VKDFIFPCLR AGAVYERKYL LGTSMARPLV VQAMVDAAKE VGADAVSHGC

           TGKGNDQVRF ELTFFSLNPE LKVVAPWREW EIGREDAIEY AKKHNVPVPS IYSRDRNLWH
           TGKGNDQVRF EVGYYSLKPD IKVIAPWREW DLSRTKLIEY AEQNNIPVPP PFSMDANLLH
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TGKGNDQVRF ELTTYSLEPS LKVIAPWRDP EFGRSDLMKY AQEKGIPVSA PWSMDENLMH
           TGKGNDQVRF ELSTYALAAG LECVVPWRIP EFGRQDLLAF AKERGIPIAP PYSMDDNMFH
           TGKGNDQVRF ELGYYGLKPD VKVIAPWREW DLSRTKLLAY ADEAGIPVAA PYSTDANLLH
           TGKGNDQVRF ELTFYALAPH IQVIAPWRDD TFGRSDLLAY ARSKGIAMPP PYSMDDNLMH
           TGKGNDQVRF ELTFFALNPK LAVVAPWREW DIGREDAIEY AKKHNVPVPS IYSRDRNLWH

           LSHEGDLLED PANEPKKDMY MMSVDPEDAP DQPEYIEIGI ESGLPVALNG PATLLAELNT
           ISYEGNALED PWTTPDDSMF TRSVSPEKAP DQPTTIEIAF EKGNPVAIDG PATILTKLNE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           CSYESGILED PRALPPPEMF HVCVNPEDAP DKPENIVISF KDGVPTEVHN PLQLFEYLNE
           ISFESGVLED PAATPPESTH KYTTPLAKCK ETHDDVQIWF EKGDPIKVKN PANILKFLNR
           ISYEGNALED PWVEYSEDMF TRSVSPENAP DKPTYIEVEF EKGDPVAIDG PADMLAKLNQ
           ISYESGDLED PACAPRDAIY TKTDPRESWP DTPETVRIEF RDGTPVKASS PLELYLFLNQ
           ISHEGDILED PANEPKEDMF VMTTNPEKAP DTPEYLEISF ERGLPVSVNG PAKLLEALND

           IGGKHGIGRI DMVENRLVGM KSR------- ---------- ---------- ----------
           LGGQNGIGRV DLVESRFVGM KSRGVYETPG GTILQVAHRG MESICLDREE LHMKDDMPRY
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LGRKHGVGRV DIVENRFVGI KSRGVYETPG GTILRCAHMD LEGVAMDREV LRLRDMAPKF
           IGGQHAIGRI DIVENRYVGI KSRGVYETPG GTILRAAHLD IEALTLDREV LRIRDMSLKY
           LGGDNGIGRL DIVESRFVGM KSRGVYETPG GTILLAVRRA LETICLDRGE MHYKDQMPQY
           VAKRHGIGRI DIVENRFVGI KSRGVYETPG ATILRCAHID IEGVAMDREV MRLRDMSPKF
           AGARHGIGRV DMVENRLVGM KSRGVYETPG GTILSLAARE LESLTLDRET MQMKDTALKY

           ------GRWF DPLRESMDAF MITETTTGSV TLKLYKGSVS VTGRQSSLYR QDISSFYNQA
           AQLVYNGFWF SPEREALQAL VTQEYCTGVV KVKLYKGNVQ VQGRKSSLYD KVIASFYNQA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AELVYNGFWF SPEMDFLMAA ISQEHIDGEV QVKLYKGSAM AVGRSSSLYD PELASMYNQA
           SELVYNGFWF SPEMEFLQHS MTQRHVNGEV RLRLFRGNAI VLGRSSSLYN KDIVSMFDVS
           AELIYNGFWF SPEREMMQAA ICSESVTGTV RAKLYKGNVI VVGRKATLYD DRLSTFYDQK
           SELVYNGFWF APEMDFLLAA VSQELIDGWV DVVCFKSNCM AVARSSSLYS ADLSSMYQPS
           AELVYAGRWF DPLRESLDAF MVTETTSGSV KLKLFKGSAV VASRTSSLYR QDISSFYNQG

           DAAGFIRLYG LNGRSMYLVG MMGSGKTTVG KIMARSLGYT FFDCDTLIVA EIFEHFGESV
           DAGGFIKLQA LRGCNIWLVG MMGSGKSTVG KMLANTLKYA FFDTDSVIVS QIFAEEGQDY
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DADGFIKINA ?????????? ?????????? ?????????? ?????????? ??????????
           HSEGFIRTQA ?????????? ?????????? ?????????? ?????????? ??????????
           DAAGFIKLQA LADTSLFLIG IMGSGKSTVG ASLAKALGYN HLDTDELIPS ELFAEAGESE
           DAGGFIRINA ?????????? ?????????? ?????????? ?????????? ??????????
           DAAGFIRLYG ?????????? ?????????? ?????????? ?????????? ??????????

           FRKETEALVV STGGGAVIRP INWKYMHKGI SIWLDVPLEA LAHRILSTIW DARGEAYKAS
           FRCESQIIVI STGGGAVLKP QNWGYMHLGI VAWLNGDTEL LARRVLDALL EDRRKYYNAD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           FRIESMILVI STGGGIVCEK TNWMHLHNGV TVRLHGDSEL LARRVINALL ETRETMYQAD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ARVAFLFPGQ GAQAVGMGKE -GAAGELYKK ANDILGLDST VISQPAIYVT SLAAVELLVD
           VVVAALFPGQ GAQSVGMAKD LPKAKEMFDK ASEILGLDST AVSQPAIYVA SLAAVEKLID
           ???IVLAPGQ GAQSPGMSRT WPAASAIFTK ADAVLSLART DIAQPAIFTA SMACWAALLT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ???AFLFPGQ GAQYLGMAGD LPKAKEMFEQ ASDVLGLDST VISQPAIYVA SLAAVEKLAT
           ITV------- ------MAKE LPAAKAMFDT ASGVLGLNST AVSQPAIYVS SLAALEKMID
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ???AFLFPGQ GAQELGMGKS -GEAAALFAK ASNILGLDST VISQPAIYVA SLAAVEALID

           VTCGLSLGEY TALAFAGAFS FEDGLKLVKL RGEAMSAMVS IIGLDSEKVV QIANYLCPGN
           VACGLSLGEY TALAFAGAMS FEDGLRLVKL RGESMSSMVS VIGLDSAKVV QIANYLCPGN
           ATAGLSLGEY TALAIGGALS FEDGLKLVAL RGRAMGGMLA LIGANEDKAL VAANFNAPGQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VAAGLSLGEY TALSFAGALS FEDGLKIVKV RGEAMSGMVS VIGLDSDTVI QIANYLCSGN
           VAAGLSLGEY TALTFAEALS FEDGLKLVKI RGESMSGMAS VIGLSADKAC SVANYLCNGN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VACGLSLGEY TALVFAGVLS FEDGLKVVKK RGEAMGGMAS VIGLDPVKVV QIANFLCPGN

           YAVSGGLKGI RMTVRLAVAG AFHTSFMEPA VSRLEAALIP VISNVIKKIL ARQVTSPVQW
           YAVSGSKEGC RMTVRLAVAG AFHTSYMSPA VDKLKAALIP VVSNVIKDIL SRQVTSPVLW
           VVLSGATAAI LRVAKLDVAG AFHSPLMAPA AERLREALVP VMSNVIRKML EKQLTSSVRW
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YAVSGAKSAC RMTVPLAVAG AFHTDFMMPA VSKLSDVLIP VISNVIKNIL TRQVTSPVLW
           YAVSGAIPAI RMVVRLAVAG AFHTDFMAPA ADKLKAALIP VISNVIRATL AKQLTNPVQW
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YAVSGGLKGI RMLVRLAVAG AFHTQYMASA VPTLEAALIP VISNVIKEIL AKQVTSPVQW

           ETTVKTLYEL GPGKVIAGIF KRPISNIRNF SIIAHIDHGK STLADKLLQV TGTVQNRDMK
           ENTIKSLYEV GPGKVIAGIV KRPVDRIRNF SIIAHIDHGK STLADQLLLK TGTVKARDMV
           ADCINYLVEL APGKTLSGIM RKPPERIRNI SIIAHIDHGK STLADRLLEV TGTVSSRDMK
           ?????????? ?????????? ??PVERLR-F CIIAHIDHGK STIADRLLQA TGTVQAREMK
           ENTIAAMYEL GPGKVVAGIV KRPAKRIRNF SIIAHIDHGK STLADRLLEF TRTVPDRELQ
           ETTMTTLTEV GPGKVISGIM KRPARRIRNF SIIAHIDHGK STLADTLLMR TKTVKERDMV
           ?????????? ?????????? ??PTERIRNL SIIAHIDHGK STLADRLIQA TDAVGDRDMK
           ETTVKTLYEL GPGKVISGIF KRPVPQIRNF SIIAHIDHGK STLADKLLQL TGTVEDRDMK

           EQFLDNMDLE RERGITIKLQ AARMRYD-TP FCLNLIDTPG HVDFSYEVSR SLACEGALLV
           EQFMDSNDIE RERGITIKLN TARMKYDGEL YALNLIDTPG HVDFTYEVSR SLACEGALLV
           DQFMDSNDIE RDRGITIKLN AARMNYDGLN YVIHLIDTPG HVDFTFEVSR SLACEGALLV
           EQFLDNMDLE RERGITIKLQ AARMNHDGNS YVLNLIDTPG HVDFSYEVSR SLACEGALLV
           QQFLDNMDIE RERGITIKLQ TARMNYNGED YVLNLIDTPG HVDFSYEVSR SLACESALLV
           KQVLDSMDLE RERGITIKLN SARMDYDGEL YVLNLIDTPG HVDFSYEVSR SLACEGALLV
           AQLLDNMDLE RERGITIKLQ AVRLNYDGLV YAINLIDTPG HVDFSYEVSR SLACEGALLV
           EQFLDNMDLE RERGITIKLQ TARMRYDSLP YCLNLIDTPG HVDFSYEVSR SLACEGALLV

           VDASQGVEAQ TLANLALENN LEIIPVLNKI DLPGAEPEKV EIEEVIGLDC SKAIFCSAKE
           VDASQGVEAQ TLANLALEND LEVIPVLNKI DLPGAEPERV EIEDIIGLDC SNILKVSAKM
           VDASQGVEAQ TLANLALDAN LEMIPVLNKI DLPGAEPDRV EIEEVVGLDC TNAVMASAKA
           VDASQGVEAQ TLANLAIENN LEIIPVLNKI DLPSADPERV EIEEIIGLDC SNAILCSGKS
           VDASQGIEAQ TLANLALDAD LTIIPVLNKI DLPGADPEKV EIEEVIGLDT TDSVLCSAKA
           VDSSQGVEAQ TVANLALEND LEIFTVLNKI DLAGSEPDRV EIEDVLGLDA SDAILASAKA
           VDATQGVEAQ TLANIAMENN LEIIPVINKI DMASAEPDRV EVEEVVGIDC TNAVMASAKS
           VDASQGVEAQ TLANLALENN LEIIPVLNKI DLPGADPDRV EIEEIVGLDC TDAILCSAKE

           GIGIEILDAI VQRIPPLRAL IFDSYYDPYR GVIVYFRVID GIFFMASGKD YFADEVGVLS
           GLGIETLEAI VERVPPLRAL IFDSYYDPYR GVVCQFKVMD GVTMMNTGKE YQLDEIGVLA
           GIGIEILQGV INYIPPLRAL IFDSYYDPYR GVVVYFRVVD GIKFMVTKKE FYAEEIGVMT
           GIGIDILEAV VQRVPPFRAL IFDSYYDPYR GVIVYMRVMD GV-------- ---GEIGVLS
           GIGIDILKTL IEKTPPLRCL IFDSYYDPYR GVVTYFRIKS GIRFMNTGKS FLAEEIGVLA
           NIGMDILERI VQVVPPLRAL IFDSYFDPYR GVVAVFRVMD GMKMMATGAT FAADEIGIMR
           GIGIEILSHI VEFIPNLRAL IFDSAYDPYR GVVVYFRVMD GVRFMATGRD FEVDEIGVLS
           GIGIEILEAV VKKIPPLRAL IFDSYYDPYR GVIVYFRVVD GVKFMASGKE YQVDEIGVLS

           PQIQVDELYA GEVGYIAASV RSVADARVGD TITHLPGYEE ATPMVFCGLF PVDADQFPDL
           PKVQVDTLYT GEVGWLAAQI KSVQDARVGD TVTQLPGYQD IQPMVYCGLF PTDADDYQDL
           TQQPVHVLRS GEIGYIIAGI KTVDDARVGD TITTLPGYQE AKPMLFAGLF PVESDQYNHL
           PQKPVAELHA GEVGYLAAGI KAVEDARVGD TVTRLPGYEE AKPMVFCGMF PVNADQYPDL
           PQQPTDTLEA GEVGYLIAGI KTVEDARVGD TITHLPGYAE AKPMVWSGLF PTDAADYDTL
           PKVPVKELGP GEVGYIIGGI KSVADARVGD TITLLPGYSK SVPMVFAGIF PTDTDRYDDL
           PMVPVEQLSC GEVGYLIAGI KTVEDARVGD TITTLPGYEE AKPMVFSGVF PSDASQFNAL
           PQMPVQQLYA GEVGYLAASI RSVADARVGD TITSLPGYQQ ATPMVFCGLF PIDADQFPEL

           RDALEKLQLN DAALKFEPET SSAMGFGFRC GFLGLLHMEI VQERLEREYN LNLITTAPSV
           REALEKLQLN DAALKFEPEV NNAMGFGFRC GFLGLLHMEI VQERLEREYN LDLITTAPTV
           KDSLEKLKLN DAALQFEVEN SAAMGFGFRC GFLGLLHMDV VQERLEREYD LDIITTAPSV
           KESLEKLKLN DAALSFEPEN SSAM-FGFRC GFLGLLHMEV VQERLEREYD LDLIITAPSV
           RDALSKLKLN DAALQFEPEN SAAMGFGFRC GFLGLAAHGS ACTRLEREFD LDLICTAPSV
           RESLQRLQIN DCSLSFEPEQ NSAMGTGFRC GFLGLLHMEI IQERLEREYD LDLITTAPSV
           KDALQKLKLN DAALSFEAEN SSAMGFGFRC GFLGLLHLDV VQERLEREYD LDIITTAPSV
           REALGKLQLN DAALRFEPES SSAMGFGFRC GFLGLLHMEI VQERLEREYN LNLITTAPSV

           VYRVNSVNGD NPSRLPDPGQ RKSVEEPYVK IELLTPKDYI GALMELAQER RGEFKEMKYR
           VYRCKTTDGE SPADLPDASR REWISEPYVR LEMVTPTDYV GNLMELANGR RGEFVEMRYR
           VYSVMPTKGE NPADLPEATK REFISEPYCK LEIITPEEYV GTLMELAQGR RGEYVDMKYR
           VYKVNTVKGE NPALLPEPTL RESMEEPYVR VDMITPESFI GPLMELGQTR RGEYIDMKYR
           VYQVKPMKGE NPSELPEPTK REWIAEPYAR LEMITPDEYV GPLMELAQNR RGVYKDMKYR
           VYNVYRTDGT NPADLCPPEL RERIEEPYCR LDMIAPSDYV GTLMELASQR RGEFIDMTYR
           VYRVKPTKGD NPADLPDPTR REYIEEPYVR LEMITPEEFV GPIMELSQSR RGEFVDMRFR
           VYNIERLDGE NPSELPE--N RKCISEPYVK IDLITPKEYI GTLMELAQER RGEFREMNYR

           ASILYELPLA EMVGDFFDQL KSRTKGYASM EYSVIGYRES DLIKLDILIN AEMVEPLSTI
           TTLVFNIPLA EVVTDYFDQL KSRSKGYASM EYKITGYREN DLVKLEVRIN GEPADPLSVI
           TTLVYDLPLA ELVNDFFDHL KSRTKGYASM EYSFIGYRKN DLVRLDVAIN GEPVDALSSI
           VSLTYEVPLA EVVTDFFDQL KSRSRGYASM EYNLIGYRPN PLVKLDILIN GDPLDPLATI
           TTIVYEMPLA EMVTDFFDHL KSRSKGYASM EYSLIEYRQN DLVRLDVAVN GEPVDALSFI
           TSIKYDIPLA EVVTNYFDDM KSRSRGYASM EYAITGYRQS DLVRLDVLIN QEPADPLAVI
           TTLVYELPLA ELVTDFFDCI KSRSKGYASM EYSLSGYRKN KLVKMDVCVN GELIEPLSCI
           ACVVYDLPLA EMVGDFFDQL KSRSKGYASM EYSITGYRVS DLVKLDIRIN GEPVEPLSAI

           VHRDKAYSVG RALTQKLKEL IPRQMFKVPI QACIGSKVIA SEALSAIRKD VLAKCYGGDI
           CHRDNAYRTG RQLTGKLKEL IPRQMFRVPI QACIGQKVVA SEAIAPYRKD VLAKCYGGDI
           VHQEKSYAVG KALVKKLKEI VPRAQFKIPI QAKIGAKVVA SQQISALKKD VTAKCYGGDI
           VHKDR????? ?????????? ?????????? ?????????? ?????????? ??????????
           LHRDNAHGIG KELCLKLKEI IPRQMFKVMV ETSRGRRNCS RNRLRARSA? ??????????
           THRDRAYSIG RQLVDKLKEL IPRQMFRIPI QAAIGNKVIA ATSISAMRKD VTAKCYGGDI
           LHEDNAYDVG KDLTKKLKEI IPRAQFKIPI QAMIGARVVA SSTISALRTD VLAKCYGGDI
           VHKDKAYTIG RALTEKLKSL IPRQLFKIPI QLS------- ---------- KLLNAAGGDI

           SRKKKLLKKQ AAGKKRMKAG RVDVPQEAFM AVLKLPGLYL VGTPIGNLED ITLRAIRVLR
           SRKKKLLQKQ AEGKKRMKAG KVEVPQEAFM AILKIGGLYV IPTPIGNLQD ITLRAADTLR
           SRKKKLIQKQ AAGKKRMKAG KVNVPQEAFK AMLSIGHLYV VSTPIGNVAD LTYRAAAILH
           ?????????? ?????????? ?????????? ?????GTLYV VSTPIGNLQD ITLRALNVLK
           ?????????? ?????????? ?????????? ?????GTLYV VATPIGNLND MTVRAVNVLK
           SRKKKLLKKQ AAGKKRMKQG KVEVPQDAFL AVLSVPGLFL VATPIGNLED VTLRALRVLR
           SRKRKLLDKQ KKGKKRLRQG KVNMPQEAFM AIVSVGTIYL VATPIGNMAD ITARALSILD
           TSKKKLLKKQ AEGKNRMKSG RVEVPQDAFM AVLRLSGLYL VATPIGNLED ITMRALRVLR

           SADVILSEDT RHSGKLLQYY NISYHKFNEA QREQAVLTRL VALISDAGTP GISDPGTQLA
           RVHLLLAEDT RHTRKLLNFL GISCHEHNEK LRLSRVLQRL VGLVSDAGMP GISDPGAVVI
           TASVIAAEDT RRTGLLLSAA VGSCHEHNVR SRIPDLLTRL VALVSDAGTP CVSDPGAQLV
           QVDAIAAEDT RHTIRLLRHF GIRRQPQRPA SRDDPLAGLR TTSTTDAGTP GISDPGAEL-
           QVDVIASEDT RHTGRMLKHF DISHHEHNRQ GSVSEIVNMA IAIVSDAGTP AISDPGTEVV
           DADAVLAEDT RRTKQLMRAY DISYHAHNEA KRRESVLGRL LALVSDAGMP TVNDPGADLA
           TVDVVAAEDT RRTGLLLARL FPSYHAHNTH ARTPHLLSLA VAVVSDAGTP GVSDPGSELV
           SVDLILAEDT RHSSKLLQHY DISYHKFNEQ TRQEEILERL LALVSDAGMP GISDPGAELV

           KMCAKENIDV IPIPGACAVV AALSASGLET DEGFLPKHRK ERLIVSSNER TQIFYVPPHK
           AAAVAAGVNV VALPGPCAFV TALVGSGLAT DAGFLPPKRR RVLDSLAAVG TLIMYAPPHG
           KAAVEAGMPV VPVPGACAAL AALVASALPL GEGFLPRARR KAMEKIAALG TVVVYEAPHR
           ---------- ---------- AAVAASGLPL DSGFLPSRRR EAVEALKSER PFILYEAPHR
           RACLQEGIRV EPIPGACAAV AAVSISGMAK EGGFIPAKRQ QFVERVVSSS PMVLYEAPHR
           ARAAAMGVRV FPVPGPSAVL AAIAGAGLPT DEGFPPPKRA KRFKSFARNA TLIMFVPPHK
           AAAVRACVPV VPVPGACAAV AALIASGLDT SSGFLPTRRA KELGRLASLS TLVLYEAPHR
           RACIEENYKI IPVPGPSAAL TALIASGLPT NEGFLSTHRH KRLLVAAEES TQIFFVPPNK

           LSQFLEETTP YFGRQCVIAR EITKLHEEFW RGSIAEAPKG EITLLIEGGH SLSTAVKTVA
           LAAVLADCVA VLGRRCCVAR EISKLHEEYF RSTLEGAARG EIVLLVEGGT PVSSAVKEVV
           LLVTLDALRG PAFRHVCLAR EVTKKWEQFM RSSPAEAPRG EFTIVLGPGV PASAVARGIA
           LQSTLEALEG ALGRAVVLAQ TRLQIY---- -------PPD SCCVLFDV?? ??????????
           LLATLEDLCA HCPRDVIVAR ELTKIHEEVF AGKLREAPRG EFTLVIEGGI PVSSAVKAVA
           LIGTLEDAHA ALGRRCSVCR ELTKVHEEFW RSTLSEAPRG EITLVIEGGA SPSDASRRVA
           VAASLAAIAE VPSRQVAVAR ELTKVHEEFR LAGAGAALKG EFVLVLGPGV PVSVAARGVA
           LCSILAECAT AFGRHCVVAR ELTKIYEEFW RGTLGKAPRG EVTLLIDGGK SLSEAVKEVS

           ERTKKEVYSL YVHLPFCRKR CHYCDFPILA LGYVNLLVRE ILETVFFGGG TPSLVPPKLV
           ANLKKAAYAL YIHLPFCKRK CFYCDFPVEA VGYVEALLRE VLETVFFGGG TPSLLPPELL
           SAAKKLVYAF ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ELFKNRLKQF YIHIPFCKQR CFYCDFPIKV LGYVEALKTE MLETVYVGGG TPSVLDPEHL
           KELRRETYGV YVHLPFCRSR CYYCDFAISV VGYGAATRAE VLETVFFGGG TPSLMPADEI
           AATRRALYAH ?????????? ?????????? ?????????? ?????????? ??????????
           EETRNSVYSL YVHLPFCKRR CHYCDFPIVA LGYVDLVCQE ILQTVFFGGG TPSLIPIPLL

           SLILETLEIS MEMDPGTFDG QKLDLMKLGV NRVSLGVQAF QDELLKACGR AHGVSQVYEA
           ARILEALEVS LEADPGTFDL ARLEYRRLGV SRLSVGVQAF QQELLTACGR GHDLLEAEAA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EQILSRIEIS IEMDPGTFDK QKASFKKLGF TRVSMGVQSF NERSLKACGR GHSVQEVYDG
           KAILGSLEVS AEMDPGTFDE EKLAFLAAGV NRVSLGVQSF DDGVLQRAGR SHDARAAEEA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QRIIQALEIS MEMDPGTFSR DYLAIQSCGI NRVSLGVQAF DDDLLKLCGR SHCLDDVFQS

           SMDLISSLPH QTLEMWEESL RLAIESQPHV SVYDLQVEQG TKFETQSAEF YASSMLAGYE
           SLDLISGLPG LTPDMWAASL QRAVAAGPHV SVYDLQVEEG TPFDEAAVEM YASQVLAGFE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SMDLISGLPG ETEKCFTHSL QSAVDLSPHL SVYDLIIEDH TAFENLAGDF YSHDFLRGYE
           SADLISGLPG VDAKTWRTSL ERVIEAGAHV SVYDLQVERG TAFEDASAAM FASATLAGYE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SLDLISSLPH HTLASWRKSL EQAIAASPHV SIYDLQIEQG TKFDDDSAEF FGSSMLAGYD

           HYEVSSYSGF KCKHNLIYWN KPFYAFGLGS ASRFSRPRRL KEYTNYATDI LMLSFRTLKD
           HYEVSNYAGH RCAHNQVYWG LPYYAFGLGA ASRFSRPARM QPYLQWLLDS LMLALRTLSD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           HYEISNYAPF HSRHNTMYWR RPFYGFGMGA TSRLARPRNL EAYLDWLVET FMVGLRTLTA
           HYEVSSYAGA RCKHNQIYWN AGWYGFGLSA TSRVARPRKM NEYYAYLFEH IMLRLRTLTD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           HYEISNYAGF QCRHNLVYWN QGYYAYGLGS TSRVKRSKRM REYAKFILDT VMLALRLLTD

           PDGFLLSNEL IIRRAADLSE MSAGLTSPHP NFGCVIVAGE GYLYAQGTKP AEALAVEAAG
           PDGFLLSNDV I????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PRGFLYSNTV L????????? ?????????? ?????????? ?????????? ??????????
           PEGFLVSTAV LMTRVCELAR AREGIAAPHP LSACAVVVVE ATHAGQGSTR AEIACADEMR
           ?????????? ?--------- ---------- ---------- ---------- ----------
           PNGFLVSNEI IMLRAAELAD GSAGHTAPHP NSACVIVVGE AFLYGQGTRC AEIQAVEMAG

           GATAYLNMEP GDCHGDH-TA VSALVQAGIE RVVVGIRHPL QHLRGSAIRE LRSHGIEVNV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RGTVYVNLEP GEVAGET-RS VEALAATGAT RAVVGMLHPL PGLRGRAVRA LRERGIEVCV
           ---------- ---------- ---------- ---------- ----GRG--- --GAGGAVEV
           GATAYLNLEP GDCHGDD-TA IKALKQSGVA RVVVGLQHPL KHHSGKAIAA LRGLGIPVDV

           VNAPLIHRAC SRVPFSLKYA MTLDGKIAAS SGHAAWISSK LSRTRVFELR GGSDAVIVGG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TNEALLYRVA TGLPFSYKYA MTLDGKIATD TGHSSWVTGA EAREMVFRER KRADAVVVGG
           LVAPFFWWKR TGRPYGLKYA MTLDGRIATD AGDARWVSGP PARGVVQQLR GGGDAIVVGG
           VNAPLLYRAT HEVPFSLKYA MTLDGKIAAS TGHASWVSSK MSRQRVFETR GRSDAIIVGG

           NTVRQDDPRL TPTRIVMTQS LLASKGVEFH LRGSILWECG GTLAASAISS SVIHKVVAFV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GTVRKDNPRL TPARVVLTRS LLRAKGVEMF KRGRCFWECG GGLAAPAMKS GVFHEVLAFI
           NTVRLDDPQL TPLRVVVTRD VLSAAGVELG ARGSVLWECG GGLAGAAMAA GVVQRVVAFV
           NTVRRDNPRL TPVRVVMSRT LLVTRGVECY ERGTVLWECG GALSAPALAA GIIHKVIAFV

           APKIIGGSKA PSPVGDLGMV EMTQALNLDM LVSGILLAGG QGKRMKPKQY IPLLGQPIAL
           ?????????? ?????????? ?????????? ????VLLAGG VGKRMGPKQY LELRGQPIAT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ????ILLAGG VGKRMGPKQF LPLQGRPIV-
           ?????????? ?????????? ?????????? ????ILLAGG VGSRMKPKQF LELEGKPILR
           APKLVGGALA PTPLGNLGIE AMHDALPLDI LIRGVLLAGG VGKRMGPKQY LPLMGTPIAL
           APKVVGG-GV YGPVGGFGLT AMADALPLDV MVVG------ ---------- ----------
           APKIIGGVTA PTPVGELGMV EMTQALNLDM LVSGILLAGG VGKRMGPKQY LRLLGQPIAL

           YSFEIVVVCD PFFLRFAIPG KERQDSVYSG LQEIDSELVC IHDSARPLVN TEDVEKVVLG
           YSLEIVIVCD PSWFKWALPG AERQDSVFNG LQQVDAAIVA VHDSARPLVT AADALRCVLG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---EIVIVCD PSSIKYALPG KERQDSVYNG LQEIDSQLVA VHDSARPLVE RDSVRLVALG
           HSLRIVIVIA PEYICFAEPG KERQDSVFNG LQETATSLIC IHDAARPLVT EQEILSCVLA
           WSLEIVVVCD PSYLVFARPG KERQDSVYNG MQAARAELLA IHDSARPLCA ATDARRCVLA
           ---------- ---------- ---------- ---------- -HDAARPCVT AAEVRAVVLG
           YSFEVVVVCD PSYVKFALPG RERQDSVFSG LQAISSKLAC IHDSARPLVL GHDIQRVVLG

           VPAKATIKEV VVKTLDRKTL WEMQTPQIKP ELLKKGFELV KSEGLEVTDD VSIVEYLKPV
           VQVKPTIKEV VIQTLQRSKL WEVQTPQIRP ALLKEGFDLV KRNNLEVTDD VSIIEAMGPV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LRLIGLDQEV VERTPDRSRL YEIQTPQIRP KILQAGYDKV DTEGLAVTDD LSIVELLGPV
           VPMKATVKES VLRTIERSRL WEIHTPQIRP ALLREGFKKV KELNLAVTDD VSIIEQLPPV
           VQSKATIKEV IDKGLDRSRL WEMQTPQMRP ELLRAGYDLV NSKGLEVTDD VSIVEALGRV
           VPVKATVKEA VARTLDRGRL WEAATPQVER GLLERGFAEV RQSGAAVTDD VSVVEAVGRV
           VRVKATIKEA VKKTLNRQNL WEMQTPQIEP SLLRQGFGLV ERDGLEVTDD VSIVEFLKPV

           YVSQGSYTNI KVTTPDDLLL AERILSGVLG CQWGDEGKGK LVDILAQHFD IVARCQGGAN
           KITPGAYTNI KVTTPDDMAV AEKFLSVVLG TQWGDEGKGK LVDNLAQQFD IVARAQGGAN
           ?????????? ?????????? ?????LVVLG AQWGDEGKGK LIDLLTSQYD ILARAAGGAN
           RITMGEYTNL KITTPEDMVI AESILTVILG SQWGDEGKGK LVD-LCSSFD IAARCAGGSN
           KITVGEYTNI KITTPEDMPM ARSILVVVLG AQWGDEGKGK IVDVLCRDMD IVARCQGGSN
           QVTPGSYFNL KVTTPEDMFI AERLMARVLG SQWGDEGKGK LVDILAREYD VVARCQGGAN
           KLTRGEYTNL KITTPEDMLV AEAILLVVLG AQWGDEGKGK LIDLLASRYD MVARCAGGSN
           FITEGSYSNL KVTTPDDMLV AERILCAVLG TQWGDEGKGK LVDILARHYD IVARCQGGDN

           AGHTIYNGKK FALHLVPSGI LNEDTTCVIG NGVVVHLPGL FKEIDGLESN GILVSDRAHL
           AGHTIYDGRK FALHLVPSGI LNPKATCVIG NGVVLHLPGL FEEIRRLKEK GLLVSDRAHL
           AGHTIVVGVK YAFHLLPSGL LNPHCLALIG NGVVLHVPKF LSELASLSEK GVRISDRAHL
           AGHTIVVGKK FAFHLIPSGI LHKNCVCVIG NGVVLHLPSF FKELESLKAQ GVKVSDRAHL
           AGHTIKVNSV YKFHLLPSGL VHTNTTCVIG NGVVVHIPSF FNEIEDITNP SIFVSSRAHL
           AGHTIYDGKK YALHLVPSGI LNENATCVVG NGVVVHLPGM FDEIDALLKA GMMVSDRAHL
           AGHTIVVDVK YAFHLLPSGL LNPHATAVIG NGVVVHVPSL MKELTSLEAQ GVRLSDRAHL
           AGHTIYDGDK FALHLVPSGI LQRDTVCMVG NGVVVHLPKL FEEIKQLEAK GIRVSDRAHL

           LFDFHQEVDG LRESFIGTTK RGIGPAYSSK VIRNGIRVGD LLPQKLDLLL SDAAARF---
           LFDLHKEIDG LREAQIGTTK RGIGPAYSSK ATRNGLRVCD LFKTKLTNLA ADGAKRF---
           LFDYHQIVDG LREVKIGTTG KGIGPCYSSK ANRTNMRVGD LFPDAFRRSL ASKHKRF---
           LFDFHQIVDG LREGSIGTTK KGIGPCYSSK ANRSGIRVGD LFPEALRRCV RNKFKRF---
           VLDYHQWEDG VREAAIGTTK RGIGPALSSK AHRTGLRVGD LFEAKLRKNL ADLEQQFYRG
           LFDLHKEIDG LREAKIGTTK RGIGPAYASK ATRNGVRLGD IFANALRTLA ADAAARF---
           LFDYHQVVDG LREVKIGTTK KGVGPAYSSK ANRTGLRVGD LFPAAFRRSL ASKHKRF---
           LFDFHRTVDA LREAMIGTTK RGVGPCYASK ATRNGIRVGD LFRDKLEILL EDAAARF---

           -KEVEAYKRY ADRLEPYITD TVHFINDSIS QKKKVLVEGG QATMLDIDFG TYPFVTSSSP
           -ADIAAYEKL AEEIRPFVVD TVEYLHEALQ SGKRILIEGA NATMLDLDFG TYPYVTSSNP
           -DEIARYYEY AQVLEPNITD TVAELNHAIS NKEHVLVEGA NAALLDIDFG TYPFVTSSNC
           -DEI-EYREY AKRLAPMVTD TVFYINDAYS KGKRILIEGA NATLLDIDF- TYPYVTSSNA
           APEIQRYKEY AQKLKPYVVD TVDYIHEAVA SGKKILIEGA NAAMLDIDYG TYPFVTSSNC
           -EEIVRYREI ASRIEPFIAD TVEYVNDAHR NGKKILVEGA NATMLDLDFG TYPFVTSSNP
           -DEVARYYEY AQVLEPNITD TVALMADAIT GGERVLVEGA NAALLDVDFG TYPYVTSSNC
           -TEVVRYRDF AEKLGPYIAD TVYLINQAYH DKKKILVEGG QATMLDVDFG TYPFVTSSNP

           SAGGICTGLG IAPSVVGDLI GVVKAYTTRV GSGPFPTEGT GGDLLRLAGQ EFGTTTGRPR
           SIGGIATGLG LPPSSYDDIV GVAKAYTTRV GAGPYPTEGK LAEDLRAVGH EYGTTTGRPR
           TAGGVITGLG IPPTAIDKVV GVVKAYTTRV GQGPFPTEDK SGVTLQVEGH EYGTTTARPR
           SIGGACTGLG ISPKKIGAII GVVKAYTTRV GAGPFPTEDA VGEKLRARGH EFGTTTGRPR
           TIGGCFTGLG IPHTAIGEVI GVVKAYTTRV GSR??????? ?????????? ??????????
           AIGGVSNGLG LAPRKFETII GVAKAYTTRV GAGPYPTEGD VADKLRELGY EYGTTTGRPR
           TIGGVSTGLG IPPRHIGHVV GIVKAYTTRV GEGPFPTENE LGERLQRVGH EYGTTTARPR
           SVGGVCTGLG IAPKRLGDII GVAKAYTTRV GAGPYPTEGE LGQSLRETGN EFGTTTKRPR

           RCGWLDIVAL KFSCQINGFA SLNLTKLDVL SDLNEIQLGV AYKFPGDLRL LEELHVEYEV
           RIGWMDIVAL RYACKINGVT HINLTKLDVL DNLEEIQVGV GYKVPADLHT LENVEVVYET
           RCGWLDTFML NYTHSVNGYT EVCLTKLDVL SHFETIKIGV GYIYPASLKL LAEAEVEYVE
           RCGWFDAVVV RYSHMINEYT HINLTKLDVL DDHTEIKIAV DYKFPASLED LAKVEVVYET
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RIGWLDMVAL NYANQINGFT HLNITKLDVL SEMDELKIGV AYEFPADIAT LENVKVVYET
           RCGWLDTFML RYTNSVNGYT AVGLTKLDVL SAFETVKIGT GYTYPASLET IGEAEVVYEE
           RCGWLDVVAL NYSCEINGFT SLNLTKLDVL SNLPEIKLGI AYKFPADLSF LEKVKVVYET

           LPGWKDISSV RNYSDLPKAA QQYVERIEEL VGVPIHYIGI GPGRDALIYK X?????????
           LPGWQDISAA RQWAQLPAAA QAYVQRIEDL IGIPVKWIGV GPGRDALVVK PEAPKKX???
           MPGWKDIMGV RKFEDLPENA QKYVIQVEKL INVPIRYVGV GPGRDAIIYR D?????????
           LPGWNSIAQC RKFSDLPADA QAYVRRIEQL TGCAVRYIGV GADRAEMIDT QTSX??????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LPGWKDIANV RSWDDMPENA KKYILRCEEL SGVECRYIGV GPGRDAMVIK PX????????
           LPGWEDITQT RTWEALPENA RKYVERVEQL MGVAVQWIGV GPGRDAVIVR NPVPTA????
           VPGWQDISSV RKFKDLPGAA KAYVQRIEEL VGIKVQFIGV GPGRDALIVR DX????????

           ??WVCESCGH SEGQWWGSCR CHKVGTMKRF GNEVARVLGG GLAPGSLILI GGDPGIGKST
           ??YPCKYCGH VHSRYHGKCQ CGAFGAMPLT GAEVQRVLGG GVVPGALVLL GGDPGVGKST
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ??-------- ---------- --GWG----P SAEINRVLGG GIVPGSLVLV GGDPGIGK--
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ??YVCAECGE DSRQWLGQCP CKSWDTMKAL GKEIERVLGG GVVPGGMILV GGDPGVGKST
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           LLLQIALYIS GEESVEQIGS RADRMSSDLQ DILNKAHIID SIQVTGSAGG LTQVKECTST
           ITLQVALYVT AEETREQVVS RSRRMRSEMA AIVRAVLVMD SINLPQAPGT VTQIRECGQL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ----VALYVS GEESAQQVAL RAARLETSVE AVEEQIRIVD SI-------- --QVRECAAR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ILLQLALYAS GEESVEQVAG RAERMATRLE NILEAVSVVD SIQATGSPGS VSQVRECATA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           LLRFAKIPVF LVGHVTKAGD IAGPRVLEHI VDVVLYLEGE ETYRLLRSVK NRFGSTDELG
           LLRLAKIALF IIGHVTKGGE MAGPNMLAHM VDTVLYLEGD VSVRLLRVVK NRHGSDAECG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LLRLAKIPIF IVGHVNK--- -------AHI VDCVVYVEGE RTLRLMRAVK NRFGSTDEVA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LLHAAKMPVF IIGHVTKSGD IAGPRVLEHI VDVVLYLEGD AAVRILRGHK NRYGSTDEVG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           VFEMGLEVVS NPSGIYLSQQ GLAVAVVMDG SRSFLIEVQA LCSPGS--RH VNGVQASRAM
           VFSMGLHAVA NQSALFLESR SSVVGVTMQG SRAILVEVQA LVSPLGSYRS ATGVDKGRLT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VLEMGLRDVA NPSALFLSEG GSAVHVAVEG SRCLLVE--A LCTPTFPRRN CNGVDVTRLH
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VFQMGMKPVA SPSALFLGER SAAPTVTVQG SRPFMLEVQA LTNERAPIRT AVGLRFERML
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           IIAVLMKQAG LRIQENGIFL NVANGMTAGD LAIAAAICSS FLEFPIPHGV AFIGEIGLGG
           LCAILDKHVT LELANCSVIV NVVGGAVASD LAIAVAVAAS YYNVAVPRDL AVCGEVDLAG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LLAVLSKRAR LSLYRQDVFV NVTGGLPASD LAVVA????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LLAVLAKFVG RRLQKHDVFI NIVGGMPSTD VAVALAIASS FVEKPLPPDM CFFGEVGLGG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           EVRVPRMEKR VSTVAKLGFN KCVVPIIGCK NLKELINAVM AEPYLIRKMT WKELSVKLAD
           RVRFQRLDVR VREAAKLGFR RVVIPVVAVR TVAEALLAG- ----MVDKLT FKELQMRMAD
           ?????????? ?????????? ?????????? ?????????M DAGAMIRKLT FDSMTMQLAD
           ?????????? ?????????? ?????????? ?????????V EYQILNNKLN FDELTRRLGD
           ?????????? ?????????? ?????????? ?????????M ADDAMILRLQ FEELTSQLGD
           ELRVMQAERR IAEAATMGFK RVLLPLVRCN TLADALEAA- ---------- -------MAD
           ?????????? ?????????? ?????????? ?????????S STASLIRKLT FENINRQLAD
           ?????????? ?????????? ?????????? ?????????A TEPYIISKLT YKELTVKLAD

           PDVVSNQSEY QKLAQSMSEL DEVVTVFRRF KDCEKQLLES KVLAKDMAEM IGSEINSLTK
           PEVAASATEF QKVAKAASDL ETTVNTYRAY QDTEQQLADA QKYLKEMAEF AREEIAELEA
           PDVCGDSKEL MRISKARAAL EPVVAAYDDW MASTSALEEA KELFSEMKEI AREEVNSLEQ
           PELASNPDEL MRVARARSEL EEVVTAFNRY KEVQ-TIEDA KVLIEDLVAM AKEELSMLED
           PSLANDPTEL LRVTKKRASL EDIVTCFNDW KTSNEELEGA NLLFQELREM AREEIKTLEA
           PSVTGDPKEF QKLSKALGEL TSVVEQYARY KECMKEISEA RAMAKEMVAM AKEEIDALTT
           PAVCNDSREL MRLTKVRAAL EPVVEAYEQW LSSNEQLTEA RELFAEMREM ARAEISELEA
           PDVANDPSEF QKLAKAIADM EEVVTSYQKY KESQRELDDL QEMIKELAEM AVEESAILKE

           EIEELEKQLK VLLLPSDPLD ARNILLEVRA GTGGDEAAIW TGDLVRMYQR YSERSSWKFS
           SLTKLQDALR LQLVPRDPLD DRNIMLEIRA GAGGDEASIW AGDLMRMYQR YANKQGWKAS
           HLRDLEEMLK ILLLPKDPND EKNCMLEVRA GTGGDEASIW AGDLVRVYMK YAAEQGWSVA
           ELVQLEKDVK LMLLPKDPLD EKNVLLEIRA GTGGDEASIW AGDLVRLYTK YAETQSWKVK
           KIQELEEQLK VLMLPKDPND ERDVMLEIRA GTGGDEAAIW ARDLLEVYTR YAKTQSWTTS
           ESDALVETMT LALLPKDPLD EKNIMLEIRA GTGGDEAGIW AGDLYRMYMR FAEREGWQTS
           SIEELEEQLK VLLLPKDPND EKNCMLEIRA GTGGDEAGIW ASDLVRVYTK YAEAMSWRVS
           NITNLEEYLK VLLLPSDPLD SRNIMLEVRA GTGGDEAGIW AGDLVRMYQK YAEQNRWNWS

           MVSCSEAHGG YKTCVMEIKG NRVYSKLKYE SGVHRVQRVP QTETQGRVHT STATVAIDEV
           LVSCTQAAGG YKEIILQING DSVYSKLKWE AGVHRVQRVP ATEAAGRVHT STATVAVEEV
           LVSESEGDGG YKECILEIRG DAVYSKMKYE AGVHRVQRVP ATETQGRVHT STATLAIDDV
           LVSESEGHGG YKECILEVQG EKVYSKLKWE AGVHRVQRVP ATESQGRVHT STATVAIDEV
           MVDESES--- ---FILQVKG DSVYSKLKYE AGVHRVQRVP ATETQGRVHT STATVAIDEV
           VVTNNPAAGG YKEIVVEIKG DDVYSSLKWE AGVHRVQRVP ATETQGRIQT STATVAVDEV
           TVSESLSAGG VKECVLEVTG DAVYSKLKYE AGVHRVQRVP ATEAQGRVHT STSTVAIDEV
           PISQTEAKGG FKEYVLEITG DRVYSKLKYE SGVHRVQRVP ATESQGRVHT STATVAIDEV

           EVVIDPKDIE LTSARSGGAG GQNVNKVETA IDLFHKPSGI RIFCTEERTQ IRNKARAFQL
           DVALNMNDID LKFARASGAG GQNVNKVETA VDLMHKPTGI RVFCQEERTQ AQNKERAFQI
           EVKIDPKDIE LSTTRSGGAG GQNVNKVETA VDLMHKPTGI RIFCTQERSQ LKNRERAMQI
           DVHIDPKDIE LKTARSGGSG GQNVNKVETA VDLIHKPTGI RIFCTQERSQ LQNRARAMEI
           TVKIDAKDIS LTTARSSGAG GQNVNKVESA VDLVHIPTGI RVFCQQERSQ LKNKEVAMQI
           EVKIDDNDLD ISTARSGGAG GQNVNKVETA IDLMHKPTGI RVFCTEERTQ MKNRIRAMQI
           EVKIDMKDVD ISTTRSGGAG GQNVNKVETA VDLMHKPTGI RVFCTQERSQ LKNRELAMQI
           EVVIDPKDIE LTTARSGGAG GQNVNKVETA VDLFHKPTGI RIFCTEERTQ LKNKARAFQL

           LRAKLYEIKV REQQEKIRNE RKSQVGTGAR SEKIRTYNYK DSRVTDHRLK MNFLTTFLDG
           LRAKLYELEL QRQQAEIYAA RKSQVGTGDR SEKIKTYNYK DSRVSDHRIK MNFLNSIIEG
           LRAKLYELEL AEQNAEIYGR RKSQVGTGSR SEKIRTYNYK DSRCTDHRLG QNFLQDFLNG
           LRAKLFEIKL QEQQAEVRSL RQSQVGTGAR SEKIRTYNYK DNRASDHRIN QNFLQQFLDT
           LRNKLYELQM EEQMSEISKQ RKDQVGTGSR SEKIRTYNWK DGRCSDHRLN KNFLQQFLSG
           LRAKLFELQL EEQRKAVSDK RKSQVGSGSR SEKIRTYNWK DSRVSDHRIG ANFLQNFLDG
           LRAKLYELEL EAHNAEVSGR RKAQVGTGAR SEKIRTYNYK DSRVSDHRLG RNFLNSFLEG
           LRAKLYEMKL AEQQEKISSQ RRSQVGTGAR SEKIRTYNYK DNRVSDHRTK INFLDSFLSG

           ALEDAVQACA ALEQKELMEE LTVRRKTRTV MVGNVALGSE HPIRIQTMTT SDTKDITGTV
           DLEDTLQAMI SADQQEKLKE LTIRRPTRTV MIGKVPVGSQ HRIALQTMTT TDTRNVQLTV
           NVENIVQACI FQDQQAMLEA LIQRRETTPV RVGDIIIGAS NPVVVQSMIN EDTLDIDGSF
           CRVSLKIGSG FPPFHEMLAT IINRRKTRSV RVGNIYIGSE HPVVVQSMIN EDTLDVYAAA
           DLESIIQECI FKDQQQKLAD MTTRRKTRTV QCGDVPIGSE HPIALQTMTT AMTTDIQGSI
           DIKGAIGGMQ ALEQEEKLAE LTVRRKTRTV HVGNVKIGSE HPIVKQTMTT SDTRDVEKTV
           DIDDMIQACI FADQQAQLEE MVIRRKTRAV RVGDISIGGG NPVVVQSMIN EDTLDVDNAT
           NIESAVQACA AVEQKQMLEE LTIRRQTSTV MVGNVAVGSE HPIRVQTMTT TDTKDVLGTV

           DEVMRIADKG ADIVRITVQG KKEADACFEI KDKLVQLNYN IPLVADIHFA -PTVALRVAE
           DQVKKCADAG ADIVRITVQG KKEAEACMKI REQLFKDKYD VPLVADIHFQ -PTVAMMVAD
           ASIKEMHEAG CEIVRITCVS MAHAHAVGFI KEKLRKEYMD VPLVADVHHN GLKIALEVAK
           DAIRRLHEAG CEIVRVTTP- LAHAKAVRLI KERLRETYMD VPLVADVHHN -MNIALEVAK
           DQVMRCADAG AQLVRLTVQG QREADACSKI KEGLLKKGYT TPLVADIHFA -PKIALQVAD
           AEVIRCADAG AEMVRITVQG MQEAKACKII KETLVAKGYD TPLIADIHFA -PKVAMMVAE
           ASIRALHEIG CEMVRVTCVS MAHAHAVGFI KEKLRAEYQD VPLVADVHHN GMKIALEVAK
           DQVMKIADRG ADIVRITVQG KKEADCCYEI KNTLVKKGYS IPLVADIHFA -PSVALRVAE

           CFDKIRVNPG NFADRRATED EYQKELQHIE QVFTPLVEKC KKYGRAMRIG TNHGSLDRIM
           AFEKIRVNPG NFADGRKDPR EFERERELIE ETFTPLVLKC KELGRAIRIG TNHGSLARIL
           HVDKVRINPG LYVFEKPTPK EFDAAEEKLR KTLEPLIISL RDQGKALRIG VNHGSLERML
           HVDKVRINPG LYVYEKPTPE EFEKIAVEIR QQLEPLVTSL REQDKALRIG VNHGSLERML
           AFDKIRINPG NFADGRKNPE DYKAELDYIE EVFTPLVLKC KELGRAMRIG TNHGSLARTL
           CFDKIRVNPG NFADGRKTDE EYNAELAEIE EIFTPLVLKC KERGVAMRIG TNHGSLARTL
           HVDKVRINPG LYVFEKPSDE EFNRLKDKLK ATLTPLVLSL KEQGKAMRIG VNHGSLERMM
           CFDKIRINPG NFADRRATED DYQKELEHIE AVFTPLVEKC KKYGRAIRIG TNHGSLDRTM

           SYYGDSPRGM VESAFEFARI CRKLDYHNFV FSMKASNPVI MVQAYRLLVA EMYVHGWDYP
           SYYGDTPRGM VESAFEFADV CRKHDYHNFV FSMKASNPLV MVQAYRLLAE EQYKRSWDYP
           FTYGDTPRGM VESALECIRV CEDLNFHNIV ISMKASKVLV MLAAYRLLSR RLAEEDMPYP
           FTYGDTPEGM VESAIEFIKI CESLDFYNII ISMKASRVPV MLSAYRLMAK RMDELGMNYP
           SYYGDTPAGM VESAFEFARI CRKHDYHNFL FSMKASNPKV MVQAYRLLAA EMYDLGWDYP
           SRFGDTPMGM VESAFEFARI CRKHDYHNFV FSMKASNPLV MVQAYRLLSH EMYKLGWDYP
           FTYGDTPRGM VESAMECIEI CRELDFHNLV ISMKASKVPV MIAAYRQLAL RLDAEGYDYP
           SYYGDSPRGM VESAFEFARI CRKLDFHNFL FSMKASNPVV MVQAYRLLVA EMYVNGWNYP

           LHLGVTEAGE GEDGRMKSAI GIGTLLQDGL GDTIRVSLTE PPEEEIDPCF NLLQGCRMRN
           LHLGVTEAGE GEDGRMKSAI GIGALLMDGL GDTIRVSLTE DPEFEMDPCF GLLQGCRMRN
           LHLGVTEAGD GEYGRIKSTL GIGTLLAEGL GDTIRVSLTE APIKEIPVCY GILQGLGLRR
           LHLGVTEAGD GDYGRIKSSI GIGSLLADGL GDTIRVSLTE DPIKEIPVCY AILQGLGLRR
           MHLGVTEAGE GEDGRMKSAI GIGSLLQDGL GDTIRVSLTE DPWFELEPCF GLLQGCRMRN
           LHLGVTEAGE GEDGRMKSSI GIGALLLDGL GDTIRVSLTE ASELEIEPCF GLLQGSRMRN
           IHLGVTEAGD GEYGRVKSSI GIGTLLGEGI GDTLRVSLTE NPMKEIPVCY GILQALNLRR
           LHLGVTEAGE GEDGRMKSAI GIGALLQDGL GDTIRVSLTE PPEEEIDPCF GLLQGCRMRN

           TKTEYVSCPS CGRTLFDLQE ISAEIREKTS HLVNGPGEMA DADFGYVGGS PGKIDLYVGK
           IKTEYVSCPS CGRTLFNLQE VTDQIRTRTG HLVNGPGEMA DADFGYVGGA PGKIDLYVGK
           TMVEYVACPS CGRTLFNLET VLHEVREATK HMVNGPGEMA DADYGYVGKT PGKISLYRGR
           TMVEYIACPS CGRTLFNLED VLAEVRNATA HLVNGP-EMA DADYGYVGKT PGVISLYRGH
           TKTEYVSCPS CGRTLFDLQT VTDQISKATG HLVNGPGEMA DADFGYVGGA PGKIDLYVGK
           TKTEYVSCPS CGRTLFDLQE VTAQIQEKTG HLVNGPGEMA DADFGYVGGA PGKIDLYVGK
           TMTEWVACPS CGRTLFDLED VLADVRAATK HLVNGPGEMA DADYGYVGSK AGYITLYRRK
           TKTEYVSCPS CGRTLFDLQD VSAEIREKTS HLVNGPGEMA DADFGYVGGA PGKIDLYVGK

           TVVKRIAMTE ATDALIGLIK EHGRWVDPVL VIGGGGREHA LCHALKRSPS CDSVLCAPGN
           EVVRRIPMES ACDQLIELIK EHGRWVEPVL VVGSGGREHS LAWKLSQSPL CNHLFCAPGN
           KEIRTVREEV GVEELVSLLK QDGVWVEPVL VVGSGGREHA LVHAISTSSY VSTLYAAPGN
           DEIKKVPEAE GVQALIDLIK ADGKWSIYVL VVGSGGREHA LCRSIRKSPL CQQLFCAPGN
           ELVRKIPSEK ACDELIELIK ENGRWVEPVL VLGSGGREHS ICWKLKQSPI LEKLFCLPGN
           EVVKRIAMET ACDELIQLIK DNDRWIEKVL VVGGGGREHA LCWRLASSAS AGTLYCAPGN
           EVIKTVPQAE GVKALVELLQ SDGVWLDP-- ---------- ---------- ----------
           QVVKRIAKDQ ATDALIQLIK DHGRWVDP-L VIGGGGREHA LCYGLQRAAS CDGVFCAPGN

           AGISSSGDAD SLAVISFCQK WNVGLVVVGP EVPLVAGLAN DLGILTFGPS SQAAALEGSK
           PGTETEPKVK HKDVVQFCKE KDVGLVVVGP EVPLVAGLAD DLGVPTWGPS ARAAALEGSK
           VGMDALCTCD VDAIVSLARK HNISLVVIGP EVPLVLGLVD RLEILAFGPT MEAAVLEGSK
           AGIADDAVCD VAGVVDFCKS NAIDFVVVGP EAPLVVGLVD ALGIPAFGPS KEAARMEGSK
           AGIASVAECD VPKVVEWCKE QKIDFVVVGP EDPLTKGVVD ALGILAFGPN KEAAELENSK
           AGIARERGVD HAAVVGFCRE RSIGLVVVGP EAPLVDGLAD ALGVPVFGPS KSAARLEGSK
           ---------- ------LAAE VAADLVIVGP EAPLVAGVVD ALGVPAFGPS AGAAALEGSK
           IGISIAGDAD SVAVISFCKR WEVGLVVVGP EAPLVAGLVD DLGIPAFGPS ASAAALEGSK

           NFMKNLCHKY NIPTAKYKTF PIVIKADGLA AGKGVTVAME EEAFEAVVVE EFLEGEEASF
           AFMKDVCRKY DIPTAAYEKF PIVVKASGLA AGKGVVVART EEAYQAVVIE EFLDGEEVSF
           VFTKAFLERH HIPTAWYKPF PIVVKADGLA AGKGVMLAKT AEADDAVVVE EFLVGEEVSF
           AFMK-FCARN NIPTGAYARF PIVIKTDGLA AGKGVIIAQT DEAIAAVVIE EFLEGEEASF
           AFMKDILHKY NVPTASYIRT PIVVKASGLC AGKGVILCYT EEAMQAIVIE ELLEGEEASY
           AFMKDLCAKY KIPTAEYAKF PIVVKTDGLA AGKGVIVAME EDALNAVVVE EFLDGEEASF
           AYMKDFLARH AVPSAWYGTF RCVVKADGLA AGKGVLLCHT AEAEAAVVIE EFLDGEELSF
           SFMKDFCDKY KIPTAKYRSF PIVVKADGLA AGKGVTVAMS EEAYEAVVVE EFLDGEEASF

           FALVDGENAI PLESAQDHKR VGDGDTGPNT GGMGAYSPAP TKELQDFVME SIIHPTVKGM
           FALVDGEAAV PLVSAQDHKA VGDGDTGPNT GGMGAYSPAP NDTIHKQVMD EIIYRTARGM
           FALLDGETAL PLVSAQDHKA AYDGDTGPNT GGMGAYSPAP DLALREQIMN RVVLPTMRGM
           FALTDGKTAV ALVSAQDHKA VGEGDTGPNT GGMGAYSPAP SKEIEAAVMR DIIQPTVDGM
           FALCDGETAI PVAGAQDHKQ VYDGDKGPNT GGMGAYSPAP TPEMEQKIMD EVMIPTVKGM
           FAVVGGGKAV ALASAQDHKR VGDGDTGLNT GGMGAYSPAP TPEITDVVMR DIIKPTVDGM
           FAVVDGAAAV PLASAQDHKA AGEGDTGPNT GGMGAYSPAP SPALAAKIME EVVGPTVRGM
           FAIVDGHTAL PLASAQDHKR VGDGDIGPNT GGMGAYSPAP DSRLESLVMD TIILPTVKGM

           AEEGCKFVGV LFAGLMIEKG LPKLIEFNVR FGDPECQVLM MRLESDLAKV LLAAVVMASN
           AAEGAPFRGT LFAGLMIKDG KAKLLEHNVR FGDPECQGLM ALCASDLTDA MLAAVVLAAR
           KEEQREFRGI LYCGMMVNPK EAKVLEFNVR FGDPECQVLC KRMNTDMLEL LYRTVVLATK
           ASEGRPFKGV LFAGLMIKDG KAKLLEFNIR FGDPECQALC SRLQSDLLIP LMSSVVMAAQ
           KAEGKPFKGV LFAGLMIKNG QIKVLEHNVR FGDPECQTVM MRMKSDLLKT LILAVVMAAK
           AAEGCPFTGV IFAGLMISKG TVKLLEHNIR FGDPECQVLM ARLTSDLTAL LLAAVVMAAE
           VAEGVPFTGV LYTGLMVAPG DVKVLEFNVR FGDPECQVLV ARLASDLLPL LSAAAAA???
           AEEGCKYVGI LYAGLMIDKG IPKLLEYNVR FGDPECQVLM MRFESDLAKL LLAAVVLASS

           GYPGSYEKGS IIVFHAGTAT GGRVLGVTAK GKDLEEARER AYSAVQQINW FRHDIGGSGV
           GYPGEYPKGS VIVFHAGTSA GGRVLNVTAL GADVAEAQAK AYAAVKQIQW YRSDIGGSGV
           GYPGKYDKGS TIVYHAGTSA GGRVLGVTAT GTSIGDAQRV AYEGVDVIDW CRRDIGGSGV
           GYPGSYKSGT VIVFHAGTVA TGRVLGVTAR ATTVKEAQRL AYTAVDKINW CRRDIGGSGV
           GYPGSYAKDT PIVFHAGTST GGRVLGVASL GNDVLEAQTL AYKAVDAIDW CRRDIG????
           GYPGSYAKGE KIVLHAGTSS GGRVLGVTAY GSSITEAAER AYEAVDVIEW TRRDIGGSGV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????GSGV
           GYPGNYKKGT LIVFHAGTAV GGRVLGVTAL GKDIAEAQNR AYQAVDVVSW CRRDIGGSGV

           WSKKEWVLPE IDDDDIVSAF EGNSNLFLGM N-DLWVKHCG ISHTGSFKDL GMTVLVSQVN
           WSKKEWVLPG LSDDDIVSMF EGNSNLFLGM T-DLWVKQCG NSHTGSFKDL GMTVLVSQVN
           WSKKEWVLPN LPDEDVVSMF EGNSNLFLGM S-DLWVKQCG NSHTGSFKDL GMTVLVSQVN
           WSKKEWVLPE LQEDSVVSMF EGNSNLFLDM T-DLWVKQCG NSHTGSFKDL GMTVLTSQVN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           WSKKEWVLPG IADEDIVSMF EGNSNLFLGM S-DLWVKQCG NSHTGSFKDL GMTALVSQVN
           WSKKEWVLPG IPDDDVVSMF EGNSNLFLGM T-DLWVKQCG NSHTGSFKDL GMTVLVSQVN
           WSKKEWVLPE IDNDDIVSLF EGNSNLFLDM N-DLWVKHCG ISHTGSFKDL GMTVLVSQVN

           R-VVGVGCAS TGDTSAALSA YCASAGIPSI VFLPANKISM AQLVQPIANG AFVLSIDTDF
           RSITAVGCAS TGDTSAALSA YCAAAGIPSI VFLPADKISL AQLVQPIANG ALVLSIDTDF
           N-IKAVGCAS TGDTSAALGA YCAAAGIPSI VFLPADKIST AQLVQPIANG SLVLSLDTDF
           E-IKAVGCAS TGDTSAALGA YCAAAGIPSV VFLPANKVSI AQLVQPIANG SLVLSLDTDF
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           R-LSAVGCAS TGDTSAALSA YAAAAGIPSI VFLPADKISV AQLVQPIANG ALVLSIDTDF
           H-IKAVGCAS TGDTSAALGA YCAAAGIPSI VFLPADKVTM AQLVQPIANG SVVMSLDTDF
           R-VVGVGCAS TGDTSAALSA YCAAAGIPAI VFLPANRISI AQLVQPIANG ALVLSLDTDF

           DGCMKLIREI TLPIYLANSL NSLRLEGQKT AAIEILQQFD VPDWVIVPGG NLGNIYAFYK
           DGCMRLIKQV TTPIYLANSM NSLRLEGQKT AAIEILQQFD VPDWVIIPGG NLGNIYAFYK
           DGCMKLIQEV VYPIYLANSM NSLRLEGQKT VSIEIAQQFD VPDWIVVPGG NLGNVYAFYK
           DGCMKLIQQV VYPIYLANSM NSLRLEGQKT IS-------- VPDWVIIPGG NLGNMYAFSK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DGCMRLIREV TLPIYLANSL NSLRLEGQKT AAIEICQQFN VPDYVIIPGG NLGNVYAFFK
           DGCMKLIQQV VYPIYLANSM NSLRLEGQKT VSVEIAQQFD VPDWVVVPGG NLGNVYAFYK
           DGCMRLIREV TLPIYLANSL NSLRLEGQKT AAIEILQQFD VPDWVIVPGG NLGNIYAFFK

           GFKMCQELGL VDRIPRMVCA QAANANPLYM TASTTFASAI QIGDPVSIDR AVYALKKCNG
           GFKMCKELGL VDKMPRLVCA QAQNANPLYM KAKMTFASAI QIGDPVSIDR AIMALKDTNG
           GFAMMKELGL TDKLPRMAVA QAENANPLYV VAKQTYASAI QIGDPVSIHR AIRALRATNG
           GFRMMKDLGL IDKLPRL--- -AHNANPLYI KAKTTFASAI QIGDPVSIDR AIAAIKAHDG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GFKMCKDLGL VDRLPRMVVA QAANANPLYV KAEPTFASAI QIGDPVSIDR AIYALTETNG
           GFKMMKELGL TDRIPRLAVA QAHNANPLYI TAEKTLASAI QIGDPVSIYR AIQALQESNG
           GFQMCKELGL VDRIPRLVCA QAANANPLYI KANPTFASAI QIGDPVSIDR AVYAMQQSNG

           IVEEATEEEL MDA-MAQADS TGMFICPHTG VALTALFIAP TDRTVVVSTA HGLKFTQSKI
           IVEEASEEEL MDA-AARADR TGMFNCPHTG VALAALTIGP NDRTVVVSTA HGLKFTQSKV
           VVEQASEEEI MDV-AARADR TGMFNCPHTG VALAALEISA DERVVVVSTA HGLKFTDSKV
           IVEEATEEEL MEA-AARADK TGMFNCPHTG VALAALIIGR DDRVVVVSTA HGLKFTDSKV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           IVEEATEEEM MDA-AAEADL TGMFNCPHTG VALAALKIAP SDRTVVISTA HGLKFTHSKV
           VVEEATEDEL MDM-SARADR TGMFNCPHTG VALAALDIGR EERVVVVSTA HGLKFTDSKV
           IVEEASEEEL MDA-AAQADL TGMFTCPHTG VALSALTIGA TDRTVVVSTA HGLKFTQSKI

           VMDVLRVVLV RHGQSTWNEE GRIQGSSDGE SQAEISRQML FTSPLKRSKK TLREIDLYSF
           VMDAIRVIIV RHGQSTWNAE GRIQGSTDGV KQAGKTRDML FQSPLARARQ TLREVDLYQF
           IIDSISVILM RHGMTNWNYI GRVQGGLDGI LQARDAGRLL FCSPLTRAKD TLKEIQV-PW
           VINPR????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VMDVL????? ?????????? ?????????? ?????????? ?????????? ??????????
           VIDAI????? ?????????? ?????????? ?????????? ?????????? ??????????
           VMDVLRVVLV RHGQSTWNEV GRIQGSSDGE IQAETSRQML FHSPLARAKR TLREIDLYAF

           QGFGEAFKQW LWSRALVVAH NAVNQALLAT AIGNCGVSVL DCLNRLNQTP NSQIILVCHG
           QGYGEAYMRW LWYRGLVVAH NAINQGLVAT ALGNAALSVL DTLSCLNQSP DNHVVLLSPP
           QGFSKSYEQY VVRRALLVGH NQVNKALICT ALGNCCFNVI M--------- --KLRLCNGG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QGYGDAYRKW LWVRALVVAH NAVNQALVAT AAGNCGVTVL DCLDRLNQTP SPCLVLVCHG

           QGNNE----- ----STAELL CSPKTASIES SGVISTKQMN ELD------- ----------
           AGG------- GEQQALAAVL ATPDVNSYLV TSLLA----- ---------- ----------
           NPKLTRQGCV GRSESVGEWE ---------- --VVG----- -LRDVHRDFS EG--------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ATE-SFPSSD GVIQSTAELL SGPQPCSVST AASIAVQTLP ELDDMNWGT- ----------

           -VESVLNKDN DVIASQLDEE AFSALWNRSE KAWESLVVGP AMHISLIAQC LNLTKEALGG
           ------AAAA APVEHMP--A AGPEVWRRAV ELAAVKVLLD EQHAAAVWAA LGLAAPPAGG
           ---------- -SELAVP--K TKESIFEFAL SCLDEWVCVD DATRAFFAAS IGMGASGMDG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ------WQAS FSHSRLTLSE SLAHLWERAG NAWKKLVVAH ETLTALLAHC LDLSQAFLGA

           SISVIDFPGP SSKGVIRCTN YTAHLIREIL PHRFPFLLVD RVIEYTPGVS AVAIKNVTIN
           GLSVCEFAPA QTPATVRCIN NTAHLIMQTL PHRYPFLLVD RVVEWEKEKY AVGYKCVTIN
           GVSIFDIRGP VG-------T YTTYVVMKIL PHRYPFLLID RVVAYEPGKR AVAIKNVSIN
           ?????????? ?????????? ?????VLRLL EQKPPFLYVD RCVENVYGKR VKALRTVLPE
           ?????????? ?????????? ?????IRKIL PHRYPFLLVD KVLKLVPGEM AVGVKCITAN
           ?????????? ?????????? ?????IMNLL PHRYPFLLVD RVVEIEVGSY AIGVKNVTIN
           ?????????? ?????????? ?????ILDVL PHRYPFLLID KVVAFTPGES AVAVKAVTMN
           GVCVIDFPGY SGKGVVRCWN YTAHLIRDIL PHRYPFLLVD RVIEYQPGVT AVGIKNVTIN

           DNFFPGHFPE RPIMPGVLMI EAMAQVGGIV MLQPEFFFAG IDKVRFRKPV IAGDTLVMRM
           DNFFPGHFPE RPIMPGVLQV EAMAQLAGLV MLDPEFFFGG IEGCRFRKPV VPGDVLMMRA
           EPHFTGHFPD RPIMPGVLQV EALAQTGGIV MLQHEFFFGG VDRVKWRKPV VPGDTLVMEM
           EVPFEQML-- -LVEGRVTQA AAIAQAGSLI VRQMPPVFSA MKDVQFSGLE PTGDELVVDA
           EPQFTGHFPD RPIMPGVMQI EAMAQLGGIV ALQPPFLFGG VDNVKWRKPL VPGDVLVMEM
           DNFFPGHFPQ RPIMPGVLMV EAMAQVGGLV MLEPGFFFAG IDGVKFRRPV VPGDTLVMKV
           EPQFTGHFPG RPIMPGVLMV EAMAQTGGIV MLQQPFFFAG LDKVKWRRPV VPGDVLVMEM
           DNFFPGHFPE RPIMPGVLMV EAMAQVGGLV MLKPEFFFAG VDKVRFRKPV IAGDTLVMRM

           TLLKFQGLAK MEGKAYVGGA LVCEGEFMMV SCFRGLVLDI SYRPVNVVCW KRAICLEYMD
           EVTKYNGIVK VAATGYVGAD LVVEAELTLA MQPRALVLDC AYRPINVLTW YKAFHFEYYG
           TLDSFKGIAK MTGKAYVDGK LVVEGSFTLV MSCPALVLNA DFSPLSLWPW QDAIKAVFLD
           ELLGVKKL-V LTGSVHVRER LACKGTIWFS F????????? ?????????? ??????????
           HVTNYKGICK MSGKGYVDGK VAVEAASAG? ?TNKVLVLNA SFEPLSIVSA TRALSLLWEG
           VLTKLNGIAK MKGQCFVGDE LACEAELTLA L--RVLVLDV GYQTIDIVPW QRAMVLQMMM
           VLKSYKGISK MSGRAYVDGQ LAVEGEFTFA M--------- ---------- ----------
           NLVKFQGIVK MEGKAYVGKN VVCEGEFTLA MKFKGLVLDL SYRPINIVGW KRALCLEILE

           KADVLEIPAV LRVPHLLQVK NSLSRKNILL RDDYTCQYCS SR-LTIDHVM PVSRGGEWTW
           RGEVLELPAV LRVPQYTADR VACTRRNIMV RDGFCCQYCG SR-LTIDHVH PASKGGRETW
           RVTVVALPSV ISLKQYQPRR PAFSRFNVFM RDAFSCQYCG RRFLTFDHVI PRCAGGKTNW
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KASMVVIPSV VSLRRYVKVM PPLNRRTVLL RDEGKCQYCG DFA-SIDHII PRAKGGGTTW
           KVDVISVPAV VRTRSYNRHL ISLHRKNIFI RDGFRCQYCG KG-LTVDHVV PASKGGPWAW
           ---------- --------MF PAFTRFNVFL RDDFSCQYCG QRFLTFDHVV PRCQGGRSNW
           KAEVLVIPAV LKMVDFVYSR LSLSRTNVFI RDKFKCQYCD HD-LTIDHVL PVSKGGGHSW

           QNLVAACSRC NSRKGQKTAD EAMKLLKVPK EPKDYDIVAE WRQYLAKSVK AALYCEGTKV
           DNLVTACMRC NQKKSDRSLA QLWKLKRKPK EPTPFEIGIE WEAYIAPTRA AALYCDQMRV
           QNVVTACIGC NHSKGRYLLH ELMKLLRMPH EPTNGQLQAS WRDYVYWCFD LPMTCESVRI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ENVVAACKAC NGRKAAFYLK DTLKLKKQPG PP--TWTHDS WSQD?????? ??????????
           ENLATACAKC NNKKGDKTLS QSMRLRTTPT APTVANMCME WVPYI????? ??????????
           QNVVAACVNC NHRKGNRTIA QLTVLRRVPV QPTNLQLQAT WRDYLYW??? ??????????
           DNLVTACKRC NGKKGSRLLE DVMKLDKAPK EPNVMDSREE WIDYL??VSE RVLYCEDRRV

           EDIMERRPFY LYSKPQITRN LEAYKEALEG V---SSIGYA IKANNNLKIL EHLRSLGCGA
           EDIRPESPFY LYSWNRIAHN YAEYKKALAG L---DNPCYA VKANNNLVIM KQLAAAGAGA
           RDIQETSPVY IYSKAQIENN YKAYQEALTG L---DSIGYA IKANNNLRIV ELLRSLGSGA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QDVMEKRPFY LYSKPQLSRN FLAYQSALQG I---SSVGYA IKANNNVKIL EHFRSLGSGA

           VLVSGNELRL ALCIFNGNGK SLEDLVLAVN VDSEFDLNNI VLLRINPDVV HPYVATGNKN
           VLVSGNELKL AMTILNGNGK LPWELELAIN IDSEFDLENI VLLRINPDVV HSYVSTGLAS
           VLVSGNELRL AVTVFNGNGK TSKELEFAIN IDSEFDLEHI VLIRINPDVV HPYISTGLAS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VLVSGNELRL ALCVFNGNGK LPEELVLAVN IDSEFDLAHI VLLRINPDVV HPYVATGNKN

           SKFGIRLKLV GAHCHLGSTI TKIFRDAAVL MIEYIDEIYL NIGGGLGIDY YHAGAVPTPM
           SKFGIRLELV GVHSHLGSTI TKIFRDAAVI MCDFVKMIYL NIGGGLGIDY SHQGQVPTPT
           SKFGIRLVLA GVHCHLGSTI KKIFKDAAEI MLGFISEIFL NIGGGLGIDY ERLGENPRPV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SKFGIRVKLV GAHCHLGSTI TKIFRDAALL MVQYMDEIYL NIGGGLGIDY YHTGAVPTPR

           DLINTVVLS- --NLIIEPGR SLIANTCCFV NHVTGVKTNK NFIVIDGSMA ELIRPSLYDA
           DLIDTVVKE- --TLVIEPGR SMVATGSALV NTVTGVKTNK NFIVIDGSMA TLIRPSLYGA
           DLISTILVE- --TIIVEPGR SMVGNTAIMA SKVIGVKTNK NFIVTDGSMA ELIRPSLYDA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DLVDTVVVS- --TLIMEPGR SLVANAAALV NRVTGVKTNK NFIVIDGSMS ELIRPSLYDA

           YQHIELVFDV VGPVCESADF LGKDRELPGA GLVVHDAGAY CMSMASTYNL KMRPPEYWVE
           YQHIELTFDV VGPICESGDY LGKDRELAGD GIVVHDAGAY CMSMASNYNL KMKPAEYMVE
           YQFISLTFDI VGPVCESADF LGKERVLPGA GLAVMDSGAY CYAMASNYNM KVKPVEVLVD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YQHIELVYDV VGPVCESADF LGKNRELPGD GIVVHDAGAY CMSMASTYNL KMRPPEYWIE

           EDITKIRHAE TFDDHLRSAT DVQFETPLKI VEYPDPILRA KNKRIDIFDE NLKNLVDAMF
           NGLRKIRHEE TLDQHLAVVT KLEWTSPLQI IKYPDPRLRA VNAKINVFDE SLMRLAKEMI
           GSWKIIRKAE TFDDIMAVDP GKVKGTDLRV LRYPHPLLRA PNAEVEEFTD ELKRIAKEML
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ???????DAK SVRWSEPLAI AKYPAKCLRA KNAPVETFDK NLERLSKAMF
           ?????????? ???????VDP GAVPGTHLRV VRYPSPILRA PNAEVTSFDA ELAALAKGMF
           DDITKIRHAE TFDDHLRAAG PVEFDSNLSI VLYPDPKLRA RNIRINSFDD NLKKLVDEML

           DVMYKTDGIG LSAPQVGLNV QLMVFNEIVL VNPKIEGCLS FPEVVRPQSV KIDARDITGE
           EIMYQDDGVG LAAPQVGVNV RLMVFNESIL VNPEIEGCLS FPDVERSRQI NVKALDATGQ
           LVMYASRGVG LAAPQVGVNK RLMVFNEVVM VNPSIEGCLS FPNVRRHEWV KVEATRLNGK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KIMYETVGCG LAAPQVGVNY RMMVYNEVVL CNPEIEGCLS FPDVERPIGV QIEAQNLKGK
           KVMYAANGVG LAAPQVGVNI RMMVWNEKVL VNPRVEGCLS FPLVRRSTSV KVEGQNVKGK
           DVMYRTDGVG LSAPQVGVNA RLMVFNEYVF VNPMIEGCLS FYDVERPISI RVEAQDINGK

           RRLPARIFQH EYDHLEGVLF FDRMIREELE KKYEEKTGVL ILDYGSQYTH LITRRIRSLN
           PPWVARIFQH EFDHLQGVLF HDRMVRPELE EAFLADHPVL ILDYGSQYTQ LITRRVRELS
           KGWIARIFQH EYDHLQGTLY PDKLVKDRLV EDYRQNPYVL ILDFGSQYSH LIARRLRECK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ????????VA ILDAGAQYGK LIDRRIRELK
           KGFEARVFQH EYDHLDGVLY HDRMVQSTLV EAYPGEDSCV VLDYGSQYTQ LITRRVRELG
           PGWQAVIFAH EYDHLDGVLY VDRLVGGRLV EEYEGDDAVV ILDFGSQYTH LIARRLREVH
           KGWTARIFQH EYDHLEGVLY IDRMIGKELE EEFENRTGVL VMDFGSQYTH LITRRVRQLG

           VFSLVISGTS SLKSITYNPR VVILSGGPHS VHALDAPSFP EGFIEWGVSV LGICYGLQLI
           MFSVLFPGDA SLDRIKVNPR VVILSGGPNS VHVEGSPRVP DGFFEYNVPV LGVCYGMQMI
           VYCELQPYDL SADQIRLNPK GIVLSGGPQS VYATDGLHVA EGVFDLGIPI LGICYGLQEM
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VESHVVPLDS KPEDLQGKYD AIVISGGPGS CYAPDAPKFH PEVLEMGLPI LGVCYGYQLL
           VYSILLPGDA DLKRIEHAPR VIVLSGGPNS VHVDDAPSVP EGFFEYSIPV LGICYGMQLL
           VYCELLAYDT PAAKLQLNPK GIVLSGGPSS VYEVDAPHMD VAILDLGIPL LGICYGLQEL
           VCSFCLSAGA SLDAIALTPS IVILSGGPHS VHEPGAPTVP DGFFDYKVLV LGICYGLQLI

           VQKLGGVVVE GEYGKMEIEV IFGSEVWMSH GDELPEGFEV VAQSAQGAVA ALESRKKKIY
           THLLGGEVKP AEYGRMPMDI LFDFLVWMSH GDELPAGFTA VAKSHQGAIV AIENSERRIY
           AWSLGGHVVP GEYGHMDIHI LFHGLVWMSH GDKLPTGFVD VANTANTEHA AVSHPSRWFY
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NYVKGGKVEK SEDLQETVDI LFQGLTLLTH GDAVAPDFRP VAWS-KGLVI AIENQGKKMF
           VQRLGGVVEA AEYGRMPVVY LYGQGVWMSH GDELPEGFAC VGKSEAGAVV AIEDPKRKLF
           AHHLGGAVVA GEFGHATLTL LFDGFAWMSH GDKLPDGFAV LASTANTEHA AVGDEARRFH
           VKELGGVVRP AEYGSTEIRA LYGDDVWMSH GDELPPGFNV VAKSVQGTIT AIENTELGIF

           GLQYHPEVTH SPKGMETLRH FLFDVCGVSA DWKMEDLMEE EIKVINDEHV ICALSGGVDS
           GFQFHPEVMH TEHGMEMIKH FLIGIAAVPA DWNMGQVLEE QMAKIKDDHV ICALSGGVDS
           GLQFHPEVTH TQHGTQILRN FVTNVCKCRC DWSMSDFVSE AKSAIKHRVV IGAVSGGVDS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GTQFHPEVDL TENGVAIFKH FLFDIAKMSP DYTPESRHEA AIAEIRTKEI LVLVSGGVDS
           GLQYHPEVTH SEKGLDTLRR FLFDVAGVSA GWSMANVLEE QIAIVKDAHV ICALSGGVDS
           GLQFHPEVTH SDHGTALLRN WTRSVCGCAG DWTMSDFVEE AVAHIRNGVV IGAVSGGVDS
           GLQYHPEVTH TPKGIQTLRR ILFDIGGVVD DWKLQDLLEE QIELIKDEHA ICALSGGVDS

           TVAATLVHKA IGDRLHCIFV DNGLLRYKEQ ERVMDTFERD LHLPVTCVDA SERFLLKGVV
           TVAATLVHKV LGDRLHCVFV DNGLLRYNEQ QRVMDTFKNH LHLPVLCVDH SKPMLLRGLS
           TVAAVLMKEA VGDQFHGFLV DNGVMRKNEA VEVMDRLANR CGVNLQLVDA SEKFLLTGVS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SVCAALCREA VGEKVHAVHI DHGFMRKNES ETVQVALG-K VGINLHMVHC ADDFALEETV
           AVAATLVHKA IGDRLHCVFV DNGLLRYKEQ ERVMEMFRDN LHLPVDCVDH SEQMLLKGVT
           TVAAVLLQRA IGSQFRAFLV DNGLLRKDEV AEVVARLHDK CGVSLTTIDG AETFLLEGVV
           SVAATLVHKA LGDRLHCVFV DNGLLRYKEQ ERVMETFKRE LHLPVVCVDA STDFLLRGVT

           DPETKRKIIG REFINIFDQF AQELKKPAFL VQGTLYPDVI ESCPP---PG TDRTHSHTIK
           DPEAKRKAIG AEFIEVFKNY ANELRKPKYL VQGTLYPDVI ESCPP---PG SGQKHSHTIK
           EPEKKRKIIG NTFIECFEKE ASKL-NADFL LQGTLYPDVI ESISH----- --KGPSATIK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           APEHKRMIIG DTFMRVTEQA VRKLADNVYL AQGTLRPDLI ESGSHLA--- --SSKADVIK
           DPEKKRKIIG AEFIECFKNF KGEIVRPTFL VQGTLYPDVI ESCPP---PG SDQKHSHTIK
           EPERKRKIIG NTFIDLFDAE ASKV-DAAFL LQGTLYPDVI ESVSH----- --KGPSATIK
           DPEQKRKIIG AQFISVFDKF ASHLKTATFL VQGTLYPDVI ESCPP---PG SGKGHSHTIK

           SHHNVGGLPK DMKLKLIEPL KLLFKDEVRE LGRILNVPVG FLKRHPFPGP GLAVRVLALE
           SHHNVGGLPK DLQFELVEPF RELFKDEVRA IGRLLGVPDQ FIKRHPFPGP GLAVRVIKLD
           THHNVGGLPD HMKLKLIEPL RFLFKDEVRA LGLELGIERE SIFRHPFPGP GLAIRILRLK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           THHNDTALVR ELRGKIVEPL RDFHKDEVRA LGTELGLPKH LVWRQPFPGP GLAIRCLVME
           SHHNVGGLPK ELGFELVEPL RMLFKDEVRK LGAIMDVPRA FLARHPFPGP GLAVRILALD
           THHNVGGLPA HMKLQLIEPL RFLFKDEVRA LGLVLGIEAA SVGRHPFPGP GLAIRILRLA
           SHHNVGGLPE VMKLKLLEPL KWLFKDEVRK LGKLLGVPES FLKRHPFPGP GLAVRILHLE

           VLRQVDEIFI QSIRDAGLYW QAFAVFLPVR SVGVQGDKRT HSVVALRAVT SQDGMTADWF
           TLREVDEIFI NTIREYGLYW QAFAVFLPIK SVGVQGDQRS HAVVALRAVT SGDGMTADWY
           ILQEADSIFL HELRVHNLYG QAFAVLLPVK AVGVMGDKRT YEVITLRAVK TSDYMTADWF
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QLREADSVVT EAMLESDLVS QVPVVIFPA- SFGTKGNR-- --SIAIRPFI TRDFMTGKPA
           ILRRADEIYI NTIREFGIYW QAFAVFLPIR TVGVQGDQRT HSVIGLRAVT SADGMTADWF
           VLRDADAIYI EELRAAGLYG QAFAVLLPVK AVGVMGDCRT YEVIALRAVE TSDFMTANWF
           MLRQADEIFV NSIKEAGLYW QAFAVLIPVK TVGVQGDRRT HAPVILRAIT SEDGMTADTY

           NFEHKFLDDV SRKICNSVQG VNRVVLDITS KPPSTIEWEY PFHEIEPKWQ RYWEDNRIFP
           SFTPAFLRDV SNRICNKVRS VNRVVYDITS KPPGTIEWEY PFTEIEAKWQ AYWEQNQTFP
           DLPTPMLRKT SARIVNEVPG VNRVTYDITS KPPGTIEWE- ---------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ELPFEVLDSI IAKI-RQVKG ISRVVYDLTA KPPGTTEWEY PFQEIERKWQ GFWKEQDTFP
           PFETDFLKEV STRITNQVKE VNRVVLDVSS KPPSTIEWCY AFGDVEAKWQ KFWREEKTFP
           DLPTPLLRRV STRIVNEVRG VNRVTYDITS KPPGTIEWL- --------WQ APWEEAGTFP
           EFKNKFVKDV TGKICNTVRG VNRVAYDFTS KPPATVEWE? ?????????? ??????????

           KFYVLDMFPY PSGLHVGHPL GYTATDILAR LRRMQGYNVL HPMGWDAFGL PAEQYAIETG
           KYYVLDMFPY PSGLHVGHPE GYTATDILAR FKRMTGHNVL HPMGWDAFGL PAEQYAIQTG
           ------MFPY PSGLHVGHPE GYTATDILSR FRRKHGYNVL HPMGWDAFGL PAEQYALQTG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KYYVLDMFPY PSGLHVGHPE GYTATDILSR YKKMNDYNVM HPMGWDAFGL PAEQYAIQTG
           KFYALDMFPY PSGLHVGHPE GYTATDIVAR YKRMTGHNVL HPMGWDAFGL PAEQYAIETG
           KFYALDMFPY PSGLHVGHPE GYTATDIMAR YKRKTGHAVL HPMGWDAFGL PAEQYALATG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           THPKTTTLKN IDRFRQLKSL GFSYDWDREL STTEPDYYKW TQWIFLQLYK KGLAYQAEVP
           THPAVTTARN VDRFRQLKAL GFSYDWGREI STTDPEYYRW TQWIFLKLYE RGLAYQAEVP
           THPAVTTDRN IAMFRQLQAL GFAYDWEREV RTTDPAYYRW TQWIFLKLWE KGLAYQDDKP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           THPSVTTKKN IDRFRQLQSL GFSYDWKREV STTDEQYYKW TQWIFLKLYE KGLAYQAEVP
           THPRDTTKTN ---------- ---------- ---------- -------LLE KDLAYQAEVP
           THPADTTARN IGRFRQLRSL GLSYDWAREV NTSEASYYKH TQWIFLQLFK RGLAYQSDVA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           VNWCPALGTV LANEEDGVSE RGGHPVIRKP MRQWMLKITA YADRLLEDLD EL-EWPESIK
           VNWCPALGTV LANEEDGLSE RGGHPVVRMP MKQWMLRITA YADRLLDDLE GL-DWPDSIK
           VNWCPALGTV LANEEDGLSE RGGHPVERRQ MKQWVLRITA YADRLLDDLH LL-DWPESVK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VNWCPALGTV LANEEDGKSE RGGHPVFKKN LKQWMLKITA YADRLLEDLE EL-DWPESVK
           VNWCPALGTV LANEEDGLSE RGNHPVIRKP MKQWMLKITQ YADRLLEDLD EL-DWPDSIK
           VNWCPALGTV LANEEDGLSE RGSHPVVRKP MRQWVLRITA YAERLLGDLE GL-DWPESIK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           EMQRNWIGRS EGAELNFITV YTTRPDTLFG ATYMVVAPEH QLLSYFVTEQ KQQVEEYKDF
           DMQRNWIGRS EGAEVQFLRV FTTRPDTLFG ATYLVVAPEH PLVQQLATEQ SAAVTAYVEA
           DMQRNWIGKS VGAELSFIAV YTTRPETVCG VSYVVIAPEW DGVLPLCTAQ REEVEAYIKA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EMQRNWIGKS QGAEVSFVVV FTTRPDTLFG ATYLVLAPEH PLLDKVTSEQ RDAVKEYVLK
           EMQRNWIGKS EGAQLAFLEV YTTRPDTLFG ATYLVVAPEH PMIDALSAAQ KDQVAEYVLA
           DMQRNWIGKS VGAELVFIAV YTTRPETVCG VTYLCVAPEY AGLDALVTEQ RDAVDAYVAA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ASRKSDLERT ELQKDKTGVF TGCYAKNPAN GDAIPIWVAD YVLASYGTGA IMAVPAHDTR
           ASRKSDLERT ELQKDKTGVP TGSFAVNPVT GERLPVWVAD YVLGSYGSGA IMAVPGHDTR
           AAMKSDRERT GEAREKTGVW TGEYAVNPVN GERVQVWVAD YVLASYGTGA VMSVPAHDAR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ASQKSDLERT ELQKDKTGLF TGGYAINPLT KEEVPIWVAD YVLGSYGTGA IMAVPAHDER
           ASRKSDLERT ELSKEKTGVF TGSYAVHPLT GEKLPIWVAD YVLGSYGTGS IMAVPAHDER
           AAAKSDRERT GEARTKSGVA TGSFAVNPFT GDAVPVWVAD YVLGGVGTGA VMAVPAHDNR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           DNEFALKYNI PIKWVVGIIE NSINQLSSKV IEWAERTGNG KKKVNYKLRD WLFARQRYWG
           DHEFASRFGL PVKQVVGVAV NSIDGLASAV IDWLQAQGRG AKQVNYKLRD WLFARQRYWG
           DFEFAKTYRL PVKQVIGEIV NWLDGMMAKL MEHLEREGIG KKRVNYKLRD WLFSRQRYWG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DHEFATKFGL PIKEVVGVLI NSINGLKVKT IAYLEQKSLG QGKVNYKLRD WLFSRQRYWG
           DYEFAQAFDL PIVEVVGKMM NSVDGLDNKI IDYVNEKGVG YKKTNYKLRD WLFARQRYWG
           DWAFAAAHGL PFVEVVGTVV NWLNGKASTL LDHLDGAALG TPQTNYKLRD WLFSRQRYWG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           EPIPILILGE TIAISESELP LTLPELNDFT GTGEPPLSKA VWVNTVDPAK RETSTMPQWA
           EPFPLVYPDE AVPVPESSLP LTLPETDNFS GTPESPLAAI TWVNTVDPAR RETSTMPQWA
           EPFPIIFVGE PKAVPESELP VTLPEVDSYS GTGESPLATV EWVNTTDPAL RETNTMPQWA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EPFPIVFTGA PHPLPESELP VTLPDVESYS GTTEGPLSTI DWVNYQLKVR RETNTMPQWA
           EPFPVVFPNT AVPIPESELP LVLPETDNFS GSGEGPLANC EWVKTVDPAR RETNTMPQWA
           EPFPIVFVGQ PEAVDEASLP VVLPSVESYT GDGASPLAGV PWVETTTPAK RETNTMPQWA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           GSCWYYLRFM DNPEALVDKE KEKYWSPVDV YVGGAEHAVL HLLYSRFWHK VLYDVVSTKE
           GSCWYYLRYI SCHEALVDRE AEKYWMPVDL YVGGAEHAVL HLLYARFWHK VLYDVVSTVE
           GSCWYYLRFI DNVGKPIDPE LEKYWMPVDM YIGGVEHAVL HLLYSRFWHK VLYDVVSTKE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GSCWYYLRFL DNPGAPIDPA LEKYWMPVDL YLGGAEHAVL HLLYARFWHK VLYDVVHTKE
           GSCWYYLRFI DNEDALIDGS LEKYWLPVDL YVGGAEHAVL HLLYARFWHK VLYDVVSTKE
           GSCWYYLRYI DNEGRPVDPA LEKYWMPVDL YVGGVEHAVL HLLYARFWHK VLYDVVSTLE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           PFKCVINQGI ILGLIPRVYK MSKSRGNVVN PDDVVLEYGA DSLRLYEMFM GPFRDSKTWN
           PFGRLVSQGM ILGVSARAHK MSKSRGNVIN PDDVVDQFGA DSLRLYEMFM GPLRDTKVWS
           PFQRLVNQGM ILGVMSRAHK MSKSRGNVVN PDEIIEMYGA DALRCYLMYM GPLEQVKPWG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PFQRLVNQGL ILGVLSRAVK MSKSRGNVVN PDDVISNVGA DSLRLYLMFM GPLEQVKPWN
           PFQRLVSQGM ILGISARAHK MSKSRGNVVN PDDVVGEYGA DSLRLYEMFM GPLRDTKIWQ
           PFGRLVNQGM ILGVLSRSHK MSKSRGNVVN PDAVVATYGA DALRCYLMFM GPLEAVKPWG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           TSGIEGVHRF LARTWRLVTL EQLRTLHKCI AKVTEEIETR FNTGISGMME FVNAAIIEPF
           TRGVEGVHRF LARAWRVFTK EQLRLLHQTI KKVSTETEMR FNTAIAAMME FVNGVALEPF
           TKGVQGMSRF LGRAWRLVSA EQNKVLHQTI KKVTEDVELR FNTAIAGLIE YVNAANVKPF
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TNGVEGVYRF LNRAWRLIGK EHLKVLHTTI KRVTQDTELS FNTAIAAMME FVNAAIAIPF
           TKGVEGCYRF LARTHRLLDD EGLVALNKCI AKVTEETEMR FNTAISAMME LTNACILEPF
           TTAVGGMARF LARAWRLVTA DQRRVTHALI RRVSDDTEMR FNTALAALME FVNAACLEPF
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           VLLLSPYAPH MAEELWSRLS LAYESFPKAN PDYLKNTTIV LPVQINGKTR GTIEVEEGCS
           ILLLSPYAPH IAEELWARCS LAYEAWPQAD ESLLVVDTIN LPVQVNGKTR GTVEVAAAAS
           LSMLNVFAPH LSEELWSRIA LANEAWPVYK AEFDVEDNKM IVVQINGKVR SKMEVPCSAT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VQLLNPYAPH IAEELWERLS VSNSPWPEFN EKYLVEDALN IAVQINGKLK GTVEVPADAD
           SLLLSPYAPH LSEEMWERLS NSQTAWPVAD ESLLVQDTVD IGVQVNGKMR GTISVSLETS
           VSMLGVYAPH IGEELWERLS LSDAPWPEAV EAYLAEATKV IVVQVNGKVR AKLTVDVGAD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           EDDAFVLASQ DDKLRKYLDG QSIKKRIYVP GKILNVIFAV ELAKVASDVK AGDIKVLFVK
           QDDALAAALA NGNVAKHAGG KEIKKIIYVP GKILNLIFAV AVAKVVDDVK CTDVVVLDVA
           KEDILTRALD MDSIQKYLSS GTIKKQIYVP DKLVNLVYIR TAVKAADERK AGDILALRVS
           ?????????? ?????????? ?????????? ???????LAR RIAQISDAAK CEAICILR--
           QAAAIALIEQ NENVQKWIEG KEIKKKIFVP GKICNFVLVQ DIIRAMDERK AESIWAARVS
           QDDAMAAALA QDSVKKFTEG VDIKKIIYVP GKILNIVMAI EFAVIADDTR AVEVQVLSVA
           KDTV--LAAA GEAVDKWVGG GAVKKQIYVP GKLVNLVFAR TAVLAADERK AVEPVAIRIA
           ?????????? ?????????? ?????????? ???????MAT ALATAANEVK AVDIKLFHVK

           PLVYWTRFFI IATAFSRPQI DAIGSRMPNS WTLLDFGDVV IHLFLPPQRT FYNLEDFYGN
           PVVSWTSFLV VATVFSKPQL LAALARVSSP WETLDFGDVV LHLFTAEQRE YYDIESFYAA
           KLTYTASFIV IATGKNSPQV RAIGNLINSG WLLLDC???? ?????????? ??????????
           ---------- -----EPRAV KEAFSPFASG WALLDYGGVV LHVFS-AERD RYDLEGLYQF
           HLTYSTEFFI NCQGSSRPML QAIAANVDSG WILLDYGEVI VNIMTAAARE FYDLEEHWQN
           KSVFYARYVV LATAFNRPQM NACCAKMVGD WACLDCADVV VHVFSPNSRT HYDLDGLYKG
           ALTCMASYVV VSAGRTPPQM RAIANMVDSG WILLDYGDLL VNVFSVESRR HYDFDNFWAA
           PLIYWARYFL IASAFSMPQV NAIVGRIPSG WTLMDFGDVV VHIFLPSQRE FYNLEEFYAN

           AGIVEEMGVK LGDSIAVNGT CLTVFTVGLA PETLRKTSLE VNLERALQPV SRMGGHVVQG
           AGIVQGTAVK IGASVAINGT CLTVLGFDVM METLRATNLG VNFERSARVG DEIGGHNVSG
           ?GIVEEMGVS LGDSIAINGT CLTVFTFGLA PETLRRTNLG VNLERSLAAD GRFGGHVVQG
           AGLVEEMGVK LGDSIAVNGT CLTVFTVGMS PETMRRTCLG VNLERSMAAD SKFGGHF--G
           GGIVEEMGCY EGCSIAVNGV CLTVFTVGVA PETIRKTNLG VNLERAAAMD GRNSGHMVQG
           AGLVQGKAIS LGASVAVNGT CLTVASFDLI VETLRATNLG VNYERSARVG DEIGGHTVSG
           GGIVEEVGVA LGDSVAVNGV CLTALSFGLA AETLRCTSLG VNLERSLAAD GRFGGHVVQG
           AGIVEEMGVK LGDSIAVNGT CLTVFTVGLS PETLRRTSLG VNLERSLQPS SRMGGHFVQG

           HVDGTGYIVP KGFVAVDGTS LTVVFNFMMI AYTQQNVVIP TKKIGQKVNL EVDGKYVERL
           HVHCTAYVLP KGYIAVDGCS LTIGFSVYLI PETVRVTVFG VKSVGDSVNI EIEAQYLEKL
           HVDCTGYVVE KGYITVDGAS LTVCFTFMMI PYTAASVCAA LKKVGDQVNI EVDGKYIERI
           HVDGTG---- -GYVAVDGTS LT???????? ?????????? ?????????? ??????????
           HVDNVGYIVP KGFIAIDGTS LTVCFTFMLI DYTQQHVIIP KKPIGDKVNL EVDSKYVERS
           HVHCTAYVLP KGFIAIDGCS LTVGFNVWLI PETLRVTVFG AKSIGDTVNV EIE???????
           HVDGTGYIVR KGYVAIDGTS LTVVFTFMMI PYTQEHVALA AKRAGERVNV EVDGKYIEKI
           HVDGTGYIVP KGYIAVDGTS LTVVFTFMLV GFTQQRVVIP GKAVGNRVNL EVDGKYVERM

           L????????H VPVMLGEVLD IFRSFVDCTL GAAGHSSSII DVDPVARKLG HFHIGILMDL
           Q????????H VPVMLREVLS AFTSYLDCTL GAGGHASEMV DVDPTAHTLA EPRIAILMDL
           I????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LLHVLRLIP- ---------- ---------- -MGGHAASLL DQDPEALAMA GRRLGILLDI
           ?????????- ----MDEVLE AFRTHVDGTL GAGGHARAMI DVDASAHALA RPRLSVVLDL
           V????????? ?????????? ?????????? ?????????? ?????????? ??????????
           L????????H TPVLVRQFLE HFKTFLDCTV GAGGHAFEII DVDPCALKLA RQRLGILLDL

           GMSSMQVNNP ERGFSVLDMR MTAEDIVNSW PESELGRVLR DYGEESNWYL LQNRIVTGEL
           GVSSMQIDTA DRGFSFLDMR MSAEEVLNTW SEAELGRILR DYGEEKLWRV VARRLVTTQL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GTSSLQLDDA ARGFSFLDMR MTAADIVNNW SEEAIAEVIY QYGEERKSRS IAKKIVTLVL
           GVSSMHLDRA ERGFSFLDMR MTAEEIVNAW PEEEIGRILR EYGEEKHWRL LARRICTREL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GLSSMQVDAP ERGFSYLDMR MTAEAICNNW SAAEIGRILR EYGEEMRWKF LASRIVTKDL

           VDLIGWIKTA TRVFQGLRIA VNDELKTLQN SLSFDVLGRL AVISFHSLED RVVKGVILTK
           VKAVKGVHPA TRTFQALRIA VNDELRRLEQ ALAIAALGRL AVISFHSLED RLVKVLVGNQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           CLAYKGIHPS TLTFQALRIA VNRELHVLTH VLAMDLLGRL AVISFHSLED RIVKFRLVTK
           VDAIGSIHPA TRTFQGIRIA VNDELGAVED VIAIEALGRL AIISFHSLED SIVKVKLITR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ASVVRARHPA ARTFQALRIA VNDELKSLRS AIASSCLGRL AVISFHSLED RIVKFMLLTT

           RPITPSEEEE RLNRRARSAK LRVISDLKDF LAIDDFDTAT IKTILDKASE VKKSMSMIFA
           KPVLPSEEET ARNPRARSAK LRVLKKGKHF LHLDDFSRDE LLDMLEKAKL CKQTMAMIFT
           ?????????? ?????????? ????PGQSHF LHVDDLSPAE LKRILQSAKK IKKAMSMVFA
           ?????????? ?????????? ????LGKKDF VHIDDWSEAE IRETLKLAAE LKKSLAMIFA
           RPITATTEET KKNPRSRSAK LRIVEYPVHV KTIGSLSRQQ ILKVMELAKN MKRTLLALFE
           KPKVPTSAEI DVNVRSRSAK LRVCPCEKHF LHLDDFTKEE IMELVERASS EKKTMAMIFA
           ?????????? ?????????? ????AGQRHF LRVDDLTTEE LRHVLATAAT LRKTLALLFA
           SPITADAAEI EKNSRCRSAK MRVISKPLHF LHVDDFDKKE ILHLLERAVE VKKSMAMIFT

           KPSMRTRVSF ETGFFLLGGH ALYLGPNDIQ MGKREETRDV ARVLSRYNDI IMARVFAHQD
           KPSARTRVSF ETGFFRLGGH ALYLDPNTIQ LGKREPTKDI ARVLSGYNDV IMARLFAHAD
           KPSSRTRVSF ETAMFKLGGH ALALGP-EVG VNTREAAGDV ARVLSGMTDV IMARLFAHGD
           KPSARTRISF ETGFTWMGGH AIYLSPDDIG IGKREAVKDI ARVLSGYNDM IMARLFAHSH
           KPSLRTRVSL ETGMTQLGGH CIYYALADSP LGKKESILDT AKVVSRYVDV MTARLKTRQA
           KQSLRTRVSF ETGFKLLGGS AIYLGPDDIS IGKREATKDI ARVISRYNDI VMARLYEHSQ
           KASARTRVSF ETGAFMMGGH AVVLGP-EVG VGTRESPKDV ARVLSQFNNL IMARLFGHDQ
           KPSMRTRVSF ETGFFLLGGH AIYLGPDDIQ IGKREETRDV ARVLSGYNDV IMARLFAHQD

           ILDLANYSSV PVVNGLTDHN HPCQIMADAL TMIEHIVEGT KVVYVGDNNM VHSWLELASV
           LLELAEYSSV PIINGLTDYN HPCQIMADAL TLLERKVEGT KVVYVGDNNI VHSWLRLATR
           LVQLAERASV PVINGLTDYN HPCQIVADAL TMAETRLEGA KVVYVGDNNI VHSWVELAAV
           ALELAEYATI PFINGLTDYN HPCQIMADAL TINEYLIDGK KVVFVGDNNI VHSWLRLAKV
           IEELAENATI PVVNALDDYG HPCQMLADFL TIIEHYYEGM KLAFVGDNNM TYDLMRLGCI
           IEELAAYSSV PIVNGLTDYN HPCQILADAL TIYECLLEGV KVVYVGDNNI VHSWLNLAAV
           LLELAAASTV PVINGLTDYN HPCQLLADAL TIVECRVDGA KVVYVGDNNM VHSWLELAAV
           LLDLAKYASI PVINGLTDYN HPCQIMADAL TIIEHVIEGV KVVYVGDNNI VHSWLRLAAV

           IPFHFVCACP KGYEPDKERV SKADPKEAVI GADVVYSDVW ASMEAEARRK AFQGFQVDEA
           LSFEFVVVCP PGYEPCQSTV EGAD-INAVK GADVIYTDVW ASMTIDERKI AFAPYQVNEK
           APIEFVCCCP EGYAPDMGLV ERADVGEATR GADFLYADVW ASMELAERER RFQGFQVTDQ
           LPFHFVWTGP EGYLPDAETV KLCDWKAAVK GADVIYGD?? ?????????? ??????????
           MGFHVTVAGP ADFNVEWSVV KECSKDEAVA GANIVYCDSW MSYERQERFK ALMPYQVTGE
           VPFHFVCVCP EEYTPDEKTL QKADPVEGVK GADVIYSDVW ASMEAEQRKK DFQGYQVNGK
           LPIDFVCACP PGYEPLPEAV AATDPMEAVV GADVIYTDVW ASMEVEARER AFKGFTVDSA
           VPFHFVCACP RGFEPDKETV NRADPLEAVK GAHVVYSDVW ASMQTAARLE RFQGFQVNEK

           LMAYFMHCLP AERGVEVTNG VVEAPYSIVF PQAENRMHAQ NAIMLHLLG? ??????????
           LMALFMHCLP AERGLETTDG VMESPQSVVF QEAENRMHAQ NGILLHCLAY -ATVEKGYKY
           MVTRFLHCLP AERGREVTDE VMEAGYSEVF RQAENRMHAQ VAIVLHCMGS AASYPSDRKY
           ?????????? ?????????? ?????????? ?????????? ?????????V AALAPRAAKF
           TMAIFMNCLP AVRGEEQTAE VLDGPQSVIY DQAENRLHAQ KALLTLLVNV SSLKAAELKY
           MMAIFMHCLP AERGLECDDE VMEADYSVVF QQAENRMHAQ NAVMLKMLNA -RTVIEGLKY
           MMTLFLHCLP AERGREVTDE VMESPASKVF QQAGNRMHAQ NAIVLHCMG? ??????????
           LMAYFMHCLP AERDVDVTDA VIESPNSIVF TQAENRMHAQ NAIMLHVLGF ATPIPQDLKF

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AASHEWAKVV ATVGISDHAQ GELGDVVYVE DVGKAVKKGE TFGVVESVKA ASDVYSPISG
           KASHEWAKLV ATVGITDHAQ AALGDIVFAD EVGSEASAGE RAATVESVKA AADIYAPLSG
           TETHEWVKIT AAVGITDYAQ TALGDIVYVD EVGRTLAKGE SF-AVESVKA ASDVYAPVAG
           TKSHEWVKLT ATLGISAHAQ EELGEIVYVD EVGSEYKAGD SFGAVESVKA AADVYSPLAG
           MPSHEWTKVI ATVGITDHAQ AELGDIVYVE EVGSKVEAKS SFGVVESVKA ASDVYSPISG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LESHEWVKVT GTVGISDHAQ HELGDVVFAD EVGSSVTKGK NFGVVESVKA CSDIYSPVSG

           ?????????? ?????????? ?????????? ???????VIV VESMTKAKII QGYLGYEVLP
           EVVEVNPGTV NSSPFKWIIK VKLSNSLLDS DAYAKECVVV VESPTKAKKI QGFLGYKVLA
           EVVGVNPDLI NKTPHDWIFR IKVNDALMDS ADYEKTILVI VESPAKAATI QKILPYRVRS
           TVTAVNPALV NKSPESWFMK IKVANALLDK AAYDKKT??? ?????????? ??????????
           KVIGVNPSLV NSSPTDWMIK IEVGDDLMDQ KAYDEYVLVI VESPSKAKII QSFLDYVVES
           EVIEVNPGMV NESSFAWLMK VKMSNSMMDA AAYEASWLMI VESPAKAKTI EKYLGAKVLA
           ?????????? ?????????? ?????????? ???????LVI VESPAKARTI QRILGYIVES
           EVIEVNPALV NKNAFGWLIK VKMSNGLMDP AAYEEHVVVL VESPAKAKTI EKYLGYVVVA

           SYGHIRDLA- ----GSVRPD DDFSMVWEVP SSAWTHIKSI KVALNGAENL ILASDPDREG
           SYGHVRDLPP AAAGGVAGEE EDWYLDWQVL DVARPRMAEI AGAATGAPLL VLATDPDREG
           CVGHVRELPP AKYKLGVDVA DDFRPLYVLI AGKQTIISHL KADLKNSAEL ILATDEDREG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           CMGHVRDLPP PELKVGVDPD NHFEPLYVTL PGKESVIKKL EGIQRKAKEV ILATDEDREG
           SYGHVRDLV- ----GSVRPE ESFAMTWTST SRQKAAMRDI TEALKKTDVL LLATDPDREG
           CVGHVRDLPP AAVKLGVDVE NGFRPLYVLM PKKSKIISAL RAQLADCDEL VLATDEDREG
           SYGHVRDLA- ----GSVRPQ DDFDLVWEVP DTAKSRFNQI KTALKGAQAM VLASDPDREG

           EAIAWHIIEM LQQQTVARVV FHEITESAIK SALQSPREID GDLVHAYLAR RALDYLIGFN
           EAISWHISQE LEKRGVQRIT FTEITKSAVT NALAAGRQVS QPLVDAYRAR RALDYLVGFQ
           EAISWHLTEL LKPTPVRRAV FHEITPDAIE FAFRNCRDID LNLVHAQETR RVLDRLAGYT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EAISWHLLEL LKPKPVKRAV FHEITKDAIT RSFQSLRSID LNLVHAQETR RILDRLAGFT
           EAISWHLLEV LREKDVKRVT FGEITKTAVL DAVGSPRDIN VPMVDAYMAR RALDYLFGFT
           EAIAWHLVQL LRPDPVQRAV FHEITPAAVT AAFASMRSID EHLVNAQETR RVLDRLAGYT
           EAIAWHILEM IKLEKIQRVT FNEITKTAVQ QGMKSPRNIS QELVDAYLAR RALDYLIGFD

           ISPLLWRKLP PSAGRVQSAA LALVCDRESE IDGFKPQEYW TVGIKVFSAH LRLN------
           LSPVLWRKLP RSAGRVQSVA LRLVCEREAA IEAFNPLAYW SIAAMLIRSR LRLG------
           MSPLLWKKIA LSAGRVQSVA MSAIVRRELA RLAFVPARYA GCTARFVVAT LRMVRGSDFD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MSPLLWKKIA LSAGRVQSVG MAIIVRRELE RLSFVPAAYF DLRANLFSAM VKVATGRDFD
           LSGLLWRKLP LSAGRVQSVA LRLVCEREEE VEAFVSEPYW TVKASLFDAA LKLG------
           MSPLLWQKIS LSAGRVQSVA MSRIVAREHR RLAFVRADYA GARASVFEVV LRLASGKDFD
           ISPLLWRKLP KSAGRVQSAA LCLLADREKE IESFTPREYW TVEAEIFPAR LKLD------

           ----LSISSE ANAQDIEQRI FLVKGTKTST TRKNPPTPYI TSTLQQDAAN KLHFSTAHTM
           ----MDIRSQ AEAEELARRI VTVARVVVRQ QQRHPGAPFT TSTLQQEASR RLGFSAARTM
           DHTGIPVFDR PALESLVAAL ARVAAVDKKR TTRSPPRPLI TSTLQQECGN KLGFGAGRTM
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AK-GLIHLDK ESANSLMEGL WKVKKVEKRA QRRKPPPPFI TSTLQQEANR KLSLSSKECM
           ----FTIASN DEAEAYAKRV LRVVEVKHSE AKRTSGPPFT TSTMQQEANK QLGFGASRTM
           PDTGVLQLTK TAGRSVVKAL WVVDDVTRKG ARRRPPPPFI TSTLQQEASR RLGFPAAKTM
           ----FSL-TG SEAEAAASYI LKVDGMKNSV VRRNAPGPYI TSSLQQDASS KLGFGASKTM

           KLAQKLYEGL ITYMRTDGLH IADEAIKDIQ SLVAERYGKN FTSDPRKYFK KVKNAQEAHE
           RVAQQLYEGL ITYMRTDGVS ISAEAVAELR AANAAMFGRG CVPPPRQYKS RAKNAQEAHE
           RVAQKLYEGH ITYMRTDNPN LSDQAVAACR TCVEALYGKK AVWDPR--VP KPKAAQAAHE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RTAQRLYEGL ITYMRTDNPI LSDSALTIAI KRAAELFGPD AVQPARKNIK KPKGSQEAHE
           SAAQRLYEGL ITYMRTDGTY VAPHAIESLR TTAGELFGDE YVPEPRYFKK KQKNAQEAHE
           RVAQGLYEGL ITYMRTDNPT LSEQAVAATR AAITSRYGED ALGA-GRAGA KPKSAQEAHE
           LLAQKLYEGL ITYMRTDSMQ LSAQAIESIR KFGEERYGKN YVLSPRKFSS KVKNAQEAHE

           AIRPTDRRLP STLYTLIWSR AVACQMEPAS IAQIQLFRSS CSKVEFLGYQ AVYEDPEAKS
           AIRPTRAVTP SSLYDLIWRR AVASQMTSAA YDVVSVLRAS GRVLRDPGYL RAYNDDEPAA
           AIRPAGFTLP EDVYSLIFKR TLASQMVGAK LDQTTIFKAT GSVVVDPGFL RAY-----QV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PIRPERDQTA AGLYELIFQR TLASVMCDAE LDLTSPFRAS GRVIRKHGWM LAYLDSSDE-
           AIRPTKGRLP AQLYALIWAR TMASQMSPAL TDRIAALKAN GHRLKFPGFL AAYRTSRPEA
           AIRPAGFALP ADLYALVFRR TLASQMADAA VDTTTIFRAS GTIVVSPGFL SVYVDASDSP
           AIRPTGERIP SELYALIWRR TMACQLEQAV FNHVSLLRST ASTMEFPGFQ IVYRDKDALE

           SEREELKDGD HHTQHPPRYS EGSLVKKLEE LGIGRPSTYA SIFRVLQHLY PEFRARMVSA
           RENQGLQPGA HATRPPPRFT EASLVRALEE RGIGRPSTYA PIMTLLQDLL PTSLGRVLTS
           VQTPGVVEGD HETKPPARYN DASLVKDLEE LGVGRPSTYA SIIEKLIALL PSLTAFAVEK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---DSLLTNQ HSTKPPARYT EASLVKELEE LGVGRPSTYT QIIETLKDLS PTLIAFVVTR
           PPSDDLGEGE HKTSPPPRYT DGSIVKALEE RGIGRPSTYA PILKVLAQLV PTTRGRLVSA
           VSSSAVVPGE HTTTPPARYT DASLVKELEA LGVGRPSTYA SIVETLVLLA PRLTAFVVDQ
           ESATELKAGS HFTEPPPRYT EGSLVKKMEE LGIGRPSTYA HVLKTLQLII PRVRGRMVAA

           FLTHYFTEIT DYSFTADMET ELDNVSGGVT EWKGLLRDYW TR---FSAYC FKASKFGACK
           FLEHYFATWV DYDFTSDMEG RLDDVASGKA AWRRVLSAFW GP---FQAAV LKPSRYGGCD
           LLSKHFSSFV DAEFTAKMEE ALDEIAGGSA ERTHYLRQYY CGEDGLAASV VLVSSYGPLT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LLETYFQDFV DTSFTARMEE ELDRIARGEM KKEEYLSRYY LGDDGLRNKV VLVGSYGATF
           FLTNYFETYV DYGFTADLEH KLDDITSEQV QWKPLLEEWW TP---FRDKI LKPSKAGGCG
           LLRRYFPSFV DAAFTAEMER SLDAIAAGAA DRQEYLSSYY LGSDGLAASV VFVGPYGPAT
           FLSRYFTEFV DYGFTAKMEE QLDAVSSGSM KWKEVLQQFW PN---FHDKV LKLTKFGTCH

           FIAKTEKVIL KGPYGHYVQL GIKDVNSITL ESALELLRYP LTLGTHPEDG VVLKLSKSGF
           FARPLQPVYV RGPYGLYVQA GGFTIQSVTL EAALALLALP RTLGLHPGDG VVANTGPFGP
           LADDLMPVLL KSRYGPYVQL GGMDVGTLTI DLALKLLSLP RLLGTHPKSG VRAAMGPYGP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           C----QPILL RGPYGLYLQK GDMDPQGISL ETAKAYLNLP RVICDHPETG IQVGIGRYGT
           FTHPLKEISL RGPYGPYLQL GGKDVNKITL AEAIGMFEYP KVLGVHPVTQ VSLNIGPFGW
           LADDLLPVLV RGRYGPYVQL GAAAAE???? ?????????? ?????????? ??????????
           YSNSLLPVLY KGPYGDYVQI GSINYNAFTL EMAMELMKYP KELGVDPE-G VMIGIGRFGC

           TINMATVPMK LLSGKNVRK? ?????????? ?????????? ?????????? ????SRNKKE
           YVVSASLGLA LLAAKRARQ- ---------- ---------- ------AAGA KKATTRQKKE
           YVTYVSLKME LISASEYRKE VQAKKKE??? ?????????? ?????????? ????NIDKKR
           ?????????? ?????????? ?????????? ?????????? ?????????? ????TKSQKN
           FLSYRSLPVE IINSAAVSPG EY--ERRRVA VVQGRFGPYI KCGLVNAIES IKLK??????
           YV???????? ?????????? ?????????? ?????????? ?????????? ????TKAKKN
           ?????????? ?????????? ?????????? ?????????? ?????????? ????NLSGKA
           YIYSVYVPLD IFVKGKEDR? ?????????? ?????????? ?????????? ????SRRKKE

           ETVEAVKSHL ENCHLLAAIN YGLTVKQFQD LRRTL-PDTT KLIVAKNTLV FKAIE-GTKW
           QVVEVLKGKL EKSTVVFGLR FGLDVPTVQK FRKIL-PANT SVYVTKNSLM KVAVSQTKGW
           EKVALVKESL ENCQMLFATN LGLSVAQVYD LRQRV-PKTT KCMTVKNTLM RRAIE-DSEW
           ASLAALKEEL NGAQAVFALE YGLLHKQFED LRKKM-PEGT KIQVAKNTIM NLAIKEQPQM
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RDLERLRELA SAEELVAGFN YGLTVKDMIT FRRAL-PEGS HIMVAKNTLL RKALE-GTAF
           GVIKTVEGLL SDTSFLFSAP LGLTVAQVAQ LKNSM-PEST TVMTVKNTLM RKAIA-GSPF
           ETVEKVKQQL ETSYLVAGVK YGLTVQQMQN LRRSL-PEST KLIVAKNTLV GKAIE-GTKW

           MKGMNAWLFV TDEIPSAIKP YRSFQKERKE GKFYFKVLET MPTRAEVYAK MLGALQSPAI
           CTGENAWVFV EEEIAETVKA YFKFEEDLFS GQYLLKRCEN LPTKDQLYAT IARLAKQPAQ
           TVGSSLWFFV QDDFKGSVEA FEKFAKDLKD GQKCIKAIAA LPSKQELIQK IAVGIRMVPT
           LAGPNAFFIV KEDVPSTLKA FSAYVKENKD GSLIIKKLEN MPSRTELMAQ LARALNAVPT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           STGMNAWVFV DENVAPTMKA VKALTKVWND GQFIIEPLEN LPTKIDLITK IAVGIKQVPT
           TAGSNMWFFV QGDIKESVGP LKTFAKANKD GEVFVLAVAE MPTKQELYGK IACLIQMVPT
           LKGMNAWLFV TEEIPSALKP YRAFQKELKE GKFYFKQLET MPTRADVYAK LLGVLKSPSS

           NLVWGGRFEE SVTEKVEKFT ESISFDKVLY KQDIMGSKAH ASMLAHQGLI TDSDKDSILR
           KLAWGGRFTG KTDPLMEKFN ESLPFDKRLW AEDIKGSQAY AKALAKAGIL AHDEAVTIVE
           KVAWAGQFDA APNELVAEMG SSIHYDKRLY KHDILGSKAH ARMLARQHII PESDATAIVD
           KLAWGGRFAT DTNTLMLKLS QSVSYDKRLY KHDIMGSIAH VTMLGKQGII PQA-ADKCVE
           ???RSGRFSG ETDPLMERFN ASLPYDKRMW KQDLEGSIAY AAALGRAGIL KDDEVKKLQE
           KLA------- -----MEKFN ESLSFDRRMW REDVEGSVGY ARALARARVI TNDERDALID
           KVAWGGRFDA PPNELVALLG ESVSYDRRMY AHDIRGSTAH ARMLARQGII PQADADAIVE
           KVVWGGRFQQ RTTNAVESFS ESVSYDKKLY KEDLAGSCAH AVMLAKQGLM SEEDRDAILK

           GLDDIERQIE ANKFWRTDRE DVHMNIEAAL TDLIGEPAKK LHTARSRNDQ VATDFRLWCR
           GLAKVAEEWK AGAFIKAGDE DIHTANERRL TELVGAVGGK LHTGRSRNDQ VATDYRLWLV
           GLDQVQREIE QGHFWKPILE DVHMNIEKRL TDIIGAPGAR LHSGRSRNDQ VATDLRLYLR
           GLKQIRKMID EGNFWKEKLE DVHMNIENKL TELIGDAGGK LHTSRSRNDQ VCVDVRMYLR
           GLRAVGKEWE SGKFVKGGDE DIHTANERRL TEIVGPVGGK LHTGRSRNDQ VVTDVRLWLR
           GLGEVGKEWE RGAFAKAGDE DIHTANERRL TELIGDVAGK LHTGRSRNDQ VATDTRMWLR
           GLAAVQAEIE AGTFWSTALE DVHMNIESRL TGLIGAPGGR LHAARSRNDQ VATDMRLYLR
           GIAEIEARIE SGNFWRSDRE DVHMNVEAAL TDLIGEPAKK LHTARSRNDQ VATDVRLWCR

           DAIDTIIVKI RNLQRALVEL ALKNEALIVP GYTHLQRAQP VLLPHVLLTF VEQLERDAGR
           GQVEVMRSEV GELMRVAADR SEAEVEVLMP GFTHLQNAMT VRWSHWLMSH AAAWQRDDMR
           DEVDFIRQRI VNVQTSLVTL AKDHTSTILP GFTHLQHAQP IVLAHYLLAY SEMFERDLGR
           DECEEIGALL RQLQSAMVET AEKYKAVILP GFTHLQHAQP VLFAHYLLAY VEMFDRDIGR
           EEVRALISNM KNLISVATER AEKEMDLLLP GYTHLQRAQP IRWSHWLLCY AWQWKRDVER
           GELLRIRAHL RTLIEIAVDR AEREVDVVMP GFTHLQSAQT VRWSHWLLSH AAAWQRDDQR
           DEVAELVRLA RALQAALVTL ASEHTDTIVP GFTHLQHAQP VVFGHVLLAY VEMLDRDVGR
           NAIDNLVKKI IALQIALVQL ALDNEGLVVP GYTHLQRAQP ILLQHLLLAY VEQLERDAGR

           YVDCRARLNF SPLGACALAG TGLPIDRFMT ANALGNSIDA VSDRDFVLEF LYTNANTGIH
           LRDLLPRVAT LPLGSGALAG NPFLVDRQFI AKELGNSMDA VSDRDFVIET VFAASLLCVH
           IKDWKARMNY LPLGSGALAG TTLPLDREFV AKELGNSLDA VSDRDFAIEL VSLCSIVMMH
           LQDCRRRMNV LPLGSGAIAG TTLPIDREFV CKALGNSMDA TADRDFAVEL LAALSITMMH
           LEGLLTRVNL LPLGVGALSG HPFGVDRHAL AKDLGNSLDA VGDRDFILEY LFASSLIMVH
           LGDMIKRVNV MPLGSGALAG NPFGIDRQLL AKDLGNSMDA VSDRDYIAEA SFWASMTATH
           LTDAAKRMDV LPLGAGAMAG TTLPIDRASV ADALGNSMDA VSDRDFAVEL VSALSLMMMH
           LKDCRCRINF SPLGSCALAG TGLPIDRFMT AEALGNSVDA VSDRDFLIEF LAANSIIAVH

           LSRLGEEWVL WASEEFGFMT PSDSVSTGSS IMPQKKNPDP MELVRGKSAR VIGDLVTVLT
           LSRWAEDLII YSSGPFGYVQ CSDAYATGSS LMPQKKNPDA LELIRGKGGR VQGNLMGVMA
           LSRLSEDIIF WMSQETAWVQ LGNEFCTGSS LMPQKKNPDM CELTRGKTAR VFGDLTTVLT
           LSRSAEDLCI YCSQEFSYLE LDDAFSTGSS LMPQKKNPDT AELTRGKTGR VYGALMGLLT
           FSRFAEDLIL YSSTEFGFVS LADAYSTGSS LMPQKKNPDA LELLRGKSGR TIGQTVGLLV
           LSRWSEDLIV YCSQQFGMVK CSDAYSTGSS LMPQKKNPDA LELLRGKSGT QIGSLMAVLA
           LSRLSEDTVF WCSQEAGWVE LGDAFCTGSS IMPQKKNPDV CELTRGKAAR VYGDLVTLLS
           LSRIGEEWVL WASEEFGFLI PSDAVSTGSS IMPQKKNPDP MELVRGKSAR VIGDLMTVLV

           LCKGLPLAYN RDFQEDKEMF DSTKTIMGMI DVSAEFAQNV TFNEDRISLP AGHLDATTLA
           VLKGTPTTYN KDFQECWELF DTVDTVHDVV RIATGVLSTL RIKPDRMGLS ADML-ATDLA
           IMKGIPLAYN RDMQEDKEIF DAIDTVKLVL AVYAPMIATM RVDKERMAAS DPALMATDLA
           VMKGLPLCYN RDMQEDKELF DAIDTVKLVV EVYAKMVGSL KLKPERMAAS EAGLMATDLA
           TVKGTPSTYN KDLQEDKELF DAADTLEACS LIANGVLSTL VTNKDKMALD LPML-ATDLS
           TIKGTPTTYN KDLQEVWHMY YTVDNMSDSL QIAAGCLATL KIYPDAMGLC AEML-ATDLA
           LMKNLPLCYN RDMQEDKELF DAVDTAKLVL AVYAPMVASI KVRKDRMAAS DAALMATDLA
           LCKGLPQAYN RDLQEDKELF DSVETIGTVL EVTTEFSQNV TFNRKRISLS AGHLDATTMA

           DYLVKKGMPF RSSHDIVGKL VGVCVSKGCE LQNLSLEEMK KLSPVFEEDV FGFLGVENSV
           EYLVRKGVPF RETHHHSGAA VKMAEDRGCT LFDLTVDDLK TIHPLFTDDV AAVWDFNRSA
           EWLVEQGVPF RDAHHRVRDL VTYSKTNSIS LDRLTLDQIK ISVPEANEEC LNLWKPEQSV
           EWL??????? ?????????? ?????????? ?????????? ?????????? ??????????
           DHLVRKGIPF REAHHVAGAV VKLAEDRKCS LDQLTVEDLR KIHPSFDDSP GGMWDYEAAV
           EYLVRKGVPF RETHHISGAA VKLSEDRGVP LSSLTVDDLK PLCAAFDADV AEVWSYEKSA
           EWLVRQGLPF RQAHHRVGAL VGAAHRAGKG LEKFTLAELR ESVPEATEEC LGLWMPEASV
           DYLVNKGIPF RTSHDIVGKA VAVAISKDVE LSKLTLEELR SINPVFEDDV YEYLGVENAV

           NKFSSYGSTG SNCVLRSVIV IQAQRGNLSN FFYASARLEN QLITKVAALM LATSIFHTMK
           EMRDTEGGTS KRSVLLSATA HGPLRGFDAA FLYPLPDPEE RALGQAMECL TDTSTLPTPH
           AKRNIVGGTA PEQA?????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ERRQTDGGTS RRAV?????? ?????????? ?????????? ?????????? ??????????
           ESRDTEGGTS RRSV------ ---------- ---------- ---------- ----------
           AARDVVGGTA PSQV?????? ?????????? ?????????? ?????????? ??????????
           KRFQSYGSTG ASCVLVKAIV YEATKGFFSD FLYGQMDCEQ RLLDRVAQIQ LDTLIFYTAR

           KLLHHFPRTY ADLGQYLIFV GKV--VRASS SFSFLHLKKF FRGTRFTWQP FLNSIQEKHK
           ALLMHVPRSV VAHHDVAALL DSMETAAEAK KEKKALYTLL TTATGSSSGG SGGSSSSSAP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ---------- ---------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SLLNHFPRAH VSFGQSVALF GTI--SKIKD TLAMLHIKRF FQGPRFTSSW FLNKTASGYP

           VGDLVCISGV KSLRAEGRPY PIYPSKGGLN PKFLSDVISR ALDPIPKEIT KVFGLPSLND
           EGSSCSSSGV GRSSSTGAAA PPPPPTPTTT GPVATYAAVA GALPLP---- ------SLAQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ------GRDN P--------- ---------- --------LL AELGLLSHSE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EGSKAAVSGV KAMNRKGEAY PVYSSKGLLN PKKIQVFIQR LLDPLPTEVR DKYDLLSIEQ

           AYVGIHEPAD LARKRLIFDE FFYLQLARLY QMLTKSFLTP SQLSAVSEII WDLPMNRLLQ
           AFDTLHRPYS VCGRVVAFHE LFFSQLRMQQ LRVVAAALTR AQARALDEVL ADMTMYRLLQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AVKNIHRPVA QARERLAFEE LVLLQVALLQ ERLTDELLTR SQESSLEEIL SDMPMLRLLQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AYSTLHQPAN VARRRIVFDD YFYLQLAFLL QRLSLKVLTA GQIKAASEIM WDLPMSRLLQ

           GDVGCGKTVV AFLACMEVIG SGYQAAFMAP TELLAIQHYE QCRDLLENMI GLLTGSTPAK
           GDVGSGKTAV ALVAMVAAAA AGLQAVLVVP TTVLAAQHAA ALERLLGRLP LLLTGEAKAK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GDVGCGKTVV AAMALLAAVG AGHQGAFMAP TEVLATQHHR VLTDLLSQMV ALLTGSTKTA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GDVGCGKTIV AFLALLDVVS SGYQAALMAP TDFVVSQHYK QFLSWLEVLI ALLSGSLSAG

           QSRMIRQDLQ SGAISFIIGT HSLIAEKIEY LRIAVVDEQQ RFGVQRGKFN SKLPHVLAMS
           EKRQAASGLA DGSVCLAVGT HGLLHVPA-Y LGLLVLDESH KFGVQLEKLS SGLPHLLNMS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ERAQILEDLN DGKIGIIVGT HALIHEKVVF LGIAVVDEQH RFGVQRAGLL AKGPHMLTMS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EARLVREGIA NREISLILGT HALISNSTNF LGLAVIDEQH RFGVQRDRLK TAHTHVLLMS

           ATPIPRSLAL ALYGDISLTQ ITGMPLGRIP VETIKEVYSM MLEDLKSGGR VYVVYPVIDQ
           ATPIPRTLAA AVYGHMDVSR LDELPPGRTP VRTMDAMWAE VLREVTSGDR AFVVYPLRTA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ATPIPRTLAM TKFGEMALSV IDEKPAGRLP IITHSQAYDS MCEEVSRGGQ AYVILRLVNE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ATPIPRSLAL TCHGDMSLSQ INEIPPGRQP VDTRRRAYEL VRAELENGGR AFFVYPLINE

           QLRAASAELE IVTKK-FPYN CGLLHGRMKS DDKEEALNKF RSGETQILLS TQVIEIGVDV
           DLKNAQDQAE VLSAMFAPVT TQLLHGKMKA EEKQAALEAF RRGDVRLLVC TTVVEVGVDV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EVKGAEEEYA RLVSK-YPVR FGLLHGQLGA DEKAAALEKF SSGETQALVA TSVVEVGVDV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           HQRAAVTEFD KVVKE-FKYK CALAHGRMKP DLRNQELKRF REGECQILVA TKVVEVGIDV

           PDASMMVVMN AERFGIAQLH QLRGRVGRGR LNMLGKSSDG FYLANIDLLL RGPGDLLGKK
           PEATVVVVEH AERFGLAQLH QLRGRVGRGR LAVMEQTSDG FLVAERDLEQ RGMGHLFGTR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PNASVIIIED ADGFGLAALH QLRGRVGRGR LRVLEQSNNG FRIAESDLQL RGAGELFGTK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PEATVMLIES AEGYGLAQLH QLRGRVGRGR LKLLESTTDG FRLAEEDLKM RGPGDLLGKR

           QSGEFPVARL EIDNMLQEAH IAALNVLGDS LKAELIVISG PTGAGKSRLA MELARLNGEI
           QHGDVSPLT- ---AVVEQAG AAAAGVAMVE VAAEW????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????VVISG PTAVGKSAIA ETLAKLDAEL
           QSGNLFHASM STDYLLEAAR KAAAEMISR- VTVAL????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QSGEFVLARL GEDDILLQAR AAAEELLETD VKHEIIVISG PTAVGKSRLA LALARLNGEI

           ISADSVQVYK GLDVGSAKPS DSDRKVVPHH LIDILHPSVG QFYDDGRQAT VTGGTGLYLR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VSADSVQVYR GMDIGSNKPT AEERASVRYH LLDVVEPNAA DFTAHARSVI VVGGTGFYLQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VSADSVQVYR GLDVGSAKTP LEEREGVPHH LLDIVDPTAG AFFDDARRAT VVGGTGLYLR

           WFMYGKDVPK PSPEVIAEAH DNWDAAVELV AGDP-KASSL PRNDWYRLRR SLEILKSTFR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           WLVFGRGAPK PTEEAEEKAR SSWEEAANRF SLDERYFDGL HGNDWLRLQR MLEVSYTTFE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           WYLNGKGTPK ESPEITAQVD ADWDGALEIL AGDVLTAKSL TRNDWYRLRR ALSIIKASFS

           IPYDLYRSID FRCEDMGVLS EARWLLPNSN PATRAIGFLN KFQTASRNFA KRQMTWFRKS
           ?????????? ?????????? ?????????? ?????????? ?????????? ????????RS
           ?????????? ?????????? ?????????? ?????????? ?????????? ????????ES
           ?????????? ?????????? ?????????? ?????????? ?????????? ????????KS
           RPQGIFRDID LRCELMGFLE EVSSLTGPAV ENEDEDGFIK DFQSVSRQFV RRQLTWFR??
           ?????????? ?????????? ?????????? ?????????? ?????????? ????????RS
           ?????????? ?????????? ?????????? ?????????? ?????????? ????????KS
           LGQKLYRAID ARCEEMGILA EASWLQPGSS PPSRAIGFLS SFQQASRNYA RRQLTWFRKS

           EEAFNAAKNL MPGGVNSPVR AFKSVGGQPV LIDSVKGSKM WDIDGNEYID YVGSWGPAII
           EEIFKEAQEL LPGGVNSPVR AFRSVGGGPI VFDRVKGAYC WDVDGNKYID YVGSWGPAIC
           QRILEEARHI MPGGVSSPVR AFKSVGGGAV VFDSVSGSKA VDVDGNEYID YIGSWGPAIV
           DEIFKRAQEI MPGGVSSPVR AFKSVGGGPI VFDRVKGPYA WDVDGNKYID YIGSWGPAIC
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SEIFKAAQDI LPGGVNSPVR AFKSVGGNPI VFERVKDAYA FDVDGNKYVD YVGSWGPAIC
           AAIMEEAMDL MPGGVNSPVR AFKSVGGGPV VFDHVKGSKA FDVDGNTYVD YIGSWGPAIV
           EEIFKEAKDL MPGGVNSPVR AFKSVGGQPI IFDRVKGSRA WDVDGNEYVD YVGSWGPAII

           GHADDEVLAA LAETMKKGTS FGAPCLLENV LAEMVISAVP SIEMVRFVNS GTEACMGVLR
           GHGNDEVNNA LKAQIDKGTS FGAPCELENV LAKMVIDRVP SVEMVRFVSS GTEACLSVLR
           GAAHPEVNAA LTEALKKGTS FGAPSALENQ LAKMVIDAVP SVEMVRFVNS GTEACMSVVR
           GATNDEVTAA LKAQIEKGTS FGAPCALENV LAEAVIDAVP CAEMVRFVNS GTEACMSVLR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GHANDRVNEK LKAQIDKGTS FGAPCELENA LGEMVIERVP SVEMVRFCNS GTEACLSALR
           GAANEEVNAA LHAALDKGTS FGAPNVLENQ LAAAVIDAVP SIEMVRFVNS GTEACMSVIR
           GHADDEVLKA LAEAAKNGTS FGAPCAAENE LAKLVIDAVP SVEMVRFVNS GTEACMGMLR

           LARAFTNKEK FIKFEGCYHG HANAFLVKAG SGVATLGLPD SPGVPKAATS DTLTAPYNDL
           LMRAYTGREK VLKFTGCYHG HADSFLVKAG SGVITLGLPD SPGVPKSTAA ATLTATYNNL
           VMRAFTGREK ILKFAGCYHG HADMYLVQAG SGVLTLGLPD SPGVPKSSTE TTLVATYNDL
           LMRAYTKREK IIKFEGCYHG HADMFLVKAG SGVATLGLPD SPGVPKTTTA ATLTAPYNDL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VMRAYTGRDM IIKFEGCYHG HADPFLVKAG SGVITLGLPD SPGVPAAATA TTLCATYNNL
           VMRAFTKREK LIKFSGCYHG HADMYLVQAG SGVLTLGLPD SPGVPASSTA PTLVAKYNDL
           LARAFTGREK VIKFEGCYHG HADSFLVKAG SGVATLGLPD SPGVPKGATS STLTAGYNDL

           EAVEKLFAAH KGEISAVILE PVVGNSGFIP PTPEFINGLR QLTKDNGVLL IFDEVMTGFR
           DSVRELFAAN KGEIAGVILE PVVGNSGFIV PTKEFLQGLR EICTAEGAVL CFDEVMTGFR
           ESVRKQFENN KGEIAGVILE PVVGNSGFIP PTKEFLAGLR EITEKEGTLL CFDEVMTGFR
           AAVRALFEAN KDEVAGVILE PVVGNAGFIT PAPGFLQGLV DLCHEYGALC CFDEVMTGFR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DEVKALFAAN PGKIAGVILE PVVGNSGFIA PDKEFLQGLR ETCTKEGAVL CFDEVMTGFR
           DSVRALFEAN PGAIAGVILE PVVGNSGFIP PAPGFLEGLR ELVTAQGALL CFDEVMTGFR
           DAVKQLFQDY KGEVAAVVLE PVVGNAGFIA PSKEFLEGLR EVTKNEGALL VFDEVMTGFR

           LAYGGAQEYF GITPDLTTLG KIIGGGLPVG AYGGRRDIME MVAPAGPMYQ AGTLSGNPLA
           IAKGCAQEHF GITPDLTTMG KVIGGGMPVG AYGGKKEIMK MVAPAGPMYQ AGTLSGNPMA
           IAYSGAQGYF GIKPDISTFG KVIGGGLPVG AYGGRKDIMS MVAPAGPVYQ AGTLSGNPLA
           ISYGGASKHF GVTPDLTTLG KVIGGGLPVG AYAGRKEIMQ M--------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           IAKGCAQEYW GVTPDLTTMG KVIGGGMPVG AYGGKREIMD MVAPAGPMYQ AGTLSGNPLA
           IAYGGAQTHF NIKPDISCFG KVIGGGLPVG AYGGRRDIMD MVAPAGPVYQ AGTLSGNPLA
           IAYGGAQEYF GITPDLTTLG KVIGGGLPVG AYGGKRDIME MVAPAGPMYQ AGTLSGNPLA

           MTAGIHTLKR LAGTYEYLDK ITKELTNGIL EAGKKTGHPM CGGYISGMFG FFFAEGPVYN
           MTAGIKTLEI LPGAYEHLEK VTKRLIDGIM AAAKEHSHEI TGGNISGMFG FFFCKGPVTC
           MTAGIKTLEI LPGSYEYLDR ITGRLVAGLV EIGKECGHAV CGGHISGMFG LFFCEGPVTC
           ---------- -PGQYEEMTR KTEKLINGIL DAGREAGHEI CGGSISAMFG FFFCN-PIRN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MVAGIETLKI LPGQYEKLDK LTKRLIEGIL KAGKDNGHAV CGGHISGMFG FFFTEGPVKN
           MTAGLKTLEI LPGAYEQLER VTGRLAQGLI DAAREAGHDA CGGHISGMFG FFFAKGPITC
           MTAGIHTLKR LSGTYEYLDK VSGKLVQGLL EAGKNAGHDM CGGYIRGMFG FFFTKGPVHN

           FADSDTEKFG RFFRGMLEEG VYFAPSQFEA GFTSLAHTPE DIQLTIAAAL KKTALYDFHV
           FEDADTAKFA RFHRGMLEEG VYLAPSQFEA GFTSLAHSEA DVDATIAAAL KKTMLYDFHV
           FEDCDFDKFG RFHRGMLENG IYLAPSQYEA GFTGLQHSEE DVDRTLRAAL KTTILHDKHV
           FEDSDTAKFA RFHRAMLERG IYLAPSQFEA GFTGIQHSDE DIERTIAVA? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????L KKTLIYDEHI
           FADSDTEKFG RWHRAMLEEG VYLAPSQYEA GFMSLAHTEA DIDATIAAAL KRTPLYDLHA
           FEDQDFEKFQ KYHRGMLEAG VYLAPSAYEA GFVGLEHSEE DVDFTLAAAL KRTVLHDFHE
           FEDSDTAKFA RFHRGMLERG VYLAPSQFEA GFTSLAHTEE DIDFTLAMAL KKTVLYDFHV

           AHGGKMVPFA GWSMPIQYSI MDSTVNCRSL FDVAHMCGLS LKGLETLVVA DVAGLAPGTG
           AHGGKMVDFA GWALPIQYSI MDSTTHCRSL FDVSHMCGFS LKGLEGLVVG DIAGLKDGTG
           DLGGKMVPFA GYAMPVQYGI KDSHLFVRGL FDVSHMGQVR LHGIEKLVVG DIAGLDEGTG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KLGGQMVDFA DWAMPVQYSI INSVKHVRGL FDVSHMCSLR WRGLESVTVA DIENLAMGKG
           RRGGKLVDFA GYALPIQYSI MEATQHCRSL FDVSHMLGSS VRGLESLVVA DLKGLKDGTG
           SLGGKMVPFA GYSMPVQYGI KASHLWVRGL FDVSHMGQVR LRGLEGLVVA DVAGLAPGTG
           ENGAKMVPFA GWSMPLLYTI LNSTLNCRSL FDVSHMCGLT LKGLETLVVG DIAGLSDGSC

           SLTVFTNEKG GAIDDSVITV VNAGCRDKDL AHIEEHMIH- DERSLLALQG PLAAPVLFLT
           SLSAFTNEKG GIIDDTVITV VNAGCRDKDL AHLSKHLVH- DDRSLLALQG PAAAEVVWVT
           VLSVLTTESG GIIDDTIVSV INAGCKDKDV KHMREHLVV- EDHELLALQG PKAMETMHVT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TLSVIPNENG GIIDDTMITV INAGCAVKDL EFFKQKLVQW EDRGLYALQG PEAVKVMFVA
           TLSVMTNEKG GIIDDTVITV LNAGCAEKDQ AHINAALVH- SDRSLLAFQG PKTMSVLWVT
           TLSVLTTESG GIIDDTIISV INAGCKDKDL AHMQEHLVL- DDAALLALQG PKAAAVLHVT
           SLSAFTNEKG GTIDDTVITV VNAGCRDKDL AHIGKHLVH- DERSLLALQG PLAASTLFIT

           RTGYTGEDGF ELAKAIKVRL TGLGARDSLR LEAGLCLYGD MEQHISPVEA GLTWAIGFLG
           RTGYTGEDGF ELAEKLRVRM AGLGPRDSLR LEAGLCLYGD LNEDLTPVEA GLAWTIGFLG
           RCGYTGEDGF EVFEGLAVRP VGLGARDSLR LEAGLCLYGD IDDSTTPIEA GLTWTVGFLG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RCGYTGEDGF ELWRKLEVHP AGLGARDTLR LEAGLCLYGD IDDTTTPTMA GLSWTVGFTG
           RTGYTGEDGF ELAERLEVRM AALGPRDSLR LEAGLCLYGD LNEDITPPEA GLAWTIGFTG
           RCGYTGEDGF ELTETLAVHA AGLGARDSLR LEAGLCLYGD IDETTTPVEA ALAWTIGFLG
           RTGYTGEDGF ELAKALKILL TGLGARDSLR LEAGLCLYGD MDDNTSVVEA GVAWTIGFLG

           ADVILQQLGP TIRRVGFGPP ARSHSEVIGE ITSGGFSPNL KKNIAMGYVK SGQHKTGTKV
           GDIIKKQLGV SKRRVGFGAP ARQHSVVVGE ITSGAFSPCL KKNIAMGYVD KDFAKAGTAL
           ADVILGQIGT SRRRMGFGAP ARGGEALVGK VTSGGFSPSL GKAIGMGYAD KPFNKSKTKL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SDTILKQVSV PKMRVGIGAP AREGAEIVGK VTSGAVSPIL KQNIAMGYIN RPHNKTGTEV
           GEIIKKQLAI PQRRVGLGAP ARQHSLIIGE VTSGGFSPVL QKNIAMGYVA KAFAKAGTEL
           DSVIMKQLGI TRRRMTFGAP PRGHEKIVGE VTSGGWGPSA GKALGMGYAK KPFNKTGTKL
           ADVILKQLGV SRKRVGMGAP ARAHCPIIGE VTSGGFSPCL KKNIAMGYVS TGNHKEGTPI

           KILVRGKPYE GSITKMPFVS AG---PSGFF TRLGRKEKAK SVEKVFSGFS KTRENLAET-
           KVEVRGKVND AVVTKMPFVN AGGEAGPGFL QRLGRKEKAA GFDRFFAGTS KTRERLEDY-
           AVQVRSRTNA VEVRKMPLVE QKKALEALRE GKGIDRDKVK RVRKVNDGLK KSRERLIEEL
           ?????????? ?????????- ---------- ---------- -FGRLVEGLS KTRSNMYDEG
           VVTVRGKSNP GTVVKMPFVD N-------FF SKFARVEKAK AIDRLFRGLE SVRSDMDET-
           LVETRGKRTP AVTTKMPFV- ---------- -KLASRKKTA MVERVFNGTS KTRERLEDF-
           TIPLRGKEVA IQVVKSPVVE RADAWDALRT GRGLDKEKAS RVKKFSDGLA KSREALSKDL
           SVAVRDKKNA GVITKMPFVA SSSSDKAGFF GKLGRKEKAK SIDRLFSGFS KTRENLSDA-

           DRVLDELEEA LLVSDFGPKI TVRIVERLRD IMSGKLKSGI KDALKESVLE MLAKKFRKPA
           EDSLEELEEV LISADFGPRT ALKIVDRIRG VKAGRVKSAI RASLKAAIVE LLTARQGRPA
           EEVLEELEEV LITSDLGVDT VDKILDDLRE SRAQRLEKRI KNGLKKSLVR ILEAKESPPT
           TNTLDEIEEV LVTSDLGLRT TLAIMDDLRE SGKKILKGAI KLSIKGSLAK ILKEKDKKPA
           DQTLEKLEEA LIMRDFGVST SAKICEGLMS VRNGSIKNYI RQAMKDTIVT ILESGDQKPA
           DDALEELEET LLGADFGPKA ATRVTDGVRR VERGECKTGV RRALKASIVE VLTKAAGEPS
           NATLAQLEEV LITSDLGVDT VDSVLADLRD AKAARLTSRI TTCLKDSLVR ILLRRGEGPT
           EKLLDELEEA LLISDFGPRT AIKIVDGLRD VLAAKLKTGI KLALKKSIVK LLTSRTRRPA

           VIMIVGVNGG GKTTSLGKLA HRLKNEVLMA AGDTFRAAAS DQLEIWAERT GCEIVVAEGD
           VVLIVGVNGA GKTTTVGKIA YKYGKEVFLI PGDTFRAAAA EQLAEWSRRA GATI-GAFRE
           IIMVIGANGM GKTTTIGKLA ARLRQDVLVA ACDTFRAAAV DQLEEWVRRA DVDIVVPKPE
           VIMVVGVNGA GKTTTIGKLA HKFVSEVLLA AGDTFRAAAD EQLE------ ----------
           VVLMVGVNGG GKTTTVGKIA TKLAEEVMLA AGDTFRAAAD LQLEEWAKRS NA-ILAPTSN
           VVLVVGVNGG GKTTTLGKLS HRFAESVMMV PGDTFRAAAA EQLATWAERT GA-VMSDSPP
           VVVVIGANGM GKTTTIGKLA TRYRREVLLA ACDTFRAAAV AQLQTWGERA DAAVVVPKTG
           VIMVVGVNGG GKTTTIGKLA HRLKKEILMA AGDTFRAAAK EQLEVWAERT ESDIVRAEEG

           KAKAATVLSK AVKRGVVLCD TSGRLHTNYS LMEELIACKK AVGKIVAPNE ILLVLDGNTG
           GARPQAVIAS NLDDLLILVD TAGRLHTAYK LMEELALCKA AVSNALQPDE TLLVLDGTTG
           QKSPSGVLFG AVEKAYLIVD TSGRLHTNAN LMGELQKMVR VVSKFKGPDE TLLVVDASIG
           ------VLFA AVEKAVLIAD TAGRLHTNFE LMEELSKMKQ TLAMKIAPHE VLM-------
           PKSPAAVMYD AIDASVLIAD TSGRLHTNTN LMKELEKVRG VFEKKMKPKE ILLVVDATQG
           NTKPGAVCYK AVDEAVVLAD TSGRLHNNSQ LMDELVGVKN SISKRLAPHE VLLVLDGTTG
           QKSAAGVCYD AMAQGVVIVD TSGRLHTNIN LMGELKKIVG VVGKFRGPDE VLLVVDASIG
           QKKPAPVLSR AVKRAIVLAD TSGRLHTNFS LMDELEDCKK AIGKALAPNE VLMVLDGTTG

           LNMLPQAREF NEVVGITGLI LTKLDGSARG GCVVSVVEEL GIPVKFIGVG EAVEDLQPFD
           LNMLNQAKEF NEAVRLSGLI LTKLDGTARG GAVVSVVDQL GLPVKFIGVG ETAEDLQPFD
           RNAVAQADTW KKEVGVTALA VTKLDGTARA GFVVSCVDEL DIPVKLIGVG ESIDDLRDFD
           -NALSQAKEF KEVAGSTGII ---LDGTAKG GVVVSVVQQT GIPVKFIGA- --------FD
           QNVLNQARGF NKAVGVTGIV LTKLDGTSKG GVVVSIVDEL KIPVKLIGVG EKAKDLMLFD
           LNMLNQARVF NEAVGVTGII LTKLDGTSRG GAVVSVVDEL GIPVKFVGVG ESMQDLQSFD
           RNAVTQARTW SDEVGVSGLV VTKLDGTARA GFVVSVVDEL GLPVKLIGVG ESVDDLRDFD
           LNMLPQAREF NDVVGVTGFV LTKLDGTARG GCVASVVDEL GIPVKFVGVG EGLEDLQPFD

           PEAFVNAIFT STTNPFVKHC LKLLVVGTIP IREVVSSLVM KKLSGVQSTE SVEALVLDSI
           PEAFAEALFS SAANAFVKHC VRLLLVGEEL IAEAVSEAVM KKVTGLDNAA GVTALVLDGV
           AELFVDGLVT SARNPHLKLA RSLLLEGQRL IEDAVAEPIM RSLCNTVSPQ GVVALVCDEV
           PDAFVEALF? ?????????? ?????????? ?????????? ?????????? ??????????
           AREYVEALFT SLQNAVAKRL VKLLVEEDQD L---VSPDVF RKISGLETTE GRQVIVLDRI
           AVGFVDALFS SAENATVKHF VKLVLSSSVL MRECAPASVL KKCAGVNNAD GLDALAVEGV
           PVLFVEGLV? ?????????? ?????????? ?????????? ?????????? ??????????
           AEAFVNALFS SLSNPYVKHL VKMLVVGSNL LQELLTASVM QKLAGLKSSE SVDALILDGI

           QDPGNLGTLV RSAMAFNWDG AFLLGCCDPY NDKALRASRG ASFQLPQMKL LAFAQSLILG
           QDPGNLGTLV RSALAFGWHG LFLLGCCDPL NDKAVRASRG AVLRLPGLLL LCLLEANVLG
           RDPGNVGTLL RSAAGAGVDA VLMTGCADPW GLKVLRAGMG AHFRLPGCEV SVYAKVDVVG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QDPGNLGTLL RTAAGLGWDA ALLLGCSDPF NEKAIRAARG AQWRLG---- ----------
           QDPGNLGTLT RTAVAFGWDT VALLGTCDPF NDKAMRAARG ATFRVDNMEL YAPERAKVLG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           QDPGNLGTLL RTATAFAWDG VFLLGCCDPF NDKTLRASRA ANFRMPAMKF YAIEKIKVLG

           SEGNGLSFES LNVSVAGGIF LYMVGLTGGI ASGKSTVSNL FPVVDADVVA RSGGWKRVVA
           SEGQGLSMES LNVGVAGSLL MFAVGLTGGI ATGKSTVSRE LTVIDCDKLA HSWGWKRVVQ
           GEANGPGMES LNAAVAGSVV LFE------- ---------- ---------- ----------
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           --GKGSS--- ---------- LFC??????? ?????????? ?????????? ??????????
           TEGQGLSMES LNVGIAGGVL MYL??????? ?????????? ?????????? ??????????
           ?????????? ?????????? ???VGLTGGI ASGKSTVSRR LPVIDADAIA RQPALWLIRR
           SEGQGLSFES LNVAVVGGIL MFLVGLTGGI ASGKSTVSKE LPVVDADKIA RTPGYRRVLK

           AFVDRPKLGQ IVFSSDSKRQ LLNKLMAPYI VVDIPLLFEV DKWTKPIVVV WVSQETQRLM
           AFIDRERLGG LVFNDAAARR RLNAATHLPV VVDMPLLFET HKLTRPNVLV ACSPEQQRLL
           ---------- ---------- ---------M VLDTPLLFES LPFCSKVVVV ACSKDQQRML
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AFLDRPRLGA LVFGDPAARR RLDRITHPFI VLDTPLLFET LPLCTLTVVV SCTRAQQRLL
           IFVDREKLGN IVFADSSQRK LLDRALGPVI VLDVPLLFET DRYTSPVVVV WVDADTERLI

           ERLSEEDARN RVMAQMPLDS KRSKADVVID NNGSLDDLHQ QFEVVYGVSP VLAALFYALY
           ARGSVERAQA RIAAQMPLDA KKRLADIVVE NDGSVEQLKA QVEALYGVYP VLAALVHRAF
           ARLSEHDAKK RLESQIPLEV KVRRADIVID NSQDVDLLKR SA???????? ??????????
           ?????????? ?????????? ?????????? ?????????? ??-------- ----------
           ?????????? ?????????? ?????????? ?????????? ??-------- ----------
           ?????????? ?????????? ?????????? ?????????? ??EIVYGTNP VLEALLFALY
           SRLTETQANE RIAAQMALED KAAMADFVVD NSGIEDRLPE QV???????? ??????????
           ARLSQEQARN RINSQRSLDW KREKADVVID NSGSLELTQQ QIEALYGIGP VRAALLYVLY

           VQFERVLKIS EGLNIKETSK HDLNMVADNR PHQGLVLDAS PLELVKVSLW VALDEVTDPQ
           LFIRQVEALC AGVEVVRAGR HELNLMSQDR PHQGLVLDVA PLTWTHMPVW LALDEVVDPQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- ---------- ---------- ------MDVG PLSFKFIPLW LALDQVWDPQ
           ---------- ---------- ---------- ---------- -------PLW LVLDEVMDPQ
           VQESEILRLA EAVTVKRASK HDLNMACDNK PHQGVLLDAE ALEIPTLPVW LALDEIVDPQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           IQVLWIMKAA KELRVETTSK HALNVLVDNR PHQGMVLDAS PLEMVDIPVW VALDEVKDPQ

           NLGAIIRSAY FFGATGVVVC AKNSAPLSAV VSKASAGSLE VMELRYCKNM MQFLEASANG
           NLGAVVRSAY CLGAAGVLAC SRNCAPLSPV VSKASAGAVE ALPLHSCHNL PRTLMDARKG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NFGAILRTAF FLGADGVVSV VCHSA----- ---------- --------NN MKFLEDSRNG
           NLGALLRSAY FLGADGVIVC SKNSAGLTPS VSKASAGAME LYQVYSVSNL MQFLNWSKLG
           NLGAALRSAH FLGVDGVVCC AKNSAPFNAT VSKASAGAME AQVVHQTGVM HRFLAKAREG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NFGAILRSSH FFGVCGVVVC SKNSAPLSGV VSKASAGALE MIDLLSCKNM MMFLRDSANG

           WRVVGLVLGN EGTGLRPLVE RSCTDLVRIS GLAVESLNVS VAAGLFLHHL IGLIVGLGNP
           WAVLGLVLGS EGFGLRTNTR RACSRLVRVE MGLVDSLNVS VATGILLHSL LSMIVGLGNP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           WEVLGVVLGN EAYGLRTNVL NACDRLLYIG GGDVDSLNVS VAAGILLHHL LH????????
           WQVIGLVMGN EGRGLRTNVL RECDVLVQVQ ADVLDSLNVS VAGGILIHHF LC-----GNP
           WDVVGLVMGN EGSGLRTNVR RACNRLIEIP RAGVDSLNVS VAAGILIHRL VALICGLGNP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           WRVIGLVLGN EGVGIRPFLN SEADCVLR-- -GTVDSLNVS VAAGVLLHEL ??MIVGLGNP

           GKKYQGTRHN VGFEMVDALA LAKPQTFMNL SGESVGQISF YKILVVYDDL DLPFGKLRLL
           GSNYDDTRHN IGFKVIDELA LVKPVTFMNN SGESVAALKF YRVLVVADDL DQPTAQVRLR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GSQYTHTRHN IGFLAVDELA LLKPTTFMNL SGKSVQAASL LDILVIIDDI YLPVGGLRAR
           GAKFAGTRHN VGFEVVDALA LAKPQTFMNL SGKSVREMRA FKIVIVYDDL ETKLGELRMK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GSKFVGTRHN VGFEAIDLLA LVKPQTYMNL SGDAVSPLLY YRVLVIHDDM NLDVAAMKMV

           PKGGHGGHNG MRSIIDRLGS RDFPRLRIGI GFVLRQFNRQ ENKSATFVNG VKLENIRKSY
           QRGGHGGHNG LRSIIDRMGT QDFPRIKIGI GYVLQPFNKA EEKAAS???G IRLENIAMTF
           ?????????? ?????????? ?????????? ?????????? ?????????S IRLEDVTMTF
           ?????????? ?????????? ?????????? ?????????? ?????????R AALENVSKAY
           PKGSPGGHNG LKDVERKLVT PDYPRLRVGV G????????? ?????????- --MEKIALTF
           TSGSHGGHNG VRSVIDDAGD RSFARVKIGI GYVLSRFDED DGDAMTRYNG VRLENVRKTF
           ?????????? ?????????? ?????????? ?????????? ?????????S VRLEDIQLAF
           PKGGPGGHNG MRNIIERFDN KNIPRLRIGI GYVLQKFTQR E????????G VRLEHISKTF

           KGVTVLKDVT WEVKRGEKVG LVGVNGAGKT TQLRIITGQE EPDSGNVIKA MKVAFLSQEF
           KNQQVLKDVS WEVKKGERVG LVGVNGAGKT TQLQIIMGRL QPDSGEVVKA MRIAYLAQEF
           RNTTILNGVT WGVKTGERVG LIGENGCGKT TQLRMIAGLM PPTSGELVRS TKASFLRQEF
           PGKDLLEDVT LAIRPGMRLG LVGPNGA-KS TLFKIIMGDL SPDKGSVVKE LRIGYLAQEL
           KNQDVLKDCS WSVQTGDRVG LVGANGGGKT TQLRVLYGEL EPDSGDIVKS LRLAFLRQEF
           KNMPILDGVN WDCKKGERVG LVGWNGAGKT TQLRIITGEM EADEGEIMLA VKIGYLTQEF
           GNTQLLAGAT WEVKTGDRVG LCGANGVGKS TMLKIISGEI IPDAGQVVRS TKTAFLRQEF
           KGTALLRDIN WEVKKGEKVG LVGINGAGKT TQLKIISGEE QPDSGTVLKA MKIAFLTQEF

           VSMSKTVREE FMTAFKELDL MGRLLDEFDL LQRRAQAVNL DSVDAKISKL MPELGFEDAD
           VQPGRTVREE FYSVYEMMDL MQEILDELDK LNNKVVDLDV DLLDKKIDQM MPELGFEDND
           LDPRRTLREE FTSAFVELDK LEVLLNRLED LRQKCDDKGA WNLEARIDKV MPGLGFDDND
           DAGERSVVDE VASGIGL-PE ERALYARLSD LQTQLDFVRA ARPRETAREI LLGLGFEELE
           LVLTRTLKEE LMSVFGEMEK MQTILDRMQE LQNKADSMGV TGLDARVERI MNLMGFEEGD
           VKESNTVREE FMASYGDMEL VQLLVDKLSD LQRQADRLDL FKMERAIDKI MPELGFEDND
           LDLTRTLREE FATAFTELDA LEGLLNRLEA VRQECDRVNA WNLDARIDRL LPGLGFGDDD
           VVPTRTLREE FLSAFKEMAL MGKLLDELDK LQKKAEATDL YDVDVKVNKV MPELGFDDND

           RLVASFSGGW QMRMSLGKIL LQDPDLLLLD EPTNHLDLDT IEWLEGYLQK QPMVIISHDR
           RLVASFSGGW QMRMCLGKLL LQDPDLLLLD EPTNHLDLDA IQWLEGYLRK QPMVIVSHDR
           KLVAAFSGGW KVRIGLGKVL LQDPDLLLLD EPSNHLDNES VEWLEAFLQA SPMVVVSHDR
           KSLRAFSGGW RMRVALARLL LMEPDLLLMD EPTNHLDLEA IVWLEAFLAR WALVLIS-DR
           QLVAAFSGGW KMRIGLGKIL LTEPNILLLD EPTNHLDLES IEWMESFLIN QPMVIVSHDR
           RLVASFSGGW QMRISLGKIL LQEPGLLLFD EPTNHLDLDT IQWLETYLKS LPMVIVSHDR
           KLVAAFSGGW KVRIGLGKVL LRDPDLLCLD EPTNHLDLES VEWLEAFLRE NPMVIVSHDR
           RLVASYSGGW QMRMSLGKIL LQEPDLLLLD EPTNHLDMDT IEWLEGYLKK IPMVVVSHDR

           AFLDQLCTKI VEEMGVSFEG NYSQYVISKA EWIETQNAAW EKQQKDIDST KDLIARLGA-
           EFLDQLCTKI VEERGVAYPG NYTQYVNSKN EKTALQWAAW EKQQKEIAKQ EEIMQRLAG-
           EFLDRVCTKI VEEGGEAYPG NYSTYVKLKK RQRKAWEAAF ERQQKFLKEQ ENYIKRNRRT
           LFLNKCVNYV AAEQ-RLYTG TFDEYEAQRE ARRAQLEAAA AGQAREIERQ EAYIERFKAK
           EFLDRVCTKI VDEQGVTYDG NYSRFLKLKK ERMEAWQKSY DNQMKKVKAE KDWINRFKV-
           EFLDQLCTKT VEERGKAYKG NYSQYCAEKE SRGAQQMVAY EKWQKEVQRQ RDMISRLAG-
           EFLDRLCTKI VEEAGEAYPG NYSTFLKLKA QRRRAWQVAY ERQQKYIAEQ RNFIRRYRSS
           AFLDQLCTKI VEDMGVSYEG NYSNYVQART TWAAEQEMKW RKQQKEIAQA KENVS-----

           GANSGRASTA EKKLEKIEKP FQR-KQMKIR FPERGTSGRS VVNVKNIDFG FMLFKKANLS
           GAQSGRASQA EKTLERIEKP FVP-KRKAFT FPPVEKMGQK VLSIEGLTHA YPLFKNANLE
           PARSSQVKSR EKMLKRVRRP PRQGKPLVFR FPPAPRSGRD CVIVDEVTHG YALFKDASIA
           ATLAKSVQSR MKALDKIEAP ASKQKAIAMQ IPQPSRAPRI VAAARNLSKR Y------KVE
           GAQASQAASR QAKLEK---- -------FFR FPSAPRMAEA VVNVKNLEHG YILFKDVEFN
           GGQSGRATAA QKALDKVEKP WIA-KRRRFF FPDCQRSSQI VARVENVTHG YTLFKNTSLE
           PARAKQVKSR QKLLERVRPP PRFVKPLVFR FPPAPRSSRD VLLLEDVTHG YTLFRDVNLA
           SANSGQATSA KRQLEKVEKP FEH-KSIRFR FPEAGRSGRM VASVKDLTLQ YVLFKSANMN

           IERGEKIAIL GPNGCGKSTL LKLIMGLEKP VKGEVILGEH NVLPNYFEQN QAEVLDLDKT
           IAKGDRVAII GPNGAGKSTL LRLIMGREAP QQGTVRLGEH NIEPNYFEQN QAEALDLELT
           IERGDRIALI GPNGAGKSTL LRMITGKEDP QEGTVQCGLT NIALAYYEQN QADALELNVT
           IERGEKVGLV GRNGAGKSTL LKALAGEIKP DGGSVFFG-P GV------DH TEEELDLSLS
           LEKGDRVALI GPNGCGKSTF LRLIVGKEEP RSGEIKLGGM NLAVNYYEQN QADVLDPEMT
           ITRGERVAMI GDNGCGKSTL MRLIQGRETP ISGVAQIGDS DLKVNYFYQN QAEGLDRNKG
           IERGDRMAVL GANGSGKSTL LRLVVGSEKP DEGTVQCELP NARLAYFEQN QADALNLELT
           VERGEKLAII GPNGCGKSTL LRLILGYEKP TRGDITLGEH RVVPNYFEQN QAEALDLNKT

           VLETVCEAAE DWRSDDIKGL LGRCNFKADM LDRKVSLLSG GEKARLAFCK FMVTPSTLLV
           VLETLVKSSP DAKLNDLKSL LGRMLFSGNA MDKKVKVLSG GEKARLALAK FMCTQGTLLV
           VLDTLRQAAP EMRYEEIRAL LGKFLFKGDD VEKKVAALSG GEKARLALAK IMLEPSNVLV
           VFETIQGAVS RWDHTQIRTY LGSFLFLGDD ----VSVLSG GEKARLAFAR MLVRPSHLLL
           VLEVIKEASD SVEYEEIRKL LGQFLFKGDT VEKKIAMLSG GEKARVALCR MMLRPANLLV
           VLQTLVEAAP DAQLNDLKAL LGQMAFSTPF HEKPVKFLSG GEKARLALAK FMVTPANVLL
           VLETLQEAAP GTRYEDLRAL LGRFLFKDDS VYKNVSALSG GEKARLALAK IMLEPANILV
           VLETVEEVAE DWRLDDIKGL LGKCNFKAEM FPRKAAFLSG GEKARLAFCK FMVKPSTLLV

           LDEPTNHLDI PSKEMLEEAI NEYQGTVIAV SHDRYFIKQI VNRVIEVEDG CLEDYAGDYN
           LDEPTNHLDI PSKETLEEAI RAFQGAVIAV SHDRYFLRQI ATRVLLVEGQ KLQDYQGDYD
           LDEPGNHLSI SAKEMLEEAL QNFDGTLLLV SHDRYLISQV ATQILAIEEQ ELVLYDGDYK
           LDEPTNHLDM ASCDVIEAAL QSYEGTLLCI SHDRHFLNAV ANKIIEIDAG AAIQYDGNFD
           LDEPTNHLDI PAKEMLEEAL KFYDGTLLVI SHDRYFVSQV ANIIAAFEDK KLVRYNGDYK
           LDEPTNHLDI PSKEMLENAI RRFDGTVIAI SHDRYFLRQI ATRVLAFDEG AITDYAGDYA
           FDEPSNHLDI EAKEMLEEAL QHYDGTLLVV SHDRYFVSQV ATQILAVENE DLVLYDCDYK
           LDEPTNHLDI PTKEMLEEAL REYHGTVLVV SHDRYFVRQI VNRVVEVKNG RLEDYNGDYN

           YYLEKNLIPI YRCIFSDQLT PVLAYRCLDD REAPSFLFES VEPGSGRYSV VGAQPAMEIV
           YYLSKNLVPL SQRIFSDHLT PVSAYRCLGD SQLPSFLLES VVNGDGRYSF LGSSPALEVV
           SYMEKRMVPV WRKIFSDQMT PVVAYRCLND QTTPSFLLES VHTGEGRYSL VGARPVCEVV
           FCPPPNLIPI YRRIFSDQLT PVMAYRRLDD PTVPSFLLES VVNGDGRYSF VS-DPAMEIL
           HYMDQ????? ?????????? ?????????? ?????????? ?????????? ??????????
           YFLEKNVVPL YRRIFDDQLT PILAYRLLDE REAPSFLLES VVGGTGRYSF LGRRPVMEVT
           SYMEK----- -RRIFSDALT PVLAYRCLDD IRTPSFLLES VSTSGGRYSF VGARPCVEVS
           YYLEKNLVPL FQRIFSDHLT PVLAYRCLDD REAPSFLFES VEHTNGRYSM VGAQPAMEIV

           AKEEDPMEIP RKISFCGGWV GFFSYDTVRY VEKPDMHLGL YDDVVVFDHV EKKAYVIHWI
           ATQADPMQLP EEISFTGGWV GYAGYDTVRY VYGPDMHLAL YYDVVVFDQA TKIAYPIAWV
           AYKDDPWKVI AEMNFSGGWV GYGGYDTMRY AELPDLHFGL YKDVFAFDQV AKVIYIVHWV
           ARG----ELV KEVQFCGGWS GYVSYDTVRY TEAPD----- ---VVVFDNV SKLAYAILWV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AKDRDPMEVM KRIGFAGGWV GFTGYDTVRY QYQPDIHLGL YKDVVVFDNA TKQLYAVHWV
           ATADDPWALL REMTFAGGWV GYGGYDTVRY TESADLHFGL YRDVIVFDHV GKMAYVVHWA
           AKEDDPMKEP EEITFCGGWV GYFSYDTVRY SEKPDMHLGL YKDVIVFDHV TKIAYAVHWV

           RLAYSNGMQH LENLVAKLHD IYKEAVVKAK EHILAGDIFQ IVLSQRFERR TFADPFEVYR
           PVAYEAGQSR LAALTAKLAA GFMDAVGATK EHIQAGDIFQ LVLSQRFERR TFATPFEIYR
           DIAHAAGMKE LDSLVETLHK GFMEALSKIK YHIMVGDTFQ TVFSQRFERW SEADPFSVYR
           DMALGTGKLE LEELVAKLTK PFMKGFDGAM HHIGEGNSFQ IVLSQRFERK TQATPLEIYR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MVAYTTGMDA LDAMIDDLQP SFLGAVAATK EHIKAGDIFQ LVLSHRFQRK TSVDPFEVYR
           DVAHSAALGS LAELAGVVSR AFLEGVRRCK EHIVEGDAFQ IVLSQRFERR SASDPFSVYR
           DIAFQDGKKR LQELIDRVQN TFKGAVLAAK EHILAGDIFQ IVLSQRFERR TAADPFEVYR

           ALRVVNPSPY MGYVASSPEI LTKIVNRPLA GTSKRGKNEV EDKRLEKELL ENEKQCAEHI
           ALRVVNPSPY MVYVSSSPEI LCRVTNRPLA GTRARGKDPQ ADKALEADLL ADQKEIAEHV
           ALRIINPSPY MIYVASSPEI LTKLTNRPLA GTRRRGASEE EDEVLAKELL ADGKDRSEHM
           ALRVVNPSPY MIYV-SSPEI LTRITNRPLA GTRWRGKTPE EDAALECELL ADEKDRAEHV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ALRVVNPSPY MIYVASSPEI LCRVVNRPLA GTRMRGKTPE EDEALEVDLL ADEKERAEHV
           ALRIINPSPY MIYVASSPEI LCRLTTRPLA GPRRRGKDAA EDEALAAELL ADEKDRAEHV
           ALRIVNPSPY MIYVASSPEI LTRVINRPLA GTRRRGVSDE EDKKLEESLL KDEKECAEHV

           MLVDLGRNDV GKVTKYGSVK VKLMNIERYS HVMHISSTVT GELWDVLRAA LPVGTVSGAP
           MLVDLGRNDV GKVAVSGSVV VKLMEVERYS HVMHISSTVT GELWDALRAA LPAGTVSGAP
           MLVDLGRNDV GKVSAYGSVK AQIMNVEKYS HVMHISSTVK GKLWDALRAT LPAGTISGAP
           MLVDLGRND- ---------- -RLX?????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           MLVDLGRNDV GRVSKAGTVK VKLMEIERYS HVMHISSTVT GNLWDVLRAA LPAGTVSGAP
           MLVDLGRNDV GRVAAYGTVK PRLMEVERFS HVMHLSSTVV GELWDALRST LPAGTVSGAP
           MLVDLGRNDV GKVSKAGSVQ VKFMEVERYS HVMHISSTVT GELWDALRAA LPVGTVSGAP

           KVKAMELIDE LEPTRRGPYS GGFGGVSFTG DMDIALSLRT IVFAYLQAGA GVVADSDPQD
           KVRAMQIIDE LEVNKRGPYG GGVGHVSFTG AMDMALGLRT MIIVHIQAGA GIVADSKPEA
           KIRAMQIIDD LEPTKRGPYG GGIGYISFHD SMNIALALRT MVVYFLQAGA GIVYESDPEA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KVRAMQIIDN LEVTRRGPYG GGIGYVGFTG EMDMALALRT MVVIHLQAGA GIVADSNPES
           KVRAMQIIDD LEPTRRGPYG GGVGWISFHD DMNIALALRT MVLYYLQAGA GIVADSDPDA
           KVRAMQLIDE LELTRRGPYS GGIGSISFNG DMDVALALRT MVFAHLQAGA GVVADSIPDE

           EHCECQNKAA GLARAI???? ?????????? ?????????? ?????????? ??????????
           EYEETVNKAA ALGRAVGGAD EAGRGPLAGP VVAAVCVLLN DSKAITREAI FEALRVRWAV
           EYTETVNKAM AMNRAIAGVD EVGAGPLAGP VVACAVLLLD DSKRLTRARL AAALAFILAY
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ??????AGVD EAGRGPLAGP VVAAAVILIK DSKKMTREAC YETLKVTIGV
           EYQETVNKAA ALGRAIVGVD EAGRGPLAGP VVAAACFVVN DSKQLTREEI FEELDIEYGV
           EFVETVNKAM ALGRAI???? ?????????? ?????????? ?????????? ??????????
           EYNETVNKAA GLGRAIIGVD EAGRGPLAGP VVAAACIIID DSKKLTREQL YSQIGVRFSI

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SIIDHETIDR INILQAALSA MRNSALDVLD YLLVDGVKGD ATVACIAAAS IIAKVTRDRL
           GECSPSEIDR DNILNARLEA MARAVRALPQ LLFVDGVGGD ARVEVVAMAS VLAKVCRDEL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SVIEHEVIDE INILQATMLG MSSAVKQLPD FVLVDGVKGD SKCMAIAAAS IIAKVTRDRI
           CVIDQDRIDE INILECTMEA MHRSAADVVD WVLIDGVKGD AKNVAIAAAS IIAKVTRDRM
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           CVVDAPRIDE INILQATMEA METCVEELPP YILIDGVKGD AESHVIAAAS ILAKVTRDRL

           ?????????? ?????????? ?????????? ?????????? ?RIGTRGSPL ALAQAYETRE
           MLELDKQYPQ YGFAQHKSHA AS-------- LGPSP????? ?KIGTRGSPL ALAQAYMTRD
           MVQMDARFPG YGFARHKGYG TKMHVQALLE LGPCAIHRRS F????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?RIGSRKSML AMWQSEWVKA
           MKEHHERWPV YDFAQHKGYG TSRHVAAISK HGPCPIHRKT FKLGTRGSPL ALAQAYETRR
           MLEIDKEFPM YGFKDHKGYG TKAHMAAIDK HGPCVYHRKT FKIGTRGSPL ALAQAYMTRD
           ?????????? ?????????? ?????????? ?????????? ?VIGTRGSPL ALAQAYETQR
           MEDYDKRWPL YGFKDHKGYG TASHTAALLK HGPCDIHRRS FRIGTRGSPL ALAQAYQTRD

           KLKKKHPIEI IKTTGDKILS QPLADIGGKG LFTKEIDEAL INGHIDIAVH SMKDVPTYLP
           LLKKSFPIVI IKTTGDKILN QPLADIGGKG LFTKEIDDAL LSGKIDIAVH SMKDVPTYLP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RLEEAYPIMA ISTK-DKILD VPLAKIGDKG LFTKELEVEL IANNVDLVVH SLKDLQTNLP
           RLAELFPINI INTSGDMELS KALSEIGGKG LFTKELDVAL LKKEVDFCVH SMKDVPTYLP
           LLKENFPICI IKTTGDKVLD QPLADIGGKG LFTRELDDAL LDGRIDIAVH SMKDVPTYLP
           RLIEAHPISV IHTTGDMVLD KALSEIGGKG LFTKEIDVAQ LNGDVDIAVH SMKDVPTWLP
           LLKGAHPIVI IKTTGDKILN QPLADIGGKG LFTKEIDDAL LDNRIDIAVH SMKDVPTYLP

           EKTILPCNLP REDVRDAFIL AELPAGSVVG TASLRRKSQI LHKPALHVEN FRGNVQTRLS
           EGTILPCNLP REDVRDVFIL SELPAGAIVG SASLRRQAQI LAKPHLKVEN FRGNVQTRLR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DELDLGAVSD RHDPSDALVI DDLPSGTIVG TSSLRRIAQL RHYDDLIFKD VRGNLQTRLK
           DGTHLEAMLP REDTRDAFIF EEMPEGTVIG SASLRRQAQI FAKPKIKCVN FRGNVQTRLR
           EGMVLPCMLP REDVRDAFLL SQLPEGAVVG TASLRRQSQL LYKPTLKCVN FRGNVQSRIR
           DGIVLPCMLP REDTRDVFIL AELPPGSVIG SASLRRQSQI LARPQLKVVN FRGNVQTRLK
           QGTILPCNLR REDARDAFIL AELPPGSVVG TASLRRKSQI LKRPHLQVTN FRGNVQTRLK

           KGKVQATLLA LAGLKRLSLS LDEMLPAVAQ GAIGIACRTD DDKMATYLAL NHEETRLAIS
           KGACSATLLA LAGLKRLDLS IDEMLPAVSQ GAIGIACRTD DGASRNLLAL NHEETRIAVV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KGEYDAIVLA TAGLERLGLP PSVTLHAVGQ GALGVEIRKG DQATIDLLSI NHAPTRAKCE
           KEVVDATLLA LAGLKRMNLD WDEMLPAVAQ GAIGIQVRSD DDKTLKYISL NHKDTKTCVD
           KEVVDCTLLA IAGLKRMDIP TEEMLPAVAQ GAIGITCRAG DDKQLAFLAL NHEDTRMAVE
           KGVVDATMLA LAGLSRMDVE LDDMLPAVAQ GAIGITCRAG DEKMAEFLRL THQPTLDCVM
           KGIVTATLLA LAGLKRLNLP MDEMLPAIAQ GAIGIACRQG DEKMERYLAL NHEETRLAVS

           CERAFLETLD GSCRTPIAGY CIFRGLVASP DGVLETSRKG VKMGKDAGQE LLSRAGGFFG
           CERAFLTALD GSCRTPIAGY LHFSGLVATP DGIMRASRVV VKCGEEAGKE LKANGPELFM
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AERAFMRELE GGCQVPIGVF LTLTGAVLSL DGCVKETISG EALGIELANI AKSKA-EILA
           CERSFLATLD GSCKTPIAGQ IHFRGLVASP DGIFRAERVG MKIGKDAGEE IRKEAGQFFA
           GERSFLAALD GSCRTPIAAH MQFRGLIASL DGVLETTREG LDAGKDAGAE LKGKAPDFFA
           TERAFLEALD GSCRTPIAGQ ISFRGLVARP DGVIETSRLG QAMGKDAGEE LRGKMGDFFD
           CERAFLEMLD GSCRTPIAGY CKFRGLVASP DGVLETTRSG VAMGKDAAKE LLSKSGSLLN

           NX???????? ?????????? ?????????? ?????????? ?????????? ??????????
           YX???????? ?????????? ?????????? ?????????? ?????????? ??????????
           ??FELCAHHQ PAGDQPKAIS FLQTLHGVTG SGKTFMMANI IAKADRPALI LAPNKTLAAQ
           NI???????? ?????????? ?????????? ?????????? ?????????? ??????????
           DL???????? ?????????? ?????????? ?????????? ?????????? ??????????
           NLNGVRAPFE PSGDQPSAIE RCVCLRGATG TGKTYVVANV LAAQRKPALV VVPNKTLAAQ
           V?FSLEAPYP PRGDQPAAIR ALQTLRGCTG TGKTFVMANI IARTDKPTLV LAPNKTLAAQ
           WS???????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LCNELSNLFP KNRVEFFVSS FKFYQPEAYL PNSDKYIAKA SAIDPDVDRL RHAATRSLFE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VARELRAYLE SHRVELFVSH FSVYVPESY- -SNGRYTEKR SAIDSDLDAL RHRATRALVE
           LCNELRAYLP RNRVEYFVSF YNHYCPEAYL PASDTHIAKS SSINDDIDRF RHAATRALLE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RTDTIVVASV SSIYGLGLPT EYLESSIRIH VGSELTESLE VQYVERGSFN IVEIAPPWEA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           PGKTVVVASV SCLYGLGLPT DYVDAALTIE IGDGVEDKLR LLYERRGQYK TITIWPPYLE
           RPDTVIVASV SCIYGLGMPS TYLEAAIRLR VGDALQARLL LQYTERGVFA TVDVAIPWEA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EYRILFVIVR MEFLNTNTSE SIDLLYPARH FVTPKGQIEA AILQIEEETK KCTTAFRAEG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SLDVRV--DG VVVACEARGR RVD-IWPRVH YITPAERLQR ALVSIKAELD EQTKKLRAEG
           DYRVTYRVTR IDTNDSDSGE V-DLLYPAKH FVTPSHLLEA AIRAIKDEAK ACVAAFAAAG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           KELEASRLEE RVATDMEMMR KVGFCSGAEN YSLYLSKRTN GPPRTLLDYM PWLLFIDESH
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           CAIEADRLEQ RTNADLTLLR ELGWCPGAEH YSRHLRCAKP EPPVTLLDYF SWLLVADESH
           KRLEADRLRE RVAADVAMLA EVGYCQGVEN YSRHLSGRAP GPSECLLDYF PWLLIVDESH
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VTVPQLGAMY AGNAARKKKL VRHGFRLPSA MENRPLNSKE FWEKAHQTIF VSATPGNLEL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VMLPQLRAMH GGDRSRKTAL VGAGYRLPSA LDNRPLMSEE FWQRVPQALL VSATPGDIET
           VTVPQVSSMA VGDRVRKDAL IAHGFRLPSA YDNRALTGAE FWAKVSRAVL VSATPGDFEL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ERSVCEAVIR PTGIVDPSVE VVPTKGQVEH LVLALAKVGR AIVTTLTKRF AEDLADCISR
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           EWVMVDMVVR PSGVLDPPVH VVGKENQLEA LAQRVNEKER SLVCVLTKAD TEDLSMYLNA
           QAAVVDQVIR PTGVLDPVVH IFPSAGQVDH LAAALVARER AIVTTLTKKM AEDLSTHLAE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VSFLHSEIDS VGRMQVLEAM RPKLDVIVGV NLLREGIDLP AVRLVAILDA DSEGFLRGET
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ADWVHSELTA PQRAEKLSKL QGELDCIVGA QLLREGLDLP SVSLVAILDA DIPGFMRSAR
           VSFLHSGVDS VARMEVLEQI KDGIDVVVGV NLLREGIDVP GVSLVAIMDA DKDGFLRSDT
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ALIQTIGRAA RNTEGHVVMY ADTVTSSMHR AITETRRRRR LQMAHNSIND IIPSGVFAEA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SLMQMAGRAA RNKNGECVLF ADSITAAMKE MMNEVDRRRV KQHKHNVDNN LVPVTA????
           ALIQTIGRAA RNVRGEVFMY ADMVTSSMRS AINETNRRRA IQVAYNTERG VSPTPLGSDG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????VSTEK APAALGPYSQ AIKANNLVFL
           ?????????? ?????????? ?????????? ?????ISTDG APAALGPYSQ AIKAGNTVYV
           PADLDVRQKM LMAANAEDFE TAALLRDRLV LEQR?LATDK AAAAVGPYNQ GVVVDGTVYV
           ?????????? ?????????? ?????????? ?????VQTDA APSAV-PYSQ AIKTKDTLYV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????IATDK SPAALGPYNQ AVKVGNTVYV
           PARVTLRTRM KAAARRLDFE AAAAMQAQIA LDGAP????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????VVTER APAALGPYSQ AIKANNLVFV

           SGVLGLIPET GKFV-SESVE DQTQVLKNME ILKASGADYS SVVKTTIMLA DLADFKTVNE
           SGQIGIVPGT KDFA-APDVE GQTQVLKNMA ILKAAGADYK DVVKTTILLA DIADFAKVNA
           SGCIGLLPGD GGMV-DGGVE GQTQALENIA ILNSTGAGPN DIVKTGILLD DMADFAKVNA
           SGCLGLVPAT MDFESATDVE IQTQALKNLA IIEAGGSRLE NVVKTTILLA KIDDFA----
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SGQIGLTPAM -EFA-GETIE EQTQVMKNLE VLAAAGATYA DVVKTTIMIA DMDDFKTVNG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SGVLGLIPET GKFV-SDSVE GQTQVLKNME ILKAAGVSYK SVVKTTIMLA DLADFKAVNE

           IYAKYFPARS TYQVAALPLN AKIEIECIAL KDSKYKTREL SVMLCNDDFI CKLNKEWRGE
           VYATYFPARA TFAVKDLPLA ARVEIDAVAL EADTAAALCL SLVLCDDAHI RHLNSLHRGK
           IYKDFFPARS CFAAKELPKG ALVEIEATA- QDSVEQDTEL SVSLVSDKII RDLNLRWRGI
           ---------- --------KA ALVEIEAIAI ANDASALLEI SLVLCSDLWI RELNRTWREK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           IYGSRFPARA TLAAKTLPLG ALVEIDAVA- --------EL SVALCSDEYI RSLNAGYREK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           IYARYFPARS TYQVAALPLN ARIEIECIA? ?????????? ?????????? ??????????

           DHATDVLSMS MGDLVISVET AARQAEIRIL VIHGLLHLLG FDHEIDEAEQ EMEEEEELLL
           DAATDVLSFE MGDLVVSLDT AERQAECRIL LVHGLLHLAG WDHEREQEHE AMAAEERAVL
           DLTTDVLSFE LGDIVVSMET AKRAAELRVL LLHGVLHLLG FDHQDDDERH NVLGCQLLLT
           DYVTDVLSFP LGDIVISLDR AGEQAEIRIL MVHGMLHLLG YDHELPSEWV EMAAAEQRLI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           DSATDVLSFP LGDVIVSVDT ASAQAECRVL LVHGTLHLLG MDHEVESEAE VMAAAEQEVL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           LFSPCKINVF LRITGGFHDL ASLFHVISLG DPVDGRNLII KALNLFFWIH LDKKVPTGAG
           LFSPSKINLF LRVVRGYHDL ASLFHVIDLG DPTDESNLVI KALNLYYKVK LHKRVPHGAG
           LSSPCKINLF LRIMGGFHEL ASLFQSISLR DPTNDSNLVL KALAKYFHVR LEKRVPFQAG
           YFSPSKVNLF LRIIRGYHDL ASLFQAIGLG DPVDGSNLVL KAMALRFRAH IEKRVPFEAG
           LLSPAKTNIF LRITKGFHEL ASVFQALSLG DPLDESNLIV KAFNLFFDCE IDKRTPLEGG
           -FSPSKINLF LRITAGFHDL ASLFHVIDLG DPTDSSNLVI KALDLYFWIE LDKKVPHGAG
           ---------- ---------- -------GSG KPTDGSNLVL RALAAHYHVH LAKAIPHEAG
           LFSPSKINVF LRITSGYHDL ASLFHVISLG DPLDDSNLVI KALNLYFWVH LDKRVPSGAG

           LGGGSSNAAT ALWAANELNG GLVTENELQD WSSEIGSDIP FFFSHGAAYC TGRGEIVQDL
           LGGGSGNAAT TLFAANKLMG GIASNEDLLE WSGEIGSDIS VFFSNGAAYC TGRGEVVEDV
           LGGGSANAAT ALWAANVLAD KPCTNKQLAE FGAEFGSDVS FFLSSGTAYC TGRGEVLEDV
           LGGGSANAAT ALWAMNELAG AGVAPQALAD WGAEFGSDIS FFLSEGTAYC TGRGEILRPL
           MGGGSSNCAT ALWAANELCG SPASTNQLIE WGGELGSDVG FFLSEGTAYC TGRGEIVENV
           LGGGSGNAAT TLFAANKLCG SPATEAELLE WSGEIGSDIS VFFSKGAAYC TGRGEIVEDV
           LGGGSSNAAT ALWAANHLAG RPLSPQALAD IGAGLGSDVA FFFSPGTALC SGRG??????
           LGGGSGNAAT ALWAANQING NLASEADLQE WSAEIGSDIP FFFSHGAAFC TGRGEIVRDI

           VLIKPR-EAC STAEVYKRLR LDQTSN-CVN DLEPPAFSGS TIIGIGGVTA AKGFKAAGMY
           LLVKPP-VGL ATPKIFKSLD LDRRSS-AVN DLEQPAFDGS TIVCFGGVCA AKGFKATGVY
           FIIKPN-EGL STAEVFKTLK MEDCSD-YVN DLEVPSFKGR TKVDLAGVTA PKGFKAGGHT
           YVVKPR-EGL STGRIFKALD LEALSR-YVN DLEAASFSGT SFFCA????? ??????????
           WVVKPQ-EGC PTPLVYKTLG LKPGEALCVN DLEPPAQKGA TTYAL????? ??????????
           LLVKPP-MGC STPAIFKALD LDGRSK-CIN DLEAPAFTGS TIVIVGGVCA AKGFKVAGYK
           ?????????? ?????????? ?????????? ?????????? ?????----- ----------
           VLIKPK-EAC PTAEVYKHFR IADASS-CIN DLEAPAFQGS TLVGVGGVTG PCGFRAAGLY

           AGLRAAGDLA LVTCAGVFTT NVVAAAPVVY CKKVLETSAR AVLINAGQAN AATGDAGYQD
           AGLRASGDLA LVVAAGTFTQ NVMCAAPVLY CKDVLSRRVR AVMTNAGQAN AATGTQGYED
           AGFKPSGDLA IVLAAALFTK NLLRAAPVDI SEQNLKQSVA AVVLNSGQAN AGTGTDGFAD
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AGLRAKGDCA LIVAAGIFTT NIMCAAPVTY CKKQLAGKAR ALLINAAQAN AATGDQGAAD
           ---------- ---------- ---------- ---------- ---------- ----------
           GGLRALGDLA LVVSAGTFTT NVVAAAPVLY CKRILAASAR AVLINAGQAN AATGDAGYQD

           MLDCVGSIAT LLVLIESTGV IGQRIKKEEL LHALPTLVNS READSAAVAI TTTDLVSKSV
           SVACAQALAA ALVLLQSTGV IGRRMKMESF LPAIPQLPAS LDAHRAAVAI TTTDLVSKEA
           GIKTTELAAE AIVFICSTGV IGKRFDINLM REALPKVVSQ ASGTAAATAI MTTDLKLKQI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AQATAEELSK SLILLMSTGV IGKRIKLDKL MPAIPILSAN VAANAAATAI CTTDLVRKTV
           ---------- --VLVASTGV IGKRVDMAKY EAAVPGLVGA AGGATAARAI LTTDLVEKTA
           ALDCATAVAK LLVLLQSTGV IGKRIKKDAL LASLPRLVGA LSGDAAATAI TTTDLVTKSV

           AIKIRVGGMA KGSGMIHPNM ATMLGVITTD ALVESDIWRK MVKVAVNRSF NQITVDGDTS
           AAVVTVGGMC KGSGMIHPNM ATMLGVVTCD AAVSSDVWTG IVKRASVASF NSITVDGDTS
           ASTVTAGGMC KGSGMIHPDM ATMLGVVTCD ADVEKGLLHK MLKRAVDRSF NAITVDGDTS
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AKTVCMGGMA KGSGMIHPNM ATMLGVVTCD ADVTPEVWRN ITSRAGAASF NQISVDGDTS
           CKTVTVGGMA KGSGMIHPNM ATMLGFVTTD AAVEPAVWAA MVSAAADASF NAITVDGDTS
           ATTVKIGGMA KGSGMIHPNM ATMLSVVTCD AHVASDVWQD LVKTAVGRSF NQITVDGDTS

           TNDTVIALAS GACLDAVMQG LAKSIAWDGE LIEVTVKGTE TEAEAAKIAR SVASSSLVKA
           TNDCVIGLAS GAAVTALMQG LAKSIAWDGE LLEIEVTGAA SDADARVIAR SVAGSSLAKS
           TNDVVCAMCS GSLLTATCIH LAKSIARDGE LVEVQVSGAN TEADARAIAK SIASSSLVKA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           TNDSLVCFAS GQALTAVCRG LAKAIAWDGE LIECNVSGAA DDEDARVIAR SVVCSSLAKA
           TNDSLVGLAS GAALTVVCVR LAKAIARDGE LLEVSVTGAS TDADARAVAR AVAGSSLTKA
           TNDTVLALAS GAALDAVFQG LAMSIASDGE LVEVEVIGAH SDDAAAVVAR SVARSSLVKA

           AVYGRDPNWG RIAAAALKIS LGEFSLMESG QPLFDRDGAS NYLVTIDISV GDGAAIGKAW
           AFFGHDPNWG RIAAAALGVR LGAMTLMRDG QPLFDKAAAN KYLVQVFVTV GKGPGRGMAW
           AIFGRDPNWG RIAAAALEIR LGDYLLMSKG NPVFDAKDAS LYMVAITVKV GNGEGSGVAW
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AIFGHDPNWG RLACAALKLS LGPHQLMDKG QPLFDAVAAS RYLCVVDISV GNGSGRGQAW
           AVYGRDPNWG RIAAAALGVS LGGVPLMVGG TPVYDETAVS GYMVRLDVAL GGGPGAGVAW
           AVYGRDPNWG RVACAALEIR LGTFVLMQKG QPLFDRGAAK DYLVAITISI GGGKGRSTAW

           GCDLSYDYVK INAEYTSRRI LFNRIAPVYD NLNDLLSLGQ HRIWKNMAVS WSGAKKGDYV
           GCDLSYDYVK INAEYTTRQG IFNRIAPVYD ELNNNLSFGQ HWVWKQMTVK WSGAKPGGKA
           GCDLSYKYVE INAEYTTVGR VFGSVAPSYD VMNDAMSLGV HRLWKSAFVA DMAPTRGMRI
           ?????????? ???????RQD LFNRIAPSYD LLNSVLSLRH ARRRKRTAVY WSKAKEGDQV
           ?????????? ???????--- MFDAIAPRYD VINTALSLGM HSLWRRKMVS SLELKPGFKV
           GCDLSYDYVK INAEYTTTLA LFNDIAPVYD RLNDGLSLGL HRAWKRAAVK WIDCSPGMEA
           GCDLTYKYVE INAEYTT??? ?????????? ?????????? ?????????? ??????????
           GCDLSYDYVK INADYTT--- -------MYD NLNDVLSLGQ HRIWKRMAVG WSGAKAGDSV

           LDLCCGSGDL AFLLSEKVGV MGLDFSSEQL AVAATRWIEG DAIDLPFDCE FDAVTMGYGL
           LDVCCGSGDI AFLLSRAVGV TGLDFAAEML EDASARWVQG DAMDLPFSAS FDAATMGYGL
           LDCAGGTADI AFRVAARTGV VVADINPKML EVGQKRFVEA NAESLPFDGE FDVYAISFGM
           IDLCCGSGDI AQILGRKVG- ---------L DIAREKWVQA DVLQLPFDES FDAATMGYGL
           LDLGTGTADV ALAIAKELAV IGLDPSQNML SHGRKKLIHG DALNLTAEAN FDAVTMAFAI
           LDVCCGSGDV AIKMSTFVGV TGLDFAANQL KYAAEKWIEG DALNLPFDES FDCATIAYGL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LDICCGSGDL AMLLAEKVGV TGLDFAEEQL ALARERWCLG DALNLPFVEQ FDAVTVGYGL

           RNVVDRLRAM KEMYRVLKPG SRVSILDFWM IDNVVVPVAD LAKEYEYLKY SINGYLTGEE
           RNVASIPTAL KELHRVLRPG CAVAILDFFF LEQLVVPAAG LAAEYEYLRP SIKRFPTGPE
           RNVPQVDRAL AEAFRVLKKG GRFMMLEFAY SFKVIPAIGG DEAAYRYLVE SIRQFPAQDE
           RNVTDISKCF TELRRVLKPG AYATILDFLY LDGIVVPVAG LRDEYAYIF- KLEEFASGEE
           RNIPDRLRVL QEIFKVLKHG GKVAILELWF VRYCVPFIGG ARREYEHLEK SVMAFDS-KR
           RNVSDIPRAM GELRRVLRRG AKLAVLDFFM LDNVVVPIAG VAAEYRYLRP SIERFPRGRE
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RNVRDIPRAF EEILRVLRPG ALASILDFWM LDNVVVPVAG FREDYEYLKQ SIENFHTGQE

           LETLALEAGF SSACHYEISG FMGNLVVVIS AGGTAGHISS ALAIGDELIL FIGFPSMEST
           QVRLAREAGF AAARHYPIGD LMGVLVVALG AVATGCHVYS GLALAEALSV FLGTRGSQYR
           FVSMMKDAGF VNNTVTDYSG ITATYS-MIA GGGTGGHLYP GVALAEEIVL FVGTRGLEAR
           QAALARAAGF RYASFRPIFG LMGVLVIVIA GGGTGGHVLP ALAMADAFIL FVGTEGIEKT
           FAQQISDAGF QLQSITAMNG SVNLFV???? ?????????? ?????????? ??????????
           QVNLARDAGF REAKFYELAG LMGCLV???? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LEKIAAQAGF SRAVHYEIAG LMGVLVILFA AGGTGGHVYP AISIAQAIIE FVGTKRMEWR

           TVPFDFSTIL KFPLRLVIGT GGHASFPVCF AAKFVIQEQD SIPGTTNWIL SFFADTIFAP
           AIAFNMHEVV WGALRFVVGI GGSMSVPACL AAPLLVYEPN AAAGAANASI HRLARQTLLA
           VIPFPLELIM QGFMQLAVGV GGYASGPAIL AAPTAVLEQN TVPGVTNRIL GRMVDAVYVM
           LVPYEIELIF AGLFALVLGV GGYASAAAVI AARTALHESN AVPGLTNKLL GSAVDRVYVG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AVPYIIRDIF WLPFKLVVGT GGYVSGPLCL AAPLVLQEQN SQPGLTNKIL GRFARVVFVA

           FNCTVTNLPG NPIRQTLKVV LLLGGSLGAN AINIALLNCY SQLLNWFFVW QTGVEAHPRL
           FPAAAAGLKG PAVRPGVRLL VVLGGSKGCC YLNQATHNAL PQLAGLQVLW QTGIRQMSNV
           FDGSADYFPG NPIRRQLFRV LVLGGSQGAH ALNLRMVEAA ATLSTLHVVH QTGRKDGLSA
           FDAAKGAFPG NPVRPEIPAH VLVG----SQ FLNERV---- PALVKLGIRY RAARRG----
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           FAGAAAHFAG NPTRLGFEVV LVLGGSLGAK SVNMALSSFV LESLRRYIIW QTGSQYHSRL

           FLSPFAYAAA DLVISRAGAM TCSEIMALGK PSILIPSPHS DEGDQVRNAM ADIVGSKLIT
           RCVPHALAAA DLVLSRAGAA SVAELGAVGA PCLLVPSPAV DEERQTANAL VDAGLAELVP
           EVHEFAYRQA DLVVCRAGAT TLAEVMVAKK PAILVPYPHA ADNHQELNAF VGQWANVGMI
           ---------- ---------- ---------- ---LLP???? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           AIHGFAYAAA DLVVARAGAI TCSEILVAGK PSILIPSPNV TDDHQTQNAL EEAGVASVLA

           EEELLRAAME DIAKADAASD VA???????? ?????????? ?????????? ??????????
           QLHVISGRLL PLCKVGSSSS SSVSLVALGC PKNVVDGEVL LGDLARAGFE VTDDHEESDA
           RSILWQQQRW RR???????? ?????????? ?????????? ?????????? ??????????
           ?????????? ?????????? ??VALIALGC PKNTVDAEVM LGDLHRKGFE ITSEVDKADC
           ?????????? ?????????? ??YVQTFSRC PKNTVDAEVM LGDLKKRGFD IVRRPRDADV
           ?????????? ?????????? ??--MVSLGC PKNTVDGEVM LGDLHGAGFD VTDDHESADA
           ?????????? ?????????? ??VALVALGC AKNTVDAEVL LADIDATGLT VIDDPATADC
           DSSLLADAID ELAIPDAAAR IA???????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           IIVNTCAFVE DAKSESLEAI VEAASRKLVV TGCLAQRYSS QLAADLPEAD LVVGFQSYGN
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           VIINTCAFVE EAKNESIEAI LEAAQ----- -----QRYSG ELAEEIPESD AVVGFA-HAD
           VIVNTCAFIE EAKTESVQAV LEAVDKGVVI TGCMAQRYAQ ELADELPEVD AVVGFEKYAD
           IVINSCGFVE DAKNESVEAI LEASQKKIIV TGCLAQRYAN DLANELPEAD VIVGFENYAN
           VIVNTCAFVE DAKRASVEAI LAAAASALVV TGCMAQRYAG ELAAALPEVD AVVGFENYAG
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           LAASLQKSMG MEVTAAAARV QVGAPEWNRH RLTKHSAYLR VAEGCNHACT FCAIPGFRGK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           IPKTIEKILE ESGI------ ----KSKSDF KSK--SKFSG LPARQNRRVA VGSATVGFGK
           IGNQIESIIT KS--FAMPEV AVGSPEWERV RITQHAAFLR VAEGCDHKCT FCAIPSWRGR
           LPKTVGGLLG VETNPQQARV QVGGEEIKRL RITRHTAYLR VAEGCDHKCT FCAIPSFRGR
           LPAKIGALLT VARSSTAADV AVGAPEWRRK RLTRHSAYLR VAEGCNNNCS FCVIPSFRGA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           FRSKPWQSVL DEAAHLVGGA VELNLIAEDT NQYGMDRR-R DLAQLLRELG KLGLRWIRIL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           FRSKPWDAVL DEAKRLVSGV KELNLIAEDT NQYGMDFPLR RLSDLLRALN ELGLTWIRIL
           FRSKSFDAIM EEARELVTGV TELNLIAEDT NQWGQDFGAR RLADLLHSLA GIEVRRISLL
           FRSKPWQSII DEAKALASGV RELNLIAEDT NQWGIDLRAR GLAELLYALA EVGIEWMRIL
           FRSKPFDALM EEVRVLVAGV VEFNIIGEDT NQYGMDFGLR RLEDVIRAIA SYQVVFIRLL
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YAYPSYFNDE LIDEIANNPK VCKYLDMPLQ HIANLTLLAM NRPPKE-TTK LLAKLRERIP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           YAYPSYFSED LITAIAELPK VVKYLDMPLQ HIS-GVLKNM NRP------- ----------
           YCYPSYFSDE LIDAIASIDK VCKYIDMPLQ HISDPVLKAM NRPPRE-TVS LLKKLRERIP
           YAYPSYFSDE LIRAIADVPQ VCKYIDIPLQ HITNLSLLRM NRPPRQ-TED LLYKLRDRIP
           YTYPTVWSDA LVDTLAETSK VACYIDMPLQ HISQDILTAM NRPPAA-TRK LLAKLRARLP
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GLALRTTFIS GFPGESDEQH RELVDFVKTF KFERMGCFAF SEEDGTPAMP EQVPRRQRER
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           ---------- -FPGETDDDH RELCEFIQEF KFERAGFFAY S-EDGTPALP -LVPQELRDA
           GLVLRTTFIS GFPGETDKDH RELVDFVKAM KFERAGVFAY SEEEGTPAML DQVPADVKER
           DLALRTTFIS GFPGETEEEH EELMQFCRDF KFERLGAFAY SEEDGTPAYP DQVPEEIRAI
           GVTLRSTFIS GFPGETDAHH RELVRFVNEQ RFSRCGVFIY STEEGTAALP GAVDPQVATA
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RRDELISLQQ RIGEEWAEGL VGREVDVLVE GYNDGWLIGR TQWDAPDVDP LVFLGSIRRC
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           RRDELVSIQQ QISDSLAKQM MGQEVELMVD AVMAVAALCR STFDAPEIDN IVEVGDVITA
           RRDELISIVQ KCQRKFAESL VGKRVEVVID KVGEFGSIGR TRADAPDIDC VVHLGTYVDA
           RRDQLVSQQQ EISEDFAMSR VGKDVDVLID NWDEQAFIGR TTLEAPDIDP VVFVGQMRRC
           RRDELVALQQ DIQAEAAEAA VGSVLDVLVD RIQGGGAVGR SSADAPDIDG VVHVGTVVRV
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????

           ?????????? ??KLAKRVIA CLDVRTNDVT KGDQYVRNLG KPVDLAGQYY KDGADEISFL
           LVTSNSLFDL ECGLAKRVIA CLDVRSNDVT KGDQYVRNLG KPVDLAARYF EEGADEVAFL
           ?????????? ??GLAKRVVA CLDVRENDVT KGDQYVRNLG KPVELAKRYF KEGADEVCFL
           RIIGALDGDL FAGVAKRIIP CLDVKDGRVV KGVNFLRDAG DPVEQAKIYN DEGADELVFL
           HIVDTFDFDL VAMLAKRIIA CLDVRENDVT KGDQYVRNLG KPVELARRYS DDGADEVTFL
           NVIGSSLFDL EAGLARRVIA CLDVRSNDVT KGDSYVRNLG KPVELAGKYF KQGADEVAFL
           KVVGCNGFDL IG???????? ?????????? ?????????? ?????????? ??????????
           ?????????? ??QLAKRVIA CLDVRTNDVT KGDQYVRNLG KPVDLASSYY MDGADEVTFL

           NITGFRDDLP MIQVLRQTSK NVFVPLTVGG GIEVAAEYFR SGADKISIGS DAVSAALEQI
           NITGFRDDTP MLEVLRRASE RVFVPLTVGG GIEVAAEYFR SGADKVSIGS DAVDAAIEQI
           NITSFRGETA MIEVLERTSR EVFVPLCIGG GIDVAAMYFR AGADKVSLGS DAVYAAIERI
           DISATPAHKT TVDMV-RVGE QLFLPLTVGG GIEDMRETLL AGADK----- ----DPLSRG
           NITSFRGDAP MLRVLELTSE HVFVPLCIGG GIDVATSYFR SGADKVSIGS DAVYAAIEQI
           NITGYRDDAP MLEVLRRSSE TVFVPLTVGG GIEVASAYFA SGADKVSIGS DAVYVAVEQI
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NITGFRNDLP MLEVLRKASE KVFVPLTVGG GIEVAAEYFR SGADKISIGS DAVYAALEQI

           SRVYGNQAVV VSIDPRRVWY QCTVSGGREG RPIGAFELAK AVEELGAGEI LLNCIDCDGQ
           SAVYGKQAVV ISIDPRRVWW QCTVKGGREG RDLGAVELAR AVEALGAGEI LLNCIDNDGV
           SEVYGAQAVV ISVDPRKVWY QCTVKGGREG RDLDVVQLVT AAERLGAGEV LLNSMDEDGQ
           ADMFGSQCIV LAIDAKLRWW EVYVAGGRTP TGIDAVEWAI KG???????? ??????????
           SNVYG----- ---------- -CTVKGGREV RDLDAFELAQ ACEALGAGEI LLNCIDKDGQ
           SERYGVQAVV ISIDPRRQWF QCTVKGGREG RDIGAYELAI AMEALGAGEI LLNCIDEDGQ
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           SYVYGNQAVV VSIDPRKVWY QCTVNGGREG RPIGAFELAK AVEELGAGEI LLNCIDCDGR

           GKGFDIDLVK LISDSVGIPV IASSGAGPDH FSEVFEKTNA SAALAAGIFH RKEVPIQSVK
           GQGFDLELVD AVSRAVTIPV IASSGAGPQH FSQVFRATGA AAALAAGIFH RREVGISEVK
           KAGYDLQLVR LVKEAVSIPV IASSGAGAEH FTECFDETDV QAALAAGIFH RGEVSIGEVK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           NNGFDIALIR QMKASVSIPV IASSGAGPQH FIDVFQATNA DAGLAAGIFH RREVGIDEVK
           GNGFDHELVN LVSDAVGIPV IASSGAGPEH FTNVFNVTKC SAALAAGIFH REEVLVSEVK
           ?????????? ?????????? ?????????? ?????????? ?????????? ??????????
           GEGFDLELVK LISEAVKIPV IASSGAGVDH FSDVFSETPA SAALAAGIFH RKEVPIALVK

           EHLQEERIEV R
           AHLAAENIPA R
           QHMRGHGTPV R
           ?????????? ?
           AAVSSSGIPC R
           AHMTSNGLPT R
           ?????????? ?
           EHMSRAGIET R