Query         psy667
Match_columns 392
No_of_seqs    340 out of 1804
Neff          7.3 
Searched_HMMs 46136
Date          Sat Aug 17 00:06:00 2013
Command       hhsearch -i /work/01045/syshi/Psyhhblits/psy667.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/667hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 KOG1542|consensus              100.0 4.3E-84 9.3E-89  613.3  20.5  290   64-389    67-371 (372)
  2 PTZ00203 cathepsin L protease; 100.0 3.7E-76   8E-81  581.5  27.9  293   61-389    31-340 (348)
  3 PTZ00200 cysteine proteinase;  100.0 1.7E-74 3.8E-79  584.0  29.2  322   33-389    88-445 (448)
  4 PTZ00021 falcipain-2; Provisio 100.0 6.5E-73 1.4E-77  574.6  25.5  292   65-390   166-489 (489)
  5 KOG1543|consensus              100.0   2E-66 4.4E-71  508.7  24.7  276   72-386    30-320 (325)
  6 cd02621 Peptidase_C1A_Cathepsi 100.0 1.7E-58 3.7E-63  437.2  20.8  209  152-387     1-240 (243)
  7 cd02698 Peptidase_C1A_Cathepsi 100.0 1.7E-57 3.7E-62  429.5  21.3  206  152-388     1-237 (239)
  8 cd02248 Peptidase_C1A Peptidas 100.0 5.7E-57 1.2E-61  416.3  20.5  206  153-387     1-210 (210)
  9 cd02620 Peptidase_C1A_Cathepsi 100.0 6.1E-57 1.3E-61  424.9  19.2  207  153-386     1-235 (236)
 10 PF00112 Peptidase_C1:  Papain  100.0 7.8E-55 1.7E-59  402.8  17.3  208  152-388     1-219 (219)
 11 PTZ00049 cathepsin C-like prot 100.0 3.9E-54 8.4E-59  446.4  21.3  215  150-391   379-678 (693)
 12 PTZ00364 dipeptidyl-peptidase  100.0 1.2E-53 2.7E-58  438.4  20.9  215  150-387   203-457 (548)
 13 smart00645 Pept_C1 Papain fami 100.0 1.3E-49 2.7E-54  358.4  17.0  166  152-384     1-170 (174)
 14 cd02619 Peptidase_C1 C1 Peptid 100.0 2.7E-46 5.8E-51  346.3  18.2  196  155-379     1-216 (223)
 15 PTZ00462 Serine-repeat antigen 100.0 7.9E-46 1.7E-50  394.2  20.0  201  164-391   544-783 (1004)
 16 KOG1544|consensus              100.0   8E-43 1.7E-47  327.5   9.9  255  106-387   169-458 (470)
 17 COG4870 Cysteine protease [Pos  99.9 7.1E-28 1.5E-32  232.1   8.7  191  151-375    98-314 (372)
 18 cd00585 Peptidase_C1B Peptidas  99.9 3.3E-23 7.1E-28  209.3  14.9  186  165-374    55-399 (437)
 19 PF03051 Peptidase_C1_2:  Pepti  99.6 1.8E-15 3.9E-20  153.3  13.6  187  165-374    56-400 (438)
 20 PF08246 Inhibitor_I29:  Cathep  99.4 2.3E-13   5E-18  100.3   5.5   49   68-116     1-58  (58)
 21 smart00848 Inhibitor_I29 Cathe  99.2 2.1E-11 4.6E-16   89.1   4.1   48   68-115     1-57  (57)
 22 COG3579 PepC Aminopeptidase C   98.7 3.4E-08 7.4E-13   95.0   7.3   75  299-373   307-401 (444)
 23 KOG4128|consensus               96.7  0.0008 1.7E-08   65.2   2.0   81  292-372   305-412 (457)
 24 PF05543 Peptidase_C47:  Stapho  95.3    0.19 4.2E-06   44.9  10.0  120  169-361    18-146 (175)
 25 PF13529 Peptidase_C39_2:  Pept  95.2    0.06 1.3E-06   45.3   6.6   55  292-359    88-144 (144)
 26 PF09778 Guanylate_cyc_2:  Guan  89.2     1.4 3.1E-05   40.8   7.2   64  292-357   112-180 (212)
 27 PF14399 Transpep_BrtH:  NlpC/p  83.8     3.3 7.2E-05   40.2   7.1   57  292-357    77-133 (317)
 28 COG4990 Uncharacterized protei  72.0     8.4 0.00018   34.8   5.2   47  292-360   122-168 (195)
 29 cd02549 Peptidase_C39A A sub-f  64.1      20 0.00043   29.9   6.0   45  296-359    70-114 (141)
 30 cd00044 CysPc Calpains, domain  53.1      20 0.00043   35.2   4.6   28  334-361   234-263 (315)
 31 PF12385 Peptidase_C70:  Papain  42.9      59  0.0013   28.9   5.3   39  292-347    97-135 (166)
 32 smart00230 CysPc Calpain-like   25.8 1.2E+02  0.0026   29.8   5.2   28  334-361   226-255 (318)
 33 PF01640 Peptidase_C10:  Peptid  23.6 2.8E+02  0.0061   25.0   6.8   51  293-370   140-192 (192)

No 1  
>KOG1542|consensus
Probab=100.00  E-value=4.3e-84  Score=613.32  Aligned_cols=290  Identities=40%  Similarity=0.755  Sum_probs=263.0

Q ss_pred             HHHHHHHHHHHhCCCcCChHHHHHHHHHHHHHHH--hhh-------hhccCCcCCCCChHHHhhhcCccccccc--hhhh
Q psy667           64 ILETFKAFIVKRGRQYANDEEIKERFEYFKQDGH--KKH-------ERYGTSEFSDRSPEEILCKTGFKWSERT--YERI  132 (392)
Q Consensus        64 ~~~~F~~f~~ky~K~Y~~~~E~~~R~~iF~~Nl~--~~h-------~~lgiN~FsDlT~eEf~~~~~~~~~~~~--~~~~  132 (392)
                      ..+.|..|+.+|+|+|.+.+|+..|+.||++|++  +++       ..+|+|+|||||+|||  ++.|++.+..  ..+.
T Consensus        67 ~~~~F~~F~~kf~r~Y~s~eE~~~Rl~iF~~N~~~a~~~q~~d~gsA~yGvtqFSDlT~eEF--kk~~l~~~~~~~~~~~  144 (372)
T KOG1542|consen   67 LEDSFKLFTIKFGRSYASREEHAHRLSIFKHNLLRAERLQENDPGSAEYGVTQFSDLTEEEF--KKIYLGVKRRGSKLPG  144 (372)
T ss_pred             hHHHHHHHHHhcCcccCcHHHHHHHHHHHHHHHHHHHHhhhcCccccccCccchhhcCHHHH--HHHhhccccccccCcc
Confidence            4789999999999999999999999999999999  444       7789999999999999  8887765542  1111


Q ss_pred             hhhhhHHHHHhhhccCCCCCCCeeecccCCCCCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHH
Q psy667          133 VADREKVEKMLMEVEKDGPVPDAWDWRKKNVTGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQY  212 (392)
Q Consensus       133 ~~~~~~~~~~~~~~~~~~~lP~~~Dwr~~g~v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~  212 (392)
                      .....+       ..+..++|++||||++|+||||||||.||||||||++++                       +|+++
T Consensus       145 ~~~~~~-------~~~~~~lP~~fDWR~kgaVTpVKnQG~CGSCWAFS~tG~-----------------------vEga~  194 (372)
T KOG1542|consen  145 DAAEAP-------IEPGESLPESFDWRDKGAVTPVKNQGMCGSCWAFSTTGA-----------------------VEGAW  194 (372)
T ss_pred             ccccCc-------CCCCCCCCcccchhccCCccccccCCcCcchhhhhhhhh-----------------------hhhHH
Confidence            111111       123458999999999999999999999999999999999                       99999


Q ss_pred             HHHhCCccccchhhhhhhccCCCCCCCCCchhhHHHH-HhCCCCCCCCCCCCCCCCCCc-ccccCCCCceeEecccceec
Q psy667          213 AIKTGKLVEFSKSQLVECAKQCSGCDGCFFEPSIEYT-HQAGLESEKDYPYKNANGEKF-KCAYDKSKVKLFTGKDFLHF  290 (392)
Q Consensus       213 ~~~~~~~~~lS~q~l~dc~~~~~gC~GG~~~~a~~~~-~~~Gi~~e~~yPY~~~~~~~~-~C~~~~~~~~~~i~~~y~~~  290 (392)
                      +|++|++++||||+|+||+..++||+||.+..||+|+ +..|+..|++|||+   +..+ .|..++....+.|+ +|..+
T Consensus       195 ~i~~g~LvsLSEQeLvDCD~~d~gC~GGl~~nA~~~~~~~gGL~~E~dYPY~---g~~~~~C~~~~~~~~v~I~-~f~~l  270 (372)
T KOG1542|consen  195 AIATGKLVSLSEQELVDCDSCDNGCNGGLMDNAFKYIKKAGGLEKEKDYPYT---GKKGNQCHFDKSKIVVSIK-DFSML  270 (372)
T ss_pred             HhhcCcccccchhhhhcccCcCCcCCCCChhHHHHHHHHhCCccccccCCcc---ccCCCccccchhhceEEEe-ccEec
Confidence            9999999999999999999999999999999999996 88999999999999   8887 99999999999999 99999


Q ss_pred             C-CHHHHHHHHHcCCCeEEEEEcCCCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecC-CccEEEEEcCCCCCCCCCcE
Q psy667          291 N-GSETMKKILYKYGPLSVLLNSDLIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQD-NIPYWLVRNSWGPIGPDEGF  368 (392)
Q Consensus       291 ~-~~~~ik~~l~~~gPV~v~i~~~~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~-g~~ywiikNSWG~~WG~~GY  368 (392)
                      + ++++|.+.|.++|||+|+|++..+|+|.+||+.+....|++..++|||+|||||... .++|||||||||++|||+||
T Consensus       271 ~~nE~~ia~wLv~~GPi~vgiNa~~mQ~YrgGV~~P~~~~Cs~~~~~HaVLlvGyG~~g~~~PYWIVKNSWG~~WGE~GY  350 (372)
T KOG1542|consen  271 SNNEDQIAAWLVTFGPLSVGINAKPMQFYRGGVSCPSKYICSPKLLNHAVLLVGYGSSGYEKPYWIVKNSWGTSWGEKGY  350 (372)
T ss_pred             CCCHHHHHHHHHhcCCeEEEEchHHHHHhcccccCCCcccCCccccCceEEEEeecCCCCCCceEEEECCccccccccce
Confidence            9 999999999999999999999899999999999966689987899999999999987 89999999999999999999


Q ss_pred             EEEEecCCccccccceeEEEE
Q psy667          369 FKIERGNNACGIEQIAGYATI  389 (392)
Q Consensus       369 ~~i~r~~n~cgi~~~~~~~~~  389 (392)
                      +|+.||.|.|||++.++.+.+
T Consensus       351 ~~l~RG~N~CGi~~mvss~~v  371 (372)
T KOG1542|consen  351 YKLCRGSNACGIADMVSSAAV  371 (372)
T ss_pred             EEEeccccccccccchhhhhc
Confidence            999999999999999988765


No 2  
>PTZ00203 cathepsin L protease; Provisional
Probab=100.00  E-value=3.7e-76  Score=581.55  Aligned_cols=293  Identities=29%  Similarity=0.552  Sum_probs=243.8

Q ss_pred             hhHHHHHHHHHHHHhCCCcCChHHHHHHHHHHHHHHH--hhh------hhccCCcCCCCChHHHhhhcCcccccc-chhh
Q psy667           61 NENILETFKAFIVKRGRQYANDEEIKERFEYFKQDGH--KKH------ERYGTSEFSDRSPEEILCKTGFKWSER-TYER  131 (392)
Q Consensus        61 ~~~~~~~F~~f~~ky~K~Y~~~~E~~~R~~iF~~Nl~--~~h------~~lgiN~FsDlT~eEf~~~~~~~~~~~-~~~~  131 (392)
                      ..+++.+|++|+++|+|.|.+.+|+.+|+.||++|++  ++|      |++|+|+|+|||+|||  .+.+++... ...+
T Consensus        31 ~~~~~~~f~~~~~~~~K~Y~~~~E~~~R~~iF~~N~~~I~~~N~~~~~~~lg~N~FaDlT~eEf--~~~~l~~~~~~~~~  108 (348)
T PTZ00203         31 GTPAAALFEEFKRTYQRAYGTLTEEQQRLANFERNLELMREHQARNPHARFGITKFFDLSEAEF--AARYLNGAAYFAAA  108 (348)
T ss_pred             ccHHHHHHHHHHHHhCCCCCChHHHHHHHHHHHHHHHHHHHHhccCCCeEEeccccccCCHHHH--HHHhcCCCcccccc
Confidence            4456678999999999999998899999999999999  666      8899999999999999  655543111 0000


Q ss_pred             hhhhhhHHHHHhhhccCCCCCCCeeecccCCCCCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHH
Q psy667          132 IVADREKVEKMLMEVEKDGPVPDAWDWRKKNVTGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQ  211 (392)
Q Consensus       132 ~~~~~~~~~~~~~~~~~~~~lP~~~Dwr~~g~v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~  211 (392)
                      ..........   ......++|++||||++|+|+||||||.||||||||++++                       +|++
T Consensus       109 ~~~~~~~~~~---~~~~~~~lP~~~DWR~~g~VtpVkdQg~CGSCWAfa~~~a-----------------------iEs~  162 (348)
T PTZ00203        109 KQHAGQHYRK---ARADLSAVPDAVDWREKGAVTPVKNQGACGSCWAFSAVGN-----------------------IESQ  162 (348)
T ss_pred             cccccccccc---cccccccCCCCCcCCcCCCCCCccccCCCccHHHHhhHHH-----------------------HHHH
Confidence            0000000000   0001136899999999999999999999999999999999                       9999


Q ss_pred             HHHHhCCccccchhhhhhhccCCCCCCCCCchhhHHHHHh---CCCCCCCCCCCCCCCCCCc---ccccCCC-CceeEec
Q psy667          212 YAIKTGKLVEFSKSQLVECAKQCSGCDGCFFEPSIEYTHQ---AGLESEKDYPYKNANGEKF---KCAYDKS-KVKLFTG  284 (392)
Q Consensus       212 ~~~~~~~~~~lS~q~l~dc~~~~~gC~GG~~~~a~~~~~~---~Gi~~e~~yPY~~~~~~~~---~C~~~~~-~~~~~i~  284 (392)
                      +++++++.+.||+|+|+||+..+.||+||++..||+|+.+   +|+++|++|||.   +.++   .|..... ...+++.
T Consensus       163 ~~i~~~~~~~LSeQqLvdC~~~~~GC~GG~~~~a~~yi~~~~~ggi~~e~~YPY~---~~~~~~~~C~~~~~~~~~~~i~  239 (348)
T PTZ00203        163 WAVAGHKLVRLSEQQLVSCDHVDNGCGGGLMLQAFEWVLRNMNGTVFTEKSYPYV---SGNGDVPECSNSSELAPGARID  239 (348)
T ss_pred             HHHhcCCCccCCHHHHHhccCCCCCCCCCCHHHHHHHHHHhcCCCCCccccCCCc---cCCCCCCcCCCCcccccceEec
Confidence            9999999999999999999987899999999999999943   468999999999   5444   6874332 2346787


Q ss_pred             ccceecC-CHHHHHHHHHcCCCeEEEEEcCCCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecCCccEEEEEcCCCCCC
Q psy667          285 KDFLHFN-GSETMKKILYKYGPLSVLLNSDLIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQDNIPYWLVRNSWGPIG  363 (392)
Q Consensus       285 ~~y~~~~-~~~~ik~~l~~~gPV~v~i~~~~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~g~~ywiikNSWG~~W  363 (392)
                       +|..++ +++.|+.+|+++|||+|+|++++|++|++|||.    .|....++|||+|||||.++|++|||||||||++|
T Consensus       240 -~~~~i~~~e~~~~~~l~~~GPv~v~i~a~~f~~Y~~GIy~----~c~~~~~nHaVliVGYG~~~g~~YWiikNSWG~~W  314 (348)
T PTZ00203        240 -GYVSMESSERVMAAWLAKNGPISIAVDASSFMSYHSGVLT----SCIGEQLNHGVLLVGYNMTGEVPYWVIKNSWGEDW  314 (348)
T ss_pred             -ceeecCcCHHHHHHHHHhCCCEEEEEEhhhhcCccCceee----ccCCCCCCeEEEEEEEecCCCceEEEEEcCCCCCc
Confidence             998887 888999999999999999999899999999996    37655689999999999988999999999999999


Q ss_pred             CCCcEEEEEecCCccccccceeEEEE
Q psy667          364 PDEGFFKIERGNNACGIEQIAGYATI  389 (392)
Q Consensus       364 G~~GY~~i~r~~n~cgi~~~~~~~~~  389 (392)
                      ||+|||||+||.|.|||++++..+.+
T Consensus       315 Ge~GY~ri~rg~n~Cgi~~~~~~~~~  340 (348)
T PTZ00203        315 GEKGYVRVTMGVNACLLTGYPVSVHV  340 (348)
T ss_pred             CcCceEEEEcCCCcccccceEEEEec
Confidence            99999999999999999988887654


No 3  
>PTZ00200 cysteine proteinase; Provisional
Probab=100.00  E-value=1.7e-74  Score=584.03  Aligned_cols=322  Identities=29%  Similarity=0.535  Sum_probs=264.2

Q ss_pred             CCCCCcchhhhhhhhhhhhhhcCCCCCChh---HHHHHHHHHHHHhCCCcCChHHHHHHHHHHHHHHH--hhh-----hh
Q psy667           33 LPSLTDRITDQVVARVDTLAIEGSLTFDNE---NILETFKAFIVKRGRQYANDEEIKERFEYFKQDGH--KKH-----ER  102 (392)
Q Consensus        33 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~---~~~~~F~~f~~ky~K~Y~~~~E~~~R~~iF~~Nl~--~~h-----~~  102 (392)
                      +|..+++.++.++.++.+|...+.+..++.   ++..+|++|+++|+|.|.+.+|+.+|+.||++|++  ++|     |+
T Consensus        88 ~~~~~~~~~~~~~~~~~~~~~~~~i~~~~~~e~e~~~~F~~f~~ky~K~Y~~~~E~~~R~~iF~~Nl~~I~~hN~~~~y~  167 (448)
T PTZ00200         88 FPRLDKSKRDSYVDELTRLFKDGYISDDPKLEFEVYLEFEEFNKKYNRKHATHAERLNRFLTFRNNYLEVKSHKGDEPYS  167 (448)
T ss_pred             CCCcChhHHHHHHHHHHHHhhCCCcCCCccchHHHHHHHHHHHHHhCCcCCCHHHHHHHHHHHHHHHHHHHHhcCcCCeE
Confidence            366667777888999999988877655543   34568999999999999999999999999999999  666     88


Q ss_pred             ccCCcCCCCChHHHhhhcCccccccchh-----hh---hh---hhhHH-HHHh------hhc-cCCCCCCCeeecccCCC
Q psy667          103 YGTSEFSDRSPEEILCKTGFKWSERTYE-----RI---VA---DREKV-EKML------MEV-EKDGPVPDAWDWRKKNV  163 (392)
Q Consensus       103 lgiN~FsDlT~eEf~~~~~~~~~~~~~~-----~~---~~---~~~~~-~~~~------~~~-~~~~~lP~~~Dwr~~g~  163 (392)
                      +|+|+|||||+|||  .+.+++...+..     +.   ..   ..... ....      .+. .....+|+++|||+.|+
T Consensus       168 lgiN~FsDlT~eEF--~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~P~~~DWR~~g~  245 (448)
T PTZ00200        168 KEINKFSDLTEEEF--RKLFPVIKVPPKSNSTSHNNDFKARHVSNPTYLKNLKKAKNTDEDVKDPSKITGEGLDWRRADA  245 (448)
T ss_pred             EeccccccCCHHHH--HHHhccCCCcccccccccccccccccccccccccccccccccccccccccccCCCCccCCCCCC
Confidence            99999999999999  665654322100     00   00   00000 0000      000 00123699999999999


Q ss_pred             CCCCCCCC-CCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHhCCccccchhhhhhhccCCCCCCCCCc
Q psy667          164 TGPAGDQA-ACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTGKLVEFSKSQLVECAKQCSGCDGCFF  242 (392)
Q Consensus       164 v~pVkdQg-~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~~~~~lS~q~l~dc~~~~~gC~GG~~  242 (392)
                      |+|||||| .||||||||++++                       +|+++++++++.+.||+|+|+||+..+.||+||++
T Consensus       246 vtpVkdQG~~CGSCWAFat~~a-----------------------iEs~~~i~~~~~~~LSeQqLvDC~~~~~GC~GG~~  302 (448)
T PTZ00200        246 VTKVKDQGLNCGSCWAFSSVGS-----------------------VESLYKIYRDKSVDLSEQELVNCDTKSQGCSGGYP  302 (448)
T ss_pred             CCCcccCCCccchHHHHhHHHH-----------------------HHHHHHHhcCCCeecCHHHHhhccCccCCCCCCcH
Confidence            99999999 9999999999999                       99999999999999999999999988899999999


Q ss_pred             hhhHHHHHhCCCCCCCCCCCCCCCCCCcccccCCCCceeEecccceecCCHHHHHHHHHcCCCeEEEEEcC-CCcccCCc
Q psy667          243 EPSIEYTHQAGLESEKDYPYKNANGEKFKCAYDKSKVKLFTGKDFLHFNGSETMKKILYKYGPLSVLLNSD-LIHDYNGT  321 (392)
Q Consensus       243 ~~a~~~~~~~Gi~~e~~yPY~~~~~~~~~C~~~~~~~~~~i~~~y~~~~~~~~ik~~l~~~gPV~v~i~~~-~f~~y~~G  321 (392)
                      ..|++|++++|+++|++|||.   +..+.|..... ..+.|. +|..+++.+.+++++. +|||+|+|++. +|++|++|
T Consensus       303 ~~A~~yi~~~Gi~~e~~YPY~---~~~~~C~~~~~-~~~~i~-~y~~~~~~~~l~~~l~-~GPV~v~i~~~~~f~~Yk~G  376 (448)
T PTZ00200        303 DTALEYVKNKGLSSSSDVPYL---AKDGKCVVSST-KKVYID-SYLVAKGKDVLNKSLV-ISPTVVYIAVSRELLKYKSG  376 (448)
T ss_pred             HHHHHHHhhcCccccccCCCC---CCCCCCcCCCC-CeeEec-ceEecCHHHHHHHHHh-cCCEEEEeecccccccCCCC
Confidence            999999988899999999999   88889986543 346787 8887776666777765 89999999995 89999999


Q ss_pred             eeeCCCCCCCCCCCCeEEEEEEEee--cCCccEEEEEcCCCCCCCCCcEEEEEec---CCccccccceeEEEE
Q psy667          322 PIRKNDETCSPYDLGHAVLLVGYGK--QDNIPYWLVRNSWGPIGPDEGFFKIERG---NNACGIEQIAGYATI  389 (392)
Q Consensus       322 iy~~~~~~c~~~~~~Hav~iVGyg~--~~g~~ywiikNSWG~~WG~~GY~~i~r~---~n~cgi~~~~~~~~~  389 (392)
                      ||.+   .|+. .++|||+|||||.  ++|.+|||||||||++|||+|||||+|+   .|.|||++.+.||++
T Consensus       377 Iy~~---~C~~-~~nHaV~lVGyG~d~~~g~~YWIIkNSWG~~WGe~GY~ri~r~~~g~n~CGI~~~~~~P~~  445 (448)
T PTZ00200        377 VYNG---ECGK-SLNHAVLLVGEGYDEKTKKRYWIIKNSWGTDWGENGYMRLERTNEGTDKCGILTVGLTPVF  445 (448)
T ss_pred             cccc---ccCC-CCcEEEEEEEecccCCCCCceEEEEcCCCCCcccCeeEEEEeCCCCCCcCCccccceeeEE
Confidence            9987   5876 4899999999985  4688999999999999999999999996   489999999999987


No 4  
>PTZ00021 falcipain-2; Provisional
Probab=100.00  E-value=6.5e-73  Score=574.61  Aligned_cols=292  Identities=31%  Similarity=0.572  Sum_probs=243.1

Q ss_pred             HHHHHHHHHHhCCCcCChHHHHHHHHHHHHHHH--hhh-------hhccCCcCCCCChHHHhhhcCccccccchhhh--h
Q psy667           65 LETFKAFIVKRGRQYANDEEIKERFEYFKQDGH--KKH-------ERYGTSEFSDRSPEEILCKTGFKWSERTYERI--V  133 (392)
Q Consensus        65 ~~~F~~f~~ky~K~Y~~~~E~~~R~~iF~~Nl~--~~h-------~~lgiN~FsDlT~eEf~~~~~~~~~~~~~~~~--~  133 (392)
                      ...|++|+.+|+|+|.+.+|+.+|+.||++|++  ++|       |++|+|+|||||+|||  ++.+++........  .
T Consensus       166 ~~~F~~wk~ky~K~Y~~~eE~~~R~~iF~~Nl~~Ie~hN~~~~~ty~lgiNqFsDlT~EEF--~~~~l~~~~~~~~~~~~  243 (489)
T PTZ00021        166 VNSFYLFIKEHGKKYQTPDEMQQRYLSFVENLAKINAHNNKENVLYKKGMNRFGDLSFEEF--KKKYLTLKSFDFKSNGK  243 (489)
T ss_pred             HHHHHHHHHHhCCcCCCHHHHHHHHHHHHHHHHHHHHhhccCCCCEEEeccccccCCHHHH--HHHhccccccccccccc
Confidence            368999999999999999999999999999999  666       8899999999999999  66665432110000  0


Q ss_pred             -hhhh-HHHHHhhh-ccCC-CCCCCeeecccCCCCCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchh
Q psy667          134 -ADRE-KVEKMLME-VEKD-GPVPDAWDWRKKNVTGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLE  209 (392)
Q Consensus       134 -~~~~-~~~~~~~~-~~~~-~~lP~~~Dwr~~g~v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le  209 (392)
                       .... ........ .+.. ...|+++|||+.|+|+||||||.||||||||++++                       +|
T Consensus       244 ~~~~~~~~~~~~~~~~~~~~~~~P~s~DWR~~g~VtpVKdQG~CGSCWAFAa~~a-----------------------lE  300 (489)
T PTZ00021        244 KSPRVINYDDVIKKYKPKDATFDHAKYDWRLHNGVTPVKDQKNCGSCWAFSTVGV-----------------------VE  300 (489)
T ss_pred             cccccccccccccccccccccCCccccccccCCCCCCcccccccccHHHHHHHHH-----------------------HH
Confidence             0000 00000000 0111 12499999999999999999999999999999999                       99


Q ss_pred             HHHHHHhCCccccchhhhhhhccCCCCCCCCCchhhHHHH-HhCCCCCCCCCCCCCCCCC-CcccccCCCCceeEecccc
Q psy667          210 GQYAIKTGKLVEFSKSQLVECAKQCSGCDGCFFEPSIEYT-HQAGLESEKDYPYKNANGE-KFKCAYDKSKVKLFTGKDF  287 (392)
Q Consensus       210 ~~~~~~~~~~~~lS~q~l~dc~~~~~gC~GG~~~~a~~~~-~~~Gi~~e~~yPY~~~~~~-~~~C~~~~~~~~~~i~~~y  287 (392)
                      +++++++++.+.||+|+|+||+..+.||+||++..|++|+ ..+||++|++|||.   +. .+.|........++|. +|
T Consensus       301 s~~~I~~g~~v~LSeQqLVDCs~~n~GC~GG~~~~Af~yi~~~gGl~tE~~YPY~---~~~~~~C~~~~~~~~~~i~-~y  376 (489)
T PTZ00021        301 SQYAIRKNELVSLSEQELVDCSFKNNGCYGGLIPNAFEDMIELGGLCSEDDYPYV---SDTPELCNIDRCKEKYKIK-SY  376 (489)
T ss_pred             HHHHHHcCCCcccCHHHHhhhccCCCCCCCcchHhhhhhhhhccccCcccccCcc---CCCCCccccccccccceee-eE
Confidence            9999999999999999999999888999999999999999 66699999999999   65 4789866555668888 99


Q ss_pred             eecCCHHHHHHHHHcCCCeEEEEEcC-CCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecC----------CccEEEEE
Q psy667          288 LHFNGSETMKKILYKYGPLSVLLNSD-LIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQD----------NIPYWLVR  356 (392)
Q Consensus       288 ~~~~~~~~ik~~l~~~gPV~v~i~~~-~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~----------g~~ywiik  356 (392)
                      ..++ +++|+++|+.+|||+|+|++. +|++|++|||.+   .|+. .++|||+|||||+++          +.+|||||
T Consensus       377 ~~i~-~~~lk~al~~~GPVsv~i~a~~~f~~YkgGIy~~---~C~~-~~nHAVlIVGYG~e~~~~~~~~~~~~~~YWIVK  451 (489)
T PTZ00021        377 VSIP-EDKFKEAIRFLGPISVSIAVSDDFAFYKGGIFDG---ECGE-EPNHAVILVGYGMEEIYNSDTKKMEKRYYYIIK  451 (489)
T ss_pred             EEec-HHHHHHHHHhcCCeEEEEEeecccccCCCCcCCC---CCCC-ccceEEEEEEecCcCCcccccccCCCCCEEEEE
Confidence            8886 578999999899999999995 899999999986   5876 589999999999753          24799999


Q ss_pred             cCCCCCCCCCcEEEEEecC----CccccccceeEEEEE
Q psy667          357 NSWGPIGPDEGFFKIERGN----NACGIEQIAGYATID  390 (392)
Q Consensus       357 NSWG~~WG~~GY~~i~r~~----n~cgi~~~~~~~~~~  390 (392)
                      ||||++|||+|||||+|+.    |.|||++.+.||+++
T Consensus       452 NSWGt~WGE~GY~rI~r~~~g~~n~CGI~t~a~yP~~~  489 (489)
T PTZ00021        452 NSWGESWGEKGFIRIETDENGLMKTCSLGTEAYVPLIE  489 (489)
T ss_pred             CCCCCCcccCeEEEEEcCCCCCCCCCCCcccceeEecC
Confidence            9999999999999999986    599999999999874


No 5  
>KOG1543|consensus
Probab=100.00  E-value=2e-66  Score=508.69  Aligned_cols=276  Identities=34%  Similarity=0.624  Sum_probs=237.1

Q ss_pred             HHHhCCCcCChHHHHHHHHHHHHHHH--hhh-------hhccCCcCCCCChHHHhhhcCccccccchhhhhhhhhHHHHH
Q psy667           72 IVKRGRQYANDEEIKERFEYFKQDGH--KKH-------ERYGTSEFSDRSPEEILCKTGFKWSERTYERIVADREKVEKM  142 (392)
Q Consensus        72 ~~ky~K~Y~~~~E~~~R~~iF~~Nl~--~~h-------~~lgiN~FsDlT~eEf~~~~~~~~~~~~~~~~~~~~~~~~~~  142 (392)
                      +.+|.+.|.+..|...|+.+|.+|++  +.|       |++++|+|+|+|.+|+  .+.+.+...+.........+    
T Consensus        30 ~~~~~~~y~~~~~~~~r~~~f~~n~~~~~~~n~~~~~~~~~g~n~~~d~~~ee~--~~~~~~~~~~~~~~~~~~~~----  103 (325)
T KOG1543|consen   30 LVKFLKRYEDRVEKKARRAIFKENLQKIESHNLKYVLSFLMGVNQFADLTTEEF--KRKKTGKKPPEIKRDKFTEK----  103 (325)
T ss_pred             hhhhccccccHHHHHHHHHHHHHHHHHHHhhhhhhceeeeeccccccccchHHH--HHhhccccCccccccccccc----
Confidence            67777778777889999999999987  333       7899999999999999  76665544321100000000    


Q ss_pred             hhhccCCCCCCCeeecccCCC-CCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHhC-Ccc
Q psy667          143 LMEVEKDGPVPDAWDWRKKNV-TGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTG-KLV  220 (392)
Q Consensus       143 ~~~~~~~~~lP~~~Dwr~~g~-v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~-~~~  220 (392)
                          ....++|++||||++|. ++||||||.||||||||++++                       ||++++|++| .++
T Consensus       104 ----~~~~~~p~s~DwR~~~~~~~~vkdQg~CgsCWAFaa~~a-----------------------ie~~~~i~~g~~l~  156 (325)
T KOG1543|consen  104 ----LDGDDLPDSFDWRDKGAVTPPVKDQGSCGSCWAFAATGA-----------------------LEDRYNIKTGGKLL  156 (325)
T ss_pred             ----cchhhCCCCccccccCCcCCCcCCCCcCcchHHHHHHHH-----------------------HHHHHHHHhCCccC
Confidence                11247999999999975 555999999999999999999                       9999999999 999


Q ss_pred             ccchhhhhhhcc-CCCCCCCCCchhhHHHHHhCCCCC-CCCCCCCCCCCCCcccccCCCCceeEecccceecC-CHHHHH
Q psy667          221 EFSKSQLVECAK-QCSGCDGCFFEPSIEYTHQAGLES-EKDYPYKNANGEKFKCAYDKSKVKLFTGKDFLHFN-GSETMK  297 (392)
Q Consensus       221 ~lS~q~l~dc~~-~~~gC~GG~~~~a~~~~~~~Gi~~-e~~yPY~~~~~~~~~C~~~~~~~~~~i~~~y~~~~-~~~~ik  297 (392)
                      .||+|+|+||+. .++||+||.+..|++|++.+|+++ +++|||.   +..+.|........+.+. ++..++ ++++|+
T Consensus       157 sLSeq~lvdC~~~~~~GC~GG~~~~A~~yi~~~G~~t~~~~Ypy~---~~~~~C~~~~~~~~~~~~-~~~~~~~~e~~i~  232 (325)
T KOG1543|consen  157 SLSEQDLVDCCGECGDGCNGGEPKNAFKYIKKNGGVTECENYPYI---GKDGTCKSNKKDKTVTIK-GFYNVPANEEAIA  232 (325)
T ss_pred             ccChhhhhhccCCCCCCcCCCCHHHHHHHHHHhCCCCCCcCCCCc---CCCCCccCCCccceeEee-eeeecCcCHHHHH
Confidence            999999999996 489999999999999997778777 9999999   888899988876777887 888787 999999


Q ss_pred             HHHHcCCCeEEEEEcC-CCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecCCccEEEEEcCCCCCCCCCcEEEEEecCC
Q psy667          298 KILYKYGPLSVLLNSD-LIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQDNIPYWLVRNSWGPIGPDEGFFKIERGNN  376 (392)
Q Consensus       298 ~~l~~~gPV~v~i~~~-~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~g~~ywiikNSWG~~WG~~GY~~i~r~~n  376 (392)
                      .+|+.+|||+|+|++. +|+.|++|||.++  .|....++|||+|||||+.++.+|||||||||+.|||+|||||.|+.|
T Consensus       233 ~~v~~~GPv~v~~~a~~~F~~Y~~GVy~~~--~~~~~~~~Hav~iVGyG~~~~~~YWivkNSWG~~WGe~Gy~ri~r~~~  310 (325)
T KOG1543|consen  233 EAVAKNGPVSVAIDAYEDFSLYKGGVYAEE--KGDDKEGDHAVLIVGYGTGDGVDYWIVKNSWGTDWGEKGYFRIARGVN  310 (325)
T ss_pred             HHHHhcCCeEEEEeehhhhhhccCceEeCC--CCCCCCCCceEEEEEEcCCCCceeEEEEcCCCCCcccCceEEEecCCC
Confidence            9999999999999995 8999999999997  554435999999999999667899999999999999999999999999


Q ss_pred             ccccccceeE
Q psy667          377 ACGIEQIAGY  386 (392)
Q Consensus       377 ~cgi~~~~~~  386 (392)
                      .|+|++.+.|
T Consensus       311 ~~~I~~~~~~  320 (325)
T KOG1543|consen  311 KCGIASEASY  320 (325)
T ss_pred             chhhhccccc
Confidence            9999999988


No 6  
>cd02621 Peptidase_C1A_CathepsinC Cathepsin C; also known as Dipeptidyl Peptidase I (DPPI), an atypical papain-like cysteine peptidase with chloride dependency and dipeptidyl aminopeptidase activity, resulting from its tetrameric structure which limits substrate access. Each subunit of the tetramer is composed of three peptides: the heavy and light chains, which together adopts the papain fold and forms the catalytic domain; and the residual propeptide region, which forms a beta barrel and points towards the substrate's N-terminus. The subunit composition is the result of the unique characteristic of procathepsin C maturation involving the cleavage of the catalytic domain and the non-autocatalytic excision of an activation peptide within its propeptide region. By removing N-terminal dipeptide extensions, cathepsin C activates granule serine peptidases (granzymes) involved in cell-mediated apoptosis, inflammation and tissue remodelling. Loss-of-function mutations in cathepsin C are assoc
Probab=100.00  E-value=1.7e-58  Score=437.25  Aligned_cols=209  Identities=32%  Similarity=0.625  Sum_probs=183.2

Q ss_pred             CCCeeecccCC----CCCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHhCC------ccc
Q psy667          152 VPDAWDWRKKN----VTGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTGK------LVE  221 (392)
Q Consensus       152 lP~~~Dwr~~g----~v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~~------~~~  221 (392)
                      ||++||||+.+    +|+||+|||.||||||||++++                       +|+++.+++++      .+.
T Consensus         1 lP~~fDwr~~~~~~~~v~~v~dQg~CGsCwAfa~~~~-----------------------ies~~~i~~~~~~~~~~~~~   57 (243)
T cd02621           1 LPKSFDWGDVNNGFNYVSPVRNQGGCGSCYAFASVYA-----------------------LEARIMIASNKTDPLGQQPI   57 (243)
T ss_pred             CCCcccccccCCCCcccccCCCCCcCccHHHHHHHHH-----------------------HHHHHHHHhCCCCccccCcc
Confidence            69999999998    9999999999999999999999                       99999998876      789


Q ss_pred             cchhhhhhhccCCCCCCCCCchhhHHHHHhCCCCCCCCCCCCCCCC-CCcccccCC-CCceeEeccccee------cCCH
Q psy667          222 FSKSQLVECAKQCSGCDGCFFEPSIEYTHQAGLESEKDYPYKNANG-EKFKCAYDK-SKVKLFTGKDFLH------FNGS  293 (392)
Q Consensus       222 lS~q~l~dc~~~~~gC~GG~~~~a~~~~~~~Gi~~e~~yPY~~~~~-~~~~C~~~~-~~~~~~i~~~y~~------~~~~  293 (392)
                      ||+|+|+||+..+.||+||++..|++|+++.|+++|++|||.   + ..+.|.... ....+++. +|..      +.++
T Consensus        58 lS~q~l~dC~~~~~GC~GG~~~~a~~~~~~~Gi~~e~~yPY~---~~~~~~C~~~~~~~~~~~~~-~~~~i~~~~~~~~~  133 (243)
T cd02621          58 LSPQHVLSCSQYSQGCDGGFPFLVGKFAEDFGIVTEDYFPYT---ADDDRPCKASPSECRRYYFS-DYNYVGGCYGCTNE  133 (243)
T ss_pred             cCHHHhhhhcCCCCCCCCCCHHHHHHHHHhcCcCCCceeCCC---CCCCCCCCCCcccccccccc-ceeEcccccccCCH
Confidence            999999999977899999999999999999999999999999   5 677887654 33334444 4443      3488


Q ss_pred             HHHHHHHHcCCCeEEEEEcC-CCcccCCceeeCCC--CCCCC--------CCCCeEEEEEEEeecC--CccEEEEEcCCC
Q psy667          294 ETMKKILYKYGPLSVLLNSD-LIHDYNGTPIRKND--ETCSP--------YDLGHAVLLVGYGKQD--NIPYWLVRNSWG  360 (392)
Q Consensus       294 ~~ik~~l~~~gPV~v~i~~~-~f~~y~~Giy~~~~--~~c~~--------~~~~Hav~iVGyg~~~--g~~ywiikNSWG  360 (392)
                      ++||++|+++|||+++|++. +|++|++|||..+.  ..|+.        ..++|||+|||||++.  +.+|||||||||
T Consensus       134 ~~ik~~i~~~GPv~v~~~~~~~F~~Y~~GIy~~~~~~~~C~~~~~~~~~~~~~~HaV~iVGyg~~~~~g~~YWiirNSWG  213 (243)
T cd02621         134 DEMKWEIYRNGPIVVAFEVYSDFDFYKEGVYHHTDNDEVSDGDNDNFNPFELTNHAVLLVGWGEDEIKGEKYWIVKNSWG  213 (243)
T ss_pred             HHHHHHHHHcCCEEEEEEecccccccCCeEECcCCcccccccccccccCcccCCeEEEEEEeeccCCCCCcEEEEEcCCC
Confidence            99999999999999999994 89999999998751  11643        2579999999999876  899999999999


Q ss_pred             CCCCCCcEEEEEecCCccccccceeEE
Q psy667          361 PIGPDEGFFKIERGNNACGIEQIAGYA  387 (392)
Q Consensus       361 ~~WG~~GY~~i~r~~n~cgi~~~~~~~  387 (392)
                      ++||++|||||+|+.|.|||++.+.++
T Consensus       214 ~~WGe~Gy~~i~~~~~~cgi~~~~~~~  240 (243)
T cd02621         214 SSWGEKGYFKIRRGTNECGIESQAVFA  240 (243)
T ss_pred             CCCCcCCeEEEecCCcccCcccceEee
Confidence            999999999999999999999998765


No 7  
>cd02698 Peptidase_C1A_CathepsinX Cathepsin X; the only papain-like lysosomal cysteine peptidase exhibiting carboxymonopeptidase activity. It can also act as a carboxydipeptidase, like cathepsin B, but has been shown to preferentially cleave substrates through a monopeptidyl carboxypeptidase pathway. The propeptide region of cathepsin X, the shortest among papain-like peptidases, is covalently attached to the active site cysteine in the inactive form of the enzyme. Little is known about the biological function of cathepsin X. Some studies point to a role in early tumorigenesis. A more recent study indicates that cathepsin X expression is restricted to immune cells suggesting a role in phagocytosis and the regulation of the immune response.
Probab=100.00  E-value=1.7e-57  Score=429.45  Aligned_cols=206  Identities=29%  Similarity=0.602  Sum_probs=183.0

Q ss_pred             CCCeeecccCC---CCCCCCCCC---CCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHhC---Ccccc
Q psy667          152 VPDAWDWRKKN---VTGPAGDQA---ACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTG---KLVEF  222 (392)
Q Consensus       152 lP~~~Dwr~~g---~v~pVkdQg---~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~---~~~~l  222 (392)
                      ||++||||+.+   +|+||||||   .||||||||++++                       ||+++.++++   +.+.|
T Consensus         1 lP~~~Dwr~~~~~~~v~~vk~Qg~~~~CGsCwAfa~~~a-----------------------ies~~~i~~~~~~~~~~l   57 (239)
T cd02698           1 LPKSWDWRNVNGVNYVSPTRNQHIPQYCGSCWAHGSTSA-----------------------LADRINIARKGAWPSVYL   57 (239)
T ss_pred             CCCCcccccCCCCcccCccccCCCCCCCCcchHHHhHHH-----------------------HHHHHHHHHCCCCCCccc
Confidence            69999999988   999999998   8999999999999                       9999998875   36899


Q ss_pred             chhhhhhhccCCCCCCCCCchhhHHHHHhCCCCCCCCCCCCCCCCCCccccc---------------CCCCceeEecccc
Q psy667          223 SKSQLVECAKQCSGCDGCFFEPSIEYTHQAGLESEKDYPYKNANGEKFKCAY---------------DKSKVKLFTGKDF  287 (392)
Q Consensus       223 S~q~l~dc~~~~~gC~GG~~~~a~~~~~~~Gi~~e~~yPY~~~~~~~~~C~~---------------~~~~~~~~i~~~y  287 (392)
                      |+|+|+||+. +.||+||++..|++|+++.|+++|++|||.   +....|..               .+....++++ +|
T Consensus        58 S~Q~lldC~~-~~gC~GG~~~~a~~~~~~~Gl~~e~~yPY~---~~~~~C~~~~~~~~c~~~~~c~~~~~~~~~~i~-~~  132 (239)
T cd02698          58 SVQVVIDCAG-GGSCHGGDPGGVYEYAHKHGIPDETCNPYQ---AKDGECNPFNRCGTCNPFGECFAIKNYTLYFVS-DY  132 (239)
T ss_pred             CHHHHHhCCC-CCCccCcCHHHHHHHHHHcCcCCCCeeCCc---CCCCCCcCCCCCCCcccCcccccccccceEEee-ec
Confidence            9999999987 789999999999999988999999999998   54444542               1122346777 88


Q ss_pred             eecCCHHHHHHHHHcCCCeEEEEEcC-CCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecC-CccEEEEEcCCCCCCCC
Q psy667          288 LHFNGSETMKKILYKYGPLSVLLNSD-LIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQD-NIPYWLVRNSWGPIGPD  365 (392)
Q Consensus       288 ~~~~~~~~ik~~l~~~gPV~v~i~~~-~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~-g~~ywiikNSWG~~WG~  365 (392)
                      ..++++++||++|.++|||+|+|.+. +|+.|++|||...  .|.. .++|||+|||||+++ +++|||||||||++|||
T Consensus       133 ~~~~~~~~i~~~l~~~GPV~v~i~~~~~f~~Y~~GIy~~~--~~~~-~~~HaV~IVGyG~~~~g~~YWiikNSWG~~WGe  209 (239)
T cd02698         133 GSVSGRDKMMAEIYARGPISCGIMATEALENYTGGVYKEY--VQDP-LINHIISVAGWGVDENGVEYWIVRNSWGEPWGE  209 (239)
T ss_pred             eecCCHHHHHHHHHHcCCEEEEEEecccccccCCeEEccC--CCCC-cCCeEEEEEEEEecCCCCEEEEEEcCCCcccCc
Confidence            88888899999999999999999995 8999999999885  4543 689999999999876 89999999999999999


Q ss_pred             CcEEEEEecC-----CccccccceeEEE
Q psy667          366 EGFFKIERGN-----NACGIEQIAGYAT  388 (392)
Q Consensus       366 ~GY~~i~r~~-----n~cgi~~~~~~~~  388 (392)
                      +|||||+|+.     |+||||+.++++.
T Consensus       210 ~Gy~~i~rg~~~~~~~~~~i~~~~~~~~  237 (239)
T cd02698         210 RGWFRIVTSSYKGARYNLAIEEDCAWAD  237 (239)
T ss_pred             CceEEEEccCCcccccccccccceEEEe
Confidence            9999999999     9999999999875


No 8  
>cd02248 Peptidase_C1A Peptidase C1A subfamily (MEROPS database nomenclature); composed of cysteine peptidases (CPs) similar to papain, including the mammalian CPs (cathepsins B, C, F, H, L, K, O, S, V, X and W). Papain is an endopeptidase with specific substrate preferences, primarily for bulky hydrophobic or aromatic residues at the S2 subsite, a hydrophobic pocket in papain that accommodates the P2 sidechain of the substrate (the second residue away from the scissile bond). Most members of the papain subfamily are endopeptidases. Some exceptions to this rule can be explained by specific details of the catalytic domains like the occluding loop in cathepsin B which confers an additional carboxydipeptidyl activity and the mini-chain of cathepsin H resulting in an N-terminal exopeptidase activity. Papain-like CPs have different functions in various organisms. Plant CPs are used to mobilize storage proteins in seeds. Parasitic CPs act extracellularly to help invade tissues and cells, to h
Probab=100.00  E-value=5.7e-57  Score=416.33  Aligned_cols=206  Identities=45%  Similarity=0.883  Sum_probs=191.0

Q ss_pred             CCeeecccCCCCCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHhCCccccchhhhhhhcc
Q psy667          153 PDAWDWRKKNVTGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTGKLVEFSKSQLVECAK  232 (392)
Q Consensus       153 P~~~Dwr~~g~v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~~~~~lS~q~l~dc~~  232 (392)
                      |++||||+.+.++||+|||.||+|||||++++                       +|++++++++....||+|+|++|..
T Consensus         1 P~~~d~r~~~~~~~v~dQg~cgsCwAfa~~~~-----------------------le~~~~i~~~~~~~lS~q~l~~c~~   57 (210)
T cd02248           1 PESVDWREKGAVTPVKDQGSCGSCWAFSTVGA-----------------------LEGAYAIKTGKLVSLSEQQLVDCST   57 (210)
T ss_pred             CCcccCCcCCCCCCCccCCCCcchHHhHHHHH-----------------------HHHHHHHHcCCCcccCHHHHhccCC
Confidence            78999999999999999999999999999999                       9999999999999999999999996


Q ss_pred             C-CCCCCCCCchhhHHHHHhCCCCCCCCCCCCCCCCCCcccccCCCCceeEecccceecC--CHHHHHHHHHcCCCeEEE
Q psy667          233 Q-CSGCDGCFFEPSIEYTHQAGLESEKDYPYKNANGEKFKCAYDKSKVKLFTGKDFLHFN--GSETMKKILYKYGPLSVL  309 (392)
Q Consensus       233 ~-~~gC~GG~~~~a~~~~~~~Gi~~e~~yPY~~~~~~~~~C~~~~~~~~~~i~~~y~~~~--~~~~ik~~l~~~gPV~v~  309 (392)
                      . +.||+||++..|++++++.|+++|++|||.   .....|........++|. +|..++  ++++||++|+++|||+++
T Consensus        58 ~~~~gC~GG~~~~a~~~~~~~Gi~~e~~yPY~---~~~~~C~~~~~~~~~~i~-~~~~i~~~~~~~ik~~l~~~gPV~~~  133 (210)
T cd02248          58 SGNNGCNGGNPDNAFEYVKNGGLASESDYPYT---GKDGTCKYNSSKVGAKIT-GYSNVPPGDEEALKAALANYGPVSVA  133 (210)
T ss_pred             CCCCCCCCCCHHHhHHHHHHCCcCccccCCcc---CCCCCccCCCCcccEEEe-eEEEcCCCcHHHHHHHHhhcCCEEEE
Confidence            5 889999999999999999999999999999   677789877666788998 999887  589999999999999999


Q ss_pred             EEcC-CCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecCCccEEEEEcCCCCCCCCCcEEEEEecCCccccccceeEE
Q psy667          310 LNSD-LIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQDNIPYWLVRNSWGPIGPDEGFFKIERGNNACGIEQIAGYA  387 (392)
Q Consensus       310 i~~~-~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~g~~ywiikNSWG~~WG~~GY~~i~r~~n~cgi~~~~~~~  387 (392)
                      +.+. +|+.|++|||..+  .|....++|||+|||||++.+.+|||||||||++||++||+||+|+.|.|||++.+.+|
T Consensus       134 ~~~~~~f~~y~~Giy~~~--~~~~~~~~Hav~iVGy~~~~~~~ywiv~NSWG~~WG~~Gy~~i~~~~~~cgi~~~~~~~  210 (210)
T cd02248         134 IDASSSFQFYKGGIYSGP--CCSNTNLNHAVLLVGYGTENGVDYWIVKNSWGTSWGEKGYIRIARGSNLCGIASYASYP  210 (210)
T ss_pred             EecCcccccCCCCceeCC--CCCCCcCCEEEEEEEEeecCCceEEEEEcCCCCccccCcEEEEEcCCCccCceeeeecC
Confidence            9995 8999999999986  56455789999999999988899999999999999999999999999999999887765


No 9  
>cd02620 Peptidase_C1A_CathepsinB Cathepsin B group; composed of cathepsin B and similar proteins, including tubulointerstitial nephritis antigen (TIN-Ag). Cathepsin B is a lysosomal papain-like cysteine peptidase which is expressed in all tissues and functions primarily as an exopeptidase through its carboxydipeptidyl activity. Together with other cathepsins, it is involved in the degradation of proteins, proenzyme activation, Ag processing, metabolism and apoptosis. Cathepsin B has been implicated in a number of human diseases such as cancer, rheumatoid arthritis, osteoporosis and Alzheimer's disease. The unique carboxydipeptidyl activity of cathepsin B is attributed to the presence of an occluding loop in its active site which favors the binding of the C-termini of substrate proteins. Some members of this group do not possess the occluding loop. TIN-Ag is an extracellular matrix basement protein which was originally identified as a target Ag involved in anti-tubular basement membrane
Probab=100.00  E-value=6.1e-57  Score=424.91  Aligned_cols=207  Identities=29%  Similarity=0.547  Sum_probs=176.9

Q ss_pred             CCeeecccC--CC--CCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHhC--Cccccchhh
Q psy667          153 PDAWDWRKK--NV--TGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTG--KLVEFSKSQ  226 (392)
Q Consensus       153 P~~~Dwr~~--g~--v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~--~~~~lS~q~  226 (392)
                      |++||||++  ++  |+||+|||.||||||||++++                       ||+++.++++  +.+.||+|+
T Consensus         1 p~~~DwR~~~~~~~~v~~v~dQg~CGsCwAfa~~~~-----------------------le~~~~i~~~~~~~~~LS~Q~   57 (236)
T cd02620           1 PESFDAREKWPNCISIGEIRDQGNCGSCWAFSAVEA-----------------------FSDRLCIQSNGKENVLLSAQD   57 (236)
T ss_pred             CCcccchhhCCCCCCccccCCcccchhHHHHHHHHH-----------------------HhhHHHHhcCCCCccccCHHH
Confidence            889999997  44  459999999999999999999                       9999999888  789999999


Q ss_pred             hhhhccC-CCCCCCCCchhhHHHHHhCCCCCCCCCCCCCCCCC---------------CcccccCCC----CceeEeccc
Q psy667          227 LVECAKQ-CSGCDGCFFEPSIEYTHQAGLESEKDYPYKNANGE---------------KFKCAYDKS----KVKLFTGKD  286 (392)
Q Consensus       227 l~dc~~~-~~gC~GG~~~~a~~~~~~~Gi~~e~~yPY~~~~~~---------------~~~C~~~~~----~~~~~i~~~  286 (392)
                      |+||+.. +.||+||++..|++|+++.|+++|++|||......               ...|.....    ...+++. +
T Consensus        58 lidC~~~~~~gC~GG~~~~a~~~i~~~G~~~e~~yPY~~~~~~~~~~~~~~~~~~~~~~~~C~~~~~~~~~~~~~~~~-~  136 (236)
T cd02620          58 LLSCCSGCGDGCNGGYPDAAWKYLTTTGVVTGGCQPYTIPPCGHHPEGPPPCCGTPYCTPKCQDGCEKTYEEDKHKGK-S  136 (236)
T ss_pred             HHhhcCCCCCCCCCCCHHHHHHHHHhcCCCcCCEecCcCCCCccCCCCCCCCCCCCCCCCCCCcCCccccceeeeeec-c
Confidence            9999965 88999999999999998899999999999832111               113543221    2234555 5


Q ss_pred             ceecC-CHHHHHHHHHcCCCeEEEEEc-CCCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecCCccEEEEEcCCCCCCC
Q psy667          287 FLHFN-GSETMKKILYKYGPLSVLLNS-DLIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQDNIPYWLVRNSWGPIGP  364 (392)
Q Consensus       287 y~~~~-~~~~ik~~l~~~gPV~v~i~~-~~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~g~~ywiikNSWG~~WG  364 (392)
                      +..+. ++++||++|+++|||+++|.+ ++|+.|++|||..+   |+...++|||+|||||++++++|||||||||++||
T Consensus       137 ~~~~~~~~~~ik~~l~~~GPv~v~i~~~~~f~~Y~~Giy~~~---~~~~~~~HaV~iVGyg~~~g~~YWivrNSWG~~WG  213 (236)
T cd02620         137 AYSVPSDETDIMKEIMTNGPVQAAFTVYEDFLYYKSGVYQHT---SGKQLGGHAVKIIGWGVENGVPYWLAANSWGTDWG  213 (236)
T ss_pred             eeeeCCHHHHHHHHHHHCCCeEEEEEechhhhhcCCcEEeec---CCCCcCCeEEEEEEEeccCCeeEEEEEeCCCCCCC
Confidence            55555 789999999999999999999 58999999999863   55556899999999999889999999999999999


Q ss_pred             CCcEEEEEecCCccccccceeE
Q psy667          365 DEGFFKIERGNNACGIEQIAGY  386 (392)
Q Consensus       365 ~~GY~~i~r~~n~cgi~~~~~~  386 (392)
                      |+|||||+|+.|.|||++.+..
T Consensus       214 e~Gy~ri~~~~~~cgi~~~~~~  235 (236)
T cd02620         214 ENGYFRILRGSNECGIESEVVA  235 (236)
T ss_pred             CCcEEEEEccCcccccccceec
Confidence            9999999999999999998764


No 10 
>PF00112 Peptidase_C1:  Papain family cysteine protease This is family C1 in the peptidase classification. ;  InterPro: IPR000668 In the MEROPS database peptidases and peptidase homologues are grouped into clans and families. Clans are groups of families for which there is evidence of common ancestry based on a common structural fold:  Each clan is identified with two letters, the first representing the catalytic type of the families included in the clan (with the letter 'P' being used for a clan containing families of more than one of the catalytic types serine, threonine and cysteine). Some families cannot yet be assigned to clans, and when a formal assignment is required, such a family is described as belonging to clan A-, C-, M-, N-, S-, T- or U-, according to the catalytic type. Some clans are divided into subclans because there is evidence of a very ancient divergence within the clan, for example MA(E), the gluzincins, and MA(M), the metzincins. Peptidase families are grouped by their catalytic type, the first character representing the catalytic type: A, aspartic; C, cysteine; G, glutamic acid; M, metallo; N, asparagine; S, serine; T, threonine; and U, unknown. The serine, threonine and cysteine peptidases utilise the amino acid as a nucleophile and form an acyl intermediate - these peptidases can also readily act as transferases. In the case of aspartic, glutamic and metallopeptidases, the nucleophile is an activated water molecule. In the case of the asparagine endopeptidases, the nucleophile is asparagine and all are self-processing endopeptidases.   In many instances the structural protein fold that characterises the clan or family may have lost its catalytic activity, yet retain its function in protein recognition and binding.  Cysteine peptidases have characteristic molecular topologies, which can be seen not only in their three-dimensional structures, but commonly also in the two-dimensional structures. These are peptidases in which the nucleophile is the sulphydryl group of a cysteine residue. Cysteine proteases are divided into clans (proteins which are evolutionary related), and further sub-divided into families, on the basis of the architecture of their catalytic dyad or triad [].  This group of proteins belong to the peptidase family C1, sub-family C1A (papain family, clan CA). It includes proteins classed as non-peptidase homologs. These are have either been shown experimentally to lack peptidase activity or lack one or more of the active site residues.  The papain family has a wide variety of activities, including broad-range (papain) and narrow-range endo-peptidases, aminopeptidases, dipeptidyl peptidases and enzymes with both exo- and endo-peptidase activity []. Members of the papain family are widespread, found in baculovirus [], eubacteria, yeast, and practically all protozoa, plants and mammals []. The proteins are typically lysosomal or secreted, and proteolytic cleavage of the propeptide is required for enzyme activation, although bleomycin hydrolase is cytosolic in fungi and mammals []. Papain-like cysteine proteinases are essentially synthesised as inactive proenzymes (zymogens) with N-terminal propeptide regions. The activation process of these enzymes includes the removal of propeptide regions. The propeptide regions serve a variety of functions in vivo and in vitro. The pro-region is required for the proper folding of the newly synthesised enzyme, the inactivation of the peptidase domain and stabilisation of the enzyme against denaturing at neutral to alkaline pH conditions. Amino acid residues within the pro-region mediate their membrane association, and play a role in the transport of the proenzyme to lysosomes. Among the most notable features of propeptides is their ability to inhibit the activity of their cognate enzymes and that certain propeptides exhibit high selectivity for inhibition of the peptidases from which they originate [].  The catalytic residues of papain are Cys-25 and His-159, other important residues being Gln-19, which helps form the 'oxyanion hole', and Asn-175, which orientates the imidazole ring of His-159. ; GO: 0008234 cysteine-type peptidase activity, 0006508 proteolysis; PDB: 3MOR_B 3HHI_B 1S4V_A 3F75_A 1MEG_A 1PCI_C 1PPO_A 3HD3_B 1F29_A 1EWL_A ....
Probab=100.00  E-value=7.8e-55  Score=402.78  Aligned_cols=208  Identities=38%  Similarity=0.742  Sum_probs=184.3

Q ss_pred             CCCeeecccC-CCCCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHh-CCccccchhhhhh
Q psy667          152 VPDAWDWRKK-NVTGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKT-GKLVEFSKSQLVE  229 (392)
Q Consensus       152 lP~~~Dwr~~-g~v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~-~~~~~lS~q~l~d  229 (392)
                      ||++||||+. +.++||+|||.||+|||||++++                       +|+++++++ +..+.||+|+|++
T Consensus         1 lP~~~D~r~~~~~~~~v~dQg~~gsCwafa~~~~-----------------------~e~~~~~~~~~~~~~lS~q~l~~   57 (219)
T PF00112_consen    1 LPKSFDWRDKGGRITPVRDQGSCGSCWAFAAAAA-----------------------LESRLAIQNNGKNVDLSEQYLID   57 (219)
T ss_dssp             STSSEEGGGTTTCSG---BTTSSBTHHHHHHHHH-----------------------HHHHHHHHHTSSCEEB-HHHHHH
T ss_pred             CCCCEecccCCCCcCccccCCcccccccchhccc-----------------------eeccccccccccccccccccccc
Confidence            7999999998 48999999999999999999999                       999999999 7899999999999


Q ss_pred             hcc-CCCCCCCCCchhhHHHHHh-CCCCCCCCCCCCCCCCCC-cccccCCCCc-eeEecccceecC--CHHHHHHHHHcC
Q psy667          230 CAK-QCSGCDGCFFEPSIEYTHQ-AGLESEKDYPYKNANGEK-FKCAYDKSKV-KLFTGKDFLHFN--GSETMKKILYKY  303 (392)
Q Consensus       230 c~~-~~~gC~GG~~~~a~~~~~~-~Gi~~e~~yPY~~~~~~~-~~C~~~~~~~-~~~i~~~y~~~~--~~~~ik~~l~~~  303 (392)
                      |.. .+.+|+||++..|++++++ .|+++|++|||.   +.. ..|....... ..++. +|..+.  ++++||++|+++
T Consensus        58 ~~~~~~~~c~gg~~~~a~~~~~~~~Gi~~e~~~pY~---~~~~~~c~~~~~~~~~~~i~-~~~~~~~~~~~~ik~~L~~~  133 (219)
T PF00112_consen   58 CSNKYNKGCDGGSPFDALKYIKNNNGIVTEEDYPYN---GNENPTCKSKKSNSYYVKIK-GYGKVKDNDIEDIKKALMKY  133 (219)
T ss_dssp             HSTGTSSTTBBBEHHHHHHHHHHHTSBEBTTTS--S---SSSSCSSCHSGGGEEEBEES-EEEEEESTCHHHHHHHHHHH
T ss_pred             cccccccccccCcccccceeecccCccccccccccc---cccccccccccccccccccc-ccccccccchhHHHHHHhhC
Confidence            996 6789999999999999977 999999999999   666 6888765443 36787 888877  589999999999


Q ss_pred             CCeEEEEEc-C-CCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecCCccEEEEEcCCCCCCCCCcEEEEEecCC-cccc
Q psy667          304 GPLSVLLNS-D-LIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQDNIPYWLVRNSWGPIGPDEGFFKIERGNN-ACGI  380 (392)
Q Consensus       304 gPV~v~i~~-~-~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~g~~ywiikNSWG~~WG~~GY~~i~r~~n-~cgi  380 (392)
                      |||+++|.+ + +|+.|++|||..+  .|.+..++|||+|||||++.+++|||||||||++||++||+||+|+.+ +|||
T Consensus       134 gpV~~~~~~~~~~f~~~~~gi~~~~--~~~~~~~~Hav~iVGy~~~~~~~~wiv~NSWG~~WG~~Gy~~i~~~~~~~c~i  211 (219)
T PF00112_consen  134 GPVVASIDVSSEDFQNYKSGIYDPP--DCSNESGGHAVLIVGYDDENGKGYWIVKNSWGTDWGDNGYFRISYDYNNECGI  211 (219)
T ss_dssp             SSEEEEEEEESHHHHTEESSEECST--SSSSSSEEEEEEEEEEEEETTEEEEEEE-SBTTTSTBTTEEEEESSSSSGGGT
T ss_pred             ceeeeeeeccccccccccceeeecc--ccccccccccccccccccccceeeEeeehhhCCccCCCeEEEEeeCCCCcCcc
Confidence            999999999 4 4999999999997  687778999999999999999999999999999999999999999997 9999


Q ss_pred             ccceeEEE
Q psy667          381 EQIAGYAT  388 (392)
Q Consensus       381 ~~~~~~~~  388 (392)
                      ++.++||+
T Consensus       212 ~~~~~~~~  219 (219)
T PF00112_consen  212 ESQAVYPI  219 (219)
T ss_dssp             TSSEEEEE
T ss_pred             CceeeecC
Confidence            99999996


No 11 
>PTZ00049 cathepsin C-like protein; Provisional
Probab=100.00  E-value=3.9e-54  Score=446.45  Aligned_cols=215  Identities=27%  Similarity=0.533  Sum_probs=180.6

Q ss_pred             CCCCCeeecccC----CCCCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHhCC-----c-
Q psy667          150 GPVPDAWDWRKK----NVTGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTGK-----L-  219 (392)
Q Consensus       150 ~~lP~~~Dwr~~----g~v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~~-----~-  219 (392)
                      .+||++||||+.    ++++||+|||.||||||||++++                       +|++++|++++     . 
T Consensus       379 ~~LP~sfDWRd~~~~~~~vtpVkdQG~CGSCWAFAat~a-----------------------lEsR~~Ia~~~~l~~~~~  435 (693)
T PTZ00049        379 DELPKNFTWGDPFNNNTREYDVTNQLLCGSCYIASQMYA-----------------------FKRRIEIALTKNLDKKYL  435 (693)
T ss_pred             ccCCCCEecCcCCCCCCcccCCCCCccCcHHHHHHHHHH-----------------------HHHHHHHHhccccccccc
Confidence            489999999985    57999999999999999999999                       88888877632     1 


Q ss_pred             ----cccchhhhhhhccCCCCCCCCCchhhHHHHHhCCCCCCCCCCCCCCCCCCcccccCCC------------------
Q psy667          220 ----VEFSKSQLVECAKQCSGCDGCFFEPSIEYTHQAGLESEKDYPYKNANGEKFKCAYDKS------------------  277 (392)
Q Consensus       220 ----~~lS~q~l~dc~~~~~gC~GG~~~~a~~~~~~~Gi~~e~~yPY~~~~~~~~~C~~~~~------------------  277 (392)
                          ..||+|+|+||+..+.||+||++..|++|+++.||++|++|||.   +..+.|.....                  
T Consensus       436 ~~~~~~LS~QqLLDCs~~nqGC~GG~~~~A~kya~~~GI~tEscYPY~---a~~g~C~~~~~~~~~~~~g~~~~~~~~~~  512 (693)
T PTZ00049        436 NNFDDLLSIQTVLSCSFYDQGCNGGFPYLVSKMAKLQGIPLDKVFPYT---ATEQTCPYQVDQSANSMNGSANLRQINAV  512 (693)
T ss_pred             cccccCcCHHHhcccCCCCCCcCCCcHHHHHHHHHHCCCCcCCccCCc---CCCCCCCCCCCCccccccccccccccccc
Confidence                27999999999988899999999999999988899999999999   66667753211                  


Q ss_pred             ---------------------CceeEecccceec---------CCHHHHHHHHHcCCCeEEEEEcC-CCcccCCceeeCC
Q psy667          278 ---------------------KVKLFTGKDFLHF---------NGSETMKKILYKYGPLSVLLNSD-LIHDYNGTPIRKN  326 (392)
Q Consensus       278 ---------------------~~~~~i~~~y~~~---------~~~~~ik~~l~~~gPV~v~i~~~-~f~~y~~Giy~~~  326 (392)
                                           ..++.++ +|..+         .++++|+++|+++|||+|+|++. +|++|++|||..+
T Consensus       513 ~~~~~~~~~~~~~~~~~~~~~~~r~y~k-~y~yI~g~y~~~~~~~E~~Im~eI~~~GPVsVsIda~~dF~~YksGVY~~~  591 (693)
T PTZ00049        513 FFSSETQSDMHADFEAPISSEPARWYAK-DYNYIGGCYGCNQCNGEKIMMNEIYRNGPIVASFEASPDFYDYADGVYYVE  591 (693)
T ss_pred             cccccccccccccccccccccccceeee-eeEEecccccccCCCCHHHHHHHHHhcCCEEEEEEechhhhcCCCccccCc
Confidence                                 1123344 55554         26889999999999999999995 8999999999864


Q ss_pred             C----CCCCCC--------------CCCeEEEEEEEeec--CCc--cEEEEEcCCCCCCCCCcEEEEEecCCccccccce
Q psy667          327 D----ETCSPY--------------DLGHAVLLVGYGKQ--DNI--PYWLVRNSWGPIGPDEGFFKIERGNNACGIEQIA  384 (392)
Q Consensus       327 ~----~~c~~~--------------~~~Hav~iVGyg~~--~g~--~ywiikNSWG~~WG~~GY~~i~r~~n~cgi~~~~  384 (392)
                      +    ..|+..              ..+|||+|||||.+  +|.  +|||||||||++||++|||||+||.|.|||++.+
T Consensus       592 ~~~h~~~C~~d~~~~~~~~~~~G~e~~NHAVlIVGwG~d~enG~~~~YWIVRNSWGt~WGenGYfKI~RG~N~CGIEs~a  671 (693)
T PTZ00049        592 DFPHARRCTVDLPKHNGVYNITGWEKVNHAIVLVGWGEEEINGKLYKYWIGRNSWGKNWGKEGYFKIIRGKNFSGIESQS  671 (693)
T ss_pred             ccccccccCCccccccccccccccccCceEEEEEEeccccCCCcccCEEEEECCCCCCcccCceEEEEcCCCccCCccce
Confidence            1    136421              46999999999975  453  7999999999999999999999999999999999


Q ss_pred             eEEEEEe
Q psy667          385 GYATIDV  391 (392)
Q Consensus       385 ~~~~~~~  391 (392)
                      .++..|+
T Consensus       672 ~~~~pd~  678 (693)
T PTZ00049        672 LFIEPDF  678 (693)
T ss_pred             eEEeeec
Confidence            9998775


No 12 
>PTZ00364 dipeptidyl-peptidase I precursor; Provisional
Probab=100.00  E-value=1.2e-53  Score=438.35  Aligned_cols=215  Identities=22%  Similarity=0.466  Sum_probs=179.9

Q ss_pred             CCCCCeeecccCC---CCCCCCCCCC---CchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHh------C
Q psy667          150 GPVPDAWDWRKKN---VTGPAGDQAA---CGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKT------G  217 (392)
Q Consensus       150 ~~lP~~~Dwr~~g---~v~pVkdQg~---cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~------~  217 (392)
                      .+||++||||++|   +|+||||||.   ||||||||++++                       +|+++++++      +
T Consensus       203 ~~LP~sfDWR~~gg~~~VtpVrdQg~~~~CGSCWAFAav~a-----------------------lEsr~~I~tn~~~~~g  259 (548)
T PTZ00364        203 DPPPAAWSWGDVGGASFLPAAPPASPGRGCNSSYVEAALAA-----------------------MMARVMVASNRTDPLG  259 (548)
T ss_pred             cCCCCccccCcCCCCccCCCCcCCCCCCCCcCHHHHHHHHH-----------------------HHHHHHHHhCCCcccC
Confidence            5799999999987   7899999999   999999999999                       999999987      4


Q ss_pred             CccccchhhhhhhccCCCCCCCCCchhhHHHHHhCCCCCCCCC--CCCCCCCCCcccccCCCCceeEecc-----cceec
Q psy667          218 KLVEFSKSQLVECAKQCSGCDGCFFEPSIEYTHQAGLESEKDY--PYKNANGEKFKCAYDKSKVKLFTGK-----DFLHF  290 (392)
Q Consensus       218 ~~~~lS~q~l~dc~~~~~gC~GG~~~~a~~~~~~~Gi~~e~~y--PY~~~~~~~~~C~~~~~~~~~~i~~-----~y~~~  290 (392)
                      +.+.||+|+|+||+..++||+||++..|++|++++||++|++|  ||....+....|........+++.+     +|..+
T Consensus       260 ~~~~LS~QqLVDCs~~n~GCdGG~p~~A~~yi~~~GI~tE~dY~~PY~~~dg~~~~Ck~~~~~~~y~~~~~~~I~gyy~~  339 (548)
T PTZ00364        260 QQTFLSARHVLDCSQYGQGCAGGFPEEVGKFAETFGILTTDSYYIPYDSGDGVERACKTRRPSRRYYFTNYGPLGGYYGA  339 (548)
T ss_pred             cccCcCHHHHhcccCCCCCCCCCcHHHHHHHHHhCCcccccccCCCCCCCCCCCCCCCCCcccceeeeeeeEEecceeec
Confidence            5789999999999977899999999999999988999999999  9983222233687655444444440     34333


Q ss_pred             C-CHHHHHHHHHcCCCeEEEEEcC-CCcccCCceeeCC-----C-CCCC----------CCCCCeEEEEEEEee-cCCcc
Q psy667          291 N-GSETMKKILYKYGPLSVLLNSD-LIHDYNGTPIRKN-----D-ETCS----------PYDLGHAVLLVGYGK-QDNIP  351 (392)
Q Consensus       291 ~-~~~~ik~~l~~~gPV~v~i~~~-~f~~y~~Giy~~~-----~-~~c~----------~~~~~Hav~iVGyg~-~~g~~  351 (392)
                      . ++++|+.+|+++|||+|+|++. +|+.|++|||.+.     + ..|.          ....+|||+|||||. ++|.+
T Consensus       340 ~~~e~~I~~eI~~~GPVsVaIda~~df~~YksGiy~gi~~~~~~~~~~~~~~~~~~~~~~~~~nHAVlIVGYG~de~G~~  419 (548)
T PTZ00364        340 VTDPDEIIWEIYRHGPVPASVYANSDWYNCDENSTEDVRYVSLDDYSTASADRPLRHYFASNVNHTVLIIGWGTDENGGD  419 (548)
T ss_pred             CCcHHHHHHHHHHcCCeEEEEEechHHHhcCCCCccCeeccccccccccccCCcccccccccCCeEEEEEEecccCCCce
Confidence            3 7889999999999999999994 8999999998631     0 0111          135799999999997 47889


Q ss_pred             EEEEEcCCCC--CCCCCcEEEEEecCCccccccceeEE
Q psy667          352 YWLVRNSWGP--IGPDEGFFKIERGNNACGIEQIAGYA  387 (392)
Q Consensus       352 ywiikNSWG~--~WG~~GY~~i~r~~n~cgi~~~~~~~  387 (392)
                      |||||||||+  +|||+|||||+||.|+|||++.+..+
T Consensus       420 YWIVKNSWGt~~~WGE~GYfRI~RG~N~CGIes~~v~~  457 (548)
T PTZ00364        420 YWLVLDPWGSRRSWCDGGTRKIARGVNAYNIESEVVVM  457 (548)
T ss_pred             EEEEECCCCCCCCcccCCeEEEEcCCCcccccceeeee
Confidence            9999999999  99999999999999999999998844


No 13 
>smart00645 Pept_C1 Papain family cysteine protease.
Probab=100.00  E-value=1.3e-49  Score=358.44  Aligned_cols=166  Identities=46%  Similarity=0.947  Sum_probs=152.4

Q ss_pred             CCCeeecccCCCCCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHhCCccccchhhhhhhc
Q psy667          152 VPDAWDWRKKNVTGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTGKLVEFSKSQLVECA  231 (392)
Q Consensus       152 lP~~~Dwr~~g~v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~~~~~lS~q~l~dc~  231 (392)
                      ||++||||+.++++||+|||.||+|||||++++                       +|+++++++++.+.||+|+|++|.
T Consensus         1 lP~~~D~R~~~~~~~v~dQg~CGsCwAfa~~~~-----------------------ie~~~~i~~~~~~~lS~q~l~~C~   57 (174)
T smart00645        1 LPESFDWRKKGAVTPVKDQGQCGSCWAFSATGA-----------------------LEGRYCIKTGKLVSLSEQQLVDCS   57 (174)
T ss_pred             CCCcCcccccCCCCccccCcccchHHHHHHHHH-----------------------HHHHHHHhcCCccccCHHHHhhhc
Confidence            699999999999999999999999999999999                       999999999989999999999999


Q ss_pred             cC-CCCCCCCCchhhHHHHHhC-CCCCCCCCCCCCCCCCCcccccCCCCceeEecccceecCCHHHHHHHHHcCCCeEEE
Q psy667          232 KQ-CSGCDGCFFEPSIEYTHQA-GLESEKDYPYKNANGEKFKCAYDKSKVKLFTGKDFLHFNGSETMKKILYKYGPLSVL  309 (392)
Q Consensus       232 ~~-~~gC~GG~~~~a~~~~~~~-Gi~~e~~yPY~~~~~~~~~C~~~~~~~~~~i~~~y~~~~~~~~ik~~l~~~gPV~v~  309 (392)
                      .. +.||+||++..|++|+++. |+++|++|||.   +                                       ++.
T Consensus        58 ~~~~~gC~GG~~~~a~~~~~~~~Gi~~e~~~PY~---~---------------------------------------~~~   95 (174)
T smart00645       58 TGGNNGCNGGLPDNAFEYIKKNGGLETESCYPYT---G---------------------------------------SVA   95 (174)
T ss_pred             CCCCCCCCCcCHHHHHHHHHHcCCcccccccCcc---c---------------------------------------EEE
Confidence            64 6799999999999999776 99999999999   3                                       556


Q ss_pred             EEcCCCcccCCceeeCCCCCCCCCCCCeEEEEEEEeec-CCccEEEEEcCCCCCCCCCcEEEEEecC-Cccccccce
Q psy667          310 LNSDLIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQ-DNIPYWLVRNSWGPIGPDEGFFKIERGN-NACGIEQIA  384 (392)
Q Consensus       310 i~~~~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~-~g~~ywiikNSWG~~WG~~GY~~i~r~~-n~cgi~~~~  384 (392)
                      +.+++|++|++|||+.+  .|+...++|||+|||||.+ ++++|||||||||+.||++|||||.|+. |.|||+...
T Consensus        96 ~~~~~f~~Y~~Gi~~~~--~~~~~~~~Hav~ivGyg~~~~g~~yWii~NSwG~~WG~~G~~~i~~~~~~~c~i~~~~  170 (174)
T smart00645       96 IDASDFQFYKSGIYDHP--GCGSGTLDHAVLIVGYGTEENGKDYWIVKNSWGTDWGENGYFRIARGKNNECGIEASV  170 (174)
T ss_pred             EEcccccCCcCeEECCC--CCCCCcccEEEEEEEEeecCCCeeEEEEECCCCCCcccCeEEEEEcCCCCccCceeee
Confidence            66667999999999886  6876568999999999987 8899999999999999999999999998 999997654


No 14 
>cd02619 Peptidase_C1 C1 Peptidase family (MEROPS database nomenclature), also referred to as the papain family; composed of two subfamilies of cysteine peptidases (CPs), C1A (papain) and C1B (bleomycin hydrolase). Papain-like enzymes are mostly endopeptidases with some exceptions like cathepsins B, C, H and X, which are exopeptidases. Papain-like CPs have different functions in various organisms. Plant CPs are used to mobilize storage proteins in seeds while mammalian CPs are primarily lysosomal enzymes responsible for protein degradation in the lysosome. Papain-like CPs are synthesized as inactive proenzymes with N-terminal propeptide regions, which are removed upon activation. Bleomycin hydrolase (BH) is a CP that detoxifies bleomycin by hydrolysis of an amide group. It acts as a carboxypeptidase on its C-terminus to convert itself into an aminopeptidase and peptide ligase. BH is found in all tissues in mammals as well as in many other eukaryotes. It forms a hexameric ring barrel str
Probab=100.00  E-value=2.7e-46  Score=346.34  Aligned_cols=196  Identities=29%  Similarity=0.375  Sum_probs=167.9

Q ss_pred             eeecccCCCCCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHhC--Cccccchhhhhhhcc
Q psy667          155 AWDWRKKNVTGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTG--KLVEFSKSQLVECAK  232 (392)
Q Consensus       155 ~~Dwr~~g~v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~--~~~~lS~q~l~dc~~  232 (392)
                      .+|||+.+ ++||+|||.||+|||||++++                       +|+.+.++++  +.+.||+|+|++|..
T Consensus         1 ~~d~r~~~-~~~v~dQg~~gsCwafa~~~~-----------------------les~~~~~~~~~~~~~lS~q~l~~c~~   56 (223)
T cd02619           1 SVDLRPLR-LTPVKNQGSRGSCWAFASAYA-----------------------LESAYRIKGGEDEYVDLSPQYLYICAN   56 (223)
T ss_pred             CCcchhcC-CCCcccCCCCcCcHHHHHHHH-----------------------HHHHHHHhcCCcccccCCHHHHHHhcc
Confidence            48999998 999999999999999999999                       9999999988  899999999999984


Q ss_pred             C-----CCCCCCCCchhhHH-HHHhCCCCCCCCCCCCCCCCCCccccc----CCCCceeEecccceecC--CHHHHHHHH
Q psy667          233 Q-----CSGCDGCFFEPSIE-YTHQAGLESEKDYPYKNANGEKFKCAY----DKSKVKLFTGKDFLHFN--GSETMKKIL  300 (392)
Q Consensus       233 ~-----~~gC~GG~~~~a~~-~~~~~Gi~~e~~yPY~~~~~~~~~C~~----~~~~~~~~i~~~y~~~~--~~~~ik~~l  300 (392)
                      .     ..||+||.+..++. +++..|+++|++|||.   .....|..    .......++. +|..+.  ++++||++|
T Consensus        57 ~~~~~~~~~c~gG~~~~~~~~~~~~~Gi~~e~~~Py~---~~~~~~~~~~~~~~~~~~~~~~-~y~~~~~~~~~~ik~aL  132 (223)
T cd02619          57 DECLGINGSCDGGGPLSALLKLVALKGIPPEEDYPYG---AESDGEEPKSEAALNAAKVKLK-DYRRVLKNNIEDIKEAL  132 (223)
T ss_pred             ccccccCCCCCCCcHHHHHHHHHHHcCCCccccCCCC---CCCCCCCCCCccchhhcceeec-ceeEeCchhHHHHHHHH
Confidence            3     37999999999998 8899999999999999   55555542    2334557787 888877  579999999


Q ss_pred             HcCCCeEEEEEcC-CCcccCCceee---CCCCCCCCCCCCeEEEEEEEeecC--CccEEEEEcCCCCCCCCCcEEEEEec
Q psy667          301 YKYGPLSVLLNSD-LIHDYNGTPIR---KNDETCSPYDLGHAVLLVGYGKQD--NIPYWLVRNSWGPIGPDEGFFKIERG  374 (392)
Q Consensus       301 ~~~gPV~v~i~~~-~f~~y~~Giy~---~~~~~c~~~~~~Hav~iVGyg~~~--g~~ywiikNSWG~~WG~~GY~~i~r~  374 (392)
                      +++|||++++.+. .|..|++|+|.   .....|....++|||+|||||++.  +++|||||||||+.||++||+||+++
T Consensus       133 ~~~gPv~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~Hav~ivGy~~~~~~~~~~~i~~NSwG~~wg~~Gy~~i~~~  212 (223)
T cd02619         133 AKGGPVVAGFDVYSGFDRLKEGIIYEEIVYLLYEDGDLGGHAVVIVGYDDNYVEGKGAFIVKNSWGTDWGDNGYGRISYE  212 (223)
T ss_pred             HHCCCEEEEEEcccchhcccCccccccccccccCCCccCCeEEEEEeecCCCCCCCCEEEEEeCCCCccccCCEEEEehh
Confidence            9999999999995 89999999973   111145555789999999999976  89999999999999999999999997


Q ss_pred             CCccc
Q psy667          375 NNACG  379 (392)
Q Consensus       375 ~n~cg  379 (392)
                       +.+.
T Consensus       213 -~~~~  216 (223)
T cd02619         213 -DVYE  216 (223)
T ss_pred             -hhhh
Confidence             3443


No 15 
>PTZ00462 Serine-repeat antigen protein; Provisional
Probab=100.00  E-value=7.9e-46  Score=394.17  Aligned_cols=201  Identities=23%  Similarity=0.422  Sum_probs=166.2

Q ss_pred             CCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHhCCccccchhhhhhhcc--CCCCCCCCC
Q psy667          164 TGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTGKLVEFSKSQLVECAK--QCSGCDGCF  241 (392)
Q Consensus       164 v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~~~~~lS~q~l~dc~~--~~~gC~GG~  241 (392)
                      ..||+|||.||||||||++++                       +|+++++++++.+.||+|+|+||+.  .+.||.||+
T Consensus       544 ~i~VKDQG~CGSCWAFASaaa-----------------------LES~~cIkgg~~v~LSeQqLVDCs~~~gn~GC~GG~  600 (1004)
T PTZ00462        544 KIQIEDQGNCAISWIFASKYH-----------------------LETIKCMKGYEPHAISALYIANCSKGEHKDRCDEGS  600 (1004)
T ss_pred             CCCcccCCcchHHHHHHHHHH-----------------------HHHHHHHhcCCCcccCHHHHHhcccccCCCCCCCCC
Confidence            579999999999999999999                       9999999999999999999999983  478999997


Q ss_pred             ch-hhHHHHHh-CCCCCCCCCCCCCCCCCCcccccCCC------------------CceeEecccceecCC---------
Q psy667          242 FE-PSIEYTHQ-AGLESEKDYPYKNANGEKFKCAYDKS------------------KVKLFTGKDFLHFNG---------  292 (392)
Q Consensus       242 ~~-~a~~~~~~-~Gi~~e~~yPY~~~~~~~~~C~~~~~------------------~~~~~i~~~y~~~~~---------  292 (392)
                      .. .++.|+++ +|+++|++|||... +..+.|+....                  .....+. +|..+..         
T Consensus       601 ~~~efl~yI~e~GgLptESdYPYt~k-~~~g~Cp~~~~~w~n~~~~~kll~~~~~~~~~i~~k-gY~~~~s~~~~~n~d~  678 (1004)
T PTZ00462        601 NPLEFLQIIEDNGFLPADSNYLYNYT-KVGEDCPDEEDHWMNLLDHGKILNHNKKEPNSLDGK-AYRAYESEHFHDKMDA  678 (1004)
T ss_pred             cHHHHHHHHHHcCCCcccccCCCccC-CCCCCCCCCcccccccccccccccccccccceeecc-ceEEecccccccchhh
Confidence            55 56688855 46899999999721 14457864321                  0123344 6655531         


Q ss_pred             -HHHHHHHHHcCCCeEEEEEcCCCcccC-CceeeCCCCCCCCCCCCeEEEEEEEeec-----CCccEEEEEcCCCCCCCC
Q psy667          293 -SETMKKILYKYGPLSVLLNSDLIHDYN-GTPIRKNDETCSPYDLGHAVLLVGYGKQ-----DNIPYWLVRNSWGPIGPD  365 (392)
Q Consensus       293 -~~~ik~~l~~~gPV~v~i~~~~f~~y~-~Giy~~~~~~c~~~~~~Hav~iVGyg~~-----~g~~ywiikNSWG~~WG~  365 (392)
                       ++.||++|+++|||+|+|++++|+.|. +|||...  .|+...++|||+|||||.+     .+++|||||||||+.||+
T Consensus       679 ~i~~IK~eI~~kGPVaV~IdAsdf~~Y~~sGIyv~~--~Cgs~~~nHAVlIVGYGt~in~eg~gk~YWIVRNSWGt~WGE  756 (1004)
T PTZ00462        679 FIKIIKDEIMNKGSVIAYIKAENVLGYEFNGKKVQN--LCGDDTADHAVNIVGYGNYINDEDEKKSYWIVRNSWGKYWGD  756 (1004)
T ss_pred             HHHHHHHHHHhcCCEEEEEEeehHHhhhcCCccccC--CCCCCcCCceEEEEEecccccccCCCCceEEEEcCCCCCcCC
Confidence             468999999999999999998888884 8998776  7986678999999999974     257999999999999999


Q ss_pred             CcEEEEEe-cCCccccccceeEEEEEe
Q psy667          366 EGFFKIER-GNNACGIEQIAGYATIDV  391 (392)
Q Consensus       366 ~GY~~i~r-~~n~cgi~~~~~~~~~~~  391 (392)
                      +|||||.| +.|.|||+....+|+|++
T Consensus       757 nGYFKI~r~g~n~CGin~i~t~~~fn~  783 (1004)
T PTZ00462        757 EGYFKVDMYGPSHCEDNFIHSVVIFNI  783 (1004)
T ss_pred             CeEEEEEeCCCCCCccchheeeeeEee
Confidence            99999998 689999999999999975


No 16 
>KOG1544|consensus
Probab=100.00  E-value=8e-43  Score=327.50  Aligned_cols=255  Identities=24%  Similarity=0.412  Sum_probs=192.0

Q ss_pred             CcCCCCChHHHhhhcCccccccchhhhhhhhhHHHHHhhhccCCCCCCCeeecccC--CCCCCCCCCCCCchhhhHhhhh
Q psy667          106 SEFSDRSPEEILCKTGFKWSERTYERIVADREKVEKMLMEVEKDGPVPDAWDWRKK--NVTGPAGDQAACGSCWAFSIAG  183 (392)
Q Consensus       106 N~FsDlT~eEf~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~lP~~~Dwr~~--g~v~pVkdQg~cgsCwAfa~~~  183 (392)
                      .+|-.||.++-  -+.-++.-++.....    ..+.+...+++..+||+.||-|.+  +++.||.|||+|++.|||++++
T Consensus       169 SaFWGmtL~DG--iKyRLGTL~Ps~sv~----nMNEi~~~l~p~~~LPE~F~As~KWp~liH~plDQgnCa~SWafSTaa  242 (470)
T KOG1544|consen  169 SAFWGMTLDDG--IKYRLGTLRPSSSVM----NMNEIYTVLNPGEVLPEAFEASEKWPNLIHEPLDQGNCAGSWAFSTAA  242 (470)
T ss_pred             hhhhccccccc--ceeeecccCchhhhh----hHHhHhhccCcccccchhhhhhhcCCccccCccccCCcccceeeeeeh
Confidence            47778887764  222233322211111    112222233444689999999998  5899999999999999999999


Q ss_pred             hhhhhHHhhhcccchhhhcccccchhHHHHHHhCCccccchhhhhhhc-cCCCCCCCCCchhhHHHHHhCCCCCCCCCCC
Q psy667          184 KFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTGKLVEFSKSQLVECA-KQCSGCDGCFFEPSIEYTHQAGLESEKDYPY  262 (392)
Q Consensus       184 ~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~~~~~lS~q~l~dc~-~~~~gC~GG~~~~a~~~~~~~Gi~~e~~yPY  262 (392)
                      .          -+||+-|.     -++++      ...||+|+|++|. ....||+||+.+.|+-|+.+.|++...+|||
T Consensus       243 v----------asDRiAI~-----S~GR~------t~~LSpQnLlSC~~h~q~GC~gG~lDRAWWYlRKrGvVsdhCYP~  301 (470)
T KOG1544|consen  243 V----------ASDRVAIH-----SLGRM------TPVLSPQNLLSCDTHQQQGCRGGRLDRAWWYLRKRGVVSDHCYPF  301 (470)
T ss_pred             h----------ccceeEEe-----ecccc------ccccChHHhcchhhhhhccCccCcccchheeeecccccccccccc
Confidence            8          34665544     33333      6789999999999 5668999999999999999999999999999


Q ss_pred             CCC-CCCCcccccCC--------------------CCceeEecccceecCCHHHHHHHHHcCCCeEEEEEc-CCCcccCC
Q psy667          263 KNA-NGEKFKCAYDK--------------------SKVKLFTGKDFLHFNGSETMKKILYKYGPLSVLLNS-DLIHDYNG  320 (392)
Q Consensus       263 ~~~-~~~~~~C~~~~--------------------~~~~~~i~~~y~~~~~~~~ik~~l~~~gPV~v~i~~-~~f~~y~~  320 (392)
                      ... ++..+.|...+                    ++..++++.-|..-+++++|++.|+++|||.+.+.| .+|..|++
T Consensus       302 ~~dQ~~~~~~C~m~sR~~grgkRqat~~CPn~~~~Sn~iyq~tPPYrVSSnE~eImkElM~NGPVQA~m~VHEDFF~Ykg  381 (470)
T KOG1544|consen  302 SGDQAGPAPPCMMHSRAMGRGKRQATAHCPNSYVNSNDIYQVTPPYRVSSNEKEIMKELMENGPVQALMEVHEDFFLYKG  381 (470)
T ss_pred             cCCCCCCCCCceeeccccCcccccccCcCCCcccccCceeeecCCeeccCCHHHHHHHHHhCCChhhhhhhhhhhhhhcc
Confidence            742 22333443221                    223455553444444999999999999999999999 69999999


Q ss_pred             ceeeCCCCCCCC-----CCCCeEEEEEEEeecC-----CccEEEEEcCCCCCCCCCcEEEEEecCCccccccceeEE
Q psy667          321 TPIRKNDETCSP-----YDLGHAVLLVGYGKQD-----NIPYWLVRNSWGPIGPDEGFFKIERGNNACGIEQIAGYA  387 (392)
Q Consensus       321 Giy~~~~~~c~~-----~~~~Hav~iVGyg~~~-----g~~ywiikNSWG~~WG~~GY~~i~r~~n~cgi~~~~~~~  387 (392)
                      |||.+.+..-..     ..+.|+|.|.|||++.     ..+|||..||||+.|||+|||||-||.|.|.||++++.+
T Consensus       382 GiY~H~~~~~~~~e~yr~~gtHsVk~tGWG~~~~~~G~~~KyW~aANSWG~~WGE~GYFriLRGvNecdIEsfvIgA  458 (470)
T KOG1544|consen  382 GIYSHTPVSLGRPERYRRHGTHSVKITGWGEETLPDGRTLKYWTAANSWGPAWGERGYFRILRGVNECDIESFVIGA  458 (470)
T ss_pred             ceeeccccccCCchhhhhcccceEEEeecccccCCCCCeeEEEEeecccccccccCceEEEeccccchhhhHhhhhh
Confidence            999986422221     2678999999999863     368999999999999999999999999999999987654


No 17 
>COG4870 Cysteine protease [Posttranslational modification, protein turnover, chaperones]
Probab=99.94  E-value=7.1e-28  Score=232.06  Aligned_cols=191  Identities=25%  Similarity=0.356  Sum_probs=129.8

Q ss_pred             CCCCeeecccCCCCCCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHhCCccccchhhh---
Q psy667          151 PVPDAWDWRKKNVTGPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTGKLVEFSKSQL---  227 (392)
Q Consensus       151 ~lP~~~Dwr~~g~v~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~~~~~lS~q~l---  227 (392)
                      .+|+.||||..|-|+||||||.||+||||+++++                       +|+...-..  ...+|+-.+   
T Consensus        98 s~~~~fd~r~~g~vs~v~dQg~~Gscwaf~t~~s-----------------------les~l~~~~--~w~~s~~nm~~l  152 (372)
T COG4870          98 SLPSYFDRRDEGKVSPVKDQGSGGSCWAFATTRS-----------------------LESYLNPES--AWDFSENNMKNL  152 (372)
T ss_pred             cchhheeeeccCCcccccccCcccceEeeeehhh-----------------------hhheecccc--cccccccchhhh
Confidence            5899999999999999999999999999999999                       777662222  233443332   


Q ss_pred             --hhhc-cCCCC-CCCCCchhhHHHH-HhCCCCCCCCCCCCCCCCCCcccccCCCCceeEecccceecC------CHHHH
Q psy667          228 --VECA-KQCSG-CDGCFFEPSIEYT-HQAGLESEKDYPYKNANGEKFKCAYDKSKVKLFTGKDFLHFN------GSETM  296 (392)
Q Consensus       228 --~dc~-~~~~g-C~GG~~~~a~~~~-~~~Gi~~e~~yPY~~~~~~~~~C~~~~~~~~~~i~~~y~~~~------~~~~i  296 (392)
                        +-|. ....+ -+||....+..|+ +..|-+.+.+-||.   .....|..... ...++. .-..++      +.-.|
T Consensus       153 l~~~ye~~fd~~~~d~g~~~m~~a~l~e~sgpv~et~d~y~---~~s~~~~~~~p-~~k~~~-~~~~i~~~~~~LdnG~i  227 (372)
T COG4870         153 LGVPYEKGFDYTSNDGGNADMSAAYLTEWSGPVYETDDPYS---ENSYFSPTNLP-VTKHVQ-EAQIIPSRKKYLDNGNI  227 (372)
T ss_pred             cCCCccccCCCccccCCccccccccccccCCcchhhcCccc---cccccCCcCCc-hhhccc-cceecccchhhhcccch
Confidence              3332 11111 1267777777777 78899999999998   44444443211 111111 112222      34458


Q ss_pred             HHHHHcCCCeEEEEEcC--CCcccCCceeeCCCCCCCCCCCCeEEEEEEEeec----------CCccEEEEEcCCCCCCC
Q psy667          297 KKILYKYGPLSVLLNSD--LIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQ----------DNIPYWLVRNSWGPIGP  364 (392)
Q Consensus       297 k~~l~~~gPV~v~i~~~--~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~----------~g~~ywiikNSWG~~WG  364 (392)
                      ++++..+|-+...|.++  .+..-..+.|...    +....+|||+||||++.          .|.+.||||||||++||
T Consensus       228 ~~~~~~yg~~s~~~~id~~~~~~~~~~~~~~~----s~~~~gHAv~iVGyDDs~~~n~~~~~~~g~GAfiikNSWGt~wG  303 (372)
T COG4870         228 KAMFGFYGAVSSSMYIDATNSLGICIPYPYVD----SGENWGHAVLIVGYDDSFDINNFKYGPPGDGAFIIKNSWGTNWG  303 (372)
T ss_pred             HHHHhhhccccceeEEecccccccccCCCCCC----ccccccceEEEEeccccccccccccCCCCCceEEEECccccccc
Confidence            88998889888666553  3333333444432    22478999999999985          25679999999999999


Q ss_pred             CCcEEEEEecC
Q psy667          365 DEGFFKIERGN  375 (392)
Q Consensus       365 ~~GY~~i~r~~  375 (392)
                      ++|||||++..
T Consensus       304 ~~GYfwisY~y  314 (372)
T COG4870         304 ENGYFWISYYY  314 (372)
T ss_pred             cCceEEEEeee
Confidence            99999999975


No 18 
>cd00585 Peptidase_C1B Peptidase C1B subfamily (MEROPS database nomenclature); composed of eukaryotic bleomycin hydrolases (BH) and bacterial aminopeptidases C (pepC). The proteins of this subfamily contain a large insert relative to the C1A peptidase (papain) subfamily. BH is a cysteine peptidase that detoxifies bleomycin by hydrolysis of an amide group. It acts as a carboxypeptidase on its C-terminus to convert itself into an aminopeptidase and peptide ligase. BH is found in all tissues in mammals as well as in many other eukaryotes. Bleomycin, a glycopeptide derived from the fungus Streptomyces verticullus, is an effective anticancer drug due to its ability to induce DNA strand breaks. Human BH is the major cause of tumor cell resistance to bleomycin chemotherapy, and is also genetically linked to Alzheimer's disease. In addition to its peptidase activity, the yeast BH (Gal6) binds DNA and acts as a repressor in the Gal4 regulatory system. BH forms a hexameric ring barrel structure w
Probab=99.90  E-value=3.3e-23  Score=209.29  Aligned_cols=186  Identities=22%  Similarity=0.273  Sum_probs=134.7

Q ss_pred             CCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHH-hCCccccchhhhhhhc------------
Q psy667          165 GPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIK-TGKLVEFSKSQLVECA------------  231 (392)
Q Consensus       165 ~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~-~~~~~~lS~q~l~dc~------------  231 (392)
                      .||+||+.-|.||.||+...                       ++..+..+ +.+.+.||+.++.--+            
T Consensus        55 ~~vtnQ~~SGrCW~FA~Ln~-----------------------lr~~~~k~~~~~~felSq~Yl~f~dklEkaN~fle~i  111 (437)
T cd00585          55 EPVTNQKSSGRCWLFAALNV-----------------------LRHQFMKKLNLKEFEFSQSYLFFWDKLEKANYFLENI  111 (437)
T ss_pred             CCcccCCCCchhHHHHCHHH-----------------------HHHHHHHHcCCCCEEeCcHHHHHHHHHHHHHHHHHHH
Confidence            49999999999999999999                       99987664 5578999998776421            


Q ss_pred             ----------------cCCCCCCCCCchhhHHHHHhCCCCCCCCCCCCCCCC------------------------CCc-
Q psy667          232 ----------------KQCSGCDGCFFEPSIEYTHQAGLESEKDYPYKNANG------------------------EKF-  270 (392)
Q Consensus       232 ----------------~~~~gC~GG~~~~a~~~~~~~Gi~~e~~yPY~~~~~------------------------~~~-  270 (392)
                                      ......+||....+...++++|+++.+.||-.....                        ..+ 
T Consensus       112 i~~~~~~~~~R~v~~ll~~~~~DGGqw~m~~~li~KYGvVPk~~~pet~~s~~t~~~n~~L~~kLr~~a~~lr~~~~~~~  191 (437)
T cd00585         112 IETADEPLDDRLVQFLLANPQNDGGQWDMLVNLIEKYGLVPKSVMPESFNSENSRRLNYLLNRKLREDALELRKLVAKGA  191 (437)
T ss_pred             HHHhcCCCccHHHHHHHhCCcCCCCchHHHHHHHHHcCCCcccccCCCcCccchHHHHHHHHHHHHHHHHHHHHHHhcCC
Confidence                            135567899999999999999999999999652200                        000 


Q ss_pred             -cc---------------------------------------------------------cc--------CCC-----Cc
Q psy667          271 -KC---------------------------------------------------------AY--------DKS-----KV  279 (392)
Q Consensus       271 -~C---------------------------------------------------------~~--------~~~-----~~  279 (392)
                       ..                                                         ..        .+.     ..
T Consensus       192 ~~~~l~~~~~~~~~~iy~il~~~lG~pP~~F~~~y~dkd~~~~~~~~~TP~~F~~~yv~~~~~dyV~l~~~p~~~~p~~~  271 (437)
T cd00585         192 SKEEIEAKKEEMLKEVYRILAIALGEPPEKFDWEYRDKDKKYHEIKELTPLEFYKKYVKFDLDDYVSLINDPRPDKPYNK  271 (437)
T ss_pred             cHHHHHHHHHHHHHHHHHHHHHHcCCCCceEEEEEEeCCCCeeeCCCcCHHHHHHHhcCCCccceEEEEeCCCCCCCCCc
Confidence             00                                                         00        000     00


Q ss_pred             eeEec-------c---cceecCCHHHHH----HHHHcCCCeEEEEEcCCCcccCCceeeCCCC-----------------
Q psy667          280 KLFTG-------K---DFLHFNGSETMK----KILYKYGPLSVLLNSDLIHDYNGTPIRKNDE-----------------  328 (392)
Q Consensus       280 ~~~i~-------~---~y~~~~~~~~ik----~~l~~~gPV~v~i~~~~f~~y~~Giy~~~~~-----------------  328 (392)
                      .+.+.       .   .|.++ ..+.|+    ++|.+++||.++++++.|..|++||+.....                 
T Consensus       272 ~y~ve~~~Nv~~g~~~~y~Nv-p~d~l~~~~~~~L~~g~pV~~g~Dv~~~~~~k~GI~d~~~~~~~~~f~~~~~~~KaeR  350 (437)
T cd00585         272 LYTVEYLGNVVGGRPILYLNV-PMDVLKKAAIAQLKDGEPVWFGCDVGKFSDRKSGILDTDLFDYELLFGIDFGLNKAER  350 (437)
T ss_pred             eEEEecCCcccccccceEEec-CHHHHHHHHHHHHhcCCCEEEEEEcChhhccCCccccCcccchhhhcCccccCCHHHH
Confidence            01111       0   23333 334444    6788899999999998888999999965310                 


Q ss_pred             -CCCCCCCCeEEEEEEEeecC-Cc-cEEEEEcCCCCCCCCCcEEEEEec
Q psy667          329 -TCSPYDLGHAVLLVGYGKQD-NI-PYWLVRNSWGPIGPDEGFFKIERG  374 (392)
Q Consensus       329 -~c~~~~~~Hav~iVGyg~~~-g~-~ywiikNSWG~~WG~~GY~~i~r~  374 (392)
                       .|.....+|||+|||||.+. |+ .||+||||||+.||++||++|+++
T Consensus       351 l~~~es~~tHAM~ivGv~~D~~g~p~yw~VkNSWG~~~G~~Gy~~ms~~  399 (437)
T cd00585         351 LDYGESLMTHAMVLTGVDLDEDGKPVKWKVENSWGEKVGKKGYFVMSDD  399 (437)
T ss_pred             HhhcCCcCCeEEEEEEEEecCCCCcceEEEEcccCCCCCCCcceehhHH
Confidence             13333678999999999754 65 699999999999999999999875


No 19 
>PF03051 Peptidase_C1_2:  Peptidase C1-like family This family is a subfamily of the Prosite entry;  InterPro: IPR004134 In the MEROPS database peptidases and peptidase homologues are grouped into clans and families. Clans are groups of families for which there is evidence of common ancestry based on a common structural fold:  Each clan is identified with two letters, the first representing the catalytic type of the families included in the clan (with the letter 'P' being used for a clan containing families of more than one of the catalytic types serine, threonine and cysteine). Some families cannot yet be assigned to clans, and when a formal assignment is required, such a family is described as belonging to clan A-, C-, M-, N-, S-, T- or U-, according to the catalytic type. Some clans are divided into subclans because there is evidence of a very ancient divergence within the clan, for example MA(E), the gluzincins, and MA(M), the metzincins. Peptidase families are grouped by their catalytic type, the first character representing the catalytic type: A, aspartic; C, cysteine; G, glutamic acid; M, metallo; N, asparagine; S, serine; T, threonine; and U, unknown. The serine, threonine and cysteine peptidases utilise the amino acid as a nucleophile and form an acyl intermediate - these peptidases can also readily act as transferases. In the case of aspartic, glutamic and metallopeptidases, the nucleophile is an activated water molecule. In the case of the asparagine endopeptidases, the nucleophile is asparagine and all are self-processing endopeptidases.   In many instances the structural protein fold that characterises the clan or family may have lost its catalytic activity, yet retain its function in protein recognition and binding.  Cysteine peptidases have characteristic molecular topologies, which can be seen not only in their three-dimensional structures, but commonly also in the two-dimensional structures. These are peptidases in which the nucleophile is the sulphydryl group of a cysteine residue. Cysteine proteases are divided into clans (proteins which are evolutionary related), and further sub-divided into families, on the basis of the architecture of their catalytic dyad or triad [].  This group of proteins belong to MEROPS peptidase family C1, sub-family C1B (bleomycin hydrolase, clan CA). This family contains prokaryotic and eukaryotic aminopeptidases and bleomycin hydrolases.; GO: 0004197 cysteine-type endopeptidase activity, 0006508 proteolysis; PDB: 3PW3_F 2CB5_A 1CB5_C 2DZZ_A 2E02_A 2E01_A 2E03_A 1A6R_A 1GCB_A 3GCB_A ....
Probab=99.64  E-value=1.8e-15  Score=153.26  Aligned_cols=187  Identities=21%  Similarity=0.323  Sum_probs=113.5

Q ss_pred             CCCCCCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHHHHHhC-Cccccchhhhh---------------
Q psy667          165 GPAGDQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQYAIKTG-KLVEFSKSQLV---------------  228 (392)
Q Consensus       165 ~pVkdQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~~~~~~-~~~~lS~q~l~---------------  228 (392)
                      .||.||+.-|.||.||+...                       ++..+..+.+ +...||+-+|.               
T Consensus        56 ~~vtnQk~SGRCW~FA~lN~-----------------------lR~~~~kk~~l~~felSq~Yl~F~DKlEKaN~fLe~i  112 (438)
T PF03051_consen   56 GPVTNQKSSGRCWLFAALNV-----------------------LRHEIMKKLNLKDFELSQNYLFFWDKLEKANYFLENI  112 (438)
T ss_dssp             -S--B--BSSTHHHHHHHHH-----------------------HHHHHHHHCT-SS--B-HHHHHHHHHHHHHHHHHHHH
T ss_pred             CCCCCCCCCCCcchhhchHH-----------------------HHHHHHHHcCCCceEeechHHHHHHHHHHHHHHHHHH
Confidence            49999999999999999999                       9988877765 78999998875               


Q ss_pred             -hhc------------cCCCCCCCCCchhhHHHHHhCCCCCCCCCCCCCCC---------------------------CC
Q psy667          229 -ECA------------KQCSGCDGCFFEPSIEYTHQAGLESEKDYPYKNAN---------------------------GE  268 (392)
Q Consensus       229 -dc~------------~~~~gC~GG~~~~a~~~~~~~Gi~~e~~yPY~~~~---------------------------~~  268 (392)
                       ++.            ......+||....+...++++|+++.+.||-....                           +.
T Consensus       113 i~~~~~~~d~R~v~~ll~~~~~DGGqw~~~~nli~KYGvVPk~~mpet~~s~~t~~~n~~l~~~Lr~~a~~LR~~~~~~~  192 (438)
T PF03051_consen  113 IDTADEPLDDRLVRFLLKNPVSDGGQWDMVVNLIKKYGVVPKSVMPETFSSSNTSEMNEMLNTKLREYALELRKLVKAGK  192 (438)
T ss_dssp             HHCCTS-TTSHHHHHHHHSTT-S-B-HHHHHHHHHHH---BGGGSTTGCGCHBHHHHHHHHHHHHHHHHHHHHHHHHTTT
T ss_pred             HHHhcCCcchHHHHHHHhcCCCCCCchHHHHHHHHHcCcCcHhhCCCCCCCCChHHHHHHHHHHHHHHHHHHHHHHHcCC
Confidence             221            11345779999999999999999999999976321                           00


Q ss_pred             C-----------------------cccc------c-CCC---------------------------------------Cc
Q psy667          269 K-----------------------FKCA------Y-DKS---------------------------------------KV  279 (392)
Q Consensus       269 ~-----------------------~~C~------~-~~~---------------------------------------~~  279 (392)
                      .                       |.++      . ++.                                       ..
T Consensus       193 ~~~~l~~~k~~~l~~iy~il~~~lG~PP~~F~~ey~dkd~~~~~~~~~TP~eF~~kyv~~~~ddyVsLin~P~~~~py~~  272 (438)
T PF03051_consen  193 SEEELRKLKEEMLAEIYRILAIYLGEPPEKFTWEYRDKDKKYHRGKNYTPLEFYKKYVGFDLDDYVSLINDPRSHHPYNK  272 (438)
T ss_dssp             TCHHHHHHHHHHHHHHHHHHHHHH---SSSEEEEEE-TTS-EEEEEEE-HHHHHHHCTTS-GGGEEEEE--T-TTS-TTC
T ss_pred             CHHHHHHHHHHHHHHHHHHHHHHcCCCChheeEEEeccccccccccccCchhHHHHHhCCCCcceEEEeeCCCccCccce
Confidence            0                       0000      0 000                                       01


Q ss_pred             eeEecc----------cceecC---CHHHHHHHHHcCCCeEEEEEcCCCcccCCceeeCCCCC-----------------
Q psy667          280 KLFTGK----------DFLHFN---GSETMKKILYKYGPLSVLLNSDLIHDYNGTPIRKNDET-----------------  329 (392)
Q Consensus       280 ~~~i~~----------~y~~~~---~~~~ik~~l~~~gPV~v~i~~~~f~~y~~Giy~~~~~~-----------------  329 (392)
                      .+.+.-          .|.+++   =.+.+.++|.++.||..+-+++.+...+.||.+..-..                 
T Consensus       273 ~y~ve~~~Nv~~g~~~~ylNvpid~lk~~~i~~Lk~G~~VwfgcDV~k~~~~k~Gi~D~~~~d~~~~fg~~~~~~K~~Rl  352 (438)
T PF03051_consen  273 LYTVEYLGNVVGGRPVRYLNVPIDELKDAAIKSLKAGYPVWFGCDVGKFFDRKNGIMDTDLYDYDSLFGVDFNMSKAERL  352 (438)
T ss_dssp             EEEETTTTSSTT-EEEEEEE--HHHHHHHHHHHHHTT--EEEEEETTTTEETTTTEE-TTSB-HHHHHT--S-S-HHHHH
T ss_pred             eEEEccCCCEECCcceeEeccCHHHHHHHHHHHHHcCCcEEEeccCCccccccchhhccchhhhhhhhccccccCHHHHH
Confidence            111110          133444   12456778888899999999987677788987653110                 


Q ss_pred             -CCCCCCCeEEEEEEEee-cCCc-cEEEEEcCCCCCCCCCcEEEEEec
Q psy667          330 -CSPYDLGHAVLLVGYGK-QDNI-PYWLVRNSWGPIGPDEGFFKIERG  374 (392)
Q Consensus       330 -c~~~~~~Hav~iVGyg~-~~g~-~ywiikNSWG~~WG~~GY~~i~r~  374 (392)
                       ......+|||+|||.+. ++|+ .+|+|+||||+..|.+||+.|+..
T Consensus       353 ~~~eS~~tHAM~itGv~~D~~g~p~~wkVeNSWG~~~g~kGy~~msd~  400 (438)
T PF03051_consen  353 DYGESTMTHAMVITGVDLDEDGKPVRWKVENSWGTDNGDKGYFYMSDD  400 (438)
T ss_dssp             HTTSS--EEEEEEEEEEE-TTSSEEEEEEE-SBTTTSTBTTEEEEEHH
T ss_pred             HhCCCCCceeEEEEEEEeccCCCeeEEEEEcCCCCCCCCCcEEEECHH
Confidence             01125689999999997 5665 599999999999999999999863


No 20 
>PF08246 Inhibitor_I29:  Cathepsin propeptide inhibitor domain (I29);  InterPro: IPR013201 Peptide proteinase inhibitors can be found as single domain proteins or as single or multiple domains within proteins; these are referred to as either simple or compound inhibitors, respectively. In many cases they are synthesised as part of a larger precursor protein, either as a prepropeptide or as an N-terminal domain associated with an inactive peptidase or zymogen. This domain prevents access of the substrate to the active site. Removal of the N-terminal inhibitor domain either by interaction with a second peptidase or by autocatalytic cleavage activates the zymogen. Other inhibitors interact direct with proteinases using a simple noncovalent lock and key mechanism; while yet others use a conformational change-based trapping mechanism that depends on their structural and thermodynamic properties.  This entry represents a peptidase inhibitor domain, which belongs to MEROPS peptidase inhibitor family I29. The domain is also found at the N terminus of a variety of peptidase precursors that belong to MEROPS peptidase subfamily C1A; these include cathepsin L, papain, and procaricain (P10056 from SWISSPROT) []. It forms an alpha-helical domain that runs through the substrate-binding site, preventing access. Removal of this region by proteolytic cleavage results in activation of the enzyme. This domain is also found, in one or more copies, in a variety of cysteine peptidase inhibitors such as salarin [].; PDB: 3QT4_A 3QJ3_A 2C0Y_A 2L95_A 1CJL_A 1CS8_A 7PCK_A 1BY8_A 1PCI_A 2O6X_A ....
Probab=99.42  E-value=2.3e-13  Score=100.29  Aligned_cols=49  Identities=39%  Similarity=0.692  Sum_probs=42.4

Q ss_pred             HHHHHHHhCCCcCChHHHHHHHHHHHHHHH--hhh-------hhccCCcCCCCChHHH
Q psy667           68 FKAFIVKRGRQYANDEEIKERFEYFKQDGH--KKH-------ERYGTSEFSDRSPEEI  116 (392)
Q Consensus        68 F~~f~~ky~K~Y~~~~E~~~R~~iF~~Nl~--~~h-------~~lgiN~FsDlT~eEf  116 (392)
                      |++|+++|+|.|.+.+|+..|+.+|++|++  ++|       |++|+|+|||||++||
T Consensus         1 F~~~~~~~~k~Y~~~~e~~~R~~~F~~N~~~I~~~N~~~~~~~~~~~N~fsD~t~eEf   58 (58)
T PF08246_consen    1 FEQFKKKYGKSYKSAEEEARRFAIFKENLRRIEEHNANGNNTYKLGLNQFSDMTPEEF   58 (58)
T ss_dssp             HHHHHHHCT---SSHHHHHHHHHHHHHHHHHHHHHHHTTSSSEEE-SSTTTTSSHHHH
T ss_pred             CHHHHHHcCCCCCCHHHHHHHHHHHHHHHHHHHHHhcCCCCCeEEeCccccCcChhhC
Confidence            899999999999999999999999999999  555       8899999999999998


No 21 
>smart00848 Inhibitor_I29 Cathepsin propeptide inhibitor domain (I29). This domain is found at the N-terminus of some C1 peptidases such as Cathepsin L where it acts as a propeptide. There are also a number of proteins that are composed solely of multiple copies of this domain such as the peptidase inhibitor salarin. This family is classified as I29 by MEROPS. Peptide proteinase inhibitors can be found as single domain proteins or as single or multiple domains within proteins; these are referred to as either simple or compound inhibitors, respectively. In many cases they are synthesised as part of a larger precursor protein, either as a prepropeptide or as an N-terminal domain associated with an inactive peptidase or zymogen. This domain prevents access of the substrate to the active site. Removal of the N-terminal inhibitor domain either by interaction with a second peptidase or by autocatalytic cleavage activates the zymogen. Other inhibitors interact direct with proteinases using a s
Probab=99.18  E-value=2.1e-11  Score=89.15  Aligned_cols=48  Identities=35%  Similarity=0.630  Sum_probs=44.4

Q ss_pred             HHHHHHHhCCCcCChHHHHHHHHHHHHHHH--hhh-------hhccCCcCCCCChHH
Q psy667           68 FKAFIVKRGRQYANDEEIKERFEYFKQDGH--KKH-------ERYGTSEFSDRSPEE  115 (392)
Q Consensus        68 F~~f~~ky~K~Y~~~~E~~~R~~iF~~Nl~--~~h-------~~lgiN~FsDlT~eE  115 (392)
                      |++|+.+|+|.|.+.+|...|+.+|++|++  +.|       |++|+|+|||||++|
T Consensus         1 f~~~~~~~~k~y~~~~e~~~r~~~f~~n~~~i~~~N~~~~~~~~~~~N~fsDlt~eE   57 (57)
T smart00848        1 FEQWKKKYGKSYSSEEEELRRFEIFKENLKFIEEHNKKNDHSYTLGLNQFADLTNEE   57 (57)
T ss_pred             ChHHHHHhCCCCCCHHHHHHHHHHHHHHHHHHHHHHhcCCCCeEecCcccccCCCCC
Confidence            689999999999999999999999999999  555       889999999999987


No 22 
>COG3579 PepC Aminopeptidase C [Amino acid transport and metabolism]
Probab=98.69  E-value=3.4e-08  Score=94.97  Aligned_cols=75  Identities=17%  Similarity=0.208  Sum_probs=54.7

Q ss_pred             HHHcCCCeEEEEEcCCCcccCCceeeCCCC------------------CCCCCCCCeEEEEEEEeec-CC-ccEEEEEcC
Q psy667          299 ILYKYGPLSVLLNSDLIHDYNGTPIRKNDE------------------TCSPYDLGHAVLLVGYGKQ-DN-IPYWLVRNS  358 (392)
Q Consensus       299 ~l~~~gPV~v~i~~~~f~~y~~Giy~~~~~------------------~c~~~~~~Hav~iVGyg~~-~g-~~ywiikNS  358 (392)
                      .+..+-||-.+-++..+..-+.||....-.                  ..+.....|||+|.|.+.+ +| .-=|.|.||
T Consensus       307 q~qagetVwFG~dvgq~s~rk~Gimdtd~~~~~s~~g~~~~q~KA~RldY~eSLmTHAMvlTGvd~d~~g~p~rwkVENS  386 (444)
T COG3579         307 QMQAGETVWFGCDVGQLSDRKTGIMDTDIYDYESSLGINLTQDKAGRLDYGESLMTHAMVLTGVDLDETGNPLRWKVENS  386 (444)
T ss_pred             HHhcCCcEEeecCchhhcccccceeeehhccchhhhCCCcccchhhccccchHHHHHHHHhhccccccCCCceeeEeecc
Confidence            345577999999998888888887643210                  0011145799999999854 44 346999999


Q ss_pred             CCCCCCCCcEEEEEe
Q psy667          359 WGPIGPDEGFFKIER  373 (392)
Q Consensus       359 WG~~WG~~GY~~i~r  373 (392)
                      ||..=|.+|||-++-
T Consensus       387 WG~d~G~~GyfvaSd  401 (444)
T COG3579         387 WGKDVGKKGYFVASD  401 (444)
T ss_pred             cccccCCCceEeehH
Confidence            999999999998763


No 23 
>KOG4128|consensus
Probab=96.70  E-value=0.0008  Score=65.23  Aligned_cols=81  Identities=19%  Similarity=0.185  Sum_probs=53.1

Q ss_pred             CHHHHHHHH----HcCCCeEEEEEcCCCcccCCceeeCCCC-----------CCC--------CCCCCeEEEEEEEee-c
Q psy667          292 GSETMKKIL----YKYGPLSVLLNSDLIHDYNGTPIRKNDE-----------TCS--------PYDLGHAVLLVGYGK-Q  347 (392)
Q Consensus       292 ~~~~ik~~l----~~~gPV~v~i~~~~f~~y~~Giy~~~~~-----------~c~--------~~~~~Hav~iVGyg~-~  347 (392)
                      +.+.|++.+    ..+-||-.+-++..+..-++|+.+-.--           .-.        .....||+++.|-|. +
T Consensus       305 ~~d~l~k~vv~sl~~~kaVwfgcd~~k~~~~K~G~~dl~l~~~~l~fG~~l~~~~KAeRl~y~eSlmthAml~T~v~~kd  384 (457)
T KOG4128|consen  305 SMDILMKIVVTSLEGDKAVWFGCDIRKAISLKSGPLDLRLHQFDLLFGFKLGESTKAERLDYRESLMTHAMLLTSVGLKD  384 (457)
T ss_pred             CHHHHHHHHHHHhcCCcceEEecccHhhhhcccCccchhhccCceeeeeeccccchhhhhhHHHHHHHHHHHhhhccccC
Confidence            456666554    3456888888776666667775432100           000        113579999999883 2


Q ss_pred             ---CCccEEEEEcCCCCCCCCCcEEEEE
Q psy667          348 ---DNIPYWLVRNSWGPIGPDEGFFKIE  372 (392)
Q Consensus       348 ---~g~~ywiikNSWG~~WG~~GY~~i~  372 (392)
                         .+-.-|-|.||||.+-|-+||..|.
T Consensus       385 ~~~g~~~~~rVenswgkd~gkkg~~~mt  412 (457)
T KOG4128|consen  385 PATGGLNEHRVENSWGKDLGKKGVNKMT  412 (457)
T ss_pred             cccCCchhhhhhchhhhhccccchhhhh
Confidence               3445699999999999999996653


No 24 
>PF05543 Peptidase_C47:  Staphopain peptidase C47;  InterPro: IPR008750 In the MEROPS database peptidases and peptidase homologues are grouped into clans and families. Clans are groups of families for which there is evidence of common ancestry based on a common structural fold:  Each clan is identified with two letters, the first representing the catalytic type of the families included in the clan (with the letter 'P' being used for a clan containing families of more than one of the catalytic types serine, threonine and cysteine). Some families cannot yet be assigned to clans, and when a formal assignment is required, such a family is described as belonging to clan A-, C-, M-, N-, S-, T- or U-, according to the catalytic type. Some clans are divided into subclans because there is evidence of a very ancient divergence within the clan, for example MA(E), the gluzincins, and MA(M), the metzincins. Peptidase families are grouped by their catalytic type, the first character representing the catalytic type: A, aspartic; C, cysteine; G, glutamic acid; M, metallo; N, asparagine; S, serine; T, threonine; and U, unknown. The serine, threonine and cysteine peptidases utilise the amino acid as a nucleophile and form an acyl intermediate - these peptidases can also readily act as transferases. In the case of aspartic, glutamic and metallopeptidases, the nucleophile is an activated water molecule. In the case of the asparagine endopeptidases, the nucleophile is asparagine and all are self-processing endopeptidases.   In many instances the structural protein fold that characterises the clan or family may have lost its catalytic activity, yet retain its function in protein recognition and binding.  Cysteine peptidases have characteristic molecular topologies, which can be seen not only in their three-dimensional structures, but commonly also in the two-dimensional structures. These are peptidases in which the nucleophile is the sulphydryl group of a cysteine residue. Cysteine proteases are divided into clans (proteins which are evolutionary related), and further sub-divided into families, on the basis of the architecture of their catalytic dyad or triad [].  This group of cysteine peptidases belong to the peptidase family C47 (staphopain family, clan CA). The type example are the staphopains, which are one of four major families of proteinases secreted by the Gram-positive Staphylococcus aureus. These staphylococcal cysteine proteases are secreted as preproenzymes that are proteolytically cleaved to generate the mature enzyme [, , ].; GO: 0008234 cysteine-type peptidase activity, 0006508 proteolysis; PDB: 1X9Y_D 1Y4H_B 1PXV_B 1CV8_A.
Probab=95.27  E-value=0.19  Score=44.93  Aligned_cols=120  Identities=20%  Similarity=0.243  Sum_probs=69.6

Q ss_pred             CCCCCchhhhHhhhhhhhhhHHhhhcccchhhhcccccchhHHH--------HHHhCCccccchhhhhhhccCCCCCCCC
Q psy667          169 DQAACGSCWAFSIAGKFSNYLLQYLNHIDQFCLLIFPGMLEGQY--------AIKTGKLVEFSKSQLVECAKQCSGCDGC  240 (392)
Q Consensus       169 dQg~cgsCwAfa~~~~~~~~~~~~~~~~dr~c~~~~~~~le~~~--------~~~~~~~~~lS~q~l~dc~~~~~gC~GG  240 (392)
                      .||.-+=|-+|+.++.                       |....        .+-..-...+|+++|.+++.        
T Consensus        18 tQg~~pWCa~Ya~aai-----------------------lN~~~~~~~~~A~~iMr~~yPn~s~~~l~~~~~--------   66 (175)
T PF05543_consen   18 TQGYNPWCAGYAMAAI-----------------------LNATTNTKIYNAKDIMRYLYPNVSEEQLKFTSL--------   66 (175)
T ss_dssp             --SSSS-HHHHHHHHH-----------------------HHHHCT-S---HHHHHHHHSTTS-CCCHHH--B--------
T ss_pred             ccCcCcHHHHHHHHHH-----------------------HHhhhCcCcCCHHHHHHHHCCCCCHHHHhhcCC--------
Confidence            4888899999999998                       33221        11122256788888877642        


Q ss_pred             CchhhHHHHHhCCCCCCCCCCCCCCCCCCcccccCCCCceeEecccceecCCHHHHHHHHHcCCCeEEEEEcCCCcccCC
Q psy667          241 FFEPSIEYTHQAGLESEKDYPYKNANGEKFKCAYDKSKVKLFTGKDFLHFNGSETMKKILYKYGPLSVLLNSDLIHDYNG  320 (392)
Q Consensus       241 ~~~~a~~~~~~~Gi~~e~~yPY~~~~~~~~~C~~~~~~~~~~i~~~y~~~~~~~~ik~~l~~~gPV~v~i~~~~f~~y~~  320 (392)
                      .+...++|.+..|...                           . --...++.+++++.+.++-|+.+..+.-     .+
T Consensus        67 ~~~~~i~y~ks~g~~~---------------------------~-~~n~~~s~~eV~~~~~~nk~i~i~~~~v-----~~  113 (175)
T PF05543_consen   67 TPNQMIKYAKSQGRNP---------------------------Q-YNNRMPSFDEVKKLIDNNKGIAILADRV-----EQ  113 (175)
T ss_dssp             -HHHHHHHHHHTTEEE---------------------------E-EECS---HHHHHHHHHTT-EEEEEEEET-----TS
T ss_pred             CHHHHHHHHHHcCcch---------------------------h-HhcCCCCHHHHHHHHHcCCCeEEEeccc-----cc
Confidence            3457777776544311                           0 0011226789999999989998876531     11


Q ss_pred             ceeeCCCCCCCCCCCCeEEEEEEEee-cCCccEEEEEcCCCC
Q psy667          321 TPIRKNDETCSPYDLGHAVLLVGYGK-QDNIPYWLVRNSWGP  361 (392)
Q Consensus       321 Giy~~~~~~c~~~~~~Hav~iVGyg~-~~g~~ywiikNSWG~  361 (392)
                              . .....+||++||||-. .+|.++.++=|-|-.
T Consensus       114 --------~-~~~~~gHAlavvGya~~~~g~~~y~~WNPW~~  146 (175)
T PF05543_consen  114 --------T-NGPHAGHALAVVGYAKPNNGQKTYYFWNPWWN  146 (175)
T ss_dssp             --------C-TTB--EEEEEEEEEEEETTSEEEEEEE-TT-S
T ss_pred             --------C-CCCccceeEEEEeeeecCCCCeEEEEeCCccC
Confidence                    1 1225789999999987 567899999999854


No 25 
>PF13529 Peptidase_C39_2:  Peptidase_C39 like family; PDB: 3ERV_A.
Probab=95.21  E-value=0.06  Score=45.26  Aligned_cols=55  Identities=27%  Similarity=0.442  Sum_probs=35.0

Q ss_pred             CHHHHHHHHHcCCCeEEEEEcC--CCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecCCccEEEEEcCC
Q psy667          292 GSETMKKILYKYGPLSVLLNSD--LIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQDNIPYWLVRNSW  359 (392)
Q Consensus       292 ~~~~ik~~l~~~gPV~v~i~~~--~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~g~~ywiikNSW  359 (392)
                      +.+.|++.|.++.||.+.+...  ..   .++.+..       ...+|.|+|+||+.+.   +++|..+|
T Consensus        88 ~~~~i~~~i~~G~Pvi~~~~~~~~~~---~~~~~~~-------~~~~H~vvi~Gy~~~~---~~~v~DP~  144 (144)
T PF13529_consen   88 SFDDIKQEIDAGRPVIVSVNSGWRPP---NGDGYDG-------TYGGHYVVIIGYDEDG---YVYVNDPW  144 (144)
T ss_dssp             -HHHHHHHHHTT--EEEEEETTSS-----TTEEEEE--------TTEEEEEEEEE-SSE----EEEE-TT
T ss_pred             cHHHHHHHHHCCCcEEEEEEcccccC---CCCCcCC-------CcCCEEEEEEEEeCCC---EEEEeCCC
Confidence            6789999999999999999742  11   1222322       2578999999999743   78888877


No 26 
>PF09778 Guanylate_cyc_2:  Guanylylate cyclase;  InterPro: IPR018616  Members of this family of proteins catalyse the conversion of guanosine triphosphate (GTP) to 3',5'-cyclic guanosine monophosphate (cGMP) and pyrophosphate. 
Probab=89.22  E-value=1.4  Score=40.84  Aligned_cols=64  Identities=27%  Similarity=0.412  Sum_probs=40.6

Q ss_pred             CHHHHHHHHHcCCCeEEEEEcCCCc--ccCCceeeCCCCCC---CCCCCCeEEEEEEEeecCCccEEEEEc
Q psy667          292 GSETMKKILYKYGPLSVLLNSDLIH--DYNGTPIRKNDETC---SPYDLGHAVLLVGYGKQDNIPYWLVRN  357 (392)
Q Consensus       292 ~~~~ik~~l~~~gPV~v~i~~~~f~--~y~~Giy~~~~~~c---~~~~~~Hav~iVGyg~~~g~~ywiikN  357 (392)
                      +.++|...|..+||+.+.++..-+.  .-+..........|   .+...+|-|+|+||+...+  =++++|
T Consensus       112 s~~ei~~hl~~g~~aIvLVd~~~L~C~~Ck~~~~~~~~~~~~~~~~~Y~GHYVVlcGyd~~~~--~~~yrd  180 (212)
T PF09778_consen  112 SIQEIIEHLSSGGPAIVLVDASLLHCDLCKSNCFDPIGSKCFGRSPDYQGHYVVLCGYDAATK--EFEYRD  180 (212)
T ss_pred             cHHHHHHHHhCCCcEEEEEccccccChhhcccccccccccccCCCCCccEEEEEEEeecCCCC--eEEEeC
Confidence            7889999999999999999886332  11222221110022   1336799999999997543  355555


No 27 
>PF14399 Transpep_BrtH:  NlpC/p60-like transpeptidase
Probab=83.79  E-value=3.3  Score=40.21  Aligned_cols=57  Identities=16%  Similarity=0.278  Sum_probs=37.6

Q ss_pred             CHHHHHHHHHcCCCeEEEEEcCCCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecCCccEEEEEc
Q psy667          292 GSETMKKILYKYGPLSVLLNSDLIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQDNIPYWLVRN  357 (392)
Q Consensus       292 ~~~~ik~~l~~~gPV~v~i~~~~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~g~~ywiikN  357 (392)
                      ..+.|++.|.++.||.+.++.-.+. |...-|       .....+|.|+|+||++++ ..|.++-+
T Consensus        77 ~~~~l~~~l~~g~pv~~~~D~~~lp-y~~~~~-------~~~~~~H~i~v~G~d~~~-~~~~v~D~  133 (317)
T PF14399_consen   77 AWEELKEALDAGRPVIVWVDMYYLP-YRPNYY-------KKHHADHYIVVYGYDEEE-DVFYVSDP  133 (317)
T ss_pred             HHHHHHHHHhCCCceEEEeccccCC-CCcccc-------ccccCCcEEEEEEEeCCC-CEEEEEcC
Confidence            4568999999888999998763222 222111       122568999999999743 34666544


No 28 
>COG4990 Uncharacterized protein conserved in bacteria [Function unknown]
Probab=72.04  E-value=8.4  Score=34.79  Aligned_cols=47  Identities=26%  Similarity=0.403  Sum_probs=36.4

Q ss_pred             CHHHHHHHHHcCCCeEEEEEcCCCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecCCccEEEEEcCCC
Q psy667          292 GSETMKKILYKYGPLSVLLNSDLIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQDNIPYWLVRNSWG  360 (392)
Q Consensus       292 ~~~~ik~~l~~~gPV~v~i~~~~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~g~~ywiikNSWG  360 (392)
                      +..+||..|.++.||.+-...  |..                ..-|+|+|.||++    .++..-++||
T Consensus       122 sl~~ik~ql~kg~PV~iw~T~--~~~----------------~s~H~v~itgyDk----~n~yynDpyG  168 (195)
T COG4990         122 SLSDIKGQLLKGRPVVIWVTN--FHS----------------YSIHSVLITGYDK----YNIYYNDPYG  168 (195)
T ss_pred             cHHHHHHHHhcCCcEEEEEec--ccc----------------cceeeeEeecccc----cceEeccccc
Confidence            789999999999999977653  221                2359999999996    4677777775


No 29 
>cd02549 Peptidase_C39A A sub-family of peptidase family C39. Peptidase family C39 mostly contains bacteriocin-processing endopeptidases from bacteria. The cysteine peptidases in family C39 cleave the "double-glycine" leader peptides from the precursors of various bacteriocins (mostly non-lantibiotic). The cleavage is mediated by the transporter as part of the secretion process. Bacteriocins are antibiotic proteins secreted by some species of bacteria that inhibit the growth of other bacterial species. The bacteriocin is synthesized as a precursor with an N-terminal leader peptide, and processing involves removal of the leader peptide by cleavage at a Gly-Gly bond, followed by translocation of the mature bacteriocin across the cytoplasmic membrane. Most endopeptidases of family C39 are N-terminal domains in larger proteins (ABC transporters) that serve both functions. The proposed protease active site is conserved in this sub-family of proteins with a single peptidase domain, which are 
Probab=64.08  E-value=20  Score=29.91  Aligned_cols=45  Identities=22%  Similarity=0.276  Sum_probs=31.8

Q ss_pred             HHHHHHcCCCeEEEEEcCCCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecCCccEEEEEcCC
Q psy667          296 MKKILYKYGPLSVLLNSDLIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQDNIPYWLVRNSW  359 (392)
Q Consensus       296 ik~~l~~~gPV~v~i~~~~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~g~~ywiikNSW  359 (392)
                      +++.|....||.+.++.+           .+     ....+|.|+|+||+.   .+..+|.+.|
T Consensus        70 ~~~~l~~~~Pvi~~~~~~-----------~~-----~~~~gH~vVv~g~~~---~~~~~i~DP~  114 (141)
T cd02549          70 LLRQLAAGHPVIVSVNLG-----------VS-----ITPSGHAMVVIGYDR---KGNVYVNDPG  114 (141)
T ss_pred             HHHHHHCCCeEEEEEecC-----------cc-----cCCCCeEEEEEEEcC---CCCEEEECCC
Confidence            788999899999988751           11     124689999999981   1335666765


No 30 
>cd00044 CysPc Calpains, domains IIa, IIb; calcium-dependent cytoplasmic cysteine proteinases, papain-like. Functions in cytoskeletal remodeling processes, cell differentiation, apoptosis and signal transduction.
Probab=53.11  E-value=20  Score=35.15  Aligned_cols=28  Identities=25%  Similarity=0.455  Sum_probs=24.6

Q ss_pred             CCCeEEEEEEEeecC--CccEEEEEcCCCC
Q psy667          334 DLGHAVLLVGYGKQD--NIPYWLVRNSWGP  361 (392)
Q Consensus       334 ~~~Hav~iVGyg~~~--g~~ywiikNSWG~  361 (392)
                      ..+||=.|++.-..+  +.+.-.+||.||.
T Consensus       234 ~~~HaY~Vl~~~~~~~~~~~lv~lrNPWg~  263 (315)
T cd00044         234 VKGHAYSVLDVREVQEEGLRLLRLRNPWGV  263 (315)
T ss_pred             ccCcceEEeEEEEEccCceEEEEecCCccC
Confidence            568999999998766  8899999999995


No 31 
>PF12385 Peptidase_C70:  Papain-like cysteine protease AvrRpt2;  InterPro: IPR022118  This is a family of cysteine proteases, found in actinobacteria, protobacteria and firmicutes. Papain-like cysteine proteases play a crucial role in plant-pathogen/pest interactions. On entering the host they act on non-self substrates, thereby manipulating the host to evade proteolysis []. AvrRpt2 from Pseudomonas syringae pv tomato DC3000 triggers resistance to P. syringae-2-dependent defence responses, including hypersensitive cell death, by cleaving the Arabidopsis RIN4 protein which is monitored by the cognate resistance protein RPS2 []. 
Probab=42.89  E-value=59  Score=28.88  Aligned_cols=39  Identities=26%  Similarity=0.429  Sum_probs=28.5

Q ss_pred             CHHHHHHHHHcCCCeEEEEEcCCCcccCCceeeCCCCCCCCCCCCeEEEEEEEeec
Q psy667          292 GSETMKKILYKYGPLSVLLNSDLIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQ  347 (392)
Q Consensus       292 ~~~~ik~~l~~~gPV~v~i~~~~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~  347 (392)
                      +.+.+...|.++||+-++....                 ......|+++|.|-..+
T Consensus        97 t~e~~~~LL~~yGPLwv~~~~P-----------------~~~~~~H~~ViTGI~~d  135 (166)
T PF12385_consen   97 TAEGLANLLREYGPLWVAWEAP-----------------GDSWVAHASVITGIDGD  135 (166)
T ss_pred             CHHHHHHHHHHcCCeEEEecCC-----------------CCcceeeEEEEEeecCC
Confidence            4678999999999999886431                 11234699999986643


No 32 
>smart00230 CysPc Calpain-like thiol protease family. Calpain-like thiol protease family (peptidase family C2). Calcium activated neutral protease (large subunit).
Probab=25.76  E-value=1.2e+02  Score=29.76  Aligned_cols=28  Identities=25%  Similarity=0.391  Sum_probs=22.7

Q ss_pred             CCCeEEEEEEEeecCCcc--EEEEEcCCCC
Q psy667          334 DLGHAVLLVGYGKQDNIP--YWLVRNSWGP  361 (392)
Q Consensus       334 ~~~Hav~iVGyg~~~g~~--ywiikNSWG~  361 (392)
                      ..+||=.|++...-++.+  -..+||-||.
T Consensus       226 v~~HaYsVl~v~~~~~~~~~Ll~lrNPWg~  255 (318)
T smart00230      226 VKGHAYSVTDVREVQGRRQELLRLRNPWGQ  255 (318)
T ss_pred             ccCccEEEEEEEEEecCCeEEEEEECCCCC
Confidence            568999999988655545  8999999993


No 33 
>PF01640 Peptidase_C10:  Peptidase C10 family classification.;  InterPro: IPR000200 In the MEROPS database peptidases and peptidase homologues are grouped into clans and families. Clans are groups of families for which there is evidence of common ancestry based on a common structural fold:  Each clan is identified with two letters, the first representing the catalytic type of the families included in the clan (with the letter 'P' being used for a clan containing families of more than one of the catalytic types serine, threonine and cysteine). Some families cannot yet be assigned to clans, and when a formal assignment is required, such a family is described as belonging to clan A-, C-, M-, N-, S-, T- or U-, according to the catalytic type. Some clans are divided into subclans because there is evidence of a very ancient divergence within the clan, for example MA(E), the gluzincins, and MA(M), the metzincins. Peptidase families are grouped by their catalytic type, the first character representing the catalytic type: A, aspartic; C, cysteine; G, glutamic acid; M, metallo; N, asparagine; S, serine; T, threonine; and U, unknown. The serine, threonine and cysteine peptidases utilise the amino acid as a nucleophile and form an acyl intermediate - these peptidases can also readily act as transferases. In the case of aspartic, glutamic and metallopeptidases, the nucleophile is an activated water molecule. In the case of the asparagine endopeptidases, the nucleophile is asparagine and all are self-processing endopeptidases.   In many instances the structural protein fold that characterises the clan or family may have lost its catalytic activity, yet retain its function in protein recognition and binding.  Cysteine peptidases have characteristic molecular topologies, which can be seen not only in their three-dimensional structures, but commonly also in the two-dimensional structures. These are peptidases in which the nucleophile is the sulphydryl group of a cysteine residue. Cysteine proteases are divided into clans (proteins which are evolutionary related), and further sub-divided into families, on the basis of the architecture of their catalytic dyad or triad [].  This group of cysteine peptidases belong to MEROPS peptidase family C10 (streptopain family, clan CA). Streptopain is a cysteine protease found in Streptococcus pyogenes that shows some structural and functional similarity to papain (family C1) [, ]. The order of the catalytic cysteine/histidine dyad is the same and the surrounding sequences are similar. The two proteins also show similar specificities, both preferring a hydrophobic residue at the P2 site [, ]. Streptopain shows a high degree of sequence similarity to the S. pyogenes exotoxin B, and strong similarity to the prtT gene product of Porphyromonas gingivalis (Bacteroides gingivalis), both of which have been included in the family [].; GO: 0008234 cysteine-type peptidase activity, 0006508 proteolysis; PDB: 4D8I_A 4D8E_A 4D8B_A 3BBA_B 3BB7_A 2JTC_A 1PVJ_A 1DKI_D 2UZJ_A.
Probab=23.58  E-value=2.8e+02  Score=24.99  Aligned_cols=51  Identities=27%  Similarity=0.496  Sum_probs=31.5

Q ss_pred             HHHHHHHHHcCCCeEEEEEcCCCcccCCceeeCCCCCCCCCCCCeEEEEEEEeecCCccEEEEEcCCCCCCC--CCcEEE
Q psy667          293 SETMKKILYKYGPLSVLLNSDLIHDYNGTPIRKNDETCSPYDLGHAVLLVGYGKQDNIPYWLVRNSWGPIGP--DEGFFK  370 (392)
Q Consensus       293 ~~~ik~~l~~~gPV~v~i~~~~f~~y~~Giy~~~~~~c~~~~~~Hav~iVGyg~~~g~~ywiikNSWG~~WG--~~GY~~  370 (392)
                      .+.|+..|.++.||...-..            .        ..+||.+|=||..   ..||-+  -||  ||  .+||++
T Consensus       140 ~~~i~~el~~~rPV~~~g~~------------~--------~~GHawViDGy~~---~~~~H~--NwG--W~G~~nGyy~  192 (192)
T PF01640_consen  140 MDMIRNELDNGRPVLYSGNS------------K--------SGGHAWVIDGYDS---DGYFHC--NWG--WGGSSNGYYR  192 (192)
T ss_dssp             HHHHHHHHHTT--EEEEEEE------------T--------TEEEEEEEEEEES---SSEEEE--E-S--STTTT-EEEE
T ss_pred             HHHHHHHHHcCCCEEEEEec------------C--------CCCeEEEEcCccC---CCeEEE--eeC--ccCCCCCccC
Confidence            35788999989999854321            1        1289999999964   346654  455  44  579985


Done!