Query         015469
Match_columns 406
No_of_seqs    335 out of 2938
Neff          8.8 
Searched_HMMs 46136
Date          Fri Mar 29 06:36:24 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/015469.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/015469hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 PLN00049 carboxyl-terminal pro 100.0 1.4E-71   3E-76  545.3  45.0  388   18-405     2-389 (389)
  2 COG0793 Prc Periplasmic protea 100.0 1.5E-60 3.3E-65  465.7  36.6  358   26-401    32-391 (406)
  3 PRK11186 carboxy-terminal prot 100.0 1.6E-57 3.5E-62  464.1  40.7  352   13-379   150-529 (667)
  4 TIGR00225 prc C-terminal pepti 100.0 1.2E-54 2.7E-59  419.1  39.0  307   60-379    10-318 (334)
  5 cd07562 Peptidase_S41_TRI Tric 100.0   7E-42 1.5E-46  320.2  20.0  260   20-400     1-263 (266)
  6 cd06567 Peptidase_S41 C-termin 100.0 6.8E-40 1.5E-44  299.9  25.8  221   25-375     1-224 (224)
  7 cd07563 Peptidase_S41_IRBP Int 100.0 2.9E-39 6.3E-44  300.2  24.2  234   24-386     1-248 (250)
  8 smart00245 TSPc tail specific  100.0   5E-37 1.1E-41  273.5  23.7  189  180-375     3-192 (192)
  9 cd07560 Peptidase_S41_CPP C-te 100.0 1.6E-35 3.4E-40  266.7  21.3  162  212-375    50-211 (211)
 10 cd07561 Peptidase_S41_CPP_like 100.0 1.9E-33 4.2E-38  259.9  21.2  170  209-378    63-245 (256)
 11 PF03572 Peptidase_S41:  Peptid 100.0 2.1E-32 4.7E-37  239.2  16.8  164  211-374     1-169 (169)
 12 PF14684 Tricorn_C1:  Tricorn p  99.4 5.8E-14 1.3E-18  103.2   3.8   67   19-85      2-69  (70)
 13 PF13180 PDZ_2:  PDZ domain; PD  99.4 1.1E-11 2.3E-16   94.6  11.4   79  102-186     2-81  (82)
 14 cd00988 PDZ_CTP_protease PDZ d  99.3 1.1E-10 2.3E-15   89.6  12.2   81  101-187     2-83  (85)
 15 cd00991 PDZ_archaeal_metallopr  99.0 2.4E-09 5.1E-14   81.0  10.0   68  117-186     9-77  (79)
 16 cd00989 PDZ_metalloprotease PD  99.0   2E-09 4.3E-14   81.3   9.5   76  103-186     3-78  (79)
 17 cd00136 PDZ PDZ domain, also c  99.0 3.2E-09   7E-14   78.1   8.7   68  102-174     2-69  (70)
 18 cd00990 PDZ_glycyl_aminopeptid  98.9 7.8E-09 1.7E-13   78.2   9.9   67  117-187    11-77  (80)
 19 cd00986 PDZ_LON_protease PDZ d  98.9 1.8E-08 3.9E-13   76.1   9.7   69  118-189     8-77  (79)
 20 PF00595 PDZ:  PDZ domain (Also  98.8 1.3E-08 2.9E-13   77.2   7.2   72  101-175    10-81  (81)
 21 cd00987 PDZ_serine_protease PD  98.7   7E-08 1.5E-12   74.6   8.5   66  117-184    23-89  (90)
 22 COG3975 Predicted protease wit  98.6 8.2E-08 1.8E-12   94.1   7.8  159    6-186   362-521 (558)
 23 smart00228 PDZ Domain present   98.6 4.7E-07   1E-11   69.0   9.4   74  101-178    12-85  (85)
 24 PF14685 Tricorn_PDZ:  Tricorn   98.6 4.1E-07   9E-12   69.4   8.7   74  103-184     3-87  (88)
 25 cd00992 PDZ_signaling PDZ doma  98.5 4.2E-07 9.1E-12   68.9   8.2   70  101-174    12-81  (82)
 26 TIGR00054 RIP metalloprotease   98.5 4.3E-07 9.3E-12   90.6   9.2   68  119-188   204-271 (420)
 27 PRK10139 serine endoprotease;   98.5 7.3E-07 1.6E-11   89.6   9.7   69  117-187   289-358 (455)
 28 PRK10898 serine endoprotease;   98.4 1.2E-06 2.5E-11   85.5  10.1   69  118-188   279-348 (353)
 29 TIGR02038 protease_degS peripl  98.4 9.5E-07 2.1E-11   86.1   9.3   69  118-188   278-347 (351)
 30 TIGR01713 typeII_sec_gspC gene  98.4 1.2E-06 2.6E-11   81.3   9.2   68  117-186   190-258 (259)
 31 PRK10779 zinc metallopeptidase  98.4 9.6E-07 2.1E-11   89.0   9.2   68  119-188   222-289 (449)
 32 TIGR02037 degP_htrA_DO peripla  98.3 2.1E-06 4.5E-11   86.2   9.4   69  118-188   257-326 (428)
 33 PRK10779 zinc metallopeptidase  98.3 1.7E-06 3.7E-11   87.2   7.4   67  119-187   127-194 (449)
 34 PRK10942 serine endoprotease;   98.3 3.4E-06 7.5E-11   85.2   9.5   69  117-187   310-379 (473)
 35 TIGR02860 spore_IV_B stage IV   98.2 9.7E-06 2.1E-10   78.9  10.8   69  118-188   105-181 (402)
 36 PRK10139 serine endoprotease;   98.2 5.4E-06 1.2E-10   83.5   8.9   65  118-185   390-454 (455)
 37 TIGR02037 degP_htrA_DO peripla  98.1   7E-06 1.5E-10   82.4   8.7   65  118-184   362-427 (428)
 38 PF04495 GRASP55_65:  GRASP55/6  98.1 1.2E-05 2.6E-10   67.1   8.3   86  101-188    26-114 (138)
 39 TIGR03279 cyano_FeS_chp putati  98.1 6.3E-06 1.4E-10   80.8   7.4   62  122-188     2-64  (433)
 40 PRK10942 serine endoprotease;   98.1 1.3E-05 2.8E-10   81.1   8.8   65  118-185   408-472 (473)
 41 KOG3129 26S proteasome regulat  98.0 2.8E-05   6E-10   67.6   7.5   73  119-191   140-213 (231)
 42 KOG3209 WW domain-containing p  97.9 2.8E-05   6E-10   78.6   6.7   73  100-177   764-837 (984)
 43 KOG3553 Tax interaction protei  97.8   2E-05 4.4E-10   59.9   3.3   47  117-163    58-104 (124)
 44 TIGR00054 RIP metalloprotease   97.8 3.3E-05 7.2E-10   77.1   5.9   63  119-184   129-191 (420)
 45 COG0265 DegQ Trypsin-like seri  97.6 0.00026 5.6E-09   69.1   9.7   70  117-188   269-339 (347)
 46 KOG3550 Receptor targeting pro  97.6 0.00024 5.3E-09   58.4   6.6   71  101-175   101-172 (207)
 47 COG3480 SdrC Predicted secrete  97.2  0.0021 4.5E-08   59.9   9.1   66  119-187   131-198 (342)
 48 KOG3209 WW domain-containing p  97.1  0.0015 3.3E-08   66.5   8.0   77   99-176   353-431 (984)
 49 PRK09681 putative type II secr  97.0   0.005 1.1E-07   57.2  10.0   54  131-186   220-274 (276)
 50 KOG1421 Predicted signaling-as  97.0  0.0025 5.5E-08   64.7   8.1   69  117-188   302-370 (955)
 51 KOG3580 Tight junction protein  96.7  0.0026 5.6E-08   63.6   5.7   57  119-175   430-487 (1027)
 52 KOG3549 Syntrophins (type gamm  96.4  0.0063 1.4E-07   57.1   5.5   73   99-175    64-137 (505)
 53 KOG3542 cAMP-regulated guanine  96.3  0.0042 9.2E-08   62.9   4.2   57  117-175   561-617 (1283)
 54 KOG3552 FERM domain protein FR  96.3  0.0058 1.3E-07   64.0   5.2   67   99-176    65-131 (1298)
 55 KOG3651 Protein kinase C, alph  96.1   0.011 2.4E-07   54.5   5.7   56  119-175    31-87  (429)
 56 KOG1892 Actin filament-binding  95.9    0.02 4.3E-07   60.4   6.9   58  119-177   961-1019(1629)
 57 KOG1320 Serine protease [Postt  95.8   0.031 6.7E-07   55.7   7.8   68  119-188   399-467 (473)
 58 cd07021 Clp_protease_NfeD_like  95.8   0.058 1.3E-06   47.2   8.7   69  223-318    13-81  (178)
 59 KOG3532 Predicted protein kina  95.8   0.027 5.8E-07   57.4   7.2   65  101-172   386-450 (1051)
 60 KOG3580 Tight junction protein  95.7   0.025 5.5E-07   56.8   6.8   57  119-177    41-97  (1027)
 61 COG3031 PulC Type II secretory  95.7   0.027 5.8E-07   50.5   5.9   59  125-185   214-273 (275)
 62 KOG3571 Dishevelled 3 and rela  95.3   0.036 7.8E-07   54.7   6.2   62  115-176   274-338 (626)
 63 KOG3551 Syntrophins (type beta  95.0   0.025 5.5E-07   53.9   3.8   71  100-174    95-166 (506)
 64 KOG3605 Beta amyloid precursor  94.6   0.041 8.9E-07   55.9   4.5   70  119-188   674-745 (829)
 65 KOG0609 Calcium/calmodulin-dep  94.2     0.1 2.2E-06   52.3   6.2   69  102-176   135-204 (542)
 66 KOG3606 Cell polarity protein   94.2    0.11 2.4E-06   47.4   5.9   59  118-177   194-253 (358)
 67 KOG3834 Golgi reassembly stack  94.2    0.16 3.5E-06   49.4   7.3   82  103-187    94-179 (462)
 68 KOG0606 Microtubule-associated  94.1   0.071 1.5E-06   57.6   5.1   54  120-174   660-713 (1205)
 69 PF12812 PDZ_1:  PDZ-like domai  93.1    0.22 4.8E-06   37.2   4.9   42  120-163    32-73  (78)
 70 cd07020 Clp_protease_NfeD_1 No  92.9    0.81 1.8E-05   40.4   9.2   70  223-319    13-85  (187)
 71 COG0750 Predicted membrane-ass  92.7    0.44 9.6E-06   46.8   8.0   58  121-180   132-193 (375)
 72 KOG3605 Beta amyloid precursor  90.5    0.22 4.7E-06   50.9   3.0   48  121-168   759-806 (829)
 73 cd07015 Clp_protease_NfeD Nodu  89.1     2.9 6.2E-05   36.4   8.6   70  223-319    13-85  (172)
 74 KOG1738 Membrane-associated gu  88.8    0.68 1.5E-05   47.3   5.1   60  101-165   213-273 (638)
 75 cd00394 Clp_protease_like Case  88.4     2.1 4.6E-05   36.5   7.4   69  223-318    11-80  (161)
 76 KOG3834 Golgi reassembly stack  87.1     1.3 2.8E-05   43.3   5.7   68  118-187    15-85  (462)
 77 TIGR00706 SppA_dom signal pept  84.8     6.7 0.00015   35.1   8.9   70  224-318    14-84  (207)
 78 KOG3938 RGS-GAIP interacting p  83.0     2.2 4.7E-05   39.1   4.8   68  102-174   138-207 (334)
 79 cd07016 S14_ClpP_1 Caseinolyti  82.1     4.4 9.5E-05   34.5   6.3   66  224-318    16-81  (160)
 80 KOG2921 Intramembrane metallop  81.8       2 4.4E-05   41.6   4.3   46  117-164   219-265 (484)
 81 PRK14512 ATP-dependent Clp pro  80.7     9.8 0.00021   33.8   8.2   82  210-319    23-105 (197)
 82 PF11874 DUF3394:  Domain of un  78.5     3.4 7.4E-05   36.1   4.4   38  103-146   113-150 (183)
 83 COG1030 NfeD Membrane-bound se  76.5      16 0.00036   36.3   8.9   60  210-270    26-86  (436)
 84 cd07014 S49_SppA Signal peptid  76.1      16 0.00034   31.7   8.1   71  224-318    23-94  (177)
 85 COG0616 SppA Periplasmic serin  75.7      14  0.0003   35.6   8.2   80  225-334    82-162 (317)
 86 PF01972 SDH_sah:  Serine dehyd  74.9      15 0.00033   34.2   7.7   72  225-329    77-148 (285)
 87 cd07013 S14_ClpP Caseinolytic   73.5      14  0.0003   31.7   6.9   70  222-318    11-81  (162)
 88 cd07023 S49_Sppa_N_C Signal pe  73.3      22 0.00048   31.7   8.5   80  223-331    17-97  (208)
 89 PRK12553 ATP-dependent Clp pro  68.0      20 0.00044   32.1   7.0   70  222-318    46-116 (207)
 90 cd07022 S49_Sppa_36K_type Sign  67.6      54  0.0012   29.4   9.7   80  223-332    25-105 (214)
 91 KOG1421 Predicted signaling-as  67.3      20 0.00043   37.6   7.3   69  117-188   861-931 (955)
 92 cd07017 S14_ClpP_2 Caseinolyti  65.8      27 0.00058   30.2   7.1   68  223-317    21-89  (171)
 93 cd07019 S49_SppA_1 Signal pept  64.7      44 0.00096   29.9   8.6   70  224-317    22-92  (211)
 94 PF00574 CLP_protease:  Clp pro  59.6      17 0.00037   31.6   4.8   82  211-320    17-99  (182)
 95 TIGR00705 SppA_67K signal pept  47.8   2E+02  0.0043   30.3  11.1   96  209-333   307-411 (584)
 96 TIGR00493 clpP ATP-dependent C  47.4      86  0.0019   27.6   7.3   67  224-317    39-106 (191)
 97 PRK00277 clpP ATP-dependent Cl  46.9      86  0.0019   27.8   7.2   68  222-316    42-110 (200)
 98 cd07041 STAS_RsbR_RsbS_like Su  45.0      46   0.001   25.9   4.8   44  211-254    10-55  (109)
 99 COG5233 GRH1 Peripheral Golgi   44.7      14  0.0003   35.0   1.8   35  117-151    62-96  (417)
100 PRK10949 protease 4; Provision  44.1 1.2E+02  0.0026   32.1   8.8   97  209-334   325-430 (618)
101 PRK12551 ATP-dependent Clp pro  43.6      87  0.0019   27.8   6.7   80  210-317    25-105 (196)
102 cd07043 STAS_anti-anti-sigma_f  41.2   1E+02  0.0022   23.0   6.1   51  211-261     8-59  (99)
103 PRK11778 putative inner membra  37.7 2.8E+02  0.0062   26.8   9.6   98  210-336    90-190 (330)
104 PF04343 DUF488:  Protein of un  35.4      45 0.00098   26.9   3.3   29  228-257     2-34  (122)
105 PRK14513 ATP-dependent Clp pro  35.1 2.3E+02   0.005   25.3   8.0   80  210-317    27-107 (201)
106 PF01740 STAS:  STAS domain;  I  34.7 1.2E+02  0.0025   23.8   5.6   47  211-257     9-65  (117)
107 KOG4407 Predicted Rho GTPase-a  33.8      24 0.00053   39.7   1.8   46  118-163   143-188 (1973)
108 PRK14514 ATP-dependent Clp pro  33.0 1.7E+02  0.0036   26.6   6.8   80  211-318    55-135 (221)
109 TIGR02886 spore_II_AA anti-sig  33.0 1.1E+02  0.0023   23.6   5.1   46  211-256     8-55  (106)
110 COG4702 Uncharacterized conser  32.2      49  0.0011   27.9   3.0   36  215-250    21-56  (168)
111 cd00466 DHQase_II Dehydroquina  30.8      67  0.0014   26.8   3.5   49  216-269    43-91  (140)
112 TIGR00377 ant_ant_sig anti-ant  29.4 1.6E+02  0.0036   22.5   5.6   46  211-256    12-59  (108)
113 KOG4371 Membrane-associated pr  28.3      57  0.0012   36.1   3.4   72  100-176  1256-1328(1332)
114 cd06844 STAS Sulphate Transpor  28.0 1.3E+02  0.0028   22.9   4.7   44  211-254     8-53  (100)
115 cd07560 Peptidase_S41_CPP C-te  27.8 1.1E+02  0.0023   27.5   4.7   43   24-86      7-49  (211)
116 TIGR01088 aroQ 3-dehydroquinat  27.5      86  0.0019   26.2   3.6   49  216-269    43-91  (141)
117 PRK06688 enoyl-CoA hydratase;   27.5      71  0.0015   29.4   3.7   99  210-317    13-118 (259)
118 cd07042 STAS_SulP_like_sulfate  26.4 2.8E+02  0.0061   20.8   6.6   47  209-255     7-56  (107)
119 PRK05395 3-dehydroquinate dehy  25.8      90  0.0019   26.3   3.5   49  216-269    45-93  (146)
120 PRK13015 3-dehydroquinate dehy  24.6      96  0.0021   26.1   3.4   49  216-269    45-93  (146)
121 PF01220 DHquinase_II:  Dehydro  24.3      82  0.0018   26.3   3.0   49  216-269    44-92  (140)
122 PF13200 DUF4015:  Putative gly  23.4 1.1E+02  0.0024   29.4   4.2   36  218-253     5-40  (316)
123 COG4100 Cystathionine beta-lya  22.6 1.4E+02  0.0031   28.4   4.5   23  135-159   103-125 (416)
124 CHL00028 clpP ATP-dependent Cl  22.5   3E+02  0.0065   24.5   6.5   80  210-317    30-110 (200)
125 PF08090 Enterotoxin_HS1:  Heat  21.8      35 0.00077   20.3   0.3   12  386-397     2-13  (36)
126 TIGR03000 plancto_dom_1 Planct  20.7 2.3E+02  0.0049   20.9   4.3   42  322-363    14-57  (75)
127 TIGR03121 one_C_dehyd_A formyl  20.3      99  0.0021   32.2   3.3   73  305-378   282-356 (556)

No 1  
>PLN00049 carboxyl-terminal processing protease; Provisional
Probab=100.00  E-value=1.4e-71  Score=545.28  Aligned_cols=388  Identities=80%  Similarity=1.272  Sum_probs=343.6

Q ss_pred             cchhhHHHHHHHHHHHHhccccccCCcchHHHHHhhhhcCCCCCHHHHHHHHHHHHHhCCCCCCCccChhhhccccccCc
Q 015469           18 LSEENRLFLEAWRTIDRAYVDKTFNGQSWFRYRENALRNEPMNTREETYMAIRKMLATLDDPFTRFLEPEKFNSLRSGTQ   97 (406)
Q Consensus        18 ~~~~~~~f~~~w~~i~~~y~~~~~~~~dW~~~~~~~~~~~~~~~~~~~~~~i~~~~~~L~D~ht~~~~~~~~~~~~~~~~   97 (406)
                      .++++++|+++|++++++|||++++++||++++++|++...+++..+++.++..|+++|+|||+.|++++++..+.....
T Consensus         2 ~~~~~~~f~e~w~~v~~~~~d~~~~g~dW~~~~e~y~~~~~~~~~~~~~~~i~~ml~~L~D~hs~y~~~~~~~~~~~~~~   81 (389)
T PLN00049          2 LTEENLLFLEAWRTVDRAYVDKTFNGQSWFRYRENALKNEPMNTREETYAAIRKMLATLDDPFTRFLEPEKFKSLRSGTK   81 (389)
T ss_pred             CccHHHHHHHHHHHHHHHHcCccccccCHHHHHHHHhhccCCCcHHHHHHHHHHHHhhCCCCcccCcCHHHHHHHHHhcc
Confidence            46789999999999999999999999999999999998777788899999999999999999999999999887766667


Q ss_pred             ceeeeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeC
Q 015469           98 GALTGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSG  177 (406)
Q Consensus        98 ~~~~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~  177 (406)
                      +.+.|+|+.+...........+++|..|.++|||+++||++||+|++|||+++.++...++..++++..|+++.++|.|+
T Consensus        82 ~~~~GiG~~~~~~~~~~~~~~g~~V~~V~~~SPA~~aGl~~GD~Iv~InG~~v~~~~~~~~~~~l~g~~g~~v~ltv~r~  161 (389)
T PLN00049         82 GAVTGVGLEVGYPTGSDGPPAGLVVVAPAPGGPAARAGIRPGDVILAIDGTSTEGLSLYEAADRLQGPEGSSVELTLRRG  161 (389)
T ss_pred             CCceEEEEEEEEccCCCCccCcEEEEEeCCCChHHHcCCCCCCEEEEECCEECCCCCHHHHHHHHhcCCCCEEEEEEEEC
Confidence            88899999987642110011278999999999999999999999999999999988777888888888899999999999


Q ss_pred             CeeEEEEEEeeccccCceeeeeeecCCCCCCCCceEEEEcCccccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHH
Q 015469          178 AEIRHLALTREKVSLNPVKSRLCVVPGPGKSSPRIGYIKLTSFNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPE  257 (406)
Q Consensus       178 g~~~~~~v~~~~~~~~~v~~~~~~~~~~~~~~~~igyl~i~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~  257 (406)
                      ++..++++++..+..+|+.............+++||||+|++|.....+++.+++++++++++++||||||+|+||.+..
T Consensus       162 g~~~~~~l~r~~v~~~~v~~~~~~~~~~~~~~~~IgYi~i~~F~~~~~~~~~~~l~~l~~~~~~glIlDLR~N~GG~~~~  241 (389)
T PLN00049        162 PETRLVTLTREKVSLNPVKSRLCEVPGPGAGSPKIGYIKLTTFNQNASSAVKEAIETLRANGVDAFVLDLRDNSGGLFPA  241 (389)
T ss_pred             CEEEEEEEEeeeEeccceeeEEEeeccccCCCCCEEEEEeccccchhHHHHHHHHHHHHHCCCCEEEEEcCCCCCCCHHH
Confidence            99999999999888888877655321111234689999999999888899999999999889999999999999999999


Q ss_pred             HHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEEcCCCccHHHHHHHHHhcCCCeEEEcccCCCCceee
Q 015469          258 GIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLVNKGTASASEILAGALKDNKRAVLFGEPTYGKGKIQ  337 (406)
Q Consensus       258 ~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~~~~~  337 (406)
                      +..++++|++++.+++...+++....+...+.....+.+|++||||+.||||||+|+.+||+++++++||++|+|++..+
T Consensus       242 a~~ia~~f~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~PvvVLvn~~TaSasEi~a~alk~~~~~~vvG~~T~Gkg~~q  321 (389)
T PLN00049        242 GIEIAKLWLDKGVIVYIADSRGVRDIYDADGSSAIATSEPLAVLVNKGTASASEILAGALKDNKRAVVLGEPTFGKGLIQ  321 (389)
T ss_pred             HHHHHHHhcCCCcEEEEecCCCceeEEecCCCccccCCCCEEEEECCCCccHHHHHHHHHhhCCCeEEEecCCcCCcccc
Confidence            99999999999987776655565555554433334578999999999999999999999999999999999999999999


Q ss_pred             eEEECCCCCeEEEEEeEEEcCCCCccCCCCcccCeecCCCCCCCcchhhhhcccccchhhcccccccc
Q 015469          338 SVFQLSDGSGLAVTVARYETPAHTDIDKVGVIPDHPLPKTFPKDEDGFCGCLQDSASTCNMNGGQLFA  405 (406)
Q Consensus       338 ~~~~L~~g~~~~~~~~~~~~~~g~~~e~~Gv~PDi~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  405 (406)
                      ..+.|+||+.+++|++++++|+|+.+|+.||+||++||..+...++.+|+|+.|+.++|-.++-|+|.
T Consensus       322 ~~~~L~dG~~l~lt~~~~~~p~G~~ie~~Gi~PDi~v~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  389 (389)
T PLN00049        322 SVFELSDGSGLAVTVARYQTPAGTDIDKVGITPDHPLPESLPKDEEAFCGCLADPAAACYLNAPQLFS  389 (389)
T ss_pred             eeEEeCCCCEEEEEEEEEECCCCCCcCCCCcCCCeECCCCCCcchHHHHHHhhcchhhcccchhhhcC
Confidence            99999999999999999999999999999999999999999999999999999999999999999873


No 2  
>COG0793 Prc Periplasmic protease [Cell envelope biogenesis, outer membrane]
Probab=100.00  E-value=1.5e-60  Score=465.70  Aligned_cols=358  Identities=34%  Similarity=0.567  Sum_probs=304.3

Q ss_pred             HHHHHHHHHhccccccCCcchHHHHHhhhhcCCCCCHHHHHHHHHHHHHhCCCCCCCccChhhhccccccCcceeeeeEE
Q 015469           26 LEAWRTIDRAYVDKTFNGQSWFRYRENALRNEPMNTREETYMAIRKMLATLDDPFTRFLEPEKFNSLRSGTQGALTGVGL  105 (406)
Q Consensus        26 ~~~w~~i~~~y~~~~~~~~dW~~~~~~~~~~~~~~~~~~~~~~i~~~~~~L~D~ht~~~~~~~~~~~~~~~~~~~~g~g~  105 (406)
                      +..|+.....+.+..++.     ++++|..  ...+...++.++..|++.|.|||+.|+.|+++..+.....+++.|+|+
T Consensus        32 ~~~~~~~~~~~~~~~~~~-----i~~~y~~--~~~~~~l~~~ai~g~ls~l~Dp~s~y~~~e~~~~~~~~~~~~~~GiG~  104 (406)
T COG0793          32 DAVLRLVALDKLDDKYEG-----IREEYVT--RVDSDKLFEGAIEGMLSSLGDPHSTYLDPEDAAEFRTDTSGEFGGIGI  104 (406)
T ss_pred             hhhhHHHHHHHHHHHHHh-----hHHHHcc--CccHHHHHHHHHHHHHHhcCCCcccccCHHHHHHhhhhccccccceeE
Confidence            455555555554444433     3333322  244557788999999999999999999999999999888999999999


Q ss_pred             EEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeC--CeeEEE
Q 015469          106 SIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSG--AEIRHL  183 (406)
Q Consensus       106 ~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~--g~~~~~  183 (406)
                      .+....     .+.+.|.++.+++||+++||++||.|++|||+++.....++++..++++.|++++|++.|.  ++..++
T Consensus       105 ~i~~~~-----~~~~~V~s~~~~~PA~kagi~~GD~I~~IdG~~~~~~~~~~av~~irG~~Gt~V~L~i~r~~~~k~~~v  179 (406)
T COG0793         105 ELQMED-----IGGVKVVSPIDGSPAAKAGIKPGDVIIKIDGKSVGGVSLDEAVKLIRGKPGTKVTLTILRAGGGKPFTV  179 (406)
T ss_pred             EEEEec-----CCCcEEEecCCCChHHHcCCCCCCEEEEECCEEccCCCHHHHHHHhCCCCCCeEEEEEEEcCCCceeEE
Confidence            998752     2789999999999999999999999999999999998888899999999999999999985  668899


Q ss_pred             EEEeeccccCceeeeeeecCCCCCCCCceEEEEcCccccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHH
Q 015469          184 ALTREKVSLNPVKSRLCVVPGPGKSSPRIGYIKLTSFNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAK  263 (406)
Q Consensus       184 ~v~~~~~~~~~v~~~~~~~~~~~~~~~~igyl~i~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~  263 (406)
                      ++.|+.+.+.++.+.....   ...+++||||||++|+....++++.++.+|+++++++||||||+|+||.+.++..++.
T Consensus       180 ~l~Re~i~l~~v~~~~~~~---~~~~~~IGyI~I~~F~~~~~~~~~~al~~L~~~~~~GlIlDLR~N~GG~L~~av~i~~  256 (406)
T COG0793         180 TLTREEIELEDVAAKEKVE---EGGKGRIGYIRIPSFGEGTYEDLEKALDELKKQGAKGLILDLRNNPGGLLSQAVKLAG  256 (406)
T ss_pred             EEEEEEEeccceeeeeeee---cCCCceEEEEEecccccchHHHHHHHHHHHHhcCCcEEEEEeCCCCCccHHHHHHHHH
Confidence            9999999998887763211   1233469999999999999999999999999999999999999999999999999999


Q ss_pred             hhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEEcCCCccHHHHHHHHHhcCCCeEEEcccCCCCceeeeEEECC
Q 015469          264 IWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLVNKGTASASEILAGALKDNKRAVLFGEPTYGKGKIQSVFQLS  343 (406)
Q Consensus       264 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~~~~~~~~~L~  343 (406)
                      +|++++++++++.|.|....+.... ....+++|++||||++||||+|+||.+||++++++|||++|+|++++|..++|+
T Consensus       257 ~f~~~g~iv~~~~r~g~~~~~~~~~-~~~~~~~PlvvLvn~~SASAsEI~agalqd~~ra~lVG~~TfGkg~vQ~~~~L~  335 (406)
T COG0793         257 LFLPSGPIVSTRGRNGKVNVYFSAS-GEALYDGPLVVLVNEGSASASEIFAGALQDYGRATLVGETTFGKGTVQTLRPLS  335 (406)
T ss_pred             cccCCCcEEEEecCCCceeeccccc-cccCCCCCEEEEECCCCccHHHHHHHHHHHcCCcEEEecccccceEEEeeEEcC
Confidence            9999999999999888765544322 223689999999999999999999999999999999999999999999999999


Q ss_pred             CCCeEEEEEeEEEcCCCCccCCCCcccCeecCCCCCCCcchhhhhcccccchhhcccc
Q 015469          344 DGSGLAVTVARYETPAHTDIDKVGVIPDHPLPKTFPKDEDGFCGCLQDSASTCNMNGG  401 (406)
Q Consensus       344 ~g~~~~~~~~~~~~~~g~~~e~~Gv~PDi~v~~~~~~~~~~~~~~~~~~~~~~~~~~~  401 (406)
                      +|+.+.+|.++||+|+|+.+|++||+|||+|+.+..  ...-....+|+-.+|++...
T Consensus       336 dg~~lklT~a~yytp~G~~i~~~GI~PDI~v~~~~~--~~~e~~~~~~~~~~~~~~~~  391 (406)
T COG0793         336 DGSALKLTIAKYYTPSGRSIEGKGITPDIEVPQADD--EPGEYAAGRDPQLEAALEAL  391 (406)
T ss_pred             CCCeEEEEEEEEECCCCccccccCcCCCEeccCCcc--cchhhhcccchHhhhhhhhh
Confidence            999999999999999999999999999999998864  22233446677777777653


No 3  
>PRK11186 carboxy-terminal protease; Provisional
Probab=100.00  E-value=1.6e-57  Score=464.09  Aligned_cols=352  Identities=25%  Similarity=0.458  Sum_probs=294.6

Q ss_pred             CCCcccchhhHHHHHHHH-HHHHhccccccCCcchHHHHH----hhhh----cCCCCCHHHHHHHHHHHHHhCCCCCCCc
Q 015469           13 TPSLALSEENRLFLEAWR-TIDRAYVDKTFNGQSWFRYRE----NALR----NEPMNTREETYMAIRKMLATLDDPFTRF   83 (406)
Q Consensus        13 ~~~~~~~~~~~~f~~~w~-~i~~~y~~~~~~~~dW~~~~~----~~~~----~~~~~~~~~~~~~i~~~~~~L~D~ht~~   83 (406)
                      ..+|+.++.  .++++|+ .+++.|.+..+++.+|+++++    +|..    ....+..+-|..++..|++.+ |||+.|
T Consensus       150 ~~~w~~~~~--el~~~W~k~vk~~~l~~~~~g~~w~~i~~~l~krY~~~l~~~~~~~~~d~~~~~i~~m~~~l-DphT~Y  226 (667)
T PRK11186        150 KAPWPKDEA--ELNELWDQRVKYDALNLKLTGKTWPEIKETLTKRYNFAIKRLTQTNSEDVFQLAMNAFAREI-DPHTSY  226 (667)
T ss_pred             cCCCcCCHH--HHHHHHHHHHHHHHhhhhhcCCCHHHHHHHHHHHHHHHHhhhccCCHHHHHHHHHHHHHhCC-CCCccc
Confidence            346776544  4599999 699999999999999988774    3432    123333344777888888888 999999


Q ss_pred             cChhhhccccccCcceeeeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhc-CCCCCCEEEEEC--CE---ecCCCCHHH
Q 015469           84 LEPEKFNSLRSGTQGALTGVGLSIGYPTASDGSSAGLVVISSMPGGPANRA-GILSGDVILAID--DT---STESMGIYD  157 (406)
Q Consensus        84 ~~~~~~~~~~~~~~~~~~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~a-Gl~~GD~I~~In--g~---~v~~~~~~~  157 (406)
                      ++|++++.+.....+.+.|+|+.+...      ++.++|..|++||||+++ ||++||+|++||  |.   ++.++..++
T Consensus       227 ~sp~e~e~f~~~~~~~~~GIGa~l~~~------~~~~~V~~vipGsPA~ka~gLk~GD~IlaVn~~g~~~~dv~g~~~~~  300 (667)
T PRK11186        227 LSPRNAEQFNTEMNLSLEGIGAVLQMD------DDYTVINSLVAGGPAAKSKKLSVGDKIVGVGQDGKPIVDVIGWRLDD  300 (667)
T ss_pred             cChHHHHHhhhccCCceeEEEEEEEEe------CCeEEEEEccCCChHHHhCCCCCCCEEEEECCCCCcccccccCCHHH
Confidence            999999888777788899999999765      567999999999999998 999999999999  44   455677789


Q ss_pred             HHHHhCCCCCCcEEEEEEe---CCeeEEEEEEeeccccC--ceeeeeeecCCCCCCCCceEEEEcCccccchHHHHHHHH
Q 015469          158 AAERLQGPEGSPVELTVRS---GAEIRHLALTREKVSLN--PVKSRLCVVPGPGKSSPRIGYIKLTSFNQNASGAVREAI  232 (406)
Q Consensus       158 ~~~~l~~~~g~~v~l~v~r---~g~~~~~~v~~~~~~~~--~v~~~~~~~~~~~~~~~~igyl~i~~f~~~~~~~~~~~~  232 (406)
                      +..+++|+.|++|+|+|.|   +++..+++++|..+..+  ++...+..     ..+++||||+|++|..+..+++.+++
T Consensus       301 vv~lirG~~Gt~V~LtV~r~~~~~~~~~vtl~R~~i~l~~~~~k~~v~~-----~~~~kIGYI~I~sF~~~~~~d~~~~l  375 (667)
T PRK11186        301 VVALIKGPKGSKVRLEILPAGKGTKTRIVTLTRDKIRLEDRAVKMSVKT-----VGGEKVGVLDIPGFYVGLTDDVKKQL  375 (667)
T ss_pred             HHHHhcCCCCCEEEEEEEeCCCCCceEEEEEEeeeecccccceEEEEEe-----cCCCcEEEEEecccccchHHHHHHHH
Confidence            9999999999999999987   35678899999887653  34444443     23568999999999988889999999


Q ss_pred             HHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEEcCCCccHHHH
Q 015469          233 DTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLVNKGTASASEI  312 (406)
Q Consensus       233 ~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLvd~~t~SaaE~  312 (406)
                      .+++++++++||||||+|+||++..+..++++|++++++++.+.+.|....+. .......|.+|++||||++||||||+
T Consensus       376 ~~l~~~~v~gLIlDLR~NgGG~l~~a~~la~lFi~~g~vv~~~~~~g~~~~~~-~~~~~~~~~gPlvVLVN~~SASASEI  454 (667)
T PRK11186        376 QKLEKQNVSGIIIDLRGNGGGALTEAVSLSGLFIPSGPVVQVRDNNGRVRVDS-DTDGVVYYKGPLVVLVDRYSASASEI  454 (667)
T ss_pred             HHHHHCCCCEEEEEcCCCCCCcHHHHHHHHHHHhcCCceEEEecCCCceeccc-cCCcccccCCCEEEEeCCCCccHHHH
Confidence            99999999999999999999999999999999999998888777666543332 12234578999999999999999999


Q ss_pred             HHHHHhcCCCeEEEcccCCCCceeeeEEECCC--------CCeEEEEEeEEEcCCCCccCCCCcccCeecCCCCC
Q 015469          313 LAGALKDNKRAVLFGEPTYGKGKIQSVFQLSD--------GSGLAVTVARYETPAHTDIDKVGVIPDHPLPKTFP  379 (406)
Q Consensus       313 ~a~~lk~~~~~~ivG~~T~G~~~~~~~~~L~~--------g~~~~~~~~~~~~~~g~~~e~~Gv~PDi~v~~~~~  379 (406)
                      ||++||++++|+|||++|+|+|.+|..++|++        +..+.+|++++++|+|..+++.||+|||.||..++
T Consensus       455 fA~alqd~~ra~vVG~~T~GKGtvQ~~~~L~~~~~~~~~~~G~lk~Tiak~y~p~G~s~q~~GV~PDi~vp~~~~  529 (667)
T PRK11186        455 FAAAMQDYGRALIVGEPTFGKGTVQQHRSLNRIYDQMLRPLGSVQYTIQKFYRINGGSTQRKGVTPDIIFPTGIE  529 (667)
T ss_pred             HHHHHHhcCCEEEEeccCCCccccccccccccccccccCCCCeeEEEEeEEECCCCCcccCCCCCCCeEcCCCcC
Confidence            99999999999999999999999998877753        34699999999999999999999999999997655


No 4  
>TIGR00225 prc C-terminal peptidase (prc). A C-terminal peptidase with different substrates in different species including processing of D1 protein of the photosystem II reaction center in higher plants and cleavage of a peptide of 11 residues from the precursor form of penicillin-binding protein in E.coli E.coli and H influenza have the most distal branch of the tree and their proteins have an N-terminal 200 amino acids that show no homology to other proteins in the database.
Probab=100.00  E-value=1.2e-54  Score=419.14  Aligned_cols=307  Identities=38%  Similarity=0.689  Sum_probs=267.9

Q ss_pred             CCHHHHHHHHHHHHHhCCCCCCCccChhhhccccccCcceeeeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCC
Q 015469           60 NTREETYMAIRKMLATLDDPFTRFLEPEKFNSLRSGTQGALTGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSG  139 (406)
Q Consensus        60 ~~~~~~~~~i~~~~~~L~D~ht~~~~~~~~~~~~~~~~~~~~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~G  139 (406)
                      ++.++++.++.+|+++|+|+|+.|++++++..+.....+...++|+.+...      +++++|..|.++|||+++||++|
T Consensus        10 ~~~~~~~~~l~~m~~~l~D~h~~~~~~~~~~~~~~~~~~~~~~lG~~~~~~------~~~~~V~~V~~~spA~~aGL~~G   83 (334)
T TIGR00225        10 DETEEIYGAIKGMLASLNDPYTRYLSPETAKSFSETTSGSLEGIGIQVGMD------DGEIVIVSPFEGSPAEKAGIKPG   83 (334)
T ss_pred             ccHHHHHHHHHHHHHhCCCCCccccCHHHHHHHHHhccCceEEEEEEEEEE------CCEEEEEEeCCCChHHHcCCCCC
Confidence            344689999999999999999999999988776655567788999988765      46899999999999999999999


Q ss_pred             CEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCCee--EEEEEEeeccccCceeeeeeecCCCCCCCCceEEEEc
Q 015469          140 DVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGAEI--RHLALTREKVSLNPVKSRLCVVPGPGKSSPRIGYIKL  217 (406)
Q Consensus       140 D~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g~~--~~~~v~~~~~~~~~v~~~~~~~~~~~~~~~~igyl~i  217 (406)
                      |+|++|||+++.+++..++...+.+..|.++.+++.|+++.  .++++.+..+..+++..++..     ..+++||||+|
T Consensus        84 D~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~R~g~~~~~~v~l~~~~~~~~~v~~~~~~-----~~~~~igYi~i  158 (334)
T TIGR00225        84 DKIIKINGKSVAGMSLDDAVALIRGKKGTKVSLEILRAGKSKPLTFTLKRDRIELQTVKASVKK-----VGGKSVGYIRI  158 (334)
T ss_pred             CEEEEECCEECCCCCHHHHHHhccCCCCCEEEEEEEeCCCCceEEEEEEEEEeeccceEEEEEc-----CCCcEEEEEEE
Confidence            99999999999998777888888888899999999998754  455666666667777765543     33568999999


Q ss_pred             CccccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCC
Q 015469          218 TSFNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEP  297 (406)
Q Consensus       218 ~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  297 (406)
                      ++|..+..+++.+++.+++++++++||||||+|+||++..+..++++|++++.+++...+++....+...  ....|++|
T Consensus       159 ~~f~~~~~~~~~~~l~~l~~~~~~~lIiDLR~N~GG~~~~a~~~a~~f~~~~~~~~~~~~~g~~~~~~~~--~~~~~~~p  236 (334)
T TIGR00225       159 SSFSEHTTEDVKKALDKLEKKNAKGYILDLRGNPGGLLQSAVDISRLFITKGPIVQTKDRNGSKRHYKAN--GRQPYNLP  236 (334)
T ss_pred             EecccchHHHHHHHHHHHHhccCceEEEEcCCCCCCCHHHHHHHHHHhcCCCcEEEEEcCCCcceEEecC--CCccCCCC
Confidence            9999888899999999998889999999999999999999999999999999877777666654444332  23468999


Q ss_pred             EEEEEcCCCccHHHHHHHHHhcCCCeEEEcccCCCCceeeeEEECCCCCeEEEEEeEEEcCCCCccCCCCcccCeecCCC
Q 015469          298 LAVLVNKGTASASEILAGALKDNKRAVLFGEPTYGKGKIQSVFQLSDGSGLAVTVARYETPAHTDIDKVGVIPDHPLPKT  377 (406)
Q Consensus       298 v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~~~~~~~~~L~~g~~~~~~~~~~~~~~g~~~e~~Gv~PDi~v~~~  377 (406)
                      |+||||+.|+||||+|+++||+++++++||++|+|++..+..+.|++|+.+.+|+.++++|+|..+|+.||+|||.|+.+
T Consensus       237 v~vLvn~~TaSaaE~~a~~l~~~~~a~viG~~T~G~~~~~~~~~l~~g~~l~~~~~~~~~~~g~~~e~~Gv~PDi~v~~~  316 (334)
T TIGR00225       237 LVVLVNRGSASASEIFAGALQDNGRATIVGEKTFGKGTVQQVRPLNDGSGIKVTIAKYYTPNGGSIHKKGIEPDIVIEQP  316 (334)
T ss_pred             EEEEECCCCCcHHHHHHHHHHhCCCeEEEeeCCccCceeeeEEEcCCCCEEEEEEEEEECCCCCCccCcCcCCCEEecCc
Confidence            99999999999999999999999999999999999998899999999999999999999999999999999999999876


Q ss_pred             CC
Q 015469          378 FP  379 (406)
Q Consensus       378 ~~  379 (406)
                      ..
T Consensus       317 ~~  318 (334)
T TIGR00225       317 DD  318 (334)
T ss_pred             cc
Confidence            65


No 5  
>cd07562 Peptidase_S41_TRI Tricorn protease; serine protease family S41. The tricorn protease (TRI), a member of the S41 peptidase family and named for its tricorn-like shape, exists only in some archaea and eubacteria. It has been shown to act as a carboxypeptidase, involved in the degradation of proteasomal products to preferentially yield di- and tripeptides, with subsequent and final degradations to free amino acid residues by tricorn interacting factors, F1, F2 and F3. Tricorn is a hexameric D3-symmetric protease of 720kD, and can self-associate further into a giant icosahedral capsid structure containing twenty copies of the complex. Each tricorn peptidase monomer consists of five structural domains: a six-bladed beta-propeller and a seven-bladed beta-propeller that limit access to the active site, the two domains (C1 and C2) that carry the active site residues, and a PDZ-like domain (proposed to be important for substrate recognition) between the C1 and C2 domains. The active sit
Probab=100.00  E-value=7e-42  Score=320.22  Aligned_cols=260  Identities=24%  Similarity=0.314  Sum_probs=199.7

Q ss_pred             hhhHHHHHHHHHHHHhccccccCCcchHHHHHhhhhc-CCCCCHHHHHHHHHHHHHhCCCCCCCccChhhhccccccCcc
Q 015469           20 EENRLFLEAWRTIDRAYVDKTFNGQSWFRYRENALRN-EPMNTREETYMAIRKMLATLDDPFTRFLEPEKFNSLRSGTQG   98 (406)
Q Consensus        20 ~~~~~f~~~w~~i~~~y~~~~~~~~dW~~~~~~~~~~-~~~~~~~~~~~~i~~~~~~L~D~ht~~~~~~~~~~~~~~~~~   98 (406)
                      ++.++|+++|++++++|++++++++||++++++|++. ..++++.+|+.++.+|+++|+|+|+.+... .+         
T Consensus         1 ~~~~~fd~~w~~~~~~y~~~~~~g~dW~~~~~~y~~~~~~~~~~~e~~~~l~~ml~~L~d~H~~~~~~-~~---------   70 (266)
T cd07562           1 EWLQMFDEAWRLVRDNFYDPDMHGVDWDAVRAEYRPLLPRAATRAELADVLNEMLGELNDSHTGVSGL-RY---------   70 (266)
T ss_pred             CHHHHHHHHHHHHHhhccCCCCCCCCHHHHHHHHHHHHhhcCCHHHHHHHHHHHHHHHcCCccchHHH-HH---------
Confidence            3678999999999999999999999999999999865 578899999999999999999999976530 00         


Q ss_pred             eeeeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCC
Q 015469           99 ALTGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGA  178 (406)
Q Consensus        99 ~~~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g  178 (406)
                                                                               .+....                 
T Consensus        71 ---------------------------------------------------------~~~~~~-----------------   76 (266)
T cd07562          71 ---------------------------------------------------------RDWVES-----------------   76 (266)
T ss_pred             ---------------------------------------------------------HHHHHH-----------------
Confidence                                                                     000000                 


Q ss_pred             eeEEEEEEeeccccCceeeeeeecCCCCCCCCceEEEEcCccccchHHHHHHHHHHHhcC-CCCeEEEEeCCCCCCChHH
Q 015469          179 EIRHLALTREKVSLNPVKSRLCVVPGPGKSSPRIGYIKLTSFNQNASGAVREAIDTLRSN-SVNAFVLDLRDNSGGLFPE  257 (406)
Q Consensus       179 ~~~~~~v~~~~~~~~~v~~~~~~~~~~~~~~~~igyl~i~~f~~~~~~~~~~~~~~~~~~-~~~~lIiDlR~N~GG~~~~  257 (406)
                              +    ...+. +        ..+++||||+|++|...   .+.++++++... .+++||||||+|+||++. 
T Consensus        77 --------~----~~~~~-~--------~~~~~igYi~i~~~~~~---~~~~~~~~~~~~~~~~glIiDlR~N~GG~~~-  131 (266)
T cd07562          77 --------N----REYVE-E--------LSDGRIGYVHIPDMGDD---GFAEFLRDLLAEVDKDGLIIDVRFNGGGNVA-  131 (266)
T ss_pred             --------H----HHHHH-H--------hcCCcEEEEEeCCCChH---HHHHHHHHHHhcCCCceEEEEecCCCCCcHH-
Confidence                    0    00000 0        11358999999999654   344444444332 389999999999999954 


Q ss_pred             HHHHHHhhccCCcEEEEEcCC-CceeeeecCCCCccCCCCCEEEEEcCCCccHHHHHHHHHhcCCCeEEEcccCCCCcee
Q 015469          258 GIEIAKIWLDKGVIVYICDSR-GVRDIYDTDGTDALAASEPLAVLVNKGTASASEILAGALKDNKRAVLFGEPTYGKGKI  336 (406)
Q Consensus       258 ~~~l~~~~~~~~~~~~~~~~~-~~~~~~~~~~~~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~~~~  336 (406)
                       ..++++|.+. ...+...+. +....   .+  ...|++||+||||+.|+||||+|+.+||+++++++||++|+|++..
T Consensus       132 -~~l~~~~~~~-~~~~~~~r~~~~~~~---~p--~~~~~~pv~vL~~~~t~SaaE~~a~~lk~~~~~~vvG~~T~G~~~~  204 (266)
T cd07562         132 -DLLLDFLSRR-RYGYDIPRGGGKPVT---YP--SGRWRGPVVVLVNEGSASDAEIFAYGFRALGLGPVVGTRTAGGVII  204 (266)
T ss_pred             -HHHHHHhCCC-ceEEEccCCCCCCCC---Cc--ccccCCCEEEEECCCCCchHHHHHHHHHHcCCeeEEeeccCCceee
Confidence             4667777654 334444333 22111   11  1238999999999999999999999999999999999999999998


Q ss_pred             eeEEECCCCCeEEEEEeEEEcCCCCccCCCCcccCeecCCCCCCCcchhhhhcccccchhhccc
Q 015469          337 QSVFQLSDGSGLAVTVARYETPAHTDIDKVGVIPDHPLPKTFPKDEDGFCGCLQDSASTCNMNG  400 (406)
Q Consensus       337 ~~~~~L~~g~~~~~~~~~~~~~~g~~~e~~Gv~PDi~v~~~~~~~~~~~~~~~~~~~~~~~~~~  400 (406)
                      +..+.||+|+.+.+|...+++++|+.+|+.||.|||.|+.+...     ..+.+|+.+++|+.-
T Consensus       205 ~~~~~L~~g~~~~~~~~~~~~~~g~~~e~~Gi~PDi~v~~~~~~-----~~~g~D~~L~~Al~~  263 (266)
T cd07562         205 SGRYRLPDGGSLTVPEFGVYLPDGGPLENRGVAPDIEVENTPED-----VAAGRDPQLEAAIEE  263 (266)
T ss_pred             cCceecCCCCEEEeeceeEEcCCCCccccCCCCCCEEecCCHhH-----hhcCCCHHHHHHHHH
Confidence            88899999999999999999999999999999999999987752     234778888877753


No 6  
>cd06567 Peptidase_S41 C-terminal processing peptidase family S41. Peptidase family S41 (C-terminal processing peptidase or CTPase family) contains very different subfamilies; it includes photosystem II D1 C-terminal processing protease (CTPase), interphotoreceptor retinoid-binding protein IRBP and tricorn protease (TRI). CTPase and TRI both contain the PDZ domain while IRBP, although being very similar to the tail-specific protease domain, lacks the PDZ insertion domain and hydrolytic activity. These serine proteases have distinctly different active sites: in CTPase, the active site consists of a serine/lysine catalytic dyad while in tricorn core protease, it is a tetrad (serine, histidine, serine, glutamate). CPases with different substrate specificities in different species include processing of D1 protein of the photosystem II reaction center in higher plants and cleavage of a peptide of 11 residues from the precursor form of penicillin-binding protein; and others such as tricorn pr
Probab=100.00  E-value=6.8e-40  Score=299.87  Aligned_cols=221  Identities=43%  Similarity=0.713  Sum_probs=194.6

Q ss_pred             HHHHHHHHHHhccccccCCcchHHHHHhhhhc-CCCCCHHHHHHHHHHHHHhCCCCCCCccChhhhccccccCcceeeee
Q 015469           25 FLEAWRTIDRAYVDKTFNGQSWFRYRENALRN-EPMNTREETYMAIRKMLATLDDPFTRFLEPEKFNSLRSGTQGALTGV  103 (406)
Q Consensus        25 f~~~w~~i~~~y~~~~~~~~dW~~~~~~~~~~-~~~~~~~~~~~~i~~~~~~L~D~ht~~~~~~~~~~~~~~~~~~~~g~  103 (406)
                      |+++|+.++++|+++  ++.+|..++.++... ...++..+++.++..|+.+|+|+|+.+.+                  
T Consensus         1 ~~~~~~~~~~~y~~~--~~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~~l~~l~D~hs~~~~------------------   60 (224)
T cd06567           1 FDEAWRLLRENYYDP--HGVDWDALRDRYVDLLDAVDDRELLAGALNGMLGELGDPHSRYLT------------------   60 (224)
T ss_pred             CHHHHHHHHHHhccc--chhHHHHHHHHHhhhhccCCHHHHHHHHHHHHHHhCCCCCceeEE------------------
Confidence            578999999999998  899999999988764 35678899999999999999999997643                  


Q ss_pred             EEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCCeeEEE
Q 015469          104 GLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGAEIRHL  183 (406)
Q Consensus       104 g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g~~~~~  183 (406)
                                                                                                      
T Consensus        61 --------------------------------------------------------------------------------   60 (224)
T cd06567          61 --------------------------------------------------------------------------------   60 (224)
T ss_pred             --------------------------------------------------------------------------------
Confidence                                                                                            


Q ss_pred             EEEeeccccCceeeeeeecCCCCCCCCceEEEEcCccc-cchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHH
Q 015469          184 ALTREKVSLNPVKSRLCVVPGPGKSSPRIGYIKLTSFN-QNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIA  262 (406)
Q Consensus       184 ~v~~~~~~~~~v~~~~~~~~~~~~~~~~igyl~i~~f~-~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~  262 (406)
                                                  ||||+|++|. ....+.+.+++..+++ ++++||||||+|+||++..+..++
T Consensus        61 ----------------------------igYi~i~~f~~~~~~~~~~~~~~~~~~-~~~~lIiDLR~N~GG~~~~a~~l~  111 (224)
T cd06567          61 ----------------------------IGYIRIPSFSAESTAEELREALAELKK-GVKGLILDLRNNPGGLLSAAVELA  111 (224)
T ss_pred             ----------------------------eEEEEECccCCcchHHHHHHHHHHHHc-CCCEEEEEcCCCCCccHHHHHHHH
Confidence                                        6899999998 6677888999998887 899999999999999999999999


Q ss_pred             HhhccCCcEEEEEcCCCc-eeeeecCCCCccCCCCCEEEEEcCCCccHHHHHHHHHhcCCCeEEEcccCCCCceeeeEEE
Q 015469          263 KIWLDKGVIVYICDSRGV-RDIYDTDGTDALAASEPLAVLVNKGTASASEILAGALKDNKRAVLFGEPTYGKGKIQSVFQ  341 (406)
Q Consensus       263 ~~~~~~~~~~~~~~~~~~-~~~~~~~~~~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~~~~~~~~~  341 (406)
                      ++|++++..+......+. ...+. .......+.+||+||||+.|+||||+|+.+||+++++++||++|+|++..+..+.
T Consensus       112 ~~~~~~~~~~~~~~~~~~~~~~~~-~~~~~~~~~~pv~vL~~~~taSaaE~~a~~lk~~~~~~vvG~~T~G~~~~~~~~~  190 (224)
T cd06567         112 SLFLPKGKIVVTTRRRGGNETEYV-APGGGSLYDGPLVVLVNEGSASASEIFAGALQDLGRATLVGERTFGKGSVQTVFP  190 (224)
T ss_pred             HHhcCCCcEEEEEecCCCceeEEe-cCCCCcccCCCEEEEECCCCccHHHHHHHHHHhCCCeEEEeeCCCCCCcceEEEE
Confidence            999999887665543332 11222 2234457999999999999999999999999999999999999999999899999


Q ss_pred             CCCCCeEEEEEeEEEcCCCCccCCCCcccCeecC
Q 015469          342 LSDGSGLAVTVARYETPAHTDIDKVGVIPDHPLP  375 (406)
Q Consensus       342 L~~g~~~~~~~~~~~~~~g~~~e~~Gv~PDi~v~  375 (406)
                      ||+|+.+.+|..++++|+|+.+|+.||.|||+|+
T Consensus       191 l~~g~~~~~~~~~~~~~~g~~~~~~Gv~PDi~v~  224 (224)
T cd06567         191 LLDGSALKLTTAKYYTPSGRSIEGKGVEPDIEVP  224 (224)
T ss_pred             cCCCCEEEEEEEEEECCCCCCccCCccCCCEECC
Confidence            9999999999999999999999999999999985


No 7  
>cd07563 Peptidase_S41_IRBP Interphotoreceptor retinoid-binding protein; serine protease family S41. Interphotoreceptor retinoid-binding protein (IRBP) is a homolog of the S41 protease, C-terminal processing peptidase (CTPase) family. It is thought to facilitate the compartmentalization of the visual cycle that requires poorly soluble and potentially toxic retinoids to cross the aqueous subretinal space between the photoreceptors and the retinal pigment epithelium (RPE). IRBP is secreted by photoreceptors into the interphotoreceptor matrix (IPM) where it is rapidly turned over by a combination of RPE and photoreceptor endocytosis. It is the most abundant soluble protein component of the IPM, consisting of homologous modules, each repeat structure arising through the duplication (as in teleost IRBP) or quadruplication (in tetrapods) of an ancient gene, arisen in the early evolution of the vertebrate eye. IRBP has been shown to promote the release of all-trans retinol from photoreceptors 
Probab=100.00  E-value=2.9e-39  Score=300.23  Aligned_cols=234  Identities=27%  Similarity=0.337  Sum_probs=196.1

Q ss_pred             HHHHHHHHHHHhccccccCCcchHHHHHhhhhcC--CCCCHHHHHHHHHHHHHhCCCCCCCccChhhhccccccCcceee
Q 015469           24 LFLEAWRTIDRAYVDKTFNGQSWFRYRENALRNE--PMNTREETYMAIRKMLATLDDPFTRFLEPEKFNSLRSGTQGALT  101 (406)
Q Consensus        24 ~f~~~w~~i~~~y~~~~~~~~dW~~~~~~~~~~~--~~~~~~~~~~~i~~~~~~L~D~ht~~~~~~~~~~~~~~~~~~~~  101 (406)
                      .|+.+|++++++|+++..++++|.++++++.+..  ...+.++|+..+.+|+..|+|+|+.+..                
T Consensus         1 ~~~~~~~~~~~~Y~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~~l~~~l~~l~D~H~~~~~----------------   64 (250)
T cd07563           1 VFEALAKLLEENYAFPEAKGIDWDALAARLRAQVYLDITSPEELAAVLTADLQELGDGHLNVSY----------------   64 (250)
T ss_pred             CHHHHHHHHHHhCCChHHcccHHHHHHHHHhccccccCCCHHHHHHHHHHhhhccCCCcEEEEE----------------
Confidence            3889999999999999999999999999998653  5788899999999999999999996421                


Q ss_pred             eeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCCeeE
Q 015469          102 GVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGAEIR  181 (406)
Q Consensus       102 g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g~~~  181 (406)
                                                                                                      
T Consensus        65 --------------------------------------------------------------------------------   64 (250)
T cd07563          65 --------------------------------------------------------------------------------   64 (250)
T ss_pred             --------------------------------------------------------------------------------
Confidence                                                                                            


Q ss_pred             EEEEEeeccccCceeeeeeecCCCCCCCCceEEEEcCcccc----chHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHH
Q 015469          182 HLALTREKVSLNPVKSRLCVVPGPGKSSPRIGYIKLTSFNQ----NASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPE  257 (406)
Q Consensus       182 ~~~v~~~~~~~~~v~~~~~~~~~~~~~~~~igyl~i~~f~~----~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~  257 (406)
                                                    ||||+|++|..    ...+.++++++.++  +.++||||||+|+||+...
T Consensus        65 ------------------------------IgYl~i~~f~~~~~~~~~~~~~~~~~~l~--~~~~LIIDLR~N~GG~~~~  112 (250)
T cd07563          65 ------------------------------IGYLRIDSFGGFEIAAAEALLDEALDKLA--DTDALIIDLRYNGGGSDSL  112 (250)
T ss_pred             ------------------------------eEEEEEcccCChhhhhhHHHHHHHHHHhc--CCCeEEEEECCCCCCCHHH
Confidence                                          68999999986    34567888888887  4599999999999999999


Q ss_pred             HHHHHHhhccCCc--EEEEE-cCCCceee----eecCCCCccCCCCCEEEEEcCCCccHHHHHHHHHhcCCCeEEEcccC
Q 015469          258 GIEIAKIWLDKGV--IVYIC-DSRGVRDI----YDTDGTDALAASEPLAVLVNKGTASASEILAGALKDNKRAVLFGEPT  330 (406)
Q Consensus       258 ~~~l~~~~~~~~~--~~~~~-~~~~~~~~----~~~~~~~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T  330 (406)
                      +..++++|++++.  .++.. .+.+....    ....+.....+++||+||||+.|+||||.|+.+||+++++++||++|
T Consensus       113 ~~~l~s~f~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~pv~vL~~~~T~SaaE~~a~~lk~~~~~~viGe~T  192 (250)
T cd07563         113 VAYLASYFTDEDKPVHLYTIYKRPGNTTTELWTLPVVPGGRYGYTKPVYVLTSPVTFSAAEEFAYALKQLKRATVVGETT  192 (250)
T ss_pred             HHHHHHHcCCCCCcEEEEEEEECCCCCCcccceeeecCCCcccCCCCEEEEeCCCcCcHHHHHHHHHHhCCCcEEEeecC
Confidence            9999999996443  33322 22222110    11122334579999999999999999999999999999999999999


Q ss_pred             CCCceeeeEEECCCCCeEEEEEeEEEcCC-CCccCCCCcccCeecCCCCCCCcchhh
Q 015469          331 YGKGKIQSVFQLSDGSGLAVTVARYETPA-HTDIDKVGVIPDHPLPKTFPKDEDGFC  386 (406)
Q Consensus       331 ~G~~~~~~~~~L~~g~~~~~~~~~~~~~~-g~~~e~~Gv~PDi~v~~~~~~~~~~~~  386 (406)
                      +|++..+..+.||+|+.+.+|+.++++|+ |..+|+.||.|||+|+.+. ..++.++
T Consensus       193 ~G~~~~~~~~~Lp~g~~~~~~~~~~~~~~~g~~~e~~Gv~PDi~v~~~~-~~d~al~  248 (250)
T cd07563         193 AGGASPVLPFPLPNGLYLTVPTSRSVDPITGTNWEGVGVPPDIEVPATP-GYDDALE  248 (250)
T ss_pred             CCCCCCceEEEcCCCeEEEEecceeEeCCCCCcccccCcCCCeeecCCC-ChhhHhh
Confidence            99999889999999999999999999998 9999999999999999887 3344333


No 8  
>smart00245 TSPc tail specific protease. tail specific protease
Probab=100.00  E-value=5e-37  Score=273.45  Aligned_cols=189  Identities=44%  Similarity=0.724  Sum_probs=162.9

Q ss_pred             eEEEEEEeeccccCceeeeeeecCCCCCCCCceEEEEcCccccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHH
Q 015469          180 IRHLALTREKVSLNPVKSRLCVVPGPGKSSPRIGYIKLTSFNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGI  259 (406)
Q Consensus       180 ~~~~~v~~~~~~~~~v~~~~~~~~~~~~~~~~igyl~i~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~  259 (406)
                      ..++.++|..+..+++.+.+...     ..++||||+|++|.....++++++++++++.++++||||||+|+||++..+.
T Consensus         3 ~~~~~~~r~~~~~~~~~~~~~~~-----~~~~igYi~i~~f~~~~~~~~~~~~~~l~~~~~~~lIiDLR~N~GG~~~~~~   77 (192)
T smart00245        3 ERTIALIRAKIKIETLEGNVGYL-----RFGNIGYIRIPEFSEHTSNLVEKAWKKLEKTNVEGLILDLRNNPGGLLSAAI   77 (192)
T ss_pred             cEEEEEEEeEEEeeEEeEEEeec-----CCCcEEEEEEeEEChhhHHHHHHHHHHHHhCCCcEEEEEecCCCCCCHHHHH
Confidence            35666777777777777665442     2368999999999987788999999999988999999999999999999999


Q ss_pred             HHHHhhccCCcEEEEEcCC-CceeeeecCCCCccCCCCCEEEEEcCCCccHHHHHHHHHhcCCCeEEEcccCCCCceeee
Q 015469          260 EIAKIWLDKGVIVYICDSR-GVRDIYDTDGTDALAASEPLAVLVNKGTASASEILAGALKDNKRAVLFGEPTYGKGKIQS  338 (406)
Q Consensus       260 ~l~~~~~~~~~~~~~~~~~-~~~~~~~~~~~~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~~~~~~  338 (406)
                      .++++|++++..++...++ +....+....  ...+.+|++||||+.|+||||+|+.+||+++++++||++|+|++..+.
T Consensus        78 ~~~~~f~~~~~~~~~~~~~~~~~~~~~~~~--~~~~~~pv~vL~~~~TaSaaE~~a~~lk~~~~a~viG~~T~G~~~~~~  155 (192)
T smart00245       78 DVSSLFLDKGVIVYTIYRRTGELETYPANL--GRKYSKPLVVLVNEGTASASEIFAGALKDLGRALIVGERTFGKGLVQQ  155 (192)
T ss_pred             HHHHHhcCCCcEEEEEecCCCceEEEecCC--CcccCCCEEEEECCCCeeHHHHHHHHHhhCCCEEEEecCCcCCcceee
Confidence            9999999988766665544 4433333322  235689999999999999999999999999999999999999999999


Q ss_pred             EEECCCCCeEEEEEeEEEcCCCCccCCCCcccCeecC
Q 015469          339 VFQLSDGSGLAVTVARYETPAHTDIDKVGVIPDHPLP  375 (406)
Q Consensus       339 ~~~L~~g~~~~~~~~~~~~~~g~~~e~~Gv~PDi~v~  375 (406)
                      .+.|++|+.+.+|+..+++|+|+.+|+.||+||++||
T Consensus       156 ~~~l~~g~~l~it~~~~~~~~g~~~e~~Gv~PDi~v~  192 (192)
T smart00245      156 TVPLGDGSGLKLTVAKYYTPSGKSIEKKGVEPDIQVP  192 (192)
T ss_pred             EEEeCCCCEEEEEEEEEECCCCCEecCCCcCCCEECc
Confidence            9999999999999999999999999999999999986


No 9  
>cd07560 Peptidase_S41_CPP C-terminal processing peptidase; serine protease family S41. The C-terminal processing peptidase (CPP, EC 3.4.21.102) also known as tail-specific protease (tsp), the photosystem II D1 C-terminal processing protease (D1P), and other related S41 protease family members are present in this CD. CPP is synthesized as a precursor form with a carboxyl-terminal extension. It specifically recognizes a C-terminal tripeptide, Xaa-Yaa-Zaa, in which Xaa is preferably Ala or Leu, Yaa is preferably Ala or Tyr and Zaa is preferably Ala, but then cleaves at a variable distance from the C-terminus. The C-terminal carboxylate group is essential, and proteins where this group is amidated are not substrates. This family of proteases contains the PDZ domain that promotes protein-protein interactions and is important for substrate recognition. The active site consists of a serine/lysine catalytic dyad. The bacterial CCP-1 is believed to be important for the degradation of incorrectl
Probab=100.00  E-value=1.6e-35  Score=266.69  Aligned_cols=162  Identities=49%  Similarity=0.812  Sum_probs=147.4

Q ss_pred             eEEEEcCccccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCc
Q 015469          212 IGYIKLTSFNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDA  291 (406)
Q Consensus       212 igyl~i~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  291 (406)
                      ||||++++|.....+++.++|++++++++++||||||+|+||++..+..++++|++++..++...+.+....+...  ..
T Consensus        50 igYi~i~sf~~~~~~~~~~~l~~~~~~~~~~lIlDLR~N~GG~~~~~~~i~~~f~~~~~~~~~~~~~g~~~~~~~~--~~  127 (211)
T cd07560          50 IGYIRITSFSENTAEELKKALKELKKQGMKGLILDLRNNPGGLLDEAVEIADLFLPGGPIVSTKGRNGKREAYASD--DG  127 (211)
T ss_pred             eEEEEEcccCchhHHHHHHHHHHHHhccCceEEEEcCCCCCCCHHHHHHHHHHhcCCCeEEEEEecCCceEEEecC--CC
Confidence            7899999999888889999999999888999999999999999999999999999988777776666655444332  23


Q ss_pred             cCCCCCEEEEEcCCCccHHHHHHHHHhcCCCeEEEcccCCCCceeeeEEECCCCCeEEEEEeEEEcCCCCccCCCCcccC
Q 015469          292 LAASEPLAVLVNKGTASASEILAGALKDNKRAVLFGEPTYGKGKIQSVFQLSDGSGLAVTVARYETPAHTDIDKVGVIPD  371 (406)
Q Consensus       292 ~~~~~~v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~~~~~~~~~L~~g~~~~~~~~~~~~~~g~~~e~~Gv~PD  371 (406)
                      ..+.+|++||||+.|+||||+|+.+||.++++++||++|+|++..+..+.||+|+.+++|+.++++|+|+.+|+.||+||
T Consensus       128 ~~~~~pvvVLvn~~TaSaaE~~a~~lk~~~~~~vIG~~T~G~~~~~~~~~L~~g~~l~i~~~~~~~~~G~~~e~~GV~PD  207 (211)
T cd07560         128 GLYDGPLVVLVNGGSASASEIVAGALQDNGRAVLVGERTFGKGSVQTVFPLSDGSALKLTTAKYYTPSGRSIQKKGIEPD  207 (211)
T ss_pred             ccCCCCEEEEeCCCcccHHHHHHHHHhhcCCEEEEecCCCCCCeeeEEEEcCCCCEEEEEEEEEECCCCCCccCCCcCCC
Confidence            46899999999999999999999999999999999999999999999999999999999999999999999999999999


Q ss_pred             eecC
Q 015469          372 HPLP  375 (406)
Q Consensus       372 i~v~  375 (406)
                      |+||
T Consensus       208 i~V~  211 (211)
T cd07560         208 IEVP  211 (211)
T ss_pred             EECC
Confidence            9986


No 10 
>cd07561 Peptidase_S41_CPP_like C-terminal processing peptidase-like; serine protease family S41. Bacterial protease homologs of the S41 family related to C-terminal processing peptidase (CPP).  CPP-1 is believed to be important for the degradation of incorrectly synthesized proteins as well as protection from thermal and osmotic stresses. CPP is synthesized with an extension on its carboxyl-terminus and specifically recognizes a C-terminal tripeptide, but cleaves at variable distance from the C-terminus. The CPP active site consists of a serine/lysine catalytic dyad. Conservation of these residues is seen in the CPP-like proteins of this group. CPP proteins contain a PDZ domain that promotes protein-protein interactions and is important for substrate recognition however, most of CPP-like proteins only have an internal fragment or lack the PDZ domain.
Probab=100.00  E-value=1.9e-33  Score=259.92  Aligned_cols=170  Identities=24%  Similarity=0.320  Sum_probs=144.9

Q ss_pred             CCceEEEEcCccccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccC---CcEEE-EEcCCCc----
Q 015469          209 SPRIGYIKLTSFNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDK---GVIVY-ICDSRGV----  280 (406)
Q Consensus       209 ~~~igyl~i~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~---~~~~~-~~~~~~~----  280 (406)
                      +++||||+|++|..+..+++.+++++++++++++||||||+|+||.+..+..++++|+++   +.++. ...+.+.    
T Consensus        63 ~~~IGYi~i~~F~~~~~~~l~~a~~~l~~~~~~~LIlDLR~N~GG~~~~a~~las~f~~~~~~~~~~~~~~~~~~~~~~~  142 (256)
T cd07561          63 GKKVGYLVYNSFTSGYDDELNQAFAEFKAQGVTELVLDLRYNGGGLVSSANLLASLLAPAVALGQVFATLEYNDKRSANN  142 (256)
T ss_pred             CCcEEEEEECccccchHHHHHHHHHHHHHcCCCeEEEEeCCCCCccHHHHHHHHHHhcCcccCCCeEEEEEecCCccCCC
Confidence            469999999999988889999999999999999999999999999999999999999984   44443 3333321    


Q ss_pred             -eeeeecCC--CCccCCCCCEEEEEcCCCccHHHHHHHHHhcCCCeEEEcccCCCCceeeeEEECC--CCCeEEEEEeEE
Q 015469          281 -RDIYDTDG--TDALAASEPLAVLVNKGTASASEILAGALKDNKRAVLFGEPTYGKGKIQSVFQLS--DGSGLAVTVARY  355 (406)
Q Consensus       281 -~~~~~~~~--~~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~~~~~~~~~L~--~g~~~~~~~~~~  355 (406)
                       ...+....  .......+||+||||+.||||||+|+.+||+++++++||++|+|++..+..+.++  +|+.+.+++.++
T Consensus       143 ~~~~~~~~~~~~~~~~~~~pv~VL~~~~TASAaE~~a~~Lk~~~~a~vIGe~T~Gk~~~~~~~~l~~~~g~~l~~t~~~~  222 (256)
T cd07561         143 EDLLFSSKTLAGGNSLNLSKVYVLTSGSTASASELVINSLKPYMDVVLIGETTYGKNVGSLTFEDDRKHKWALQPVVFKV  222 (256)
T ss_pred             ceeecccccccccCcCCcccEEEEECCCcccHHHHHHHHhhccCCEEEEeCCCCCCCccceEEEccCCCCeEEEEEEEEE
Confidence             12222211  1223456899999999999999999999999999999999999999999999998  899999999999


Q ss_pred             EcCCCCccCCCCcccCeecCCCC
Q 015469          356 ETPAHTDIDKVGVIPDHPLPKTF  378 (406)
Q Consensus       356 ~~~~g~~~e~~Gv~PDi~v~~~~  378 (406)
                      ++|+|+.+++.||+||++|+.+.
T Consensus       223 ~~~~G~~~~~~Gi~PDi~v~~~~  245 (256)
T cd07561         223 VNADGQGDYSNGLTPDIEVNEDS  245 (256)
T ss_pred             ECCCCCCccCCCcCCceEeCccc
Confidence            99999999999999999998664


No 11 
>PF03572 Peptidase_S41:  Peptidase family S41;  InterPro: IPR005151 This group of putative serine peptidases belong to the MEROPS peptidase family S41 (C-terminal processing peptidase family, clan SM). The members of this group include: the tricorn protease of bacteria and archaea, C-terminal peptidases with different substrates specificities in different species including processing of D1 protein of the photosystem II reaction centre in higher plants and cleavage of a peptide of 11 residues from the precursor form of penicillin-binding protein; and some appear to be responsible for degrading oligopeptides, probably derived from the proteasome. ; GO: 0008236 serine-type peptidase activity, 0006508 proteolysis; PDB: 1N6F_D 1N6D_C 1N6E_C 1K32_A 3K50_A 3DJA_B 3DPM_B 3DPN_A 3DOR_B 1J7X_A ....
Probab=100.00  E-value=2.1e-32  Score=239.21  Aligned_cols=164  Identities=36%  Similarity=0.564  Sum_probs=126.6

Q ss_pred             ceEEEEcCcccc--chHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceee--eec
Q 015469          211 RIGYIKLTSFNQ--NASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDI--YDT  286 (406)
Q Consensus       211 ~igyl~i~~f~~--~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~--~~~  286 (406)
                      +||||+|++|..  ...+.+.+++++++++++++||||||+|+||+...+..++++|++++...+.....+....  ...
T Consensus         1 ~i~yl~i~sf~~~~~~~~~~~~~~~~~~~~~~~~lIIDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~   80 (169)
T PF03572_consen    1 NIGYLRIPSFSENKSFDEELDEFLDKLKSKDTDGLIIDLRGNGGGSDEYAIELLSYLIPKPIIFYYRDRIGSNKKWVSTI   80 (169)
T ss_dssp             EEEEEEES-BCCGHHHHHHHHHHHHHHHHTTSSEEEEE-TTB--BSHHHHHHHHHCHSSSSEEEEEEEEEEEETTCCHEE
T ss_pred             CEEEEEeCcccCccccHHHHHHHHHHHHHCCCCEEEEEcccCCCcchHHHHHHHhcccCCCcEEEEecccccccccccCC
Confidence            589999999954  5778899999999888999999999999999999999999999998766544322111110  000


Q ss_pred             CCC-CccCCCCCEEEEEcCCCccHHHHHHHHHhcCCCeEEEcccCCCCceeeeEEECCCCCeEEEEEeEEEcCCCCccCC
Q 015469          287 DGT-DALAASEPLAVLVNKGTASASEILAGALKDNKRAVLFGEPTYGKGKIQSVFQLSDGSGLAVTVARYETPAHTDIDK  365 (406)
Q Consensus       287 ~~~-~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~~~~~~~~~L~~g~~~~~~~~~~~~~~g~~~e~  365 (406)
                      ... ....+++|++||+|+.|+|+||.|+.++|+++++++||++|+|....+..+.|++|+.+.+|...++.++|..+|+
T Consensus        81 ~~~~~~~~~~~~v~vL~~~~t~Saae~fa~~lk~~~~~~ivGe~T~G~~~~~~~~~l~~g~~~~i~~~~~~~~~g~~~~~  160 (169)
T PF03572_consen   81 KWSTPKNRFNGPVYVLTDENTASAAEIFASALKDNKRATIVGEPTAGAGGGQTGFSLPSGSILSIPTSRYYNPDGQKIEG  160 (169)
T ss_dssp             EECSSTT-SSSEEEEEE-TTBBTHHHHHHHHHHHTTSEEEEES--SB-EEEEEEEE-TTSEEEEEEEEEEEETTSBBTTT
T ss_pred             CCccccccCCCCEEEEeCCCCCChhHHHHHHHHhcCCCeEEeecCCCCCEEeeEEEECCCcEEEeEeEEEEeCCCCEEcC
Confidence            000 1457999999999999999999999999999999999999999999888999999999999999999999999999


Q ss_pred             CCcccCeec
Q 015469          366 VGVIPDHPL  374 (406)
Q Consensus       366 ~Gv~PDi~v  374 (406)
                      .||.|||+|
T Consensus       161 ~Gi~PDi~V  169 (169)
T PF03572_consen  161 IGIEPDIEV  169 (169)
T ss_dssp             TS---SEE-
T ss_pred             CcEEccEEC
Confidence            999999987


No 12 
>PF14684 Tricorn_C1:  Tricorn protease C1 domain; PDB: 1N6F_D 1N6D_C 1N6E_C 1K32_A.
Probab=99.45  E-value=5.8e-14  Score=103.20  Aligned_cols=67  Identities=27%  Similarity=0.464  Sum_probs=53.9

Q ss_pred             chhhHHHHHHHHHHHHhccccccCCcchHHHHHhhhhc-CCCCCHHHHHHHHHHHHHhCCCCCCCccC
Q 015469           19 SEENRLFLEAWRTIDRAYVDKTFNGQSWFRYRENALRN-EPMNTREETYMAIRKMLATLDDPFTRFLE   85 (406)
Q Consensus        19 ~~~~~~f~~~w~~i~~~y~~~~~~~~dW~~~~~~~~~~-~~~~~~~~~~~~i~~~~~~L~D~ht~~~~   85 (406)
                      .+++++|+++|++++++|++++++|+||++++++|.+. ..+.++.+|+.++.+|+++|+|+|+.+.+
T Consensus         2 ~E~~~~F~~~W~~~~~~f~d~~~~gvDW~~~~~~Y~p~v~~~~~~~el~~vl~eMl~eL~~~H~~~~~   69 (70)
T PF14684_consen    2 AEWRQMFDEAWRLVRENFYDPDMHGVDWDAVYDRYRPLVPAAKTRDELYDVLNEMLGELNDSHTYVYG   69 (70)
T ss_dssp             HHHHHHHHHHHHHHHHHSS-HHHHHHHHHHHHHHHHGGGGG--SHHHHHHHHHHHHHTT--S---EE-
T ss_pred             HHHHHHHHHHHHHHHHhcCCCCCCCCChHHHHHHHHHHHhcCCCHHHHHHHHHHHHHHHCCCccCccC
Confidence            47889999999999999999999999999999999876 46788999999999999999999998753


No 13 
>PF13180 PDZ_2:  PDZ domain; PDB: 2L97_A 1Y8T_A 2Z9I_A 1LCY_A 2PZD_B 2P3W_A 1VCW_C 1TE0_B 1SOZ_C 1SOT_C ....
Probab=99.36  E-value=1.1e-11  Score=94.65  Aligned_cols=79  Identities=37%  Similarity=0.618  Sum_probs=64.8

Q ss_pred             eeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHh-CCCCCCcEEEEEEeCCee
Q 015469          102 GVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERL-QGPEGSPVELTVRSGAEI  180 (406)
Q Consensus       102 g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l-~~~~g~~v~l~v~r~g~~  180 (406)
                      ++|+.+.....    .+++.|..|.++|||+++||++||+|++|||+++.++  .++...+ ...+|+++++++.|+++.
T Consensus         2 ~lGv~~~~~~~----~~g~~V~~V~~~spA~~aGl~~GD~I~~ing~~v~~~--~~~~~~l~~~~~g~~v~l~v~R~g~~   75 (82)
T PF13180_consen    2 GLGVTVQNLSD----TGGVVVVSVIPGSPAAKAGLQPGDIILAINGKPVNSS--EDLVNILSKGKPGDTVTLTVLRDGEE   75 (82)
T ss_dssp             E-SEEEEECSC----SSSEEEEEESTTSHHHHTTS-TTEEEEEETTEESSSH--HHHHHHHHCSSTTSEEEEEEEETTEE
T ss_pred             EECeEEEEccC----CCeEEEEEeCCCCcHHHCCCCCCcEEEEECCEEcCCH--HHHHHHHHhCCCCCEEEEEEEECCEE
Confidence            46666655421    3589999999999999999999999999999999874  7777666 677899999999999999


Q ss_pred             EEEEEE
Q 015469          181 RHLALT  186 (406)
Q Consensus       181 ~~~~v~  186 (406)
                      .+++++
T Consensus        76 ~~~~v~   81 (82)
T PF13180_consen   76 LTVEVT   81 (82)
T ss_dssp             EEEEEE
T ss_pred             EEEEEE
Confidence            988774


No 14 
>cd00988 PDZ_CTP_protease PDZ domain of C-terminal processing-, tail-specific-, and tricorn proteases, which function in posttranslational protein processing, maturation, and disassembly or degradation, in Bacteria, Archaea, and plant chloroplasts. May be responsible for substrate recognition and/or binding, as most PDZ domains bind C-terminal polypeptides, and binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this subfamily of protease-associated PDZ domains a C-terminal beta-strand forms the peptide-binding groove base, a circular permutation with respect to PDZ domains found in Eumetazoan signaling proteins.
Probab=99.26  E-value=1.1e-10  Score=89.63  Aligned_cols=81  Identities=42%  Similarity=0.786  Sum_probs=69.5

Q ss_pred             eeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeC-Ce
Q 015469          101 TGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSG-AE  179 (406)
Q Consensus       101 ~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~-g~  179 (406)
                      .++|+.+...      ..+++|..+.++|||+++||++||+|++|||+++.+++..++...+....++.+.+++.|+ ++
T Consensus         2 ~~lG~~~~~~------~~~~~V~~v~~~s~a~~~gl~~GD~I~~vng~~i~~~~~~~~~~~l~~~~~~~i~l~v~r~~~~   75 (85)
T cd00988           2 GGIGLELKYD------DGGLVITSVLPGSPAAKAGIKAGDIIVAIDGEPVDGLSLEDVVKLLRGKAGTKVRLTLKRGDGE   75 (85)
T ss_pred             eEEEEEEEEc------CCeEEEEEecCCCCHHHcCCCCCCEEEEECCEEcCCCCHHHHHHHhcCCCCCEEEEEEEcCCCC
Confidence            5778887654      4679999999999999999999999999999999998667888888777788999999998 88


Q ss_pred             eEEEEEEe
Q 015469          180 IRHLALTR  187 (406)
Q Consensus       180 ~~~~~v~~  187 (406)
                      ..++++.+
T Consensus        76 ~~~~~~~~   83 (85)
T cd00988          76 PREVTLTR   83 (85)
T ss_pred             EEEEEEEE
Confidence            88777764


No 15 
>cd00991 PDZ_archaeal_metalloprotease PDZ domain of archaeal zinc metalloprotases, presumably membrane-associated or integral membrane proteases, which may be involved in signalling and regulatory mechanisms. May be responsible for substrate recognition and/or binding, as most PDZ domains bind C-terminal polypeptides, and binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this subfamily of protease-associated PDZ domains a C-terminal beta-strand forms the peptide-binding groove base, a circular permutation with respect to PDZ domains found in Eumetazoan signaling proteins.
Probab=99.03  E-value=2.4e-09  Score=81.02  Aligned_cols=68  Identities=29%  Similarity=0.418  Sum_probs=58.9

Q ss_pred             CCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCC-CCCcEEEEEEeCCeeEEEEEE
Q 015469          117 SAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGP-EGSPVELTVRSGAEIRHLALT  186 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~-~g~~v~l~v~r~g~~~~~~v~  186 (406)
                      ..++.|..|.++|||+++||++||+|++|||+++.++  .++...+... .|+++.+++.|+++..+++++
T Consensus         9 ~~Gv~V~~V~~~spa~~aGL~~GDiI~~Ing~~v~~~--~d~~~~l~~~~~g~~v~l~v~r~g~~~~~~~~   77 (79)
T cd00991           9 VAGVVIVGVIVGSPAENAVLHTGDVIYSINGTPITTL--EDFMEALKPTKPGEVITVTVLPSTTKLTNVST   77 (79)
T ss_pred             CCcEEEEEECCCChHHhcCCCCCCEEEEECCEEcCCH--HHHHHHHhcCCCCCEEEEEEEECCEEEEEEEE
Confidence            4579999999999999999999999999999999985  6777777654 588999999999988877664


No 16 
>cd00989 PDZ_metalloprotease PDZ domain of bacterial and plant zinc metalloprotases, presumably membrane-associated or integral membrane proteases, which may be involved in signalling and regulatory mechanisms. May be responsible for substrate recognition and/or binding, as most PDZ domains bind C-terminal polypeptides, and binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this subfamily of protease-associated PDZ domains a C-terminal beta-strand forms the peptide-binding groove base, a circular permutation with respect to PDZ domains found in Eumetazoan signaling proteins.
Probab=99.03  E-value=2e-09  Score=81.27  Aligned_cols=76  Identities=37%  Similarity=0.552  Sum_probs=61.1

Q ss_pred             eEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCCeeEE
Q 015469          103 VGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGAEIRH  182 (406)
Q Consensus       103 ~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g~~~~  182 (406)
                      +|+..+..      ...++|..+.++|||+++||++||+|++|||+++.++  .++...+....++.+.+++.|+++..+
T Consensus         3 ~~~~~g~~------~~~~~V~~v~~~s~a~~~gl~~GD~I~~ing~~i~~~--~~~~~~l~~~~~~~~~l~v~r~~~~~~   74 (79)
T cd00989           3 LGFVPGGP------PIEPVIGEVVPGSPAAKAGLKAGDRILAINGQKIKSW--EDLVDAVQENPGKPLTLTVERNGETIT   74 (79)
T ss_pred             eeEeccCC------ccCcEEEeECCCCHHHHcCCCCCCEEEEECCEECCCH--HHHHHHHHHCCCceEEEEEEECCEEEE
Confidence            45555543      3358899999999999999999999999999999985  677777765557789999999887766


Q ss_pred             EEEE
Q 015469          183 LALT  186 (406)
Q Consensus       183 ~~v~  186 (406)
                      +.+.
T Consensus        75 ~~l~   78 (79)
T cd00989          75 LTLT   78 (79)
T ss_pred             EEec
Confidence            6553


No 17 
>cd00136 PDZ PDZ domain, also called DHR (Dlg homologous region) or GLGF (after a conserved sequence motif). Many PDZ domains bind C-terminal polypeptides, though binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. Heterodimerization through PDZ-PDZ domain interactions adds to the domain's versatility, and PDZ domain-mediated interactions may be modulated dynamically through target phosphorylation. Some PDZ domains play a role in scaffolding supramolecular complexes. PDZ domains are found in diverse signaling proteins in bacteria, archebacteria, and eurkayotes. This CD contains two distinct structural subgroups with either a N- or C-terminal beta-strand forming the peptide-binding groove base. The circular permutation placing the strand on the N-terminus appears to be found in Eumetazoa only, while the C-terminal variant is found in all three kingdoms of life, and seems to co-occur with protease domains. PDZ domains have been named after PSD95(pos
Probab=98.98  E-value=3.2e-09  Score=78.13  Aligned_cols=68  Identities=47%  Similarity=0.715  Sum_probs=57.4

Q ss_pred             eeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEE
Q 015469          102 GVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTV  174 (406)
Q Consensus       102 g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v  174 (406)
                      ++|+.+....     +.+++|..+.++|||+.+||++||+|++|||+++.++...++.++++...|+++++++
T Consensus         2 ~~G~~~~~~~-----~~~~~V~~v~~~s~a~~~gl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v   69 (70)
T cd00136           2 GLGFSIRGGT-----EGGVVVLSVEPGSPAERAGLQAGDVILAVNGTDVKNLTLEDVAELLKKEVGEKVTLTV   69 (70)
T ss_pred             CccEEEecCC-----CCCEEEEEeCCCCHHHHcCCCCCCEEEEECCEECCCCCHHHHHHHHhhCCCCeEEEEE
Confidence            3566665431     2379999999999999999999999999999999998888999999887788888876


No 18 
>cd00990 PDZ_glycyl_aminopeptidase PDZ domain associated with archaeal and bacterial M61 glycyl-aminopeptidases. May be responsible for substrate recognition and/or binding, as most PDZ domains bind C-terminal polypeptides, and binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this subfamily of protease-associated PDZ domains a C-terminal beta-strand is presumed to form the peptide-binding groove base, a circular permutation with respect to PDZ domains found in Eumetazoan signaling proteins.
Probab=98.95  E-value=7.8e-09  Score=78.25  Aligned_cols=67  Identities=27%  Similarity=0.398  Sum_probs=54.9

Q ss_pred             CCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCCeeEEEEEEe
Q 015469          117 SAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGAEIRHLALTR  187 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g~~~~~~v~~  187 (406)
                      ++++.|..|.++|||+.+||++||+|++|||+++.++  .++...+  ..++.+.+++.|+++..++.++.
T Consensus        11 ~~~~~V~~V~~~s~a~~aGl~~GD~I~~Ing~~v~~~--~~~l~~~--~~~~~v~l~v~r~g~~~~~~v~~   77 (80)
T cd00990          11 EGLGKVTFVRDDSPADKAGLVAGDELVAVNGWRVDAL--QDRLKEY--QAGDPVELTVFRDDRLIEVPLTL   77 (80)
T ss_pred             CCcEEEEEECCCChHHHhCCCCCCEEEEECCEEhHHH--HHHHHhc--CCCCEEEEEEEECCEEEEEEEEe
Confidence            4579999999999999999999999999999999873  3443333  36778999999999887776653


No 19 
>cd00986 PDZ_LON_protease PDZ domain of ATP-dependent LON serine proteases. Most PDZ domains bind C-terminal polypeptides, though binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this bacterial subfamily of protease-associated PDZ domains a C-terminal beta-strand  is thought to form the peptide-binding groove base, a circular permutation with respect to PDZ domains found in Eumetazoan signaling proteins.
Probab=98.88  E-value=1.8e-08  Score=76.14  Aligned_cols=69  Identities=26%  Similarity=0.354  Sum_probs=58.1

Q ss_pred             CcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCC-CCCCcEEEEEEeCCeeEEEEEEeec
Q 015469          118 AGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQG-PEGSPVELTVRSGAEIRHLALTREK  189 (406)
Q Consensus       118 ~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~-~~g~~v~l~v~r~g~~~~~~v~~~~  189 (406)
                      .+++|..|.++|||+. ||++||+|++|||.++.++  .++...+.. ..+..+.+++.|+|+..+++++...
T Consensus         8 ~Gv~V~~V~~~s~A~~-gL~~GD~I~~Ing~~v~~~--~~~~~~l~~~~~~~~v~l~v~r~g~~~~~~v~l~~   77 (79)
T cd00986           8 HGVYVTSVVEGMPAAG-KLKAGDHIIAVDGKPFKEA--EELIDYIQSKKEGDTVKLKVKREEKELPEDLILKT   77 (79)
T ss_pred             cCEEEEEECCCCchhh-CCCCCCEEEEECCEECCCH--HHHHHHHHhCCCCCEEEEEEEECCEEEEEEEEEec
Confidence            4689999999999986 7999999999999999985  667777764 5678899999999998887776543


No 20 
>PF00595 PDZ:  PDZ domain (Also known as DHR or GLGF) Coordinates are not yet available;  InterPro: IPR001478 PDZ domains are found in diverse signalling proteins in bacteria, yeasts, plants, insects and vertebrates [, ]. PDZ domains can occur in one or multiple copies and are nearly always found in cytoplasmic proteins. They bind either the carboxyl-terminal sequences of proteins or internal peptide sequences []. In most cases, interaction between a PDZ domain and its target is constitutive, with a binding affinity of 1 to 10 microns. However, agonist-dependent activation of cell surface receptors is sometimes required to promote interaction with a PDZ protein. PDZ domain proteins are frequently associated with the plasma membrane, a compartment where high concentrations of phosphatidylinositol 4,5-bisphosphate (PIP2) are found. Direct interaction between PIP2 and a subset of class II PDZ domains (syntenin, CASK, Tiam-1) has been demonstrated.  PDZ domains consist of 80 to 90 amino acids comprising six beta-strands (beta-A to beta-F) and two alpha-helices, A and B, compactly arranged in a globular structure. Peptide binding of the ligand takes place in an elongated surface groove as an anti-parallel beta-strand interacts with the beta-B strand and the B helix. The structure of PDZ domains allows binding to a free carboxylate group at the end of a peptide through a carboxylate-binding loop between the beta-A and beta-B strands.; GO: 0005515 protein binding; PDB: 3AXA_A 1WF8_A 1QAV_B 1QAU_A 1B8Q_A 1MC7_A 2KAW_A 1I16_A 1VB7_A 1WI4_A ....
Probab=98.82  E-value=1.3e-08  Score=77.24  Aligned_cols=72  Identities=35%  Similarity=0.564  Sum_probs=57.8

Q ss_pred             eeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEE
Q 015469          101 TGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVR  175 (406)
Q Consensus       101 ~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~  175 (406)
                      .++|+.+.......  ..+++|..+.++|||+++||++||+|++|||+++.+++..++..+++...+ +++|+|+
T Consensus        10 ~~lG~~l~~~~~~~--~~~~~V~~v~~~~~a~~~gl~~GD~Il~INg~~v~~~~~~~~~~~l~~~~~-~v~L~V~   81 (81)
T PF00595_consen   10 GPLGFTLRGGSDND--EKGVFVSSVVPGSPAERAGLKVGDRILEINGQSVRGMSHDEVVQLLKSASN-PVTLTVQ   81 (81)
T ss_dssp             SBSSEEEEEESTSS--SEEEEEEEECTTSHHHHHTSSTTEEEEEETTEESTTSBHHHHHHHHHHSTS-EEEEEEE
T ss_pred             CCcCEEEEecCCCC--cCCEEEEEEeCCChHHhcccchhhhhheeCCEeCCCCCHHHHHHHHHCCCC-cEEEEEC
Confidence            35677776542100  148999999999999999999999999999999999998999988886554 7777763


No 21 
>cd00987 PDZ_serine_protease PDZ domain of tryspin-like serine proteases, such as DegP/HtrA, which are oligomeric proteins involved in heat-shock response, chaperone function, and apoptosis. May be responsible for substrate recognition and/or binding, as most PDZ domains bind C-terminal polypeptides, though binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this subfamily of protease-associated PDZ domains a C-terminal beta-strand forms the peptide-binding groove base, a circular permutation with respect to PDZ domains found in Eumetazoan signaling proteins.
Probab=98.72  E-value=7e-08  Score=74.63  Aligned_cols=66  Identities=36%  Similarity=0.550  Sum_probs=54.6

Q ss_pred             CCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCC-CCCcEEEEEEeCCeeEEEE
Q 015469          117 SAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGP-EGSPVELTVRSGAEIRHLA  184 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~-~g~~v~l~v~r~g~~~~~~  184 (406)
                      .++++|..|.++|||+++||++||+|++|||+++.++  .++...+... .+..+.+++.|+|+..++.
T Consensus        23 ~~g~~V~~v~~~s~a~~~gl~~GD~I~~Ing~~i~~~--~~~~~~l~~~~~~~~i~l~v~r~g~~~~~~   89 (90)
T cd00987          23 TKGVLVASVDPGSPAAKAGLKPGDVILAVNGKPVKSV--ADLRRALAELKPGDKVTLTVLRGGKELTVT   89 (90)
T ss_pred             CCEEEEEEECCCCHHHHcCCCcCCEEEEECCEECCCH--HHHHHHHHhcCCCCEEEEEEEECCEEEEee
Confidence            3578999999999999999999999999999999985  5666666543 4788999999998765543


No 22 
>COG3975 Predicted protease with the C-terminal PDZ domain [General function prediction only]
Probab=98.63  E-value=8.2e-08  Score=94.14  Aligned_cols=159  Identities=14%  Similarity=0.155  Sum_probs=106.7

Q ss_pred             EeeeccCCCCcccchhhHHHHHHHHHHHHhccccccCCcchHHHHHhhhhcCCCCCHHHHHHHHHHHHHhCCCC-CCCcc
Q 015469            6 TTIALSETPSLALSEENRLFLEAWRTIDRAYVDKTFNGQSWFRYRENALRNEPMNTREETYMAIRKMLATLDDP-FTRFL   84 (406)
Q Consensus         6 ~~~~~~~~~~~~~~~~~~~f~~~w~~i~~~y~~~~~~~~dW~~~~~~~~~~~~~~~~~~~~~~i~~~~~~L~D~-ht~~~   84 (406)
                      +.++++|+.++..+.+++.+|.+++.|...+-. ..+++..+.++..+...... +..+|++   +.+.+-.++ ...++
T Consensus       362 lv~L~lDl~iR~r~~~~~SLDdvmram~~~~~~-~~~~~t~e~v~av~~~~tg~-dl~~f~~---~~i~~~~~~~l~~~l  436 (558)
T COG3975         362 LVALLLDLLIRERGGGQKSLDDVMRALWKEFGR-AERGYTPEDVQAVLENVTGL-DLATFFD---EYIEGTEPPPLNPLL  436 (558)
T ss_pred             HHHHHHHHHHHhcCCCcccHHHHHHHHHHHhCc-CccCCCHHHHHHHHHhhccc-cHHHHHH---HHhhcCCCCChhhhh
Confidence            345677888899999999999999999998866 44677777777666554442 3344443   444333322 22222


Q ss_pred             ChhhhccccccCcceeeeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCC
Q 015469           85 EPEKFNSLRSGTQGALTGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQG  164 (406)
Q Consensus        85 ~~~~~~~~~~~~~~~~~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~  164 (406)
                      .+....- . ....+...+|+.+...      .++.+|+.|.++|||+.|||.+||+|++|||.+-         ++.+.
T Consensus       437 ~~~gL~~-~-~~~~~~~~LGl~v~~~------~g~~~i~~V~~~gPA~~AGl~~Gd~ivai~G~s~---------~l~~~  499 (558)
T COG3975         437 ERFGLTF-T-PKPREAYYLGLKVKSE------GGHEKITFVFPGGPAYKAGLSPGDKIVAINGISD---------QLDRY  499 (558)
T ss_pred             hhcceEE-E-ecCCCCcccceEeccc------CCeeEEEecCCCChhHhccCCCccEEEEEcCccc---------ccccc
Confidence            2211110 0 1112234677777654      6788999999999999999999999999999821         22234


Q ss_pred             CCCCcEEEEEEeCCeeEEEEEE
Q 015469          165 PEGSPVELTVRSGAEIRHLALT  186 (406)
Q Consensus       165 ~~g~~v~l~v~r~g~~~~~~v~  186 (406)
                      +.+..+.+++.|.+..+++.++
T Consensus       500 ~~~d~i~v~~~~~~~L~e~~v~  521 (558)
T COG3975         500 KVNDKIQVHVFREGRLREFLVK  521 (558)
T ss_pred             ccccceEEEEccCCceEEeecc
Confidence            5788999999999888877664


No 23 
>smart00228 PDZ Domain present in PSD-95, Dlg, and ZO-1/2. Also called DHR (Dlg homologous region) or GLGF (relatively well conserved tetrapeptide in these domains). Some PDZs have been shown to bind C-terminal polypeptides; others appear to bind internal (non-C-terminal) polypeptides. Different PDZs possess different binding specificities.
Probab=98.58  E-value=4.7e-07  Score=68.95  Aligned_cols=74  Identities=39%  Similarity=0.612  Sum_probs=56.1

Q ss_pred             eeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCC
Q 015469          101 TGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGA  178 (406)
Q Consensus       101 ~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g  178 (406)
                      ..+|+.+.....   ...+++|..+.++|||+.+||++||+|++|||+++.++...+....+... +.++.+++.|++
T Consensus        12 ~~~G~~~~~~~~---~~~~~~i~~v~~~s~a~~~gl~~GD~I~~In~~~v~~~~~~~~~~~~~~~-~~~~~l~i~r~~   85 (85)
T smart00228       12 GGLGFSLVGGKD---EGGGVVVSSVVPGSPAAKAGLKVGDVILEVNGTSVEGLTHLEAVDLLKKA-GGKVTLTVLRGG   85 (85)
T ss_pred             CcccEEEECCCC---CCCCEEEEEECCCCHHHHcCCCCCCEEEEECCEECCCCCHHHHHHHHHhC-CCeEEEEEEeCC
Confidence            346666653210   01579999999999999999999999999999999988666666666543 458888887653


No 24 
>PF14685 Tricorn_PDZ:  Tricorn protease PDZ domain; PDB: 1N6F_D 1N6D_C 1N6E_C 1K32_A.
Probab=98.57  E-value=4.1e-07  Score=69.40  Aligned_cols=74  Identities=28%  Similarity=0.482  Sum_probs=52.9

Q ss_pred             eEEEEeeccCCCCCCCcEEEEEeCCC--------ChhhhcC--CCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEE
Q 015469          103 VGLSIGYPTASDGSSAGLVVISSMPG--------GPANRAG--ILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVEL  172 (406)
Q Consensus       103 ~g~~~~~~~~~~~~~~~~~V~~v~~~--------spA~~aG--l~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l  172 (406)
                      +|..+.+.      ++++.|.+++++        ||-.+.|  +++||.|++|||+++..-  .++..+|.++.|+++.|
T Consensus         3 LGAd~~~~------~~~y~I~~I~~gd~~~~~~~sPL~~pGv~v~~GD~I~aInG~~v~~~--~~~~~lL~~~agk~V~L   74 (88)
T PF14685_consen    3 LGADFSYD------NGGYRIARIYPGDPWNPNARSPLAQPGVDVREGDYILAINGQPVTAD--ANPYRLLEGKAGKQVLL   74 (88)
T ss_dssp             -SEEEEEE------TTEEEEEEE-BS-TTSSS-B-GGGGGS----TT-EEEEETTEE-BTT--B-HHHHHHTTTTSEEEE
T ss_pred             cceEEEEc------CCEEEEEEEeCCCCCCccccCCccCCCCCCCCCCEEEEECCEECCCC--CCHHHHhcccCCCEEEE
Confidence            56666655      578999999986        7888887  569999999999999873  57888999999999999


Q ss_pred             EEEeCC-eeEEEE
Q 015469          173 TVRSGA-EIRHLA  184 (406)
Q Consensus       173 ~v~r~g-~~~~~~  184 (406)
                      +|.+.+ +.+++.
T Consensus        75 tv~~~~~~~R~v~   87 (88)
T PF14685_consen   75 TVNRKPGGARTVV   87 (88)
T ss_dssp             EEE-STT-EEEEE
T ss_pred             EEecCCCCceEEE
Confidence            998755 555554


No 25 
>cd00992 PDZ_signaling PDZ domain found in a variety of Eumetazoan signaling molecules, often in tandem arrangements. May be responsible for specific protein-protein interactions, as most PDZ domains bind C-terminal polypeptides, and binding to internal (non-C-terminal) polypeptides and even to lipids has been demonstrated. In this subfamily of PDZ domains an N-terminal beta-strand forms the peptide-binding groove base, a circular permutation with respect to PDZ domains found in proteases.
Probab=98.54  E-value=4.2e-07  Score=68.89  Aligned_cols=70  Identities=37%  Similarity=0.566  Sum_probs=53.4

Q ss_pred             eeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEE
Q 015469          101 TGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTV  174 (406)
Q Consensus       101 ~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v  174 (406)
                      .++|+.+.....   ...+++|..+.++|||+++||++||+|++|||+++.+++..++...++...+ ++++++
T Consensus        12 ~~~G~~~~~~~~---~~~~~~V~~v~~~s~a~~~gl~~GD~I~~ing~~i~~~~~~~~~~~l~~~~~-~v~l~v   81 (82)
T cd00992          12 GGLGFSLRGGKD---SGGGIFVSRVEPGGPAERGGLRVGDRILEVNGVSVEGLTHEEAVELLKNSGD-EVTLTV   81 (82)
T ss_pred             CCcCEEEeCccc---CCCCeEEEEECCCChHHhCCCCCCCEEEEECCEEcCccCHHHHHHHHHhCCC-eEEEEE
Confidence            346666643210   0247999999999999999999999999999999997777888888875443 555554


No 26 
>TIGR00054 RIP metalloprotease RseP. A model that detects fragments as well matches a number of members of the PEPTIDASE FAMILY S2C. The region of match appears not to overlap the active site domain.
Probab=98.50  E-value=4.3e-07  Score=90.60  Aligned_cols=68  Identities=26%  Similarity=0.419  Sum_probs=61.1

Q ss_pred             cEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCCeeEEEEEEee
Q 015469          119 GLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGAEIRHLALTRE  188 (406)
Q Consensus       119 ~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g~~~~~~v~~~  188 (406)
                      +.+|..|.++|||+++||++||+|++|||+++.++  +++...+....++++.++++|+|+..++++++.
T Consensus       204 g~vV~~V~~~SpA~~aGL~~GD~Iv~Vng~~V~s~--~dl~~~l~~~~~~~v~l~v~R~g~~~~~~v~~~  271 (420)
T TIGR00054       204 EPVLSDVTPNSPAEKAGLKEGDYIQSINGEKLRSW--TDFVSAVKENPGKSMDIKVERNGETLSISLTPE  271 (420)
T ss_pred             CcEEEEECCCCHHHHcCCCCCCEEEEECCEECCCH--HHHHHHHHhCCCCceEEEEEECCEEEEEEEEEc
Confidence            57899999999999999999999999999999985  778888877778889999999999888888764


No 27 
>PRK10139 serine endoprotease; Provisional
Probab=98.45  E-value=7.3e-07  Score=89.64  Aligned_cols=69  Identities=20%  Similarity=0.375  Sum_probs=60.3

Q ss_pred             CCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCC-CCCCcEEEEEEeCCeeEEEEEEe
Q 015469          117 SAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQG-PEGSPVELTVRSGAEIRHLALTR  187 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~-~~g~~v~l~v~r~g~~~~~~v~~  187 (406)
                      ..+++|..|.++|||+++||++||+|++|||+++.++  .++...+.. ..|+++.+++.|+|+..+++++.
T Consensus       289 ~~Gv~V~~V~~~SpA~~AGL~~GDvIl~InG~~V~s~--~dl~~~l~~~~~g~~v~l~V~R~G~~~~l~v~~  358 (455)
T PRK10139        289 QRGAFVSEVLPNSGSAKAGVKAGDIITSLNGKPLNSF--AELRSRIATTEPGTKVKLGLLRNGKPLEVEVTL  358 (455)
T ss_pred             CCceEEEEECCCChHHHCCCCCCCEEEEECCEECCCH--HHHHHHHHhcCCCCEEEEEEEECCEEEEEEEEE
Confidence            3578999999999999999999999999999999996  677666654 57889999999999988887764


No 28 
>PRK10898 serine endoprotease; Provisional
Probab=98.43  E-value=1.2e-06  Score=85.47  Aligned_cols=69  Identities=26%  Similarity=0.452  Sum_probs=59.0

Q ss_pred             CcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCC-CCCCcEEEEEEeCCeeEEEEEEee
Q 015469          118 AGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQG-PEGSPVELTVRSGAEIRHLALTRE  188 (406)
Q Consensus       118 ~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~-~~g~~v~l~v~r~g~~~~~~v~~~  188 (406)
                      .+++|..|.++|||+++||++||+|++|||+++.++  .++...+.. ..|+++.+++.|+++..++.++..
T Consensus       279 ~Gv~V~~V~~~spA~~aGL~~GDvI~~Ing~~V~s~--~~l~~~l~~~~~g~~v~l~v~R~g~~~~~~v~l~  348 (353)
T PRK10898        279 QGIVVNEVSPDGPAAKAGIQVNDLIISVNNKPAISA--LETMDQVAEIRPGSVIPVVVMRDDKQLTLQVTIQ  348 (353)
T ss_pred             CeEEEEEECCCChHHHcCCCCCCEEEEECCEEcCCH--HHHHHHHHhcCCCCEEEEEEEECCEEEEEEEEec
Confidence            589999999999999999999999999999999885  555555543 578899999999998888777654


No 29 
>TIGR02038 protease_degS periplasmic serine pepetdase DegS. This family consists of the periplasmic serine protease DegS (HhoB), a shorter paralog of protease DO (HtrA, DegP) and DegQ (HhoA). It is found in E. coli and several other Proteobacteria of the gamma subdivision. It contains a trypsin domain and a single copy of PDZ domain (in contrast to DegP with two copies). A critical role of this DegS is to sense stress in the periplasm and partially degrade an inhibitor of sigma(E).
Probab=98.42  E-value=9.5e-07  Score=86.09  Aligned_cols=69  Identities=35%  Similarity=0.480  Sum_probs=59.6

Q ss_pred             CcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCC-CCCCcEEEEEEeCCeeEEEEEEee
Q 015469          118 AGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQG-PEGSPVELTVRSGAEIRHLALTRE  188 (406)
Q Consensus       118 ~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~-~~g~~v~l~v~r~g~~~~~~v~~~  188 (406)
                      .+++|..|.++|||+++||++||+|++|||+++.++  .++...+.. ..|+++.+++.|+|+..+++++..
T Consensus       278 ~Gv~V~~V~~~spA~~aGL~~GDvI~~Ing~~V~s~--~dl~~~l~~~~~g~~v~l~v~R~g~~~~~~v~l~  347 (351)
T TIGR02038       278 RGIVITGVDPNGPAARAGILVRDVILKYDGKDVIGA--EELMDRIAETRPGSKVMVTVLRQGKQLELPVTID  347 (351)
T ss_pred             ccceEeecCCCChHHHCCCCCCCEEEEECCEEcCCH--HHHHHHHHhcCCCCEEEEEEEECCEEEEEEEEec
Confidence            479999999999999999999999999999999985  666666654 578899999999999888877643


No 30 
>TIGR01713 typeII_sec_gspC general secretion pathway protein C. This model represents GspC, protein C of the main terminal branch of the general secretion pathway, also called type II secretion. This system transports folded proteins across the bacterial outer membrane and is widely distributed in Gram-negative pathogens.
Probab=98.41  E-value=1.2e-06  Score=81.34  Aligned_cols=68  Identities=18%  Similarity=0.218  Sum_probs=57.9

Q ss_pred             CCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCC-CCCCcEEEEEEeCCeeEEEEEE
Q 015469          117 SAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQG-PEGSPVELTVRSGAEIRHLALT  186 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~-~~g~~v~l~v~r~g~~~~~~v~  186 (406)
                      ..++.|..+.++|||+++||++||+|++|||+++.++  .++.+.+.. ..++.++++|.|+|+..++.+.
T Consensus       190 ~~G~~v~~v~~~s~a~~aGLr~GDvIv~ING~~i~~~--~~~~~~l~~~~~~~~v~l~V~R~G~~~~i~v~  258 (259)
T TIGR01713       190 LEGYRLNPGKDPSLFYKSGLQDGDIAVALNGLDLRDP--EQAFQALQMLREETNLTLTVERDGQREDIYVR  258 (259)
T ss_pred             eeEEEEEecCCCCHHHHcCCCCCCEEEEECCEEcCCH--HHHHHHHHhcCCCCeEEEEEEECCEEEEEEEE
Confidence            3589999999999999999999999999999999985  666666654 3668899999999998877653


No 31 
>PRK10779 zinc metallopeptidase RseP; Provisional
Probab=98.41  E-value=9.6e-07  Score=88.98  Aligned_cols=68  Identities=22%  Similarity=0.359  Sum_probs=60.3

Q ss_pred             cEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCCeeEEEEEEee
Q 015469          119 GLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGAEIRHLALTRE  188 (406)
Q Consensus       119 ~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g~~~~~~v~~~  188 (406)
                      +.+|..|.++|||+++||++||+|++|||+++.++  +++.+.+....++++.+++.|+|+..++++++.
T Consensus       222 ~~vV~~V~~~SpA~~AGL~~GDvIl~Ing~~V~s~--~dl~~~l~~~~~~~v~l~v~R~g~~~~~~v~~~  289 (449)
T PRK10779        222 EPVLAEVQPNSAASKAGLQAGDRIVKVDGQPLTQW--QTFVTLVRDNPGKPLALEIERQGSPLSLTLTPD  289 (449)
T ss_pred             CcEEEeeCCCCHHHHcCCCCCCEEEEECCEEcCCH--HHHHHHHHhCCCCEEEEEEEECCEEEEEEEEee
Confidence            47899999999999999999999999999999985  677777776678899999999999888887764


No 32 
>TIGR02037 degP_htrA_DO periplasmic serine protease, Do/DeqQ family. This family consists of a set proteins various designated DegP, heat shock protein HtrA, and protease DO. The ortholog in Pseudomonas aeruginosa is designated MucD and is found in an operon that controls mucoid phenotype. This family also includes the DegQ (HhoA) paralog in E. coli which can rescue a DegP mutant, but not the smaller DegS paralog, which cannot. Members of this family are located in the periplasm and have separable functions as both protease and chaperone. Members have a trypsin domain and two copies of a PDZ domain. This protein protects bacteria from thermal and other stresses and may be important for the survival of bacterial pathogens.// The chaperone function is dominant at low temperatures, whereas the proteolytic activity is turned on at elevated temperatures.
Probab=98.33  E-value=2.1e-06  Score=86.21  Aligned_cols=69  Identities=28%  Similarity=0.491  Sum_probs=59.1

Q ss_pred             CcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCC-CCCCcEEEEEEeCCeeEEEEEEee
Q 015469          118 AGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQG-PEGSPVELTVRSGAEIRHLALTRE  188 (406)
Q Consensus       118 ~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~-~~g~~v~l~v~r~g~~~~~~v~~~  188 (406)
                      .+++|..|.++|||+++||++||+|++|||+++.++  .++...+.. ..|+++++++.|+++..+++++..
T Consensus       257 ~Gv~V~~V~~~spA~~aGL~~GDvI~~Vng~~i~~~--~~~~~~l~~~~~g~~v~l~v~R~g~~~~~~v~l~  326 (428)
T TIGR02037       257 RGALVAQVLPGSPAEKAGLKAGDVILSVNGKPISSF--ADLRRAIGTLKPGKKVTLGILRKGKEKTITVTLG  326 (428)
T ss_pred             CceEEEEccCCCChHHcCCCCCCEEEEECCEEcCCH--HHHHHHHHhcCCCCEEEEEEEECCEEEEEEEEEC
Confidence            578999999999999999999999999999999985  566655543 568899999999999888877643


No 33 
>PRK10779 zinc metallopeptidase RseP; Provisional
Probab=98.27  E-value=1.7e-06  Score=87.16  Aligned_cols=67  Identities=21%  Similarity=0.096  Sum_probs=54.8

Q ss_pred             cEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHh-CCCCCCcEEEEEEeCCeeEEEEEEe
Q 015469          119 GLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERL-QGPEGSPVELTVRSGAEIRHLALTR  187 (406)
Q Consensus       119 ~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l-~~~~g~~v~l~v~r~g~~~~~~v~~  187 (406)
                      ...|..|.++|||++|||++||+|++|||+++.++  +++...+ ....++++++++.|+|+.++++++.
T Consensus       127 ~~lV~~V~~~SpA~kAGLk~GDvI~~vnG~~V~~~--~~l~~~v~~~~~g~~v~v~v~R~gk~~~~~v~l  194 (449)
T PRK10779        127 RPVVGEIAPNSIAAQAQIAPGTELKAVDGIETPDW--DAVRLALVSKIGDESTTITVAPFGSDQRRDKTL  194 (449)
T ss_pred             CccccccCCCCHHHHcCCCCCCEEEEECCEEcCCH--HHHHHHHHhhccCCceEEEEEeCCccceEEEEe
Confidence            34789999999999999999999999999999996  5554444 3346788999999999877666543


No 34 
>PRK10942 serine endoprotease; Provisional
Probab=98.27  E-value=3.4e-06  Score=85.25  Aligned_cols=69  Identities=23%  Similarity=0.368  Sum_probs=58.9

Q ss_pred             CCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCC-CCCCcEEEEEEeCCeeEEEEEEe
Q 015469          117 SAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQG-PEGSPVELTVRSGAEIRHLALTR  187 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~-~~g~~v~l~v~r~g~~~~~~v~~  187 (406)
                      ..+++|..|.++|||+++||++||+|++|||+++.++  .++...+.. ..|+++.+++.|+|+.+++.++.
T Consensus       310 ~~GvlV~~V~~~SpA~~AGL~~GDvIl~InG~~V~s~--~dl~~~l~~~~~g~~v~l~v~R~G~~~~v~v~l  379 (473)
T PRK10942        310 QRGAFVSQVLPNSSAAKAGIKAGDVITSLNGKPISSF--AALRAQVGTMPVGSKLTLGLLRDGKPVNVNVEL  379 (473)
T ss_pred             CCceEEEEECCCChHHHcCCCCCCEEEEECCEECCCH--HHHHHHHHhcCCCCEEEEEEEECCeEEEEEEEe
Confidence            3578999999999999999999999999999999995  666655543 46889999999999888877754


No 35 
>TIGR02860 spore_IV_B stage IV sporulation protein B. SpoIVB, the stage IV sporulation protein B of endospore-forming bacteria such as Bacillus subtilis, is a serine proteinase, expressed in the spore (rather than mother cell) compartment, that participates in a proteolytic activation cascade for Sigma-K. It appears to be universal among endospore-forming bacteria and occurs nowhere else.
Probab=98.21  E-value=9.7e-06  Score=78.91  Aligned_cols=69  Identities=28%  Similarity=0.424  Sum_probs=56.7

Q ss_pred             CcEEEEEeC--------CCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCCeeEEEEEEee
Q 015469          118 AGLVVISSM--------PGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGAEIRHLALTRE  188 (406)
Q Consensus       118 ~~~~V~~v~--------~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g~~~~~~v~~~  188 (406)
                      .++.|....        .+|||+++||++||+|++|||+++.++  +++.+.+....++++.+++.|+++..++++.+.
T Consensus       105 ~GVlVvg~~~v~~~~g~~~SPAa~AGLq~GDiIvsING~~V~s~--~DL~~iL~~~~g~~V~LtV~R~Ge~~tv~V~Pv  181 (402)
T TIGR02860       105 KGVLVVGFSDIETEKGKIHSPGEEAGIQIGDRILKINGEKIKNM--DDLANLINKAGGEKLTLTIERGGKIIETVIKPV  181 (402)
T ss_pred             CEEEEEEEEcccccCCCCCCHHHHcCCCCCCEEEEECCEECCCH--HHHHHHHHhCCCCeEEEEEEECCEEEEEEEEEe
Confidence            466665542        258999999999999999999999996  778788876668899999999999888887643


No 36 
>PRK10139 serine endoprotease; Provisional
Probab=98.19  E-value=5.4e-06  Score=83.46  Aligned_cols=65  Identities=25%  Similarity=0.409  Sum_probs=56.1

Q ss_pred             CcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCCeeEEEEE
Q 015469          118 AGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGAEIRHLAL  185 (406)
Q Consensus       118 ~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g~~~~~~v  185 (406)
                      .+++|..|.++|||+++||++||+|++|||+++.+|  +++.+.+.... +++.+++.|+|+...+.+
T Consensus       390 ~Gv~V~~V~~~spA~~aGL~~GD~I~~Ing~~v~~~--~~~~~~l~~~~-~~v~l~v~R~g~~~~~~~  454 (455)
T PRK10139        390 KGIKIDEVVKGSPAAQAGLQKDDVIIGVNRDRVNSI--AEMRKVLAAKP-AIIALQIVRGNESIYLLL  454 (455)
T ss_pred             CceEEEEeCCCChHHHcCCCCCCEEEEECCEEcCCH--HHHHHHHHhCC-CeEEEEEEECCEEEEEEe
Confidence            468999999999999999999999999999999996  77777776544 688999999998776654


No 37 
>TIGR02037 degP_htrA_DO periplasmic serine protease, Do/DeqQ family. This family consists of a set proteins various designated DegP, heat shock protein HtrA, and protease DO. The ortholog in Pseudomonas aeruginosa is designated MucD and is found in an operon that controls mucoid phenotype. This family also includes the DegQ (HhoA) paralog in E. coli which can rescue a DegP mutant, but not the smaller DegS paralog, which cannot. Members of this family are located in the periplasm and have separable functions as both protease and chaperone. Members have a trypsin domain and two copies of a PDZ domain. This protein protects bacteria from thermal and other stresses and may be important for the survival of bacterial pathogens.// The chaperone function is dominant at low temperatures, whereas the proteolytic activity is turned on at elevated temperatures.
Probab=98.15  E-value=7e-06  Score=82.40  Aligned_cols=65  Identities=31%  Similarity=0.531  Sum_probs=56.5

Q ss_pred             CcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCC-CCCCcEEEEEEeCCeeEEEE
Q 015469          118 AGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQG-PEGSPVELTVRSGAEIRHLA  184 (406)
Q Consensus       118 ~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~-~~g~~v~l~v~r~g~~~~~~  184 (406)
                      .+++|..|.++|||+++||++||+|++|||+++.++  .++.+.+.. +.++.+.+++.|+++...+.
T Consensus       362 ~Gv~V~~V~~~SpA~~aGL~~GDvI~~Ing~~V~s~--~d~~~~l~~~~~g~~v~l~v~R~g~~~~~~  427 (428)
T TIGR02037       362 KGVVVTKVVSGSPAARAGLQPGDVILSVNQQPVSSV--AELRKVLDRAKKGGRVALLILRGGATIFVT  427 (428)
T ss_pred             CceEEEEeCCCCHHHHcCCCCCCEEEEECCEEcCCH--HHHHHHHHhcCCCCEEEEEEEECCEEEEEE
Confidence            579999999999999999999999999999999984  777777765 36889999999999876543


No 38 
>PF04495 GRASP55_65:  GRASP55/65 PDZ-like domain ;  InterPro: IPR007583 GRASP55 (Golgi reassembly stacking protein of 55 kDa) and GRASP65 (a 65 kDa) protein are highly homologous. GRASP55 is a component of the Golgi stacking machinery. GRASP65, an N-ethylmaleimide-sensitive membrane protein required for the stacking of Golgi cisternae in a cell-free system [].; PDB: 3RLE_A 4EDJ_A.
Probab=98.13  E-value=1.2e-05  Score=67.09  Aligned_cols=86  Identities=24%  Similarity=0.391  Sum_probs=57.9

Q ss_pred             eeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCC-CCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEe--C
Q 015469          101 TGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILS-GDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRS--G  177 (406)
Q Consensus       101 ~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~-GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r--~  177 (406)
                      ..+|+.+++..........+.|..|.|+|||+.|||++ .|.|+.+|+..+.+  .+++.+++....+.++.|.|..  .
T Consensus        26 g~LG~sv~~~~~~~~~~~~~~Vl~V~p~SPA~~AGL~p~~DyIig~~~~~l~~--~~~l~~~v~~~~~~~l~L~Vyns~~  103 (138)
T PF04495_consen   26 GLLGISVRFESFEGAEEEGWHVLRVAPNSPAAKAGLEPFFDYIIGIDGGLLDD--EDDLFELVEANENKPLQLYVYNSKT  103 (138)
T ss_dssp             SSS-EEEEEEE-TTGCCCEEEEEEE-TTSHHHHTT--TTTEEEEEETTCE--S--TCHHHHHHHHTTTS-EEEEEEETTT
T ss_pred             CCCcEEEEEecccccccceEEEeEecCCCHHHHCCccccccEEEEccceecCC--HHHHHHHHHHcCCCcEEEEEEECCC
Confidence            34566666543332335578999999999999999998 69999999988886  4678888888888999999975  4


Q ss_pred             CeeEEEEEEee
Q 015469          178 AEIRHLALTRE  188 (406)
Q Consensus       178 g~~~~~~v~~~  188 (406)
                      ...+.+++++.
T Consensus       104 ~~vR~V~i~P~  114 (138)
T PF04495_consen  104 DSVREVTITPS  114 (138)
T ss_dssp             TCEEEEEE---
T ss_pred             CeEEEEEEEcC
Confidence            45566776553


No 39 
>TIGR03279 cyano_FeS_chp putative FeS-containing Cyanobacterial-specific oxidoreductase. Members of this protein family are predicted FeS-containing oxidoreductases of unknown function, apparently restricted to and universal across the Cyanobacteria. The high trusted cutoff score for this model, 700 bits, excludes homologs from other lineages. This exclusion seems justified because a significant number of sequence positions are simultaneously unique to and invariant across the Cyanobacteria, suggesting a specialized, conserved function, perhaps related to photosynthesis. A distantly related protein family, TIGR03278, in universal in and restricted to archaeal methanogens, and may be linked to methanogenesis.
Probab=98.12  E-value=6.3e-06  Score=80.75  Aligned_cols=62  Identities=19%  Similarity=0.393  Sum_probs=51.2

Q ss_pred             EEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEE-eCCeeEEEEEEee
Q 015469          122 VISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVR-SGAEIRHLALTRE  188 (406)
Q Consensus       122 V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~-r~g~~~~~~v~~~  188 (406)
                      |..|.|+|||+++||++||+|++|||+++.+|  .++...+.   ++.+.+++. |+|+..++++.+.
T Consensus         2 I~~V~pgSpAe~AGLe~GD~IlsING~~V~Dw--~D~~~~l~---~e~l~L~V~~rdGe~~~l~Ie~~   64 (433)
T TIGR03279         2 ISAVLPGSIAEELGFEPGDALVSINGVAPRDL--IDYQFLCA---DEELELEVLDANGESHQIEIEKD   64 (433)
T ss_pred             cCCcCCCCHHHHcCCCCCCEEEEECCEECCCH--HHHHHHhc---CCcEEEEEEcCCCeEEEEEEecC
Confidence            56789999999999999999999999999997  56555553   357888886 7888888888754


No 40 
>PRK10942 serine endoprotease; Provisional
Probab=98.07  E-value=1.3e-05  Score=81.11  Aligned_cols=65  Identities=26%  Similarity=0.448  Sum_probs=55.9

Q ss_pred             CcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCCeeEEEEE
Q 015469          118 AGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGAEIRHLAL  185 (406)
Q Consensus       118 ~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g~~~~~~v  185 (406)
                      .+++|..|.++|||+++||++||+|++|||+++.++  +++.+.+... +..+.++|+|+|....+.+
T Consensus       408 ~gvvV~~V~~~S~A~~aGL~~GDvIv~VNg~~V~s~--~dl~~~l~~~-~~~v~l~V~R~g~~~~v~~  472 (473)
T PRK10942        408 KGVVVDNVKPGTPAAQIGLKKGDVIIGANQQPVKNI--AELRKILDSK-PSVLALNIQRGDSSIYLLM  472 (473)
T ss_pred             CCeEEEEeCCCChHHHcCCCCCCEEEEECCEEcCCH--HHHHHHHHhC-CCeEEEEEEECCEEEEEEe
Confidence            468999999999999999999999999999999995  7777777653 3789999999998766543


No 41 
>KOG3129 consensus 26S proteasome regulatory complex, subunit PSMD9 [Posttranslational modification, protein turnover, chaperones]
Probab=97.96  E-value=2.8e-05  Score=67.60  Aligned_cols=73  Identities=32%  Similarity=0.365  Sum_probs=60.0

Q ss_pred             cEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCC-HHHHHHHhCCCCCCcEEEEEEeCCeeEEEEEEeeccc
Q 015469          119 GLVVISSMPGGPANRAGILSGDVILAIDDTSTESMG-IYDAAERLQGPEGSPVELTVRSGAEIRHLALTREKVS  191 (406)
Q Consensus       119 ~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~-~~~~~~~l~~~~g~~v~l~v~r~g~~~~~~v~~~~~~  191 (406)
                      ..+|..|.|+|||+.+||+.||+|+++....-.+.. +..+....+...+..+.+++.|.|....+.+++..+.
T Consensus       140 Fa~V~sV~~~SPA~~aGl~~gD~il~fGnV~sgn~~~lq~i~~~v~~~e~~~v~v~v~R~g~~v~L~ltP~~W~  213 (231)
T KOG3129|consen  140 FAVVDSVVPGSPADEAGLCVGDEILKFGNVHSGNFLPLQNIAAVVQSNEDQIVSVTVIREGQKVVLSLTPKKWQ  213 (231)
T ss_pred             eEEEeecCCCChhhhhCcccCceEEEecccccccchhHHHHHHHHHhccCcceeEEEecCCCEEEEEeCccccc
Confidence            578999999999999999999999999987766543 3445555566778999999999999998888876553


No 42 
>KOG3209 consensus WW domain-containing protein [General function prediction only]
Probab=97.86  E-value=2.8e-05  Score=78.59  Aligned_cols=73  Identities=26%  Similarity=0.352  Sum_probs=59.0

Q ss_pred             eeeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeC
Q 015469          100 LTGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSG  177 (406)
Q Consensus       100 ~~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~  177 (406)
                      -.||||.+-....+    ..--|..+++||||++.| |++||.|++|||++|.+++..+++++++ ..|-+|+|+|...
T Consensus       764 NeGFGFVi~sS~~k----p~sgiGrIieGSPAdRCgkLkVGDrilAVNG~sI~~lsHadiv~LIK-daGlsVtLtIip~  837 (984)
T KOG3209|consen  764 NEGFGFVIMSSQNK----PESGIGRIIEGSPADRCGKLKVGDRILAVNGQSILNLSHADIVSLIK-DAGLSVTLTIIPP  837 (984)
T ss_pred             CCceeEEEEecccC----CCCCccccccCChhHhhccccccceEEEecCeeeeccCchhHHHHHH-hcCceEEEEEcCh
Confidence            36788876432211    122389999999999998 9999999999999999999999999997 4788999998653


No 43 
>KOG3553 consensus Tax interaction protein TIP1 [Cell wall/membrane/envelope biogenesis]
Probab=97.79  E-value=2e-05  Score=59.95  Aligned_cols=47  Identities=26%  Similarity=0.336  Sum_probs=40.4

Q ss_pred             CCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhC
Q 015469          117 SAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQ  163 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~  163 (406)
                      +.+++|++|.+||||+.|||+.+|.|+.|||....-...+.+++.+.
T Consensus        58 D~GiYvT~V~eGsPA~~AGLrihDKIlQvNG~DfTMvTHd~Avk~i~  104 (124)
T KOG3553|consen   58 DKGIYVTRVSEGSPAEIAGLRIHDKILQVNGWDFTMVTHDQAVKRIT  104 (124)
T ss_pred             CccEEEEEeccCChhhhhcceecceEEEecCceeEEEEhHHHHHHhh
Confidence            55899999999999999999999999999998876665666666665


No 44 
>TIGR00054 RIP metalloprotease RseP. A model that detects fragments as well matches a number of members of the PEPTIDASE FAMILY S2C. The region of match appears not to overlap the active site domain.
Probab=97.78  E-value=3.3e-05  Score=77.13  Aligned_cols=63  Identities=19%  Similarity=0.208  Sum_probs=51.9

Q ss_pred             cEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCCeeEEEE
Q 015469          119 GLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGAEIRHLA  184 (406)
Q Consensus       119 ~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g~~~~~~  184 (406)
                      +..|..|.++|||+++|+++||+|++|||+++.++  .++...+.... .++.+++.|+++..++.
T Consensus       129 g~~V~~V~~~SpA~~AGL~~GDvI~~vng~~v~~~--~dl~~~ia~~~-~~v~~~I~r~g~~~~l~  191 (420)
T TIGR00054       129 GPVIELLDKNSIALEAGIEPGDEILSVNGNKIPGF--KDVRQQIADIA-GEPMVEILAERENWTFE  191 (420)
T ss_pred             CceeeccCCCCHHHHcCCCCCCEEEEECCEEcCCH--HHHHHHHHhhc-ccceEEEEEecCceEec
Confidence            56899999999999999999999999999999985  66666555444 67889998877665543


No 45 
>COG0265 DegQ Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain [Posttranslational modification, protein turnover, chaperones]
Probab=97.65  E-value=0.00026  Score=69.12  Aligned_cols=70  Identities=36%  Similarity=0.590  Sum_probs=59.0

Q ss_pred             CCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhC-CCCCCcEEEEEEeCCeeEEEEEEee
Q 015469          117 SAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQ-GPEGSPVELTVRSGAEIRHLALTRE  188 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~-~~~g~~v~l~v~r~g~~~~~~v~~~  188 (406)
                      ..+.+|..+.+++||.++|+++||+|+++||+++.+.  .++...+. ...|+++.+++.|+|+..++.++..
T Consensus       269 ~~G~~V~~v~~~spa~~agi~~Gdii~~vng~~v~~~--~~l~~~v~~~~~g~~v~~~~~r~g~~~~~~v~l~  339 (347)
T COG0265         269 AAGAVVLGVLPGSPAAKAGIKAGDIITAVNGKPVASL--SDLVAAVASNRPGDEVALKLLRGGKERELAVTLG  339 (347)
T ss_pred             CCceEEEecCCCChHHHcCCCCCCEEEEECCEEccCH--HHHHHHHhccCCCCEEEEEEEECCEEEEEEEEec
Confidence            3468999999999999999999999999999999984  55555544 3468999999999999888877643


No 46 
>KOG3550 consensus Receptor targeting protein Lin-7 [Extracellular structures]
Probab=97.55  E-value=0.00024  Score=58.38  Aligned_cols=71  Identities=30%  Similarity=0.488  Sum_probs=54.0

Q ss_pred             eeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhc-CCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEE
Q 015469          101 TGVGLSIGYPTASDGSSAGLVVISSMPGGPANRA-GILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVR  175 (406)
Q Consensus       101 ~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~a-Gl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~  175 (406)
                      .|+||.+---   +..+..++|+.++||+-|++- ||+.||.+++|||.++..-..+..+.++....| ++.+.|+
T Consensus       101 eglgfnvmgg---keqnspiyisriipggvadrhgglkrgdqllsvngvsvege~hekavellkaa~g-svklvvr  172 (207)
T KOG3550|consen  101 EGLGFNVMGG---KEQNSPIYISRIIPGGVADRHGGLKRGDQLLSVNGVSVEGEHHEKAVELLKAAVG-SVKLVVR  172 (207)
T ss_pred             cccceeeccC---cccCCceEEEeecCCccccccCcccccceeEeecceeecchhhHHHHHHHHHhcC-cEEEEEe
Confidence            4677765321   112557999999999999987 599999999999999998777888888875444 5566554


No 47 
>COG3480 SdrC Predicted secreted protein containing a PDZ domain [Signal transduction mechanisms]
Probab=97.20  E-value=0.0021  Score=59.86  Aligned_cols=66  Identities=20%  Similarity=0.321  Sum_probs=54.5

Q ss_pred             cEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCC-CCCCcEEEEEEe-CCeeEEEEEEe
Q 015469          119 GLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQG-PEGSPVELTVRS-GAEIRHLALTR  187 (406)
Q Consensus       119 ~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~-~~g~~v~l~v~r-~g~~~~~~v~~  187 (406)
                      ++++..+..+||+... |+.||.|++|||+++.+  .+++..++.+ +.|++++++++| ++++...+++-
T Consensus       131 gvyv~~v~~~~~~~gk-l~~gD~i~avdg~~f~s--~~e~i~~v~~~k~Gd~VtI~~~r~~~~~~~~~~tl  198 (342)
T COG3480         131 GVYVLSVIDNSPFKGK-LEAGDTIIAVDGEPFTS--SDELIDYVSSKKPGDEVTIDYERHNETPEIVTITL  198 (342)
T ss_pred             eEEEEEccCCcchhce-eccCCeEEeeCCeecCC--HHHHHHHHhccCCCCeEEEEEEeccCCCceEEEEE
Confidence            7899999999998654 99999999999999998  4788887765 479999999986 66666555543


No 48 
>KOG3209 consensus WW domain-containing protein [General function prediction only]
Probab=97.13  E-value=0.0015  Score=66.46  Aligned_cols=77  Identities=27%  Similarity=0.380  Sum_probs=63.2

Q ss_pred             eeeeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCC-CCCCcEEEEEEe
Q 015469           99 ALTGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQG-PEGSPVELTVRS  176 (406)
Q Consensus        99 ~~~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~-~~g~~v~l~v~r  176 (406)
                      .+.||||.+.--++ -..+..+.|.+|++++||++.| |+.||+|+.|||..+-.....++++.++. +.|..|.|++.|
T Consensus       353 g~~GFGfTliGGdd-~~gDefLqVKsvl~DGPAa~dGkle~GDviV~INg~cvlGhTHAqaV~~fqaiPvg~~V~L~lcR  431 (984)
T KOG3209|consen  353 GYMGFGFTLIGGDD-VRGDEFLQVKSVLKDGPAAQDGKLETGDVIVHINGECVLGHTHAQAVKRFQAIPVGQSVDLVLCR  431 (984)
T ss_pred             cccccceEEecCCc-CCCCceeeeeecccCCchhhcCccccCcEEEEECCceeccccHHHHHHHhhccccCCeeeEEEec
Confidence            45789998754321 1124468899999999999998 99999999999999999888899988874 568999999977


No 49 
>PRK09681 putative type II secretion protein GspC; Provisional
Probab=97.03  E-value=0.005  Score=57.19  Aligned_cols=54  Identities=15%  Similarity=0.294  Sum_probs=41.9

Q ss_pred             hhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCC-CCCCcEEEEEEeCCeeEEEEEE
Q 015469          131 ANRAGILSGDVILAIDDTSTESMGIYDAAERLQG-PEGSPVELTVRSGAEIRHLALT  186 (406)
Q Consensus       131 A~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~-~~g~~v~l~v~r~g~~~~~~v~  186 (406)
                      -..+||++||++++|||.++.+.  .+..+++.. ...+.++|+|+|+|+..++.+.
T Consensus       220 F~~~GLq~GDva~sING~dL~D~--~qa~~l~~~L~~~tei~ltVeRdGq~~~i~i~  274 (276)
T PRK09681        220 FDASGFKEGDIAIALNQQDFTDP--RAMIALMRQLPSMDSIQLTVLRKGARHDISIA  274 (276)
T ss_pred             HHHcCCCCCCEEEEeCCeeCCCH--HHHHHHHHHhccCCeEEEEEEECCEEEEEEEE
Confidence            46779999999999999999874  444443332 2567899999999998887663


No 50 
>KOG1421 consensus Predicted signaling-associated protein (contains a PDZ domain) [General function prediction only]
Probab=96.99  E-value=0.0025  Score=64.73  Aligned_cols=69  Identities=29%  Similarity=0.490  Sum_probs=58.5

Q ss_pred             CCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeCCeeEEEEEEee
Q 015469          117 SAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSGAEIRHLALTRE  188 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~g~~~~~~v~~~  188 (406)
                      .+-++|..|.++|||++. |++||.+++||+.-+.++  ..+.+.+....|+.++|+|.|.|+..+++++-.
T Consensus       302 tgmLvV~~vL~~gpa~k~-Le~GDillavN~t~l~df--~~l~~iLDegvgk~l~LtI~Rggqelel~vtvq  370 (955)
T KOG1421|consen  302 TGMLVVETVLPEGPAEKK-LEPGDILLAVNSTCLNDF--EALEQILDEGVGKNLELTIQRGGQELELTVTVQ  370 (955)
T ss_pred             ceeEEEEEeccCCchhhc-cCCCcEEEEEcceehHHH--HHHHHHHhhccCceEEEEEEeCCEEEEEEEEec
Confidence            345789999999999987 999999999998888773  566677777789999999999999888887643


No 51 
>KOG3580 consensus Tight junction proteins [Signal transduction mechanisms]
Probab=96.72  E-value=0.0026  Score=63.56  Aligned_cols=57  Identities=26%  Similarity=0.446  Sum_probs=48.4

Q ss_pred             cEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHH-hCCCCCCcEEEEEE
Q 015469          119 GLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAER-LQGPEGSPVELTVR  175 (406)
Q Consensus       119 ~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~-l~~~~g~~v~l~v~  175 (406)
                      +++|..|.++|||+..||+.||.|++||.++..++..++++.+ |.-++|+.++|.-.
T Consensus       430 GIFVaGvqegspA~~eGlqEGDQIL~VN~vdF~nl~REeAVlfLL~lPkGEevtilaQ  487 (1027)
T KOG3580|consen  430 GIFVAGVQEGSPAEQEGLQEGDQILKVNTVDFRNLVREEAVLFLLELPKGEEVTILAQ  487 (1027)
T ss_pred             eEEEeecccCCchhhccccccceeEEeccccchhhhHHHHHHHHhcCCCCcEEeehhh
Confidence            7999999999999999999999999999999999866666554 44567888887653


No 52 
>KOG3549 consensus Syntrophins (type gamma) [Extracellular structures]
Probab=96.36  E-value=0.0063  Score=57.05  Aligned_cols=73  Identities=25%  Similarity=0.358  Sum_probs=60.3

Q ss_pred             eeeeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEE
Q 015469           99 ALTGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVR  175 (406)
Q Consensus        99 ~~~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~  175 (406)
                      ...|+|+.+.--..   .+=.++|+.+.++-.|+..| |=.||.|++|||+.+.....++++++|+ +.|+.|+++|.
T Consensus        64 ~vGGlGLSIKGGaE---Hn~PvviSkI~kdQaAd~tG~LFvGDAilqvNGi~v~~c~HeevV~iLR-NAGdeVtlTV~  137 (505)
T KOG3549|consen   64 KVGGLGLSIKGGAE---HNLPVVISKIYKDQAADITGQLFVGDAILQVNGIYVTACPHEEVVNILR-NAGDEVTLTVK  137 (505)
T ss_pred             ecCcceeeeccccc---cCccEEeehhhhhhhhhhcCceEeeeeeEEeccEEeecCChHHHHHHHH-hcCCEEEEEeH
Confidence            45788888753211   12368899999999999998 7899999999999999999999999998 58899999984


No 53 
>KOG3542 consensus cAMP-regulated guanine nucleotide exchange factor [Signal transduction mechanisms]
Probab=96.28  E-value=0.0042  Score=62.94  Aligned_cols=57  Identities=32%  Similarity=0.522  Sum_probs=48.8

Q ss_pred             CCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEE
Q 015469          117 SAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVR  175 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~  175 (406)
                      ..+++|..|.|++.|+++||+.||+|++|||+..+.+....+..+|+++  ..+++++.
T Consensus       561 GfgifV~~V~pgskAa~~GlKRgDqilEVNgQnfenis~~KA~eiLrnn--thLtltvK  617 (1283)
T KOG3542|consen  561 GFGIFVAEVFPGSKAAREGLKRGDQILEVNGQNFENISAKKAEEILRNN--THLTLTVK  617 (1283)
T ss_pred             cceeEEeeecCCchHHHhhhhhhhhhhhccccchhhhhHHHHHHHhcCC--ceEEEEEe
Confidence            4479999999999999999999999999999999998878888888853  45566654


No 54 
>KOG3552 consensus FERM domain protein FRM-8 [General function prediction only]
Probab=96.26  E-value=0.0058  Score=64.05  Aligned_cols=67  Identities=27%  Similarity=0.355  Sum_probs=53.8

Q ss_pred             eeeeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEe
Q 015469           99 ALTGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRS  176 (406)
Q Consensus        99 ~~~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r  176 (406)
                      ...||||.-+         ..++|..|.+|+|+.- .|++||.|++|||.++.....+.+..+++. -.+++.|+|-+
T Consensus        65 ~~lGFgfvag---------rPviVr~VT~GGps~G-KL~PGDQIl~vN~Epv~daprervIdlvRa-ce~sv~ltV~q  131 (1298)
T KOG3552|consen   65 ASLGFGFVAG---------RPVIVRFVTEGGPSIG-KLQPGDQILAVNGEPVKDAPRERVIDLVRA-CESSVNLTVCQ  131 (1298)
T ss_pred             ccccceeecC---------CceEEEEecCCCCccc-cccCCCeEEEecCcccccccHHHHHHHHHH-HhhhcceEEec
Confidence            4567777653         3688999999999864 399999999999999999888888888874 34677888755


No 55 
>KOG3651 consensus Protein kinase C, alpha binding protein [Signal transduction mechanisms]
Probab=96.14  E-value=0.011  Score=54.50  Aligned_cols=56  Identities=23%  Similarity=0.342  Sum_probs=46.7

Q ss_pred             cEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEE
Q 015469          119 GLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVR  175 (406)
Q Consensus       119 ~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~  175 (406)
                      .++|..|..++||++.| ++.||+|++|||+++.+...-++.++++... ..|.+.+.
T Consensus        31 ClYiVQvFD~tPAa~dG~i~~GDEi~avNg~svKGktKveVAkmIQ~~~-~eV~IhyN   87 (429)
T KOG3651|consen   31 CLYIVQVFDKTPAAKDGRIRCGDEIVAVNGISVKGKTKVEVAKMIQVSL-NEVKIHYN   87 (429)
T ss_pred             eEEEEEeccCCchhccCccccCCeeEEecceeecCccHHHHHHHHHHhc-cceEEEeh
Confidence            58999999999999998 9999999999999999987677778887433 45666663


No 56 
>KOG1892 consensus Actin filament-binding protein Afadin [Cytoskeleton]
Probab=95.87  E-value=0.02  Score=60.41  Aligned_cols=58  Identities=31%  Similarity=0.461  Sum_probs=50.1

Q ss_pred             cEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeC
Q 015469          119 GLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSG  177 (406)
Q Consensus       119 ~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~  177 (406)
                      +++|..|++|++|+..| |+.||.+++|||+.+-+++.+++..++. ..|..|.+.|...
T Consensus       961 GIYvKsVV~GgaAd~DGRL~aGDQLLsVdG~SLiGisQErAA~lmt-rtg~vV~leVaKq 1019 (1629)
T KOG1892|consen  961 GIYVKSVVEGGAADHDGRLEAGDQLLSVDGHSLIGISQERAARLMT-RTGNVVHLEVAKQ 1019 (1629)
T ss_pred             ceEEEEeccCCccccccccccCceeeeecCcccccccHHHHHHHHh-ccCCeEEEehhhh
Confidence            79999999999999888 9999999999999999998777777775 4677888888643


No 57 
>KOG1320 consensus Serine protease [Posttranslational modification, protein turnover, chaperones]
Probab=95.82  E-value=0.031  Score=55.73  Aligned_cols=68  Identities=19%  Similarity=0.275  Sum_probs=55.5

Q ss_pred             cEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCC-CCCcEEEEEEeCCeeEEEEEEee
Q 015469          119 GLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGP-EGSPVELTVRSGAEIRHLALTRE  188 (406)
Q Consensus       119 ~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~-~g~~v~l~v~r~g~~~~~~v~~~  188 (406)
                      .+.|..|.+++++...++.+||+|++|||+++.+.  .++..+++.. .++++.+..+|..+..++.+..+
T Consensus       399 ~v~is~Vlp~~~~~~~~~~~g~~V~~vng~~V~n~--~~l~~~i~~~~~~~~v~vl~~~~~e~~tl~Il~~  467 (473)
T KOG1320|consen  399 LVLVSQVLPGSINGGYGLKPGDQVVKVNGKPVKNL--KHLYELIEECSTEDKVAVLDRRSAEDATLEILPE  467 (473)
T ss_pred             EEEEEEeccCCCcccccccCCCEEEEECCEEeech--HHHHHHHHhcCcCceEEEEEecCccceeEEeccc
Confidence            47789999999999999999999999999999994  7777777653 24577777777777777776543


No 58 
>cd07021 Clp_protease_NfeD_like Nodulation formation efficiency D (NfeD) is a membrane-bound ClpP-class protease. Nodulation formation efficiency D (NfeD; stomatin operon partner protein, STOPP; DUF107) is a member of membrane-anchored ClpP-class proteases. Currently, more than 300 NfeD homologs have been identified - all of which are bacterial or archaeal in origin. Majority of these genomes have been shown to possess operons containing a homologous NfeD/stomatin gene pair, causing NfeD to be previously named STOPP (stomatin operon partner protein). NfeD homologs can be divided into two groups: long and short forms. Long-form homologs have a putative ClpP-class serine protease domain while the short form homologs do not. Downstream from the ClpP-class domain is the so-called NfeD or DUF107 domain. N-terminal region of the NfeD homolog PH1510 (1510-N or PH1510-N) from Pyrococcus horikoshii has been shown to possess serine protease activity and has a Ser-Lys catalytic dyad, preferentiall
Probab=95.81  E-value=0.058  Score=47.23  Aligned_cols=69  Identities=29%  Similarity=0.437  Sum_probs=57.6

Q ss_pred             chHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEE
Q 015469          223 NASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLV  302 (406)
Q Consensus       223 ~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLv  302 (406)
                      .....+.+.|++..+.+++.|||++ +.|||.+..+..+...+..                          .+.|++..+
T Consensus        13 ~~~~~l~~~l~~a~~~~~~~ivl~i-nspGG~v~~~~~I~~~l~~--------------------------~~~pvva~V   65 (178)
T cd07021          13 GLAAFVERALKEAKEEGADAVVLDI-DTPGGRVDSALEIVDLILN--------------------------SPIPTIAYV   65 (178)
T ss_pred             HHHHHHHHHHHHHHhCCCCeEEEEE-ECcCCCHHHHHHHHHHHHh--------------------------CCCCEEEEE
Confidence            3456788889888877899999999 8899999998888877642                          226899999


Q ss_pred             cCCCccHHHHHHHHHh
Q 015469          303 NKGTASASEILAGALK  318 (406)
Q Consensus       303 d~~t~SaaE~~a~~lk  318 (406)
                      ++.++|++-+++.+..
T Consensus        66 ~g~AaSaG~~ia~a~d   81 (178)
T cd07021          66 NDRAASAGALIALAAD   81 (178)
T ss_pred             CCchHHHHHHHHHhCC
Confidence            9999999999999775


No 59 
>KOG3532 consensus Predicted protein kinase [General function prediction only]
Probab=95.79  E-value=0.027  Score=57.44  Aligned_cols=65  Identities=26%  Similarity=0.340  Sum_probs=48.4

Q ss_pred             eeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEE
Q 015469          101 TGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVEL  172 (406)
Q Consensus       101 ~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l  172 (406)
                      ..+|+.+....     ..-+.|-.|.+++||.++.+++||++++|||+||.+.  .++.+.++...|+-..|
T Consensus       386 ~~ig~vf~~~~-----~~~v~v~tv~~ns~a~k~~~~~gdvlvai~~~pi~s~--~q~~~~~~s~~~~~~~l  450 (1051)
T KOG3532|consen  386 SPIGLVFDKNT-----NRAVKVCTVEDNSLADKAAFKPGDVLVAINNVPIRSE--RQATRFLQSTTGDLTVL  450 (1051)
T ss_pred             CceeEEEecCC-----ceEEEEEEecCCChhhHhcCCCcceEEEecCccchhH--HHHHHHHHhcccceEEE
Confidence            45677665431     3356799999999999999999999999999999984  66666666544443333


No 60 
>KOG3580 consensus Tight junction proteins [Signal transduction mechanisms]
Probab=95.74  E-value=0.025  Score=56.76  Aligned_cols=57  Identities=25%  Similarity=0.432  Sum_probs=46.5

Q ss_pred             cEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeC
Q 015469          119 GLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSG  177 (406)
Q Consensus       119 ~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~  177 (406)
                      .++|..|+||+||+-. |+.||.|+.|||.++.+....-+++.|+ +.|+...|+|+|.
T Consensus        41 SiViSDVlpGGPAeG~-LQenDrvvMVNGvsMenv~haFAvQqLr-ksgK~A~ItvkRp   97 (1027)
T KOG3580|consen   41 SIVISDVLPGGPAEGL-LQENDRVVMVNGVSMENVLHAFAVQQLR-KSGKVAAITVKRP   97 (1027)
T ss_pred             eEEEeeccCCCCcccc-cccCCeEEEEcCcchhhhHHHHHHHHHH-hhccceeEEeccc
Confidence            5899999999999744 9999999999999998875555666676 4667778888765


No 61 
>COG3031 PulC Type II secretory pathway, component PulC [Intracellular trafficking and secretion]
Probab=95.66  E-value=0.027  Score=50.47  Aligned_cols=59  Identities=20%  Similarity=0.246  Sum_probs=45.0

Q ss_pred             eCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCC-CCCcEEEEEEeCCeeEEEEE
Q 015469          125 SMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGP-EGSPVELTVRSGAEIRHLAL  185 (406)
Q Consensus       125 v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~-~g~~v~l~v~r~g~~~~~~v  185 (406)
                      .-+++.-...||++||+.++||+..+.+  .+++..+++.- .-..+.+||+|+|+...+.+
T Consensus       214 gkd~slF~~sglq~GDIavaiNnldltd--p~~m~~llq~l~~m~s~qlTv~R~G~rhdInV  273 (275)
T COG3031         214 GKDGSLFYKSGLQRGDIAVAINNLDLTD--PEDMFRLLQMLRNMPSLQLTVIRRGKRHDINV  273 (275)
T ss_pred             CCCcchhhhhcCCCcceEEEecCcccCC--HHHHHHHHHhhhcCcceEEEEEecCccceeee
Confidence            3345677788999999999999999988  46665555432 33578999999998877654


No 62 
>KOG3571 consensus Dishevelled 3 and related proteins [General function prediction only]
Probab=95.34  E-value=0.036  Score=54.69  Aligned_cols=62  Identities=34%  Similarity=0.474  Sum_probs=51.1

Q ss_pred             CCCCcEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCCCC--CCcEEEEEEe
Q 015469          115 GSSAGLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQGPE--GSPVELTVRS  176 (406)
Q Consensus       115 ~~~~~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~--g~~v~l~v~r  176 (406)
                      ..+++++|..+.++++.+..| |.+||.|+.||.....+++.++++..|+...  ..+++++|-.
T Consensus       274 rgDggIYVgsImkgGAVA~DGRIe~GDMiLQVNevsFENmSNd~AVrvLREaV~~~gPi~ltvAk  338 (626)
T KOG3571|consen  274 RGDGGIYVGSIMKGGAVALDGRIEPGDMILQVNEVSFENMSNDQAVRVLREAVSRPGPIKLTVAK  338 (626)
T ss_pred             CCCCceEEeeeccCceeeccCccCccceEEEeeecchhhcCchHHHHHHHHHhccCCCeEEEEee
Confidence            357899999999999887777 9999999999999999998888888887532  2357777743


No 63 
>KOG3551 consensus Syntrophins (type beta) [Extracellular structures]
Probab=94.97  E-value=0.025  Score=53.92  Aligned_cols=71  Identities=24%  Similarity=0.383  Sum_probs=55.8

Q ss_pred             eeeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEE
Q 015469          100 LTGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTV  174 (406)
Q Consensus       100 ~~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v  174 (406)
                      ..|+|+.+.--..   ..=.+.|+.+.+|-.|++.+ |-.||.|++|||..+.+.+.+++++.|+ ..|+.|.+.|
T Consensus        95 ~gGLGISIKGGre---NkMPIlISKIFkGlAADQt~aL~~gDaIlSVNG~dL~~AtHdeAVqaLK-raGkeV~lev  166 (506)
T KOG3551|consen   95 AGGLGISIKGGRE---NKMPILISKIFKGLAADQTGALFLGDAILSVNGEDLRDATHDEAVQALK-RAGKEVLLEV  166 (506)
T ss_pred             CCcceEEeecCcc---cCCceehhHhccccccccccceeeccEEEEecchhhhhcchHHHHHHHH-hhCceeeeee
Confidence            4678887753210   12258899999999999987 9999999999999999988899888886 4677777666


No 64 
>KOG3605 consensus Beta amyloid precursor-binding protein [General function prediction only]
Probab=94.62  E-value=0.041  Score=55.91  Aligned_cols=70  Identities=27%  Similarity=0.480  Sum_probs=56.5

Q ss_pred             cEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCCCCC-CcEEEEEEeCCeeEEEEEEee
Q 015469          119 GLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQGPEG-SPVELTVRSGAEIRHLALTRE  188 (406)
Q Consensus       119 ~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g-~~v~l~v~r~g~~~~~~v~~~  188 (406)
                      .++|.+...++||++.| |-.||.|++|||.++-.+.+.....++++.++ +.|+++|.+=.-..++.|.|.
T Consensus       674 TVViAnmm~~GpAarsgkLnIGDQiiaING~SLVGLPLstcQs~Ik~~KnQT~VkltiV~cpPV~~V~I~RP  745 (829)
T KOG3605|consen  674 TVVIANMMHGGPAARSGKLNIGDQIMSINGTSLVGLPLSTCQSIIKGLKNQTAVKLNIVSCPPVTTVLIRRP  745 (829)
T ss_pred             HHHHHhcccCChhhhcCCccccceeEeecCceeccccHHHHHHHHhcccccceEEEEEecCCCceEEEeecc
Confidence            46678888999999998 99999999999999999988888888887654 567888876555566666554


No 65 
>KOG0609 consensus Calcium/calmodulin-dependent serine protein kinase/membrane-associated guanylate kinase [Signal transduction mechanisms]
Probab=94.25  E-value=0.1  Score=52.30  Aligned_cols=69  Identities=25%  Similarity=0.384  Sum_probs=55.3

Q ss_pred             eeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEe
Q 015469          102 GVGLSIGYPTASDGSSAGLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRS  176 (406)
Q Consensus       102 g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r  176 (406)
                      .+|+.++...     ...++|..+..|+.+.+.| |..||+|.+|||+++.+....++..+++... .++++.+..
T Consensus       135 plG~Tik~~e-----~~~~~vARI~~GG~~~r~glL~~GD~i~EvNGi~v~~~~~~e~q~~l~~~~-G~itfkiiP  204 (542)
T KOG0609|consen  135 PLGATIRVEE-----DTKVVVARIMHGGMADRQGLLHVGDEILEVNGISVANKSPEELQELLRNSR-GSITFKIIP  204 (542)
T ss_pred             ccceEEEecc-----CCccEEeeeccCCcchhccceeeccchheecCeecccCCHHHHHHHHHhCC-CcEEEEEcc
Confidence            3566665531     2368999999999999999 7999999999999999988888888888666 466776643


No 66 
>KOG3606 consensus Cell polarity protein PAR6 [Signal transduction mechanisms]
Probab=94.23  E-value=0.11  Score=47.37  Aligned_cols=59  Identities=17%  Similarity=0.381  Sum_probs=48.9

Q ss_pred             CcEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEeC
Q 015469          118 AGLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRSG  177 (406)
Q Consensus       118 ~~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r~  177 (406)
                      .+++|...+||+-|+..| |.+.|+|++|||+.|...+++++..++-.+ ...+-+||+..
T Consensus       194 pGIFISRlVpGGLAeSTGLLaVnDEVlEVNGIEVaGKTLDQVTDMMvAN-shNLIiTVkPA  253 (358)
T KOG3606|consen  194 PGIFISRLVPGGLAESTGLLAVNDEVLEVNGIEVAGKTLDQVTDMMVAN-SHNLIITVKPA  253 (358)
T ss_pred             CceEEEeecCCccccccceeeecceeEEEcCEEeccccHHHHHHHHhhc-ccceEEEeccc
Confidence            479999999999999999 699999999999999998888888877643 34566666543


No 67 
>KOG3834 consensus Golgi reassembly stacking protein GRASP65, contains PDZ domain [Intracellular trafficking, secretion, and vesicular transport]
Probab=94.21  E-value=0.16  Score=49.45  Aligned_cols=82  Identities=27%  Similarity=0.374  Sum_probs=59.0

Q ss_pred             eEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCC-CCCEEEEE-CCEecCCCCHHHHHHHhCCCCCCcEEEEEEe--CC
Q 015469          103 VGLSIGYPTASDGSSAGLVVISSMPGGPANRAGIL-SGDVILAI-DDTSTESMGIYDAAERLQGPEGSPVELTVRS--GA  178 (406)
Q Consensus       103 ~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~-~GD~I~~I-ng~~v~~~~~~~~~~~l~~~~g~~v~l~v~r--~g  178 (406)
                      ||+.+++-...--...-+.|.+|.++|||+.|||+ -+|.|+-+ |.+--.   .+++..++..+.++.+.+.|..  ..
T Consensus        94 lGvsvrFcsf~~A~~~vwHvl~V~p~SPaalAgl~~~~DYivG~~~~~~~~---~eDl~~lIeshe~kpLklyVYN~D~d  170 (462)
T KOG3834|consen   94 LGVSVRFCSFDGAVESVWHVLSVEPNSPAALAGLRPYTDYIVGIWDAVMHE---EEDLFTLIESHEGKPLKLYVYNHDTD  170 (462)
T ss_pred             cceEEEeccCccchhheeeeeecCCCCHHHhcccccccceEecchhhhccc---hHHHHHHHHhccCCCcceeEeecCCC
Confidence            66666654321111235779999999999999998 88999988 654433   3788899998999999998864  33


Q ss_pred             eeEEEEEEe
Q 015469          179 EIRHLALTR  187 (406)
Q Consensus       179 ~~~~~~v~~  187 (406)
                      ..+.+++++
T Consensus       171 ~~ReVti~p  179 (462)
T KOG3834|consen  171 SCREVTITP  179 (462)
T ss_pred             ccceEEeec
Confidence            456666664


No 68 
>KOG0606 consensus Microtubule-associated serine/threonine kinase and related proteins [Signal transduction mechanisms; General function prediction only]
Probab=94.05  E-value=0.071  Score=57.65  Aligned_cols=54  Identities=28%  Similarity=0.345  Sum_probs=45.1

Q ss_pred             EEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEE
Q 015469          120 LVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTV  174 (406)
Q Consensus       120 ~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v  174 (406)
                      -.|..|.++|||..+|+++||.|+.|||+++..+...++.+++.. .|..+.+.+
T Consensus       660 h~v~sv~egsPA~~agls~~DlIthvnge~v~gl~H~ev~~Lll~-~gn~v~~~t  713 (1205)
T KOG0606|consen  660 HSVGSVEEGSPAFEAGLSAGDLITHVNGEPVHGLVHTEVMELLLK-SGNKVTLRT  713 (1205)
T ss_pred             eeeeeecCCCCccccCCCccceeEeccCcccchhhHHHHHHHHHh-cCCeeEEEe
Confidence            457889999999999999999999999999999988999988873 344444433


No 69 
>PF12812 PDZ_1:  PDZ-like domain
Probab=93.05  E-value=0.22  Score=37.19  Aligned_cols=42  Identities=21%  Similarity=0.256  Sum_probs=34.2

Q ss_pred             EEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhC
Q 015469          120 LVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQ  163 (406)
Q Consensus       120 ~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~  163 (406)
                      .++.....++++...|+..|..|.+|||+++.++  +++.+.++
T Consensus        32 gv~v~~~~g~~~~~~~i~~g~iI~~Vn~kpt~~L--d~f~~vvk   73 (78)
T PF12812_consen   32 GVYVAVSGGSLAFAGGISKGFIITSVNGKPTPDL--DDFIKVVK   73 (78)
T ss_pred             EEEEEecCCChhhhCCCCCCeEEEeECCcCCcCH--HHHHHHHH
Confidence            5566667888888777999999999999999994  67666655


No 70 
>cd07020 Clp_protease_NfeD_1 Nodulation formation efficiency D (NfeD) is a membrane-bound ClpP-class protease. Nodulation formation efficiency D (NfeD; stomatin operon partner protein, STOPP; DUF107) is a member of membrane-anchored ClpP-class proteases. Currently, more than 300 NfeD homologs have been identified - all of which are bacterial or archaeal in origin. Majority of these genomes have been shown to possess operons containing a homologous NfeD/stomatin gene pair, causing NfeD to be previously named STOPP (stomatin operon partner protein). NfeD homologs can be divided into two groups: long and short forms. Long-form homologs have a putative ClpP-class serine protease domain while the short form homologs do not. Downstream from the ClpP-class domain is the so-called NfeD or DUF107 domain. N-terminal region of the NfeD homolog PH1510 (1510-N or PH1510-N) from Pyrococcus horikoshii has been shown to possess serine protease activity and has a Ser-Lys catalytic dyad, preferentially c
Probab=92.90  E-value=0.81  Score=40.35  Aligned_cols=70  Identities=29%  Similarity=0.391  Sum_probs=53.7

Q ss_pred             chHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEE
Q 015469          223 NASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLV  302 (406)
Q Consensus       223 ~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLv  302 (406)
                      .....+.+.|..+.+.+++.++|++ +.|||+...+..+...+.                          ..++|++..+
T Consensus        13 ~~~~~l~~~l~~a~~~~~~~vvl~I-nSpGG~v~~~~~i~~~l~--------------------------~~~kPvia~v   65 (187)
T cd07020          13 ATADYLERAIDQAEEGGADALIIEL-DTPGGLLDSTREIVQAIL--------------------------ASPVPVVVYV   65 (187)
T ss_pred             HHHHHHHHHHHHHHhCCCCEEEEEE-ECCCCCHHHHHHHHHHHH--------------------------hCCCCEEEEE
Confidence            3456788888888777789999866 467789888887766552                          1347899999


Q ss_pred             c---CCCccHHHHHHHHHhc
Q 015469          303 N---KGTASASEILAGALKD  319 (406)
Q Consensus       303 d---~~t~SaaE~~a~~lk~  319 (406)
                      +   +.++|++-.++.+-..
T Consensus        66 ~~~~G~AasgG~~iala~D~   85 (187)
T cd07020          66 YPSGARAASAGTYILLAAHI   85 (187)
T ss_pred             ecCCCCchhHHHHHHHhCCc
Confidence            8   8999999998887654


No 71 
>COG0750 Predicted membrane-associated Zn-dependent proteases 1 [Cell envelope biogenesis, outer membrane]
Probab=92.68  E-value=0.44  Score=46.84  Aligned_cols=58  Identities=29%  Similarity=0.347  Sum_probs=45.1

Q ss_pred             EEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCc---EEEEEEe-CCee
Q 015469          121 VVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGSP---VELTVRS-GAEI  180 (406)
Q Consensus       121 ~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~---v~l~v~r-~g~~  180 (406)
                      .+..+..+|+|..+|+++||+|+++|+.++.++  .++...+....+..   +.+.+.| ++..
T Consensus       132 ~~~~v~~~s~a~~a~l~~Gd~iv~~~~~~i~~~--~~~~~~~~~~~~~~~~~~~i~~~~~~~~~  193 (375)
T COG0750         132 VVGEVAPKSAAALAGLRPGDRIVAVDGEKVASW--DDVRRLLVAAAGDVFNLLTILVIRLDGEA  193 (375)
T ss_pred             eeeecCCCCHHHHcCCCCCCEEEeECCEEccCH--HHHHHHHHhccCCcccceEEEEEecccee
Confidence            344788999999999999999999999999996  55555555445555   7778877 5554


No 72 
>KOG3605 consensus Beta amyloid precursor-binding protein [General function prediction only]
Probab=90.46  E-value=0.22  Score=50.90  Aligned_cols=48  Identities=25%  Similarity=0.378  Sum_probs=42.1

Q ss_pred             EEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCCCC
Q 015469          121 VVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPEGS  168 (406)
Q Consensus       121 ~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~  168 (406)
                      +|-+...|+-|++.|+++|-+|++|||++|-....+.++++|....|+
T Consensus       759 iICSLlRGGIAERGGVRVGHRIIEINgQSVVA~pHekIV~lLs~aVGE  806 (829)
T KOG3605|consen  759 IICSLLRGGIAERGGVRVGHRIIEINGQSVVATPHEKIVQLLSNAVGE  806 (829)
T ss_pred             EeehhhcccchhccCceeeeeEEEECCceEEeccHHHHHHHHHHhhhh
Confidence            577888999999999999999999999999888788899888765553


No 73 
>cd07015 Clp_protease_NfeD Nodulation formation efficiency D (NfeD) is a membrane-bound ClpP-class protease. Nodulation formation efficiency D (NfeD; stomatin operon partner protein, STOPP; DUF107) is a member of membrane-anchored ClpP-class proteases. Currently, more than 300 NfeD homologs have been identified - all of which are bacterial or archaeal in origin. Majority of these genomes have been shown to possess operons containing a homologous NfeD/stomatin gene pair, causing NfeD to be previously named STOPP (stomatin operon partner protein). NfeD homologs can be divided into two groups: long and short forms. Long-form homologs have a putative ClpP-class serine protease domain while the short form homologs do not. Downstream from the ClpP-class domain is the so-called NfeD or DUF107 domain. N-terminal region of the NfeD homolog PH1510 (1510-N or PH1510-N) from Pyrococcus horikoshii has been shown to possess serine protease activity and has a Ser-Lys catalytic dyad, preferentially cle
Probab=89.12  E-value=2.9  Score=36.37  Aligned_cols=70  Identities=17%  Similarity=0.185  Sum_probs=54.4

Q ss_pred             chHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEE
Q 015469          223 NASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLV  302 (406)
Q Consensus       223 ~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLv  302 (406)
                      .....+.+.+++..+.+++.|+|++- -|||.+..+..+...+.                          ..+.||++.+
T Consensus        13 ~~~~~l~~~l~~A~~~~~~~i~l~in-SPGG~v~~~~~I~~~i~--------------------------~~~~pvv~~v   65 (172)
T cd07015          13 YTYDQFDRYITIAEQDNAEAIIIELD-TPGGRADAAGNIVQRIQ--------------------------QSKIPVIIYV   65 (172)
T ss_pred             hHHHHHHHHHHHHhcCCCCeEEEEEE-CCCCCHHHHHHHHHHHH--------------------------hcCcCEEEEE
Confidence            34567888888877778999999995 56788888877766552                          1246799999


Q ss_pred             c---CCCccHHHHHHHHHhc
Q 015469          303 N---KGTASASEILAGALKD  319 (406)
Q Consensus       303 d---~~t~SaaE~~a~~lk~  319 (406)
                      +   +..+|++-+++.+-..
T Consensus        66 ~p~g~~AaSag~~I~~a~~~   85 (172)
T cd07015          66 YPPGASAASAGTYIALGSHL   85 (172)
T ss_pred             ecCCCeehhHHHHHHHhcCc
Confidence            8   8899999999888665


No 74 
>KOG1738 consensus Membrane-associated guanylate kinase-interacting protein/connector enhancer of KSR-like [Nucleotide transport and metabolism]
Probab=88.80  E-value=0.68  Score=47.35  Aligned_cols=60  Identities=23%  Similarity=0.329  Sum_probs=48.2

Q ss_pred             eeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCCC
Q 015469          101 TGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQGP  165 (406)
Q Consensus       101 ~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~~  165 (406)
                      .|+|+.+....     ++..+|+.+.++|||...+ |..||+|+.||+..+-+|.+..++..++..
T Consensus       213 eglg~~I~Ssy-----dg~h~~s~~~e~Spad~~~kI~dgdEv~qiN~qtvVgwqlk~vV~sL~~~  273 (638)
T KOG1738|consen  213 EGLGLYIDSSY-----DGPHVTSKIFEQSPADYRQKILDGDEVLQINEQTVVGWQLKVVVSSLRET  273 (638)
T ss_pred             cCCceEEeeec-----CCceeccccccCChHHHhhcccCccceeeecccccccchhHhHHhhcccC
Confidence            45666664432     5677899999999999886 999999999999999999888777777643


No 75 
>cd00394 Clp_protease_like Caseinolytic protease (ClpP) is an ATP-dependent protease. Clp protease (caseinolytic protease; ClpP; endopeptidase Clp; Peptidase S14; ATP-dependent protease, ClpAP)-like enzymes are highly conserved serine proteases and belong to the ClpP/Crotonase superfamily. Included in this family are Clp proteases that are involved in a number of cellular processes such as degradation of misfolded proteins, regulation of short-lived proteins and housekeeping removal of dysfunctional proteins. They are also implicated in the control of cell growth, targeting DNA-binding protein from starved cells. The functional Clp protease is comprised of two components: a proteolytic component and one of several regulatory ATPase components, both of which are required for effective levels of protease activity in the presence of ATP. Active site consists of the triad Ser, His and Asp, preferring hydrophobic or non-polar residues at P1 or P1' positions. The protease exists as a tetradec
Probab=88.39  E-value=2.1  Score=36.50  Aligned_cols=69  Identities=26%  Similarity=0.365  Sum_probs=50.4

Q ss_pred             chHHHHHHHHHHHhcC-CCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEE
Q 015469          223 NASGAVREAIDTLRSN-SVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVL  301 (406)
Q Consensus       223 ~~~~~~~~~~~~~~~~-~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vL  301 (406)
                      ...+++.+.|+.+.+. .+++++|++. .+||....+..+...+.                          .+++|++..
T Consensus        11 ~~~~~l~~~l~~a~~d~~~~~ivl~~~-s~Gg~~~~~~~i~~~l~--------------------------~~~kpvva~   63 (161)
T cd00394          11 VSADQLAAQIRFAEADNSVKAIVLEVN-TPGGRVDAGMNIVDALQ--------------------------ASRKPVIAY   63 (161)
T ss_pred             chHHHHHHHHHHHHhCCCCceEEEEEE-CCCcCHHHHHHHHHHHH--------------------------HhCCCEEEE
Confidence            3456788888877654 4999999996 46777777666665441                          133789999


Q ss_pred             EcCCCccHHHHHHHHHh
Q 015469          302 VNKGTASASEILAGALK  318 (406)
Q Consensus       302 vd~~t~SaaE~~a~~lk  318 (406)
                      +++.++|++=.++.+..
T Consensus        64 ~~g~~~s~g~~la~~~d   80 (161)
T cd00394          64 VGGQAASAGYYIATAAN   80 (161)
T ss_pred             ECChhHHHHHHHHhCCC
Confidence            99999999977776554


No 76 
>KOG3834 consensus Golgi reassembly stacking protein GRASP65, contains PDZ domain [Intracellular trafficking, secretion, and vesicular transport]
Probab=87.09  E-value=1.3  Score=43.33  Aligned_cols=68  Identities=24%  Similarity=0.303  Sum_probs=48.1

Q ss_pred             CcEEEEEeCCCChhhhcCCCC-CCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEe--CCeeEEEEEEe
Q 015469          118 AGLVVISSMPGGPANRAGILS-GDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRS--GAEIRHLALTR  187 (406)
Q Consensus       118 ~~~~V~~v~~~spA~~aGl~~-GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r--~g~~~~~~v~~  187 (406)
                      .++.|.+|.++|||.++||.+ -|-|++|||..+..- .+.+..+++... +.|++++..  ....+.+.|++
T Consensus        15 eg~hvlkVqedSpa~~aglepffdFIvSI~g~rL~~d-nd~Lk~llk~~s-ekVkltv~n~kt~~~R~v~I~p   85 (462)
T KOG3834|consen   15 EGYHVLKVQEDSPAHKAGLEPFFDFIVSINGIRLNKD-NDTLKALLKANS-EKVKLTVYNSKTQEVRIVEIVP   85 (462)
T ss_pred             eeEEEEEeecCChHHhcCcchhhhhhheeCcccccCc-hHHHHHHHHhcc-cceEEEEEecccceeEEEEecc
Confidence            467899999999999999865 579999999999864 233444555433 448998853  33445555544


No 77 
>TIGR00706 SppA_dom signal peptide peptidase SppA, 36K type. The member of this family from Bacillus subtilis was shown to have properties consistent with a role in degrading signal peptides after cleavage from precursor proteins, although it was not demonstrated conclusively.
Probab=84.83  E-value=6.7  Score=35.10  Aligned_cols=70  Identities=20%  Similarity=0.274  Sum_probs=49.9

Q ss_pred             hHHHHHHHHHHHhc-CCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEE
Q 015469          224 ASGAVREAIDTLRS-NSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLV  302 (406)
Q Consensus       224 ~~~~~~~~~~~~~~-~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLv  302 (406)
                      ...++.+.++++.+ ..++++||++- .+||.+..+..+...+..                +        +..+||+..+
T Consensus        14 s~~~l~~~l~~a~~d~~i~~vvl~~~-s~Gg~~~~~~~l~~~i~~----------------~--------~~~kpvia~v   68 (207)
T TIGR00706        14 SPEDFDKKIKRIKDDKSIKALLLRIN-SPGGTVVASEEIYEKLKK----------------L--------KAKKPVVASM   68 (207)
T ss_pred             CHHHHHHHHHHHhhCCCccEEEEEec-CCCCCHHHHHHHHHHHHH----------------h--------cCCCCEEEEE
Confidence            35678888888764 57999999985 567777666555444311                0        0247899999


Q ss_pred             cCCCccHHHHHHHHHh
Q 015469          303 NKGTASASEILAGALK  318 (406)
Q Consensus       303 d~~t~SaaE~~a~~lk  318 (406)
                      ++.++|++=.++.+..
T Consensus        69 ~g~a~s~g~~la~aaD   84 (207)
T TIGR00706        69 GGVAASGGYYIAMAAD   84 (207)
T ss_pred             CCccchHHHHHHhcCC
Confidence            9999998888877653


No 78 
>KOG3938 consensus RGS-GAIP interacting protein GIPC, contains PDZ domain [Signal transduction mechanisms; Intracellular trafficking, secretion, and vesicular transport]
Probab=83.02  E-value=2.2  Score=39.09  Aligned_cols=68  Identities=26%  Similarity=0.346  Sum_probs=50.3

Q ss_pred             eeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCC-CCCCcEEEEE
Q 015469          102 GVGLSIGYPTASDGSSAGLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQG-PEGSPVELTV  174 (406)
Q Consensus       102 g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~-~~g~~v~l~v  174 (406)
                      .+|+.+.-.     .-+..+|..+.++|--++.. +.+||.|-+|||+.+-.+.++++..+|+. +.|++.++.+
T Consensus       138 alGlTITDN-----G~GyAFIKrIkegsvidri~~i~VGd~IEaiNge~ivG~RHYeVArmLKel~rge~ftlrL  207 (334)
T KOG3938|consen  138 ALGLTITDN-----GAGYAFIKRIKEGSVIDRIEAICVGDHIEAINGESIVGKRHYEVARMLKELPRGETFTLRL  207 (334)
T ss_pred             ccceEEeeC-----CcceeeeEeecCCchhhhhhheeHHhHHHhhcCccccchhHHHHHHHHHhcccCCeeEEEe
Confidence            356665422     23457788888888776653 89999999999999999999999988875 3455555554


No 79 
>cd07016 S14_ClpP_1 Caseinolytic protease (ClpP) is an ATP-dependent, highly conserved serine protease. Clp protease (caseinolytic protease; ClpP; Peptidase S14) is a highly conserved serine protease present throughout in bacteria and eukaryota, but seems to be absent in archaea, mollicutes and some fungi. This subfamily only contains bacterial sequences. Clp proteases are involved in a number of cellular processes such as degradation of misfolded proteins, regulation of short-lived proteins and housekeeping removal of dysfunctional proteins. They are also implicated in the control of cell growth, targeting DNA-binding protein from starved cells. ClpP has also been linked to the tight regulation of virulence genes in the pathogens Listeria monocytogenes and Salmonella typhimurium. This enzyme belong to the family of ATP-dependent proteases; the functional Clp protease is comprised of two components: a proteolytic component and one of several regulatory ATPase components, both of which a
Probab=82.10  E-value=4.4  Score=34.55  Aligned_cols=66  Identities=20%  Similarity=0.299  Sum_probs=51.4

Q ss_pred             hHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEEc
Q 015469          224 ASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLVN  303 (406)
Q Consensus       224 ~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLvd  303 (406)
                      ..+.+.+.|..+...  +.++|.+ +-|||+...+..+...+..                          .++|++..++
T Consensus        16 ~~~~~~~~l~~~~~~--~~i~l~i-nspGG~~~~~~~i~~~i~~--------------------------~~~pvi~~v~   66 (160)
T cd07016          16 TAKEFKDALDALGDD--SDITVRI-NSPGGDVFAGLAIYNALKR--------------------------HKGKVTVKID   66 (160)
T ss_pred             CHHHHHHHHHhccCC--CCEEEEE-ECCCCCHHHHHHHHHHHHh--------------------------cCCCEEEEEc
Confidence            466788888877643  8999999 7789998888777666521                          2468999999


Q ss_pred             CCCccHHHHHHHHHh
Q 015469          304 KGTASASEILAGALK  318 (406)
Q Consensus       304 ~~t~SaaE~~a~~lk  318 (406)
                      +.++|++-.++.+-.
T Consensus        67 g~a~s~g~~ia~a~d   81 (160)
T cd07016          67 GLAASAASVIAMAGD   81 (160)
T ss_pred             chHHhHHHHHHhcCC
Confidence            999999988887765


No 80 
>KOG2921 consensus Intramembrane metalloprotease (sterol-regulatory element-binding protein (SREBP) protease) [Posttranslational modification, protein turnover, chaperones]
Probab=81.83  E-value=2  Score=41.61  Aligned_cols=46  Identities=26%  Similarity=0.338  Sum_probs=37.4

Q ss_pred             CCcEEEEEeCCCChhhhc-CCCCCCEEEEECCEecCCCCHHHHHHHhCC
Q 015469          117 SAGLVVISSMPGGPANRA-GILSGDVILAIDDTSTESMGIYDAAERLQG  164 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~a-Gl~~GD~I~~Ing~~v~~~~~~~~~~~l~~  164 (406)
                      +.++.|++|...||+.-- ||.+||.|+++||-|+..  .+++.++++.
T Consensus       219 g~gV~Vtev~~~Spl~gprGL~vgdvitsldgcpV~~--v~dW~ecl~t  265 (484)
T KOG2921|consen  219 GEGVTVTEVPSVSPLFGPRGLSVGDVITSLDGCPVHK--VSDWLECLAT  265 (484)
T ss_pred             CceEEEEeccccCCCcCcccCCccceEEecCCcccCC--HHHHHHHHHh
Confidence            447889999988887544 899999999999999998  4677766653


No 81 
>PRK14512 ATP-dependent Clp protease proteolytic subunit; Provisional
Probab=80.74  E-value=9.8  Score=33.85  Aligned_cols=82  Identities=21%  Similarity=0.166  Sum_probs=58.6

Q ss_pred             CceEEEEcCccccchHHHHHHHHHHHhc-CCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCC
Q 015469          210 PRIGYIKLTSFNQNASGAVREAIDTLRS-NSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDG  288 (406)
Q Consensus       210 ~~igyl~i~~f~~~~~~~~~~~~~~~~~-~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~  288 (406)
                      .++-||. ..........+.+.|..+.. .+.+.++|.+- -+||++..+..+...+..                     
T Consensus        23 ~r~I~i~-g~I~~~~~~~i~~~L~~l~~~~~~~~I~l~IN-SpGG~v~ag~aI~d~i~~---------------------   79 (197)
T PRK14512         23 SRSIVIA-GEINKDLSELFQEKILLLEALDSKKPIFVYID-SEGGDIDAGFAIFNMIRF---------------------   79 (197)
T ss_pred             CcEEEEC-CEEcHHHHHHHHHHHHHHHhcCCCCCEEEEEE-CCCCCHHHHHHHHHHHHh---------------------
Confidence            3555664 12233456677887777765 45789999997 678899988877776621                     


Q ss_pred             CCccCCCCCEEEEEcCCCccHHHHHHHHHhc
Q 015469          289 TDALAASEPLAVLVNKGTASASEILAGALKD  319 (406)
Q Consensus       289 ~~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~  319 (406)
                           .+.||+.++++..+|+|-+++.+-..
T Consensus        80 -----~~~~V~t~v~G~AaSaaslIl~ag~~  105 (197)
T PRK14512         80 -----VKPKVFTIGVGLVASAAALIFLAAKK  105 (197)
T ss_pred             -----CCCCEEEEEEeeeHhHHHHHHhcCCc
Confidence                 23478999999999999988877654


No 82 
>PF11874 DUF3394:  Domain of unknown function (DUF3394);  InterPro: IPR021814  This domain is functionally uncharacterised. This domain is found in bacteria. This presumed domain is about 190 amino acids in length. This domain is found associated with PF06808 from PFAM. 
Probab=78.46  E-value=3.4  Score=36.07  Aligned_cols=38  Identities=26%  Similarity=0.303  Sum_probs=31.8

Q ss_pred             eEEEEeeccCCCCCCCcEEEEEeCCCChhhhcCCCCCCEEEEEC
Q 015469          103 VGLSIGYPTASDGSSAGLVVISSMPGGPANRAGILSGDVILAID  146 (406)
Q Consensus       103 ~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aGl~~GD~I~~In  146 (406)
                      .|+.+...      ++.+.|..|..||||+++|+.-|++|++|-
T Consensus       113 ~GL~l~~e------~~~~~Vd~v~fgS~A~~~g~d~d~~I~~v~  150 (183)
T PF11874_consen  113 AGLTLMEE------GGKVIVDEVEFGSPAEKAGIDFDWEITEVE  150 (183)
T ss_pred             CCCEEEee------CCEEEEEecCCCCHHHHcCCCCCcEEEEEE
Confidence            45555543      678999999999999999999999998874


No 83 
>COG1030 NfeD Membrane-bound serine protease (ClpP class) [Posttranslational modification, protein turnover, chaperones]
Probab=76.47  E-value=16  Score=36.28  Aligned_cols=60  Identities=22%  Similarity=0.386  Sum_probs=50.2

Q ss_pred             CceEEEEcCcc-ccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCCc
Q 015469          210 PRIGYIKLTSF-NQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGV  270 (406)
Q Consensus       210 ~~igyl~i~~f-~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~  270 (406)
                      +++.++.++.= ++.+.+.+++.++..++.++..+||+| +-|||.+..+.++.+.+...+.
T Consensus        26 ~~v~vi~i~g~I~~~s~~~l~r~l~~A~~~~a~~vvl~l-dTPGGl~~sm~~iv~~i~~s~v   86 (436)
T COG1030          26 KKVYVIEIDGAIDPASADYLQRALQSAEEENAAAVVLEL-DTPGGLLDSMRQIVRAILNSPV   86 (436)
T ss_pred             CeEEEEEecCccCHHHHHHHHHHHHHHHhCCCcEEEEEe-cCCCchHHHHHHHHHHHHcCCC
Confidence            46778888764 455778899999999888999999999 5789999999999999987654


No 84 
>cd07014 S49_SppA Signal peptide peptidase A. Signal peptide peptidase A (SppA; Peptidase S49; Protease IV): SppA is an intramembrane enzyme found in all three domains of life and is involved in the cleavage of signal peptides after their removal from the precursor proteins by signal peptidases. Unlike the eukaryotic functional homologs that are proposed to be aspartic proteases, site-directed mutagenesis and sequence analysis have shown these bacterial, archaeal and thylakoid SppAs to be ClpP-like serine proteases. The predicted active site serine for members in this family occurs in a transmembrane domain, cleaving peptide bonds in the plane of the lipid bilayer. Mutagenesis studies also suggest that the catalytic center comprises a Ser-Lys dyad (both residues absolutely conserved within bacteria, chloroplast and mitochondrial signal peptidase family members) and not the usual Ser-His-Asp catalytic triad found in the majority of serine proteases. In addition to the carboxyl-terminal p
Probab=76.10  E-value=16  Score=31.69  Aligned_cols=71  Identities=20%  Similarity=0.190  Sum_probs=48.4

Q ss_pred             hHHHHHHHHHHHhc-CCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEE
Q 015469          224 ASGAVREAIDTLRS-NSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLV  302 (406)
Q Consensus       224 ~~~~~~~~~~~~~~-~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLv  302 (406)
                      ...++.++++.+.+ .+++++||++. .+||+......+...+ ..               +       ....+||+..+
T Consensus        23 ~~~~l~~~l~~a~~d~~v~~vvl~~~-~~gg~~~~~~~~~~~i-~~---------------~-------~~~~kpVia~v   78 (177)
T cd07014          23 SGDTTAAQIRDARLDPKVKAIVLRVN-SPGGSVTASEVIRAEL-AA---------------A-------RAAGKPVVASG   78 (177)
T ss_pred             CHHHHHHHHHHHhcCCCceEEEEEee-CCCcCHHHHHHHHHHH-HH---------------H-------HhCCCCEEEEE
Confidence            45688888887765 46999999995 5677665433222211 00               0       12468999999


Q ss_pred             cCCCccHHHHHHHHHh
Q 015469          303 NKGTASASEILAGALK  318 (406)
Q Consensus       303 d~~t~SaaE~~a~~lk  318 (406)
                      ++.++|++=.++.+.-
T Consensus        79 ~G~a~g~g~~la~a~D   94 (177)
T cd07014          79 GGNAASGGYWISTPAN   94 (177)
T ss_pred             CCchhHHHHHHHHhCC
Confidence            9999999988887753


No 85 
>COG0616 SppA Periplasmic serine proteases (ClpP class) [Posttranslational modification, protein turnover, chaperones / Intracellular trafficking and secretion]
Probab=75.65  E-value=14  Score=35.57  Aligned_cols=80  Identities=28%  Similarity=0.347  Sum_probs=56.7

Q ss_pred             HHHHHHHHHHHhc-CCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEEc
Q 015469          225 SGAVREAIDTLRS-NSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLVN  303 (406)
Q Consensus       225 ~~~~~~~~~~~~~-~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLvd  303 (406)
                      .+.+.+.++.+.. .++++++|.+ +-|||....+..+++.+-.                        ...++||+|.++
T Consensus        82 ~~~~~~~l~~~~~~~~vk~vvL~i-nSPGG~v~as~~i~~~l~~------------------------l~~~~PV~v~v~  136 (317)
T COG0616          82 GDDIEEILRAARADPSVKAVVLRI-NSPGGSVVASELIARALKR------------------------LRAKKPVVVSVG  136 (317)
T ss_pred             HHHHHHHHHHHhcCCCCceEEEEE-ECcCCchhHHHHHHHHHHH------------------------HhhcCCEEEEEC
Confidence            4556666766654 4699999988 4689998888777776632                        012239999999


Q ss_pred             CCCccHHHHHHHHHhcCCCeEEEcccCCCCc
Q 015469          304 KGTASASEILAGALKDNKRAVLFGEPTYGKG  334 (406)
Q Consensus       304 ~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~~  334 (406)
                      ..++|++=++|.+-..     |+=.|++-.|
T Consensus       137 ~~AASGGY~IA~aAd~-----I~a~p~si~G  162 (317)
T COG0616         137 GYAASGGYYIALAADK-----IVADPSSITG  162 (317)
T ss_pred             CeecchhhhhhccCCE-----EEecCCceee
Confidence            9999999998887654     4555554444


No 86 
>PF01972 SDH_sah:  Serine dehydrogenase proteinase;  InterPro: IPR002825  This family of archaebacterial proteins, formerly known as DUF114, has been found to be a serine dehydrogenase proteinase distantly related to ClpP proteinases that belong to the serine proteinase superfamily. The family belong to MEROPS peptidase family S49; they are mostly unassigned peptidases but include the archaean signal peptide peptidase 1 [].  The family has a catalytic triad of Ser, Asp, His residues, which shows an altered residue ordering compared with the ClpP proteinases but similar to that of the carboxypeptidase clan []. ; GO: 0016021 integral to membrane
Probab=74.90  E-value=15  Score=34.21  Aligned_cols=72  Identities=24%  Similarity=0.279  Sum_probs=50.6

Q ss_pred             HHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEEcC
Q 015469          225 SGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLVNK  304 (406)
Q Consensus       225 ~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLvd~  304 (406)
                      .+++.++++...+  .+++.|.+ +-+||....+..++..+..                          +..|+.|+|..
T Consensus        77 se~v~raI~~~~~--~~~IdLii-~TpGG~v~AA~~I~~~l~~--------------------------~~~~v~v~VP~  127 (285)
T PF01972_consen   77 SEFVLRAIREAPK--DKPIDLII-HTPGGLVDAAEQIARALRE--------------------------HPAKVTVIVPH  127 (285)
T ss_pred             HHHHHHHHHhcCC--CCceEEEE-ECCCCcHHHHHHHHHHHHh--------------------------CCCCEEEEECc
Confidence            4566677766543  34555555 5889999999999987632                          23568888899


Q ss_pred             CCccHHHHHHHHHhcCCCeEEEccc
Q 015469          305 GTASASEILAGALKDNKRAVLFGEP  329 (406)
Q Consensus       305 ~t~SaaE~~a~~lk~~~~~~ivG~~  329 (406)
                      .+.||+-++|.+...    .++|..
T Consensus       128 ~A~SAGTlIALaADe----IvM~p~  148 (285)
T PF01972_consen  128 YAMSAGTLIALAADE----IVMGPG  148 (285)
T ss_pred             ccccHHHHHHHhCCe----EEECCC
Confidence            999999998887644    455554


No 87 
>cd07013 S14_ClpP Caseinolytic protease (ClpP) is an ATP-dependent, highly conserved serine protease. Clp protease (caseinolytic protease; ClpP; Peptidase S14) is a highly conserved serine protease present throughout in bacteria and eukaryota, but seems to be absent in archaea, mollicutes and some fungi. Clp proteases are involved in a number of cellular processes such as degradation of misfolded proteins, regulation of short-lived proteins and housekeeping removal of dysfunctional proteins. Additionally, they are implicated in the control of cell growth, targeting DNA-binding protein from starved cells. ClpP has also been linked to the tight regulation of virulence genes in the pathogens Listeria monocytogenes and Salmonella typhimurium. This enzyme belong to the family of ATP-dependent proteases; the functional Clp protease is comprised of two components: a proteolytic component and one of several regulatory ATPase components, both of which are required for effective levels of proteas
Probab=73.50  E-value=14  Score=31.67  Aligned_cols=70  Identities=14%  Similarity=0.113  Sum_probs=51.4

Q ss_pred             cchHHHHHHHHHHHhcC-CCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEE
Q 015469          222 QNASGAVREAIDTLRSN-SVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAV  300 (406)
Q Consensus       222 ~~~~~~~~~~~~~~~~~-~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~v  300 (406)
                      +...+.+.+.|..+... +.+.++|-+ +-|||++..+..+...+-.                          .+.|++.
T Consensus        11 ~~~~~~~~~~L~~l~~~~~~~~i~l~I-nSpGG~v~~~~~i~~~i~~--------------------------~~~~v~~   63 (162)
T cd07013          11 DISANQFAAQLLFLGAVNPEKDIYLYI-NSPGGDVFAGMAIYDTIKF--------------------------IKADVVT   63 (162)
T ss_pred             cHHHHHHHHHHHHHhcCCCCCCEEEEE-ECCCCcHHHHHHHHHHHHh--------------------------cCCCceE
Confidence            34567788888877754 578999999 6778888888777766531                          1235777


Q ss_pred             EEcCCCccHHHHHHHHHh
Q 015469          301 LVNKGTASASEILAGALK  318 (406)
Q Consensus       301 Lvd~~t~SaaE~~a~~lk  318 (406)
                      .+.+.++|+|-+++.+-.
T Consensus        64 ~~~g~aaS~~~~i~~a~~   81 (162)
T cd07013          64 IIDGLAASMGSVIAMAGA   81 (162)
T ss_pred             EEEeehhhHHHHHHHcCC
Confidence            888999999988877654


No 88 
>cd07023 S49_Sppa_N_C Signal peptide peptidase A (SppA), a serine protease, has catalytic Ser-Lys dyad. Signal peptide peptidase A (SppA; Peptidase S49; Protease IV): SppA is found in all three domains of life and is involved in the cleavage of signal peptides after their removal from the precursor proteins by signal peptidases. This subfamily contains members with either a single domain (sometimes referred to as 36K type), such as sohB peptidase, protein C and archaeal signal peptide peptidase, or an amino-terminal domain in addition to the carboxyl-terminal protease domain that is conserved in all the S49 family members (sometimes referred to as 67K type), similar to E. coli and Arabidopsis thaliana SppA peptidases. Site-directed mutagenesis and sequence analysis have shown these SppAs to be serine proteases. The predicted active site serine for members in this family occurs in a transmembrane domain. Mutagenesis studies also suggest that the catalytic center comprises a Ser-Lys dyad 
Probab=73.30  E-value=22  Score=31.68  Aligned_cols=80  Identities=24%  Similarity=0.287  Sum_probs=53.6

Q ss_pred             chHHHHHHHHHHHhc-CCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEE
Q 015469          223 NASGAVREAIDTLRS-NSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVL  301 (406)
Q Consensus       223 ~~~~~~~~~~~~~~~-~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vL  301 (406)
                      ....++.++|..+.+ .+++++||++- .+||++..+..+...+..                +       ....+|++..
T Consensus        17 ~~~~~l~~~l~~a~~d~~i~~ivl~~~-s~Gg~~~~~~~i~~~i~~----------------~-------~~~~kpvia~   72 (208)
T cd07023          17 IGADSLIEQLRKAREDDSVKAVVLRIN-SPGGSVVASEEIYREIRR----------------L-------RKAKKPVVAS   72 (208)
T ss_pred             CCHHHHHHHHHHHHhCCCCcEEEEEEE-CCCCCHHHHHHHHHHHHH----------------H-------HhcCCcEEEE
Confidence            356678888888754 46999999994 578887654433222100                0       1135799999


Q ss_pred             EcCCCccHHHHHHHHHhcCCCeEEEcccCC
Q 015469          302 VNKGTASASEILAGALKDNKRAVLFGEPTY  331 (406)
Q Consensus       302 vd~~t~SaaE~~a~~lk~~~~~~ivG~~T~  331 (406)
                      +++.++|++=.++.+..     .++-.+++
T Consensus        73 v~g~~~s~g~~lA~aaD-----~i~a~~~s   97 (208)
T cd07023          73 MGDVAASGGYYIAAAAD-----KIVANPTT   97 (208)
T ss_pred             ECCcchhHHHHHHhhCC-----EEEECCCC
Confidence            99999998888877653     25555554


No 89 
>PRK12553 ATP-dependent Clp protease proteolytic subunit; Reviewed
Probab=68.00  E-value=20  Score=32.07  Aligned_cols=70  Identities=19%  Similarity=0.160  Sum_probs=52.5

Q ss_pred             cchHHHHHHHHHHHhcCC-CCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEE
Q 015469          222 QNASGAVREAIDTLRSNS-VNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAV  300 (406)
Q Consensus       222 ~~~~~~~~~~~~~~~~~~-~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~v  300 (406)
                      .....++.+.|..+...+ .+.+.|-+ +-+||++..+..+...+-.                          .+.|++.
T Consensus        46 ~~~~~~i~~~L~~l~~~~~~~~I~l~I-NSpGG~v~~g~~I~d~i~~--------------------------~~~~v~t   98 (207)
T PRK12553         46 DASANDVMAQLLVLESIDPDRDITLYI-NSPGGSVTAGDAIYDTIQF--------------------------IRPDVQT   98 (207)
T ss_pred             HHHHHHHHHHHHHHHhCCCCCCEEEEE-eCCCCcHHHHHHHHHHHHh--------------------------cCCCcEE
Confidence            445677888887777654 78899988 6778898888877766521                          1236888


Q ss_pred             EEcCCCccHHHHHHHHHh
Q 015469          301 LVNKGTASASEILAGALK  318 (406)
Q Consensus       301 Lvd~~t~SaaE~~a~~lk  318 (406)
                      ++++.++|+|-+++.+-.
T Consensus        99 ~~~G~aaSaa~lI~~ag~  116 (207)
T PRK12553         99 VCTGQAASAGAVLLAAGT  116 (207)
T ss_pred             EEEeehhhHHHHHHHcCC
Confidence            889999999998888764


No 90 
>cd07022 S49_Sppa_36K_type Signal peptide peptidase A (SppA) 36K type, a serine protease, has catalytic Ser-Lys dyad. Signal peptide peptidase A (SppA; Peptidase S49; Protease IV) 36K type: SppA is found in all three domains of life and is involved in the cleavage of signal peptides after their removal from the precursor proteins by signal peptidases. Members in this subfamily are all bacterial and include sohB peptidase and protein C. These are sometimes referred to as 36K type since they contain only one domain, unlike E. coli SppA that also contains an amino-terminal domain. Site-directed mutagenesis and sequence analysis have shown these SppAs to be serine proteases. The predicted active site serine for members in this family occurs in a transmembrane domain. Mutagenesis studies also suggest that the catalytic center comprises a Ser-Lys dyad and not the usual Ser-His-Asp catalytic triad found in the majority of serine proteases.
Probab=67.61  E-value=54  Score=29.40  Aligned_cols=80  Identities=29%  Similarity=0.326  Sum_probs=53.9

Q ss_pred             chHHHHHHHHHHHhc-CCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEE
Q 015469          223 NASGAVREAIDTLRS-NSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVL  301 (406)
Q Consensus       223 ~~~~~~~~~~~~~~~-~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vL  301 (406)
                      ....++.++|+.+.+ ..++++||++.. +||....+..+...+..                +       .. .+||+..
T Consensus        25 ~~~~~l~~~l~~a~~d~~i~~Vvl~~~s-~gg~~~~~~~l~~~l~~----------------~-------~~-~KpViA~   79 (214)
T cd07022          25 TSYEGIAAAIRAALADPDVRAIVLDIDS-PGGEVAGVFELADAIRA----------------A-------RA-GKPIVAF   79 (214)
T ss_pred             ccHHHHHHHHHHHhhCCCCcEEEEEEeC-CCCcHHHHHHHHHHHHH----------------H-------hc-CCCEEEE
Confidence            456788888888764 469999999954 67776554444433310                0       01 4799999


Q ss_pred             EcCCCccHHHHHHHHHhcCCCeEEEcccCCC
Q 015469          302 VNKGTASASEILAGALKDNKRAVLFGEPTYG  332 (406)
Q Consensus       302 vd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G  332 (406)
                      +++.++|++=.++.+..     .++-.+++-
T Consensus        80 v~g~a~s~gy~lA~~aD-----~i~a~~~a~  105 (214)
T cd07022          80 VNGLAASAAYWIASAAD-----RIVVTPTAG  105 (214)
T ss_pred             ECCchhhHHHHHHhcCC-----EEEEcCCCe
Confidence            99999998888877663     355555543


No 91 
>KOG1421 consensus Predicted signaling-associated protein (contains a PDZ domain) [General function prediction only]
Probab=67.33  E-value=20  Score=37.62  Aligned_cols=69  Identities=19%  Similarity=0.167  Sum_probs=52.6

Q ss_pred             CCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhCCCC-CCcEEEEE-EeCCeeEEEEEEee
Q 015469          117 SAGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQGPE-GSPVELTV-RSGAEIRHLALTRE  188 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~-g~~v~l~v-~r~g~~~~~~v~~~  188 (406)
                      +.+++|+..-.+|||.+ +|++--.|++|||..+.+  ++++...+...+ ++-+++.. .+++-+..+++++.
T Consensus       861 p~gvyvt~rg~gspalq-~l~aa~fitavng~~t~~--lddf~~~~~~ipdnsyv~v~~mtfd~vp~~~s~k~n  931 (955)
T KOG1421|consen  861 PEGVYVTSRGYGSPALQ-MLRAAHFITAVNGHDTNT--LDDFYHMLLEIPDNSYVQVKQMTFDGVPSIVSVKPN  931 (955)
T ss_pred             CCceEEeecccCChhHh-hcchheeEEEecccccCc--HHHHHHHHhhCCCCceEEEEEeccCCCceEEEeccC
Confidence            56899999999999998 899999999999999988  488888777544 44455543 35666666665543


No 92 
>cd07017 S14_ClpP_2 Caseinolytic protease (ClpP) is an ATP-dependent, highly conserved serine protease. Clp protease (caseinolytic protease; ClpP; Peptidase S14) is a highly conserved serine protease present throughout in bacteria and eukaryota, but seems to be absent in archaea, mollicutes and some fungi. Clp proteases are involved in a number of cellular processes such as degradation of misfolded proteins, regulation of short-lived proteins and housekeeping removal of dysfunctional proteins. They are also implicated in the control of cell growth, targeting DNA-binding protein from starved cells. ClpP has also been linked to the tight regulation of virulence genes in the pathogens Listeria monocytogenes and Salmonella typhimurium. This enzyme belong to the family of ATP-dependent proteases; the functional Clp protease is comprised of two components: a proteolytic component and one of several regulatory ATPase components, both of which are required for effective levels of protease activ
Probab=65.81  E-value=27  Score=30.16  Aligned_cols=68  Identities=18%  Similarity=0.213  Sum_probs=48.9

Q ss_pred             chHHHHHHHHHHHhcCC-CCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEE
Q 015469          223 NASGAVREAIDTLRSNS-VNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVL  301 (406)
Q Consensus       223 ~~~~~~~~~~~~~~~~~-~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vL  301 (406)
                      ....++...+..+...+ .+.++|-+ +-|||+...+..+...+-.                          .+.|++..
T Consensus        21 ~~~~~i~~~l~~~~~~~~~~~i~l~i-nSpGG~v~~~~~i~~~l~~--------------------------~~~~v~t~   73 (171)
T cd07017          21 EVANLIIAQLLYLESEDPKKPIYLYI-NSPGGSVTAGLAIYDTMQY--------------------------IKPPVSTI   73 (171)
T ss_pred             HHHHHHHHHHHHHHccCCCCceEEEE-ECCCCCHHHHHHHHHHHHh--------------------------cCCCEEEE
Confidence            34566777776666544 58999999 6778888888877776521                          12568888


Q ss_pred             EcCCCccHHHHHHHHH
Q 015469          302 VNKGTASASEILAGAL  317 (406)
Q Consensus       302 vd~~t~SaaE~~a~~l  317 (406)
                      +.+.++|+|-+++.+-
T Consensus        74 ~~g~aaS~~~~i~~~g   89 (171)
T cd07017          74 CLGLAASMGALLLAAG   89 (171)
T ss_pred             EEeEehhHHHHHHHcC
Confidence            8888899988777665


No 93 
>cd07019 S49_SppA_1 Signal peptide peptidase A (SppA), a serine protease, has catalytic Ser-Lys dyad. Signal peptide peptidase A (SppA; Peptidase S49; Protease IV): SppAs in this subfamily are found in all three domains of life and are involved in the cleavage of signal peptides after their removal from the precursor proteins by signal peptidases. Site-directed mutagenesis and sequence analysis have shown these bacterial, archaeal and thylakoid SppAs to be serine proteases. The predicted active site serine for members in this family occurs in a transmembrane domain. Mutagenesis studies also suggest that the catalytic center comprises a Ser-Lys dyad (both residues absolutely conserved within bacteria, chloroplast and mitochondrial signal peptidase family members) and not the usual Ser-His-Asp catalytic triad found in the majority of serine proteases. In addition to the carboxyl-terminal protease domain that is conserved in all the S49 family members, the E. coli SppA contains an amino-te
Probab=64.69  E-value=44  Score=29.89  Aligned_cols=70  Identities=21%  Similarity=0.227  Sum_probs=50.1

Q ss_pred             hHHHHHHHHHHHhcC-CCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEE
Q 015469          224 ASGAVREAIDTLRSN-SVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLV  302 (406)
Q Consensus       224 ~~~~~~~~~~~~~~~-~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLv  302 (406)
                      ...++.++++.+.+. +++++||++- ++||++..+..+...+.                .+       ....+||+..+
T Consensus        22 ~~~~l~~~l~~a~~d~~v~~ivL~~~-s~Gg~~~~~~~~~~~l~----------------~~-------~~~~kpVia~v   77 (211)
T cd07019          22 GGDTTAAQIRDARLDPKVKAIVLRVN-SPGGSVTASEVIRAELA----------------AA-------RAAGKPVVVSA   77 (211)
T ss_pred             CHHHHHHHHHHHhhCCCceEEEEEEc-CCCcCHHHHHHHHHHHH----------------HH-------HhCCCCEEEEE
Confidence            356788888887654 7999999955 58888876554433210                01       12358999999


Q ss_pred             cCCCccHHHHHHHHH
Q 015469          303 NKGTASASEILAGAL  317 (406)
Q Consensus       303 d~~t~SaaE~~a~~l  317 (406)
                      ++.++|++=.++.+.
T Consensus        78 ~g~a~s~gy~la~~a   92 (211)
T cd07019          78 GGAAASGGYWISTPA   92 (211)
T ss_pred             CCeehhHHHHHHHhC
Confidence            999999998888875


No 94 
>PF00574 CLP_protease:  Clp protease;  InterPro: IPR001907 In the MEROPS database peptidases and peptidase homologues are grouped into clans and families. Clans are groups of families for which there is evidence of common ancestry based on a common structural fold:  Each clan is identified with two letters, the first representing the catalytic type of the families included in the clan (with the letter 'P' being used for a clan containing families of more than one of the catalytic types serine, threonine and cysteine). Some families cannot yet be assigned to clans, and when a formal assignment is required, such a family is described as belonging to clan A-, C-, M-, N-, S-, T- or U-, according to the catalytic type. Some clans are divided into subclans because there is evidence of a very ancient divergence within the clan, for example MA(E), the gluzincins, and MA(M), the metzincins. Peptidase families are grouped by their catalytic type, the first character representing the catalytic type: A, aspartic; C, cysteine; G, glutamic acid; M, metallo; N, asparagine; S, serine; T, threonine; and U, unknown. The serine, threonine and cysteine peptidases utilise the amino acid as a nucleophile and form an acyl intermediate - these peptidases can also readily act as transferases. In the case of aspartic, glutamic and metallopeptidases, the nucleophile is an activated water molecule. In the case of the asparagine endopeptidases, the nucleophile is asparagine and all are self-processing endopeptidases.   In many instances the structural protein fold that characterises the clan or family may have lost its catalytic activity, yet retain its function in protein recognition and binding.  Proteolytic enzymes that exploit serine in their catalytic activity are ubiquitous, being found in viruses, bacteria and eukaryotes []. They include a wide range of peptidase activity, including exopeptidase, endopeptidase, oligopeptidase and omega-peptidase activity. Over 20 families (denoted S1 - S66) of serine protease have been identified, these being grouped into clans on the basis of structural similarity and other functional evidence []. Structures are known for members of the clans and the structures indicate that some appear to be totally unrelated, suggesting different evolutionary origins for the serine peptidases []. Not withstanding their different evolutionary origins, there are similarities in the reaction mechanisms of several peptidases. Chymotrypsin, subtilisin and carboxypeptidase C have a catalytic triad of serine, aspartate and histidine in common: serine acts as a nucleophile, aspartate as an electrophile, and histidine as a base []. The geometric orientations of the catalytic residues are similar between families, despite different protein folds []. The linear arrangements of the catalytic residues commonly reflect clan relationships. For example the catalytic triad in the chymotrypsin clan (PA) is ordered HDS, but is ordered DHS in the subtilisin clan (SB) and SDH in the carboxypeptidase clan (SC) [, ]. This group of serine peptidases belong to the MEROPS peptidase family S14 (ClpP endopeptidase family, clan SK). ClpP is an ATP-dependent protease that cleaves a number of proteins, such as casein and albumin []. It exists as a heterodimer of ATP-binding regulatory A and catalytic P subunits, both of which are required for effective levels of protease activity in the presence of ATP [], although the P subunit alone does possess some catalytic activity. This family of sequences represent the P subunit. Proteases highly similar to ClpP have been found to be encoded in the genome of bacteria, metazoa, some viruses and in the chloroplast of plants. A number of the proteins in this family are classified as non-peptidase homologues as they have been found experimentally to be without peptidase activity, or lack amino acid residues that are believed to be essential for catalytic activity. ; GO: 0004252 serine-type endopeptidase activity, 0006508 proteolysis; PDB: 2ZL3_L 2ZL0_F 2ZL2_M 2ZL4_C 1TG6_D 2F6I_D 3V5I_b 3V5E_M 3QWD_D 2DEO_A ....
Probab=59.55  E-value=17  Score=31.61  Aligned_cols=82  Identities=16%  Similarity=0.223  Sum_probs=55.2

Q ss_pred             ceEEEEcCccccchHHHHHHHHHHHh-cCCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCC
Q 015469          211 RIGYIKLTSFNQNASGAVREAIDTLR-SNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGT  289 (406)
Q Consensus       211 ~igyl~i~~f~~~~~~~~~~~~~~~~-~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~  289 (406)
                      ++-+|.-+ -+......+.+.|..+. +...+.+.|-+ +.+||++..+..+...+-.                      
T Consensus        17 r~i~l~g~-I~~~~~~~~~~~L~~l~~~~~~~~i~i~I-NSpGG~v~~g~~i~~~i~~----------------------   72 (182)
T PF00574_consen   17 RIIFLNGP-IDEESANRLISQLLYLENEDKNKPINIYI-NSPGGDVDAGLAIYDAIRS----------------------   72 (182)
T ss_dssp             TEEEEESS-BSHHHHHHHHHHHHHHHHHTSSSEEEEEE-EECEBCHHHHHHHHHHHHH----------------------
T ss_pred             eEEEECCc-cCHHHHHHHHHHHHHHhccCCCceEEEEE-cCCCCccHHHHHHHHHHHh----------------------
Confidence            45455422 23344566666666563 34678888888 6789999999888887642                      


Q ss_pred             CccCCCCCEEEEEcCCCccHHHHHHHHHhcC
Q 015469          290 DALAASEPLAVLVNKGTASASEILAGALKDN  320 (406)
Q Consensus       290 ~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~~  320 (406)
                          .+.|+...+.+.++|+|-+++.+-+..
T Consensus        73 ----~~~~v~t~~~G~aaSaa~~i~~ag~~~   99 (182)
T PF00574_consen   73 ----SKAPVTTVVLGLAASAATLIFLAGDKG   99 (182)
T ss_dssp             ----SSSEEEEEEEEEEETHHHHHHHTSSTT
T ss_pred             ----cCCCeEEEEeCccccceehhhhcCCcC
Confidence                124577777788889988887766553


No 95 
>TIGR00705 SppA_67K signal peptide peptidase SppA, 67K type. E. coli SohB, which is most closely homologous to the C-terminal duplication of SppA, is predicted to perform a similar function of small peptide degradation, but in the periplasm. Many prokaryotes have a single SppA/SohB homolog that may perform the function of either or both.
Probab=47.76  E-value=2e+02  Score=30.25  Aligned_cols=96  Identities=21%  Similarity=0.243  Sum_probs=62.5

Q ss_pred             CCceEEEEcCcccc--------chHHHHHHHHHHHhc-CCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCC
Q 015469          209 SPRIGYIKLTSFNQ--------NASGAVREAIDTLRS-NSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRG  279 (406)
Q Consensus       209 ~~~igyl~i~~f~~--------~~~~~~~~~~~~~~~-~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~  279 (406)
                      .++|+.|.+..--.        ...+.+.+.++.+.+ .+++++||.+- .|||+...+..+...+..            
T Consensus       307 ~~~vavI~~~G~I~~~~~~~~~~~~~~~~~~l~~a~~D~~VkaIVLrin-SpGGs~~ase~i~~~i~~------------  373 (584)
T TIGR00705       307 QDKIGIVHLEGPIADGRDTEGNTGGDTVAALLRVARSDPDIKAVVLRIN-SPGGSVFASEIIRRELAR------------  373 (584)
T ss_pred             CCeEEEEEEEEEEcCCCCcccccCHHHHHHHHHHHhhCCCceEEEEEec-CCCCCHHHHHHHHHHHHH------------
Confidence            46788888765311        123566777776654 47899999886 466776665545433211            


Q ss_pred             ceeeeecCCCCccCCCCCEEEEEcCCCccHHHHHHHHHhcCCCeEEEcccCCCC
Q 015469          280 VRDIYDTDGTDALAASEPLAVLVNKGTASASEILAGALKDNKRAVLFGEPTYGK  333 (406)
Q Consensus       280 ~~~~~~~~~~~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~  333 (406)
                          +.       ...+||++.+++.++|++=.++.+..     .++-+++.-.
T Consensus       374 ----~~-------~~gKPVva~~~g~aaSggY~iA~aaD-----~I~a~p~t~~  411 (584)
T TIGR00705       374 ----AQ-------ARGKPVIVSMGAMAASGGYWIASAAD-----YIVASPNTIT  411 (584)
T ss_pred             ----HH-------hCCCcEEEEECCccccHHHHHHHhCC-----EEEECCCCee
Confidence                00       12389999999999999999888774     3666666533


No 96 
>TIGR00493 clpP ATP-dependent Clp protease, proteolytic subunit ClpP. This model for the proteolytic subunit ClpP has been rebuilt to a higher stringency. In every bacterial genome with the ClpXP machine, a ClpP protein will be found that scores with this model. In general, this ClpP member will be encoded adjacent to the clpX gene, as were all examples used in the seed alignment. A large fraction of genomes have one or more additional ClpP paralogs, sometimes encoded nearby and sometimes elsewhere. The stringency of the trusted cutoff used here excludes the more divergent ClpP paralogs from being called authentic ClpP by this model.
Probab=47.40  E-value=86  Score=27.63  Aligned_cols=67  Identities=15%  Similarity=0.166  Sum_probs=46.0

Q ss_pred             hHHHHHHHHHHHhcC-CCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEEEE
Q 015469          224 ASGAVREAIDTLRSN-SVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAVLV  302 (406)
Q Consensus       224 ~~~~~~~~~~~~~~~-~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~vLv  302 (406)
                      ..+.+...|..+... ..+.+.|.+ +-+||++..+..+...+-.                          .+.|+..++
T Consensus        39 ~~~~ii~~L~~l~~~~~~~~i~l~I-nSpGG~v~~g~~I~d~l~~--------------------------~~~~v~t~~   91 (191)
T TIGR00493        39 VANLIVAQLLFLEAEDPEKDIYLYI-NSPGGSITAGLAIYDTMQF--------------------------IKPDVSTIC   91 (191)
T ss_pred             HHHHHHHHHHHhhccCCCCCEEEEE-ECCCCCHHHHHHHHHHHHh--------------------------cCCCEEEEE
Confidence            445666666556543 356788888 5678898888877776521                          124577788


Q ss_pred             cCCCccHHHHHHHHH
Q 015469          303 NKGTASASEILAGAL  317 (406)
Q Consensus       303 d~~t~SaaE~~a~~l  317 (406)
                      ++.++|+|-+++++-
T Consensus        92 ~G~AaSaaslI~~aG  106 (191)
T TIGR00493        92 IGQAASMGAFLLSAG  106 (191)
T ss_pred             EEeeccHHHHHHhcC
Confidence            899999998877653


No 97 
>PRK00277 clpP ATP-dependent Clp protease proteolytic subunit; Reviewed
Probab=46.87  E-value=86  Score=27.84  Aligned_cols=68  Identities=15%  Similarity=0.193  Sum_probs=48.5

Q ss_pred             cchHHHHHHHHHHHhcC-CCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCCCccCCCCCEEE
Q 015469          222 QNASGAVREAIDTLRSN-SVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGTDALAASEPLAV  300 (406)
Q Consensus       222 ~~~~~~~~~~~~~~~~~-~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~v  300 (406)
                      ....+.+...+..+... ..+.+.|.+ +-+||+...+..+...+-                          ..+.|++.
T Consensus        42 ~~~~~~i~~~L~~l~~~~~~~~I~l~I-nSpGG~v~~g~~I~d~i~--------------------------~~~~~v~t   94 (200)
T PRK00277         42 DHMANLIVAQLLFLEAEDPDKDIYLYI-NSPGGSVTAGLAIYDTMQ--------------------------FIKPDVST   94 (200)
T ss_pred             HHHHHHHHHHHHHhhccCCCCCEEEEE-ECCCCcHHHHHHHHHHHH--------------------------hcCCCEEE
Confidence            33456666677666543 466788888 677889888877777641                          12246788


Q ss_pred             EEcCCCccHHHHHHHH
Q 015469          301 LVNKGTASASEILAGA  316 (406)
Q Consensus       301 Lvd~~t~SaaE~~a~~  316 (406)
                      ++++.++|+|-+++.+
T Consensus        95 ~~~G~aaS~a~~I~~a  110 (200)
T PRK00277         95 ICIGQAASMGAFLLAA  110 (200)
T ss_pred             EEEeEeccHHHHHHhc
Confidence            8899999999988877


No 98 
>cd07041 STAS_RsbR_RsbS_like Sulphate Transporter and Anti-Sigma factor antagonist domain of the "stressosome" complex proteins RsbS and RsbR, regulators of the bacterial stress activated alternative sigma factor sigma-B by phosphorylation. The STAS (Sulphate Transporter and Anti-Sigma factor antagonist) domain of proteins related to RsbS and RsbR which are part of the "stressosome" complex that plays an important role in the regulation of the bacterial stress activated alternative sigma factor sigma-B. During stress conditions RsbS and RsbR are phosphorylated which leads to the release of RsbT, an activator of of the RsbU phosphatase, which in turn activates RsbV which leads to the release and activation of sigma factor B. RsbS is a single domain protein (STAS domain), while RsbR-like proteins have a well-conserved C-terminal STATS domain and a variable N-terminal domain. The STAS domain is also found in the C- terminal region of sulphate transporters and anti-anti-sigma factors.
Probab=45.00  E-value=46  Score=25.87  Aligned_cols=44  Identities=9%  Similarity=0.191  Sum_probs=29.1

Q ss_pred             ceEEEEcCc-cccchHHHHHHHH-HHHhcCCCCeEEEEeCCCCCCC
Q 015469          211 RIGYIKLTS-FNQNASGAVREAI-DTLRSNSVNAFVLDLRDNSGGL  254 (406)
Q Consensus       211 ~igyl~i~~-f~~~~~~~~~~~~-~~~~~~~~~~lIiDlR~N~GG~  254 (406)
                      ++..+++.. +.....+.+++.+ ..+.+.+.+.+|||+++=+-=+
T Consensus        10 ~~~v~~l~G~L~~~~a~~~~~~l~~~~~~~~~~~vvlDls~v~~iD   55 (109)
T cd07041          10 GVLVLPLIGDLDDERAEQLQERLLEAISRRRARGVIIDLTGVPVID   55 (109)
T ss_pred             CEEEEeeeeeECHHHHHHHHHHHHHHHHHcCCCEEEEECCCCchhc
Confidence            566777765 4445567777755 4454457899999999755333


No 99 
>COG5233 GRH1 Peripheral Golgi membrane protein [Intracellular trafficking and secretion]
Probab=44.73  E-value=14  Score=34.95  Aligned_cols=35  Identities=34%  Similarity=0.592  Sum_probs=30.1

Q ss_pred             CCcEEEEEeCCCChhhhcCCCCCCEEEEECCEecC
Q 015469          117 SAGLVVISSMPGGPANRAGILSGDVILAIDDTSTE  151 (406)
Q Consensus       117 ~~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~  151 (406)
                      +.-+-+..|.+.+||+++|.-.||.|+-+|+-++.
T Consensus        62 n~~l~~lrv~~~~~~e~~~~~~~dyilg~n~Dp~~   96 (417)
T COG5233          62 NCLLEVLRVNPESPAEKAGMVVGDYILGINEDPLR   96 (417)
T ss_pred             hhhhhheeccccChhHhhccccceeEEeecCCcHH
Confidence            34466888999999999999999999999987764


No 100
>PRK10949 protease 4; Provisional
Probab=44.08  E-value=1.2e+02  Score=32.09  Aligned_cols=97  Identities=20%  Similarity=0.183  Sum_probs=63.6

Q ss_pred             CCceEEEEcCccc-c-------chHHHHHHHHHHHhc-CCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCC
Q 015469          209 SPRIGYIKLTSFN-Q-------NASGAVREAIDTLRS-NSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRG  279 (406)
Q Consensus       209 ~~~igyl~i~~f~-~-------~~~~~~~~~~~~~~~-~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~  279 (406)
                      .++|+.|.+..-- .       -..+.+.+.|++..+ .+++++||.+- .|||+...+..+...+..            
T Consensus       325 ~~~Iavi~~~G~I~~g~~~~g~~~~~~~~~~l~~a~~D~~vkaVvLrIn-SpGGs~~ase~i~~~i~~------------  391 (618)
T PRK10949        325 GGSIAVIFANGAIMDGEETPGNVGGDTTAAQIRDARLDPKVKAIVLRVN-SPGGSVTASEVIRAELAA------------  391 (618)
T ss_pred             CCeEEEEEEEEEEcCCCCcCCCcCHHHHHHHHHHHHhCCCCcEEEEEec-CCCCcHHHHHHHHHHHHH------------
Confidence            4689999886531 1       123456666766543 58999999997 567777666666554421            


Q ss_pred             ceeeeecCCCCccCCCCCEEEEEcCCCccHHHHHHHHHhcCCCeEEEcccCCCCc
Q 015469          280 VRDIYDTDGTDALAASEPLAVLVNKGTASASEILAGALKDNKRAVLFGEPTYGKG  334 (406)
Q Consensus       280 ~~~~~~~~~~~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~~  334 (406)
                          +.       ...+||++-+++..+|++=.++.+..     .|+=+||.-.|
T Consensus       392 ----~r-------~~gKPVvas~~~~aASggY~iA~aad-----~I~a~p~t~tG  430 (618)
T PRK10949        392 ----AR-------AAGKPVVVSMGGMAASGGYWISTPAN-----YIVASPSTLTG  430 (618)
T ss_pred             ----HH-------hcCCcEEEEECCCCccHHHHHHHhcC-----EEEECCCCcee
Confidence                00       12478999999999999888887763     35555554433


No 101
>PRK12551 ATP-dependent Clp protease proteolytic subunit; Reviewed
Probab=43.64  E-value=87  Score=27.78  Aligned_cols=80  Identities=15%  Similarity=0.168  Sum_probs=53.4

Q ss_pred             CceEEEEcCccccchHHHHHHHHHHHhcCC-CCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCC
Q 015469          210 PRIGYIKLTSFNQNASGAVREAIDTLRSNS-VNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDG  288 (406)
Q Consensus       210 ~~igyl~i~~f~~~~~~~~~~~~~~~~~~~-~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~  288 (406)
                      ++|-||-- ...+...+++-..|..+...+ .+.+.|=+ +-+||++..+..+...+-                      
T Consensus        25 ~Riifl~~-~i~~~~a~~ii~~Ll~l~~~~~~~~I~l~I-NSpGG~v~~g~aIyd~m~----------------------   80 (196)
T PRK12551         25 ERIIFLGE-PVTSDSANRIVAQLLFLEAEDPEKDIYLYI-NSPGGSVYDGLGIFDTMQ----------------------   80 (196)
T ss_pred             CcEEEECC-eecHHHHHHHHHHHHHhhccCCCCCEEEEE-eCCCcchhhHHHHHHHHH----------------------
Confidence            35655531 123345667777776676443 56777766 566889888877766552                      


Q ss_pred             CCccCCCCCEEEEEcCCCccHHHHHHHHH
Q 015469          289 TDALAASEPLAVLVNKGTASASEILAGAL  317 (406)
Q Consensus       289 ~~~~~~~~~v~vLvd~~t~SaaE~~a~~l  317 (406)
                          ..+.||..++++..+|+|-+++.+=
T Consensus        81 ----~~~~~V~t~~~G~AaS~AslIl~aG  105 (196)
T PRK12551         81 ----HVKPDVHTVCVGLAASMGAFLLCAG  105 (196)
T ss_pred             ----hcCCCEEEEEEEEehhHHHHHHhCC
Confidence                1335788999999999999888764


No 102
>cd07043 STAS_anti-anti-sigma_factors Sulphate Transporter and Anti-Sigma factor antagonist) domain of anti-anti-sigma factors, key regulators of anti-sigma factors by phosphorylation. Anti-anti-sigma factors play an important role in the regulation of several sigma factors and their corresponding anti-sigma factors. Upon dephosphorylation they bind the anti-sigma factor and induce the release of the sigma factor from the anti-sigma factor. In a feedback mechanism the anti-anti-sigma factor can be inactivated via phosphorylation by the anti-sigma factor. Well studied examples from Bacillus subtilis are SpoIIAA (regulating sigmaF and sigmaC which play an important role in sporulation) and RsbV (regulating sigmaB involved in the general stress response). The STAS domain is also found in the C- terminal region of sulphate transporters and stressosomes.
Probab=41.23  E-value=1e+02  Score=22.95  Aligned_cols=51  Identities=18%  Similarity=0.162  Sum_probs=31.1

Q ss_pred             ceEEEEcCc-cccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHH
Q 015469          211 RIGYIKLTS-FNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEI  261 (406)
Q Consensus       211 ~igyl~i~~-f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l  261 (406)
                      ++..+++.. +.....+.+.+.+........+.+|||+++-..=+...+..+
T Consensus         8 ~~~ii~l~G~l~~~~~~~~~~~~~~~~~~~~~~viid~~~v~~iDs~g~~~L   59 (99)
T cd07043           8 GVLVVRLSGELDAATAPELREALEELLAEGPRRLVLDLSGVTFIDSSGLGVL   59 (99)
T ss_pred             CEEEEEEeceecccchHHHHHHHHHHHHcCCCEEEEECCCCCEEcchhHHHH
Confidence            455555543 233345567776665544457999999999776655444333


No 103
>PRK11778 putative inner membrane peptidase; Provisional
Probab=37.70  E-value=2.8e+02  Score=26.80  Aligned_cols=98  Identities=22%  Similarity=0.248  Sum_probs=54.9

Q ss_pred             CceEEEEcCccc-cchHHHHHHHHHHHh--cCCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeec
Q 015469          210 PRIGYIKLTSFN-QNASGAVREAIDTLR--SNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDT  286 (406)
Q Consensus       210 ~~igyl~i~~f~-~~~~~~~~~~~~~~~--~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~  286 (406)
                      +.|+.|.+..-- .+....+++.+..+.  ..+-+++||++- .|||....+..++..+..                +. 
T Consensus        90 ~~v~VI~~~G~I~~~~~~~l~e~i~a~l~~A~~~~aVvLrid-SpGG~v~~s~~a~~~l~~----------------lr-  151 (330)
T PRK11778         90 PRLFVLDFKGDIDASEVESLREEITAILAVAKPGDEVLLRLE-SPGGVVHGYGLAASQLQR----------------LR-  151 (330)
T ss_pred             CeEEEEEEEEEECCCcchhhHHHHHHHHHhccCCCeEEEEEe-CCCCchhHHHHHHHHHHH----------------HH-
Confidence            467777766532 122223333333321  123388999985 467766543222332210                00 


Q ss_pred             CCCCccCCCCCEEEEEcCCCccHHHHHHHHHhcCCCeEEEcccCCCCcee
Q 015469          287 DGTDALAASEPLAVLVNKGTASASEILAGALKDNKRAVLFGEPTYGKGKI  336 (406)
Q Consensus       287 ~~~~~~~~~~~v~vLvd~~t~SaaE~~a~~lk~~~~~~ivG~~T~G~~~~  336 (406)
                            ...+||++.++..++|++=++|.+..     .|+=.|++..|+.
T Consensus       152 ------~~~kpVva~v~~~AASggY~iAsaAD-----~I~A~P~a~vGSI  190 (330)
T PRK11778        152 ------DAGIPLTVAVDKVAASGGYMMACVAD-----KIIAAPFAIVGSI  190 (330)
T ss_pred             ------hcCCCEEEEECCchhhHHHHHHHhCC-----EEEECCCCeEEee
Confidence                  12368999999999999988887663     3555665555443


No 104
>PF04343 DUF488:  Protein of unknown function, DUF488;  InterPro: IPR007438 This family includes several proteins of uncharacterised function.
Probab=35.36  E-value=45  Score=26.86  Aligned_cols=29  Identities=24%  Similarity=0.391  Sum_probs=21.0

Q ss_pred             HHHHHHHHhcCCCCeEEEEeCCCCC----CChHH
Q 015469          228 VREAIDTLRSNSVNAFVLDLRDNSG----GLFPE  257 (406)
Q Consensus       228 ~~~~~~~~~~~~~~~lIiDlR~N~G----G~~~~  257 (406)
                      +++++..+++.+++ +++|+|.+|.    |.--.
T Consensus         2 ~e~f~~~l~~~~i~-~lVDVR~~P~S~~~~~~k~   34 (122)
T PF04343_consen    2 IERFYDLLKKNGIR-VLVDVRLWPRSRKPGFNKE   34 (122)
T ss_pred             HHHHHHHHHHCCCe-EEEEECCCCCCCCCCCCHH
Confidence            34556656666776 8999999999    86543


No 105
>PRK14513 ATP-dependent Clp protease proteolytic subunit; Provisional
Probab=35.13  E-value=2.3e+02  Score=25.26  Aligned_cols=80  Identities=15%  Similarity=0.177  Sum_probs=51.6

Q ss_pred             CceEEEEcCccccchHHHHHHHHHHHhcCC-CCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCC
Q 015469          210 PRIGYIKLTSFNQNASGAVREAIDTLRSNS-VNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDG  288 (406)
Q Consensus       210 ~~igyl~i~~f~~~~~~~~~~~~~~~~~~~-~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~  288 (406)
                      .+|.||-- ...+...+.+-..|-.|...+ .+.+-|=+ +-+||++..+..+...+-                      
T Consensus        27 ~Riifl~~-~i~~~~a~~ii~~Ll~L~~~~~~~~I~l~I-NSpGG~v~~GlaIyd~m~----------------------   82 (201)
T PRK14513         27 DRIIFVGT-PIESQMANTIVAQLLLLDSQNPEQEIQMYI-NCPGGEVYAGLAIYDTMR----------------------   82 (201)
T ss_pred             CCEEEECC-EEcHHHHHHHHHHHHHhhccCCCCCEEEEE-ECCCCchhhHHHHHHHHH----------------------
Confidence            46666632 223344566666666666543 45566655 567888888776666542                      


Q ss_pred             CCccCCCCCEEEEEcCCCccHHHHHHHHH
Q 015469          289 TDALAASEPLAVLVNKGTASASEILAGAL  317 (406)
Q Consensus       289 ~~~~~~~~~v~vLvd~~t~SaaE~~a~~l  317 (406)
                          ..+.||..++++.++|+|-+++.+=
T Consensus        83 ----~~~~~V~Ti~~G~AaS~As~il~aG  107 (201)
T PRK14513         83 ----YIKAPVSTICVGIAMSMGSVLLMAG  107 (201)
T ss_pred             ----hcCCCEEEEEEeeehhhHHHHHhcC
Confidence                1335799999999999998887554


No 106
>PF01740 STAS:  STAS domain;  InterPro: IPR002645 The STAS (Sulphate Transporter and AntiSigma factor antagonist) domain is found in the C-terminal region of sulphate transporters and bacterial anti-sigma factor antagonists. It has been suggested that this domain may have a general NTP binding function. The establishment of differential gene expression in sporulating Bacillus subtilis involves four protein components one of which is SpoIIAA (P10727 from SWISSPROT). The four components regulate the sporulation sigma factor F. Early in sporulation, SpoIIAA is in the phosphorylated state (SpoIIAA-P), as a result of the activity of the ATP-dependent protein kinase SpoIIAB (P10728 from SWISSPROT). The site at which this protein is a conserved serine. SpoIIAB is an anti-sigma factor that in its free form inhibits F by binding to it. Competition by SpoIIAA (the anti-anti-sigma factor) for binding to SpoIIAB releases Sigma F activity []. The STAS domain is found in the anti-sigma factor antagonist SpoIIAA.; PDB: 3T6O_B 3LKL_B 1H4Z_A 1H4Y_B 1H4X_B 3NY7_A 3OIZ_A 1T6R_A 1VC1_B 1SBO_A ....
Probab=34.66  E-value=1.2e+02  Score=23.84  Aligned_cols=47  Identities=17%  Similarity=0.141  Sum_probs=33.4

Q ss_pred             ceEEEEcCc-cccchHHHHHHHHHHHhcCC---------CCeEEEEeCCCCCCChHH
Q 015469          211 RIGYIKLTS-FNQNASGAVREAIDTLRSNS---------VNAFVLDLRDNSGGLFPE  257 (406)
Q Consensus       211 ~igyl~i~~-f~~~~~~~~~~~~~~~~~~~---------~~~lIiDlR~N~GG~~~~  257 (406)
                      ++..+++.. +.....+.+++.+.++...+         .+.+|||+++-..=+...
T Consensus         9 ~v~ii~~~g~l~f~~~~~~~~~i~~~~~~~~~~~~~~~~~~~vIlD~s~v~~iDssg   65 (117)
T PF01740_consen    9 GVLIIRLDGPLFFANAEEFRDRIRKLIDEDPERIKKRQTIKNVILDMSGVSFIDSSG   65 (117)
T ss_dssp             TEEEEEEESEESHHHHHHHHHHHHHHHCCSSS--HTSSSSSEEEEEETTESEESHHH
T ss_pred             CEEEEEEeeEEEHHHHHHHHHHHHHhhhcccccccccccceEEEEEEEeCCcCCHHH
Confidence            677777765 33345677888877766555         599999999987655443


No 107
>KOG4407 consensus Predicted Rho GTPase-activating protein [General function prediction only]
Probab=33.83  E-value=24  Score=39.69  Aligned_cols=46  Identities=15%  Similarity=0.357  Sum_probs=38.7

Q ss_pred             CcEEEEEeCCCChhhhcCCCCCCEEEEECCEecCCCCHHHHHHHhC
Q 015469          118 AGLVVISSMPGGPANRAGILSGDVILAIDDTSTESMGIYDAAERLQ  163 (406)
Q Consensus       118 ~~~~V~~v~~~spA~~aGl~~GD~I~~Ing~~v~~~~~~~~~~~l~  163 (406)
                      +.++|..|.+++||..+.|+-||.++.||..++..+....++..+.
T Consensus       143 eT~~~~eV~~n~~~~~a~LQ~~~~V~~v~~q~~A~i~~s~~~S~~~  188 (1973)
T KOG4407|consen  143 ETIFIKEVQANGPAHYANLQTGDRVLMVNNQPIAGIAYSTIVSMIK  188 (1973)
T ss_pred             hhhhhhhhccCChhHHHhhhccceeEEeecCcccchhhhhhhhhhc
Confidence            3578999999999999999999999999999999875555555443


No 108
>PRK14514 ATP-dependent Clp protease proteolytic subunit; Provisional
Probab=32.99  E-value=1.7e+02  Score=26.60  Aligned_cols=80  Identities=18%  Similarity=0.202  Sum_probs=51.7

Q ss_pred             ceEEEEcCccccchHHHHHHHHHHHhcCC-CCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCCC
Q 015469          211 RIGYIKLTSFNQNASGAVREAIDTLRSNS-VNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDGT  289 (406)
Q Consensus       211 ~igyl~i~~f~~~~~~~~~~~~~~~~~~~-~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~  289 (406)
                      +|-||-- ..++...+.+...|-.|...+ .+.|.|=+ +-+||++..+..+...+-                       
T Consensus        55 Riifl~~-~Idd~~a~~i~aqLl~L~~~~~~~~I~lyI-NSpGGsv~aGlaIyd~m~-----------------------  109 (221)
T PRK14514         55 RIIFLGT-QIDDYTANTIQAQLLYLDSVDPGKDISIYI-NSPGGSVYAGLGIYDTMQ-----------------------  109 (221)
T ss_pred             cEEEECC-EEcHHHHHHHHHHHHHHhccCCCCCEEEEE-ECCCcchhhHHHHHHHHH-----------------------
Confidence            5544431 123345666777666665432 35666655 678899888776666541                       


Q ss_pred             CccCCCCCEEEEEcCCCccHHHHHHHHHh
Q 015469          290 DALAASEPLAVLVNKGTASASEILAGALK  318 (406)
Q Consensus       290 ~~~~~~~~v~vLvd~~t~SaaE~~a~~lk  318 (406)
                         ..+.||..++++..+|+|-+++.+=.
T Consensus       110 ---~~~~~V~tv~~G~AAS~AslIl~aG~  135 (221)
T PRK14514        110 ---FISSDVATICTGMAASMASVLLVAGT  135 (221)
T ss_pred             ---hcCCCEEEEEEEEehhHHHHHHhcCC
Confidence               13357999999999999998887643


No 109
>TIGR02886 spore_II_AA anti-sigma F factor antagonist. The anti-sigma F factor antagonist, also called stage II sporulation protein AA, is a protein universal among endospore-forming bacteria, all of which belong to the Firmcutes
Probab=32.98  E-value=1.1e+02  Score=23.58  Aligned_cols=46  Identities=15%  Similarity=0.273  Sum_probs=30.8

Q ss_pred             ceEEEEcCc-cccchHHHHHHHHHHHh-cCCCCeEEEEeCCCCCCChH
Q 015469          211 RIGYIKLTS-FNQNASGAVREAIDTLR-SNSVNAFVLDLRDNSGGLFP  256 (406)
Q Consensus       211 ~igyl~i~~-f~~~~~~~~~~~~~~~~-~~~~~~lIiDlR~N~GG~~~  256 (406)
                      ++..+++.. +.....+.+.+.+.+.- +.+.+.+|||+++-.-=+..
T Consensus         8 ~~~vi~l~G~L~f~~~~~~~~~l~~~~~~~~~~~vilDls~v~~iDss   55 (106)
T TIGR02886         8 DVLIVRLSGELDHHTAERVRRKIDDAIERRPIKHLILNLKNVTFMDSS   55 (106)
T ss_pred             CEEEEEEecccchhhHHHHHHHHHHHHHhCCCCEEEEECCCCcEecch
Confidence            566777764 23345667777776643 34689999999998755443


No 110
>COG4702 Uncharacterized conserved protein [Function unknown]
Probab=32.24  E-value=49  Score=27.93  Aligned_cols=36  Identities=14%  Similarity=0.210  Sum_probs=28.9

Q ss_pred             EEcCccccchHHHHHHHHHHHhcCCCCeEEEEeCCC
Q 015469          215 IKLTSFNQNASGAVREAIDTLRSNSVNAFVLDLRDN  250 (406)
Q Consensus       215 l~i~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N  250 (406)
                      +.+++|.....-.+-..++....++..+++||++-|
T Consensus        21 l~f~~fd~~dAf~LG~~IR~~a~k~~~piaIDItL~   56 (168)
T COG4702          21 LQFSSFDYADAFSLGTYIRRAAKKNKLPIAIDITLN   56 (168)
T ss_pred             hccccCcHHHHHHHHHHHHHHHHhcCCCEEEEEEEC
Confidence            567888776666777778777666779999999999


No 111
>cd00466 DHQase_II Dehydroquinase (DHQase), type II. Dehydroquinase (or 3-dehydroquinate dehydratase) catalyzes the reversible dehydration of 3-dehydroquinate to form 3-dehydroshikimate. This reaction is part of two metabolic pathways: the biosynthetic shikimate pathway and the catabolic quinate pathway. There are two types of DHQases, which are distinct from each other in amino acid sequence and three-dimensional structure. Type I enzymes usually catalyze the biosynthetic reaction using a syn elimination mechanism. In contrast, type II enzymes, found in the quinate pathway of fungi and in the shikimate pathway of many bacteria, are dodecameric enzymes that employ an anti elimination reaction mechanism.
Probab=30.77  E-value=67  Score=26.80  Aligned_cols=49  Identities=16%  Similarity=0.310  Sum_probs=35.3

Q ss_pred             EcCccccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCC
Q 015469          216 KLTSFNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKG  269 (406)
Q Consensus       216 ~i~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~  269 (406)
                      .+.-|..+...++-+.+.+... +.+++||    |||+....+..+...+..-.
T Consensus        43 ~v~~~QSN~Egelid~I~~a~~-~~dgiII----Npga~THtSvAi~DAl~~~~   91 (140)
T cd00466          43 EVEFFQSNHEGELIDWIHEARD-GADGIII----NPGAYTHTSIALRDALAAVS   91 (140)
T ss_pred             EEEEEeeCcHHHHHHHHHHhhc-cCcEEEE----cchHHHHHHHHHHHHHHcCC
Confidence            4445655666677777766543 6899999    99999988888888775533


No 112
>TIGR00377 ant_ant_sig anti-anti-sigma factor. This superfamily includes small (105-125 residue) proteins related to SpoIIAA of Bacillus subtilis, an anti-anti-sigma factor. SpoIIAA can bind to and inhibit the anti-sigma F factor SpoIIAB. Also, it can be phosphorylated by SpoIIAB on a Ser residue at position 59 of the seed alignment. A similar arrangement is inferred for RsbV, an anti-anti-sigma factor for sigma B. This Ser is fairly well conserved within a motif resembling MXS[STA]G[VIL]X[VIL][VILF] among homologous known or predicted anti-anti-sigma factors. Regions similar to SpoIIAA and apparently homologous, but differing considerably near the phosphorlated Ser of SpoIIAA, appear in a single copy in several longer proteins.
Probab=29.41  E-value=1.6e+02  Score=22.46  Aligned_cols=46  Identities=17%  Similarity=0.213  Sum_probs=30.7

Q ss_pred             ceEEEEcCc-cccchHHHHHHHHHHHhc-CCCCeEEEEeCCCCCCChH
Q 015469          211 RIGYIKLTS-FNQNASGAVREAIDTLRS-NSVNAFVLDLRDNSGGLFP  256 (406)
Q Consensus       211 ~igyl~i~~-f~~~~~~~~~~~~~~~~~-~~~~~lIiDlR~N~GG~~~  256 (406)
                      ++.++++.. +.......+++.+..+.. .+.+.+|||+.+-..=+..
T Consensus        12 ~~~vi~~~G~l~~~~~~~~~~~l~~~~~~~~~~~vvidls~v~~iDss   59 (108)
T TIGR00377        12 GVVIVRLSGELDAHTAPLLREKVTPAAERTGPRPIVLDLEDLEFMDSS   59 (108)
T ss_pred             CEEEEEEecccccccHHHHHHHHHHHHHhcCCCeEEEECCCCeEEccc
Confidence            566666654 333346677777766554 4789999999987765543


No 113
>KOG4371 consensus Membrane-associated protein tyrosine phosphatase PTP-BAS and related proteins, contain FERM domain [Signal transduction mechanisms]
Probab=28.26  E-value=57  Score=36.07  Aligned_cols=72  Identities=24%  Similarity=0.401  Sum_probs=44.1

Q ss_pred             eeeeEEEEeeccCCCCCCCcEEEEEeCCCChhhhcC-CCCCCEEEEECCEecCCCCHHHHHHHhCCCCCCcEEEEEEe
Q 015469          100 LTGVGLSIGYPTASDGSSAGLVVISSMPGGPANRAG-ILSGDVILAIDDTSTESMGIYDAAERLQGPEGSPVELTVRS  176 (406)
Q Consensus       100 ~~g~g~~~~~~~~~~~~~~~~~V~~v~~~spA~~aG-l~~GD~I~~Ing~~v~~~~~~~~~~~l~~~~g~~v~l~v~r  176 (406)
                      ..++|+.+....    ..+++++..+..++.|...| ++.||.+++.+|+++...........+. -.-.++.+++.|
T Consensus      1256 ~~~~~~~~~~~~----~s~~~~~~~~~~~~~a~~~~~~r~g~~~~~~~~~~~~~~~p~~~l~~~~-~v~~p~~~~~~~ 1328 (1332)
T KOG4371|consen 1256 MATLGLSLAKRT----MSDGIFIRNIAQDSAASSEGTLRVGDRLVSLDGEPVDGFTPATILEKLK-LVQGPVQITVTR 1328 (1332)
T ss_pred             cccccccccccC----cCCceeeecccccccccccccccccceeeccCCccCCCCChHHHHHHhh-hccCchhheehh
Confidence            345555544332    35678887777666665555 9999999999999999875433332222 122344555543


No 114
>cd06844 STAS Sulphate Transporter and Anti-Sigma factor antagonist domain found in the C-terminal region of sulphate transporters as well as in bacterial and archaeal proteins involved in the regulation of sigma factors. The STAS (Sulphate Transporter and Anti-Sigma factor antagonist) domain is found in the C-terminal region of sulphate transporters as well as in bacterial and archaeal proteins involved in the regulation of sigma factors, like anti-anti-sigma factors and "stressosome" components. The sigma factor regulators are involved in protein-protein interaction which is regulated by phosphorylation.
Probab=27.97  E-value=1.3e+02  Score=22.94  Aligned_cols=44  Identities=9%  Similarity=0.107  Sum_probs=28.3

Q ss_pred             ceEEEEcCc-cccchHHHHHHHHHH-HhcCCCCeEEEEeCCCCCCC
Q 015469          211 RIGYIKLTS-FNQNASGAVREAIDT-LRSNSVNAFVLDLRDNSGGL  254 (406)
Q Consensus       211 ~igyl~i~~-f~~~~~~~~~~~~~~-~~~~~~~~lIiDlR~N~GG~  254 (406)
                      ++.++++.. +.-.+.+.+++.+.. +.+.+.+.+|||+++-.-=+
T Consensus         8 ~v~ii~~~G~l~f~~~~~~~~~l~~~~~~~~~~~vilDls~v~~iD   53 (100)
T cd06844           8 DYWVVRLEGELDHHSVEQFKEELLHNITNVAGKTIVIDISALEFMD   53 (100)
T ss_pred             CEEEEEEEEEecHhhHHHHHHHHHHHHHhCCCCEEEEECCCCcEEc
Confidence            566777764 333456677776643 33346899999998765433


No 115
>cd07560 Peptidase_S41_CPP C-terminal processing peptidase; serine protease family S41. The C-terminal processing peptidase (CPP, EC 3.4.21.102) also known as tail-specific protease (tsp), the photosystem II D1 C-terminal processing protease (D1P), and other related S41 protease family members are present in this CD. CPP is synthesized as a precursor form with a carboxyl-terminal extension. It specifically recognizes a C-terminal tripeptide, Xaa-Yaa-Zaa, in which Xaa is preferably Ala or Leu, Yaa is preferably Ala or Tyr and Zaa is preferably Ala, but then cleaves at a variable distance from the C-terminus. The C-terminal carboxylate group is essential, and proteins where this group is amidated are not substrates. This family of proteases contains the PDZ domain that promotes protein-protein interactions and is important for substrate recognition. The active site consists of a serine/lysine catalytic dyad. The bacterial CCP-1 is believed to be important for the degradation of incorrectl
Probab=27.79  E-value=1.1e+02  Score=27.47  Aligned_cols=43  Identities=33%  Similarity=0.549  Sum_probs=31.4

Q ss_pred             HHHHHHHHHHHhccccccCCcchHHHHHhhhhcCCCCCHHHHHHHHHHHHHhCCCCCCCccCh
Q 015469           24 LFLEAWRTIDRAYVDKTFNGQSWFRYRENALRNEPMNTREETYMAIRKMLATLDDPFTRFLEP   86 (406)
Q Consensus        24 ~f~~~w~~i~~~y~~~~~~~~dW~~~~~~~~~~~~~~~~~~~~~~i~~~~~~L~D~ht~~~~~   86 (406)
                      .++++..+++++|.++.                   ......+..+++|+.. .|||+.|+.+
T Consensus         7 ~~~~~~~~~~~~~~~~~-------------------~~~~~~~~~~~~~~~~-~~~~~~~~~~   49 (211)
T cd07560           7 KLEEVLELIKKNYVDPV-------------------DDEKLIEGAIKGMLSS-LDPYSRYLTP   49 (211)
T ss_pred             HHHHHHHHHHHHHhccC-------------------CHHHHHHHHHHHHHHc-CCCcceeeCc
Confidence            45666777888887752                   1124456788999999 7999999886


No 116
>TIGR01088 aroQ 3-dehydroquinate dehydratase, type II. This model specifies the type II enzyme. The type I enzyme, often found as part of a multifunctional protein, is described by TIGR01093.
Probab=27.50  E-value=86  Score=26.19  Aligned_cols=49  Identities=16%  Similarity=0.340  Sum_probs=35.3

Q ss_pred             EcCccccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCC
Q 015469          216 KLTSFNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKG  269 (406)
Q Consensus       216 ~i~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~  269 (406)
                      .+.-|..+...++-..+.+... +++++||    ||||....+..+...+..-+
T Consensus        43 ~v~~~QSN~EGelId~i~~a~~-~~dgiII----Npga~THtSiAl~DAl~~~~   91 (141)
T TIGR01088        43 ELEFFQSNSEGQLIDKIHEAEG-QYDGIII----NPGALTHTSVALRDALAAVS   91 (141)
T ss_pred             EEEEEeeCcHHHHHHHHHhccc-cCCEEEE----cChHHhhhHHHHHHHHHcCC
Confidence            4445665656677777766532 4899999    99999988888888876544


No 117
>PRK06688 enoyl-CoA hydratase; Provisional
Probab=27.46  E-value=71  Score=29.44  Aligned_cols=99  Identities=17%  Similarity=0.133  Sum_probs=55.3

Q ss_pred             CceEEEEcCc------cccchHHHHHHHHHHHhc-CCCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCcee
Q 015469          210 PRIGYIKLTS------FNQNASGAVREAIDTLRS-NSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRD  282 (406)
Q Consensus       210 ~~igyl~i~~------f~~~~~~~~~~~~~~~~~-~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~  282 (406)
                      ++|++|.++.      |+....+++.++++++.+ .+++.+||  ++++ +.+..+.++-.+.-.....  .........
T Consensus        13 ~~v~~i~lnrp~~~Nal~~~~~~~l~~~l~~~~~d~~v~~vVl--~g~g-~~F~aG~Dl~~~~~~~~~~--~~~~~~~~~   87 (259)
T PRK06688         13 DGVLTITINRPDKKNALTAAMYQALADALEAAATDPAVRVVVL--TGAG-RAFSAGGDIKDFPKAPPKP--PDELAPVNR   87 (259)
T ss_pred             CCEEEEEecCcccccCCCHHHHHHHHHHHHHHhcCCCceEEEE--ECCC-CCccCccCHHHHhccCcch--HHHHHHHHH
Confidence            3677776653      444566788888888875 46889997  4443 3444443333221100000  000000000


Q ss_pred             eeecCCCCccCCCCCEEEEEcCCCccHHHHHHHHH
Q 015469          283 IYDTDGTDALAASEPLAVLVNKGTASASEILAGAL  317 (406)
Q Consensus       283 ~~~~~~~~~~~~~~~v~vLvd~~t~SaaE~~a~~l  317 (406)
                      .+.    .-...++|++..+++.+...+-.++.+.
T Consensus        88 ~~~----~l~~~~kp~Iaav~G~a~GgG~~lal~c  118 (259)
T PRK06688         88 FLR----AIAALPKPVVAAVNGPAVGVGVSLALAC  118 (259)
T ss_pred             HHH----HHHcCCCCEEEEECCeeecHHHHHHHhC
Confidence            111    0124679999999999999988887776


No 118
>cd07042 STAS_SulP_like_sulfate_transporter Sulphate Transporter and Anti-Sigma factor antagonist domain of SulP-like sulfate transporters, plays a role in the function and regulation of the transport activity, proposed general NTP binding function. The SulP family is a large and diverse family of anion transporters, with members from eubacteria, plants, fungi, and mammals. They contain 10 to 14 transmembrane helices which form the catalytic core of the protein and a C-terminal extension, the STAS (Sulphate Transporter and AntiSigma factor antagonist) domain which plays a role in the function and regulation of the transport activity. The STAS domain is found in the C-terminal region of sulphate transporters and bacterial anti-sigma factor antagonists. It has been suggested that this domain may have a general NTP binding function.
Probab=26.40  E-value=2.8e+02  Score=20.79  Aligned_cols=47  Identities=11%  Similarity=0.090  Sum_probs=29.5

Q ss_pred             CCceEEEEcCc-cccchHHHHHHHHHHHhcCC--CCeEEEEeCCCCCCCh
Q 015469          209 SPRIGYIKLTS-FNQNASGAVREAIDTLRSNS--VNAFVLDLRDNSGGLF  255 (406)
Q Consensus       209 ~~~igyl~i~~-f~~~~~~~~~~~~~~~~~~~--~~~lIiDlR~N~GG~~  255 (406)
                      .+++.++++.. +.-...+.+.+.+.+..+..  .+.+|||+++-..=+.
T Consensus         7 ~~~~~v~~l~G~l~~~~~~~l~~~~~~~~~~~~~~~~lilD~~~v~~iDs   56 (107)
T cd07042           7 PPGVLIYRIDGPLFFGNAEYFKDRLLRLVDEDPPLKVVILDLSAVNFIDS   56 (107)
T ss_pred             CCCEEEEEecCceEeehHHHHHHHHHHHhccCCCceEEEEECCCCchhhH
Confidence            34677777665 22234556666666655433  5899999998764443


No 119
>PRK05395 3-dehydroquinate dehydratase; Provisional
Probab=25.78  E-value=90  Score=26.26  Aligned_cols=49  Identities=16%  Similarity=0.340  Sum_probs=35.0

Q ss_pred             EcCccccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCC
Q 015469          216 KLTSFNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKG  269 (406)
Q Consensus       216 ~i~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~  269 (406)
                      .+.-|..+...++-..+.+... +++++||    |||+....+..+...+..-+
T Consensus        45 ~v~~~QSN~EGelId~I~~a~~-~~dgiiI----Npga~THtSiAl~DAl~~~~   93 (146)
T PRK05395         45 ELEFFQSNHEGELIDRIHEARD-GADGIII----NPGAYTHTSVALRDALAAVS   93 (146)
T ss_pred             EEEEEeeCcHHHHHHHHHhccc-CCcEEEE----CchHHHHHHHHHHHHHHcCC
Confidence            3444555556677777766543 6899999    99999988888888775543


No 120
>PRK13015 3-dehydroquinate dehydratase; Reviewed
Probab=24.59  E-value=96  Score=26.08  Aligned_cols=49  Identities=18%  Similarity=0.240  Sum_probs=34.7

Q ss_pred             EcCccccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCC
Q 015469          216 KLTSFNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKG  269 (406)
Q Consensus       216 ~i~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~  269 (406)
                      .+.-|..+...++-..+.+.. .+++++||    |||+....+..+...+..-+
T Consensus        45 ~~~~~QSN~EGelId~i~~a~-~~~dgiII----Npga~THtSiAl~DAl~~~~   93 (146)
T PRK13015         45 EVEFRQSNHEGELIDWIHEAR-GDVAGIVI----NPGAYTHTSVAIRDALAALE   93 (146)
T ss_pred             EEEEEeeCcHHHHHHHHHHhh-hcCCEEEE----cchHHhhhHHHHHHHHHcCC
Confidence            444565555666666666543 35899999    99999988888888776544


No 121
>PF01220 DHquinase_II:  Dehydroquinase class II;  InterPro: IPR001874 3-dehydroquinate dehydratase (4.2.1.10 from EC), or dehydroquinase, catalyzes the conversion of 3-dehydroquinate into 3-dehydroshikimate. It is the third step in the shikimate pathway for the biosynthesis of aromatic amino acids from chorismate. Two classes of dehydroquinases exist, known as types I and II. Class-II enzymes are homododecameric enzymes of about 17 kDa. They are found in some bacteria such as actinomycetales [, ] and some fungi where they act in a catabolic pathway that allows the use of quinic acid as a carbon source.; GO: 0003855 3-dehydroquinate dehydratase activity; PDB: 3N8K_J 3N7A_I 3N87_F 3N8N_H 3N86_N 1H0S_A 3N59_J 1H05_A 1H0R_A 2Y71_A ....
Probab=24.30  E-value=82  Score=26.29  Aligned_cols=49  Identities=20%  Similarity=0.333  Sum_probs=32.3

Q ss_pred             EcCccccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCCChHHHHHHHHhhccCC
Q 015469          216 KLTSFNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGGLFPEGIEIAKIWLDKG  269 (406)
Q Consensus       216 ~i~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~  269 (406)
                      .+.-|..+...++-+.+.+... .++++||    ||||....+..+..-+..-.
T Consensus        44 ~v~~~QSN~EGelid~I~~a~~-~~dgiII----Npga~thtS~Ai~DAl~~~~   92 (140)
T PF01220_consen   44 EVEFFQSNHEGELIDWIHEARD-DVDGIII----NPGAYTHTSIAIRDALKAIS   92 (140)
T ss_dssp             EEEEEE-SSHHHHHHHHHHHTC-TTSEEEE----E-GGGGHT-HHHHHHHHCCT
T ss_pred             eEEEEecCCHHHHHHHHHHHHh-hCCEEEE----ccchhccccHHHHHHHHcCC
Confidence            3444555566677777776654 4999999    99999887777777665433


No 122
>PF13200 DUF4015:  Putative glycosyl hydrolase domain
Probab=23.44  E-value=1.1e+02  Score=29.36  Aligned_cols=36  Identities=22%  Similarity=0.570  Sum_probs=27.8

Q ss_pred             CccccchHHHHHHHHHHHhcCCCCeEEEEeCCCCCC
Q 015469          218 TSFNQNASGAVREAIDTLRSNSVNAFVLDLRDNSGG  253 (406)
Q Consensus       218 ~~f~~~~~~~~~~~~~~~~~~~~~~lIiDlR~N~GG  253 (406)
                      +.+..+....+++.++.+++.++.++|||+.+-.|-
T Consensus         5 t~~~a~~~~~~~~~~~~i~~t~lNavVIDvKdd~G~   40 (316)
T PF13200_consen    5 TAYSAGSPERLDKLLDLIKRTELNAVVIDVKDDDGN   40 (316)
T ss_pred             chhhcCCHHHHHHHHHHHHhcCCceEEEEEecCCce
Confidence            334334456788999999889999999999977765


No 123
>COG4100 Cystathionine beta-lyase family protein involved in aluminum resistance [Inorganic ion transport and metabolism]
Probab=22.64  E-value=1.4e+02  Score=28.41  Aligned_cols=23  Identities=17%  Similarity=0.304  Sum_probs=18.8

Q ss_pred             CCCCCCEEEEECCEecCCCCHHHHH
Q 015469          135 GILSGDVILAIDDTSTESMGIYDAA  159 (406)
Q Consensus       135 Gl~~GD~I~~Ing~~v~~~~~~~~~  159 (406)
                      -|++||+++.|-|.|..++  .++.
T Consensus       103 ~LRpgDell~i~G~PYDTL--eevI  125 (416)
T COG4100         103 ILRPGDELLYITGSPYDTL--EEVI  125 (416)
T ss_pred             ccCCCCeEEEecCCcchhH--HHHh
Confidence            3899999999999998774  5544


No 124
>CHL00028 clpP ATP-dependent Clp protease proteolytic subunit
Probab=22.45  E-value=3e+02  Score=24.45  Aligned_cols=80  Identities=11%  Similarity=0.137  Sum_probs=51.2

Q ss_pred             CceEEEEcCccccchHHHHHHHHHHHhcC-CCCeEEEEeCCCCCCChHHHHHHHHhhccCCcEEEEEcCCCceeeeecCC
Q 015469          210 PRIGYIKLTSFNQNASGAVREAIDTLRSN-SVNAFVLDLRDNSGGLFPEGIEIAKIWLDKGVIVYICDSRGVRDIYDTDG  288 (406)
Q Consensus       210 ~~igyl~i~~f~~~~~~~~~~~~~~~~~~-~~~~lIiDlR~N~GG~~~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~~~~  288 (406)
                      ++|-||--+ ..+...+.+-..+-.|... ..+.+.|=+ +-+||++..+..+...+-                      
T Consensus        30 ~Riifl~~~-i~~~~a~~ii~~ll~L~~~~~~~~I~l~I-NSpGG~v~~g~aIyd~m~----------------------   85 (200)
T CHL00028         30 ERLLFLGQE-VDDEIANQLIGLMVYLSIEDDTKDLYLFI-NSPGGSVISGLAIYDTMQ----------------------   85 (200)
T ss_pred             CCEEEECCe-ecHHHHHHHHHHHHHHhccCCCCCEEEEE-eCCCcchhhHHHHHHHHH----------------------
Confidence            466565422 2334456666666666544 366676666 567888888776666542                      


Q ss_pred             CCccCCCCCEEEEEcCCCccHHHHHHHHH
Q 015469          289 TDALAASEPLAVLVNKGTASASEILAGAL  317 (406)
Q Consensus       289 ~~~~~~~~~v~vLvd~~t~SaaE~~a~~l  317 (406)
                          ..+.||...+++.++|+|-+++.+=
T Consensus        86 ----~~~~~V~Tv~~G~AaS~aslIl~aG  110 (200)
T CHL00028         86 ----FVKPDVHTICLGLAASMASFILAGG  110 (200)
T ss_pred             ----hcCCCEEEEEEEehHHHHHHHHhCC
Confidence                1234688888899999888877664


No 125
>PF08090 Enterotoxin_HS1:  Heat stable E.coli enterotoxin 1;  InterPro: IPR012557 Heat-stable toxin 1 of entero-aggregative Escherichia coli (EAST1) is a small toxin. It is not, however, solely associated with entero-aggregative E. coli but also with many other diarrhoeic E. coli families. Some studies have established the role of EAST1 in some human outbreaks of diarrhoea. Isolates from farm animals have been shown to carry the astA gene coding for EAST1. However, the relation between the presence of EAST1 and disease is not conclusive [].
Probab=21.76  E-value=35  Score=20.35  Aligned_cols=12  Identities=33%  Similarity=0.863  Sum_probs=10.1

Q ss_pred             hhhcccccchhh
Q 015469          386 CGCLQDSASTCN  397 (406)
Q Consensus       386 ~~~~~~~~~~~~  397 (406)
                      .+++|.|+|+||
T Consensus         2 ~~~ir~pass~a   13 (36)
T PF08090_consen    2 IQCIRRPASSCA   13 (36)
T ss_pred             cceecccccchh
Confidence            368899999997


No 126
>TIGR03000 plancto_dom_1 Planctomycetes uncharacterized domain TIGR03000. Domains described by this model are found, so far, only in the Planctomycetes (Pirellula sp. strain 1 and Gemmata obscuriglobus), in up to six proteins per genome, and may be duplicated within a protein. The function is unknown.
Probab=20.74  E-value=2.3e+02  Score=20.94  Aligned_cols=42  Identities=19%  Similarity=0.212  Sum_probs=32.1

Q ss_pred             CeEEEcccCCCCceeeeE--EECCCCCeEEEEEeEEEcCCCCcc
Q 015469          322 RAVLFGEPTYGKGKIQSV--FQLSDGSGLAVTVARYETPAHTDI  363 (406)
Q Consensus       322 ~~~ivG~~T~G~~~~~~~--~~L~~g~~~~~~~~~~~~~~g~~~  363 (406)
                      +..+=|.+|.|.|..-..  -.|+.|..+.+...--+.++|+.+
T Consensus        14 kl~v~G~~t~~~G~~R~F~T~~L~~G~~y~Y~v~a~~~~dG~~~   57 (75)
T TIGR03000        14 KLKVDGKETNGTGTVRTFTTPPLEAGKEYEYTVTAEYDRDGRIL   57 (75)
T ss_pred             EEEECCeEcccCccEEEEECCCCCCCCEEEEEEEEEEecCCcEE
Confidence            456778999988865433  368889888888888888998654


No 127
>TIGR03121 one_C_dehyd_A formylmethanofuran dehydrogenase subunit A. Members of this largely archaeal protein family are subunit A of the formylmethanofuran dehydrogenase. Nomenclature in some bacteria may reflect inclusion of the formyltransferase described by TIGR03119 as part of the complex, and therefore call this protein formyltransferase/hydrolase complex Fhc subunit A. Note that this model does not distinguish tungsten (FwdA) from molybdenum-containing (FmdA) forms of this enzyme; a single gene from this family is expressed constitutively in Methanobacterium thermoautotrophicum, which has both tungsten and molybdenum forms and may work interchangeably.
Probab=20.26  E-value=99  Score=32.17  Aligned_cols=73  Identities=18%  Similarity=0.180  Sum_probs=49.6

Q ss_pred             CCccHHHHHHHHHhcCCCeEE-EcccCCCCceeeeE-EECCCCCeEEEEEeEEEcCCCCccCCCCcccCeecCCCC
Q 015469          305 GTASASEILAGALKDNKRAVL-FGEPTYGKGKIQSV-FQLSDGSGLAVTVARYETPAHTDIDKVGVIPDHPLPKTF  378 (406)
Q Consensus       305 ~t~SaaE~~a~~lk~~~~~~i-vG~~T~G~~~~~~~-~~L~~g~~~~~~~~~~~~~~g~~~e~~Gv~PDi~v~~~~  378 (406)
                      .-.|.|+.+|..+..++++++ ||+-++|.....+. -+... ....++..+|..-|.+.-.+.||.|=+.-+..+
T Consensus       282 ~f~s~a~~~a~~vn~~~~~t~d~Gqv~fg~t~tmt~d~~~~~-~~~~~~~~kw~~~d~e~e~g~gvvp~~y~~~~~  356 (556)
T TIGR03121       282 DFESGAEKIADYVNANPNVTIDVGQVTFGETTTMTADGPMEY-DLHKLTGLKWANKDVELETGSGVVPFKYSPKNP  356 (556)
T ss_pred             CcchhHHHHHHHHhcCCCEEEEeCceecCCceEEeccchhhh-hcccCCCCceeeeeeecccCCceEEeeecCCCc
Confidence            567999999999999998775 99999998643221 00100 123445567777776666788999987655443


Done!