Query         036387
Match_columns 334
No_of_seqs    231 out of 1332
Neff          8.1 
Searched_HMMs 46136
Date          Fri Mar 29 12:11:00 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/036387.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/036387hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 PF14870 PSII_BNR:  Photosynthe 100.0 3.1E-39 6.6E-44  298.9  28.4  258   61-333    14-302 (302)
  2 PLN00033 photosystem II stabil 100.0 2.9E-38 6.3E-43  303.6  28.6  274   60-334    34-398 (398)
  3 PRK13684 Ycf48-like protein; P 100.0 8.7E-33 1.9E-37  262.1  28.1  253   65-334    47-330 (334)
  4 PF14870 PSII_BNR:  Photosynthe 100.0 7.9E-30 1.7E-34  236.2  27.0  209  100-333     4-213 (302)
  5 COG4447 Uncharacterized protei 100.0 1.6E-30 3.6E-35  230.4  13.6  243   80-334    54-331 (339)
  6 PRK13684 Ycf48-like protein; P 100.0 5.9E-28 1.3E-32  229.0  25.1  214   92-331    25-239 (334)
  7 COG4447 Uncharacterized protei  99.9 2.8E-22 6.1E-27  178.1  12.0  207  102-333    32-241 (339)
  8 PLN00033 photosystem II stabil  99.8 7.7E-20 1.7E-24  176.2  20.1  175  141-333    69-265 (398)
  9 PF13088 BNR_2:  BNR repeat-lik  99.5 3.5E-12 7.5E-17  117.4  19.1  215   92-322    18-275 (275)
 10 smart00602 VPS10 VPS10 domain.  99.4   2E-11 4.3E-16  124.8  24.0  214   92-333    10-250 (612)
 11 smart00602 VPS10 VPS10 domain.  99.1 1.7E-08 3.6E-13  103.4  21.9   59   92-153    55-116 (612)
 12 cd00260 Sialidase Sialidases o  98.9 2.9E-07 6.2E-12   87.9  22.0  220   93-327    49-337 (351)
 13 PF13088 BNR_2:  BNR repeat-lik  98.9 1.2E-07 2.6E-12   87.2  18.7  178  137-325    18-226 (275)
 14 cd00260 Sialidase Sialidases o  98.1 3.3E-05 7.1E-10   73.7  12.9  155  139-301    50-240 (351)
 15 KOG3511 Sortilin and related r  98.0 0.00016 3.5E-09   74.2  14.2   63   92-156   215-280 (720)
 16 PF02012 BNR:  BNR/Asp-box repe  97.4 0.00015 3.3E-09   33.9   1.9   12  186-197     1-12  (12)
 17 PF02012 BNR:  BNR/Asp-box repe  97.3 0.00025 5.3E-09   33.2   1.9   12  287-298     1-12  (12)
 18 KOG3511 Sortilin and related r  97.2  0.0032   7E-08   64.8  11.5   80  116-201   194-279 (720)
 19 PF14517 Tachylectin:  Tachylec  97.1  0.0032 6.9E-08   56.2   8.9  155  166-333    36-204 (229)
 20 PF13859 BNR_3:  BNR repeat-lik  96.6   0.058 1.3E-06   50.8  14.0  150  141-300    34-213 (310)
 21 PF14517 Tachylectin:  Tachylec  96.5   0.025 5.4E-07   50.6  10.2  108  224-332    38-155 (229)
 22 COG4257 Vgb Streptogramin lyas  95.6     1.8   4E-05   39.8  20.3  105  225-333   194-303 (353)
 23 PHA02713 hypothetical protein;  94.6     6.2 0.00013   40.3  23.2  196  101-327   281-523 (557)
 24 PHA02790 Kelch-like protein; P  94.5     5.8 0.00013   39.7  20.4  169  128-325   272-454 (480)
 25 KOG0645 WD40 repeat protein [G  93.9     5.1 0.00011   36.8  20.3  216   80-330    72-306 (312)
 26 COG3292 Predicted periplasmic   93.0     1.4 3.1E-05   44.3  11.7  146  115-286   165-312 (671)
 27 KOG0645 WD40 repeat protein [G  93.0     7.3 0.00016   35.8  22.5  193  116-330    16-220 (312)
 28 KOG0310 Conserved WD40 repeat-  91.6      15 0.00032   36.2  19.9  217   78-330    77-304 (487)
 29 KOG3669 Uncharacterized conser  91.2     5.3 0.00011   40.3  13.1   96   82-190   194-302 (705)
 30 KOG1538 Uncharacterized conser  91.1      21 0.00045   36.9  17.5  198  115-328    13-245 (1081)
 31 PHA02790 Kelch-like protein; P  90.8      19 0.00041   36.0  18.6  151  101-282   296-454 (480)
 32 KOG4441 Proteins containing BT  89.9      25 0.00055   36.1  21.0  192  103-325   312-530 (571)
 33 KOG3669 Uncharacterized conser  89.0      11 0.00024   38.0  13.5  139  174-333   193-353 (705)
 34 COG3292 Predicted periplasmic   88.3     5.6 0.00012   40.2  10.9   98  228-329   214-312 (671)
 35 KOG0278 Serine/threonine kinas  88.2     5.9 0.00013   36.1  10.0  102  223-331   188-293 (334)
 36 PF13859 BNR_3:  BNR repeat-lik  87.4       2 4.4E-05   40.4   7.2   60   92-153   150-213 (310)
 37 smart00706 TECPR Beta propelle  86.2     2.2 4.7E-05   26.1   4.5   34  295-334     2-35  (35)
 38 PF08450 SGL:  SMP-30/Gluconola  85.8      25 0.00054   31.3  22.3  188  119-333     4-211 (246)
 39 PF08450 SGL:  SMP-30/Gluconola  85.8      25 0.00055   31.2  24.7  205   92-325    22-245 (246)
 40 PHA03098 kelch-like protein; P  85.5      43 0.00094   33.7  23.0  172  128-326   295-496 (534)
 41 cd00200 WD40 WD40 domain, foun  84.8      24 0.00053   30.3  23.0  104  222-332    96-204 (289)
 42 COG4946 Uncharacterized protei  83.6      48   0.001   33.0  14.4   70  225-301   133-223 (668)
 43 PHA02713 hypothetical protein;  82.3      62  0.0014   33.1  19.0  152  146-325   281-471 (557)
 44 PHA03098 kelch-like protein; P  80.3      68  0.0015   32.2  20.4  178   94-301   313-520 (534)
 45 KOG0296 Angio-associated migra  80.2      39 0.00086   32.3  12.1  100  224-332    69-175 (399)
 46 KOG1523 Actin-related protein   79.4      47   0.001   31.4  12.2  142  166-325    13-165 (361)
 47 TIGR03547 muta_rot_YjhT mutatr  77.0      66  0.0014   30.2  24.4   76   99-181    38-126 (346)
 48 TIGR03548 mutarot_permut cycli  76.0      68  0.0015   29.9  23.3   30  170-199   120-155 (323)
 49 KOG1274 WD40 repeat protein [G  74.2 1.3E+02  0.0028   32.3  20.6  186  116-332    15-215 (933)
 50 KOG2055 WD40 repeat protein [G  73.3   1E+02  0.0022   30.6  17.8  193  115-333   214-415 (514)
 51 PF07995 GSDH:  Glucose / Sorbo  72.5      53  0.0011   31.1  11.3  100  224-323     6-130 (331)
 52 COG4257 Vgb Streptogramin lyas  70.2      40 0.00087   31.3   9.2  100  228-333    70-174 (353)
 53 KOG0318 WD40 repeat stress pro  70.1 1.3E+02  0.0028   30.4  19.8  138  164-325   364-506 (603)
 54 cd00200 WD40 WD40 domain, foun  69.6      71  0.0015   27.3  22.6  186  115-332    52-246 (289)
 55 KOG4441 Proteins containing BT  69.1 1.4E+02  0.0031   30.6  16.4  137  168-325   327-483 (571)
 56 KOG1446 Histone H3 (Lys4) meth  68.4 1.1E+02  0.0023   28.8  11.9  105  225-333   146-260 (311)
 57 TIGR03547 muta_rot_YjhT mutatr  68.2 1.1E+02  0.0023   28.8  17.3   33  293-326   177-209 (346)
 58 KOG0640 mRNA cleavage stimulat  66.7      33 0.00071   32.3   8.0  111  222-334   175-290 (430)
 59 PF06977 SdiA-regulated:  SdiA-  66.4      43 0.00092   30.5   8.8   72  115-187   171-246 (248)
 60 PRK14131 N-acetylneuraminic ac  66.0 1.3E+02  0.0028   28.9  16.9   33  292-325   197-229 (376)
 61 KOG0289 mRNA splicing factor [  65.9 1.4E+02  0.0031   29.4  18.9  149  165-332   349-502 (506)
 62 TIGR02604 Piru_Ver_Nterm putat  64.4 1.4E+02  0.0029   28.6  14.4   57  266-325   126-202 (367)
 63 KOG2048 WD40 repeat protein [G  62.7   1E+02  0.0022   31.9  11.2  104  221-330    27-135 (691)
 64 TIGR03300 assembly_YfgL outer   61.8 1.5E+02  0.0032   28.1  15.7   95  230-332   279-376 (377)
 65 PF12768 Rax2:  Cortical protei  61.8 1.4E+02   0.003   27.8  12.8   97   94-200    18-130 (281)
 66 KOG0289 mRNA splicing factor [  61.1 1.2E+02  0.0026   29.9  10.9   62  265-330   349-414 (506)
 67 PRK14131 N-acetylneuraminic ac  60.9 1.6E+02  0.0034   28.2  12.5   53  274-326    84-148 (376)
 68 KOG0301 Phospholipase A2-activ  60.1 2.2E+02  0.0048   29.7  15.0  100  224-332   184-285 (745)
 69 PF03404 Mo-co_dimer:  Mo-co ox  58.3      12 0.00027   30.5   3.4   18  139-156    46-63  (131)
 70 KOG0272 U4/U6 small nuclear ri  56.7      32 0.00069   33.5   6.2   92  221-325   263-364 (459)
 71 PF07995 GSDH:  Glucose / Sorbo  55.6 1.8E+02   0.004   27.3  15.6  147  167-323     5-198 (331)
 72 TIGR02604 Piru_Ver_Nterm putat  55.2 1.7E+02  0.0036   28.0  11.3   96  224-323    18-140 (367)
 73 KOG0640 mRNA cleavage stimulat  54.3 1.6E+02  0.0036   27.8  10.2  117  115-248   173-290 (430)
 74 PF00400 WD40:  WD domain, G-be  54.2      40 0.00086   20.1   4.6   27  306-332    11-38  (39)
 75 PF14339 DUF4394:  Domain of un  53.5   1E+02  0.0022   27.9   8.7   70  264-333    27-101 (236)
 76 KOG1332 Vesicle coat complex C  51.8 1.9E+02  0.0042   26.5  11.8   51  103-154    91-144 (299)
 77 PTZ00334 trans-sialidase; Prov  51.3      39 0.00085   35.9   6.5   57  241-299   289-349 (780)
 78 TIGR03548 mutarot_permut cycli  51.1 2.1E+02  0.0045   26.6  18.5   52  274-326   123-180 (323)
 79 KOG0275 Conserved WD40 repeat-  50.8 2.3E+02  0.0049   27.0  11.2   50  274-332   414-464 (508)
 80 KOG0771 Prolactin regulatory e  50.2      89  0.0019   30.3   8.1  108  221-331   188-307 (398)
 81 cd02110 SO_family_Moco_dimer S  48.0      63  0.0014   30.5   6.9   17  139-155   241-257 (317)
 82 PF12768 Rax2:  Cortical protei  45.9 2.5E+02  0.0054   26.0  11.9  103   49-156    25-132 (281)
 83 PRK11138 outer membrane biogen  45.6 2.8E+02  0.0061   26.5  16.5   95  230-332   294-391 (394)
 84 KOG0647 mRNA export protein (c  44.9 2.2E+02  0.0048   26.8   9.5   83   98-185   184-275 (347)
 85 KOG0266 WD40 repeat-containing  44.7 3.2E+02   0.007   27.0  12.4  105  221-332   205-315 (456)
 86 PLN02153 epithiospecifier prot  44.4 2.7E+02  0.0059   26.0  24.6   52  274-326   193-260 (341)
 87 KOG0291 WD40-repeat-containing  42.4 3.4E+02  0.0075   28.8  11.3  101  220-327   351-456 (893)
 88 COG4692 Predicted neuraminidas  42.1      77  0.0017   29.9   6.1   58   92-153   178-242 (381)
 89 PTZ00334 trans-sialidase; Prov  42.0      60  0.0013   34.5   6.2   59   92-153   288-350 (780)
 90 PF13810 DUF4185:  Domain of un  40.8      37  0.0008   32.1   4.1   17   92-108   129-145 (316)
 91 KOG1036 Mitotic spindle checkp  40.1 3.2E+02   0.007   25.7  18.2  189  114-334    54-261 (323)
 92 KOG1063 RNA polymerase II elon  39.6 3.2E+02  0.0069   28.7  10.5  103  227-332   324-433 (764)
 93 PF13810 DUF4185:  Domain of un  38.5      38 0.00082   32.0   3.8   43  283-325   128-182 (316)
 94 KOG0301 Phospholipase A2-activ  38.3   5E+02   0.011   27.3  17.5   64  265-332   181-246 (745)
 95 KOG1063 RNA polymerase II elon  38.0 1.6E+02  0.0035   30.7   8.2   95   93-193   341-438 (764)
 96 KOG0318 WD40 repeat stress pro  37.1 4.7E+02    0.01   26.6  20.7  102  222-332   490-599 (603)
 97 PLN03215 ascorbic acid mannose  37.0 1.2E+02  0.0027   29.3   7.0   51  277-333   175-225 (373)
 98 PLN02153 epithiospecifier prot  37.0 3.6E+02  0.0077   25.2  22.9   53  274-326   251-323 (341)
 99 PF03404 Mo-co_dimer:  Mo-co ox  36.2      48   0.001   27.0   3.6   17  286-302    46-62  (131)
100 KOG1523 Actin-related protein   35.7   4E+02  0.0086   25.4  16.1  213   94-330    36-274 (361)
101 PF06977 SdiA-regulated:  SdiA-  35.0 3.5E+02  0.0075   24.6  21.1  198  115-332    22-247 (248)
102 cd02113 bact_SoxC_Moco bacteri  34.8      42  0.0009   31.9   3.4   17  139-155   243-259 (326)
103 KOG0284 Polyadenylation factor  34.3 1.6E+02  0.0034   28.9   7.1  104  222-333    99-208 (464)
104 KOG0641 WD40 repeat protein [G  33.4 2.4E+02  0.0053   25.4   7.7   80  253-332    22-115 (350)
105 KOG2110 Uncharacterized conser  33.3 2.1E+02  0.0047   27.5   7.7   64  265-330   175-243 (391)
106 PF10647 Gmad1:  Lipoprotein Lp  32.9 2.7E+02  0.0058   25.1   8.4   74  222-301   168-245 (253)
107 KOG1524 WD40 repeat-containing  32.9 2.5E+02  0.0054   28.7   8.4   53  263-329   227-280 (737)
108 KOG2111 Uncharacterized conser  32.6 4.4E+02  0.0095   25.0  12.7  108  221-332   183-319 (346)
109 KOG0275 Conserved WD40 repeat-  32.4 2.8E+02   0.006   26.5   8.2   71  113-187   391-463 (508)
110 cd02114 bact_SorA_Moco sulfite  32.4      44 0.00096   32.3   3.2   17  139-155   293-309 (367)
111 PF07494 Reg_prop:  Two compone  32.0      82  0.0018   17.3   3.0   19  307-325     5-23  (24)
112 PLN02193 nitrile-specifier pro  31.5 5.3E+02   0.011   25.6  23.2  204  102-326   151-386 (470)
113 KOG0973 Histone transcription   31.3 7.4E+02   0.016   27.2  16.3  205  102-330   117-350 (942)
114 cd02847 Chitobiase_C_term Chit  30.8      81  0.0017   23.3   3.7   19  137-155    33-51  (78)
115 KOG1446 Histone H3 (Lys4) meth  30.2 2.2E+02  0.0047   26.8   7.1   62  268-330   145-212 (311)
116 cd02112 eukary_NR_Moco molybdo  28.9      60  0.0013   31.6   3.5   17  139-155   305-321 (386)
117 KOG2055 WD40 repeat protein [G  27.9 6.2E+02   0.014   25.3  15.5  191  115-327   258-456 (514)
118 PTZ00421 coronin; Provisional   27.4 6.5E+02   0.014   25.3  25.3   25  115-139    76-100 (493)
119 KOG2111 Uncharacterized conser  27.2   3E+02  0.0065   26.1   7.5   64  265-330   183-251 (346)
120 PF06739 SBBP:  Beta-propeller   27.1 1.2E+02  0.0026   18.8   3.5   20  307-326    13-32  (38)
121 KOG0310 Conserved WD40 repeat-  26.0 1.4E+02  0.0031   29.6   5.4   67  265-332    70-137 (487)
122 cd02111 eukary_SO_Moco molybdo  25.5 2.1E+02  0.0046   27.6   6.6   17  139-155   281-297 (365)
123 KOG4714 Nucleoporin [Nuclear s  25.4 2.2E+02  0.0048   26.3   6.1   27  115-141   224-250 (319)
124 KOG2445 Nuclear pore complex c  25.3 5.9E+02   0.013   24.2  15.4  195  115-328    14-250 (361)
125 PF13570 PQQ_3:  PQQ-like domai  24.7 1.3E+02  0.0028   18.4   3.4   22  311-333    16-37  (40)
126 KOG0271 Notchless-like WD40 re  24.6 6.7E+02   0.015   24.6  10.0   62  265-332   411-477 (480)
127 KOG1407 WD40 repeat protein [F  24.5 5.7E+02   0.012   23.7  10.4  100  225-330   112-213 (313)
128 KOG0286 G-protein beta subunit  23.4 6.3E+02   0.014   23.8  11.5  104  222-328    58-167 (343)
129 PTZ00420 coronin; Provisional   23.4 8.3E+02   0.018   25.2  25.9   25  115-139    75-99  (568)
130 KOG2445 Nuclear pore complex c  23.2 6.5E+02   0.014   23.9  12.2  111  222-333    16-142 (361)
131 PF06462 Hyd_WA:  Propeller;  I  23.0      98  0.0021   18.5   2.4   16  318-333     1-16  (32)
132 KOG0771 Prolactin regulatory e  22.9 3.7E+02   0.008   26.2   7.5   86  225-318   150-241 (398)
133 KOG1332 Vesicle coat complex C  22.8   6E+02   0.013   23.4   9.4  101   92-200   187-296 (299)
134 PLN00177 sulfite oxidase; Prov  22.8      81  0.0018   30.8   3.1   16  139-154   301-316 (393)
135 KOG1230 Protein containing rep  22.8 7.6E+02   0.017   24.5  12.8  156  150-325    55-250 (521)
136 COG4946 Uncharacterized protei  22.6 8.1E+02   0.018   24.8  21.1   20  134-153   203-222 (668)
137 KOG0639 Transducin-like enhanc  21.9 5.4E+02   0.012   26.2   8.4  128  184-325   556-693 (705)
138 PF11725 AvrE:  Pathogenicity f  21.8 3.2E+02  0.0068   31.8   7.6  102  220-327   703-816 (1774)
139 KOG0296 Angio-associated migra  21.6 4.9E+02   0.011   25.2   7.9   63  265-331    66-132 (399)
140 PRK11028 6-phosphogluconolacto  21.6 6.3E+02   0.014   23.1  10.8   95  225-324    40-144 (330)
141 KOG1963 WD40 repeat protein [G  21.1 7.4E+02   0.016   26.6   9.7   91  223-323   209-309 (792)
142 cd02110 SO_family_Moco_dimer S  21.1      84  0.0018   29.7   2.8   28   81-109   229-256 (317)
143 COG4409 NanH Neuraminidase (si  20.7 1.8E+02   0.004   30.5   5.3  105   92-197   545-671 (728)
144 KOG2048 WD40 repeat protein [G  20.5   1E+03   0.022   25.0  19.6  193  115-330   111-314 (691)
145 KOG2106 Uncharacterized conser  20.4 9.2E+02    0.02   24.6  21.1  136  166-327   371-511 (626)
146 cd02114 bact_SorA_Moco sulfite  20.2      85  0.0018   30.4   2.7   28   81-109   281-308 (367)

No 1  
>PF14870 PSII_BNR:  Photosynthesis system II assembly factor YCF48; PDB: 2XBG_A.
Probab=100.00  E-value=3.1e-39  Score=298.93  Aligned_cols=258  Identities=36%  Similarity=0.692  Sum_probs=177.0

Q ss_pred             CCCcccccceeeeccccccceeEEEecCCCccceEEecCCCCCcEEcccCCCC--CeeeEEEEEecCCCCEEEEEEcCCe
Q 036387           61 SSSSSLNRRQFVSQTATLSLSISLAATTGLYEQPAKSEEALSAWERVYIPVDP--GVVLLDIAFVPDDLNHGFLLGTRQT  138 (334)
Q Consensus        61 ~~~~~~~~~~~~~~~~~~a~g~~~~~g~~~~g~i~~S~DgG~tW~~~~~p~~~--~~~l~~I~~~p~d~~~~~avG~~g~  138 (334)
                      ..+..+.++.|++...++++      |..  +.|++|+|||+||+.+..+...  ...+++|.|.   .+.+|++|+.|.
T Consensus        14 ~t~~~l~dV~F~d~~~G~~V------G~~--g~il~T~DGG~tW~~~~~~~~~~~~~~l~~I~f~---~~~g~ivG~~g~   82 (302)
T PF14870_consen   14 PTDKPLLDVAFVDPNHGWAV------GAY--GTILKTTDGGKTWQPVSLDLDNPFDYHLNSISFD---GNEGWIVGEPGL   82 (302)
T ss_dssp             S-SS-EEEEEESSSS-EEEE------ETT--TEEEEESSTTSS-EE-----S-----EEEEEEEE---TTEEEEEEETTE
T ss_pred             CCCCceEEEEEecCCEEEEE------ecC--CEEEEECCCCccccccccCCCccceeeEEEEEec---CCceEEEcCCce
Confidence            34557888898877777554      454  7899999999999998755432  3678899996   267999999999


Q ss_pred             EEEEcCCCcCeEeCcCCCCcccCcceeEEEEEE-eCCeEEEEEcCCEEEEEcCCCCCeEEeecCCC--------CC----
Q 036387          139 LLETKDGGKTWAPRSIPSAEEEDFNYRFNSISF-KGKEGWIVGKPAILLHTSDAGESWERIPLSSQ--------LP----  205 (334)
Q Consensus       139 i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~-~~~~~~~vG~~g~i~~S~DgG~TW~~~~~~~~--------l~----  205 (334)
                      ||+|+|+|+||+++.++...+.    .+..|.+ .++.+++++..|.||+|+|+|+||+.+.....        .+    
T Consensus        83 ll~T~DgG~tW~~v~l~~~lpg----s~~~i~~l~~~~~~l~~~~G~iy~T~DgG~tW~~~~~~~~gs~~~~~r~~dG~~  158 (302)
T PF14870_consen   83 LLHTTDGGKTWERVPLSSKLPG----SPFGITALGDGSAELAGDRGAIYRTTDGGKTWQAVVSETSGSINDITRSSDGRY  158 (302)
T ss_dssp             EEEESSTTSS-EE----TT-SS-----EEEEEEEETTEEEEEETT--EEEESSTTSSEEEEE-S----EEEEEE-TTS-E
T ss_pred             EEEecCCCCCcEEeecCCCCCC----CeeEEEEcCCCcEEEEcCCCcEEEeCCCCCCeeEcccCCcceeEeEEECCCCcE
Confidence            9999999999999876533221    2234443 46888899999999999999999999865421        01    


Q ss_pred             ------C--------CcccccccCccccceEeeeeEeecCCEEEEEcCCeEEEec--CCCcceeeEeccccCCCeeeEEE
Q 036387          206 ------G--------DMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGGGLFLSK--GTGITEEFEEVPVQSRGFGILDV  269 (334)
Q Consensus       206 ------g--------~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g~i~~S~--D~G~tW~w~~~~~~~~~~~~~~v  269 (334)
                            |        ...+|.+|++...++|++|+|.+++.+|+++..|.|++|.  |.+.+|+....++...+++++++
T Consensus       159 vavs~~G~~~~s~~~G~~~w~~~~r~~~~riq~~gf~~~~~lw~~~~Gg~~~~s~~~~~~~~w~~~~~~~~~~~~~~ld~  238 (302)
T PF14870_consen  159 VAVSSRGNFYSSWDPGQTTWQPHNRNSSRRIQSMGFSPDGNLWMLARGGQIQFSDDPDDGETWSEPIIPIKTNGYGILDL  238 (302)
T ss_dssp             EEEETTSSEEEEE-TT-SS-EEEE--SSS-EEEEEE-TTS-EEEEETTTEEEEEE-TTEEEEE---B-TTSS--S-EEEE
T ss_pred             EEEECcccEEEEecCCCccceEEccCccceehhceecCCCCEEEEeCCcEEEEccCCCCccccccccCCcccCceeeEEE
Confidence                  1        1157889999889999999999999999999999999998  66776533224444556789999


Q ss_pred             EeecCCeEEEEeCCCcEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeCCeeEEEEc
Q 036387          270 GYRSQDEAWAAGGSGVLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGNDGVLLQYL  333 (334)
Q Consensus       270 ~~~~~~~~~~~G~~G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G~il~s~  333 (334)
                      +|++++++|++|..|.||+|+|+|+||++.+..++.+.+|+.|.|.++++.|++|++|+|||+.
T Consensus       239 a~~~~~~~wa~gg~G~l~~S~DgGktW~~~~~~~~~~~n~~~i~f~~~~~gf~lG~~G~ll~~~  302 (302)
T PF14870_consen  239 AYRPPNEIWAVGGSGTLLVSTDGGKTWQKDRVGENVPSNLYRIVFVNPDKGFVLGQDGVLLRYV  302 (302)
T ss_dssp             EESSSS-EEEEESTT-EEEESSTTSS-EE-GGGTTSSS---EEEEEETTEEEEE-STTEEEEE-
T ss_pred             EecCCCCEEEEeCCccEEEeCCCCccceECccccCCCCceEEEEEcCCCceEEECCCcEEEEeC
Confidence            9999999999999999999999999999998866778899999999999999999999999984


No 2  
>PLN00033 photosystem II stability/assembly factor; Provisional
Probab=100.00  E-value=2.9e-38  Score=303.56  Aligned_cols=274  Identities=75%  Similarity=1.258  Sum_probs=210.8

Q ss_pred             CCCCcccccceeeeccccccceeEEEecCCCccceEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCCeE
Q 036387           60 SSSSSSLNRRQFVSQTATLSLSISLAATTGLYEQPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQTL  139 (334)
Q Consensus        60 ~~~~~~~~~~~~~~~~~~~a~g~~~~~g~~~~g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g~i  139 (334)
                      ........||.|+...++.+.......-. .+..-....|+|++|+++..|..++..|++|+|.|.|++++||+|+.|.|
T Consensus        34 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~-~~~~~~~~~d~G~~W~q~~~p~~~~~~L~~V~F~~~d~~~GwAVG~~G~I  112 (398)
T PLN00033         34 LSSNSSENRRSFLRQTATAAAALLLLPLL-GPSAPADAAEQSSEWEQVDLPIDPGVVLLDIAFVPDDPTHGFLLGTRQTL  112 (398)
T ss_pred             ccccccchhhhHHHhhhHhhhhhhhcccc-cccCCcccccCCCccEEeecCCCCCCceEEEEeccCCCCEEEEEcCCCEE
Confidence            44556778888876654432221111100 01223445699999999999988667999999976688999999999999


Q ss_pred             EEEcCCCcCeEeCcCCCCcccCcceeEEEEEEeCCeEEEEEcCCEEEEEcCCCCCeEEeecCCCCCCCc-----------
Q 036387          140 LETKDGGKTWAPRSIPSAEEEDFNYRFNSISFKGKEGWIVGKPAILLHTSDAGESWERIPLSSQLPGDM-----------  208 (334)
Q Consensus       140 ~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~~~~~~vG~~g~i~~S~DgG~TW~~~~~~~~l~g~~-----------  208 (334)
                      ++|+|||+||++...|...+.+..+++.+|.|.++++|++|+.|.||+|+|+|+||+++..++.+++..           
T Consensus       113 L~T~DGG~tW~~~~~~~~~~~~~~~~l~~v~f~~~~g~~vG~~G~il~T~DgG~tW~~~~~~~~~p~~~~~i~~~~~~~~  192 (398)
T PLN00033        113 LETKDGGKTWVPRSIPSAEDEDFNYRFNSISFKGKEGWIIGKPAILLHTSDGGETWERIPLSPKLPGEPVLIKATGPKSA  192 (398)
T ss_pred             EEEcCCCCCceECccCcccccccccceeeeEEECCEEEEEcCceEEEEEcCCCCCceECccccCCCCCceEEEEECCCce
Confidence            999999999999766554344455688999998889999999999999999999999886532222110           


Q ss_pred             ----------------ccccc-----------------------------------------------------------
Q 036387          209 ----------------AFWQP-----------------------------------------------------------  213 (334)
Q Consensus       209 ----------------~~~~~-----------------------------------------------------------  213 (334)
                                      .-|..                                                           
T Consensus       193 ~ivg~~G~v~~S~D~G~tW~~~~~~t~~~~l~~~~~s~~~g~~~y~Gsf~~v~~~~dG~~~~vg~~G~~~~s~d~G~~~W  272 (398)
T PLN00033        193 EMVTDEGAIYVTSNAGRNWKAAVEETVSATLNRTVSSGISGASYYTGTFSTVNRSPDGDYVAVSSRGNFYLTWEPGQPYW  272 (398)
T ss_pred             EEEeccceEEEECCCCCCceEcccccccccccccccccccccceeccceeeEEEcCCCCEEEEECCccEEEecCCCCcce
Confidence                            11221                                                           


Q ss_pred             --cCccccceEeeeeEeecCCEEEEEcCCeEEEecCCCcce---eeEeccccCCCeeeEEEEeecCCeEEEEeCCCcEEE
Q 036387          214 --HNRAVARRIQNMGWRADGGLWLLVRGGGLFLSKGTGITE---EFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVLLK  288 (334)
Q Consensus       214 --~~~~~~~~i~~~~~~~~g~~~~~~~~g~i~~S~D~G~tW---~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i~~  288 (334)
                        ++......++.+.+.+++.+|+++..|.+++|.|+|++|   +|+++..+...+.++++.|.+++.+|++|..|.+++
T Consensus       273 ~~~~~~~~~~l~~v~~~~dg~l~l~g~~G~l~~S~d~G~~~~~~~f~~~~~~~~~~~l~~v~~~~d~~~~a~G~~G~v~~  352 (398)
T PLN00033        273 QPHNRASARRIQNMGWRADGGLWLLTRGGGLYVSKGTGLTEEDFDFEEADIKSRGFGILDVGYRSKKEAWAAGGSGILLR  352 (398)
T ss_pred             EEecCCCccceeeeeEcCCCCEEEEeCCceEEEecCCCCcccccceeecccCCCCcceEEEEEcCCCcEEEEECCCcEEE
Confidence              111112234455666788899999999999999999998   678877664445789999999999999999999999


Q ss_pred             EcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeCCeeEEEEcC
Q 036387          289 TTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGNDGVLLQYLG  334 (334)
Q Consensus       289 S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G~il~s~~  334 (334)
                      |.|+|+||++....++...+||+|.|.+++++|++|++|+|||++|
T Consensus       353 s~D~G~tW~~~~~~~~~~~~ly~v~f~~~~~g~~~G~~G~il~~~~  398 (398)
T PLN00033        353 STDGGKSWKRDKGADNIAANLYSVKFFDDKKGFVLGNDGVLLRYLG  398 (398)
T ss_pred             eCCCCcceeEccccCCCCcceeEEEEcCCCceEEEeCCcEEEEeCC
Confidence            9999999999985446678999999998999999999999999986


No 3  
>PRK13684 Ycf48-like protein; Provisional
Probab=100.00  E-value=8.7e-33  Score=262.06  Aligned_cols=253  Identities=30%  Similarity=0.626  Sum_probs=186.9

Q ss_pred             ccccceeeeccccccceeEEEecCCCccceEEecCCCCCcEEcccCC-CCCeeeEEEEEecCCCCEEEEEEcCCeEEEEc
Q 036387           65 SLNRRQFVSQTATLSLSISLAATTGLYEQPAKSEEALSAWERVYIPV-DPGVVLLDIAFVPDDLNHGFLLGTRQTLLETK  143 (334)
Q Consensus        65 ~~~~~~~~~~~~~~a~g~~~~~g~~~~g~i~~S~DgG~tW~~~~~p~-~~~~~l~~I~~~p~d~~~~~avG~~g~i~~S~  143 (334)
                      .+..+.|.+...+      |++|+.  +.|++|+|+|+||+++..+. .....+++|+|.   ++.+|++|+.|.||+|+
T Consensus        47 ~l~~v~F~d~~~g------~avG~~--G~il~T~DgG~tW~~~~~~~~~~~~~l~~v~~~---~~~~~~~G~~g~i~~S~  115 (334)
T PRK13684         47 NLLDIAFTDPNHG------WLVGSN--RTLLETNDGGETWEERSLDLPEENFRLISISFK---GDEGWIVGQPSLLLHTT  115 (334)
T ss_pred             ceEEEEEeCCCcE------EEEECC--CEEEEEcCCCCCceECccCCcccccceeeeEEc---CCcEEEeCCCceEEEEC
Confidence            3445666544444      566665  88999999999999986543 223568899985   35689999999999999


Q ss_pred             CCCcCeEeCcCCCCcccCcceeEEEEEE-eCCeEEEEEcCCEEEEEcCCCCCeEEeecCCC--------CCCCc------
Q 036387          144 DGGKTWAPRSIPSAEEEDFNYRFNSISF-KGKEGWIVGKPAILLHTSDAGESWERIPLSSQ--------LPGDM------  208 (334)
Q Consensus       144 DgG~TW~~~~~p~~~~~~~~~~~~~I~~-~~~~~~~vG~~g~i~~S~DgG~TW~~~~~~~~--------l~g~~------  208 (334)
                      |+|+||+++..+...+.    +...+.. .++..++++..|.||||+|+|+||+++..+..        .++..      
T Consensus       116 DgG~tW~~~~~~~~~~~----~~~~i~~~~~~~~~~~g~~G~i~~S~DgG~tW~~~~~~~~g~~~~i~~~~~g~~v~~g~  191 (334)
T PRK13684        116 DGGKNWTRIPLSEKLPG----SPYLITALGPGTAEMATNVGAIYRTTDGGKNWEALVEDAAGVVRNLRRSPDGKYVAVSS  191 (334)
T ss_pred             CCCCCCeEccCCcCCCC----CceEEEEECCCcceeeeccceEEEECCCCCCceeCcCCCcceEEEEEECCCCeEEEEeC
Confidence            99999999865422111    1223433 34678899999999999999999999875421        01100      


Q ss_pred             ------------ccccccCccccceEeeeeEeecCCEEEEEcCCeEEE-ecCCCcceeeEecccc--CCCeeeEEEEeec
Q 036387          209 ------------AFWQPHNRAVARRIQNMGWRADGGLWLLVRGGGLFL-SKGTGITEEFEEVPVQ--SRGFGILDVGYRS  273 (334)
Q Consensus       209 ------------~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g~i~~-S~D~G~tW~w~~~~~~--~~~~~~~~v~~~~  273 (334)
                                  .-|..++......+..+.+.+++.+|++++.|.+++ |+|+|.+|  +.+..+  ...+.++++.+.+
T Consensus       192 ~G~i~~s~~~gg~tW~~~~~~~~~~l~~i~~~~~g~~~~vg~~G~~~~~s~d~G~sW--~~~~~~~~~~~~~l~~v~~~~  269 (334)
T PRK13684        192 RGNFYSTWEPGQTAWTPHQRNSSRRLQSMGFQPDGNLWMLARGGQIRFNDPDDLESW--SKPIIPEITNGYGYLDLAYRT  269 (334)
T ss_pred             CceEEEEcCCCCCeEEEeeCCCcccceeeeEcCCCCEEEEecCCEEEEccCCCCCcc--ccccCCccccccceeeEEEcC
Confidence                        113333333334556667777888999998888877 69999986  443333  2235688888888


Q ss_pred             CCeEEEEeCCCcEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeCCeeEEEEcC
Q 036387          274 QDEAWAAGGSGVLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGNDGVLLQYLG  334 (334)
Q Consensus       274 ~~~~~~~G~~G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G~il~s~~  334 (334)
                      ++++|++|..|.+++|.|+|++|+.+......+..++.+.+.+++++|++|+.|+||+++|
T Consensus       270 ~~~~~~~G~~G~v~~S~d~G~tW~~~~~~~~~~~~~~~~~~~~~~~~~~~G~~G~il~~~~  330 (334)
T PRK13684        270 PGEIWAGGGNGTLLVSKDGGKTWEKDPVGEEVPSNFYKIVFLDPEKGFVLGQRGVLLRYVG  330 (334)
T ss_pred             CCCEEEEcCCCeEEEeCCCCCCCeECCcCCCCCcceEEEEEeCCCceEEECCCceEEEecC
Confidence            8899999999999999999999999875324456899999999999999999999999986


No 4  
>PF14870 PSII_BNR:  Photosynthesis system II assembly factor YCF48; PDB: 2XBG_A.
Probab=99.97  E-value=7.9e-30  Score=236.23  Aligned_cols=209  Identities=37%  Similarity=0.648  Sum_probs=144.9

Q ss_pred             CCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEeCCeEEEE
Q 036387          100 ALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFKGKEGWIV  179 (334)
Q Consensus       100 gG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~~~~~~v  179 (334)
                      .+++|+.+..|.+  ..+.+|+|.  |++++||||+.|.||+|+|||+||++...+..  ++..++|+.|.|.++++|++
T Consensus         4 ~~~~W~~v~l~t~--~~l~dV~F~--d~~~G~~VG~~g~il~T~DGG~tW~~~~~~~~--~~~~~~l~~I~f~~~~g~iv   77 (302)
T PF14870_consen    4 SGNSWQQVSLPTD--KPLLDVAFV--DPNHGWAVGAYGTILKTTDGGKTWQPVSLDLD--NPFDYHLNSISFDGNEGWIV   77 (302)
T ss_dssp             SS--EEEEE-S-S--S-EEEEEES--SSS-EEEEETTTEEEEESSTTSS-EE-----S-------EEEEEEEETTEEEEE
T ss_pred             cCCCcEEeecCCC--CceEEEEEe--cCCEEEEEecCCEEEEECCCCccccccccCCC--ccceeeEEEEEecCCceEEE
Confidence            3689999998877  799999998  78999999999999999999999999875443  22357899999998899999


Q ss_pred             EcCCEEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCCeEEEecCCCcceeeEeccc
Q 036387          180 GKPAILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGGGLFLSKGTGITEEFEEVPV  259 (334)
Q Consensus       180 G~~g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g~i~~S~D~G~tW~w~~~~~  259 (334)
                      |+++.||||+|+|+||+++..+..+|+..  +            .+....++.+++++..|.||+|+|+|++|  +.+..
T Consensus        78 G~~g~ll~T~DgG~tW~~v~l~~~lpgs~--~------------~i~~l~~~~~~l~~~~G~iy~T~DgG~tW--~~~~~  141 (302)
T PF14870_consen   78 GEPGLLLHTTDGGKTWERVPLSSKLPGSP--F------------GITALGDGSAELAGDRGAIYRTTDGGKTW--QAVVS  141 (302)
T ss_dssp             EETTEEEEESSTTSS-EE----TT-SS-E--E------------EEEEEETTEEEEEETT--EEEESSTTSSE--EEEE-
T ss_pred             cCCceEEEecCCCCCcEEeecCCCCCCCe--e------------EEEEcCCCcEEEEcCCCcEEEeCCCCCCe--eEccc
Confidence            99999999999999999998765566542  1            12234566788889999999999999987  44433


Q ss_pred             cCCCeeeEEEEeecCCeEEEEeCCCcEEEEcCCCcC-cEEcccCCCcccceeEEEEeeCCeEEEEeCCeeEEEEc
Q 036387          260 QSRGFGILDVGYRSQDEAWAAGGSGVLLKTTNGGKT-WIREKAADNIAANLYSVKFINEKKGFVLGNDGVLLQYL  333 (334)
Q Consensus       260 ~~~~~~~~~v~~~~~~~~~~~G~~G~i~~S~DgG~t-W~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G~il~s~  333 (334)
                      +.. ..+.++...++++.++++..|.+|+|.|.|.+ |+....  ...+.+.+|.|.+++.+|+++..|.|..++
T Consensus       142 ~~~-gs~~~~~r~~dG~~vavs~~G~~~~s~~~G~~~w~~~~r--~~~~riq~~gf~~~~~lw~~~~Gg~~~~s~  213 (302)
T PF14870_consen  142 ETS-GSINDITRSSDGRYVAVSSRGNFYSSWDPGQTTWQPHNR--NSSRRIQSMGFSPDGNLWMLARGGQIQFSD  213 (302)
T ss_dssp             S-----EEEEEE-TTS-EEEEETTSSEEEEE-TT-SS-EEEE----SSS-EEEEEE-TTS-EEEEETTTEEEEEE
T ss_pred             CCc-ceeEeEEECCCCcEEEEECcccEEEEecCCCccceEEcc--CccceehhceecCCCCEEEEeCCcEEEEcc
Confidence            322 25677776778899999999999999988865 999998  567899999999999999999999988875


No 5  
>COG4447 Uncharacterized protein related to plant photosystem II stability/assembly factor [General function prediction only]
Probab=99.97  E-value=1.6e-30  Score=230.38  Aligned_cols=243  Identities=29%  Similarity=0.533  Sum_probs=193.3

Q ss_pred             ceeEEEecCCCccceEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCCCcc
Q 036387           80 LSISLAATTGLYEQPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPSAEE  159 (334)
Q Consensus        80 ~g~~~~~g~~~~g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~~~~  159 (334)
                      ....|++|..  +.|+.|+|+|.+|++...+.. ...|+++.|..   ..+|++|+...|++|+|+|+||.++.+....+
T Consensus        54 g~~gwlVg~r--gtiletdd~g~tw~qal~~~g-r~~f~sv~f~~---~egw~vGe~sqll~T~DgGqsWARi~~~e~~e  127 (339)
T COG4447          54 GSHGWLVGGR--GTILETDDGGITWAQALDFLG-RHAFHSVSFLG---MEGWIVGEPSQLLHTTDGGQSWARIPLSEKLE  127 (339)
T ss_pred             CcceEEEcCc--ceEEEecCCcccchhhhchhh-hhheeeeeeec---ccccccCCcceEEEecCCCcchhhchhhcCCC
Confidence            3445777765  889999999999999877764 37899999973   47999999999999999999999987543322


Q ss_pred             cCcceeEEEEEEeC-CeEEEEEcCCEEEEEcCCCCCeEEeecCCC---CC-----------------CC--------ccc
Q 036387          160 EDFNYRFNSISFKG-KEGWIVGKPAILLHTSDAGESWERIPLSSQ---LP-----------------GD--------MAF  210 (334)
Q Consensus       160 ~~~~~~~~~I~~~~-~~~~~vG~~g~i~~S~DgG~TW~~~~~~~~---l~-----------------g~--------~~~  210 (334)
                      .    ...+|.|.+ ++++++|+.|.||+|+|+|++|+.+.....   .+                 |.        ...
T Consensus       128 g----~~~sI~f~d~q~g~m~gd~Gail~T~DgGk~Wk~l~e~~v~~~~~n~ia~s~dng~vaVg~rGs~f~T~~aGqt~  203 (339)
T COG4447         128 G----FPDSITFLDDQRGEMLGDQGAILKTTDGGKNWKALVEKAVGLAVPNEIARSADNGYVAVGARGSFFSTWGAGQTV  203 (339)
T ss_pred             C----CcceeEEecchhhhhhcccceEEEecCCcccHhHhcccccchhhhhhhhhhccCCeEEEecCcceEecCCCCccE
Confidence            1    345777765 999999999999999999999999754210   00                 00        024


Q ss_pred             ccccCccccceEeeeeEeecC--CEEEEEcCCeEEEecCCCcceeeEeccccC----CCeeeEEEEeecCCeEEEEeCCC
Q 036387          211 WQPHNRAVARRIQNMGWRADG--GLWLLVRGGGLFLSKGTGITEEFEEVPVQS----RGFGILDVGYRSQDEAWAAGGSG  284 (334)
Q Consensus       211 ~~~~~~~~~~~i~~~~~~~~g--~~~~~~~~g~i~~S~D~G~tW~w~~~~~~~----~~~~~~~v~~~~~~~~~~~G~~G  284 (334)
                      |.+|++...+++.+|++..++  .+++.+..|..+++.++|..|  .+++.+.    ...++.+.+++.++++|++|..|
T Consensus       204 ~~~~g~~s~~~letmg~adag~~g~la~g~qg~~f~~~~~gD~w--sd~~~~~~~g~~~~Gl~d~a~~a~~~v~v~G~gG  281 (339)
T COG4447         204 WLPHGRNSSRRLETMGLADAGSKGLLARGGQGDQFSWVCGGDEW--SDQGEPVNLGRRSWGLLDFAPRAPPEVWVSGIGG  281 (339)
T ss_pred             EeccCCCccchhcccccccCCccceEEEccccceeecCCCcccc--cccccchhcccCCCccccccccCCCCeEEeccCc
Confidence            667888888889999987777  466677777889999999965  5554432    24678899999999999999999


Q ss_pred             cEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeCCeeEEEEcC
Q 036387          285 VLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGNDGVLLQYLG  334 (334)
Q Consensus       285 ~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G~il~s~~  334 (334)
                      .++.|+|+|++|.+........+++++|.|..++..+++|++|++++++|
T Consensus       282 nvl~StdgG~t~skd~g~~er~s~l~~V~~ts~~~~~l~Gq~Gvll~~n~  331 (339)
T COG4447         282 NVLASTDGGTTWSKDGGVEERVSNLYSVVFTSPKAGFLCGQKGVLLKYNP  331 (339)
T ss_pred             cEEEecCCCeeEeccCChhhhhhhhheEEeccCCceEEEcCCceEEEecC
Confidence            99999999999998765323346799999999999999999999999875


No 6  
>PRK13684 Ycf48-like protein; Provisional
Probab=99.96  E-value=5.9e-28  Score=229.03  Aligned_cols=214  Identities=34%  Similarity=0.604  Sum_probs=169.9

Q ss_pred             cceEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEE
Q 036387           92 EQPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISF  171 (334)
Q Consensus        92 g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~  171 (334)
                      ....++.+.+.+|+++..|..  ..+++|+|.  |++++||+|+.|.||+|+|+|+||+++..+..   +..+++.+|.|
T Consensus        25 ~~~~~~~~~~~~W~~~~~~~~--~~l~~v~F~--d~~~g~avG~~G~il~T~DgG~tW~~~~~~~~---~~~~~l~~v~~   97 (334)
T PRK13684         25 STTRVPMLSSSPWQVIDLPTE--ANLLDIAFT--DPNHGWLVGSNRTLLETNDGGETWEERSLDLP---EENFRLISISF   97 (334)
T ss_pred             CCCCcccccCCCcEEEecCCC--CceEEEEEe--CCCcEEEEECCCEEEEEcCCCCCceECccCCc---ccccceeeeEE
Confidence            334478888999999987665  789999998  78999999999999999999999999764321   12246888988


Q ss_pred             eCCeEEEEEcCCEEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCCeEEEecCCCcc
Q 036387          172 KGKEGWIVGKPAILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGGGLFLSKGTGIT  251 (334)
Q Consensus       172 ~~~~~~~vG~~g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g~i~~S~D~G~t  251 (334)
                      .++++|++|+.+.||||+|+|+||+++..+..+++.. +             .+....++.++++++.|.||+|.|+|+|
T Consensus        98 ~~~~~~~~G~~g~i~~S~DgG~tW~~~~~~~~~~~~~-~-------------~i~~~~~~~~~~~g~~G~i~~S~DgG~t  163 (334)
T PRK13684         98 KGDEGWIVGQPSLLLHTTDGGKNWTRIPLSEKLPGSP-Y-------------LITALGPGTAEMATNVGAIYRTTDGGKN  163 (334)
T ss_pred             cCCcEEEeCCCceEEEECCCCCCCeEccCCcCCCCCc-e-------------EEEEECCCcceeeeccceEEEECCCCCC
Confidence            8778999999999999999999999987542233321 0             1112234557888999999999999998


Q ss_pred             eeeEeccccCCCeeeEEEEeecCCeEEEEeCCCcEEEEc-CCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeCCeeEE
Q 036387          252 EEFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVLLKTT-NGGKTWIREKAADNIAANLYSVKFINEKKGFVLGNDGVLL  330 (334)
Q Consensus       252 W~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i~~S~-DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G~il  330 (334)
                      |  +.+..+... .++++.+.+++..+++|..|.+|++. |+|++|+.+..  +....++++.+.+++++|++|+.|.++
T Consensus       164 W--~~~~~~~~g-~~~~i~~~~~g~~v~~g~~G~i~~s~~~gg~tW~~~~~--~~~~~l~~i~~~~~g~~~~vg~~G~~~  238 (334)
T PRK13684        164 W--EALVEDAAG-VVRNLRRSPDGKYVAVSSRGNFYSTWEPGQTAWTPHQR--NSSRRLQSMGFQPDGNLWMLARGGQIR  238 (334)
T ss_pred             c--eeCcCCCcc-eEEEEEECCCCeEEEEeCCceEEEEcCCCCCeEEEeeC--CCcccceeeeEcCCCCEEEEecCCEEE
Confidence            6  554443322 57888887788888899999999984 77799999977  456899999999899999999999987


Q ss_pred             E
Q 036387          331 Q  331 (334)
Q Consensus       331 ~  331 (334)
                      .
T Consensus       239 ~  239 (334)
T PRK13684        239 F  239 (334)
T ss_pred             E
Confidence            6


No 7  
>COG4447 Uncharacterized protein related to plant photosystem II stability/assembly factor [General function prediction only]
Probab=99.88  E-value=2.8e-22  Score=178.14  Aligned_cols=207  Identities=31%  Similarity=0.471  Sum_probs=163.1

Q ss_pred             CCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEeCCeEEEEEc
Q 036387          102 SAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFKGKEGWIVGK  181 (334)
Q Consensus       102 ~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~~~~~~vG~  181 (334)
                      +.|+.+..|..  ....+|+|.- +++++|++|..|+|+.|+|+|++|++...+..     .+.|.++.|...++|++|+
T Consensus        32 ~p~~~velp~~--s~~l~ia~~~-~g~~gwlVg~rgtiletdd~g~tw~qal~~~g-----r~~f~sv~f~~~egw~vGe  103 (339)
T COG4447          32 NPWTDVELPTL--SPTLDIAFTE-SGSHGWLVGGRGTILETDDGGITWAQALDFLG-----RHAFHSVSFLGMEGWIVGE  103 (339)
T ss_pred             Ccceeeecccc--CcccceeEee-cCcceEEEcCcceEEEecCCcccchhhhchhh-----hhheeeeeeecccccccCC
Confidence            47999988877  6788899984 89999999999999999999999998876542     1368899998889999999


Q ss_pred             CCEEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCCeEEEecCCCcceeeEeccccC
Q 036387          182 PAILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGGGLFLSKGTGITEEFEEVPVQS  261 (334)
Q Consensus       182 ~g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g~i~~S~D~G~tW~w~~~~~~~  261 (334)
                      +..|++|+|+|+||.+++...++++.   |.           ++.|..+..-++++..|.||+++|+|++|  +.+....
T Consensus       104 ~sqll~T~DgGqsWARi~~~e~~eg~---~~-----------sI~f~d~q~g~m~gd~Gail~T~DgGk~W--k~l~e~~  167 (339)
T COG4447         104 PSQLLHTTDGGQSWARIPLSEKLEGF---PD-----------SITFLDDQRGEMLGDQGAILKTTDGGKNW--KALVEKA  167 (339)
T ss_pred             cceEEEecCCCcchhhchhhcCCCCC---cc-----------eeEEecchhhhhhcccceEEEecCCcccH--hHhcccc
Confidence            99999999999999999987666543   22           23445556678888889999999999987  4432111


Q ss_pred             C-CeeeEEEEeecCCeEEEEeCCCcEEEEcCCCcCcEEcccCCCcccceeEEEEeeCC--eEEEEeCCeeEEEEc
Q 036387          262 R-GFGILDVGYRSQDEAWAAGGSGVLLKTTNGGKTWIREKAADNIAANLYSVKFINEK--KGFVLGNDGVLLQYL  333 (334)
Q Consensus       262 ~-~~~~~~v~~~~~~~~~~~G~~G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~--~~~a~G~~G~il~s~  333 (334)
                      . ......+++..++..+++|..|.+|.|-+-|++|.....+ +...-+..|-+.+++  -+++.|..|..+++.
T Consensus       168 v~~~~~n~ia~s~dng~vaVg~rGs~f~T~~aGqt~~~~~g~-~s~~~letmg~adag~~g~la~g~qg~~f~~~  241 (339)
T COG4447         168 VGLAVPNEIARSADNGYVAVGARGSFFSTWGAGQTVWLPHGR-NSSRRLETMGLADAGSKGLLARGGQGDQFSWV  241 (339)
T ss_pred             cchhhhhhhhhhccCCeEEEecCcceEecCCCCccEEeccCC-CccchhcccccccCCccceEEEccccceeecC
Confidence            1 1234456666688889999999999999999998888764 345667788887777  467888888877653


No 8  
>PLN00033 photosystem II stability/assembly factor; Provisional
Probab=99.85  E-value=7.7e-20  Score=176.18  Aligned_cols=175  Identities=16%  Similarity=0.291  Sum_probs=125.5

Q ss_pred             EEcCCCcCeEeCcCCCCcccCcceeEEEEEE--e-CCeEEEEEcCCEEEEEcCCCCCeEEeecCCCCCCCcccccccCcc
Q 036387          141 ETKDGGKTWAPRSIPSAEEEDFNYRFNSISF--K-GKEGWIVGKPAILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRA  217 (334)
Q Consensus       141 ~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~--~-~~~~~~vG~~g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~  217 (334)
                      ...|+|++|+++..|....    ..|.+|.|  . ++++|++|+.|.|++|+|+|+||+++..+.....+..        
T Consensus        69 ~~~d~G~~W~q~~~p~~~~----~~L~~V~F~~~d~~~GwAVG~~G~IL~T~DGG~tW~~~~~~~~~~~~~~--------  136 (398)
T PLN00033         69 DAAEQSSEWEQVDLPIDPG----VVLLDIAFVPDDPTHGFLLGTRQTLLETKDGGKTWVPRSIPSAEDEDFN--------  136 (398)
T ss_pred             ccccCCCccEEeecCCCCC----CceEEEEeccCCCCEEEEEcCCCEEEEEcCCCCCceECccCcccccccc--------
Confidence            3459999999998876532    25889999  4 3899999999999999999999999754321111111        


Q ss_pred             ccceEeeeeEeecCCEEEEEcCCeEEEecCCCcceeeEeccc--cCCCeeeEEEEeecCCeEEEEeCCCcEEEEcCCCcC
Q 036387          218 VARRIQNMGWRADGGLWLLVRGGGLFLSKGTGITEEFEEVPV--QSRGFGILDVGYRSQDEAWAAGGSGVLLKTTNGGKT  295 (334)
Q Consensus       218 ~~~~i~~~~~~~~g~~~~~~~~g~i~~S~D~G~tW~w~~~~~--~~~~~~~~~v~~~~~~~~~~~G~~G~i~~S~DgG~t  295 (334)
                        ..+..+.+. ++..|++++.|.|++|+|+|+||+-...+.  +..   ...+....++.+++++..|.+|+|.|+|++
T Consensus       137 --~~l~~v~f~-~~~g~~vG~~G~il~T~DgG~tW~~~~~~~~~p~~---~~~i~~~~~~~~~ivg~~G~v~~S~D~G~t  210 (398)
T PLN00033        137 --YRFNSISFK-GKEGWIIGKPAILLHTSDGGETWERIPLSPKLPGE---PVLIKATGPKSAEMVTDEGAIYVTSNAGRN  210 (398)
T ss_pred             --cceeeeEEE-CCEEEEEcCceEEEEEcCCCCCceECccccCCCCC---ceEEEEECCCceEEEeccceEEEECCCCCC
Confidence              123445554 467999999999999999999874333211  222   223333455678899999999999999999


Q ss_pred             cEEcccCC-----------------CcccceeEEEEeeCCeEEEEeCCeeEEEEc
Q 036387          296 WIREKAAD-----------------NIAANLYSVKFINEKKGFVLGNDGVLLQYL  333 (334)
Q Consensus       296 W~~~~~~~-----------------~~~~~l~~i~~~~~~~~~a~G~~G~il~s~  333 (334)
                      |+.+....                 .....++.+...+++.++++|..|.++++.
T Consensus       211 W~~~~~~t~~~~l~~~~~s~~~g~~~y~Gsf~~v~~~~dG~~~~vg~~G~~~~s~  265 (398)
T PLN00033        211 WKAAVEETVSATLNRTVSSGISGASYYTGTFSTVNRSPDGDYVAVSSRGNFYLTW  265 (398)
T ss_pred             ceEcccccccccccccccccccccceeccceeeEEEcCCCCEEEEECCccEEEec
Confidence            99872210                 112346677777889999999999999863


No 9  
>PF13088 BNR_2:  BNR repeat-like domain; PDB: 2F11_A 2F0Z_A 1VCU_B 2F25_B 1SO7_A 2F29_A 1SNT_A 2F13_A 2F28_A 2F27_A ....
Probab=99.48  E-value=3.5e-12  Score=117.41  Aligned_cols=215  Identities=20%  Similarity=0.212  Sum_probs=116.8

Q ss_pred             cceEEe--cCCCCCcEEccc---CCCCCeeeEE--EEEecCCCCEEEEE---Ec-----CCe---EEEEcCCCcCeEeCc
Q 036387           92 EQPAKS--EEALSAWERVYI---PVDPGVVLLD--IAFVPDDLNHGFLL---GT-----RQT---LLETKDGGKTWAPRS  153 (334)
Q Consensus        92 g~i~~S--~DgG~tW~~~~~---p~~~~~~l~~--I~~~p~d~~~~~av---G~-----~g~---i~~S~DgG~TW~~~~  153 (334)
                      ..|.+|  +|+|+||.....   +.........  +...+  ..++++.   +.     .+.   .++|+|+|+||+...
T Consensus        18 ~~i~~S~s~D~G~tWs~~~~v~~~~~~~~~~~~p~~~~~~--~g~l~l~~~~~~~~~~~~~~~~~~~~S~D~G~TWs~~~   95 (275)
T PF13088_consen   18 IVIRRSRSTDGGKTWSEPRIVADGPKPGRRYGNPSLVVDP--DGRLWLFYSAGSSGGGWSGSRIYYSRSTDGGKTWSEPT   95 (275)
T ss_dssp             EEEEEECCCCCTTEEEEEEEEETSTBTTCEEEEEEEEEET--TSEEEEEEEEEETTESCCTCEEEEEEESSTTSS-EEEE
T ss_pred             EEEEEEEeeCCCCeeCCCEEEeeccccCCcccCcEEEEeC--CCCEEEEEEEccCCCCCCceeEEEEEECCCCCCCCCcc
Confidence            357888  999999987432   2211123332  33344  2555543   22     122   389999999999764


Q ss_pred             -CCCCcccCcceeEEE--EEEeCCeEEEEE-------cCCEEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEe
Q 036387          154 -IPSAEEEDFNYRFNS--ISFKGKEGWIVG-------KPAILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQ  223 (334)
Q Consensus       154 -~p~~~~~~~~~~~~~--I~~~~~~~~~vG-------~~g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~  223 (334)
                       ++.............  |...++++++..       ....+++|+|+|+||+......   .......          .
T Consensus        96 ~l~~~~~~~~~~~~~~~~i~~~~G~l~~~~~~~~~~~~~~~~~~S~D~G~tW~~~~~~~---~~~~~~e----------~  162 (275)
T PF13088_consen   96 DLPPGWFGNFSGPGRGPPIQLPDGRLIAPYYHESGGSFSAFVYYSDDGGKTWSSGSPIP---DGQGECE----------P  162 (275)
T ss_dssp             EEHHHCCCSCEECSEEEEEEECTTEEEEEEEEESSCEEEEEEEEESSTTSSEEEEEECE---CSEEEEE----------E
T ss_pred             ccccccccceeccceeeeeEecCCCEEEEEeeccccCcceEEEEeCCCCceeecccccc---ccCCcce----------e
Confidence             221100000011122  444456666542       2347889999999999986431   0001111          0


Q ss_pred             eeeEeecCCEEEEEcC-----CeEEEecCCCcceeeE-eccccCCCeeeEEEEeecCCeEEEEeCC------CcEEEEcC
Q 036387          224 NMGWRADGGLWLLVRG-----GGLFLSKGTGITEEFE-EVPVQSRGFGILDVGYRSQDEAWAAGGS------GVLLKTTN  291 (334)
Q Consensus       224 ~~~~~~~g~~~~~~~~-----g~i~~S~D~G~tW~w~-~~~~~~~~~~~~~v~~~~~~~~~~~G~~------G~i~~S~D  291 (334)
                      .+...++|.+++....     -.+.+|.|+|+||+-. ...++.....+..+. .+++.++++...      -.|+.|.|
T Consensus       163 ~~~~~~dG~l~~~~R~~~~~~~~~~~S~D~G~TWs~~~~~~~~~~~~~~~~~~-~~~g~~~~~~~~~~~r~~l~l~~S~D  241 (275)
T PF13088_consen  163 SIVELPDGRLLAVFRTEGNDDIYISRSTDGGRTWSPPQPTNLPNPNSSISLVR-LSDGRLLLVYNNPDGRSNLSLYVSED  241 (275)
T ss_dssp             EEEEETTSEEEEEEEECSSTEEEEEEESSTTSS-EEEEEEECSSCCEEEEEEE-CTTSEEEEEEECSSTSEEEEEEEECT
T ss_pred             EEEECCCCcEEEEEEccCCCcEEEEEECCCCCcCCCceecccCcccCCceEEE-cCCCCEEEEEECCCCCCceEEEEEeC
Confidence            1222466777765432     2568999999998632 233443222333333 345666665442      35789999


Q ss_pred             CCcCcEEcccCCCc---ccceeEEEEeeCCeEEE
Q 036387          292 GGKTWIREKAADNI---AANLYSVKFINEKKGFV  322 (334)
Q Consensus       292 gG~tW~~~~~~~~~---~~~l~~i~~~~~~~~~a  322 (334)
                      +|++|+....-...   .....++...+++++++
T Consensus       242 ~g~tW~~~~~i~~~~~~~~~Y~~~~~~~dg~l~i  275 (275)
T PF13088_consen  242 GGKTWSRPKTIDDGPNGDSGYPSLTQLPDGKLYI  275 (275)
T ss_dssp             TCEEEEEEEEEEEEE-CCEEEEEEEEEETTEEEE
T ss_pred             CCCcCCccEEEeCCCCCcEECCeeEEeCCCcCCC
Confidence            99999976442111   13455666667777764


No 10 
>smart00602 VPS10 VPS10 domain.
Probab=99.45  E-value=2e-11  Score=124.75  Aligned_cols=214  Identities=14%  Similarity=0.130  Sum_probs=117.6

Q ss_pred             cceEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEE--EEcCCeEEEEcCCCcCeEeCcCCCCcccCcceeEEEE
Q 036387           92 EQPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFL--LGTRQTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSI  169 (334)
Q Consensus        92 g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~a--vG~~g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I  169 (334)
                      +.||+|+|+|+||+.+.....  ..+..+...+.++...+.  ....+.+|+|+|+|+||+.+..|...       +..+
T Consensus        10 g~vyrS~D~G~TW~~i~~~~~--~~i~~i~~~~~~~p~~~~~~~~~~~~ly~S~D~GkTW~~~~~p~~~-------~~~l   80 (612)
T smart00602       10 SSVYISEDYGKTWKKIDEIEG--VIIETVISDFFNSSANKFKTILVKGYIFISSDEGKSFQKFTLPFPP-------LPSL   80 (612)
T ss_pred             CcEEEecCCCcCceeccccCC--CceeEEEeCCcCCccceeEEEecCCcEEEeecCCcceeEEECCCCC-------ccce
Confidence            679999999999998842211  234444444333322222  12457799999999999998765421       2344


Q ss_pred             EEeC---CeEEEEEcCC---EEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEc-----
Q 036387          170 SFKG---KEGWIVGKPA---ILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVR-----  238 (334)
Q Consensus       170 ~~~~---~~~~~vG~~g---~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~-----  238 (334)
                      .+++   +.+++.+..+   .+|+|+|+|+||+.+....  +.-.-+|......          ..+..++....     
T Consensus        81 ~~hp~~~~~il~~~~~~~~~~ly~S~DgG~tW~~i~~~v--~~cqf~~~~~~~~----------~~p~~I~~~~q~~~~~  148 (612)
T smart00602       81 LYHPKHPDYVLAYSKDCNYKVLYVSKDFGKTWTEIQENV--ESCEFSWGSMGVY----------DFPDLVHISVKENSGA  148 (612)
T ss_pred             EECCCCCCEEEEEecCCCCceEEEEcCCCCCcEEccccc--ceeEEEecCCCcC----------CCCcEEEEEeccCCCC
Confidence            5543   4466666665   8999999999999886431  1111122210000          00111222211     


Q ss_pred             CCeEEEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeC-----CCcEEEEcCCCcCcEEcccCCC--cc-ccee
Q 036387          239 GGGLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGG-----SGVLLKTTNGGKTWIREKAADN--IA-ANLY  310 (334)
Q Consensus       239 ~g~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~-----~G~i~~S~DgG~tW~~~~~~~~--~~-~~l~  310 (334)
                      ...+++|.|..+.-+...+ . .   .+.++.. .++-++++..     .-.+|+|.|++ +|+++..+..  .. ..-+
T Consensus       149 ~~~Lv~S~D~f~~~~~~~~-~-~---~~~~f~~-~~~yl~va~~~~~~~~~~l~VS~Dg~-~f~~a~~P~~~~i~~~~~y  221 (612)
T smart00602      149 LTELVSSIDFFQRYDQSTI-F-L---DIVGFLL-TDEYLFVAVTDEDTTSRKLYVSNDRS-TFAMAKFPKYHALGKQQAY  221 (612)
T ss_pred             ceEEEEeccccccCCccEe-e-e---cceeeEE-EccEEEEEEecCCCCeEEEEEECCCC-cceEEeCCCCcccCccccE
Confidence            1246777766431000111 1 0   1222222 2344554322     13589999965 9998876422  11 1234


Q ss_pred             EEEEeeCCeEEEE------eCCeeEEEEc
Q 036387          311 SVKFINEKKGFVL------GNDGVLLQYL  333 (334)
Q Consensus       311 ~i~~~~~~~~~a~------G~~G~il~s~  333 (334)
                      .|.-...+++++.      +..|.||+|+
T Consensus       222 tildss~~~vfl~V~~~~~~~~g~ly~Sd  250 (612)
T smart00602      222 TILDSDEDSVFLHVSENNQNDTGNLYISD  250 (612)
T ss_pred             EEEecCCCcEEEEEecCCCCceeEEEEEC
Confidence            4444467788887      7888899886


No 11 
>smart00602 VPS10 VPS10 domain.
Probab=99.08  E-value=1.7e-08  Score=103.39  Aligned_cols=59  Identities=19%  Similarity=0.260  Sum_probs=49.6

Q ss_pred             cceEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCC---eEEEEcCCCcCeEeCc
Q 036387           92 EQPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQ---TLLETKDGGKTWAPRS  153 (334)
Q Consensus        92 g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g---~i~~S~DgG~TW~~~~  153 (334)
                      +.+++|+|+|+||+.+..|..   .+..+.+.|.+++.+++.+..+   .+++|+|+|+||+.+.
T Consensus        55 ~~ly~S~D~GkTW~~~~~p~~---~~~~l~~hp~~~~~il~~~~~~~~~~ly~S~DgG~tW~~i~  116 (612)
T smart00602       55 GYIFISSDEGKSFQKFTLPFP---PLPSLLYHPKHPDYVLAYSKDCNYKVLYVSKDFGKTWTEIQ  116 (612)
T ss_pred             CcEEEeecCCcceeEEECCCC---CccceEECCCCCCEEEEEecCCCCceEEEEcCCCCCcEEcc
Confidence            469999999999999876643   2677889998888888887776   8999999999999774


No 12 
>cd00260 Sialidase Sialidases or neuraminidases function to bind and hydrolyze terminal sialic acid residues from various glycoconjugates as well as playing roles in pathogenesis, bacterial nutrition and cellular interactions. They have a six-bladed, beta-propeller fold with the non-viral sialidases containing 2-5 Asp-box motifs (most commonly Ser/Thr-X-Asp-[X]-Gly-X-Thr- Trp/Phe).  This CD includes eubacterial, eukaryotic, and viral sialidases.
Probab=98.92  E-value=2.9e-07  Score=87.89  Aligned_cols=220  Identities=18%  Similarity=0.224  Sum_probs=112.1

Q ss_pred             ceEEecCCCCCcEEcccCCCC----CeeeEEEEEecCCC-CEEEEE-Ec-----------------CCeEEEEcCCCcCe
Q 036387           93 QPAKSEEALSAWERVYIPVDP----GVVLLDIAFVPDDL-NHGFLL-GT-----------------RQTLLETKDGGKTW  149 (334)
Q Consensus        93 ~i~~S~DgG~tW~~~~~p~~~----~~~l~~I~~~p~d~-~~~~av-G~-----------------~g~i~~S~DgG~TW  149 (334)
                      .+.+|+|+|+||.........    ........+.  ++ +++++. +.                 .-.+.+|+|+|+||
T Consensus        49 v~~~S~D~G~tW~~~~~i~~~~~~~~~~~~p~~v~--~~~g~l~l~~~~~~~~~~~~~~~~~~~~~~~~~~~S~D~G~tW  126 (351)
T cd00260          49 VARRSTDGGKTWSPSTVISDGDGKSSRVKDPTVVV--DGLGRVFLLVGSFPNGEGEDNDYAGPSNAYLVLVYSDDDGITW  126 (351)
T ss_pred             eEEEeccCCCcccccEEehhcCCCCCcEEcceEEE--cCCCCEEEEEEECCCcccccccccCCCceEEEEEEEEcCCcee
Confidence            478899999999975432211    0112223333  22 555443 11                 12378899999999


Q ss_pred             EeCc-CCCCcc-cCcceeE----EEEEEeCCeEEEE--E------cCCEEEEEcCCCCCeEEeecCCCCCCCcccccccC
Q 036387          150 APRS-IPSAEE-EDFNYRF----NSISFKGKEGWIV--G------KPAILLHTSDAGESWERIPLSSQLPGDMAFWQPHN  215 (334)
Q Consensus       150 ~~~~-~p~~~~-~~~~~~~----~~I~~~~~~~~~v--G------~~g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~  215 (334)
                      +... +..... ......+    ..|...++++++.  +      ....+++|+|+|+||+......   .....     
T Consensus       127 ~~p~~l~~~~~~~~~~~~~~~~g~gi~l~~Grlv~p~~~~~~~~~~~~~~~~S~D~G~tW~~~~~~~---~~~~~-----  198 (351)
T cd00260         127 SSPRDLTPSVKGDNWAALFTGPGSGIQMKDGRLVFPVYGGNAGGRVSSAIIYSDDSGKTWKLGEGVN---DAGGC-----  198 (351)
T ss_pred             cCCccCCccccCcceeEEEecCcCeEEecCCcEEEEEEEEcCCCCEEEEEEEECCCCCCcEECCCCC---CCCCC-----
Confidence            7532 221110 0000111    1233334454432  1      1257899999999998643221   00000     


Q ss_pred             ccccceEeeeeEeecCCEEEEEcC-----CeEEEecCCCcceeeEecccc----------CCC--eeeEEEEeecCCeEE
Q 036387          216 RAVARRIQNMGWRADGGLWLLVRG-----GGLFLSKGTGITEEFEEVPVQ----------SRG--FGILDVGYRSQDEAW  278 (334)
Q Consensus       216 ~~~~~~i~~~~~~~~g~~~~~~~~-----g~i~~S~D~G~tW~w~~~~~~----------~~~--~~~~~v~~~~~~~~~  278 (334)
                        ....   +.-.++|.+++....     -.+++|.|+|+||+-......          ..+  ..++.+.......++
T Consensus       199 --~e~~---i~el~dG~l~~~~R~~~~~~~~~~~S~D~G~tWs~~~~~~~~~~~~~~~~~~~g~~~~~i~~~~~~g~~~l  273 (351)
T cd00260         199 --SECS---VVELSDGKLYMYTRDNSGGRRPVYESRDMGTTWTEALGTLSRVWGNCPTRCGSGVQGSFITATIESGKKVM  273 (351)
T ss_pred             --cCCE---EEEecCCEEEEEEeeCCCCcEEEEEEcCCCcCcccCcCCccccccccccCCCCcccceEEEeEecCCCEEE
Confidence              0111   122346777665322     247899999999854332111          111  122232211023344


Q ss_pred             EEeC--------CCcEEEEcCCCcCcEEcccCCCcc--cceeEEEEeeC-----CeEEEEeCCe
Q 036387          279 AAGG--------SGVLLKTTNGGKTWIREKAADNIA--ANLYSVKFINE-----KKGFVLGNDG  327 (334)
Q Consensus       279 ~~G~--------~G~i~~S~DgG~tW~~~~~~~~~~--~~l~~i~~~~~-----~~~~a~G~~G  327 (334)
                      +...        ...++.|.|+|++|.....-....  ....++.+.++     +.+++.-+.+
T Consensus       274 l~~~~~~~~~R~~l~l~~s~d~g~~w~~~~~i~~~~~~~~Ys~~~~~~~~~~~~~~~~~l~E~~  337 (351)
T cd00260         274 LLSRPNSPDSRSNLTLWLTDNNGSRWLDVGPISNGTDGSGYSTLTELPDTGDSCGYLGLLYELG  337 (351)
T ss_pred             EEeCCCCCCCCCceEEEEEeCCCceEEeeeeeccCCCceEEeeeeecCCccCCCCEEEEEEEcC
Confidence            4322        256899999999999986632222  33445666555     6666665554


No 13 
>PF13088 BNR_2:  BNR repeat-like domain; PDB: 2F11_A 2F0Z_A 1VCU_B 2F25_B 1SO7_A 2F29_A 1SNT_A 2F13_A 2F28_A 2F27_A ....
Probab=98.92  E-value=1.2e-07  Score=87.16  Aligned_cols=178  Identities=18%  Similarity=0.242  Sum_probs=89.2

Q ss_pred             CeEEEE--cCCCcCeEeCcCCCCcc-cCcceeEEEEEEe-CCeEEEE---Ec-----CCE---EEEEcCCCCCeEEeecC
Q 036387          137 QTLLET--KDGGKTWAPRSIPSAEE-EDFNYRFNSISFK-GKEGWIV---GK-----PAI---LLHTSDAGESWERIPLS  201 (334)
Q Consensus       137 g~i~~S--~DgG~TW~~~~~p~~~~-~~~~~~~~~I~~~-~~~~~~v---G~-----~g~---i~~S~DgG~TW~~~~~~  201 (334)
                      ..|.+|  +|+|+||++........ ....+.--.+... ++++++.   +.     .+.   .++|+|+|+||+.... 
T Consensus        18 ~~i~~S~s~D~G~tWs~~~~v~~~~~~~~~~~~p~~~~~~~g~l~l~~~~~~~~~~~~~~~~~~~~S~D~G~TWs~~~~-   96 (275)
T PF13088_consen   18 IVIRRSRSTDGGKTWSEPRIVADGPKPGRRYGNPSLVVDPDGRLWLFYSAGSSGGGWSGSRIYYSRSTDGGKTWSEPTD-   96 (275)
T ss_dssp             EEEEEECCCCCTTEEEEEEEEETSTBTTCEEEEEEEEEETTSEEEEEEEEEETTESCCTCEEEEEEESSTTSS-EEEEE-
T ss_pred             EEEEEEEeeCCCCeeCCCEEEeeccccCCcccCcEEEEeCCCCEEEEEEEccCCCCCCceeEEEEEECCCCCCCCCccc-
Confidence            357888  99999999754211111 1111111122233 3666643   22     122   3999999999999752 


Q ss_pred             CCCCCC-cccccccCccccceEee-eeEeecCCEEEEE-------cCCeEEEecCCCcceeeEeccccCCCeeeEEEEee
Q 036387          202 SQLPGD-MAFWQPHNRAVARRIQN-MGWRADGGLWLLV-------RGGGLFLSKGTGITEEFEEVPVQSRGFGILDVGYR  272 (334)
Q Consensus       202 ~~l~g~-~~~~~~~~~~~~~~i~~-~~~~~~g~~~~~~-------~~g~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~  272 (334)
                        ++.. ......       .... +....+|.+++..       ....+++|.|+|+||+............-..+...
T Consensus        97 --l~~~~~~~~~~-------~~~~~~i~~~~G~l~~~~~~~~~~~~~~~~~~S~D~G~tW~~~~~~~~~~~~~e~~~~~~  167 (275)
T PF13088_consen   97 --LPPGWFGNFSG-------PGRGPPIQLPDGRLIAPYYHESGGSFSAFVYYSDDGGKTWSSGSPIPDGQGECEPSIVEL  167 (275)
T ss_dssp             --EHHHCCCSCEE-------CSEEEEEEECTTEEEEEEEEESSCEEEEEEEEESSTTSSEEEEEECECSEEEEEEEEEEE
T ss_pred             --cccccccceec-------cceeeeeEecCCCEEEEEeeccccCcceEEEEeCCCCceeeccccccccCCcceeEEEEC
Confidence              1100 000000       0001 1113466665542       12347799999999854443221111122334444


Q ss_pred             cCCeEEEEeCC-----CcEEEEcCCCcCcEEcccC--CCcccceeEEEEeeCCeEEEEeC
Q 036387          273 SQDEAWAAGGS-----GVLLKTTNGGKTWIREKAA--DNIAANLYSVKFINEKKGFVLGN  325 (334)
Q Consensus       273 ~~~~~~~~G~~-----G~i~~S~DgG~tW~~~~~~--~~~~~~l~~i~~~~~~~~~a~G~  325 (334)
                      +++.+++.-..     -.+.+|+|+|+||+.....  ......+..+. .++++++++.+
T Consensus       168 ~dG~l~~~~R~~~~~~~~~~~S~D~G~TWs~~~~~~~~~~~~~~~~~~-~~~g~~~~~~~  226 (275)
T PF13088_consen  168 PDGRLLAVFRTEGNDDIYISRSTDGGRTWSPPQPTNLPNPNSSISLVR-LSDGRLLLVYN  226 (275)
T ss_dssp             TTSEEEEEEEECSSTEEEEEEESSTTSS-EEEEEEECSSCCEEEEEEE-CTTSEEEEEEE
T ss_pred             CCCcEEEEEEccCCCcEEEEEECCCCCcCCCceecccCcccCCceEEE-cCCCCEEEEEE
Confidence            67777775322     2568999999999986421  01122333333 34667766654


No 14 
>cd00260 Sialidase Sialidases or neuraminidases function to bind and hydrolyze terminal sialic acid residues from various glycoconjugates as well as playing roles in pathogenesis, bacterial nutrition and cellular interactions. They have a six-bladed, beta-propeller fold with the non-viral sialidases containing 2-5 Asp-box motifs (most commonly Ser/Thr-X-Asp-[X]-Gly-X-Thr- Trp/Phe).  This CD includes eubacterial, eukaryotic, and viral sialidases.
Probab=98.15  E-value=3.3e-05  Score=73.72  Aligned_cols=155  Identities=19%  Similarity=0.268  Sum_probs=76.2

Q ss_pred             EEEEcCCCcCeEeCcCCCCccc-CcceeEEEEEE-eC-CeEEEE--Ec----------------CCEEEEEcCCCCCeEE
Q 036387          139 LLETKDGGKTWAPRSIPSAEEE-DFNYRFNSISF-KG-KEGWIV--GK----------------PAILLHTSDAGESWER  197 (334)
Q Consensus       139 i~~S~DgG~TW~~~~~p~~~~~-~~~~~~~~I~~-~~-~~~~~v--G~----------------~g~i~~S~DgG~TW~~  197 (334)
                      +.+|+|+|+||.+......... ... ......+ .+ +++++.  ..                .-.+.+|+|+|+||+.
T Consensus        50 ~~~S~D~G~tW~~~~~i~~~~~~~~~-~~~p~~v~~~~g~l~l~~~~~~~~~~~~~~~~~~~~~~~~~~~S~D~G~tW~~  128 (351)
T cd00260          50 ARRSTDGGKTWSPSTVISDGDGKSSR-VKDPTVVVDGLGRVFLLVGSFPNGEGEDNDYAGPSNAYLVLVYSDDDGITWSS  128 (351)
T ss_pred             EEEeccCCCcccccEEehhcCCCCCc-EEcceEEEcCCCCEEEEEEECCCcccccccccCCCceEEEEEEEEcCCceecC
Confidence            6779999999997543221110 000 1111112 23 455432  10                1358899999999986


Q ss_pred             eec-CCCCCCCcccccccCccccceEeeeeEeecCCEEEEEc--------CCeEEEecCCCcceeeEecccc-CCCeeeE
Q 036387          198 IPL-SSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVR--------GGGLFLSKGTGITEEFEEVPVQ-SRGFGIL  267 (334)
Q Consensus       198 ~~~-~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~--------~g~i~~S~D~G~tW~w~~~~~~-~~~~~~~  267 (334)
                      -.. ......  ..|..........+    ...+|++++...        ...+++|.|+|+||+....... ... .--
T Consensus       129 p~~l~~~~~~--~~~~~~~~~~g~gi----~l~~Grlv~p~~~~~~~~~~~~~~~~S~D~G~tW~~~~~~~~~~~~-~e~  201 (351)
T cd00260         129 PRDLTPSVKG--DNWAALFTGPGSGI----QMKDGRLVFPVYGGNAGGRVSSAIIYSDDSGKTWKLGEGVNDAGGC-SEC  201 (351)
T ss_pred             CccCCccccC--cceeEEEecCcCeE----EecCCcEEEEEEEEcCCCCEEEEEEEECCCCCCcEECCCCCCCCCC-cCC
Confidence            321 111100  00100000000011    123566655321        2357899999999865443322 110 001


Q ss_pred             EEEeecCCeEEEEeC-----CCcEEEEcCCCcCcEEccc
Q 036387          268 DVGYRSQDEAWAAGG-----SGVLLKTTNGGKTWIREKA  301 (334)
Q Consensus       268 ~v~~~~~~~~~~~G~-----~G~i~~S~DgG~tW~~~~~  301 (334)
                      .+...+++.+++.-.     .-.+++|.|+|+||+....
T Consensus       202 ~i~el~dG~l~~~~R~~~~~~~~~~~S~D~G~tWs~~~~  240 (351)
T cd00260         202 SVVELSDGKLYMYTRDNSGGRRPVYESRDMGTTWTEALG  240 (351)
T ss_pred             EEEEecCCEEEEEEeeCCCCcEEEEEEcCCCcCcccCcC
Confidence            222233566665421     2247899999999998754


No 15 
>KOG3511 consensus Sortilin and related receptors [General function prediction only]
Probab=97.95  E-value=0.00016  Score=74.20  Aligned_cols=63  Identities=17%  Similarity=0.200  Sum_probs=41.2

Q ss_pred             cceEEecCCCCCcEEcccCCCCCeeeEEEE---EecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCC
Q 036387           92 EQPAKSEEALSAWERVYIPVDPGVVLLDIA---FVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPS  156 (334)
Q Consensus        92 g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~---~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~  156 (334)
                      .++|.|.|+|++|+.+.. ........++.   +.. .-....+.+..+.+|.|.|.|++|.++.++.
T Consensus       215 qkL~iS~D~G~tW~li~e-v~~~~~~~dv~~~~~~~-~~~~~e~~~~~~~fyyT~D~Gksw~e~~l~~  280 (720)
T KOG3511|consen  215 QKLWISKDGGRTWELIHE-VTGLYWFGDVGNIPFTI-PYRAFEAIDVSSEFYYTLDRGKSWNEITLSE  280 (720)
T ss_pred             CcEEEecCCCccceEeee-ccceeEEeeccCccccc-ccccccccCCCceEEEEcccCcccceeeccc
Confidence            479999999999999875 32112222222   221 1122334445678999999999999988753


No 16 
>PF02012 BNR:  BNR/Asp-box repeat;  InterPro: IPR002860 Members of this entry contain multiple BNR (bacterial neuraminidase repeat) repeats or Asp-boxes. The repeats are short, however the repeats are never found closer than 40 residues together suggesting that the repeat is structurally longer. These repeats are found in a variety of non-homologous proteins, including bacterial ribonucleases, sulphite oxidases, reelin, netrins, sialidases, neuraminidases, some lipoprotein receptors, and a variety of glycosyl hydrolases [].; PDB: 2JKB_A 2VW0_A 2VW2_A 2VW1_A 2CN2_D 2CN3_B 2VK7_B 2VK5_A 2VK6_A 2BF6_A ....
Probab=97.37  E-value=0.00015  Score=33.90  Aligned_cols=12  Identities=25%  Similarity=0.927  Sum_probs=9.8

Q ss_pred             EEEcCCCCCeEE
Q 036387          186 LHTSDAGESWER  197 (334)
Q Consensus       186 ~~S~DgG~TW~~  197 (334)
                      |+|+|+|+||+.
T Consensus         1 ~~S~D~G~TW~~   12 (12)
T PF02012_consen    1 YYSTDGGKTWKK   12 (12)
T ss_dssp             EEESSTTSS-EE
T ss_pred             CEeCCCcccCcC
Confidence            689999999984


No 17 
>PF02012 BNR:  BNR/Asp-box repeat;  InterPro: IPR002860 Members of this entry contain multiple BNR (bacterial neuraminidase repeat) repeats or Asp-boxes. The repeats are short, however the repeats are never found closer than 40 residues together suggesting that the repeat is structurally longer. These repeats are found in a variety of non-homologous proteins, including bacterial ribonucleases, sulphite oxidases, reelin, netrins, sialidases, neuraminidases, some lipoprotein receptors, and a variety of glycosyl hydrolases [].; PDB: 2JKB_A 2VW0_A 2VW2_A 2VW1_A 2CN2_D 2CN3_B 2VK7_B 2VK5_A 2VK6_A 2BF6_A ....
Probab=97.25  E-value=0.00025  Score=33.19  Aligned_cols=12  Identities=50%  Similarity=1.049  Sum_probs=9.8

Q ss_pred             EEEcCCCcCcEE
Q 036387          287 LKTTNGGKTWIR  298 (334)
Q Consensus       287 ~~S~DgG~tW~~  298 (334)
                      |+|+|+|+||+.
T Consensus         1 ~~S~D~G~TW~~   12 (12)
T PF02012_consen    1 YYSTDGGKTWKK   12 (12)
T ss_dssp             EEESSTTSS-EE
T ss_pred             CEeCCCcccCcC
Confidence            689999999984


No 18 
>KOG3511 consensus Sortilin and related receptors [General function prediction only]
Probab=97.20  E-value=0.0032  Score=64.84  Aligned_cols=80  Identities=29%  Similarity=0.405  Sum_probs=55.1

Q ss_pred             eeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCCCcccCcceeEE-EE---EEe-C-CeEEEEEcCCEEEEEc
Q 036387          116 VLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPSAEEEDFNYRFN-SI---SFK-G-KEGWIVGKPAILLHTS  189 (334)
Q Consensus       116 ~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~-~I---~~~-~-~~~~~vG~~g~i~~S~  189 (334)
                      .+..+.++|..++...+...+..+|.|.|+|.||+.+.. ...     .++. .+   -+. + .+..+.+..+.+|+|+
T Consensus       194 ~~~~ll~~ps~~D~~l~~~~dqkL~iS~D~G~tW~li~e-v~~-----~~~~~dv~~~~~~~~~~~~e~~~~~~~fyyT~  267 (720)
T KOG3511|consen  194 PAADLLFHPSVSDGLLLLSTDQKLWISKDGGRTWELIHE-VTG-----LYWFGDVGNIPFTIPYRAFEAIDVSSEFYYTL  267 (720)
T ss_pred             hhhhheeccccCccceeeeccCcEEEecCCCccceEeee-ccc-----eeEEeeccCcccccccccccccCCCceEEEEc
Confidence            445667777666666777777799999999999998764 211     1221 11   112 1 3444556678999999


Q ss_pred             CCCCCeEEeecC
Q 036387          190 DAGESWERIPLS  201 (334)
Q Consensus       190 DgG~TW~~~~~~  201 (334)
                      |.|++|.++...
T Consensus       268 D~Gksw~e~~l~  279 (720)
T KOG3511|consen  268 DRGKSWNEITLS  279 (720)
T ss_pred             ccCcccceeecc
Confidence            999999999864


No 19 
>PF14517 Tachylectin:  Tachylectin; PDB: 1TL2_A.
Probab=97.08  E-value=0.0032  Score=56.20  Aligned_cols=155  Identities=15%  Similarity=0.214  Sum_probs=82.5

Q ss_pred             EEEEEEeC-CeEEEEEcCCEEEEE---cCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCCe
Q 036387          166 FNSISFKG-KEGWIVGKPAILLHT---SDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGGG  241 (334)
Q Consensus       166 ~~~I~~~~-~~~~~vG~~g~i~~S---~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g~  241 (334)
                      +..|.+.+ .++|++-. +.+|+.   ++++.+|.....  ++. . .-|..        ...+.+.+.|.||++..+|.
T Consensus        36 ~~~i~~~P~g~lY~I~~-~~lY~~~~~~~~~~~~~~~~~--~Ig-~-g~W~~--------F~~i~~d~~G~LYaV~~~G~  102 (229)
T PF14517_consen   36 FRDIAAGPNGRLYAIRN-DGLYRGSPSSSGGNTWDSGSK--QIG-D-GGWNS--------FKFIFFDPTGVLYAVTPDGK  102 (229)
T ss_dssp             -SEEEE-TTS-EEEEET-TEEEEES---STT--HHHH-E--EEE---S-GGG---------SEEEE-TTS-EEEEETT-E
T ss_pred             cceEEEcCCceEEEEEC-CceEEecCCccCcccccccCc--ccc-c-Ccccc--------eeEEEecCCccEEEeccccc
Confidence            55677776 77888865 478888   788999973322  121 0 11321        22455677889999999999


Q ss_pred             EEEe---cCCCcceeeEe-ccccCCCe-eeEEEEeecCCeEEEEeCCCcEEEE---cCCCcCcEEcccC--CCcccceeE
Q 036387          242 LFLS---KGTGITEEFEE-VPVQSRGF-GILDVGYRSQDEAWAAGGSGVLLKT---TNGGKTWIREKAA--DNIAANLYS  311 (334)
Q Consensus       242 i~~S---~D~G~tW~w~~-~~~~~~~~-~~~~v~~~~~~~~~~~G~~G~i~~S---~DgG~tW~~~~~~--~~~~~~l~~  311 (334)
                      +||-   .++..+|.-.. ..+...+- .+..+-+.+++.+|++..+|.+|+.   .+++.+|-....-  ...-..+.-
T Consensus       103 lyR~~~~~~~~~~W~~~~~~~iG~~GW~~f~~vfa~~~GvLY~i~~dg~~~~~~~p~~~~~~W~~~s~~v~~~gw~~~~~  182 (229)
T PF14517_consen  103 LYRHPRPTNGSDNWIGGSGKKIGGTGWNDFDAVFAGPNGVLYAITPDGRLYRRYRPDGGSDRWLSGSGLVGGGGWDSFHF  182 (229)
T ss_dssp             EEEES---STT--HHH-HSEEEE-SSGGGEEEEEE-TTS-EEEEETTE-EEEE---SSTT--HHHH-EEEESSSGGGEEE
T ss_pred             eeeccCCCccCcchhhccceecccCCCccceEEEeCCCccEEEEcCCCceEEeCCCCCCCCccccccceeccCCcccceE
Confidence            8774   45667663201 11211121 2455656678889999888877665   6777889774331  011134777


Q ss_pred             EEEeeCCeEEEEeCCeeEEEEc
Q 036387          312 VKFINEKKGFVLGNDGVLLQYL  333 (334)
Q Consensus       312 i~~~~~~~~~a~G~~G~il~s~  333 (334)
                      |.+.+++.+|+|-.+|.|+|..
T Consensus       183 i~~~~~g~L~~V~~~G~lyr~~  204 (229)
T PF14517_consen  183 IFFSPDGNLWAVKSNGKLYRGR  204 (229)
T ss_dssp             EEE-TTS-EEEE-ETTEEEEES
T ss_pred             EeeCCCCcEEEEecCCEEeccC
Confidence            8888899999998899998864


No 20 
>PF13859 BNR_3:  BNR repeat-like domain; PDB: 3B69_A.
Probab=96.64  E-value=0.058  Score=50.77  Aligned_cols=150  Identities=17%  Similarity=0.226  Sum_probs=65.1

Q ss_pred             EEcCCCcCeEeCcCCC-CcccCcceeEEEE-E-EeCCeEEE-EEcC----------CEEEEEcCCCCCeEEeecCCCCCC
Q 036387          141 ETKDGGKTWAPRSIPS-AEEEDFNYRFNSI-S-FKGKEGWI-VGKP----------AILLHTSDAGESWERIPLSSQLPG  206 (334)
Q Consensus       141 ~S~DgG~TW~~~~~p~-~~~~~~~~~~~~I-~-~~~~~~~~-vG~~----------g~i~~S~DgG~TW~~~~~~~~l~g  206 (334)
                      .+.|+|++|+...... .........+.+- . +.++.+|+ +|..          ..+++++|+|.+|......+....
T Consensus        34 ~~~~~g~tw~~~~~~~~~~~~~~~v~v~rPTtvvkgn~IymLvG~y~~~~~~~~~~llLvks~~~g~~W~~~~~l~~~~~  113 (310)
T PF13859_consen   34 YSTDNGETWKAEVAVLNDDGSKKRVDVSRPTTVVKGNKIYMLVGSYSRSAGADDWGLLLVKSTDGGIKWGDTKSLPSTSF  113 (310)
T ss_dssp             EESSSSSS-EEEEEE----SS-TT-EEEEEEEEEETTEEEEEEEEESS--SSTTEEEEEEEEESSSSEE---EE-GGGS-
T ss_pred             EeeccccccccceeeecccccccccccceeeeeecceeEEEEEEEEeccccccccceeeeeccCCcceeeecccCCchhc
Confidence            3789999998754211 1111111112111 1 23566764 4431          378899999999998764321110


Q ss_pred             C--cccccccCccccceEeeeeEeecCCEEEE----EcCC-----eEEEecCCCcceeeEeccccCCCeee-EEEEeecC
Q 036387          207 D--MAFWQPHNRAVARRIQNMGWRADGGLWLL----VRGG-----GLFLSKGTGITEEFEEVPVQSRGFGI-LDVGYRSQ  274 (334)
Q Consensus       207 ~--~~~~~~~~~~~~~~i~~~~~~~~g~~~~~----~~~g-----~i~~S~D~G~tW~w~~~~~~~~~~~~-~~v~~~~~  274 (334)
                      .  ..|....    ...|    ...||.+++-    ..++     -|.+|+|+|++|.+.+--.+..  +. -.|.--.+
T Consensus       114 ~~~~~figgG----GSGV----~m~dGTLVFPv~a~~~~~~~~~SlIiYS~d~g~~W~lskg~s~~g--C~~psv~EWe~  183 (310)
T PF13859_consen  114 QSWKQFIGGG----GSGV----VMEDGTLVFPVQATKKNGDGTVSLIIYSTDDGKTWKLSKGMSPAG--CSDPSVVEWED  183 (310)
T ss_dssp             EEEEEEEE-S----EE-E----E-TTS-EEEEEEEEETT---EEEEEEEESSTTSS-EE-S----TT---EEEEEEEE-T
T ss_pred             cccceeecCC----CCce----EEcCCCEEEEEeeeccCccceEEEEEEECCCccceEeccccCCCC--cceEEEEeccC
Confidence            0  0011000    0011    1234544331    1122     3678999999998766433321  11 11211124


Q ss_pred             CeEEEEe--CCC--cEEEEcCCCcCcEEcc
Q 036387          275 DEAWAAG--GSG--VLLKTTNGGKTWIREK  300 (334)
Q Consensus       275 ~~~~~~G--~~G--~i~~S~DgG~tW~~~~  300 (334)
                      +.++++.  .+|  .+|.|.|-|+||...-
T Consensus       184 gkLlM~~~c~~g~rrVYeS~DmG~tWtea~  213 (310)
T PF13859_consen  184 GKLLMMTACDDGRRRVYESGDMGTTWTEAL  213 (310)
T ss_dssp             TEEEEEEE-TTS---EEEESSTTSS-EE-T
T ss_pred             CeeEEEEecccceEEEEEEcccceehhhcc
Confidence            5655442  245  6999999999999843


No 21 
>PF14517 Tachylectin:  Tachylectin; PDB: 1TL2_A.
Probab=96.54  E-value=0.025  Score=50.59  Aligned_cols=108  Identities=18%  Similarity=0.231  Sum_probs=60.8

Q ss_pred             eeeEeecCCEEEEEcCCeEEEe---cCCCcceeeEeccccCCC-eeeEEEEeecCCeEEEEeCCCcEEEE---cCCCcCc
Q 036387          224 NMGWRADGGLWLLVRGGGLFLS---KGTGITEEFEEVPVQSRG-FGILDVGYRSQDEAWAAGGSGVLLKT---TNGGKTW  296 (334)
Q Consensus       224 ~~~~~~~g~~~~~~~~g~i~~S---~D~G~tW~w~~~~~~~~~-~~~~~v~~~~~~~~~~~G~~G~i~~S---~DgG~tW  296 (334)
                      .+.+.+++.+|++-++ .+|+.   .+++.+|......+...+ ..+..|.+.+.+.+|++..+|.|||-   .+++.+|
T Consensus        38 ~i~~~P~g~lY~I~~~-~lY~~~~~~~~~~~~~~~~~~Ig~g~W~~F~~i~~d~~G~LYaV~~~G~lyR~~~~~~~~~~W  116 (229)
T PF14517_consen   38 DIAAGPNGRLYAIRND-GLYRGSPSSSGGNTWDSGSKQIGDGGWNSFKFIFFDPTGVLYAVTPDGKLYRHPRPTNGSDNW  116 (229)
T ss_dssp             EEEE-TTS-EEEEETT-EEEEES---STT--HHHH-EEEE-S-GGG-SEEEE-TTS-EEEEETT-EEEEES---STT--H
T ss_pred             eEEEcCCceEEEEECC-ceEEecCCccCcccccccCcccccCcccceeEEEecCCccEEEeccccceeeccCCCccCcch
Confidence            3555788889988754 88888   678887743333344331 13446666778999999999988664   6889999


Q ss_pred             EE-ccc-C-CCcccceeEEEEeeCCeEEEEeCCeeEEEE
Q 036387          297 IR-EKA-A-DNIAANLYSVKFINEKKGFVLGNDGVLLQY  332 (334)
Q Consensus       297 ~~-~~~-~-~~~~~~l~~i~~~~~~~~~a~G~~G~il~s  332 (334)
                      .. ... . ...=..+..|-+.+++.+|++..+|.++|.
T Consensus       117 ~~~~~~~iG~~GW~~f~~vfa~~~GvLY~i~~dg~~~~~  155 (229)
T PF14517_consen  117 IGGSGKKIGGTGWNDFDAVFAGPNGVLYAITPDGRLYRR  155 (229)
T ss_dssp             HH-HSEEEE-SSGGGEEEEEE-TTS-EEEEETTE-EEEE
T ss_pred             hhccceecccCCCccceEEEeCCCccEEEEcCCCceEEe
Confidence            65 111 1 011134667777789999999999977775


No 22 
>COG4257 Vgb Streptogramin lyase [Defense mechanisms]
Probab=95.62  E-value=1.8  Score=39.85  Aligned_cols=105  Identities=18%  Similarity=0.277  Sum_probs=65.4

Q ss_pred             eeEeecCCEEEEEcCCe-EEEecC-CCcceeeEeccccCC-CeeeEEEEeecCCeEEEEeC-CCcEEEEcCCCcCcEEcc
Q 036387          225 MGWRADGGLWLLVRGGG-LFLSKG-TGITEEFEEVPVQSR-GFGILDVGYRSQDEAWAAGG-SGVLLKTTNGGKTWIREK  300 (334)
Q Consensus       225 ~~~~~~g~~~~~~~~g~-i~~S~D-~G~tW~w~~~~~~~~-~~~~~~v~~~~~~~~~~~G~-~G~i~~S~DgG~tW~~~~  300 (334)
                      +...++|.+|++.-.+. |.+-.. .|.   -+.++.|.. ......+.-.+-+++|+... .|.+++-.-.-++|+..+
T Consensus       194 i~atpdGsvwyaslagnaiaridp~~~~---aev~p~P~~~~~gsRriwsdpig~~wittwg~g~l~rfdPs~~sW~eyp  270 (353)
T COG4257         194 ICATPDGSVWYASLAGNAIARIDPFAGH---AEVVPQPNALKAGSRRIWSDPIGRAWITTWGTGSLHRFDPSVTSWIEYP  270 (353)
T ss_pred             eEECCCCcEEEEeccccceEEcccccCC---cceecCCCcccccccccccCccCcEEEeccCCceeeEeCcccccceeee
Confidence            44467888988764433 333322 132   244444432 11233444445688999754 467888877778899999


Q ss_pred             cCCCcccceeEEEEeeCCeEEEE-eCCeeEEEEc
Q 036387          301 AADNIAANLYSVKFINEKKGFVL-GNDGVLLQYL  333 (334)
Q Consensus       301 ~~~~~~~~l~~i~~~~~~~~~a~-G~~G~il~s~  333 (334)
                      .+ .....-+++..+..+++|.. -..|.|+|.+
T Consensus       271 LP-gs~arpys~rVD~~grVW~sea~agai~rfd  303 (353)
T COG4257         271 LP-GSKARPYSMRVDRHGRVWLSEADAGAIGRFD  303 (353)
T ss_pred             CC-CCCCCcceeeeccCCcEEeeccccCceeecC
Confidence            86 33456778877778889984 4666777765


No 23 
>PHA02713 hypothetical protein; Provisional
Probab=94.57  E-value=6.2  Score=40.31  Aligned_cols=196  Identities=10%  Similarity=0.111  Sum_probs=94.0

Q ss_pred             CCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcC--C-----eEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEeC
Q 036387          101 LSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTR--Q-----TLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFKG  173 (334)
Q Consensus       101 G~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~--g-----~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~  173 (334)
                      -.+|..+.....+ ..-.+++..  + +.+|++|..  +     .+++=+=.-.+|+++... ...  . ..+ ++...+
T Consensus       281 ~~~W~~l~~mp~~-r~~~~~a~l--~-~~IYviGG~~~~~~~~~~v~~Yd~~~n~W~~~~~m-~~~--R-~~~-~~~~~~  351 (557)
T PHA02713        281 TMEYSVISTIPNH-IINYASAIV--D-NEIIIAGGYNFNNPSLNKVYKINIENKIHVELPPM-IKN--R-CRF-SLAVID  351 (557)
T ss_pred             CCeEEECCCCCcc-ccceEEEEE--C-CEEEEEcCCCCCCCccceEEEEECCCCeEeeCCCC-cch--h-hce-eEEEEC
Confidence            4579887632221 122345554  2 678888753  1     133222234579876421 111  1 112 344457


Q ss_pred             CeEEEEEcC-C-----EEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCC-------
Q 036387          174 KEGWIVGKP-A-----ILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGG-------  240 (334)
Q Consensus       174 ~~~~~vG~~-g-----~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g-------  240 (334)
                      +.+|++|.. +     .+.+-+=.-.+|+.++.   ++.....           .  ....-++.+|+.|+..       
T Consensus       352 g~IYviGG~~~~~~~~sve~Ydp~~~~W~~~~~---mp~~r~~-----------~--~~~~~~g~IYviGG~~~~~~~~~  415 (557)
T PHA02713        352 DTIYAIGGQNGTNVERTIECYTMGDDKWKMLPD---MPIALSS-----------Y--GMCVLDQYIYIIGGRTEHIDYTS  415 (557)
T ss_pred             CEEEEECCcCCCCCCceEEEEECCCCeEEECCC---CCccccc-----------c--cEEEECCEEEEEeCCCccccccc
Confidence            889988642 1     23333333457988763   2211100           0  1112367788876421       


Q ss_pred             -----------------eEEEecCCCcceeeEeccc-cCCCeeeEEEEeecCCeEEEEeCCC-------cEEEEcCCC-c
Q 036387          241 -----------------GLFLSKGTGITEEFEEVPV-QSRGFGILDVGYRSQDEAWAAGGSG-------VLLKTTNGG-K  294 (334)
Q Consensus       241 -----------------~i~~S~D~G~tW~w~~~~~-~~~~~~~~~v~~~~~~~~~~~G~~G-------~i~~S~DgG-~  294 (334)
                                       .+.+-...-.  +|+.++. +... ...+++. -++.+|++|+..       .+.+-.-.- +
T Consensus       416 ~~~~~~~~~~~~~~~~~~ve~YDP~td--~W~~v~~m~~~r-~~~~~~~-~~~~IYv~GG~~~~~~~~~~ve~Ydp~~~~  491 (557)
T PHA02713        416 VHHMNSIDMEEDTHSSNKVIRYDTVNN--IWETLPNFWTGT-IRPGVVS-HKDDIYVVCDIKDEKNVKTCIFRYNTNTYN  491 (557)
T ss_pred             ccccccccccccccccceEEEECCCCC--eEeecCCCCccc-ccCcEEE-ECCEEEEEeCCCCCCccceeEEEecCCCCC
Confidence                             1222222223  3566542 2211 1112222 257899987631       233333333 4


Q ss_pred             CcEEcccCCCcccceeEEEEeeCCeEEEEeC-Ce
Q 036387          295 TWIREKAADNIAANLYSVKFINEKKGFVLGN-DG  327 (334)
Q Consensus       295 tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~-~G  327 (334)
                      .|+.+..- +.......++.. ++++|++|. +|
T Consensus       492 ~W~~~~~m-~~~r~~~~~~~~-~~~iyv~Gg~~~  523 (557)
T PHA02713        492 GWELITTT-ESRLSALHTILH-DNTIMMLHCYES  523 (557)
T ss_pred             CeeEcccc-CcccccceeEEE-CCEEEEEeeecc
Confidence            79998763 333444455544 689999875 55


No 24 
>PHA02790 Kelch-like protein; Provisional
Probab=94.50  E-value=5.8  Score=39.67  Aligned_cols=169  Identities=9%  Similarity=0.079  Sum_probs=83.8

Q ss_pred             CEEEEEEcCC------eEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEeCCeEEEEEcC---CEEEEEcCCCCCeEEe
Q 036387          128 NHGFLLGTRQ------TLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFKGKEGWIVGKP---AILLHTSDAGESWERI  198 (334)
Q Consensus       128 ~~~~avG~~g------~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~~~~~~vG~~---g~i~~S~DgG~TW~~~  198 (334)
                      +.+|++|...      .+++-+=.-.+|.++......   .. .. ++...++.+|++|..   ..+.+-...-.+|+.+
T Consensus       272 ~~lyviGG~~~~~~~~~v~~Ydp~~~~W~~~~~m~~~---r~-~~-~~v~~~~~iYviGG~~~~~sve~ydp~~n~W~~~  346 (480)
T PHA02790        272 EVVYLIGGWMNNEIHNNAIAVNYISNNWIPIPPMNSP---RL-YA-SGVPANNKLYVVGGLPNPTSVERWFHGDAAWVNM  346 (480)
T ss_pred             CEEEEEcCCCCCCcCCeEEEEECCCCEEEECCCCCch---hh-cc-eEEEECCEEEEECCcCCCCceEEEECCCCeEEEC
Confidence            5677776421      232222234679887532211   11 12 233457889988753   2344444445679887


Q ss_pred             ecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCC----eEEEecCCCcceeeEeccccCCC-eeeEEEEeec
Q 036387          199 PLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGG----GLFLSKGTGITEEFEEVPVQSRG-FGILDVGYRS  273 (334)
Q Consensus       199 ~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g----~i~~S~D~G~tW~w~~~~~~~~~-~~~~~v~~~~  273 (334)
                      +.   ++-...             ......-++.+|+.|+..    .+.+-.-...  +|+.++..... .....+.  -
T Consensus       347 ~~---l~~~r~-------------~~~~~~~~g~IYviGG~~~~~~~ve~ydp~~~--~W~~~~~m~~~r~~~~~~~--~  406 (480)
T PHA02790        347 PS---LLKPRC-------------NPAVASINNVIYVIGGHSETDTTTEYLLPNHD--QWQFGPSTYYPHYKSCALV--F  406 (480)
T ss_pred             CC---CCCCCc-------------ccEEEEECCEEEEecCcCCCCccEEEEeCCCC--EEEeCCCCCCccccceEEE--E
Confidence            63   221110             001123467888886421    1211111223  35665332211 1112222  3


Q ss_pred             CCeEEEEeCCCcEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeC
Q 036387          274 QDEAWAAGGSGVLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGN  325 (334)
Q Consensus       274 ~~~~~~~G~~G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~  325 (334)
                      ++.+|++|..-.+|-  -.-.+|+.++.. +.+..-.+++.. ++++|++|.
T Consensus       407 ~~~IYv~GG~~e~yd--p~~~~W~~~~~m-~~~r~~~~~~v~-~~~IYviGG  454 (480)
T PHA02790        407 GRRLFLVGRNAEFYC--ESSNTWTLIDDP-IYPRDNPELIIV-DNKLLLIGG  454 (480)
T ss_pred             CCEEEEECCceEEec--CCCCcEeEcCCC-CCCccccEEEEE-CCEEEEECC
Confidence            689999985433432  234689998753 333344455544 679999986


No 25 
>KOG0645 consensus WD40 repeat protein [General function prediction only]
Probab=93.91  E-value=5.1  Score=36.77  Aligned_cols=216  Identities=13%  Similarity=0.155  Sum_probs=117.0

Q ss_pred             ceeEEEecCCC-ccceEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCC--e-EEEEcCCCcCeEeCcCC
Q 036387           80 LSISLAATTGL-YEQPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQ--T-LLETKDGGKTWAPRSIP  155 (334)
Q Consensus        80 ~g~~~~~g~~~-~g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g--~-i~~S~DgG~TW~~~~~p  155 (334)
                      -|.++|.++.. -..|++  +.+..|+.+..-...+..+.+|++.+  ....+|.-+..  . |++ .|.+.-.+-+..-
T Consensus        72 ~g~~La~aSFD~t~~Iw~--k~~~efecv~~lEGHEnEVK~Vaws~--sG~~LATCSRDKSVWiWe-~deddEfec~aVL  146 (312)
T KOG0645|consen   72 HGRYLASASFDATVVIWK--KEDGEFECVATLEGHENEVKCVAWSA--SGNYLATCSRDKSVWIWE-IDEDDEFECIAVL  146 (312)
T ss_pred             CCcEEEEeeccceEEEee--cCCCceeEEeeeeccccceeEEEEcC--CCCEEEEeeCCCeEEEEE-ecCCCcEEEEeee
Confidence            36667776651 133554  44568988775444557899999974  35556655443  2 344 4556666655432


Q ss_pred             CCcccCcceeEEEEEEeCC-eEEEEEc---CCEEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecC
Q 036387          156 SAEEEDFNYRFNSISFKGK-EGWIVGK---PAILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADG  231 (334)
Q Consensus       156 ~~~~~~~~~~~~~I~~~~~-~~~~vG~---~g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g  231 (334)
                      ..+    ..-+..+.++|. .+.+...   .-.+|+..| +..|+-+..   +.+-.           .++-.+.|.+.|
T Consensus       147 ~~H----tqDVK~V~WHPt~dlL~S~SYDnTIk~~~~~~-dddW~c~~t---l~g~~-----------~TVW~~~F~~~G  207 (312)
T KOG0645|consen  147 QEH----TQDVKHVIWHPTEDLLFSCSYDNTIKVYRDED-DDDWECVQT---LDGHE-----------NTVWSLAFDNIG  207 (312)
T ss_pred             ccc----cccccEEEEcCCcceeEEeccCCeEEEEeecC-CCCeeEEEE---ecCcc-----------ceEEEEEecCCC
Confidence            221    123555666773 3333332   237888887 889998874   22211           023344555545


Q ss_pred             CE-EEEEcCCeEEEecCCCcceeeEec-cccC-CCeeeEEEEeecCCeEEE-EeCCC--cEEEEcC--CCcCcEEcccCC
Q 036387          232 GL-WLLVRGGGLFLSKGTGITEEFEEV-PVQS-RGFGILDVGYRSQDEAWA-AGGSG--VLLKTTN--GGKTWIREKAAD  303 (334)
Q Consensus       232 ~~-~~~~~~g~i~~S~D~G~tW~w~~~-~~~~-~~~~~~~v~~~~~~~~~~-~G~~G--~i~~S~D--gG~tW~~~~~~~  303 (334)
                      .- .-.++++.+.         -|... .++. ....++.+...  +.+++ +|.++  .+|+..|  .+-+|+.+...+
T Consensus       208 ~rl~s~sdD~tv~---------Iw~~~~~~~~~~sr~~Y~v~W~--~~~IaS~ggD~~i~lf~~s~~~d~p~~~l~~~~~  276 (312)
T KOG0645|consen  208 SRLVSCSDDGTVS---------IWRLYTDLSGMHSRALYDVPWD--NGVIASGGGDDAIRLFKESDSPDEPSWNLLAKKE  276 (312)
T ss_pred             ceEEEecCCcceE---------eeeeccCcchhcccceEeeeec--ccceEeccCCCEEEEEEecCCCCCchHHHHHhhh
Confidence            32 2222232211         12211 1111 11246667664  22333 34444  3577766  457898876432


Q ss_pred             Ccc-cceeEEEEee--CCeEEEEeCCeeEE
Q 036387          304 NIA-ANLYSVKFIN--EKKGFVLGNDGVLL  330 (334)
Q Consensus       304 ~~~-~~l~~i~~~~--~~~~~a~G~~G~il  330 (334)
                      +.+ ..+.+|.+.+  .+++...|++|++-
T Consensus       277 ~aHe~dVNsV~w~p~~~~~L~s~~DDG~v~  306 (312)
T KOG0645|consen  277 GAHEVDVNSVQWNPKVSNRLASGGDDGIVN  306 (312)
T ss_pred             cccccccceEEEcCCCCCceeecCCCceEE
Confidence            222 4789999987  67888889999764


No 26 
>COG3292 Predicted periplasmic ligand-binding sensor domain [Signal transduction mechanisms]
Probab=93.03  E-value=1.4  Score=44.27  Aligned_cols=146  Identities=14%  Similarity=0.209  Sum_probs=75.2

Q ss_pred             eeeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEe-CCeEEEEEcCCEEEEEcCCCC
Q 036387          115 VVLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFK-GKEGWIVGKPAILLHTSDAGE  193 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~-~~~~~~vG~~g~i~~S~DgG~  193 (334)
                      ..+.++.++-  .+.+|+...+|..+...=-|+-=+....|...      .++.+..+ .+++|+....|..+++. .| 
T Consensus       165 ~~V~aLv~D~--~g~lWvgT~dGL~~fd~~~gkalql~s~~~dk------~I~al~~d~qg~LWVGTdqGv~~~e~-~G-  234 (671)
T COG3292         165 TPVVALVFDA--NGRLWVGTPDGLSYFDAGRGKALQLASPPLDK------AINALIADVQGRLWVGTDQGVYLQEA-EG-  234 (671)
T ss_pred             ccceeeeeec--cCcEEEecCCcceEEccccceEEEcCCCcchh------hHHHHHHHhcCcEEEEeccceEEEch-hh-
Confidence            5667777753  36778766667544432223323222222210      23333322 36788887777555544 45 


Q ss_pred             CeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCCeE-EEecCCCcceeeEeccccCCCeeeEEEEee
Q 036387          194 SWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGGGL-FLSKGTGITEEFEEVPVQSRGFGILDVGYR  272 (334)
Q Consensus       194 TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g~i-~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~  272 (334)
                       |....-...+|..             .|..+.-+..|.+|+.+++|-. ++..+.|..  ....+.+..-..+..+..+
T Consensus       235 -~~~sn~~~~lp~~-------------~I~ll~qD~qG~lWiGTenGl~r~~l~rq~Lq--~~~~~~~l~~S~vnsL~~D  298 (671)
T COG3292         235 -WRASNWGPMLPSG-------------NILLLVQDAQGELWIGTENGLWRTRLPRQGLQ--IPLSKMHLGVSTVNSLWLD  298 (671)
T ss_pred             -ccccccCCCCcch-------------heeeeecccCCCEEEeecccceeEecCCCCcc--ccccccCCccccccceeec
Confidence             4443322223321             1222222456789999988654 788888862  2322222211234555555


Q ss_pred             cCCeEEEEeCCCcE
Q 036387          273 SQDEAWAAGGSGVL  286 (334)
Q Consensus       273 ~~~~~~~~G~~G~i  286 (334)
                      .++.+|+....|.+
T Consensus       299 ~dGsLWv~t~~giv  312 (671)
T COG3292         299 TDGSLWVGTYGGIV  312 (671)
T ss_pred             cCCCEeeeccCceE
Confidence            67888885555444


No 27 
>KOG0645 consensus WD40 repeat protein [General function prediction only]
Probab=92.99  E-value=7.3  Score=35.79  Aligned_cols=193  Identities=12%  Similarity=0.208  Sum_probs=107.7

Q ss_pred             eeEEEEEecCCCCEEEEEEc-CCe-EEEEcCCCcCeEeCcC-CCCcccCcceeEEEEEEeC-CeEEEEEcC-CEEEEEcC
Q 036387          116 VLLDIAFVPDDLNHGFLLGT-RQT-LLETKDGGKTWAPRSI-PSAEEEDFNYRFNSISFKG-KEGWIVGKP-AILLHTSD  190 (334)
Q Consensus       116 ~l~~I~~~p~d~~~~~avG~-~g~-i~~S~DgG~TW~~~~~-p~~~~~~~~~~~~~I~~~~-~~~~~vG~~-g~i~~S~D  190 (334)
                      .+-.+++.|. ..+++|.+. +-. -.-+.-+|.+|+-... ...+    .-.++.|+..| .+..+.+.. ..+-.-.+
T Consensus        16 r~W~~awhp~-~g~ilAscg~Dk~vriw~~~~~~s~~ck~vld~~h----krsVRsvAwsp~g~~La~aSFD~t~~Iw~k   90 (312)
T KOG0645|consen   16 RVWSVAWHPG-KGVILASCGTDKAVRIWSTSSGDSWTCKTVLDDGH----KRSVRSVAWSPHGRYLASASFDATVVIWKK   90 (312)
T ss_pred             cEEEEEeccC-CceEEEeecCCceEEEEecCCCCcEEEEEeccccc----hheeeeeeecCCCcEEEEeeccceEEEeec
Confidence            5677778652 134565543 322 2224444889986642 2221    12588888887 565555542 33333344


Q ss_pred             CCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCC-eEE-EecCCCcceeeEeccccCC-CeeeE
Q 036387          191 AGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGG-GLF-LSKGTGITEEFEEVPVQSR-GFGIL  267 (334)
Q Consensus       191 gG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g-~i~-~S~D~G~tW~w~~~~~~~~-~~~~~  267 (334)
                      .+..|+.+..-   .|-.           .-+..++|+.+|..+++-... .++ .-.|.+.  ++.-..+-.. ..-+-
T Consensus        91 ~~~efecv~~l---EGHE-----------nEVK~Vaws~sG~~LATCSRDKSVWiWe~dedd--Efec~aVL~~HtqDVK  154 (312)
T KOG0645|consen   91 EDGEFECVATL---EGHE-----------NEVKCVAWSASGNYLATCSRDKSVWIWEIDEDD--EFECIAVLQEHTQDVK  154 (312)
T ss_pred             CCCceeEEeee---eccc-----------cceeEEEEcCCCCEEEEeeCCCeEEEEEecCCC--cEEEEeeecccccccc
Confidence            45689998753   3211           134567788888877654332 232 2223332  2444332211 12344


Q ss_pred             EEEeecCCeEEEEeCC-C--cEEEEcCCCcCcEEcccCCCcccceeEEEEeeCC-eEEEEeCCeeEE
Q 036387          268 DVGYRSQDEAWAAGGS-G--VLLKTTNGGKTWIREKAADNIAANLYSVKFINEK-KGFVLGNDGVLL  330 (334)
Q Consensus       268 ~v~~~~~~~~~~~G~~-G--~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~-~~~a~G~~G~il  330 (334)
                      .+.+.+...+++...+ .  .+|+..| +..|+-...-++-..++++++|.+.| ++.-+.++|.+.
T Consensus       155 ~V~WHPt~dlL~S~SYDnTIk~~~~~~-dddW~c~~tl~g~~~TVW~~~F~~~G~rl~s~sdD~tv~  220 (312)
T KOG0645|consen  155 HVIWHPTEDLLFSCSYDNTIKVYRDED-DDDWECVQTLDGHENTVWSLAFDNIGSRLVSCSDDGTVS  220 (312)
T ss_pred             EEEEcCCcceeEEeccCCeEEEEeecC-CCCeeEEEEecCccceEEEEEecCCCceEEEecCCcceE
Confidence            5566555556665443 3  4677777 77899887743334589999998755 677777888654


No 28 
>KOG0310 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=91.63  E-value=15  Score=36.25  Aligned_cols=217  Identities=11%  Similarity=0.036  Sum_probs=115.9

Q ss_pred             ccceeEEEecCCCccceEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCCC
Q 036387           78 LSLSISLAATTGLYEQPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPSA  157 (334)
Q Consensus        78 ~a~g~~~~~g~~~~g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~~  157 (334)
                      -..|.++|+|+.  .+..+--| =++=..+..-.....+++-+.|.|. .++.++.|++..+.+=.|--.--.+..+...
T Consensus        77 R~DG~LlaaGD~--sG~V~vfD-~k~r~iLR~~~ah~apv~~~~f~~~-d~t~l~s~sDd~v~k~~d~s~a~v~~~l~~h  152 (487)
T KOG0310|consen   77 RSDGRLLAAGDE--SGHVKVFD-MKSRVILRQLYAHQAPVHVTKFSPQ-DNTMLVSGSDDKVVKYWDLSTAYVQAELSGH  152 (487)
T ss_pred             ecCCeEEEccCC--cCcEEEec-cccHHHHHHHhhccCceeEEEeccc-CCeEEEecCCCceEEEEEcCCcEEEEEecCC
Confidence            456888888875  33555555 2330001011112367888899884 5777888877766555553222233233222


Q ss_pred             cccCcceeEEEEEEeC--CeEEEEEcCCEEEE---EcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCC
Q 036387          158 EEEDFNYRFNSISFKG--KEGWIVGKPAILLH---TSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGG  232 (334)
Q Consensus       158 ~~~~~~~~~~~I~~~~--~~~~~vG~~g~i~~---S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~  232 (334)
                      .+     ++++.++.+  +++++.|...+..|   +.--+ +|..-     +        .|.    -.+.++.+.+.|.
T Consensus       153 tD-----YVR~g~~~~~~~hivvtGsYDg~vrl~DtR~~~-~~v~e-----l--------nhg----~pVe~vl~lpsgs  209 (487)
T KOG0310|consen  153 TD-----YVRCGDISPANDHIVVTGSYDGKVRLWDTRSLT-SRVVE-----L--------NHG----CPVESVLALPSGS  209 (487)
T ss_pred             cc-----eeEeeccccCCCeEEEecCCCceEEEEEeccCC-ceeEE-----e--------cCC----CceeeEEEcCCCC
Confidence            21     578888775  67788776543333   22222 33321     1        111    1245566677777


Q ss_pred             EEEEEcCC--eEEEecCCCcceeeEeccccCCCeeeEEEEeecCC-eEEEEeCCCc--EEEEcCCCcCcEEcccCCCccc
Q 036387          233 LWLLVRGG--GLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQD-EAWAAGGSGV--LLKTTNGGKTWIREKAADNIAA  307 (334)
Q Consensus       233 ~~~~~~~g--~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~-~~~~~G~~G~--i~~S~DgG~tW~~~~~~~~~~~  307 (334)
                      +++...+.  .+|=..-||+.    ......-...+.++.+..++ .++.+|.++.  +|.++    +|+.+..- ..+.
T Consensus       210 ~iasAgGn~vkVWDl~~G~ql----l~~~~~H~KtVTcL~l~s~~~rLlS~sLD~~VKVfd~t----~~Kvv~s~-~~~~  280 (487)
T KOG0310|consen  210 LIASAGGNSVKVWDLTTGGQL----LTSMFNHNKTVTCLRLASDSTRLLSGSLDRHVKVFDTT----NYKVVHSW-KYPG  280 (487)
T ss_pred             EEEEcCCCeEEEEEecCCcee----hhhhhcccceEEEEEeecCCceEeecccccceEEEEcc----ceEEEEee-eccc
Confidence            66544222  23434444441    10111111246677665544 4555666775  46544    48888763 3567


Q ss_pred             ceeEEEEeeC-CeEEEEeCCeeEE
Q 036387          308 NLYSVKFINE-KKGFVLGNDGVLL  330 (334)
Q Consensus       308 ~l~~i~~~~~-~~~~a~G~~G~il  330 (334)
                      ++.+++.+++ .++++...+|+++
T Consensus       281 pvLsiavs~dd~t~viGmsnGlv~  304 (487)
T KOG0310|consen  281 PVLSIAVSPDDQTVVIGMSNGLVS  304 (487)
T ss_pred             ceeeEEecCCCceEEEecccceee
Confidence            8999988864 4566666888765


No 29 
>KOG3669 consensus Uncharacterized conserved protein, contains dysferlin, TECPR and PH domains [General function prediction only]
Probab=91.17  E-value=5.3  Score=40.30  Aligned_cols=96  Identities=13%  Similarity=0.174  Sum_probs=61.9

Q ss_pred             eEEEecCCCccceEE------ecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCCeEEE----EcC--CCcCe
Q 036387           82 ISLAATTGLYEQPAK------SEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQTLLE----TKD--GGKTW  149 (334)
Q Consensus        82 ~~~~~g~~~~g~i~~------S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g~i~~----S~D--gG~TW  149 (334)
                      .+||.++.  |.+|+      +.--|..|+.+..+.    .|..|..-|  ...+||+..+|.++.    |.+  .|.+|
T Consensus       194 ~awAI~s~--Gd~y~RtGvs~~~P~GraW~~i~~~t----~L~qISagP--tg~VwAvt~nG~vf~R~GVsRqNp~GdsW  265 (705)
T KOG3669|consen  194 TAWAIRSS--GDLYLRTGVSVDRPCGRAWKVICPYT----DLSQISAGP--TGVVWAVTENGAVFYREGVSRQNPEGDSW  265 (705)
T ss_pred             EEEEEecC--CcEEEeccccCCCCCCceeeecCCCC----ccceEeecC--cceEEEEeeCCcEEEEecccccCCCCchh
Confidence            35666665  55554      334488999987543    588888864  378999999887654    344  59999


Q ss_pred             EeCcCCCCcccCcceeEEEEEEeCCeEEEEEcCC-EEEEEcC
Q 036387          150 APRSIPSAEEEDFNYRFNSISFKGKEGWIVGKPA-ILLHTSD  190 (334)
Q Consensus       150 ~~~~~p~~~~~~~~~~~~~I~~~~~~~~~vG~~g-~i~~S~D  190 (334)
                      +.+..|...-     .+.+|.+.-+.+|++...+ ..||..+
T Consensus       266 kdI~tP~~a~-----~~v~iSvGt~t~Waldndg~lwfrrgi  302 (705)
T KOG3669|consen  266 KDIVTPRQAL-----EPVCISVGTQTLWALDNDGNLWFRRGI  302 (705)
T ss_pred             hhccCccccc-----ceEEEEeccceEEEEecCCcEEEEecc
Confidence            9888776421     2445555446677765433 4445443


No 30 
>KOG1538 consensus Uncharacterized conserved protein WDR10, contains WD40 repeats [General function prediction only]
Probab=91.10  E-value=21  Score=36.95  Aligned_cols=198  Identities=18%  Similarity=0.311  Sum_probs=100.3

Q ss_pred             eeeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEe-CCeEEEEEcC-----------
Q 036387          115 VVLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFK-GKEGWIVGKP-----------  182 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~-~~~~~~vG~~-----------  182 (334)
                      ..+++|+|.|+..+-++|+|+.=.||-+.||+. -+....   + .+   .++.|+.. ++..|+.|..           
T Consensus        13 hci~d~afkPDGsqL~lAAg~rlliyD~ndG~l-lqtLKg---H-KD---tVycVAys~dGkrFASG~aDK~VI~W~~kl   84 (1081)
T KOG1538|consen   13 HCINDIAFKPDGTQLILAAGSRLLVYDTSDGTL-LQPLKG---H-KD---TVYCVAYAKDGKRFASGSADKSVIIWTSKL   84 (1081)
T ss_pred             cchheeEECCCCceEEEecCCEEEEEeCCCccc-cccccc---c-cc---eEEEEEEccCCceeccCCCceeEEEecccc
Confidence            478999999965555667776666777788764 222211   1 11   46777764 4556655432           


Q ss_pred             -CEEEEEcCCCCCeEEeecCCC---C----CCCcccccccCcc-----ccceEeeeeEeecCCEEEEEc-CCeEEEecCC
Q 036387          183 -AILLHTSDAGESWERIPLSSQ---L----PGDMAFWQPHNRA-----VARRIQNMGWRADGGLWLLVR-GGGLFLSKGT  248 (334)
Q Consensus       183 -g~i~~S~DgG~TW~~~~~~~~---l----~g~~~~~~~~~~~-----~~~~i~~~~~~~~g~~~~~~~-~g~i~~S~D~  248 (334)
                       |.+-+|.  +..=+-+...+.   +    -.+..+|.+....     +..++..-.+..||..++.+. +|.|-.-.-.
T Consensus        85 EG~LkYSH--~D~IQCMsFNP~~h~LasCsLsdFglWS~~qK~V~K~kss~R~~~CsWtnDGqylalG~~nGTIsiRNk~  162 (1081)
T KOG1538|consen   85 EGILKYSH--NDAIQCMSFNPITHQLASCSLSDFGLWSPEQKSVSKHKSSSRIICCSWTNDGQYLALGMFNGTISIRNKN  162 (1081)
T ss_pred             cceeeecc--CCeeeEeecCchHHHhhhcchhhccccChhhhhHHhhhhheeEEEeeecCCCcEEEEeccCceEEeecCC
Confidence             3333332  223343333221   0    1234677654432     233555556678888887774 5555433333


Q ss_pred             CcceeeEeccccCC-CeeeEEEEeecC-----CeEEEE-eCCCcE-EEEcCCCcCcEEcccCCCcccceeEEEEeeCCeE
Q 036387          249 GITEEFEEVPVQSR-GFGILDVGYRSQ-----DEAWAA-GGSGVL-LKTTNGGKTWIREKAADNIAANLYSVKFINEKKG  320 (334)
Q Consensus       249 G~tW~w~~~~~~~~-~~~~~~v~~~~~-----~~~~~~-G~~G~i-~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~  320 (334)
                      |+.  -..+.-|.. ..++.+|.+.+.     +.++++ .....+ |++-||    +.+.......-.-..|.+..+|..
T Consensus       163 gEe--k~~I~Rpgg~Nspiwsi~~~p~sg~G~~di~aV~DW~qTLSFy~LsG----~~Igk~r~L~FdP~CisYf~NGEy  236 (1081)
T KOG1538|consen  163 GEE--KVKIERPGGSNSPIWSICWNPSSGEGRNDILAVADWGQTLSFYQLSG----KQIGKDRALNFDPCCISYFTNGEY  236 (1081)
T ss_pred             CCc--ceEEeCCCCCCCCceEEEecCCCCCCccceEEEEeccceeEEEEecc----eeecccccCCCCchhheeccCCcE
Confidence            431  123333332 346888888652     234443 333333 667664    223211112223345666666766


Q ss_pred             EEEe-CCee
Q 036387          321 FVLG-NDGV  328 (334)
Q Consensus       321 ~a~G-~~G~  328 (334)
                      .++| .++.
T Consensus       237 ~LiGGsdk~  245 (1081)
T KOG1538|consen  237 ILLGGSDKQ  245 (1081)
T ss_pred             EEEccCCCc
Confidence            5554 4443


No 31 
>PHA02790 Kelch-like protein; Provisional
Probab=90.83  E-value=19  Score=36.01  Aligned_cols=151  Identities=10%  Similarity=0.122  Sum_probs=71.8

Q ss_pred             CCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcC---CeEEEEcCCCcCeEeCcC-CCCcccCcceeEEEEEEeCCeE
Q 036387          101 LSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTR---QTLLETKDGGKTWAPRSI-PSAEEEDFNYRFNSISFKGKEG  176 (334)
Q Consensus       101 G~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~---g~i~~S~DgG~TW~~~~~-p~~~~~~~~~~~~~I~~~~~~~  176 (334)
                      -.+|..+.....+... .+++..  + +.+|++|..   ..+.+-.-.-.+|+.+.. |..    .  .-.++...++.+
T Consensus       296 ~~~W~~~~~m~~~r~~-~~~v~~--~-~~iYviGG~~~~~sve~ydp~~n~W~~~~~l~~~----r--~~~~~~~~~g~I  365 (480)
T PHA02790        296 SNNWIPIPPMNSPRLY-ASGVPA--N-NKLYVVGGLPNPTSVERWFHGDAAWVNMPSLLKP----R--CNPAVASINNVI  365 (480)
T ss_pred             CCEEEECCCCCchhhc-ceEEEE--C-CEEEEECCcCCCCceEEEECCCCeEEECCCCCCC----C--cccEEEEECCEE
Confidence            4679988643322222 233333  2 788998753   223333334557988752 221    1  112334457889


Q ss_pred             EEEEcCC----EEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCCeEEEecCCCcce
Q 036387          177 WIVGKPA----ILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGGGLFLSKGTGITE  252 (334)
Q Consensus       177 ~~vG~~g----~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g~i~~S~D~G~tW  252 (334)
                      |++|...    .+.+-+=...+|+.++..+ .+   .+            ......-++.+|+.+....+|-- + -.  
T Consensus       366 YviGG~~~~~~~ve~ydp~~~~W~~~~~m~-~~---r~------------~~~~~~~~~~IYv~GG~~e~ydp-~-~~--  425 (480)
T PHA02790        366 YVIGGHSETDTTTEYLLPNHDQWQFGPSTY-YP---HY------------KSCALVFGRRLFLVGRNAEFYCE-S-SN--  425 (480)
T ss_pred             EEecCcCCCCccEEEEeCCCCEEEeCCCCC-Cc---cc------------cceEEEECCEEEEECCceEEecC-C-CC--
Confidence            9886421    1222222345788875321 11   00            00111346788988743334422 2 22  


Q ss_pred             eeEeccccCCCeeeEEEEeecCCeEEEEeC
Q 036387          253 EFEEVPVQSRGFGILDVGYRSQDEAWAAGG  282 (334)
Q Consensus       253 ~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~  282 (334)
                      +|+.++.......-.+++. -++.+|++|+
T Consensus       426 ~W~~~~~m~~~r~~~~~~v-~~~~IYviGG  454 (480)
T PHA02790        426 TWTLIDDPIYPRDNPELII-VDNKLLLIGG  454 (480)
T ss_pred             cEeEcCCCCCCccccEEEE-ECCEEEEECC
Confidence            4666542211111122322 2678999886


No 32 
>KOG4441 consensus Proteins containing BTB/POZ and Kelch domains, involved in regulatory/signal transduction processes [Signal transduction mechanisms; General function prediction only]
Probab=89.92  E-value=25  Score=36.05  Aligned_cols=192  Identities=12%  Similarity=0.175  Sum_probs=102.5

Q ss_pred             CcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCC-------eEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEeCCe
Q 036387          103 AWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQ-------TLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFKGKE  175 (334)
Q Consensus       103 tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g-------~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~~~  175 (334)
                      .|........+ ..-.++++..   +.+|++|...       .+++-+--..+|.++..-...     -...++..-++.
T Consensus       312 ~w~~~a~m~~~-r~~~~~~~~~---~~lYv~GG~~~~~~~l~~ve~YD~~~~~W~~~a~M~~~-----R~~~~v~~l~g~  382 (571)
T KOG4441|consen  312 EWSSLAPMPSP-RCRVGVAVLN---GKLYVVGGYDSGSDRLSSVERYDPRTNQWTPVAPMNTK-----RSDFGVAVLDGK  382 (571)
T ss_pred             cEeecCCCCcc-cccccEEEEC---CEEEEEccccCCCcccceEEEecCCCCceeccCCccCc-----cccceeEEECCE
Confidence            68877643221 2345667763   5788887532       244444456679986422111     022245555788


Q ss_pred             EEEEEcC-C-----EEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCC-------eE
Q 036387          176 GWIVGKP-A-----ILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGG-------GL  242 (334)
Q Consensus       176 ~~~vG~~-g-----~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g-------~i  242 (334)
                      +|++|.. |     .+-+-+-....|+.+..-   +..             +-...+..-++.+|++++..       .+
T Consensus       383 iYavGG~dg~~~l~svE~YDp~~~~W~~va~m---~~~-------------r~~~gv~~~~g~iYi~GG~~~~~~~l~sv  446 (571)
T KOG4441|consen  383 LYAVGGFDGEKSLNSVECYDPVTNKWTPVAPM---LTR-------------RSGHGVAVLGGKLYIIGGGDGSSNCLNSV  446 (571)
T ss_pred             EEEEeccccccccccEEEecCCCCcccccCCC---Ccc-------------eeeeEEEEECCEEEEEcCcCCCccccceE
Confidence            9988643 2     355556666778877632   110             01111223468899887521       12


Q ss_pred             EEecCCCcceeeEecc-ccCCCeeeEEEEeecCCeEEEEeCC-C-----cEEEEcCCCcCcEEcccCCCcccceeEEEEe
Q 036387          243 FLSKGTGITEEFEEVP-VQSRGFGILDVGYRSQDEAWAAGGS-G-----VLLKTTNGGKTWIREKAADNIAANLYSVKFI  315 (334)
Q Consensus       243 ~~S~D~G~tW~w~~~~-~~~~~~~~~~v~~~~~~~~~~~G~~-G-----~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~  315 (334)
                      .+-...-.+  |+.++ .... ....+++.. .+.+|++|+. |     .+-+..-..+.|..+... .....-..++..
T Consensus       447 e~YDP~t~~--W~~~~~M~~~-R~~~g~a~~-~~~iYvvGG~~~~~~~~~VE~ydp~~~~W~~v~~m-~~~rs~~g~~~~  521 (571)
T KOG4441|consen  447 ECYDPETNT--WTLIAPMNTR-RSGFGVAVL-NGKIYVVGGFDGTSALSSVERYDPETNQWTMVAPM-TSPRSAVGVVVL  521 (571)
T ss_pred             EEEcCCCCc--eeecCCcccc-cccceEEEE-CCEEEEECCccCCCccceEEEEcCCCCceeEcccC-ccccccccEEEE
Confidence            222223333  56653 2221 122344433 6789999874 2     245556667889999642 233444444544


Q ss_pred             eCCeEEEEeC
Q 036387          316 NEKKGFVLGN  325 (334)
Q Consensus       316 ~~~~~~a~G~  325 (334)
                       ++++|++|.
T Consensus       522 -~~~ly~vGG  530 (571)
T KOG4441|consen  522 -GGKLYAVGG  530 (571)
T ss_pred             -CCEEEEEec
Confidence             688999875


No 33 
>KOG3669 consensus Uncharacterized conserved protein, contains dysferlin, TECPR and PH domains [General function prediction only]
Probab=89.02  E-value=11  Score=38.05  Aligned_cols=139  Identities=14%  Similarity=0.252  Sum_probs=79.6

Q ss_pred             CeEEEEEcCCEEEEE------cCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCCeEEE---
Q 036387          174 KEGWIVGKPAILLHT------SDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGGGLFL---  244 (334)
Q Consensus       174 ~~~~~vG~~g~i~~S------~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g~i~~---  244 (334)
                      ..+|+.+..|.+|+-      .--|..|+.+...+.+                  ..+...+-+.+|+++.+|.+++   
T Consensus       193 ~~awAI~s~Gd~y~RtGvs~~~P~GraW~~i~~~t~L------------------~qISagPtg~VwAvt~nG~vf~R~G  254 (705)
T KOG3669|consen  193 DTAWAIRSSGDLYLRTGVSVDRPCGRAWKVICPYTDL------------------SQISAGPTGVVWAVTENGAVFYREG  254 (705)
T ss_pred             eEEEEEecCCcEEEeccccCCCCCCceeeecCCCCcc------------------ceEeecCcceEEEEeeCCcEEEEec
Confidence            567888887766553      3458889998754311                  1122234577899998887654   


Q ss_pred             -ecC--CCcceeeEeccccCCCeeeEEEEeecCCeEEEEeCCCcE-EEEcC-----CCcCcEEcccCC--C--cccceeE
Q 036387          245 -SKG--TGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVL-LKTTN-----GGKTWIREKAAD--N--IAANLYS  311 (334)
Q Consensus       245 -S~D--~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i-~~S~D-----gG~tW~~~~~~~--~--~~~~l~~  311 (334)
                       |.+  .|.+|  ..+..|.....+..+..- ...+|++..+|.+ ||..+     .|..|+......  .  ....+.-
T Consensus       255 VsRqNp~GdsW--kdI~tP~~a~~~v~iSvG-t~t~Waldndg~lwfrrgii~~kpeg~h~~e~~~s~~~~v~tdq~isf  331 (705)
T KOG3669|consen  255 VSRQNPEGDSW--KDIVTPRQALEPVCISVG-TQTLWALDNDGNLWFRRGIISKKPEGDHDHEWQVSITDYVVTDQCISF  331 (705)
T ss_pred             ccccCCCCchh--hhccCcccccceEEEEec-cceEEEEecCCcEEEEecccccCcccccccccccccccceEEecceee
Confidence             333  37754  666655432225555543 5678888877755 55543     334444433311  1  1123333


Q ss_pred             EEEeeCCeEEEEeCCeeEEEEc
Q 036387          312 VKFINEKKGFVLGNDGVLLQYL  333 (334)
Q Consensus       312 i~~~~~~~~~a~G~~G~il~s~  333 (334)
                      +...-+.++||++.++.|.+-+
T Consensus       332 ~SV~~ndqVfaisa~~~i~~R~  353 (705)
T KOG3669|consen  332 QSVIHNDQVFAISAQAKIEVRE  353 (705)
T ss_pred             EEEEecceEEEEecccceeeec
Confidence            3333467899999988665433


No 34 
>COG3292 Predicted periplasmic ligand-binding sensor domain [Signal transduction mechanisms]
Probab=88.28  E-value=5.6  Score=40.18  Aligned_cols=98  Identities=16%  Similarity=0.140  Sum_probs=59.6

Q ss_pred             eecCCEEEEEcCCeEEEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeCCCcE-EEEcCCCcCcEEcccCCCcc
Q 036387          228 RADGGLWLLVRGGGLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVL-LKTTNGGKTWIREKAADNIA  306 (334)
Q Consensus       228 ~~~g~~~~~~~~g~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i-~~S~DgG~tW~~~~~~~~~~  306 (334)
                      +..+++|+.+..|-.+.+. .|  |.|.....+.....+..+.-+..+..|+....|.. ++..+.|..--..+.. ..-
T Consensus       214 d~qg~LWVGTdqGv~~~e~-~G--~~~sn~~~~lp~~~I~ll~qD~qG~lWiGTenGl~r~~l~rq~Lq~~~~~~~-l~~  289 (671)
T COG3292         214 DVQGRLWVGTDQGVYLQEA-EG--WRASNWGPMLPSGNILLLVQDAQGELWIGTENGLWRTRLPRQGLQIPLSKMH-LGV  289 (671)
T ss_pred             HhcCcEEEEeccceEEEch-hh--ccccccCCCCcchheeeeecccCCCEEEeecccceeEecCCCCccccccccC-Ccc
Confidence            4468899888665544444 44  56666433221113444443446788997777754 7888888765555442 122


Q ss_pred             cceeEEEEeeCCeEEEEeCCeeE
Q 036387          307 ANLYSVKFINEKKGFVLGNDGVL  329 (334)
Q Consensus       307 ~~l~~i~~~~~~~~~a~G~~G~i  329 (334)
                      ..+.++....++.+|+....|++
T Consensus       290 S~vnsL~~D~dGsLWv~t~~giv  312 (671)
T COG3292         290 STVNSLWLDTDGSLWVGTYGGIV  312 (671)
T ss_pred             ccccceeeccCCCEeeeccCceE
Confidence            45667777778889977776644


No 35 
>KOG0278 consensus Serine/threonine kinase receptor-associated protein [Lipid transport and metabolism]
Probab=88.17  E-value=5.9  Score=36.05  Aligned_cols=102  Identities=17%  Similarity=0.244  Sum_probs=54.0

Q ss_pred             eeeeEeecCCEEEEEcCCeE-EEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeC-CCcEEEEc-CCCcCcEEc
Q 036387          223 QNMGWRADGGLWLLVRGGGL-FLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGG-SGVLLKTT-NGGKTWIRE  299 (334)
Q Consensus       223 ~~~~~~~~g~~~~~~~~g~i-~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~-~G~i~~S~-DgG~tW~~~  299 (334)
                      .++.+..+|.++.....+.| |+..+.     +..+....-...+.+....+...+|++|. ++.+|+-. +-|+-=...
T Consensus       188 tSlEvs~dG~ilTia~gssV~Fwdaks-----f~~lKs~k~P~nV~SASL~P~k~~fVaGged~~~~kfDy~TgeEi~~~  262 (334)
T KOG0278|consen  188 TSLEVSQDGRILTIAYGSSVKFWDAKS-----FGLLKSYKMPCNVESASLHPKKEFFVAGGEDFKVYKFDYNTGEEIGSY  262 (334)
T ss_pred             cceeeccCCCEEEEecCceeEEecccc-----ccceeeccCccccccccccCCCceEEecCcceEEEEEeccCCceeeec
Confidence            34555677776655544443 333221     22221111112333333445667888866 45555442 223222222


Q ss_pred             ccCCCcccceeEEEEeeCCeEEEEe-CCeeEEE
Q 036387          300 KAADNIAANLYSVKFINEKKGFVLG-NDGVLLQ  331 (334)
Q Consensus       300 ~~~~~~~~~l~~i~~~~~~~~~a~G-~~G~il~  331 (334)
                      ..  +-..++.+|.|+++|.+||.| ++|.|.-
T Consensus       263 nk--gh~gpVhcVrFSPdGE~yAsGSEDGTirl  293 (334)
T KOG0278|consen  263 NK--GHFGPVHCVRFSPDGELYASGSEDGTIRL  293 (334)
T ss_pred             cc--CCCCceEEEEECCCCceeeccCCCceEEE
Confidence            12  335789999999999999998 7787643


No 36 
>PF13859 BNR_3:  BNR repeat-like domain; PDB: 3B69_A.
Probab=87.43  E-value=2  Score=40.45  Aligned_cols=60  Identities=13%  Similarity=0.110  Sum_probs=32.7

Q ss_pred             cceEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEE--EcCC--eEEEEcCCCcCeEeCc
Q 036387           92 EQPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLL--GTRQ--TLLETKDGGKTWAPRS  153 (334)
Q Consensus        92 g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~av--G~~g--~i~~S~DgG~TW~~~~  153 (334)
                      ..|.+|+|.|++|+.-..-...+..-..|.=.  ....++.+  .++|  .+|.|.|-|.||++..
T Consensus       150 SlIiYS~d~g~~W~lskg~s~~gC~~psv~EW--e~gkLlM~~~c~~g~rrVYeS~DmG~tWtea~  213 (310)
T PF13859_consen  150 SLIIYSTDDGKTWKLSKGMSPAGCSDPSVVEW--EDGKLLMMTACDDGRRRVYESGDMGTTWTEAL  213 (310)
T ss_dssp             EEEEEESSTTSS-EE-S----TT-EEEEEEEE---TTEEEEEEE-TTS---EEEESSTTSS-EE-T
T ss_pred             EEEEEECCCccceEeccccCCCCcceEEEEec--cCCeeEEEEecccceEEEEEEcccceehhhcc
Confidence            56899999999999743211112333334333  12444443  3456  5999999999999853


No 37 
>smart00706 TECPR Beta propeller repeats in Physarum polycephalum tectonins, Limulus lectin L-6 and animal hypothetical proteins.
Probab=86.22  E-value=2.2  Score=26.07  Aligned_cols=34  Identities=18%  Similarity=0.374  Sum_probs=27.9

Q ss_pred             CcEEcccCCCcccceeEEEEeeCCeEEEEeCCeeEEEEcC
Q 036387          295 TWIREKAADNIAANLYSVKFINEKKGFVLGNDGVLLQYLG  334 (334)
Q Consensus       295 tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G~il~s~~  334 (334)
                      .|++++.      .+..|...+++.+|++..+|.|++.+|
T Consensus         2 ~W~~v~g------~l~~isvg~~~~vW~V~~~g~i~~r~g   35 (35)
T smart00706        2 SWTQVPG------ELVQVSVGPSDTVWAVNSDGNIYRRTG   35 (35)
T ss_pred             CcEEcCC------CEEEEEECCCCeEEEEcCCCCEEEECC
Confidence            4888763      688888876689999999999998765


No 38 
>PF08450 SGL:  SMP-30/Gluconolaconase/LRE-like region;  InterPro: IPR013658 This family describes a region that is found in proteins expressed by a variety of eukaryotic and prokaryotic species. These proteins include various enzymes, such as senescence marker protein 30 (SMP-30, Q15493 from SWISSPROT), gluconolactonase (Q01578 from SWISSPROT) and luciferin-regenerating enzyme (LRE, Q86DU5 from SWISSPROT). SMP-30 is known to hydrolyse diisopropyl phosphorofluoridate in the liver, and has been noted as having sequence similarity, in the region described in this family, with PON1 (P52430 from SWISSPROT) and LRE. ; PDB: 2GHS_A 2DG0_L 2DG1_D 2DSO_D 3E5Z_A 2IAT_A 2IAV_A 2GVV_A 3HLI_A 2GVU_A ....
Probab=85.77  E-value=25  Score=31.26  Aligned_cols=188  Identities=10%  Similarity=0.116  Sum_probs=96.4

Q ss_pred             EEEEecCCCCEEEEEEc-CCeEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEe--CCeEEEEEcCCEEEEEcCCCCCe
Q 036387          119 DIAFVPDDLNHGFLLGT-RQTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFK--GKEGWIVGKPAILLHTSDAGESW  195 (334)
Q Consensus       119 ~I~~~p~d~~~~~avG~-~g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~--~~~~~~vG~~g~i~~S~DgG~TW  195 (334)
                      ++.+.+ ..+.+|++.- .+.|++-...+..-+....+.         ...+.+.  ++.+|++...+..+. +-....+
T Consensus         4 gp~~d~-~~g~l~~~D~~~~~i~~~~~~~~~~~~~~~~~---------~~G~~~~~~~g~l~v~~~~~~~~~-d~~~g~~   72 (246)
T PF08450_consen    4 GPVWDP-RDGRLYWVDIPGGRIYRVDPDTGEVEVIDLPG---------PNGMAFDRPDGRLYVADSGGIAVV-DPDTGKV   72 (246)
T ss_dssp             EEEEET-TTTEEEEEETTTTEEEEEETTTTEEEEEESSS---------EEEEEEECTTSEEEEEETTCEEEE-ETTTTEE
T ss_pred             ceEEEC-CCCEEEEEEcCCCEEEEEECCCCeEEEEecCC---------CceEEEEccCCEEEEEEcCceEEE-ecCCCcE
Confidence            355654 2477777764 566777555444444333332         2345555  366777666555444 3234467


Q ss_pred             EEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcC---------CeEEEecCCCcceeeEeccccCCCeee
Q 036387          196 ERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRG---------GGLFLSKGTGITEEFEEVPVQSRGFGI  266 (334)
Q Consensus       196 ~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~---------g~i~~S~D~G~tW~w~~~~~~~~~~~~  266 (334)
                      +.+....  .+...         ....+.+.+.++|.+|+....         |.+|+-..+|+   .+.+...  ....
T Consensus        73 ~~~~~~~--~~~~~---------~~~~ND~~vd~~G~ly~t~~~~~~~~~~~~g~v~~~~~~~~---~~~~~~~--~~~p  136 (246)
T PF08450_consen   73 TVLADLP--DGGVP---------FNRPNDVAVDPDGNLYVTDSGGGGASGIDPGSVYRIDPDGK---VTVVADG--LGFP  136 (246)
T ss_dssp             EEEEEEE--TTCSC---------TEEEEEEEE-TTS-EEEEEECCBCTTCGGSEEEEEEETTSE---EEEEEEE--ESSE
T ss_pred             EEEeecc--CCCcc---------cCCCceEEEcCCCCEEEEecCCCccccccccceEEECCCCe---EEEEecC--cccc
Confidence            7765421  01101         124556778889999987642         56887766654   2222111  1124


Q ss_pred             EEEEeecCC-eEEEEeC-CCcEEEEcC--CCcCcEEcc---cCCCcccceeEEEEeeCCeEEEEe-CCeeEEEEc
Q 036387          267 LDVGYRSQD-EAWAAGG-SGVLLKTTN--GGKTWIREK---AADNIAANLYSVKFINEKKGFVLG-NDGVLLQYL  333 (334)
Q Consensus       267 ~~v~~~~~~-~~~~~G~-~G~i~~S~D--gG~tW~~~~---~~~~~~~~l~~i~~~~~~~~~a~G-~~G~il~s~  333 (334)
                      .++++.+++ .+|++-. .+.|++-.=  .+..+....   .........-.+++..++++|++. ..|.|++.+
T Consensus       137 NGi~~s~dg~~lyv~ds~~~~i~~~~~~~~~~~~~~~~~~~~~~~~~g~pDG~~vD~~G~l~va~~~~~~I~~~~  211 (246)
T PF08450_consen  137 NGIAFSPDGKTLYVADSFNGRIWRFDLDADGGELSNRRVFIDFPGGPGYPDGLAVDSDGNLWVADWGGGRIVVFD  211 (246)
T ss_dssp             EEEEEETTSSEEEEEETTTTEEEEEEEETTTCCEEEEEEEEE-SSSSCEEEEEEEBTTS-EEEEEETTTEEEEEE
T ss_pred             cceEECCcchheeecccccceeEEEeccccccceeeeeeEEEcCCCCcCCCcceEcCCCCEEEEEcCCCEEEEEC
Confidence            678887766 4666533 455655432  233232211   111111235678887788888873 455566554


No 39 
>PF08450 SGL:  SMP-30/Gluconolaconase/LRE-like region;  InterPro: IPR013658 This family describes a region that is found in proteins expressed by a variety of eukaryotic and prokaryotic species. These proteins include various enzymes, such as senescence marker protein 30 (SMP-30, Q15493 from SWISSPROT), gluconolactonase (Q01578 from SWISSPROT) and luciferin-regenerating enzyme (LRE, Q86DU5 from SWISSPROT). SMP-30 is known to hydrolyse diisopropyl phosphorofluoridate in the liver, and has been noted as having sequence similarity, in the region described in this family, with PON1 (P52430 from SWISSPROT) and LRE. ; PDB: 2GHS_A 2DG0_L 2DG1_D 2DSO_D 3E5Z_A 2IAT_A 2IAV_A 2GVV_A 3HLI_A 2GVU_A ....
Probab=85.75  E-value=25  Score=31.25  Aligned_cols=205  Identities=13%  Similarity=0.081  Sum_probs=107.4

Q ss_pred             cceEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEE
Q 036387           92 EQPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISF  171 (334)
Q Consensus        92 g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~  171 (334)
                      +.|++-...+..-+.+..+.     ..++.+...+ +.+|++...+..+.-.+. ..++.+..... ........+++.+
T Consensus        22 ~~i~~~~~~~~~~~~~~~~~-----~~G~~~~~~~-g~l~v~~~~~~~~~d~~~-g~~~~~~~~~~-~~~~~~~~ND~~v   93 (246)
T PF08450_consen   22 GRIYRVDPDTGEVEVIDLPG-----PNGMAFDRPD-GRLYVADSGGIAVVDPDT-GKVTVLADLPD-GGVPFNRPNDVAV   93 (246)
T ss_dssp             TEEEEEETTTTEEEEEESSS-----EEEEEEECTT-SEEEEEETTCEEEEETTT-TEEEEEEEEET-TCSCTEEEEEEEE
T ss_pred             CEEEEEECCCCeEEEEecCC-----CceEEEEccC-CEEEEEEcCceEEEecCC-CcEEEEeeccC-CCcccCCCceEEE
Confidence            45666555544444333322     5666776323 777777766655443233 35665543210 1112346888988


Q ss_pred             eC-CeEEEEEcC---------CEEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCC-EEEEEc-C
Q 036387          172 KG-KEGWIVGKP---------AILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGG-LWLLVR-G  239 (334)
Q Consensus       172 ~~-~~~~~vG~~---------g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~-~~~~~~-~  239 (334)
                      ++ +++|+....         |.||+-+..| +.+.+...  +.               .-+.+.+.+++. +|++.. .
T Consensus        94 d~~G~ly~t~~~~~~~~~~~~g~v~~~~~~~-~~~~~~~~--~~---------------~pNGi~~s~dg~~lyv~ds~~  155 (246)
T PF08450_consen   94 DPDGNLYVTDSGGGGASGIDPGSVYRIDPDG-KVTVVADG--LG---------------FPNGIAFSPDGKTLYVADSFN  155 (246)
T ss_dssp             -TTS-EEEEEECCBCTTCGGSEEEEEEETTS-EEEEEEEE--ES---------------SEEEEEEETTSSEEEEEETTT
T ss_pred             cCCCCEEEEecCCCccccccccceEEECCCC-eEEEEecC--cc---------------cccceEECCcchheeeccccc
Confidence            86 677775321         5688777663 34444321  10               123467788886 555543 4


Q ss_pred             CeEEEecC--CCcceeeEec--cccCCCeeeEEEEeecCCeEEEEe-CCCcEEEEcCCCcCcEEcccCCCcccceeEEEE
Q 036387          240 GGLFLSKG--TGITEEFEEV--PVQSRGFGILDVGYRSQDEAWAAG-GSGVLLKTTNGGKTWIREKAADNIAANLYSVKF  314 (334)
Q Consensus       240 g~i~~S~D--~G~tW~w~~~--~~~~~~~~~~~v~~~~~~~~~~~G-~~G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~  314 (334)
                      +.|++-.-  .+..+.-..+  ..+......-++++..++.+|++. ..+.|++-.-.|+--..+..+   ......++|
T Consensus       156 ~~i~~~~~~~~~~~~~~~~~~~~~~~~~g~pDG~~vD~~G~l~va~~~~~~I~~~~p~G~~~~~i~~p---~~~~t~~~f  232 (246)
T PF08450_consen  156 GRIWRFDLDADGGELSNRRVFIDFPGGPGYPDGLAVDSDGNLWVADWGGGRIVVFDPDGKLLREIELP---VPRPTNCAF  232 (246)
T ss_dssp             TEEEEEEEETTTCCEEEEEEEEE-SSSSCEEEEEEEBTTS-EEEEEETTTEEEEEETTSCEEEEEE-S---SSSEEEEEE
T ss_pred             ceeEEEeccccccceeeeeeEEEcCCCCcCCCcceEcCCCCEEEEEcCCCEEEEECCCccEEEEEcCC---CCCEEEEEE
Confidence            55665432  1221221221  122211124567777788999973 245565554448877888773   247888898


Q ss_pred             e--eCCeEEEEeC
Q 036387          315 I--NEKKGFVLGN  325 (334)
Q Consensus       315 ~--~~~~~~a~G~  325 (334)
                      .  +.+++|++..
T Consensus       233 gg~~~~~L~vTta  245 (246)
T PF08450_consen  233 GGPDGKTLYVTTA  245 (246)
T ss_dssp             ESTTSSEEEEEEB
T ss_pred             ECCCCCEEEEEeC
Confidence            5  4577888753


No 40 
>PHA03098 kelch-like protein; Provisional
Probab=85.47  E-value=43  Score=33.69  Aligned_cols=172  Identities=10%  Similarity=0.106  Sum_probs=83.8

Q ss_pred             CEEEEEEcC---C----eEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEeCCeEEEEEcC------CEEEEEcCCCCC
Q 036387          128 NHGFLLGTR---Q----TLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFKGKEGWIVGKP------AILLHTSDAGES  194 (334)
Q Consensus       128 ~~~~avG~~---g----~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~~~~~~vG~~------g~i~~S~DgG~T  194 (334)
                      +.+|++|..   +    .+++=+-.-.+|+.......   ..  ...++...++.+|++|..      ..+.+-+-...+
T Consensus       295 ~~lyv~GG~~~~~~~~~~v~~yd~~~~~W~~~~~~~~---~R--~~~~~~~~~~~lyv~GG~~~~~~~~~v~~yd~~~~~  369 (534)
T PHA03098        295 NVIYFIGGMNKNNLSVNSVVSYDTKTKSWNKVPELIY---PR--KNPGVTVFNNRIYVIGGIYNSISLNTVESWKPGESK  369 (534)
T ss_pred             CEEEEECCCcCCCCeeccEEEEeCCCCeeeECCCCCc---cc--ccceEEEECCEEEEEeCCCCCEecceEEEEcCCCCc
Confidence            578887642   1    23333334567987642111   01  112333446788887642      134444445678


Q ss_pred             eEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcC-------CeEEEecCCCcceeeEecc-ccCCCeee
Q 036387          195 WERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRG-------GGLFLSKGTGITEEFEEVP-VQSRGFGI  266 (334)
Q Consensus       195 W~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~-------g~i~~S~D~G~tW~w~~~~-~~~~~~~~  266 (334)
                      |+.++..   |... +  .+          ....-++.+|+.++.       ..+++-.-...  +|+.+. .|......
T Consensus       370 W~~~~~l---p~~r-~--~~----------~~~~~~~~iYv~GG~~~~~~~~~~v~~yd~~t~--~W~~~~~~p~~r~~~  431 (534)
T PHA03098        370 WREEPPL---IFPR-Y--NP----------CVVNVNNLIYVIGGISKNDELLKTVECFSLNTN--KWSKGSPLPISHYGG  431 (534)
T ss_pred             eeeCCCc---CcCC-c--cc----------eEEEECCEEEEECCcCCCCcccceEEEEeCCCC--eeeecCCCCccccCc
Confidence            9886532   2111 0  00          111235778887641       12333222223  456653 23211111


Q ss_pred             EEEEeecCCeEEEEeCCC---------cEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeCC
Q 036387          267 LDVGYRSQDEAWAAGGSG---------VLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGND  326 (334)
Q Consensus       267 ~~v~~~~~~~~~~~G~~G---------~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~  326 (334)
                       .+. ..++.+|++|+..         .+++-.-.-.+|+.+... +.+..-.++... ++++|++|..
T Consensus       432 -~~~-~~~~~iyv~GG~~~~~~~~~~~~v~~yd~~~~~W~~~~~~-~~~r~~~~~~~~-~~~iyv~GG~  496 (534)
T PHA03098        432 -CAI-YHDGKIYVIGGISYIDNIKVYNIVESYNPVTNKWTELSSL-NFPRINASLCIF-NNKIYVVGGD  496 (534)
T ss_pred             -eEE-EECCEEEEECCccCCCCCcccceEEEecCCCCceeeCCCC-CcccccceEEEE-CCEEEEEcCC
Confidence             222 2367899987631         255555556789998752 222222233333 6889998853


No 41 
>cd00200 WD40 WD40 domain, found in a number of eukaryotic proteins that cover a wide variety of functions including adaptor/regulatory modules in signal transduction, pre-mRNA processing and cytoskeleton assembly; typically contains a GH dipeptide 11-24 residues from its N-terminus and the WD dipeptide at its C-terminus and is 40 residues long, hence the name WD40; between GH and WD lies a conserved core; serves as a stable propeller-like platform to which proteins can bind either stably or reversibly; forms a propeller-like structure with several blades where each blade is composed of a four-stranded anti-parallel b-sheet; instances with few detectable copies are hypothesized to form larger structures by dimerization; each WD40 sequence repeat forms the first three strands of one blade and the last strand in the next blade; the last C-terminal WD40 repeat completes the blade structure of the first WD40 repeat to create the closed ring propeller-structure; residues on the top and botto
Probab=84.83  E-value=24  Score=30.28  Aligned_cols=104  Identities=14%  Similarity=0.184  Sum_probs=56.0

Q ss_pred             EeeeeEeecCCEEEEEc-CCeEEE-ecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeC-CCcEEE-EcCCCcCcE
Q 036387          222 IQNMGWRADGGLWLLVR-GGGLFL-SKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGG-SGVLLK-TTNGGKTWI  297 (334)
Q Consensus       222 i~~~~~~~~g~~~~~~~-~g~i~~-S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~-~G~i~~-S~DgG~tW~  297 (334)
                      +..+.+.+++.+++++. ++.+.. ..+.++.  .....  .....+..+.+.+.+..++++. +|.++. ....++.-+
T Consensus        96 i~~~~~~~~~~~~~~~~~~~~i~~~~~~~~~~--~~~~~--~~~~~i~~~~~~~~~~~l~~~~~~~~i~i~d~~~~~~~~  171 (289)
T cd00200          96 VSSVAFSPDGRILSSSSRDKTIKVWDVETGKC--LTTLR--GHTDWVNSVAFSPDGTFVASSSQDGTIKLWDLRTGKCVA  171 (289)
T ss_pred             EEEEEEcCCCCEEEEecCCCeEEEEECCCcEE--EEEec--cCCCcEEEEEEcCcCCEEEEEcCCCcEEEEEccccccce
Confidence            44455666666666665 555432 2222221  11111  1112467788776666777666 676533 333344333


Q ss_pred             EcccCCCcccceeEEEEeeCC-eEEEEeCCeeEEEE
Q 036387          298 REKAADNIAANLYSVKFINEK-KGFVLGNDGVLLQY  332 (334)
Q Consensus       298 ~~~~~~~~~~~l~~i~~~~~~-~~~a~G~~G~il~s  332 (334)
                      .+..   ....+..+.+.+++ .+++++.+|.+..+
T Consensus       172 ~~~~---~~~~i~~~~~~~~~~~l~~~~~~~~i~i~  204 (289)
T cd00200         172 TLTG---HTGEVNSVAFSPDGEKLLSSSSDGTIKLW  204 (289)
T ss_pred             eEec---CccccceEEECCCcCEEEEecCCCcEEEE
Confidence            3332   22478889998776 56666778876654


No 42 
>COG4946 Uncharacterized protein related to the periplasmic component of the Tol biopolymer transport system [Function unknown]
Probab=83.61  E-value=48  Score=33.03  Aligned_cols=70  Identities=21%  Similarity=0.325  Sum_probs=40.2

Q ss_pred             eeEeecCCEEEEEcC-------CeEEEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEE--------------EeCC
Q 036387          225 MGWRADGGLWLLVRG-------GGLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWA--------------AGGS  283 (334)
Q Consensus       225 ~~~~~~g~~~~~~~~-------g~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~--------------~G~~  283 (334)
                      ++|.+||.+++.+..       -.+|+-.++|.  ...++++..    ...+.+. ++.+++              .|..
T Consensus       133 aG~~~dg~iiV~TD~~tPF~q~~~lYkv~~dg~--~~e~LnlGp----athiv~~-dg~ivigRntydLP~WK~YkGGtr  205 (668)
T COG4946         133 AGWIPDGEIIVSTDFHTPFSQWTELYKVNVDGI--KTEPLNLGP----ATHIVIK-DGIIVIGRNTYDLPHWKGYKGGTR  205 (668)
T ss_pred             eccCCCCCEEEEeccCCCcccceeeeEEccCCc--eeeeccCCc----eeeEEEe-CCEEEEccCcccCcccccccCCcc
Confidence            345667776655432       23565555544  135555432    2233333 334433              2446


Q ss_pred             CcEEEEcCCCcCcEEccc
Q 036387          284 GVLLKTTNGGKTWIREKA  301 (334)
Q Consensus       284 G~i~~S~DgG~tW~~~~~  301 (334)
                      |.||.|+|+|++++++-.
T Consensus       206 GklWis~d~g~tFeK~vd  223 (668)
T COG4946         206 GKLWISSDGGKTFEKFVD  223 (668)
T ss_pred             ceEEEEecCCcceeeeee
Confidence            899999999999999755


No 43 
>PHA02713 hypothetical protein; Provisional
Probab=82.25  E-value=62  Score=33.05  Aligned_cols=152  Identities=9%  Similarity=-0.029  Sum_probs=74.0

Q ss_pred             CcCeEeCcC-CCCcccCcceeEEEEEEeCCeEEEEEcC-------CEEEEEcCCCCCeEEeecCCCCCCCcccccccCcc
Q 036387          146 GKTWAPRSI-PSAEEEDFNYRFNSISFKGKEGWIVGKP-------AILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRA  217 (334)
Q Consensus       146 G~TW~~~~~-p~~~~~~~~~~~~~I~~~~~~~~~vG~~-------g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~  217 (334)
                      -.+|..+.. |...      .-.++...++.+|++|..       ..+++-+=.-.+|+.++.   ++.....       
T Consensus       281 ~~~W~~l~~mp~~r------~~~~~a~l~~~IYviGG~~~~~~~~~~v~~Yd~~~n~W~~~~~---m~~~R~~-------  344 (557)
T PHA02713        281 TMEYSVISTIPNHI------INYASAIVDNEIIIAGGYNFNNPSLNKVYKINIENKIHVELPP---MIKNRCR-------  344 (557)
T ss_pred             CCeEEECCCCCccc------cceEEEEECCEEEEEcCCCCCCCccceEEEEECCCCeEeeCCC---Ccchhhc-------
Confidence            346887642 2211      112344457889988652       124333334457887653   2211100       


Q ss_pred             ccceEeeeeEeecCCEEEEEcCC------eEEEecCCCcceeeEecc-ccCCCeeeEEEEeecCCeEEEEeCCC------
Q 036387          218 VARRIQNMGWRADGGLWLLVRGG------GLFLSKGTGITEEFEEVP-VQSRGFGILDVGYRSQDEAWAAGGSG------  284 (334)
Q Consensus       218 ~~~~i~~~~~~~~g~~~~~~~~g------~i~~S~D~G~tW~w~~~~-~~~~~~~~~~v~~~~~~~~~~~G~~G------  284 (334)
                            .....-++.+|+.|+..      .+.+-.-.-.  +|..++ .+......-.+.  -++.+|++|+..      
T Consensus       345 ------~~~~~~~g~IYviGG~~~~~~~~sve~Ydp~~~--~W~~~~~mp~~r~~~~~~~--~~g~IYviGG~~~~~~~~  414 (557)
T PHA02713        345 ------FSLAVIDDTIYAIGGQNGTNVERTIECYTMGDD--KWKMLPDMPIALSSYGMCV--LDQYIYIIGGRTEHIDYT  414 (557)
T ss_pred             ------eeEEEECCEEEEECCcCCCCCCceEEEEECCCC--eEEECCCCCcccccccEEE--ECCEEEEEeCCCcccccc
Confidence                  01113467888887532      1222222223  356653 232111122222  268899987631      


Q ss_pred             ------------------cEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeC
Q 036387          285 ------------------VLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGN  325 (334)
Q Consensus       285 ------------------~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~  325 (334)
                                        .+++-.-.-++|+.++.. +......+++.. ++.+|++|.
T Consensus       415 ~~~~~~~~~~~~~~~~~~~ve~YDP~td~W~~v~~m-~~~r~~~~~~~~-~~~IYv~GG  471 (557)
T PHA02713        415 SVHHMNSIDMEEDTHSSNKVIRYDTVNNIWETLPNF-WTGTIRPGVVSH-KDDIYVVCD  471 (557)
T ss_pred             cccccccccccccccccceEEEECCCCCeEeecCCC-CcccccCcEEEE-CCEEEEEeC
Confidence                              233333344679988752 223333445444 679999985


No 44 
>PHA03098 kelch-like protein; Provisional
Probab=80.30  E-value=68  Score=32.24  Aligned_cols=178  Identities=12%  Similarity=0.146  Sum_probs=85.7

Q ss_pred             eEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCC------eEEEEcCCCcCeEeCcC-CCCcccCcceeE
Q 036387           94 PAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQ------TLLETKDGGKTWAPRSI-PSAEEEDFNYRF  166 (334)
Q Consensus        94 i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g------~i~~S~DgG~TW~~~~~-p~~~~~~~~~~~  166 (334)
                      +++=+-...+|+.+.....+.. ..+++..  + +.+|++|...      .+.+=.-...+|+.... |...     .. 
T Consensus       313 v~~yd~~~~~W~~~~~~~~~R~-~~~~~~~--~-~~lyv~GG~~~~~~~~~v~~yd~~~~~W~~~~~lp~~r-----~~-  382 (534)
T PHA03098        313 VVSYDTKTKSWNKVPELIYPRK-NPGVTVF--N-NRIYVIGGIYNSISLNTVESWKPGESKWREEPPLIFPR-----YN-  382 (534)
T ss_pred             EEEEeCCCCeeeECCCCCcccc-cceEEEE--C-CEEEEEeCCCCCEecceEEEEcCCCCceeeCCCcCcCC-----cc-
Confidence            3333334567988753222222 2334443  2 6788887532      23332334678997642 2211     11 


Q ss_pred             EEEEEeCCeEEEEEcC-------CEEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcC
Q 036387          167 NSISFKGKEGWIVGKP-------AILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRG  239 (334)
Q Consensus       167 ~~I~~~~~~~~~vG~~-------g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~  239 (334)
                      .++...++.+|++|..       ..+++-+=.-.+|+.+...   |... +  .+          .....++.+|+.++.
T Consensus       383 ~~~~~~~~~iYv~GG~~~~~~~~~~v~~yd~~t~~W~~~~~~---p~~r-~--~~----------~~~~~~~~iyv~GG~  446 (534)
T PHA03098        383 PCVVNVNNLIYVIGGISKNDELLKTVECFSLNTNKWSKGSPL---PISH-Y--GG----------CAIYHDGKIYVIGGI  446 (534)
T ss_pred             ceEEEECCEEEEECCcCCCCcccceEEEEeCCCCeeeecCCC---Cccc-c--Cc----------eEEEECCEEEEECCc
Confidence            1233456788887641       2344434345679887532   2111 0  00          111235678877642


Q ss_pred             C---------eEEEecCCCcceeeEeccc-cCCCeeeEEEEeecCCeEEEEeCC------CcEEEEcCCCcCcEEccc
Q 036387          240 G---------GLFLSKGTGITEEFEEVPV-QSRGFGILDVGYRSQDEAWAAGGS------GVLLKTTNGGKTWIREKA  301 (334)
Q Consensus       240 g---------~i~~S~D~G~tW~w~~~~~-~~~~~~~~~v~~~~~~~~~~~G~~------G~i~~S~DgG~tW~~~~~  301 (334)
                      .         .+++-...-.  +|+.++. +........+.+  ++.+|++|+.      ..++.-.-..+.|+.+..
T Consensus       447 ~~~~~~~~~~~v~~yd~~~~--~W~~~~~~~~~r~~~~~~~~--~~~iyv~GG~~~~~~~~~v~~yd~~~~~W~~~~~  520 (534)
T PHA03098        447 SYIDNIKVYNIVESYNPVTN--KWTELSSLNFPRINASLCIF--NNKIYVVGGDKYEYYINEIEVYDDKTNTWTLFCK  520 (534)
T ss_pred             cCCCCCcccceEEEecCCCC--ceeeCCCCCcccccceEEEE--CCEEEEEcCCcCCcccceeEEEeCCCCEEEecCC
Confidence            1         1333333333  4566542 211111122222  6789998763      245555545668998876


No 45 
>KOG0296 consensus Angio-associated migratory cell protein (contains WD40 repeats) [Function unknown]
Probab=80.17  E-value=39  Score=32.33  Aligned_cols=100  Identities=16%  Similarity=0.219  Sum_probs=62.1

Q ss_pred             eeeEeecCCEEEEEcC---CeEEEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeC-CCc--EEEEcCCCcCcE
Q 036387          224 NMGWRADGGLWLLVRG---GGLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGG-SGV--LLKTTNGGKTWI  297 (334)
Q Consensus       224 ~~~~~~~g~~~~~~~~---g~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~-~G~--i~~S~DgG~tW~  297 (334)
                      .+...|+..+.+++..   +-+|++.++-  |-.+...-   .-++..+.|..++..+|.|+ +|.  ||+..-++.-|+
T Consensus        69 avsl~P~~~l~aTGGgDD~AflW~~~~ge--~~~eltgH---KDSVt~~~FshdgtlLATGdmsG~v~v~~~stg~~~~~  143 (399)
T KOG0296|consen   69 AVSLHPNNNLVATGGGDDLAFLWDISTGE--FAGELTGH---KDSVTCCSFSHDGTLLATGDMSGKVLVFKVSTGGEQWK  143 (399)
T ss_pred             EEEeCCCCceEEecCCCceEEEEEccCCc--ceeEecCC---CCceEEEEEccCceEEEecCCCccEEEEEcccCceEEE
Confidence            4455665555554422   2356666553  22222221   12578899988888888765 665  467777888888


Q ss_pred             EcccCCCcccceeEEEEeeCCeEEEEe-CCeeEEEE
Q 036387          298 REKAADNIAANLYSVKFINEKKGFVLG-NDGVLLQY  332 (334)
Q Consensus       298 ~~~~~~~~~~~l~~i~~~~~~~~~a~G-~~G~il~s  332 (334)
                      ....    -..+--+.+.+..+++++| .+|.+..+
T Consensus       144 ~~~e----~~dieWl~WHp~a~illAG~~DGsvWmw  175 (399)
T KOG0296|consen  144 LDQE----VEDIEWLKWHPRAHILLAGSTDGSVWMW  175 (399)
T ss_pred             eecc----cCceEEEEecccccEEEeecCCCcEEEE
Confidence            8743    2467777777878887776 67766543


No 46 
>KOG1523 consensus Actin-related protein Arp2/3 complex, subunit ARPC1/p41-ARC [Cytoskeleton]
Probab=79.41  E-value=47  Score=31.36  Aligned_cols=142  Identities=13%  Similarity=0.215  Sum_probs=76.9

Q ss_pred             EEEEEEe-CCeEEEEEcCC--EEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecC-CEEEEEcC-C
Q 036387          166 FNSISFK-GKEGWIVGKPA--ILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADG-GLWLLVRG-G  240 (334)
Q Consensus       166 ~~~I~~~-~~~~~~vG~~g--~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g-~~~~~~~~-g  240 (334)
                      +++.++. +...++++.+.  .-.++.++.+-|+...+..+          |..    .++.+.+.+.. +|+-...+ +
T Consensus        13 itchAwn~drt~iAv~~~~~evhiy~~~~~~~w~~~htls~----------Hd~----~vtgvdWap~snrIvtcs~drn   78 (361)
T KOG1523|consen   13 ITCHAWNSDRTQIAVSPNNHEVHIYSMLGADLWEPAHTLSE----------HDK----IVTGVDWAPKSNRIVTCSHDRN   78 (361)
T ss_pred             eeeeeecCCCceEEeccCCceEEEEEecCCCCceeceehhh----------hCc----ceeEEeecCCCCceeEccCCCC
Confidence            4556665 46777776433  33344556666999876421          110    12234444433 44444433 2


Q ss_pred             eEEEec-CCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeCCCcE--EEEcCCCcCc---EEcccCCCcccceeEEEE
Q 036387          241 GLFLSK-GTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVL--LKTTNGGKTW---IREKAADNIAANLYSVKF  314 (334)
Q Consensus       241 ~i~~S~-D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i--~~S~DgG~tW---~~~~~~~~~~~~l~~i~~  314 (334)
                      ....+. ++| +|.-+.+-+... .....|...+...-|++|..+.+  .-.-.+.+.|   +.+..  +...++.++++
T Consensus        79 ayVw~~~~~~-~WkptlvLlRiN-rAAt~V~WsP~enkFAVgSgar~isVcy~E~ENdWWVsKhikk--PirStv~sldW  154 (361)
T KOG1523|consen   79 AYVWTQPSGG-TWKPTLVLLRIN-RAATCVKWSPKENKFAVGSGARLISVCYYEQENDWWVSKHIKK--PIRSTVTSLDW  154 (361)
T ss_pred             ccccccCCCC-eeccceeEEEec-cceeeEeecCcCceEEeccCccEEEEEEEecccceehhhhhCC--ccccceeeeec
Confidence            333444 444 443222222211 13456666666677888776532  1112345668   33444  55688999999


Q ss_pred             eeCCeEEEEeC
Q 036387          315 INEKKGFVLGN  325 (334)
Q Consensus       315 ~~~~~~~a~G~  325 (334)
                      .+++-+.++|.
T Consensus       155 hpnnVLlaaGs  165 (361)
T KOG1523|consen  155 HPNNVLLAAGS  165 (361)
T ss_pred             cCCcceecccc
Confidence            99998999886


No 47 
>TIGR03547 muta_rot_YjhT mutatrotase, YjhT family. Members of this protein family contain multiple copies of the beta-propeller-forming Kelch repeat. All are full-length homologs to YjhT of Escherichia coli, which has been identified as a mutarotase for sialic acid. This protein improves bacterial ability to obtain host sialic acid, and thus serves as a virulence factor. Some bacteria carry what appears to be a cyclically permuted homolog of this protein.
Probab=76.99  E-value=66  Score=30.24  Aligned_cols=76  Identities=13%  Similarity=0.250  Sum_probs=37.7

Q ss_pred             CCCCCcEEccc-CCCCCeeeEEEEEecCCCCEEEEEEcCC------------eEEEEcCCCcCeEeCcCCCCcccCccee
Q 036387           99 EALSAWERVYI-PVDPGVVLLDIAFVPDDLNHGFLLGTRQ------------TLLETKDGGKTWAPRSIPSAEEEDFNYR  165 (334)
Q Consensus        99 DgG~tW~~~~~-p~~~~~~l~~I~~~p~d~~~~~avG~~g------------~i~~S~DgG~TW~~~~~p~~~~~~~~~~  165 (334)
                      +..++|+.+.. |..+.. ...++..  + +.+|++|...            .+++=+=.-.+|+++..+....   .+.
T Consensus        38 ~~~~~W~~l~~~p~~~R~-~~~~~~~--~-~~iYv~GG~~~~~~~~~~~~~~~v~~Yd~~~~~W~~~~~~~p~~---~~~  110 (346)
T TIGR03547        38 KPSKGWQKIADFPGGPRN-QAVAAAI--D-GKLYVFGGIGKANSEGSPQVFDDVYRYDPKKNSWQKLDTRSPVG---LLG  110 (346)
T ss_pred             CCCCCceECCCCCCCCcc-cceEEEE--C-CEEEEEeCCCCCCCCCcceecccEEEEECCCCEEecCCCCCCCc---ccc
Confidence            45678998764 222222 2334444  2 6789887531            1222122356799875322110   011


Q ss_pred             EEEEEEeCCeEEEEEc
Q 036387          166 FNSISFKGKEGWIVGK  181 (334)
Q Consensus       166 ~~~I~~~~~~~~~vG~  181 (334)
                      ...+...++.+|++|.
T Consensus       111 ~~~~~~~~g~IYviGG  126 (346)
T TIGR03547       111 ASGFSLHNGQAYFTGG  126 (346)
T ss_pred             eeEEEEeCCEEEEEcC
Confidence            1122235788998864


No 48 
>TIGR03548 mutarot_permut cyclically-permuted mutatrotase family protein. Members of this protein family show essentially full-length homology, cyclically permuted, to YjhT from Escherichia coli. YjhT was shown to act as a mutarotase for sialic acid, and by this ability to be able to act as a virulence factor. Members of the YjhT family (TIGR03547) and this cyclically-permuted family have multiple repeats of the beta-propeller-forming Kelch repeat.
Probab=75.96  E-value=68  Score=29.88  Aligned_cols=30  Identities=13%  Similarity=0.242  Sum_probs=18.5

Q ss_pred             EEeCCeEEEEEcC------CEEEEEcCCCCCeEEee
Q 036387          170 SFKGKEGWIVGKP------AILLHTSDAGESWERIP  199 (334)
Q Consensus       170 ~~~~~~~~~vG~~------g~i~~S~DgG~TW~~~~  199 (334)
                      ...++.+|+.|..      ..+++-+=.-.+|+.++
T Consensus       120 ~~~~~~iYv~GG~~~~~~~~~v~~yd~~~~~W~~~~  155 (323)
T TIGR03548       120 CYKDGTLYVGGGNRNGKPSNKSYLFNLETQEWFELP  155 (323)
T ss_pred             EEECCEEEEEeCcCCCccCceEEEEcCCCCCeeECC
Confidence            3456788887642      24444444456899876


No 49 
>KOG1274 consensus WD40 repeat protein [General function prediction only]
Probab=74.24  E-value=1.3e+02  Score=32.31  Aligned_cols=186  Identities=15%  Similarity=0.084  Sum_probs=94.3

Q ss_pred             eeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcC---CCCcccCcceeEEEEEEeCCeEEEEEcCCEE-EEEcCC
Q 036387          116 VLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSI---PSAEEEDFNYRFNSISFKGKEGWIVGKPAIL-LHTSDA  191 (334)
Q Consensus       116 ~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~---p~~~~~~~~~~~~~I~~~~~~~~~vG~~g~i-~~S~Dg  191 (334)
                      .++.|.++| +.+.++.+|.+|.|.+       |+....   |..-.. .+-.+.+|....+++....+.+.| .++-|.
T Consensus        15 G~t~i~~d~-~gefi~tcgsdg~ir~-------~~~~sd~e~P~ti~~-~g~~v~~ia~~s~~f~~~s~~~tv~~y~fps   85 (933)
T KOG1274|consen   15 GLTLICYDP-DGEFICTCGSDGDIRK-------WKTNSDEEEPETIDI-SGELVSSIACYSNHFLTGSEQNTVLRYKFPS   85 (933)
T ss_pred             ceEEEEEcC-CCCEEEEecCCCceEE-------eecCCcccCCchhhc-cCceeEEEeecccceEEeeccceEEEeeCCC
Confidence            478899988 5678888899998766       433322   211100 011344444433333333333322 223333


Q ss_pred             CCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCC---eEEEecCCCcceeeEeccccCCCeeeEE
Q 036387          192 GESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGG---GLFLSKGTGITEEFEEVPVQSRGFGILD  268 (334)
Q Consensus       192 G~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g---~i~~S~D~G~tW~w~~~~~~~~~~~~~~  268 (334)
                      |..=+.+.         .|-        ..+..+.+..+|...+++.+.   .+..+.|.++-  ..-.+..   ..+..
T Consensus        86 ~~~~~iL~---------Rft--------lp~r~~~v~g~g~~iaagsdD~~vK~~~~~D~s~~--~~lrgh~---apVl~  143 (933)
T KOG1274|consen   86 GEEDTILA---------RFT--------LPIRDLAVSGSGKMIAAGSDDTAVKLLNLDDSSQE--KVLRGHD---APVLQ  143 (933)
T ss_pred             CCccceee---------eee--------ccceEEEEecCCcEEEeecCceeEEEEeccccchh--eeecccC---Cceee
Confidence            32211111         010        123445666667666665443   34556666541  1111211   25788


Q ss_pred             EEeecCCeEEEEe-CCCcE--EEEcCCC--cCcEEcccC-CCc-ccceeEEEEeeC-CeEEEEeCCeeEEEE
Q 036387          269 VGYRSQDEAWAAG-GSGVL--LKTTNGG--KTWIREKAA-DNI-AANLYSVKFINE-KKGFVLGNDGVLLQY  332 (334)
Q Consensus       269 v~~~~~~~~~~~G-~~G~i--~~S~DgG--~tW~~~~~~-~~~-~~~l~~i~~~~~-~~~~a~G~~G~il~s  332 (334)
                      +.|.+.+.++|+. .+|.|  |-..|+-  ++|..+... +.. .+.+..+++.++ +++.+.+-++.+..+
T Consensus       144 l~~~p~~~fLAvss~dG~v~iw~~~~~~~~~tl~~v~k~n~~~~s~i~~~~aW~Pk~g~la~~~~d~~Vkvy  215 (933)
T KOG1274|consen  144 LSYDPKGNFLAVSSCDGKVQIWDLQDGILSKTLTGVDKDNEFILSRICTRLAWHPKGGTLAVPPVDNTVKVY  215 (933)
T ss_pred             eeEcCCCCEEEEEecCceEEEEEcccchhhhhcccCCccccccccceeeeeeecCCCCeEEeeccCCeEEEE
Confidence            9998888877763 36654  4333432  355555432 112 345667788875 777777877765443


No 50 
>KOG2055 consensus WD40 repeat protein [General function prediction only]
Probab=73.25  E-value=1e+02  Score=30.59  Aligned_cols=193  Identities=14%  Similarity=0.152  Sum_probs=90.4

Q ss_pred             eeeEEEEEecCCCCEEEEEEcCCe--EEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEeC-Ce-EEEEEcCCEEEEEcC
Q 036387          115 VVLLDIAFVPDDLNHGFLLGTRQT--LLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFKG-KE-GWIVGKPAILLHTSD  190 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG~~g~--i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~-~~-~~~vG~~g~i~~S~D  190 (334)
                      ..+++|.|.| ....++++|-++.  ||+ .| |++=..+..-..    ..+.+....|.+ ++ ..+.+..-..|++=|
T Consensus       214 ~~I~sv~FHp-~~plllvaG~d~~lrifq-vD-Gk~N~~lqS~~l----~~fPi~~a~f~p~G~~~i~~s~rrky~ysyD  286 (514)
T KOG2055|consen  214 GGITSVQFHP-TAPLLLVAGLDGTLRIFQ-VD-GKVNPKLQSIHL----EKFPIQKAEFAPNGHSVIFTSGRRKYLYSYD  286 (514)
T ss_pred             CCceEEEecC-CCceEEEecCCCcEEEEE-ec-CccChhheeeee----ccCccceeeecCCCceEEEecccceEEEEee
Confidence            6799999998 5566677777775  443 66 443222211000    012344455554 33 444444444556554


Q ss_pred             C-CCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCC-EEEEEcCCeEEEecCCCcceee-EeccccCCCeeeE
Q 036387          191 A-GESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGG-LWLLVRGGGLFLSKGTGITEEF-EEVPVQSRGFGIL  267 (334)
Q Consensus       191 g-G~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~-~~~~~~~g~i~~S~D~G~tW~w-~~~~~~~~~~~~~  267 (334)
                      = -..-+++..+.   |-     .     ...+....+++++. +.+++..|.|+.-.---.  +| ....++.   .+.
T Consensus       287 le~ak~~k~~~~~---g~-----e-----~~~~e~FeVShd~~fia~~G~~G~I~lLhakT~--eli~s~KieG---~v~  348 (514)
T KOG2055|consen  287 LETAKVTKLKPPY---GV-----E-----EKSMERFEVSHDSNFIAIAGNNGHIHLLHAKTK--ELITSFKIEG---VVS  348 (514)
T ss_pred             ccccccccccCCC---Cc-----c-----cchhheeEecCCCCeEEEcccCceEEeehhhhh--hhhheeeecc---EEe
Confidence            3 11112221111   10     0     01122233455665 444566676653322111  11 1222332   355


Q ss_pred             EEEeec-CCeEEEEeCCCcEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEe-CCeeEEEEc
Q 036387          268 DVGYRS-QDEAWAAGGSGVLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLG-NDGVLLQYL  333 (334)
Q Consensus       268 ~v~~~~-~~~~~~~G~~G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G-~~G~il~s~  333 (334)
                      ++.|.. ...+|++|.+|.||+-.=+-.+=...-..+ ..-+=.+++.+.++..+|+| +.|++-.|+
T Consensus       349 ~~~fsSdsk~l~~~~~~GeV~v~nl~~~~~~~rf~D~-G~v~gts~~~S~ng~ylA~GS~~GiVNIYd  415 (514)
T KOG2055|consen  349 DFTFSSDSKELLASGGTGEVYVWNLRQNSCLHRFVDD-GSVHGTSLCISLNGSYLATGSDSGIVNIYD  415 (514)
T ss_pred             eEEEecCCcEEEEEcCCceEEEEecCCcceEEEEeec-CccceeeeeecCCCceEEeccCcceEEEec
Confidence            666664 457888888888775422111111111111 11233455555678899998 556654544


No 51 
>PF07995 GSDH:  Glucose / Sorbosone dehydrogenase;  InterPro: IPR012938 Proteins containing this domain are thought to be glucose/sorbosone dehydrogenases. The best characterised of these proteins is soluble glucose dehydrogenase (P13650 from SWISSPROT) from Acinetobacter calcoaceticus, which oxidises glucose to gluconolactone. The enzyme is a calcium-dependent homodimer which uses PQQ as a cofactor [].; GO: 0016901 oxidoreductase activity, acting on the CH-OH group of donors, quinone or similar compound as acceptor, 0048038 quinone binding, 0005975 carbohydrate metabolic process; PDB: 2ISM_A 2WG3_D 3HO5_A 3HO4_A 3HO3_A 2WFT_A 2WG4_B 2WFX_B 1CRU_A 1CQ1_B ....
Probab=72.51  E-value=53  Score=31.06  Aligned_cols=100  Identities=17%  Similarity=0.229  Sum_probs=53.1

Q ss_pred             eeeEeecCCEEEEEcCCeEEEecCCCcce-eeEecc-cc-CCCeeeEEEEeec----CCeEEEEeCC---------CcEE
Q 036387          224 NMGWRADGGLWLLVRGGGLFLSKGTGITE-EFEEVP-VQ-SRGFGILDVGYRS----QDEAWAAGGS---------GVLL  287 (334)
Q Consensus       224 ~~~~~~~g~~~~~~~~g~i~~S~D~G~tW-~w~~~~-~~-~~~~~~~~v~~~~----~~~~~~~G~~---------G~i~  287 (334)
                      .|++.+++.+|++...|.|++-...|..- ....++ +. ....+++++++.+    .+.+|++...         -.|+
T Consensus         6 ~~a~~pdG~l~v~e~~G~i~~~~~~g~~~~~v~~~~~v~~~~~~gllgia~~p~f~~n~~lYv~~t~~~~~~~~~~~~v~   85 (331)
T PF07995_consen    6 SMAFLPDGRLLVAERSGRIWVVDKDGSLKTPVADLPEVFADGERGLLGIAFHPDFASNGYLYVYYTNADEDGGDNDNRVV   85 (331)
T ss_dssp             EEEEETTSCEEEEETTTEEEEEETTTEECEEEEE-TTTBTSTTBSEEEEEE-TTCCCC-EEEEEEEEE-TSSSSEEEEEE
T ss_pred             EEEEeCCCcEEEEeCCceEEEEeCCCcCcceecccccccccccCCcccceeccccCCCCEEEEEEEcccCCCCCcceeeE
Confidence            47778899999988889888877555421 112221 11 1234788998876    3788887542         1344


Q ss_pred             EEcCCC--cCcEE---ccc--CC--CcccceeEEEEeeCCeEEEE
Q 036387          288 KTTNGG--KTWIR---EKA--AD--NIAANLYSVKFINEKKGFVL  323 (334)
Q Consensus       288 ~S~DgG--~tW~~---~~~--~~--~~~~~l~~i~~~~~~~~~a~  323 (334)
                      |-+...  .+...   +-.  +.  .....-..|.|.+++.+|+.
T Consensus        86 r~~~~~~~~~~~~~~~l~~~~p~~~~~~H~g~~l~fgpDG~LYvs  130 (331)
T PF07995_consen   86 RFTLSDGDGDLSSEEVLVTGLPDTSSGNHNGGGLAFGPDGKLYVS  130 (331)
T ss_dssp             EEEEETTSCEEEEEEEEEEEEES-CSSSS-EEEEEE-TTSEEEEE
T ss_pred             EEeccCCccccccceEEEEEeCCCCCCCCCCccccCCCCCcEEEE
Confidence            443222  23332   211  11  11223456778777887764


No 52 
>COG4257 Vgb Streptogramin lyase [Defense mechanisms]
Probab=70.21  E-value=40  Score=31.34  Aligned_cols=100  Identities=21%  Similarity=0.243  Sum_probs=54.6

Q ss_pred             eecCCEEEEEcCCeEEEecC--CCcceeeEeccccCCCeeeEEEEeecCCeEEEEeCCCcEEEEcCCCcC--cEEcccC-
Q 036387          228 RADGGLWLLVRGGGLFLSKG--TGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVLLKTTNGGKT--WIREKAA-  302 (334)
Q Consensus       228 ~~~g~~~~~~~~g~i~~S~D--~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i~~S~DgG~t--W~~~~~~-  302 (334)
                      .+||.+|......+..---|  .|+   -...+++... .-..|...+++..|++...-.|.|- | +|+  -++...+ 
T Consensus        70 apdG~VWft~qg~gaiGhLdP~tGe---v~~ypLg~Ga-~Phgiv~gpdg~~Witd~~~aI~R~-d-pkt~evt~f~lp~  143 (353)
T COG4257          70 APDGAVWFTAQGTGAIGHLDPATGE---VETYPLGSGA-SPHGIVVGPDGSAWITDTGLAIGRL-D-PKTLEVTRFPLPL  143 (353)
T ss_pred             CCCCceEEecCccccceecCCCCCc---eEEEecCCCC-CCceEEECCCCCeeEecCcceeEEe-c-CcccceEEeeccc
Confidence            45676777654433322122  132   2334444322 2345555567777776433234333 2 222  2222221 


Q ss_pred             CCcccceeEEEEeeCCeEEEEeCCeeEEEEc
Q 036387          303 DNIAANLYSVKFINEKKGFVLGNDGVLLQYL  333 (334)
Q Consensus       303 ~~~~~~l~~i~~~~~~~~~a~G~~G~il~s~  333 (334)
                      +....++....|++.+++|.+|+.|..=|.+
T Consensus       144 ~~a~~nlet~vfD~~G~lWFt~q~G~yGrLd  174 (353)
T COG4257         144 EHADANLETAVFDPWGNLWFTGQIGAYGRLD  174 (353)
T ss_pred             ccCCCcccceeeCCCccEEEeeccccceecC
Confidence            1345789999999999999999999765554


No 53 
>KOG0318 consensus WD40 repeat stress protein/actin interacting protein [Cytoskeleton]
Probab=70.11  E-value=1.3e+02  Score=30.44  Aligned_cols=138  Identities=17%  Similarity=0.215  Sum_probs=72.9

Q ss_pred             eeEEEEEEeC-CeEEEEEcCCEEEEEc--CCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCC
Q 036387          164 YRFNSISFKG-KEGWIVGKPAILLHTS--DAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGG  240 (334)
Q Consensus       164 ~~~~~I~~~~-~~~~~vG~~g~i~~S~--DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g  240 (334)
                      ..+.++.... ++++.+|....|-+..  |+|-+=+.+.   ++..     +|        + .++...++.+.++....
T Consensus       364 nqI~~~~~~~~~~~~t~g~Dd~l~~~~~~~~~~t~~~~~---~lg~-----QP--------~-~lav~~d~~~avv~~~~  426 (603)
T KOG0318|consen  364 NQIKGMAASESGELFTIGWDDTLRVISLKDNGYTKSEVV---KLGS-----QP--------K-GLAVLSDGGTAVVACIS  426 (603)
T ss_pred             ceEEEEeecCCCcEEEEecCCeEEEEecccCccccccee---ecCC-----Cc--------e-eEEEcCCCCEEEEEecC
Confidence            3577777776 7888888776665542  2232222111   1111     11        1 23334555555554455


Q ss_pred             eEEEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEE-eCCCcE-EEEcCCCcCcEEcccCCCcccceeEEEEeeCC
Q 036387          241 GLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAA-GGSGVL-LKTTNGGKTWIREKAADNIAANLYSVKFINEK  318 (334)
Q Consensus       241 ~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~-G~~G~i-~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~  318 (334)
                      .|..-.|.+.-   ..+++.   +...+++..+++.-+++ |.+|.+ .++-.|++.=+.... ..-.+.+..|+|++++
T Consensus       427 ~iv~l~~~~~~---~~~~~~---y~~s~vAv~~~~~~vaVGG~Dgkvhvysl~g~~l~ee~~~-~~h~a~iT~vaySpd~  499 (603)
T KOG0318|consen  427 DIVLLQDQTKV---SSIPIG---YESSAVAVSPDGSEVAVGGQDGKVHVYSLSGDELKEEAKL-LEHRAAITDVAYSPDG  499 (603)
T ss_pred             cEEEEecCCcc---eeeccc---cccceEEEcCCCCEEEEecccceEEEEEecCCcccceeee-ecccCCceEEEECCCC
Confidence            55555555431   223321   23345666666655555 456766 344455443222111 1234789999999999


Q ss_pred             eEEEEeC
Q 036387          319 KGFVLGN  325 (334)
Q Consensus       319 ~~~a~G~  325 (334)
                      ..+|+|+
T Consensus       500 ~yla~~D  506 (603)
T KOG0318|consen  500 AYLAAGD  506 (603)
T ss_pred             cEEEEec
Confidence            9999885


No 54 
>cd00200 WD40 WD40 domain, found in a number of eukaryotic proteins that cover a wide variety of functions including adaptor/regulatory modules in signal transduction, pre-mRNA processing and cytoskeleton assembly; typically contains a GH dipeptide 11-24 residues from its N-terminus and the WD dipeptide at its C-terminus and is 40 residues long, hence the name WD40; between GH and WD lies a conserved core; serves as a stable propeller-like platform to which proteins can bind either stably or reversibly; forms a propeller-like structure with several blades where each blade is composed of a four-stranded anti-parallel b-sheet; instances with few detectable copies are hypothesized to form larger structures by dimerization; each WD40 sequence repeat forms the first three strands of one blade and the last strand in the next blade; the last C-terminal WD40 repeat completes the blade structure of the first WD40 repeat to create the closed ring propeller-structure; residues on the top and botto
Probab=69.62  E-value=71  Score=27.28  Aligned_cols=186  Identities=13%  Similarity=0.121  Sum_probs=88.4

Q ss_pred             eeeEEEEEecCCCCEEEEEEcCCeEEE-EcCCCcCeEeCcCCCCcccCcceeEEEEEEeC-CeEEEEEc-CCEEEEEc-C
Q 036387          115 VVLLDIAFVPDDLNHGFLLGTRQTLLE-TKDGGKTWAPRSIPSAEEEDFNYRFNSISFKG-KEGWIVGK-PAILLHTS-D  190 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG~~g~i~~-S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~-~~~~~vG~-~g~i~~S~-D  190 (334)
                      ..+..+.+.| +.+.+++++.+|.+.. ..+.++.=....  . .    ...+..+.+.+ +..++++. .+.|..-+ +
T Consensus        52 ~~i~~~~~~~-~~~~l~~~~~~~~i~i~~~~~~~~~~~~~--~-~----~~~i~~~~~~~~~~~~~~~~~~~~i~~~~~~  123 (289)
T cd00200          52 GPVRDVAASA-DGTYLASGSSDKTIRLWDLETGECVRTLT--G-H----TSYVSSVAFSPDGRILSSSSRDKTIKVWDVE  123 (289)
T ss_pred             cceeEEEECC-CCCEEEEEcCCCeEEEEEcCcccceEEEe--c-c----CCcEEEEEEcCCCCEEEEecCCCeEEEEECC
Confidence            4566888886 3346666665666432 222221111111  0 0    01466777765 45555554 55443322 1


Q ss_pred             CCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEc-CCeEEE-ecCCCcceeeEeccccCCCeeeEE
Q 036387          191 AGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVR-GGGLFL-SKGTGITEEFEEVPVQSRGFGILD  268 (334)
Q Consensus       191 gG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~-~g~i~~-S~D~G~tW~w~~~~~~~~~~~~~~  268 (334)
                      .++.-..+.             .+.    ..+..+.+.+++.+++++. ++.+.. ....++.  .......  ...+..
T Consensus       124 ~~~~~~~~~-------------~~~----~~i~~~~~~~~~~~l~~~~~~~~i~i~d~~~~~~--~~~~~~~--~~~i~~  182 (289)
T cd00200         124 TGKCLTTLR-------------GHT----DWVNSVAFSPDGTFVASSSQDGTIKLWDLRTGKC--VATLTGH--TGEVNS  182 (289)
T ss_pred             CcEEEEEec-------------cCC----CcEEEEEEcCcCCEEEEEcCCCcEEEEEcccccc--ceeEecC--ccccce
Confidence            122111111             010    1244566666666666655 555432 2222221  1111111  124667


Q ss_pred             EEeecCC-eEEEEeCCCcEEE-EcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeC-CeeEEEE
Q 036387          269 VGYRSQD-EAWAAGGSGVLLK-TTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGN-DGVLLQY  332 (334)
Q Consensus       269 v~~~~~~-~~~~~G~~G~i~~-S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~-~G~il~s  332 (334)
                      +.+.+++ .+++++.+|.+.. ....+   +.+..-......+..+.+.+++.+++++. +|.+..+
T Consensus       183 ~~~~~~~~~l~~~~~~~~i~i~d~~~~---~~~~~~~~~~~~i~~~~~~~~~~~~~~~~~~~~i~i~  246 (289)
T cd00200         183 VAFSPDGEKLLSSSSDGTIKLWDLSTG---KCLGTLRGHENGVNSVAFSPDGYLLASGSEDGTIRVW  246 (289)
T ss_pred             EEECCCcCEEEEecCCCcEEEEECCCC---ceecchhhcCCceEEEEEcCCCcEEEEEcCCCcEEEE
Confidence            7776665 5556565676532 22222   22222111234788899988788888876 7876544


No 55 
>KOG4441 consensus Proteins containing BTB/POZ and Kelch domains, involved in regulatory/signal transduction processes [Signal transduction mechanisms; General function prediction only]
Probab=69.08  E-value=1.4e+02  Score=30.62  Aligned_cols=137  Identities=13%  Similarity=0.134  Sum_probs=74.0

Q ss_pred             EEEEeCCeEEEEEcCC-------EEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCC
Q 036387          168 SISFKGKEGWIVGKPA-------ILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGG  240 (334)
Q Consensus       168 ~I~~~~~~~~~vG~~g-------~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g  240 (334)
                      .+.+.++.+|++|...       .+++-+-...+|+.++.-   .-....           . .++ .-+|.+|++++..
T Consensus       327 ~~~~~~~~lYv~GG~~~~~~~l~~ve~YD~~~~~W~~~a~M---~~~R~~-----------~-~v~-~l~g~iYavGG~d  390 (571)
T KOG4441|consen  327 GVAVLNGKLYVVGGYDSGSDRLSSVERYDPRTNQWTPVAPM---NTKRSD-----------F-GVA-VLDGKLYAVGGFD  390 (571)
T ss_pred             cEEEECCEEEEEccccCCCcccceEEEecCCCCceeccCCc---cCcccc-----------c-eeE-EECCEEEEEeccc
Confidence            4555677889886422       445555556679986632   111100           0 111 2367888887532


Q ss_pred             ------eEEEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeC-CC------cEEEEcCCCcCcEEcccCCCccc
Q 036387          241 ------GLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGG-SG------VLLKTTNGGKTWIREKAADNIAA  307 (334)
Q Consensus       241 ------~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~-~G------~i~~S~DgG~tW~~~~~~~~~~~  307 (334)
                            .+-+-......  |+.+..-.....-.+++- -.+.+|++|+ ++      .+..-.=.-++|+.++.- ....
T Consensus       391 g~~~l~svE~YDp~~~~--W~~va~m~~~r~~~gv~~-~~g~iYi~GG~~~~~~~l~sve~YDP~t~~W~~~~~M-~~~R  466 (571)
T KOG4441|consen  391 GEKSLNSVECYDPVTNK--WTPVAPMLTRRSGHGVAV-LGGKLYIIGGGDGSSNCLNSVECYDPETNTWTLIAPM-NTRR  466 (571)
T ss_pred             cccccccEEEecCCCCc--ccccCCCCcceeeeEEEE-ECCEEEEEcCcCCCccccceEEEEcCCCCceeecCCc-cccc
Confidence                  23333334443  555542211112233332 2689999976 22      233334455789999873 3445


Q ss_pred             ceeEEEEeeCCeEEEEeC
Q 036387          308 NLYSVKFINEKKGFVLGN  325 (334)
Q Consensus       308 ~l~~i~~~~~~~~~a~G~  325 (334)
                      ....++.. ++.+|++|.
T Consensus       467 ~~~g~a~~-~~~iYvvGG  483 (571)
T KOG4441|consen  467 SGFGVAVL-NGKIYVVGG  483 (571)
T ss_pred             ccceEEEE-CCEEEEECC
Confidence            55566655 678999874


No 56 
>KOG1446 consensus Histone H3 (Lys4) methyltransferase complex and RNA cleavage factor II complex, subunit SWD2 [RNA processing and modification; Chromatin structure and dynamics; Posttranslational modification, protein turnover, chaperones]
Probab=68.35  E-value=1.1e+02  Score=28.80  Aligned_cols=105  Identities=16%  Similarity=0.223  Sum_probs=57.3

Q ss_pred             eeEeecCCEEEEEcCC-e--E--EEecCCCcceeeEecccc-CCCeeeEEEEeecCCeEEEEeCCCc-E--EEEcCCCcC
Q 036387          225 MGWRADGGLWLLVRGG-G--L--FLSKGTGITEEFEEVPVQ-SRGFGILDVGYRSQDEAWAAGGSGV-L--LKTTNGGKT  295 (334)
Q Consensus       225 ~~~~~~g~~~~~~~~g-~--i--~~S~D~G~tW~w~~~~~~-~~~~~~~~v~~~~~~~~~~~G~~G~-i--~~S~DgG~t  295 (334)
                      .+++++|-+++++.+. .  +  .|+.|.|-   ++...+. ........+.|.+++..++++.... +  +-.-| |.-
T Consensus       146 ~AfDp~GLifA~~~~~~~IkLyD~Rs~dkgP---F~tf~i~~~~~~ew~~l~FS~dGK~iLlsT~~s~~~~lDAf~-G~~  221 (311)
T KOG1446|consen  146 AAFDPEGLIFALANGSELIKLYDLRSFDKGP---FTTFSITDNDEAEWTDLEFSPDGKSILLSTNASFIYLLDAFD-GTV  221 (311)
T ss_pred             eeECCCCcEEEEecCCCeEEEEEecccCCCC---ceeEccCCCCccceeeeEEcCCCCEEEEEeCCCcEEEEEccC-CcE
Confidence            4567778788777554 2  3  47888874   4554443 2222467888888777665554433 2  22223 331


Q ss_pred             cEEcccCCCcccceeEEEEeeCCeEEEEeCC-eeEEEEc
Q 036387          296 WIREKAADNIAANLYSVKFINEKKGFVLGND-GVLLQYL  333 (334)
Q Consensus       296 W~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~-G~il~s~  333 (334)
                      =+......+....--+..|.++++.+++|.+ |.|..+.
T Consensus       222 ~~tfs~~~~~~~~~~~a~ftPds~Fvl~gs~dg~i~vw~  260 (311)
T KOG1446|consen  222 KSTFSGYPNAGNLPLSATFTPDSKFVLSGSDDGTIHVWN  260 (311)
T ss_pred             eeeEeeccCCCCcceeEEECCCCcEEEEecCCCcEEEEE
Confidence            1111111011111135567789999988865 8887654


No 57 
>TIGR03547 muta_rot_YjhT mutatrotase, YjhT family. Members of this protein family contain multiple copies of the beta-propeller-forming Kelch repeat. All are full-length homologs to YjhT of Escherichia coli, which has been identified as a mutarotase for sialic acid. This protein improves bacterial ability to obtain host sialic acid, and thus serves as a virulence factor. Some bacteria carry what appears to be a cyclically permuted homolog of this protein.
Probab=68.18  E-value=1.1e+02  Score=28.81  Aligned_cols=33  Identities=6%  Similarity=0.106  Sum_probs=18.8

Q ss_pred             CcCcEEcccCCCcccceeEEEEeeCCeEEEEeCC
Q 036387          293 GKTWIREKAADNIAANLYSVKFINEKKGFVLGND  326 (334)
Q Consensus       293 G~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~  326 (334)
                      -++|+.+...........+++.. ++++|++|..
T Consensus       177 t~~W~~~~~~p~~~r~~~~~~~~-~~~iyv~GG~  209 (346)
T TIGR03547       177 TNQWRNLGENPFLGTAGSAIVHK-GNKLLLINGE  209 (346)
T ss_pred             CCceeECccCCCCcCCCceEEEE-CCEEEEEeee
Confidence            45799986521112233344443 6789998753


No 58 
>KOG0640 consensus mRNA cleavage stimulating factor complex; subunit 1 [RNA processing and modification]
Probab=66.67  E-value=33  Score=32.31  Aligned_cols=111  Identities=11%  Similarity=0.129  Sum_probs=68.7

Q ss_pred             EeeeeEeecCCEEEEEcCCeEEEecCCCcceeeEe-ccccCCCeeeEEEEeecCCeEEEEeCCCcEEEEcCCCcCcEEcc
Q 036387          222 IQNMGWRADGGLWLLVRGGGLFLSKGTGITEEFEE-VPVQSRGFGILDVGYRSQDEAWAAGGSGVLLKTTNGGKTWIREK  300 (334)
Q Consensus       222 i~~~~~~~~g~~~~~~~~g~i~~S~D~G~tW~w~~-~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i~~S~DgG~tW~~~~  300 (334)
                      ++.+.|.|...+++.+...+-.+-.|-.++- -.+ ...-..-..+.++.|.+.++.+++|.+--++|--| =+|.|-.-
T Consensus       175 vn~l~FHPre~ILiS~srD~tvKlFDfsK~s-aKrA~K~~qd~~~vrsiSfHPsGefllvgTdHp~~rlYd-v~T~Qcfv  252 (430)
T KOG0640|consen  175 VNDLDFHPRETILISGSRDNTVKLFDFSKTS-AKRAFKVFQDTEPVRSISFHPSGEFLLVGTDHPTLRLYD-VNTYQCFV  252 (430)
T ss_pred             ccceeecchhheEEeccCCCeEEEEecccHH-HHHHHHHhhccceeeeEeecCCCceEEEecCCCceeEEe-ccceeEee
Confidence            3445666666677666554444444544321 000 00111224678899999999999998766556555 45666654


Q ss_pred             cCC---CcccceeEEEEeeCCeEEEEe-CCeeEEEEcC
Q 036387          301 AAD---NIAANLYSVKFINEKKGFVLG-NDGVLLQYLG  334 (334)
Q Consensus       301 ~~~---~~~~~l~~i~~~~~~~~~a~G-~~G~il~s~~  334 (334)
                      ...   .-...+..|.+.+.+.+|+.+ .+|.|-.++|
T Consensus       253 sanPd~qht~ai~~V~Ys~t~~lYvTaSkDG~IklwDG  290 (430)
T KOG0640|consen  253 SANPDDQHTGAITQVRYSSTGSLYVTASKDGAIKLWDG  290 (430)
T ss_pred             ecCcccccccceeEEEecCCccEEEEeccCCcEEeecc
Confidence            321   223578899999999999987 6777776665


No 59 
>PF06977 SdiA-regulated:  SdiA-regulated;  InterPro: IPR009722 This entry represents a conserved region approximately 100 residues long within a number of hypothetical bacterial proteins that may be regulated by SdiA, a member of the LuxR family of transcriptional regulators []. Some proteins contain the IPR001258 from INTERPRO repeat.; PDB: 3QQZ_A.
Probab=66.35  E-value=43  Score=30.51  Aligned_cols=72  Identities=19%  Similarity=0.265  Sum_probs=39.9

Q ss_pred             eeeEEEEEecCCCCEEEEEEcCC-eEEEEcCCCcCeEeCcCCCCccc--CcceeEEEEEEeC-CeEEEEEcCCEEEE
Q 036387          115 VVLLDIAFVPDDLNHGFLLGTRQ-TLLETKDGGKTWAPRSIPSAEEE--DFNYRFNSISFKG-KEGWIVGKPAILLH  187 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG~~g-~i~~S~DgG~TW~~~~~p~~~~~--~~~~~~~~I~~~~-~~~~~vG~~g~i~~  187 (334)
                      ..+.+++++| ..+++|+..+.. .|+..+..|+--....+.....+  ..-.+-.+|+|++ +++|++++++.+|+
T Consensus       171 ~d~S~l~~~p-~t~~lliLS~es~~l~~~d~~G~~~~~~~L~~g~~gl~~~~~QpEGIa~d~~G~LYIvsEpNlfy~  246 (248)
T PF06977_consen  171 RDLSGLSYDP-RTGHLLILSDESRLLLELDRQGRVVSSLSLDRGFHGLSKDIPQPEGIAFDPDGNLYIVSEPNLFYR  246 (248)
T ss_dssp             S---EEEEET-TTTEEEEEETTTTEEEEE-TT--EEEEEE-STTGGG-SS---SEEEEEE-TT--EEEEETTTEEEE
T ss_pred             ccccceEEcC-CCCeEEEEECCCCeEEEECCCCCEEEEEEeCCcccCcccccCCccEEEECCCCCEEEEcCCceEEE
Confidence            4577899988 467888887654 57777777775554444332110  0011356889985 89999999997765


No 60 
>PRK14131 N-acetylneuraminic acid mutarotase; Provisional
Probab=66.03  E-value=1.3e+02  Score=28.88  Aligned_cols=33  Identities=9%  Similarity=0.159  Sum_probs=19.1

Q ss_pred             CCcCcEEcccCCCcccceeEEEEeeCCeEEEEeC
Q 036387          292 GGKTWIREKAADNIAANLYSVKFINEKKGFVLGN  325 (334)
Q Consensus       292 gG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~  325 (334)
                      .-++|+.+.........-.++... ++++|++|.
T Consensus       197 ~t~~W~~~~~~p~~~~~~~a~v~~-~~~iYv~GG  229 (376)
T PRK14131        197 STNQWKNAGESPFLGTAGSAVVIK-GNKLWLING  229 (376)
T ss_pred             CCCeeeECCcCCCCCCCcceEEEE-CCEEEEEee
Confidence            346799886531112333455444 678999875


No 61 
>KOG0289 consensus mRNA splicing factor [General function prediction only]
Probab=65.85  E-value=1.4e+02  Score=29.40  Aligned_cols=149  Identities=13%  Similarity=0.234  Sum_probs=79.6

Q ss_pred             eEEEEEEeC-CeEEEEEcCCEEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEE--cCCe
Q 036387          165 RFNSISFKG-KEGWIVGKPAILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLV--RGGG  241 (334)
Q Consensus       165 ~~~~I~~~~-~~~~~vG~~g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~--~~g~  241 (334)
                      .+++..|++ +-+|..|...++++=      |..-...     +.+-+..|.    ..|..+.|.. ++.|+++  +++.
T Consensus       349 ~~ts~~fHpDgLifgtgt~d~~vki------wdlks~~-----~~a~Fpght----~~vk~i~FsE-NGY~Lat~add~~  412 (506)
T KOG0289|consen  349 EYTSAAFHPDGLIFGTGTPDGVVKI------WDLKSQT-----NVAKFPGHT----GPVKAISFSE-NGYWLATAADDGS  412 (506)
T ss_pred             eeEEeeEcCCceEEeccCCCceEEE------EEcCCcc-----ccccCCCCC----CceeEEEecc-CceEEEEEecCCe
Confidence            467778886 556666765555442      3322111     111111222    1355666654 4455443  2332


Q ss_pred             EEEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEE-eCCCcEEEEcCCCcCcEEcccCCCcc-cceeEEEEeeCCe
Q 036387          242 LFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAA-GGSGVLLKTTNGGKTWIREKAADNIA-ANLYSVKFINEKK  319 (334)
Q Consensus       242 i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~-G~~G~i~~S~DgG~tW~~~~~~~~~~-~~l~~i~~~~~~~  319 (334)
                      |. --|--+.-.+..+.++. .+.+.++.|+..+..+++ |.+=.||...-.-++|+.+..- ... ..-..+.|...-+
T Consensus       413 V~-lwDLRKl~n~kt~~l~~-~~~v~s~~fD~SGt~L~~~g~~l~Vy~~~k~~k~W~~~~~~-~~~sg~st~v~Fg~~aq  489 (506)
T KOG0289|consen  413 VK-LWDLRKLKNFKTIQLDE-KKEVNSLSFDQSGTYLGIAGSDLQVYICKKKTKSWTEIKEL-ADHSGLSTGVRFGEHAQ  489 (506)
T ss_pred             EE-EEEehhhcccceeeccc-cccceeEEEcCCCCeEEeecceeEEEEEecccccceeeehh-hhcccccceeeecccce
Confidence            21 11111100123333333 235677888766665554 5556788888778899999762 122 2455778876667


Q ss_pred             EEEEeCCeeEEEE
Q 036387          320 GFVLGNDGVLLQY  332 (334)
Q Consensus       320 ~~a~G~~G~il~s  332 (334)
                      .++.|..+.+||.
T Consensus       490 ~l~s~smd~~l~~  502 (506)
T KOG0289|consen  490 YLASTSMDAILRL  502 (506)
T ss_pred             EEeeccchhheEE
Confidence            7788888887764


No 62 
>TIGR02604 Piru_Ver_Nterm putative membrane-bound dehydrogenase domain. All proteins that score above the trusted cutoff score of 45 to this model are large proteins of either Pirellula sp. 1 or Verrucomicrobium spinosum. These proteins all contain, in addition to this domain, several hundred residues of highly variable sequence, and then a well-conserved C-terminal domain (TIGR02603) that features a putative cytochrome c-type heme binding motif CXXCH. The membrane-bound L-sorbosone dehydrogenase from Acetobacter liquefaciens (Gluconacetobacter liquefaciens) is homologous to this domain but lacks additional sequence regions shared by members of this family and belongs to a different clade of the larger family of homologs. It and its closely related homologs are excluded from the this model by scoring between the trusted (45) and noise (18) cutoffs.
Probab=64.38  E-value=1.4e+02  Score=28.63  Aligned_cols=57  Identities=14%  Similarity=0.130  Sum_probs=35.2

Q ss_pred             eEEEEeecCCeEEEE-eC-------------------CCcEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeC
Q 036387          266 ILDVGYRSQDEAWAA-GG-------------------SGVLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGN  325 (334)
Q Consensus       266 ~~~v~~~~~~~~~~~-G~-------------------~G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~  325 (334)
                      ...+.+.+++.+|++ |.                   .|.+|+-.-+|...+.+..  + ..+-+.++|.+.+++|++-+
T Consensus       126 ~~~l~~gpDG~LYv~~G~~~~~~~~~~~~~~~~~~~~~g~i~r~~pdg~~~e~~a~--G-~rnp~Gl~~d~~G~l~~tdn  202 (367)
T TIGR02604       126 LNSLAWGPDGWLYFNHGNTLASKVTRPGTSDESRQGLGGGLFRYNPDGGKLRVVAH--G-FQNPYGHSVDSWGDVFFCDN  202 (367)
T ss_pred             ccCceECCCCCEEEecccCCCceeccCCCccCcccccCceEEEEecCCCeEEEEec--C-cCCCccceECCCCCEEEEcc
Confidence            456666667777764 31                   1456665544555666655  2 35667888888888887643


No 63 
>KOG2048 consensus WD40 repeat protein [General function prediction only]
Probab=62.66  E-value=1e+02  Score=31.88  Aligned_cols=104  Identities=17%  Similarity=0.246  Sum_probs=56.7

Q ss_pred             eEeeeeEeecCCEEEEEc-CCe--EEEecCCCcceeeEec-cccCCCeeeEEEEeecCCeEEEEeCCCcEEEEcCCCcCc
Q 036387          221 RIQNMGWRADGGLWLLVR-GGG--LFLSKGTGITEEFEEV-PVQSRGFGILDVGYRSQDEAWAAGGSGVLLKTTNGGKTW  296 (334)
Q Consensus       221 ~i~~~~~~~~g~~~~~~~-~g~--i~~S~D~G~tW~w~~~-~~~~~~~~~~~v~~~~~~~~~~~G~~G~i~~S~DgG~tW  296 (334)
                      .|.++++....+.++++. +|.  ||--.   ..|--+.+ ..+.. ..+-++++.+.+++|-+|.+|.|-.- | =.+=
T Consensus        27 ~I~slA~s~kS~~lAvsRt~g~IEiwN~~---~~w~~~~vi~g~~d-rsIE~L~W~e~~RLFS~g~sg~i~Ew-D-l~~l  100 (691)
T KOG2048|consen   27 EIVSLAYSHKSNQLAVSRTDGNIEIWNLS---NNWFLEPVIHGPED-RSIESLAWAEGGRLFSSGLSGSITEW-D-LHTL  100 (691)
T ss_pred             ceEEEEEeccCCceeeeccCCcEEEEccC---CCceeeEEEecCCC-CceeeEEEccCCeEEeecCCceEEEE-e-cccC
Confidence            466677765555555442 232  22111   13421221 22222 35677888778899999888876321 0 0111


Q ss_pred             EEcccCCCcccceeEEEEeeCCeEEEEe-CCeeEE
Q 036387          297 IREKAADNIAANLYSVKFINEKKGFVLG-NDGVLL  330 (334)
Q Consensus       297 ~~~~~~~~~~~~l~~i~~~~~~~~~a~G-~~G~il  330 (334)
                      ++.-..+.....+++|+..+.++..++| ++|+++
T Consensus       101 k~~~~~d~~gg~IWsiai~p~~~~l~IgcddGvl~  135 (691)
T KOG2048|consen  101 KQKYNIDSNGGAIWSIAINPENTILAIGCDDGVLY  135 (691)
T ss_pred             ceeEEecCCCcceeEEEeCCccceEEeecCCceEE
Confidence            1111112345678888888888888887 888654


No 64 
>TIGR03300 assembly_YfgL outer membrane assembly lipoprotein YfgL. Members of this protein family are YfgL, a lipoprotein component of a complex that acts protein insertion into the bacterial outer membrane. Other members of this complex are NlpB, YfiO, and YaeT. This protein contains multiple copies of a repeat that, in other contexts, are associated with binding of the coenzyme PQQ.
Probab=61.81  E-value=1.5e+02  Score=28.15  Aligned_cols=95  Identities=14%  Similarity=0.110  Sum_probs=48.5

Q ss_pred             cCCEEEEEcCCeEEE-ecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeCCCcEEE-EcCCCc-CcEEcccCCCcc
Q 036387          230 DGGLWLLVRGGGLFL-SKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVLLK-TTNGGK-TWIREKAADNIA  306 (334)
Q Consensus       230 ~g~~~~~~~~g~i~~-S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i~~-S~DgG~-tW~~~~~~~~~~  306 (334)
                      ++.+|+...+|.++. ..+.|+. .|+........  ...... .++.+|+...+|.++. ..+.|+ .|+ .....  .
T Consensus       279 ~~~vyv~~~~G~l~~~d~~tG~~-~W~~~~~~~~~--~ssp~i-~g~~l~~~~~~G~l~~~d~~tG~~~~~-~~~~~--~  351 (377)
T TIGR03300       279 DNRLYVTDADGVVVALDRRSGSE-LWKNDELKYRQ--LTAPAV-VGGYLVVGDFEGYLHWLSREDGSFVAR-LKTDG--S  351 (377)
T ss_pred             CCEEEEECCCCeEEEEECCCCcE-EEccccccCCc--cccCEE-ECCEEEEEeCCCEEEEEECCCCCEEEE-EEcCC--C
Confidence            466777776776643 3344542 34332221110  111111 2567777777787643 333344 453 33311  1


Q ss_pred             cceeEEEEeeCCeEEEEeCCeeEEEE
Q 036387          307 ANLYSVKFINEKKGFVLGNDGVLLQY  332 (334)
Q Consensus       307 ~~l~~i~~~~~~~~~a~G~~G~il~s  332 (334)
                      ....+..+. ++++|+++.+|.|+..
T Consensus       352 ~~~~sp~~~-~~~l~v~~~dG~l~~~  376 (377)
T TIGR03300       352 GIASPPVVV-GDGLLVQTRDGDLYAF  376 (377)
T ss_pred             ccccCCEEE-CCEEEEEeCCceEEEe
Confidence            122333444 5789999999988753


No 65 
>PF12768 Rax2:  Cortical protein marker for cell polarity
Probab=61.78  E-value=1.4e+02  Score=27.79  Aligned_cols=97  Identities=19%  Similarity=0.310  Sum_probs=60.4

Q ss_pred             eEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEc---CC---eEEEE-cCCCcCeEeCcCCC--CcccCcce
Q 036387           94 PAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGT---RQ---TLLET-KDGGKTWAPRSIPS--AEEEDFNY  164 (334)
Q Consensus        94 i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~---~g---~i~~S-~DgG~TW~~~~~p~--~~~~~~~~  164 (334)
                      |..=+-.+..|........  ..++++.+.  +.+.++++|.   .+   .-+.+ +-...+|+......  ..+.    
T Consensus        18 lC~yd~~~~qW~~~g~~i~--G~V~~l~~~--~~~~Llv~G~ft~~~~~~~~la~yd~~~~~w~~~~~~~s~~ipg----   89 (281)
T PF12768_consen   18 LCLYDTDNSQWSSPGNGIS--GTVTDLQWA--SNNQLLVGGNFTLNGTNSSNLATYDFKNQTWSSLGGGSSNSIPG----   89 (281)
T ss_pred             EEEEECCCCEeecCCCCce--EEEEEEEEe--cCCEEEEEEeeEECCCCceeEEEEecCCCeeeecCCcccccCCC----
Confidence            4444445789998765544  789999987  5688999885   12   22333 33577998775421  1111    


Q ss_pred             eEEEEEEe--C-CeEEEEEcC----CEEEEEcCCCCCeEEeec
Q 036387          165 RFNSISFK--G-KEGWIVGKP----AILLHTSDAGESWERIPL  200 (334)
Q Consensus       165 ~~~~I~~~--~-~~~~~vG~~----g~i~~S~DgG~TW~~~~~  200 (334)
                      .+..+.+.  + .+.|+.|..    ..|++-  .|.+|+.+..
T Consensus        90 pv~a~~~~~~d~~~~~~aG~~~~g~~~l~~~--dGs~W~~i~~  130 (281)
T PF12768_consen   90 PVTALTFISNDGSNFWVAGRSANGSTFLMKY--DGSSWSSIGS  130 (281)
T ss_pred             cEEEEEeeccCCceEEEeceecCCCceEEEE--cCCceEeccc
Confidence            35555553  3 678877642    356665  3789999875


No 66 
>KOG0289 consensus mRNA splicing factor [General function prediction only]
Probab=61.14  E-value=1.2e+02  Score=29.89  Aligned_cols=62  Identities=11%  Similarity=0.190  Sum_probs=38.4

Q ss_pred             eeEEEEeecCCeEEEEeCC-CcE--EEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEe-CCeeEE
Q 036387          265 GILDVGYRSQDEAWAAGGS-GVL--LKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLG-NDGVLL  330 (334)
Q Consensus       265 ~~~~v~~~~~~~~~~~G~~-G~i--~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G-~~G~il  330 (334)
                      .+.+.+|.+++.++..|.. |.+  |-...+ .  ....-+ +-.+.+.+|.|..+|-+.+++ ++|.+.
T Consensus       349 ~~ts~~fHpDgLifgtgt~d~~vkiwdlks~-~--~~a~Fp-ght~~vk~i~FsENGY~Lat~add~~V~  414 (506)
T KOG0289|consen  349 EYTSAAFHPDGLIFGTGTPDGVVKIWDLKSQ-T--NVAKFP-GHTGPVKAISFSENGYWLATAADDGSVK  414 (506)
T ss_pred             eeEEeeEcCCceEEeccCCCceEEEEEcCCc-c--ccccCC-CCCCceeEEEeccCceEEEEEecCCeEE
Confidence            4677888888988888774 432  322221 1  111111 234789999999988877764 777444


No 67 
>PRK14131 N-acetylneuraminic acid mutarotase; Provisional
Probab=60.94  E-value=1.6e+02  Score=28.23  Aligned_cols=53  Identities=13%  Similarity=0.261  Sum_probs=30.7

Q ss_pred             CCeEEEEeCCC------------cEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeCC
Q 036387          274 QDEAWAAGGSG------------VLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGND  326 (334)
Q Consensus       274 ~~~~~~~G~~G------------~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~  326 (334)
                      ++.+|++|...            .+++-.-..++|+.+....+....-.+.....++++|++|..
T Consensus        84 ~~~IYV~GG~~~~~~~~~~~~~~~v~~YD~~~n~W~~~~~~~p~~~~~~~~~~~~~~~IYv~GG~  148 (376)
T PRK14131         84 DGKLYVFGGIGKTNSEGSPQVFDDVYKYDPKTNSWQKLDTRSPVGLAGHVAVSLHNGKAYITGGV  148 (376)
T ss_pred             CCEEEEEcCCCCCCCCCceeEcccEEEEeCCCCEEEeCCCCCCCcccceEEEEeeCCEEEEECCC
Confidence            67899987642            244444456789998742111111122222147899999875


No 68 
>KOG0301 consensus Phospholipase A2-activating protein (contains WD40 repeats) [Lipid transport and metabolism]
Probab=60.14  E-value=2.2e+02  Score=29.72  Aligned_cols=100  Identities=13%  Similarity=0.100  Sum_probs=59.4

Q ss_pred             eeeEeecCCEEEEEcCCeEEE-ecCCCcceeeEeccccCCCeeeEEEEe-ecCCeEEEEeCCCcEEEEcCCCcCcEEccc
Q 036387          224 NMGWRADGGLWLLVRGGGLFL-SKGTGITEEFEEVPVQSRGFGILDVGY-RSQDEAWAAGGSGVLLKTTNGGKTWIREKA  301 (334)
Q Consensus       224 ~~~~~~~g~~~~~~~~g~i~~-S~D~G~tW~w~~~~~~~~~~~~~~v~~-~~~~~~~~~G~~G~i~~S~DgG~tW~~~~~  301 (334)
                      .+.+.++..+.-++++|.|.+ ..|++-   -.+..  ....-++.+.. .+++.+.-+|.++.+-.= +.++-=|.+..
T Consensus       184 gL~vl~~~~flScsNDg~Ir~w~~~ge~---l~~~~--ghtn~vYsis~~~~~~~Ivs~gEDrtlriW-~~~e~~q~I~l  257 (745)
T KOG0301|consen  184 GLAVLDDSHFLSCSNDGSIRLWDLDGEV---LLEMH--GHTNFVYSISMALSDGLIVSTGEDRTLRIW-KKDECVQVITL  257 (745)
T ss_pred             eeEEecCCCeEeecCCceEEEEeccCce---eeeee--ccceEEEEEEecCCCCeEEEecCCceEEEe-ecCceEEEEec
Confidence            344555556666777776643 333321   11111  11123566663 345556667888876222 23355566665


Q ss_pred             CCCcccceeEEEEeeCCeEEEEeCCeeEEEE
Q 036387          302 ADNIAANLYSVKFINEKKGFVLGNDGVLLQY  332 (334)
Q Consensus       302 ~~~~~~~l~~i~~~~~~~~~a~G~~G~il~s  332 (334)
                      |   ...++++.+..++.++..|.+|.+.-.
T Consensus       258 P---ttsiWsa~~L~NgDIvvg~SDG~VrVf  285 (745)
T KOG0301|consen  258 P---TTSIWSAKVLLNGDIVVGGSDGRVRVF  285 (745)
T ss_pred             C---ccceEEEEEeeCCCEEEeccCceEEEE
Confidence            3   358999999999999999999987643


No 69 
>PF03404 Mo-co_dimer:  Mo-co oxidoreductase dimerisation domain;  InterPro: IPR005066 The majority of molybdenum-containing enzymes utilise a molybdenum cofactor (MoCF or Moco) consisting of a Mo atom coordinated via a cis-dithiolene moiety to molybdopterin (MPT). MoCF is ubiquitous in nature, and the pathway for MoCF biosynthesis is conserved in all three domains of life. MoCF-containing enzymes function as oxidoreductases in carbon, nitrogen, and sulphur metabolism [, ].  In Escherichia coli, biosynthesis of MoCF is a three stage process. It begins with the MoaA and MoaC conversion of GTP to the meta-stable pterin intermediate precursor Z. The second stage involves MPT synthase (MoaD and MoaE), which converts precursor Z to MPT; MoeB is involved in the recycling of MPT synthase. The final step in MoCF synthesis is the attachment of mononuclear Mo to MPT, a process that requires MoeA and which is enhanced by MogA in an Mg2 ATP-dependent manner []. MoCF is the active co-factor in eukaryotic and some prokaryotic molybdo-enzymes, but the majority of bacterial enzymes requiring MoCF, need a modification of MTP for it to be active; MobA is involved in the attachment of a nucleotide monophosphate to MPT resulting in the MGD co-factor, the active co-factor for most prokaryotic molybdo-enzymes. Bacterial two-hybrid studies have revealed the close interactions between MoeA, MogA, and MobA in the synthesis of MoCF []. Moreover the close functional association of MoeA and MogA in the synthesis of MoCF is supported by fact that the known eukaryotic homologues to MoeA and MogA exist as fusion proteins: CNX1 (Q39054 from SWISSPROT) of Arabidopsis thaliana (Mouse-ear cress), mammalian Gephryin (e.g. Q9NQX3 from SWISSPROT) and Drosophila melanogaster (Fruit fly) Cinnamon (P39205 from SWISSPROT) []. This domain is found in molybdopterin cofactor oxidoreductases, such as in the C-terminal of Mo-containing sulphite oxidase, which catalyses the conversion of sulphite to sulphate, the terminal step in the oxidative degradation of cysteine and methionine []. This domain is involved in dimer formation, and has an Ig-fold structure [].; GO: 0016491 oxidoreductase activity, 0030151 molybdenum ion binding, 0055114 oxidation-reduction process; PDB: 2C9X_A 2CA3_A 2BLF_A 2CA4_A 2BPB_A 2XTS_C 2BII_A 2BIH_A 1OGP_A 2A9A_B ....
Probab=58.30  E-value=12  Score=30.45  Aligned_cols=18  Identities=33%  Similarity=0.726  Sum_probs=13.4

Q ss_pred             EEEEcCCCcCeEeCcCCC
Q 036387          139 LLETKDGGKTWAPRSIPS  156 (334)
Q Consensus       139 i~~S~DgG~TW~~~~~p~  156 (334)
                      +=.|.|+|+||+...+..
T Consensus        46 VEVS~DgG~tW~~A~l~~   63 (131)
T PF03404_consen   46 VEVSTDGGKTWQEATLDG   63 (131)
T ss_dssp             EEEESSTTSSEEE-EEES
T ss_pred             EEEEeCCCCCcEEeEecc
Confidence            556999999999876533


No 70 
>KOG0272 consensus U4/U6 small nuclear ribonucleoprotein Prp4 (contains WD40 repeats) [RNA processing and modification]
Probab=56.66  E-value=32  Score=33.55  Aligned_cols=92  Identities=15%  Similarity=0.230  Sum_probs=54.5

Q ss_pred             eEeeeeEeecCCEEEEEcCCeEEEecCCCcceeeEecc-------ccCCCeeeEEEEeecCCeEEEEeCC---CcEEEEc
Q 036387          221 RIQNMGWRADGGLWLLVRGGGLFLSKGTGITEEFEEVP-------VQSRGFGILDVGYRSQDEAWAAGGS---GVLLKTT  290 (334)
Q Consensus       221 ~i~~~~~~~~g~~~~~~~~g~i~~S~D~G~tW~w~~~~-------~~~~~~~~~~v~~~~~~~~~~~G~~---G~i~~S~  290 (334)
                      ++..+.|.|+|..+..+..       |  .||.--.+.       ...-..++++++|..++.+.+.|.-   |.||=.+
T Consensus       263 RVs~VafHPsG~~L~Tasf-------D--~tWRlWD~~tk~ElL~QEGHs~~v~~iaf~~DGSL~~tGGlD~~~RvWDlR  333 (459)
T KOG0272|consen  263 RVSRVAFHPSGKFLGTASF-------D--STWRLWDLETKSELLLQEGHSKGVFSIAFQPDGSLAATGGLDSLGRVWDLR  333 (459)
T ss_pred             hheeeeecCCCceeeeccc-------c--cchhhcccccchhhHhhcccccccceeEecCCCceeeccCccchhheeecc
Confidence            4566788888876655422       2  244322221       1122347899999999988887652   5554333


Q ss_pred             CCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeC
Q 036387          291 NGGKTWIREKAADNIAANLYSVKFINEKKGFVLGN  325 (334)
Q Consensus       291 DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~  325 (334)
                      - |.  +.+-.. +-...+++|.|+++|.-+|.|.
T Consensus       334 t-gr--~im~L~-gH~k~I~~V~fsPNGy~lATgs  364 (459)
T KOG0272|consen  334 T-GR--CIMFLA-GHIKEILSVAFSPNGYHLATGS  364 (459)
T ss_pred             c-Cc--EEEEec-ccccceeeEeECCCceEEeecC
Confidence            2 21  111111 2236799999999999998864


No 71 
>PF07995 GSDH:  Glucose / Sorbosone dehydrogenase;  InterPro: IPR012938 Proteins containing this domain are thought to be glucose/sorbosone dehydrogenases. The best characterised of these proteins is soluble glucose dehydrogenase (P13650 from SWISSPROT) from Acinetobacter calcoaceticus, which oxidises glucose to gluconolactone. The enzyme is a calcium-dependent homodimer which uses PQQ as a cofactor [].; GO: 0016901 oxidoreductase activity, acting on the CH-OH group of donors, quinone or similar compound as acceptor, 0048038 quinone binding, 0005975 carbohydrate metabolic process; PDB: 2ISM_A 2WG3_D 3HO5_A 3HO4_A 3HO3_A 2WFT_A 2WG4_B 2WFX_B 1CRU_A 1CQ1_B ....
Probab=55.57  E-value=1.8e+02  Score=27.35  Aligned_cols=147  Identities=10%  Similarity=0.107  Sum_probs=73.4

Q ss_pred             EEEEEeC-CeEEEEEcCCEEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEee----cCCEEEEEcC--
Q 036387          167 NSISFKG-KEGWIVGKPAILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRA----DGGLWLLVRG--  239 (334)
Q Consensus       167 ~~I~~~~-~~~~~vG~~g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~----~g~~~~~~~~--  239 (334)
                      ++|++.+ +++|+.-..|.|++-+..|..-+.+....+..      ...    ...+..+++.+    ++.+|++...  
T Consensus         5 ~~~a~~pdG~l~v~e~~G~i~~~~~~g~~~~~v~~~~~v~------~~~----~~gllgia~~p~f~~n~~lYv~~t~~~   74 (331)
T PF07995_consen    5 RSMAFLPDGRLLVAERSGRIWVVDKDGSLKTPVADLPEVF------ADG----ERGLLGIAFHPDFASNGYLYVYYTNAD   74 (331)
T ss_dssp             EEEEEETTSCEEEEETTTEEEEEETTTEECEEEEE-TTTB------TST----TBSEEEEEE-TTCCCC-EEEEEEEEE-
T ss_pred             eEEEEeCCCcEEEEeCCceEEEEeCCCcCcceeccccccc------ccc----cCCcccceeccccCCCCEEEEEEEccc
Confidence            5677775 67777767788888775555534443221110      000    11344455554    3567776542  


Q ss_pred             -------CeEEEecCC--Cccee-eEec--cccC---CCeeeEEEEeecCCeEEEE-eC-------------CCcEEEEc
Q 036387          240 -------GGLFLSKGT--GITEE-FEEV--PVQS---RGFGILDVGYRSQDEAWAA-GG-------------SGVLLKTT  290 (334)
Q Consensus       240 -------g~i~~S~D~--G~tW~-w~~~--~~~~---~~~~~~~v~~~~~~~~~~~-G~-------------~G~i~~S~  290 (334)
                             ..|.|-+..  ..+.. .+.+  ..+.   ..+....+.|.+++.+|+. |.             .|.|+|-.
T Consensus        75 ~~~~~~~~~v~r~~~~~~~~~~~~~~~l~~~~p~~~~~~H~g~~l~fgpDG~LYvs~G~~~~~~~~~~~~~~~G~ilri~  154 (331)
T PF07995_consen   75 EDGGDNDNRVVRFTLSDGDGDLSSEEVLVTGLPDTSSGNHNGGGLAFGPDGKLYVSVGDGGNDDNAQDPNSLRGKILRID  154 (331)
T ss_dssp             TSSSSEEEEEEEEEEETTSCEEEEEEEEEEEEES-CSSSS-EEEEEE-TTSEEEEEEB-TTTGGGGCSTTSSTTEEEEEE
T ss_pred             CCCCCcceeeEEEeccCCccccccceEEEEEeCCCCCCCCCCccccCCCCCcEEEEeCCCCCcccccccccccceEEEec
Confidence                   245543322  22222 1221  1222   2234456888888898885 32             26787766


Q ss_pred             CCCcCcEEcccC-----C-----CcccceeEEEEeeC-CeEEEE
Q 036387          291 NGGKTWIREKAA-----D-----NIAANLYSVKFINE-KKGFVL  323 (334)
Q Consensus       291 DgG~tW~~~~~~-----~-----~~~~~l~~i~~~~~-~~~~a~  323 (334)
                      ..|+.+..-+..     .     ..-++.+.++|.+. +++|++
T Consensus       155 ~dG~~p~dnP~~~~~~~~~~i~A~GlRN~~~~~~d~~tg~l~~~  198 (331)
T PF07995_consen  155 PDGSIPADNPFVGDDGADSEIYAYGLRNPFGLAFDPNTGRLWAA  198 (331)
T ss_dssp             TTSSB-TTSTTTTSTTSTTTEEEE--SEEEEEEEETTTTEEEEE
T ss_pred             ccCcCCCCCccccCCCceEEEEEeCCCccccEEEECCCCcEEEE
Confidence            666522211110     0     01256778899887 899975


No 72 
>TIGR02604 Piru_Ver_Nterm putative membrane-bound dehydrogenase domain. All proteins that score above the trusted cutoff score of 45 to this model are large proteins of either Pirellula sp. 1 or Verrucomicrobium spinosum. These proteins all contain, in addition to this domain, several hundred residues of highly variable sequence, and then a well-conserved C-terminal domain (TIGR02603) that features a putative cytochrome c-type heme binding motif CXXCH. The membrane-bound L-sorbosone dehydrogenase from Acetobacter liquefaciens (Gluconacetobacter liquefaciens) is homologous to this domain but lacks additional sequence regions shared by members of this family and belongs to a different clade of the larger family of homologs. It and its closely related homologs are excluded from the this model by scoring between the trusted (45) and noise (18) cutoffs.
Probab=55.17  E-value=1.7e+02  Score=28.02  Aligned_cols=96  Identities=10%  Similarity=0.070  Sum_probs=47.1

Q ss_pred             eeeEeecCCEEEEEc------------CC-eEEEecC---CCcceeeEeccccCCCeeeEEEEeecCCeEEEEeCCCcEE
Q 036387          224 NMGWRADGGLWLLVR------------GG-GLFLSKG---TGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVLL  287 (334)
Q Consensus       224 ~~~~~~~g~~~~~~~------------~g-~i~~S~D---~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i~  287 (334)
                      .|.+.++|++|++..            .+ .|++-.|   +|+-=+++......  ....++++.+++ +|++.. ..|+
T Consensus        18 ~ia~d~~G~l~V~e~~~y~~~~~~~~~~~~rI~~l~d~dgdG~~d~~~vfa~~l--~~p~Gi~~~~~G-lyV~~~-~~i~   93 (367)
T TIGR02604        18 AVCFDERGRLWVAEGITYSRPAGRQGPLGDRILILEDADGDGKYDKSNVFAEEL--SMVTGLAVAVGG-VYVATP-PDIL   93 (367)
T ss_pred             eeeECCCCCEEEEeCCcCCCCCCCCCCCCCEEEEEEcCCCCCCcceeEEeecCC--CCccceeEecCC-EEEeCC-CeEE
Confidence            356677888988752            12 5655444   35421112221111  123566665556 777543 4454


Q ss_pred             EE--cCCCc----CcEEcccCCCc-----ccceeEEEEeeCCeEEEE
Q 036387          288 KT--TNGGK----TWIREKAADNI-----AANLYSVKFINEKKGFVL  323 (334)
Q Consensus       288 ~S--~DgG~----tW~~~~~~~~~-----~~~l~~i~~~~~~~~~a~  323 (334)
                      +-  +|+..    .-+.+-..-+.     ......+.+.++|.+|++
T Consensus        94 ~~~d~~gdg~ad~~~~~l~~~~~~~~~~~~~~~~~l~~gpDG~LYv~  140 (367)
T TIGR02604        94 FLRDKDGDDKADGEREVLLSGFGGQINNHHHSLNSLAWGPDGWLYFN  140 (367)
T ss_pred             EEeCCCCCCCCCCccEEEEEccCCCCCcccccccCceECCCCCEEEe
Confidence            33  33211    33433321111     233667888888888874


No 73 
>KOG0640 consensus mRNA cleavage stimulating factor complex; subunit 1 [RNA processing and modification]
Probab=54.30  E-value=1.6e+02  Score=27.83  Aligned_cols=117  Identities=22%  Similarity=0.280  Sum_probs=64.1

Q ss_pred             eeeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEeC-CeEEEEEcCCEEEEEcCCCC
Q 036387          115 VVLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFKG-KEGWIVGKPAILLHTSDAGE  193 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~-~~~~~vG~~g~i~~S~DgG~  193 (334)
                      ..++++.|.|.  +++++.|+.-.-++=-|--++=.+...-...+   ...+++|.|++ ++..++|..--++|-=|= +
T Consensus       173 devn~l~FHPr--e~ILiS~srD~tvKlFDfsK~saKrA~K~~qd---~~~vrsiSfHPsGefllvgTdHp~~rlYdv-~  246 (430)
T KOG0640|consen  173 DEVNDLDFHPR--ETILISGSRDNTVKLFDFSKTSAKRAFKVFQD---TEPVRSISFHPSGEFLLVGTDHPTLRLYDV-N  246 (430)
T ss_pred             Ccccceeecch--hheEEeccCCCeEEEEecccHHHHHHHHHhhc---cceeeeEeecCCCceEEEecCCCceeEEec-c
Confidence            45778999985  67788776543344456444321111000001   12588999997 777788865444444442 4


Q ss_pred             CeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCCeEEEecCC
Q 036387          194 SWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGGGLFLSKGT  248 (334)
Q Consensus       194 TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g~i~~S~D~  248 (334)
                      |.|-....  .|..     .|.    ..|..+.+++.+.+|+++...+-.+--||
T Consensus       247 T~Qcfvsa--nPd~-----qht----~ai~~V~Ys~t~~lYvTaSkDG~IklwDG  290 (430)
T KOG0640|consen  247 TYQCFVSA--NPDD-----QHT----GAITQVRYSSTGSLYVTASKDGAIKLWDG  290 (430)
T ss_pred             ceeEeeec--Cccc-----ccc----cceeEEEecCCccEEEEeccCCcEEeecc
Confidence            55654322  1211     111    24556777778889988755444444443


No 74 
>PF00400 WD40:  WD domain, G-beta repeat;  InterPro: IPR019781 WD-40 repeats (also known as WD or beta-transducin repeats) are short ~40 amino acid motifs, often terminating in a Trp-Asp (W-D) dipeptide. WD40 repeats usually assume a 7-8 bladed beta-propeller fold, but proteins have been found with 4 to 16 repeated units, which also form a circularised beta-propeller structure. WD-repeat proteins are a large family found in all eukaryotes and are implicated in a variety of functions ranging from signal transduction and transcription regulation to cell cycle control and apoptosis. Repeated WD40 motifs act as a site for protein-protein interaction, and proteins containing WD40 repeats are known to serve as platforms for the assembly of protein complexes or mediators of transient interplay among other proteins. The specificity of the proteins is determined by the sequences outside the repeats themselves. Examples of such complexes are G proteins (beta subunit is a beta-propeller), TAFII transcription factor, and E3 ubiquitin ligase [, ]. In Arabidopsis spp., several WD40-containing proteins act as key regulators of plant-specific developmental events.; PDB: 2ZKQ_a 3CFV_B 3CFS_B 1PEV_A 1NR0_A 1VYH_T 3RFH_A 3O2Z_T 3FRX_C 3U5G_g ....
Probab=54.24  E-value=40  Score=20.13  Aligned_cols=27  Identities=11%  Similarity=0.261  Sum_probs=20.0

Q ss_pred             ccceeEEEEeeCCeEEE-EeCCeeEEEE
Q 036387          306 AANLYSVKFINEKKGFV-LGNDGVLLQY  332 (334)
Q Consensus       306 ~~~l~~i~~~~~~~~~a-~G~~G~il~s  332 (334)
                      ...+++|++.++++.++ ++.+|.|..+
T Consensus        11 ~~~i~~i~~~~~~~~~~s~~~D~~i~vw   38 (39)
T PF00400_consen   11 SSSINSIAWSPDGNFLASGSSDGTIRVW   38 (39)
T ss_dssp             SSSEEEEEEETTSSEEEEEETTSEEEEE
T ss_pred             CCcEEEEEEecccccceeeCCCCEEEEE
Confidence            46899999998766655 5677887654


No 75 
>PF14339 DUF4394:  Domain of unknown function (DUF4394)
Probab=53.54  E-value=1e+02  Score=27.89  Aligned_cols=70  Identities=16%  Similarity=0.266  Sum_probs=46.5

Q ss_pred             eeeEEEEeec-CCeEEEEeCCCcEEEEc-CCCcCcEE--cccCCCcccceeEEEEee-CCeEEEEeCCeeEEEEc
Q 036387          264 FGILDVGYRS-QDEAWAAGGSGVLLKTT-NGGKTWIR--EKAADNIAANLYSVKFIN-EKKGFVLGNDGVLLQYL  333 (334)
Q Consensus       264 ~~~~~v~~~~-~~~~~~~G~~G~i~~S~-DgG~tW~~--~~~~~~~~~~l~~i~~~~-~~~~~a~G~~G~il~s~  333 (334)
                      ..+.+|.|++ .+++|+++..|.||.=. .-|.--..  -..........+.+.|.+ -.++-++++.|.=||..
T Consensus        27 e~l~GID~Rpa~G~LYgl~~~g~lYtIn~~tG~aT~vg~s~~~~al~g~~~gvDFNP~aDRlRvvs~~GqNlR~n  101 (236)
T PF14339_consen   27 ESLVGIDFRPANGQLYGLGSTGRLYTINPATGAATPVGASPLTVALSGTAFGVDFNPAADRLRVVSNTGQNLRLN  101 (236)
T ss_pred             CeEEEEEeecCCCCEEEEeCCCcEEEEECCCCeEEEeecccccccccCceEEEecCcccCcEEEEccCCcEEEEC
Confidence            3688999987 57899999999987532 23332222  111112334577888865 56899999999888865


No 76 
>KOG1332 consensus Vesicle coat complex COPII, subunit SEC13 [Intracellular trafficking, secretion, and vesicular transport]
Probab=51.81  E-value=1.9e+02  Score=26.46  Aligned_cols=51  Identities=16%  Similarity=0.403  Sum_probs=31.2

Q ss_pred             CcEEcccCCCCCeeeEEEEEecCCCCEEEEEE-cCCe--EEEEcCCCcCeEeCcC
Q 036387          103 AWERVYIPVDPGVVLLDIAFVPDDLNHGFLLG-TRQT--LLETKDGGKTWAPRSI  154 (334)
Q Consensus       103 tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG-~~g~--i~~S~DgG~TW~~~~~  154 (334)
                      .|++...-......+++|++.|.+-.-.+|++ ++|.  ||.-++.| -|.....
T Consensus        91 ~w~k~~e~~~h~~SVNsV~wapheygl~LacasSDG~vsvl~~~~~g-~w~t~ki  144 (299)
T KOG1332|consen   91 RWTKAYEHAAHSASVNSVAWAPHEYGLLLACASSDGKVSVLTYDSSG-GWTTSKI  144 (299)
T ss_pred             chhhhhhhhhhcccceeecccccccceEEEEeeCCCcEEEEEEcCCC-Cccchhh
Confidence            89887654444478999999986545556665 3564  44433332 2765443


No 77 
>PTZ00334 trans-sialidase; Provisional
Probab=51.29  E-value=39  Score=35.89  Aligned_cols=57  Identities=11%  Similarity=0.104  Sum_probs=32.4

Q ss_pred             eEEEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEE--eCCC--cEEEEcCCCcCcEEc
Q 036387          241 GLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAA--GGSG--VLLKTTNGGKTWIRE  299 (334)
Q Consensus       241 ~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~--G~~G--~i~~S~DgG~tW~~~  299 (334)
                      -|.+|+|+|. |.+.+--.+..-.. -.|.--.++.++++  -.+|  .+|.|.|-|+||...
T Consensus       289 lIiYS~d~g~-W~ls~g~s~~gC~~-P~I~EWe~gkLlM~t~C~dG~RrVYES~DmG~tWtEA  349 (780)
T PTZ00334        289 LIIYSSATES-GNLSKGMSADGCSD-PSVVEWKEGKLMMMTACDDGRRRVYESGDKGDSWTEA  349 (780)
T ss_pred             EEEEecCCCC-eEEcCCCCCCCCCC-CEEEEEcCCeEEEEEEeCCCCEEEEEECCCCCChhhC
Confidence            3677889885 87765322221000 11221223555443  2244  599999999999864


No 78 
>TIGR03548 mutarot_permut cyclically-permuted mutatrotase family protein. Members of this protein family show essentially full-length homology, cyclically permuted, to YjhT from Escherichia coli. YjhT was shown to act as a mutarotase for sialic acid, and by this ability to be able to act as a virulence factor. Members of the YjhT family (TIGR03547) and this cyclically-permuted family have multiple repeats of the beta-propeller-forming Kelch repeat.
Probab=51.14  E-value=2.1e+02  Score=26.60  Aligned_cols=52  Identities=10%  Similarity=0.107  Sum_probs=29.4

Q ss_pred             CCeEEEEeCC------CcEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeCC
Q 036387          274 QDEAWAAGGS------GVLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGND  326 (334)
Q Consensus       274 ~~~~~~~G~~------G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~  326 (334)
                      ++.+|++|..      ..+++-.=.-++|+.+..-.........++ .-++++|++|..
T Consensus       123 ~~~iYv~GG~~~~~~~~~v~~yd~~~~~W~~~~~~p~~~r~~~~~~-~~~~~iYv~GG~  180 (323)
T TIGR03548       123 DGTLYVGGGNRNGKPSNKSYLFNLETQEWFELPDFPGEPRVQPVCV-KLQNELYVFGGG  180 (323)
T ss_pred             CCEEEEEeCcCCCccCceEEEEcCCCCCeeECCCCCCCCCCcceEE-EECCEEEEEcCC
Confidence            6789998763      234444334467999874111122222333 346789998753


No 79 
>KOG0275 consensus Conserved WD40 repeat-containing protein [General function prediction only]
Probab=50.77  E-value=2.3e+02  Score=26.99  Aligned_cols=50  Identities=16%  Similarity=0.387  Sum_probs=33.1

Q ss_pred             CCeEEEEeCCCcEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCe-EEEEeCCeeEEEE
Q 036387          274 QDEAWAAGGSGVLLKTTNGGKTWIREKAADNIAANLYSVKFINEKK-GFVLGNDGVLLQY  332 (334)
Q Consensus       274 ~~~~~~~G~~G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~-~~a~G~~G~il~s  332 (334)
                      .+.+|+....|.+.+|.-.|+         .....+.....++.|. +|++|++|+++..
T Consensus       414 sntv~imn~qGQvVrsfsSGk---------REgGdFi~~~lSpkGewiYcigED~vlYCF  464 (508)
T KOG0275|consen  414 SNTVYIMNMQGQVVRSFSSGK---------REGGDFINAILSPKGEWIYCIGEDGVLYCF  464 (508)
T ss_pred             CCeEEEEeccceEEeeeccCC---------ccCCceEEEEecCCCcEEEEEccCcEEEEE
Confidence            456666666777878776665         1234566555566555 6889999998753


No 80 
>KOG0771 consensus Prolactin regulatory element-binding protein/Protein transport protein SEC12p [Intracellular trafficking, secretion, and vesicular transport]
Probab=50.18  E-value=89  Score=30.35  Aligned_cols=108  Identities=13%  Similarity=0.135  Sum_probs=55.9

Q ss_pred             eEeeeeEeecCCEEEE-EcCCeEEEecCCCcceeeEeccccCCCeeeEEEEeecCC---eEEEEe--CCCcEEEEcCCCc
Q 036387          221 RIQNMGWRADGGLWLL-VRGGGLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQD---EAWAAG--GSGVLLKTTNGGK  294 (334)
Q Consensus       221 ~i~~~~~~~~g~~~~~-~~~g~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~---~~~~~G--~~G~i~~S~DgG~  294 (334)
                      .|..+.|++|+.+++. +.+....++.+.|..|+|... .. ..+.+-...|..++   .++++.  ..+...+..| ..
T Consensus       188 eV~DL~FS~dgk~lasig~d~~~VW~~~~g~~~a~~t~-~~-k~~~~~~cRF~~d~~~~~l~laa~~~~~~~v~~~~-~~  264 (398)
T KOG0771|consen  188 EVKDLDFSPDGKFLASIGADSARVWSVNTGAALARKTP-FS-KDEMFSSCRFSVDNAQETLRLAASQFPGGGVRLCD-IS  264 (398)
T ss_pred             ccccceeCCCCcEEEEecCCceEEEEeccCchhhhcCC-cc-cchhhhhceecccCCCceEEEEEecCCCCceeEEE-ee
Confidence            4667888999875543 334445556666665544331 11 11233344554444   333332  2222223333 33


Q ss_pred             CcEEc-----ccCCCcccceeEEEEeeCCeEEEEe-CCeeEEE
Q 036387          295 TWIRE-----KAADNIAANLYSVKFINEKKGFVLG-NDGVLLQ  331 (334)
Q Consensus       295 tW~~~-----~~~~~~~~~l~~i~~~~~~~~~a~G-~~G~il~  331 (334)
                      .|..-     .........+.+++..++|++.|+| .+|.+..
T Consensus       265 ~w~~~~~l~~~~~~~~~~siSsl~VS~dGkf~AlGT~dGsVai  307 (398)
T KOG0771|consen  265 LWSGSNFLRLRKKIKRFKSISSLAVSDDGKFLALGTMDGSVAI  307 (398)
T ss_pred             eeccccccchhhhhhccCcceeEEEcCCCcEEEEeccCCcEEE
Confidence            45541     1111123568888888899999886 6665543


No 81 
>cd02110 SO_family_Moco_dimer Subgroup of sulfite oxidase (SO) family molybdopterin binding domains that contains conserved dimerization domain. This molybdopterin cofactor (Moco) binding domain is found in a variety of oxidoreductases, main members of this family are nitrate reductase (NR) and sulfite oxidase (SO).
Probab=47.96  E-value=63  Score=30.49  Aligned_cols=17  Identities=29%  Similarity=0.679  Sum_probs=14.6

Q ss_pred             EEEEcCCCcCeEeCcCC
Q 036387          139 LLETKDGGKTWAPRSIP  155 (334)
Q Consensus       139 i~~S~DgG~TW~~~~~p  155 (334)
                      +-.|.|||+||++..+.
T Consensus       241 VEvS~DgG~tW~~A~l~  257 (317)
T cd02110         241 VEVSLDGGRTWQEARLE  257 (317)
T ss_pred             EEEEeCCCCcceEeEcc
Confidence            67799999999998763


No 82 
>PF12768 Rax2:  Cortical protein marker for cell polarity
Probab=45.86  E-value=2.5e+02  Score=26.04  Aligned_cols=103  Identities=17%  Similarity=0.163  Sum_probs=62.0

Q ss_pred             CCCCCCCCCCCCCCCcccccceeeeccccccceeEEEecCCCccceEEecCCCCCcEEcccCC--CCCeeeEEEEEecCC
Q 036387           49 SSDSSSSSSSSSSSSSSLNRRQFVSQTATLSLSISLAATTGLYEQPAKSEEALSAWERVYIPV--DPGVVLLDIAFVPDD  126 (334)
Q Consensus        49 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~a~g~~~~~g~~~~g~i~~S~DgG~tW~~~~~p~--~~~~~l~~I~~~p~d  126 (334)
                      ..++...+..   .........++.....++.|..-..+.. ...+..=+-..++|..+....  ....++..+.+...|
T Consensus        25 ~~qW~~~g~~---i~G~V~~l~~~~~~~Llv~G~ft~~~~~-~~~la~yd~~~~~w~~~~~~~s~~ipgpv~a~~~~~~d  100 (281)
T PF12768_consen   25 NSQWSSPGNG---ISGTVTDLQWASNNQLLVGGNFTLNGTN-SSNLATYDFKNQTWSSLGGGSSNSIPGPVTALTFISND  100 (281)
T ss_pred             CCEeecCCCC---ceEEEEEEEEecCCEEEEEEeeEECCCC-ceeEEEEecCCCeeeecCCcccccCCCcEEEEEeeccC
Confidence            4466655444   5556677777666666677765555422 234444444567998776421  122567777776667


Q ss_pred             CCEEEEEEc--CC-eEEEEcCCCcCeEeCcCCC
Q 036387          127 LNHGFLLGT--RQ-TLLETKDGGKTWAPRSIPS  156 (334)
Q Consensus       127 ~~~~~avG~--~g-~i~~S~DgG~TW~~~~~p~  156 (334)
                      ...+|++|.  .| ..+..-| |.+|+.+..+.
T Consensus       101 ~~~~~~aG~~~~g~~~l~~~d-Gs~W~~i~~~~  132 (281)
T PF12768_consen  101 GSNFWVAGRSANGSTFLMKYD-GSSWSSIGSDI  132 (281)
T ss_pred             CceEEEeceecCCCceEEEEc-CCceEeccccc
Confidence            788998875  22 2333346 67899987633


No 83 
>PRK11138 outer membrane biogenesis protein BamB; Provisional
Probab=45.62  E-value=2.8e+02  Score=26.54  Aligned_cols=95  Identities=13%  Similarity=0.166  Sum_probs=48.3

Q ss_pred             cCCEEEEEcCCeEEE-ecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeCCCcEEE-EcCCCcC-cEEcccCCCcc
Q 036387          230 DGGLWLLVRGGGLFL-SKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVLLK-TTNGGKT-WIREKAADNIA  306 (334)
Q Consensus       230 ~g~~~~~~~~g~i~~-S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i~~-S~DgG~t-W~~~~~~~~~~  306 (334)
                      ++.+|+.+.++.++. ....|+. .|+.......  ....... .++.+|+...+|.++. ..+.|+. |+. ...  ..
T Consensus       294 ~~~vy~~~~~g~l~ald~~tG~~-~W~~~~~~~~--~~~sp~v-~~g~l~v~~~~G~l~~ld~~tG~~~~~~-~~~--~~  366 (394)
T PRK11138        294 GGRIYLVDQNDRVYALDTRGGVE-LWSQSDLLHR--LLTAPVL-YNGYLVVGDSEGYLHWINREDGRFVAQQ-KVD--SS  366 (394)
T ss_pred             CCEEEEEcCCCeEEEEECCCCcE-EEcccccCCC--cccCCEE-ECCEEEEEeCCCEEEEEECCCCCEEEEE-EcC--CC
Confidence            566777777776643 3333432 3433211110  0111111 2677888777787643 4445554 544 221  01


Q ss_pred             cceeEEEEeeCCeEEEEeCCeeEEEE
Q 036387          307 ANLYSVKFINEKKGFVLGNDGVLLQY  332 (334)
Q Consensus       307 ~~l~~i~~~~~~~~~a~G~~G~il~s  332 (334)
                      ....+..+ .++++|+.+.+|.|+..
T Consensus       367 ~~~s~P~~-~~~~l~v~t~~G~l~~~  391 (394)
T PRK11138        367 GFLSEPVV-ADDKLLIQARDGTVYAI  391 (394)
T ss_pred             cceeCCEE-ECCEEEEEeCCceEEEE
Confidence            11223333 36799999999988753


No 84 
>KOG0647 consensus mRNA export protein (contains WD40 repeats) [RNA processing and modification]
Probab=44.87  E-value=2.2e+02  Score=26.85  Aligned_cols=83  Identities=20%  Similarity=0.289  Sum_probs=47.3

Q ss_pred             cCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEc-CCe-EEEEcCCCc---CeE--eCcCCCCcccCcceeEEEEE
Q 036387           98 EEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGT-RQT-LLETKDGGK---TWA--PRSIPSAEEEDFNYRFNSIS  170 (334)
Q Consensus        98 ~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~-~g~-i~~S~DgG~---TW~--~~~~p~~~~~~~~~~~~~I~  170 (334)
                      +++-...+.+.+|..  ...++|++..+  +..+|+|. .|. -.+..|.+.   +++  --..... ..+.-|.++.|.
T Consensus       184 ~n~~te~k~~~SpLk--~Q~R~va~f~d--~~~~alGsiEGrv~iq~id~~~~~~nFtFkCHR~~~~-~~~~VYaVNsi~  258 (347)
T KOG0647|consen  184 ENPPTEFKRIESPLK--WQTRCVACFQD--KDGFALGSIEGRVAIQYIDDPNPKDNFTFKCHRSTNS-VNDDVYAVNSIA  258 (347)
T ss_pred             CCCcchhhhhcCccc--ceeeEEEEEec--CCceEeeeecceEEEEecCCCCccCceeEEEeccCCC-CCCceEEecceE
Confidence            344455777777766  77899998864  55667775 554 345566552   221  1111111 111246788899


Q ss_pred             EeCCe--EEEEEcCCEE
Q 036387          171 FKGKE--GWIVGKPAIL  185 (334)
Q Consensus       171 ~~~~~--~~~vG~~g~i  185 (334)
                      |++.+  +.-+|..|.+
T Consensus       259 FhP~hgtlvTaGsDGtf  275 (347)
T KOG0647|consen  259 FHPVHGTLVTAGSDGTF  275 (347)
T ss_pred             eecccceEEEecCCceE
Confidence            99844  4445666643


No 85 
>KOG0266 consensus WD40 repeat-containing protein [General function prediction only]
Probab=44.66  E-value=3.2e+02  Score=26.97  Aligned_cols=105  Identities=13%  Similarity=0.242  Sum_probs=60.1

Q ss_pred             eEeeeeEeecCCEEEEEcCCe---EEEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeC-CCcEEEE-cCCCcC
Q 036387          221 RIQNMGWRADGGLWLLVRGGG---LFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGG-SGVLLKT-TNGGKT  295 (334)
Q Consensus       221 ~i~~~~~~~~g~~~~~~~~g~---i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~-~G~i~~S-~DgG~t  295 (334)
                      .+..+.|.+++...+.+....   ||...+.+..  -..+.  .-...+++++|.+.++.++.|. ++.+..- ...|+.
T Consensus       205 ~v~~~~fs~d~~~l~s~s~D~tiriwd~~~~~~~--~~~l~--gH~~~v~~~~f~p~g~~i~Sgs~D~tvriWd~~~~~~  280 (456)
T KOG0266|consen  205 GVSDVAFSPDGSYLLSGSDDKTLRIWDLKDDGRN--LKTLK--GHSTYVTSVAFSPDGNLLVSGSDDGTVRIWDVRTGEC  280 (456)
T ss_pred             ceeeeEECCCCcEEEEecCCceEEEeeccCCCeE--EEEec--CCCCceEEEEecCCCCEEEEecCCCcEEEEeccCCeE
Confidence            456677888887666554333   3434344432  12111  1122578999988777777654 5655222 222444


Q ss_pred             cEEcccCCCcccceeEEEEeeCCeEEEEeC-CeeEEEE
Q 036387          296 WIREKAADNIAANLYSVKFINEKKGFVLGN-DGVLLQY  332 (334)
Q Consensus       296 W~~~~~~~~~~~~l~~i~~~~~~~~~a~G~-~G~il~s  332 (334)
                      =+.+..   -...+.+++|..+++.++++. +|.|.-+
T Consensus       281 ~~~l~~---hs~~is~~~f~~d~~~l~s~s~d~~i~vw  315 (456)
T KOG0266|consen  281 VRKLKG---HSDGISGLAFSPDGNLLVSASYDGTIRVW  315 (456)
T ss_pred             EEeeec---cCCceEEEEECCCCCEEEEcCCCccEEEE
Confidence            444433   235788999988888777764 7766544


No 86 
>PLN02153 epithiospecifier protein
Probab=44.43  E-value=2.7e+02  Score=26.05  Aligned_cols=52  Identities=13%  Similarity=0.303  Sum_probs=29.3

Q ss_pred             CCeEEEEeCC--------------CcEEEEcCCCcCcEEcccC--CCcccceeEEEEeeCCeEEEEeCC
Q 036387          274 QDEAWAAGGS--------------GVLLKTTNGGKTWIREKAA--DNIAANLYSVKFINEKKGFVLGND  326 (334)
Q Consensus       274 ~~~~~~~G~~--------------G~i~~S~DgG~tW~~~~~~--~~~~~~l~~i~~~~~~~~~a~G~~  326 (334)
                      ++++|++|..              ..++.-.-.-.+|+.+...  .+......++... ++.+|++|..
T Consensus       193 ~~~iyv~GG~~~~~~~gG~~~~~~~~v~~yd~~~~~W~~~~~~g~~P~~r~~~~~~~~-~~~iyv~GG~  260 (341)
T PLN02153        193 QGKIWVVYGFATSILPGGKSDYESNAVQFFDPASGKWTEVETTGAKPSARSVFAHAVV-GKYIIIFGGE  260 (341)
T ss_pred             CCeEEEEeccccccccCCccceecCceEEEEcCCCcEEeccccCCCCCCcceeeeEEE-CCEEEEECcc
Confidence            5678887542              1243333345679998641  1223334444444 5789998874


No 87 
>KOG0291 consensus WD40-repeat-containing subunit of the 18S rRNA processing complex [RNA processing and modification]
Probab=42.44  E-value=3.4e+02  Score=28.84  Aligned_cols=101  Identities=13%  Similarity=0.184  Sum_probs=56.5

Q ss_pred             ceEeeeeEeecCCEEEEEc-CCeE--EEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEE-EeCCCcE-EEEcCCCc
Q 036387          220 RRIQNMGWRADGGLWLLVR-GGGL--FLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWA-AGGSGVL-LKTTNGGK  294 (334)
Q Consensus       220 ~~i~~~~~~~~g~~~~~~~-~g~i--~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~-~G~~G~i-~~S~DgG~  294 (334)
                      .++..+.+++||.+++++. +|.|  |-+.- |-  =+....-+.  .++.++.|...+..++ ...+|.+ ..=--.+.
T Consensus       351 ~~i~~l~YSpDgq~iaTG~eDgKVKvWn~~S-gf--C~vTFteHt--s~Vt~v~f~~~g~~llssSLDGtVRAwDlkRYr  425 (893)
T KOG0291|consen  351 DRITSLAYSPDGQLIATGAEDGKVKVWNTQS-GF--CFVTFTEHT--SGVTAVQFTARGNVLLSSSLDGTVRAWDLKRYR  425 (893)
T ss_pred             cceeeEEECCCCcEEEeccCCCcEEEEeccC-ce--EEEEeccCC--CceEEEEEEecCCEEEEeecCCeEEeeeecccc
Confidence            3567788889998887763 3433  22221 11  011111122  2567777765555444 4567765 11122456


Q ss_pred             CcEEcccCCCcccceeEEEEeeCCeEEEEeCCe
Q 036387          295 TWIREKAADNIAANLYSVKFINEKKGFVLGNDG  327 (334)
Q Consensus       295 tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G  327 (334)
                      +.+....|  .+..+..++..+.|.++.+|..-
T Consensus       426 NfRTft~P--~p~QfscvavD~sGelV~AG~~d  456 (893)
T KOG0291|consen  426 NFRTFTSP--EPIQFSCVAVDPSGELVCAGAQD  456 (893)
T ss_pred             eeeeecCC--CceeeeEEEEcCCCCEEEeeccc
Confidence            66766663  45667777777778888777543


No 88 
>COG4692 Predicted neuraminidase (sialidase) [Carbohydrate transport and metabolism]
Probab=42.08  E-value=77  Score=29.86  Aligned_cols=58  Identities=16%  Similarity=0.248  Sum_probs=32.5

Q ss_pred             cceEEecCCCCCcEEcccCCCCCeeeEEEEEecCCC-CEEEEE----EcCCeEE--EEcCCCcCeEeCc
Q 036387           92 EQPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDL-NHGFLL----GTRQTLL--ETKDGGKTWAPRS  153 (334)
Q Consensus        92 g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~-~~~~av----G~~g~i~--~S~DgG~TW~~~~  153 (334)
                      ..+-+|.|.|++|+.-.....    .-.+...|.+. .+-|++    -..+.++  .+.|+|.+|....
T Consensus       178 a~v~~s~d~gk~wr~~~ln~s----~g~v~l~p~~~~~t~y~al~~~~q~~~~~~~el~~~~r~~~~~Q  242 (381)
T COG4692         178 AAVGPSLDLGKSWRLKDLNTS----DGCVHLSPYHEGDTQYAALFRRRQADNVYRCELLDGGRTWSQPQ  242 (381)
T ss_pred             cccccccccCceeeecccccc----CccEecChhhcccccchhhhhhhhcCCeeeeeeccCcccccCcC
Confidence            456779999999987643322    11222221100 112222    1346678  6899999998764


No 89 
>PTZ00334 trans-sialidase; Provisional
Probab=41.97  E-value=60  Score=34.53  Aligned_cols=59  Identities=12%  Similarity=0.016  Sum_probs=33.6

Q ss_pred             cceEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEE--EcCC--eEEEEcCCCcCeEeCc
Q 036387           92 EQPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLL--GTRQ--TLLETKDGGKTWAPRS  153 (334)
Q Consensus        92 g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~av--G~~g--~i~~S~DgG~TW~~~~  153 (334)
                      ..|++|+|.|. |..-..-...+..-..|.=.  +...++.+  .++|  .+|.|.|-|.||++..
T Consensus       288 slIiYS~d~g~-W~ls~g~s~~gC~~P~I~EW--e~gkLlM~t~C~dG~RrVYES~DmG~tWtEAl  350 (780)
T PTZ00334        288 SLIIYSSATES-GNLSKGMSADGCSDPSVVEW--KEGKLMMMTACDDGRRRVYESGDKGDSWTEAL  350 (780)
T ss_pred             EEEEEecCCCC-eEEcCCCCCCCCCCCEEEEE--cCCeEEEEEEeCCCCEEEEEECCCCCChhhCC
Confidence            46888999885 97533111111222233333  22344332  3455  4999999999999753


No 90 
>PF13810 DUF4185:  Domain of unknown function (DUF4185)
Probab=40.75  E-value=37  Score=32.08  Aligned_cols=17  Identities=24%  Similarity=0.257  Sum_probs=15.5

Q ss_pred             cceEEecCCCCCcEEcc
Q 036387           92 EQPAKSEEALSAWERVY  108 (334)
Q Consensus        92 g~i~~S~DgG~tW~~~~  108 (334)
                      ..|++|+|+|++|+.+.
T Consensus       129 S~i~~S~D~G~tW~~~~  145 (316)
T PF13810_consen  129 SGIAYSDDNGETWTVVP  145 (316)
T ss_pred             eEEEEeCCCCCCceeCC
Confidence            56999999999999886


No 91 
>KOG1036 consensus Mitotic spindle checkpoint protein BUB3, WD repeat superfamily [Cell cycle control, cell division, chromosome partitioning]
Probab=40.11  E-value=3.2e+02  Score=25.70  Aligned_cols=189  Identities=14%  Similarity=0.149  Sum_probs=93.7

Q ss_pred             CeeeEEEEEecCCCCEEEEEEcCCeEEEEcC--CCcCeEeCcCCCCcccCcceeEEEEEEeC-CeEEEEEcCCEEEEEcC
Q 036387          114 GVVLLDIAFVPDDLNHGFLLGTRQTLLETKD--GGKTWAPRSIPSAEEEDFNYRFNSISFKG-KEGWIVGKPAILLHTSD  190 (334)
Q Consensus       114 ~~~l~~I~~~p~d~~~~~avG~~g~i~~S~D--gG~TW~~~~~p~~~~~~~~~~~~~I~~~~-~~~~~vG~~g~i~~S~D  190 (334)
                      +.++.+-+|.  |..+++..+-+|.|.+ -|  .|.+-+ +.   .+.    -.+++|.... ...++.|.....++=-|
T Consensus        54 ~~plL~c~F~--d~~~~~~G~~dg~vr~-~Dln~~~~~~-ig---th~----~~i~ci~~~~~~~~vIsgsWD~~ik~wD  122 (323)
T KOG1036|consen   54 GAPLLDCAFA--DESTIVTGGLDGQVRR-YDLNTGNEDQ-IG---THD----EGIRCIEYSYEVGCVISGSWDKTIKFWD  122 (323)
T ss_pred             CCceeeeecc--CCceEEEeccCceEEE-EEecCCccee-ec---cCC----CceEEEEeeccCCeEEEcccCccEEEEe
Confidence            4789999998  5688888888887654 33  333322 11   111    1366777663 44555555444445444


Q ss_pred             CCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEE-EcCCe--EEEecCCCcceeeEeccccCCCeeeE
Q 036387          191 AGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLL-VRGGG--LFLSKGTGITEEFEEVPVQSRGFGIL  267 (334)
Q Consensus       191 gG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~-~~~g~--i~~S~D~G~tW~w~~~~~~~~~~~~~  267 (334)
                      .=+   +......-.+.             .+..+  +..+..+++ +.+..  +|....-...  ++.-... -.+...
T Consensus       123 ~R~---~~~~~~~d~~k-------------kVy~~--~v~g~~LvVg~~~r~v~iyDLRn~~~~--~q~reS~-lkyqtR  181 (323)
T KOG1036|consen  123 PRN---KVVVGTFDQGK-------------KVYCM--DVSGNRLVVGTSDRKVLIYDLRNLDEP--FQRRESS-LKYQTR  181 (323)
T ss_pred             ccc---cccccccccCc-------------eEEEE--eccCCEEEEeecCceEEEEEcccccch--hhhcccc-ceeEEE
Confidence            322   11111000000             12222  223444444 43333  4444443331  1111111 123456


Q ss_pred             EEEeecCCeEEEEeC-CCcEEE-EcCCC-----cC--cEEcccCC---CcccceeEEEEee-CCeEEEEeCCeeEEEEcC
Q 036387          268 DVGYRSQDEAWAAGG-SGVLLK-TTNGG-----KT--WIREKAAD---NIAANLYSVKFIN-EKKGFVLGNDGVLLQYLG  334 (334)
Q Consensus       268 ~v~~~~~~~~~~~G~-~G~i~~-S~DgG-----~t--W~~~~~~~---~~~~~l~~i~~~~-~~~~~a~G~~G~il~s~~  334 (334)
                      +|+..+.+.+|+++. +|.+++ --|.-     +.  ++-.....   ..--++.+|+|.+ -++++-.|.+|.+..+++
T Consensus       182 ~v~~~pn~eGy~~sSieGRVavE~~d~s~~~~skkyaFkCHr~~~~~~~~~yPVNai~Fhp~~~tfaTgGsDG~V~~Wd~  261 (323)
T KOG1036|consen  182 CVALVPNGEGYVVSSIEGRVAVEYFDDSEEAQSKKYAFKCHRLSEKDTEIIYPVNAIAFHPIHGTFATGGSDGIVNIWDL  261 (323)
T ss_pred             EEEEecCCCceEEEeecceEEEEccCCchHHhhhceeEEeeecccCCceEEEEeceeEeccccceEEecCCCceEEEccC
Confidence            788778788898865 676532 22322     00  00001100   1224678999987 466777789999988764


No 92 
>KOG1063 consensus RNA polymerase II elongator complex, subunit ELP2, WD repeat superfamily [Chromatin structure and dynamics; Transcription]
Probab=39.57  E-value=3.2e+02  Score=28.67  Aligned_cols=103  Identities=23%  Similarity=0.360  Sum_probs=63.1

Q ss_pred             EeecCCEEEE-EcCCe--EEEecCCCcceeeEeccccCC-CeeeEEEEeecCCeEEE-EeCCC--cEEEEcCCCcCcEEc
Q 036387          227 WRADGGLWLL-VRGGG--LFLSKGTGITEEFEEVPVQSR-GFGILDVGYRSQDEAWA-AGGSG--VLLKTTNGGKTWIRE  299 (334)
Q Consensus       227 ~~~~g~~~~~-~~~g~--i~~S~D~G~tW~w~~~~~~~~-~~~~~~v~~~~~~~~~~-~G~~G--~i~~S~DgG~tW~~~  299 (334)
                      +.+++..+++ +..|+  ++++.|.+.   |+..+.... -..+.+|+..+.++.++ +|.+-  .+|.---.-.+|-.+
T Consensus       324 w~~n~~~ii~~g~~Gg~hlWkt~d~~~---w~~~~~iSGH~~~V~dv~W~psGeflLsvs~DQTTRlFa~wg~q~~wHEi  400 (764)
T KOG1063|consen  324 WSPNSNVIIAHGRTGGFHLWKTKDKTF---WTQEPVISGHVDGVKDVDWDPSGEFLLSVSLDQTTRLFARWGRQQEWHEI  400 (764)
T ss_pred             EcCCCCEEEEecccCcEEEEeccCccc---eeeccccccccccceeeeecCCCCEEEEeccccceeeecccccccceeee
Confidence            3455554443 23343  567777764   666554432 13578898887777554 45542  333221123459999


Q ss_pred             ccCCCcccceeEEEEeeCCeEEEEeCCeeEEEE
Q 036387          300 KAADNIAANLYSVKFINEKKGFVLGNDGVLLQY  332 (334)
Q Consensus       300 ~~~~~~~~~l~~i~~~~~~~~~a~G~~G~il~s  332 (334)
                      ..|.--...+..++|.+....|+.|.+-.|+|.
T Consensus       401 aRPQiHGyDl~c~~~vn~~~~FVSgAdEKVlRv  433 (764)
T KOG1063|consen  401 ARPQIHGYDLTCLSFVNEDLQFVSGADEKVLRV  433 (764)
T ss_pred             cccccccccceeeehccCCceeeecccceeeee
Confidence            886222356889999987788999988888874


No 93 
>PF13810 DUF4185:  Domain of unknown function (DUF4185)
Probab=38.46  E-value=38  Score=32.01  Aligned_cols=43  Identities=19%  Similarity=0.349  Sum_probs=27.0

Q ss_pred             CCcEEEEcCCCcCcEEcccCC--Cc---cc------ceeEEEEe-eCCeEEEEeC
Q 036387          283 SGVLLKTTNGGKTWIREKAAD--NI---AA------NLYSVKFI-NEKKGFVLGN  325 (334)
Q Consensus       283 ~G~i~~S~DgG~tW~~~~~~~--~~---~~------~l~~i~~~-~~~~~~a~G~  325 (334)
                      ...|++|+|.|+||+......  +.   ..      ++.-.++. +++-+|+.|.
T Consensus       128 ~S~i~~S~D~G~tW~~~~~~~~~~~~~~~g~~~~~~~fq~~a~~~~dgyVYv~gt  182 (316)
T PF13810_consen  128 YSGIAYSDDNGETWTVVPGTIRPNSPFHPGFNQGNWNFQMAAFVKDDGYVYVYGT  182 (316)
T ss_pred             ceEEEEeCCCCCCceeCCCcccccccccCCccccccccccccccCCCCEEEEEeC
Confidence            456899999999999997310  11   01      22223333 5778888764


No 94 
>KOG0301 consensus Phospholipase A2-activating protein (contains WD40 repeats) [Lipid transport and metabolism]
Probab=38.33  E-value=5e+02  Score=27.31  Aligned_cols=64  Identities=11%  Similarity=0.179  Sum_probs=43.5

Q ss_pred             eeEEEEeecCCeEEEEeCCCcEEE-EcCCCcCcEEcccCCCcccceeEEE-EeeCCeEEEEeCCeeEEEE
Q 036387          265 GILDVGYRSQDEAWAAGGSGVLLK-TTNGGKTWIREKAADNIAANLYSVK-FINEKKGFVLGNDGVLLQY  332 (334)
Q Consensus       265 ~~~~v~~~~~~~~~~~G~~G~i~~-S~DgG~tW~~~~~~~~~~~~l~~i~-~~~~~~~~a~G~~G~il~s  332 (334)
                      .+.++++.++..+.-++.+|.|-+ +.|| +.=.....   ....+|+|. +.+++.++-+|+++.+-.+
T Consensus       181 ~VRgL~vl~~~~flScsNDg~Ir~w~~~g-e~l~~~~g---htn~vYsis~~~~~~~Ivs~gEDrtlriW  246 (745)
T KOG0301|consen  181 CVRGLAVLDDSHFLSCSNDGSIRLWDLDG-EVLLEMHG---HTNFVYSISMALSDGLIVSTGEDRTLRIW  246 (745)
T ss_pred             heeeeEEecCCCeEeecCCceEEEEeccC-ceeeeeec---cceEEEEEEecCCCCeEEEecCCceEEEe
Confidence            466777788888888899998744 3444 33333322   346899998 4566777778999987654


No 95 
>KOG1063 consensus RNA polymerase II elongator complex, subunit ELP2, WD repeat superfamily [Chromatin structure and dynamics; Transcription]
Probab=37.95  E-value=1.6e+02  Score=30.74  Aligned_cols=95  Identities=15%  Similarity=0.237  Sum_probs=61.1

Q ss_pred             ceEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCC--eEEEEcCCCcCeEeCcCCCCcccCcceeEEEEE
Q 036387           93 QPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQ--TLLETKDGGKTWAPRSIPSAEEEDFNYRFNSIS  170 (334)
Q Consensus        93 ~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g--~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~  170 (334)
                      .++||.|. ..|++...+...-..+.+|+..|. .+-++.+|.+-  .|+.---.-++|.++..|.-+    +|.++++.
T Consensus       341 hlWkt~d~-~~w~~~~~iSGH~~~V~dv~W~ps-GeflLsvs~DQTTRlFa~wg~q~~wHEiaRPQiH----GyDl~c~~  414 (764)
T KOG1063|consen  341 HLWKTKDK-TFWTQEPVISGHVDGVKDVDWDPS-GEFLLSVSLDQTTRLFARWGRQQEWHEIARPQIH----GYDLTCLS  414 (764)
T ss_pred             EEEeccCc-cceeeccccccccccceeeeecCC-CCEEEEeccccceeeecccccccceeeecccccc----cccceeee
Confidence            45665553 458776554443467889999873 45566667543  244322234569999988764    46788888


Q ss_pred             EeC-CeEEEEEcCCEEEEEcCCCC
Q 036387          171 FKG-KEGWIVGKPAILLHTSDAGE  193 (334)
Q Consensus       171 ~~~-~~~~~vG~~g~i~~S~DgG~  193 (334)
                      |.+ +..|+.|..-.|+|.=+.-+
T Consensus       415 ~vn~~~~FVSgAdEKVlRvF~aPk  438 (764)
T KOG1063|consen  415 FVNEDLQFVSGADEKVLRVFEAPK  438 (764)
T ss_pred             hccCCceeeecccceeeeeecCcH
Confidence            876 77888877766776654433


No 96 
>KOG0318 consensus WD40 repeat stress protein/actin interacting protein [Cytoskeleton]
Probab=37.08  E-value=4.7e+02  Score=26.63  Aligned_cols=102  Identities=17%  Similarity=0.224  Sum_probs=64.4

Q ss_pred             EeeeeEeecCCEEEEEcC-C-eEEEecCCCc----ceeeEeccccCCCeeeEEEEeecCCeEEEEeC--CCcEEEEcCCC
Q 036387          222 IQNMGWRADGGLWLLVRG-G-GLFLSKGTGI----TEEFEEVPVQSRGFGILDVGYRSQDEAWAAGG--SGVLLKTTNGG  293 (334)
Q Consensus       222 i~~~~~~~~g~~~~~~~~-g-~i~~S~D~G~----tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~--~G~i~~S~DgG  293 (334)
                      |..+.+++|+..++++.. + -+.++....+    .|.|..       ..+.+++..+++..+|.|.  ...+.++-+.-
T Consensus       490 iT~vaySpd~~yla~~Da~rkvv~yd~~s~~~~~~~w~FHt-------akI~~~aWsP~n~~vATGSlDt~Viiysv~kP  562 (603)
T KOG0318|consen  490 ITDVAYSPDGAYLAAGDASRKVVLYDVASREVKTNRWAFHT-------AKINCVAWSPNNKLVATGSLDTNVIIYSVKKP  562 (603)
T ss_pred             ceEEEECCCCcEEEEeccCCcEEEEEcccCceecceeeeee-------eeEEEEEeCCCceEEEeccccceEEEEEccCh
Confidence            556778888887776642 2 2444443322    222222       2578899988888888765  23445565554


Q ss_pred             cCcEEcccCCCcccceeEEEEeeCCeEEEEeCCeeEEEE
Q 036387          294 KTWIREKAADNIAANLYSVKFINEKKGFVLGNDGVLLQY  332 (334)
Q Consensus       294 ~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G~il~s  332 (334)
                      ..=-.+..+ . ...++.+.+.++.+++-.|++--|-.+
T Consensus       563 ~~~i~iknA-H-~~gVn~v~wlde~tvvSsG~Da~iK~W  599 (603)
T KOG0318|consen  563 AKHIIIKNA-H-LGGVNSVAWLDESTVVSSGQDANIKVW  599 (603)
T ss_pred             hhheEeccc-c-ccCceeEEEecCceEEeccCcceeEEe
Confidence            444555442 2 234999999999999999998776543


No 97 
>PLN03215 ascorbic acid mannose pathway regulator 1; Provisional
Probab=36.98  E-value=1.2e+02  Score=29.33  Aligned_cols=51  Identities=10%  Similarity=0.106  Sum_probs=34.6

Q ss_pred             EEEEeCCCcEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeCCeeEEEEc
Q 036387          277 AWAAGGSGVLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGNDGVLLQYL  333 (334)
Q Consensus       277 ~~~~G~~G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G~il~s~  333 (334)
                      +++++..|.+..=.|  ++|..+..   ....+.+|.+. +|++||+...|.++..+
T Consensus       175 vl~i~~~g~l~~w~~--~~Wt~l~~---~~~~~~DIi~~-kGkfYAvD~~G~l~~i~  225 (373)
T PLN03215        175 VLGIGRDGKINYWDG--NVLKALKQ---MGYHFSDIIVH-KGQTYALDSIGIVYWIN  225 (373)
T ss_pred             EEEEeecCcEeeecC--CeeeEccC---CCceeeEEEEE-CCEEEEEcCCCeEEEEe
Confidence            444555666633223  78999975   24578888886 68899998888877543


No 98 
>PLN02153 epithiospecifier protein
Probab=36.98  E-value=3.6e+02  Score=25.25  Aligned_cols=53  Identities=8%  Similarity=0.073  Sum_probs=29.8

Q ss_pred             CCeEEEEeCC---------------CcEEEEcCCCcCcEEcccCC--Ccccce---eEEEEeeCCeEEEEeCC
Q 036387          274 QDEAWAAGGS---------------GVLLKTTNGGKTWIREKAAD--NIAANL---YSVKFINEKKGFVLGND  326 (334)
Q Consensus       274 ~~~~~~~G~~---------------G~i~~S~DgG~tW~~~~~~~--~~~~~l---~~i~~~~~~~~~a~G~~  326 (334)
                      ++.+|++|..               ..+|.-.-.-++|+.+....  +.+...   ..+....++.+|+.|..
T Consensus       251 ~~~iyv~GG~~~~~~~~~~~~~~~~n~v~~~d~~~~~W~~~~~~~~~~~pr~~~~~~~~~v~~~~~~~~~gG~  323 (341)
T PLN02153        251 GKYIIIFGGEVWPDLKGHLGPGTLSNEGYALDTETLVWEKLGECGEPAMPRGWTAYTTATVYGKNGLLMHGGK  323 (341)
T ss_pred             CCEEEEECcccCCccccccccccccccEEEEEcCccEEEeccCCCCCCCCCccccccccccCCcceEEEEcCc
Confidence            5788988763               14555555567899886421  112222   22332345678887754


No 99 
>PF03404 Mo-co_dimer:  Mo-co oxidoreductase dimerisation domain;  InterPro: IPR005066 The majority of molybdenum-containing enzymes utilise a molybdenum cofactor (MoCF or Moco) consisting of a Mo atom coordinated via a cis-dithiolene moiety to molybdopterin (MPT). MoCF is ubiquitous in nature, and the pathway for MoCF biosynthesis is conserved in all three domains of life. MoCF-containing enzymes function as oxidoreductases in carbon, nitrogen, and sulphur metabolism [, ].  In Escherichia coli, biosynthesis of MoCF is a three stage process. It begins with the MoaA and MoaC conversion of GTP to the meta-stable pterin intermediate precursor Z. The second stage involves MPT synthase (MoaD and MoaE), which converts precursor Z to MPT; MoeB is involved in the recycling of MPT synthase. The final step in MoCF synthesis is the attachment of mononuclear Mo to MPT, a process that requires MoeA and which is enhanced by MogA in an Mg2 ATP-dependent manner []. MoCF is the active co-factor in eukaryotic and some prokaryotic molybdo-enzymes, but the majority of bacterial enzymes requiring MoCF, need a modification of MTP for it to be active; MobA is involved in the attachment of a nucleotide monophosphate to MPT resulting in the MGD co-factor, the active co-factor for most prokaryotic molybdo-enzymes. Bacterial two-hybrid studies have revealed the close interactions between MoeA, MogA, and MobA in the synthesis of MoCF []. Moreover the close functional association of MoeA and MogA in the synthesis of MoCF is supported by fact that the known eukaryotic homologues to MoeA and MogA exist as fusion proteins: CNX1 (Q39054 from SWISSPROT) of Arabidopsis thaliana (Mouse-ear cress), mammalian Gephryin (e.g. Q9NQX3 from SWISSPROT) and Drosophila melanogaster (Fruit fly) Cinnamon (P39205 from SWISSPROT) []. This domain is found in molybdopterin cofactor oxidoreductases, such as in the C-terminal of Mo-containing sulphite oxidase, which catalyses the conversion of sulphite to sulphate, the terminal step in the oxidative degradation of cysteine and methionine []. This domain is involved in dimer formation, and has an Ig-fold structure [].; GO: 0016491 oxidoreductase activity, 0030151 molybdenum ion binding, 0055114 oxidation-reduction process; PDB: 2C9X_A 2CA3_A 2BLF_A 2CA4_A 2BPB_A 2XTS_C 2BII_A 2BIH_A 1OGP_A 2A9A_B ....
Probab=36.24  E-value=48  Score=26.96  Aligned_cols=17  Identities=35%  Similarity=0.661  Sum_probs=13.4

Q ss_pred             EEEEcCCCcCcEEcccC
Q 036387          286 LLKTTNGGKTWIREKAA  302 (334)
Q Consensus       286 i~~S~DgG~tW~~~~~~  302 (334)
                      +=.|.|+|+||+.....
T Consensus        46 VEVS~DgG~tW~~A~l~   62 (131)
T PF03404_consen   46 VEVSTDGGKTWQEATLD   62 (131)
T ss_dssp             EEEESSTTSSEEE-EEE
T ss_pred             EEEEeCCCCCcEEeEec
Confidence            45799999999998763


No 100
>KOG1523 consensus Actin-related protein Arp2/3 complex, subunit ARPC1/p41-ARC [Cytoskeleton]
Probab=35.65  E-value=4e+02  Score=25.39  Aligned_cols=213  Identities=17%  Similarity=0.253  Sum_probs=105.3

Q ss_pred             eEEecCCCCCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcC-CeEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEe
Q 036387           94 PAKSEEALSAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTR-QTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFK  172 (334)
Q Consensus        94 i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~-g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~  172 (334)
                      || +.++.+-|+....-.+.+..++.|...| ..+++.-++++ +..+-+.-.|.+|.+...-...    +-..+.|.-.
T Consensus        36 iy-~~~~~~~w~~~htls~Hd~~vtgvdWap-~snrIvtcs~drnayVw~~~~~~~WkptlvLlRi----NrAAt~V~Ws  109 (361)
T KOG1523|consen   36 IY-SMLGADLWEPAHTLSEHDKIVTGVDWAP-KSNRIVTCSHDRNAYVWTQPSGGTWKPTLVLLRI----NRAATCVKWS  109 (361)
T ss_pred             EE-EecCCCCceeceehhhhCcceeEEeecC-CCCceeEccCCCCccccccCCCCeeccceeEEEe----ccceeeEeec
Confidence            44 4666667998865444457788898887 45677766653 4333344235679876421111    0123344444


Q ss_pred             C-CeEEEEEcCCE----EEEEcCCCCCe-EEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEc-CC--eE-
Q 036387          173 G-KEGWIVGKPAI----LLHTSDAGESW-ERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVR-GG--GL-  242 (334)
Q Consensus       173 ~-~~~~~vG~~g~----i~~S~DgG~TW-~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~-~g--~i-  242 (334)
                      + ...|++|..+.    .|...  -+.| -.....  .|            +..++..+.+.+++.+.+++. ++  .+ 
T Consensus       110 P~enkFAVgSgar~isVcy~E~--ENdWWVsKhik--kP------------irStv~sldWhpnnVLlaaGs~D~k~rVf  173 (361)
T KOG1523|consen  110 PKENKFAVGSGARLISVCYYEQ--ENDWWVSKHIK--KP------------IRSTVTSLDWHPNNVLLAAGSTDGKCRVF  173 (361)
T ss_pred             CcCceEEeccCccEEEEEEEec--ccceehhhhhC--Cc------------cccceeeeeccCCcceecccccCcceeEE
Confidence            5 67788887552    22221  1235 211110  01            112344455555555555442 11  11 


Q ss_pred             ---EE---ecCCCcceeeEecccc-------CCCeeeEEEEeecCCeEEE-EeCCCcEEEEcCCCcCcEEcccCCCcccc
Q 036387          243 ---FL---SKGTGITEEFEEVPVQ-------SRGFGILDVGYRSQDEAWA-AGGSGVLLKTTNGGKTWIREKAADNIAAN  308 (334)
Q Consensus       243 ---~~---S~D~G~tW~w~~~~~~-------~~~~~~~~v~~~~~~~~~~-~G~~G~i~~S~DgG~tW~~~~~~~~~~~~  308 (334)
                         .+   ..+....|- .+++..       ..+..+.++.|.+.+..++ ++.+..+..-.+.|.. +++........+
T Consensus       174 SayIK~Vdekpap~pWg-sk~PFG~lm~E~~~~ggwvh~v~fs~sG~~lawv~Hds~v~~~da~~p~-~~v~~~~~~~lP  251 (361)
T KOG1523|consen  174 SAYIKGVDEKPAPTPWG-SKMPFGQLMSEASSSGGWVHGVLFSPSGNRLAWVGHDSTVSFVDAAGPS-ERVQSVATAQLP  251 (361)
T ss_pred             EEeeeccccCCCCCCCc-cCCcHHHHHHhhccCCCceeeeEeCCCCCEeeEecCCCceEEeecCCCc-hhccchhhccCC
Confidence               11   222333331 112211       1122467777765443322 3666666444444432 122221112367


Q ss_pred             eeEEEEeeCCeEEEEeCC-eeEE
Q 036387          309 LYSVKFINEKKGFVLGND-GVLL  330 (334)
Q Consensus       309 l~~i~~~~~~~~~a~G~~-G~il  330 (334)
                      +.++.|..++.++++|.+ +-++
T Consensus       252 ~ls~~~ise~~vv~ag~~c~P~l  274 (361)
T KOG1523|consen  252 LLSVSWISENSVVAAGYDCGPVL  274 (361)
T ss_pred             ceeeEeecCCceeecCCCCCceE
Confidence            889999999999999987 4333


No 101
>PF06977 SdiA-regulated:  SdiA-regulated;  InterPro: IPR009722 This entry represents a conserved region approximately 100 residues long within a number of hypothetical bacterial proteins that may be regulated by SdiA, a member of the LuxR family of transcriptional regulators []. Some proteins contain the IPR001258 from INTERPRO repeat.; PDB: 3QQZ_A.
Probab=35.04  E-value=3.5e+02  Score=24.57  Aligned_cols=198  Identities=14%  Similarity=0.256  Sum_probs=88.8

Q ss_pred             eeeEEEEEecCCCCEEEEEEcC-CeEE-EEcCCCcCeEeCcCCCCcccCcceeEEEEEEeCCeEEEEEc--CCEE--EEE
Q 036387          115 VVLLDIAFVPDDLNHGFLLGTR-QTLL-ETKDGGKTWAPRSIPSAEEEDFNYRFNSISFKGKEGWIVGK--PAIL--LHT  188 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG~~-g~i~-~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~~~~~~vG~--~g~i--~~S  188 (334)
                      ..+.+|++.| +.+++|+|... +.|+ .+.+ |+==.++.+....      -..+|++.++..|++.+  .+.|  +.-
T Consensus        22 ~e~SGLTy~p-d~~tLfaV~d~~~~i~els~~-G~vlr~i~l~g~~------D~EgI~y~g~~~~vl~~Er~~~L~~~~~   93 (248)
T PF06977_consen   22 DELSGLTYNP-DTGTLFAVQDEPGEIYELSLD-GKVLRRIPLDGFG------DYEGITYLGNGRYVLSEERDQRLYIFTI   93 (248)
T ss_dssp             S-EEEEEEET-TTTEEEEEETTTTEEEEEETT---EEEEEE-SS-S------SEEEEEE-STTEEEEEETTTTEEEEEEE
T ss_pred             CCccccEEcC-CCCeEEEEECCCCEEEEEcCC-CCEEEEEeCCCCC------CceeEEEECCCEEEEEEcCCCcEEEEEE
Confidence            4589999998 56889999764 4443 3555 4433333333322      25577776644555543  3433  333


Q ss_pred             cCCCCCeEE-----eecCCCCCCCcccccccCccccceEeeeeEeec-CCEEEEEcCC--eEEEecC--CCcceeeEe-c
Q 036387          189 SDAGESWER-----IPLSSQLPGDMAFWQPHNRAVARRIQNMGWRAD-GGLWLLVRGG--GLFLSKG--TGITEEFEE-V  257 (334)
Q Consensus       189 ~DgG~TW~~-----~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~-g~~~~~~~~g--~i~~S~D--~G~tW~w~~-~  257 (334)
                      .+.+++=+.     +...  ++      ...|.    .+..+++.+. ++++++-+..  .||...-  .+..-.... .
T Consensus        94 ~~~~~~~~~~~~~~~~l~--~~------~~~N~----G~EGla~D~~~~~L~v~kE~~P~~l~~~~~~~~~~~~~~~~~~  161 (248)
T PF06977_consen   94 DDDTTSLDRADVQKISLG--FP------NKGNK----GFEGLAYDPKTNRLFVAKERKPKRLYEVNGFPGGFDLFVSDDQ  161 (248)
T ss_dssp             ----TT--EEEEEEEE-----S---------SS------EEEEEETTTTEEEEEEESSSEEEEEEESTT-SS--EEEE-H
T ss_pred             eccccccchhhceEEecc--cc------cCCCc----ceEEEEEcCCCCEEEEEeCCCChhhEEEccccCccceeecccc
Confidence            333332222     2211  11      11121    2455666654 4566654432  3443321  111000000 1


Q ss_pred             ccc---CCCeeeEEEEeec-CCeEEEEeC-CCcEEEEcCCCcCcEEcccCCCc------ccceeEEEEeeCCeEEEEeCC
Q 036387          258 PVQ---SRGFGILDVGYRS-QDEAWAAGG-SGVLLKTTNGGKTWIREKAADNI------AANLYSVKFINEKKGFVLGND  326 (334)
Q Consensus       258 ~~~---~~~~~~~~v~~~~-~~~~~~~G~-~G~i~~S~DgG~tW~~~~~~~~~------~~~l~~i~~~~~~~~~a~G~~  326 (334)
                      ...   .....+-+++|.+ .+++|+... +..|+..+..|+--+.+....+.      -..--.|++.++|++|++.+-
T Consensus       162 ~~~~~~~~~~d~S~l~~~p~t~~lliLS~es~~l~~~d~~G~~~~~~~L~~g~~gl~~~~~QpEGIa~d~~G~LYIvsEp  241 (248)
T PF06977_consen  162 DLDDDKLFVRDLSGLSYDPRTGHLLILSDESRLLLELDRQGRVVSSLSLDRGFHGLSKDIPQPEGIAFDPDGNLYIVSEP  241 (248)
T ss_dssp             HHH-HT--SS---EEEEETTTTEEEEEETTTTEEEEE-TT--EEEEEE-STTGGG-SS---SEEEEEE-TT--EEEEETT
T ss_pred             ccccccceeccccceEEcCCCCeEEEEECCCCeEEEECCCCCEEEEEEeCCcccCcccccCCccEEEECCCCCEEEEcCC
Confidence            111   1112345677665 467877655 56778888888766666553211      124668999999999999998


Q ss_pred             eeEEEE
Q 036387          327 GVLLQY  332 (334)
Q Consensus       327 G~il~s  332 (334)
                      -.+++.
T Consensus       242 Nlfy~f  247 (248)
T PF06977_consen  242 NLFYRF  247 (248)
T ss_dssp             TEEEEE
T ss_pred             ceEEEe
Confidence            877764


No 102
>cd02113 bact_SoxC_Moco bacterial SoxC is a member of the sulfite oxidase (SO) family of molybdopterin binding domains. SoxC is involved in oxidation of sulfur compounds during chemolithothrophic growth. Together with SoxD, a small c-type heme containing subunit, it forms a hetrotetrameric sulfite dehydrogenase. This molybdopterin cofactor (Moco) binding domain is found in a variety of oxidoreductases, main members of this family are nitrate reductase (NR) and sulfite oxidase (SO). Common features of all known members of this family are that they contain one single pterin cofactor and part of the coordination of the metal (Mo) is a cysteine ligand of the protein and that they catalyze the transfer of an oxygen to or from a lone pair of electrons on the substrate.
Probab=34.80  E-value=42  Score=31.91  Aligned_cols=17  Identities=29%  Similarity=0.628  Sum_probs=14.4

Q ss_pred             EEEEcCCCcCeEeCcCC
Q 036387          139 LLETKDGGKTWAPRSIP  155 (334)
Q Consensus       139 i~~S~DgG~TW~~~~~p  155 (334)
                      +-.|.|+|+||+...+.
T Consensus       243 VEVS~DgG~tW~~A~l~  259 (326)
T cd02113         243 VDVSFDGGRTWQDARLE  259 (326)
T ss_pred             EEEEcCCCCCceECccC
Confidence            66799999999998763


No 103
>KOG0284 consensus Polyadenylation factor I complex, subunit PFS2 [RNA processing and modification]
Probab=34.31  E-value=1.6e+02  Score=28.86  Aligned_cols=104  Identities=16%  Similarity=0.293  Sum_probs=51.8

Q ss_pred             EeeeeEeecCCEEEEEcCCeEEEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeCCCcEEEEcCCCcCcEEccc
Q 036387          222 IQNMGWRADGGLWLLVRGGGLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVLLKTTNGGKTWIREKA  301 (334)
Q Consensus       222 i~~~~~~~~g~~~~~~~~g~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i~~S~DgG~tW~~~~~  301 (334)
                      |..+.+.++|+-++++..-+-|. -=+|.+..|+.+--..+ ..+..+.+..++.-.+.|+.|...+      -|+.--.
T Consensus        99 V~~v~WtPeGRRLltgs~SGEFt-LWNg~~fnFEtilQaHD-s~Vr~m~ws~~g~wmiSgD~gG~iK------yWqpnmn  170 (464)
T KOG0284|consen   99 VNVVRWTPEGRRLLTGSQSGEFT-LWNGTSFNFETILQAHD-SPVRTMKWSHNGTWMISGDKGGMIK------YWQPNMN  170 (464)
T ss_pred             eeeEEEcCCCceeEeecccccEE-EecCceeeHHHHhhhhc-ccceeEEEccCCCEEEEcCCCceEE------ecccchh
Confidence            44566788887555543322111 11233333332211111 2345555554455445555444333      3665322


Q ss_pred             C-----CCcccceeEEEEeeCCeEEE-EeCCeeEEEEc
Q 036387          302 A-----DNIAANLYSVKFINEKKGFV-LGNDGVLLQYL  333 (334)
Q Consensus       302 ~-----~~~~~~l~~i~~~~~~~~~a-~G~~G~il~s~  333 (334)
                      -     ..-.+.+.+++|+++...|+ +.++|.|..++
T Consensus       171 nVk~~~ahh~eaIRdlafSpnDskF~t~SdDg~ikiWd  208 (464)
T KOG0284|consen  171 NVKIIQAHHAEAIRDLAFSPNDSKFLTCSDDGTIKIWD  208 (464)
T ss_pred             hhHHhhHhhhhhhheeccCCCCceeEEecCCCeEEEEe
Confidence            0     01125789999987666665 56888887654


No 104
>KOG0641 consensus WD40 repeat protein [General function prediction only]
Probab=33.44  E-value=2.4e+02  Score=25.45  Aligned_cols=80  Identities=11%  Similarity=0.207  Sum_probs=47.1

Q ss_pred             eeEeccccCCCeeeEEEEeecCCeEEEEeCCCcEEEEc------CCCcCcEEcccC--------CCcccceeEEEEeeCC
Q 036387          253 EFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVLLKTT------NGGKTWIREKAA--------DNIAANLYSVKFINEK  318 (334)
Q Consensus       253 ~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i~~S~------DgG~tW~~~~~~--------~~~~~~l~~i~~~~~~  318 (334)
                      +|..+.+-.+...+.+++|.+.+.+|++|.+..-||--      |--.-=+....|        ..-...+|..++++.+
T Consensus        22 ~f~~i~~l~dsqairav~fhp~g~lyavgsnskt~ric~yp~l~~~r~~hea~~~pp~v~~kr~khhkgsiyc~~ws~~g  101 (350)
T KOG0641|consen   22 HFEAINILEDSQAIRAVAFHPAGGLYAVGSNSKTFRICAYPALIDLRHAHEAAKQPPSVLCKRNKHHKGSIYCTAWSPCG  101 (350)
T ss_pred             ceEEEEEecchhheeeEEecCCCceEEeccCCceEEEEccccccCcccccccccCCCeEEeeeccccCccEEEEEecCcc
Confidence            35555444444567889998889999998764433321      100000111111        0113578999999999


Q ss_pred             eEEEEeCCeeEEEE
Q 036387          319 KGFVLGNDGVLLQY  332 (334)
Q Consensus       319 ~~~a~G~~G~il~s  332 (334)
                      +++|.|.+-...|+
T Consensus       102 eliatgsndk~ik~  115 (350)
T KOG0641|consen  102 ELIATGSNDKTIKV  115 (350)
T ss_pred             CeEEecCCCceEEE
Confidence            99999987765554


No 105
>KOG2110 consensus Uncharacterized conserved protein, contains WD40 repeats [Function unknown]
Probab=33.32  E-value=2.1e+02  Score=27.54  Aligned_cols=64  Identities=11%  Similarity=0.263  Sum_probs=44.8

Q ss_pred             eeEEEEeecCCeEEEEeC-CCcE---EEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEE-EeCCeeEE
Q 036387          265 GILDVGYRSQDEAWAAGG-SGVL---LKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFV-LGNDGVLL  330 (334)
Q Consensus       265 ~~~~v~~~~~~~~~~~G~-~G~i---~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a-~G~~G~il  330 (334)
                      .+-+++|.+++..+|.+. .|.|   |...| |+--.....+ -....+++++|.++.+.++ +++.++|.
T Consensus       175 ~lAalafs~~G~llATASeKGTVIRVf~v~~-G~kl~eFRRG-~~~~~IySL~Fs~ds~~L~~sS~TeTVH  243 (391)
T KOG2110|consen  175 PLAALAFSPDGTLLATASEKGTVIRVFSVPE-GQKLYEFRRG-TYPVSIYSLSFSPDSQFLAASSNTETVH  243 (391)
T ss_pred             ceeEEEECCCCCEEEEeccCceEEEEEEcCC-ccEeeeeeCC-ceeeEEEEEEECCCCCeEEEecCCCeEE
Confidence            567888988899888654 5654   44444 6666666663 2357899999998877665 46777754


No 106
>PF10647 Gmad1:  Lipoprotein LpqB beta-propeller domain;  InterPro: IPR018910  The Gmad1 domain is found associated with IPR019606 from INTERPRO, in bacterial spore formation. It is predicted to have a beta-propeller fold and to have a passive binding role rather than a catalytic function owing to the low number of conserved hydrophilic residues. 
Probab=32.90  E-value=2.7e+02  Score=25.13  Aligned_cols=74  Identities=22%  Similarity=0.465  Sum_probs=40.6

Q ss_pred             EeeeeEeecCCEEEEEcC--C-eE-EEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeCCCcEEEEcCCCcCcE
Q 036387          222 IQNMGWRADGGLWLLVRG--G-GL-FLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVLLKTTNGGKTWI  297 (334)
Q Consensus       222 i~~~~~~~~g~~~~~~~~--g-~i-~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i~~S~DgG~tW~  297 (334)
                      +..+.|..++.+.+.+..  . .. +.+.|++..   +.++.......+.++. .....+|+ ..++.+++ ...|..|+
T Consensus       168 v~~v~W~~~~~L~V~~~~~~~~~~~~v~~dG~~~---~~l~~~~~~~~v~a~~-~~~~~~~~-t~~~~~~~-~~~~~~W~  241 (253)
T PF10647_consen  168 VTDVAWSDDSTLVVLGRSAGGPVVRLVSVDGGPS---TPLPSVNLGVPVVAVA-ASPSTVYV-TDDGGVLQ-SRSGASWR  241 (253)
T ss_pred             ceeeeecCCCEEEEEeCCCCCceeEEEEccCCcc---cccCCCCCCcceEEee-CCCcEEEE-ECCCcEEE-CCCCCcce
Confidence            445777777777766532  1 12 467787752   3331111122344443 22344444 45666766 45688999


Q ss_pred             Eccc
Q 036387          298 REKA  301 (334)
Q Consensus       298 ~~~~  301 (334)
                      .+..
T Consensus       242 ~v~~  245 (253)
T PF10647_consen  242 EVPG  245 (253)
T ss_pred             EccC
Confidence            9987


No 107
>KOG1524 consensus WD40 repeat-containing protein CHE-2 [General function prediction only]
Probab=32.85  E-value=2.5e+02  Score=28.67  Aligned_cols=53  Identities=9%  Similarity=0.251  Sum_probs=37.4

Q ss_pred             CeeeEEEEeecCCeEEEEeCCCcEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEe-CCeeE
Q 036387          263 GFGILDVGYRSQDEAWAAGGSGVLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLG-NDGVL  329 (334)
Q Consensus       263 ~~~~~~v~~~~~~~~~~~G~~G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G-~~G~i  329 (334)
                      .+.+.+|+|.++ +.|++|....+ |          +..  +....++.++++.+|+=.++| ..|.+
T Consensus       227 ey~ITSva~npd-~~~~v~S~nt~-R----------~~~--p~~GSifnlsWS~DGTQ~a~gt~~G~v  280 (737)
T KOG1524|consen  227 EYAITSVAFNPE-KDYLLWSYNTA-R----------FSS--PRVGSIFNLSWSADGTQATCGTSTGQL  280 (737)
T ss_pred             ccceeeeeeccc-cceeeeeeeee-e----------ecC--CCccceEEEEEcCCCceeeccccCceE
Confidence            468899999766 89999886654 3          333  234678999998888877765 55544


No 108
>KOG2111 consensus Uncharacterized conserved protein, contains WD40 repeats [Function unknown]
Probab=32.64  E-value=4.4e+02  Score=25.02  Aligned_cols=108  Identities=16%  Similarity=0.226  Sum_probs=59.8

Q ss_pred             eEeeeeEeecCCEEEEE-cCCeE---EEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEe-CCCcE--EEEcCCC
Q 036387          221 RIQNMGWRADGGLWLLV-RGGGL---FLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAG-GSGVL--LKTTNGG  293 (334)
Q Consensus       221 ~i~~~~~~~~g~~~~~~-~~g~i---~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G-~~G~i--~~S~DgG  293 (334)
                      .|..++..-+|.+++.. ..|.+   |-+.|+.+   -++..-......++.++|.++...+++. +.|.+  |.-.|.-
T Consensus       183 ~Iacv~Ln~~Gt~vATaStkGTLIRIFdt~~g~~---l~E~RRG~d~A~iy~iaFSp~~s~LavsSdKgTlHiF~l~~~~  259 (346)
T KOG2111|consen  183 DIACVALNLQGTLVATASTKGTLIRIFDTEDGTL---LQELRRGVDRADIYCIAFSPNSSWLAVSSDKGTLHIFSLRDTE  259 (346)
T ss_pred             ceeEEEEcCCccEEEEeccCcEEEEEEEcCCCcE---eeeeecCCchheEEEEEeCCCccEEEEEcCCCeEEEEEeecCC
Confidence            34455555677777654 46654   44556554   2333222222368899997766655553 34543  3333322


Q ss_pred             --cC-------------------cEEcccCCCcccceeEEEEeeC-CeEEEEeCCeeEEEE
Q 036387          294 --KT-------------------WIREKAADNIAANLYSVKFINE-KKGFVLGNDGVLLQY  332 (334)
Q Consensus       294 --~t-------------------W~~~~~~~~~~~~l~~i~~~~~-~~~~a~G~~G~il~s  332 (334)
                        +.                   |....-. -...+..-++|-.+ +++++++.+|..+|.
T Consensus       260 ~~~~~~SSl~~~~~~lpky~~S~wS~~~f~-l~~~~~~~~~fg~~~nsvi~i~~Dgsy~k~  319 (346)
T KOG2111|consen  260 NTEDESSSLSFKRLVLPKYFSSEWSFAKFQ-LPQGTQCIIAFGSETNTVIAICADGSYYKF  319 (346)
T ss_pred             CCccccccccccccccchhcccceeEEEEE-ccCCCcEEEEecCCCCeEEEEEeCCcEEEE
Confidence              11                   3332221 01235556667655 899999999998875


No 109
>KOG0275 consensus Conserved WD40 repeat-containing protein [General function prediction only]
Probab=32.42  E-value=2.8e+02  Score=26.45  Aligned_cols=71  Identities=15%  Similarity=0.182  Sum_probs=38.0

Q ss_pred             CCeeeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEeC--CeEEEEEcCCEEEE
Q 036387          113 PGVVLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFKG--KEGWIVGKPAILLH  187 (334)
Q Consensus       113 ~~~~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~--~~~~~vG~~g~i~~  187 (334)
                      .+..++.|...|.||.+.+++.-..+++.-.=.|+-=........+.++   .+.++ ..+  .-+|++|+.+.+|-
T Consensus       391 ~d~~vnsv~~~PKnpeh~iVCNrsntv~imn~qGQvVrsfsSGkREgGd---Fi~~~-lSpkGewiYcigED~vlYC  463 (508)
T KOG0275|consen  391 TDYPVNSVILLPKNPEHFIVCNRSNTVYIMNMQGQVVRSFSSGKREGGD---FINAI-LSPKGEWIYCIGEDGVLYC  463 (508)
T ss_pred             CcccceeEEEcCCCCceEEEEcCCCeEEEEeccceEEeeeccCCccCCc---eEEEE-ecCCCcEEEEEccCcEEEE
Confidence            3478888888888888877665433333333333221111222222222   23333 343  55778898886664


No 110
>cd02114 bact_SorA_Moco sulfite:cytochrome c oxidoreductase subunit A (SorA), molybdopterin binding domain. SorA is involved in oxidation of sulfur compounds during chemolithothrophic growth. Together with SorB, a small c-type heme containing subunit, it forms a hetrodimer. It  is a member of the sulfite oxidase (SO) family of molybdopterin binding domains. This molybdopterin cofactor (Moco) binding domain is found in a variety of oxidoreductases, main members of this family are nitrate reductase (NR) and sulfite oxidase (SO). Common features of all known members of this family are that they contain one single pterin cofactor and part of the coordination of the metal (Mo) is a cysteine ligand of the protein and that they catalyze the transfer of an oxygen to or from a lone pair of electrons on the substrate.
Probab=32.41  E-value=44  Score=32.29  Aligned_cols=17  Identities=24%  Similarity=0.659  Sum_probs=14.2

Q ss_pred             EEEEcCCCcCeEeCcCC
Q 036387          139 LLETKDGGKTWAPRSIP  155 (334)
Q Consensus       139 i~~S~DgG~TW~~~~~p  155 (334)
                      +-.|.|+|+||++..+.
T Consensus       293 VEVS~DgG~tW~~A~l~  309 (367)
T cd02114         293 VDVSADGGDSWTQATLG  309 (367)
T ss_pred             EEEEeCCCCcceEeEeC
Confidence            66799999999988663


No 111
>PF07494 Reg_prop:  Two component regulator propeller;  InterPro: IPR011110 A large group of two component regulator proteins appear to have the same N-terminal structure of 14 tandem repeats. These repeats show homology to members of IPR002372 from INTERPRO and IPR001680 from INTERPRO indicating that they are likely to form a beta-propeller. This family has been built with artificially high cut-offs in order to avoid overlaps with other beta-propeller families. The fourteen repeats are likely to form two propellers; it is not clear if these structures are likely to recruit other proteins or interact with DNA.; PDB: 3V9F_D 3VA6_B 3OTT_B 4A2M_D 4A2L_B.
Probab=31.99  E-value=82  Score=17.32  Aligned_cols=19  Identities=16%  Similarity=0.148  Sum_probs=14.7

Q ss_pred             cceeEEEEeeCCeEEEEeC
Q 036387          307 ANLYSVKFINEKKGFVLGN  325 (334)
Q Consensus       307 ~~l~~i~~~~~~~~~a~G~  325 (334)
                      ..+++|....++++|+.+.
T Consensus         5 n~I~~i~~D~~G~lWigT~   23 (24)
T PF07494_consen    5 NNIYSIYEDSDGNLWIGTY   23 (24)
T ss_dssp             SCEEEEEE-TTSCEEEEET
T ss_pred             CeEEEEEEcCCcCEEEEeC
Confidence            5788888888899998765


No 112
>PLN02193 nitrile-specifier protein
Probab=31.54  E-value=5.3e+02  Score=25.59  Aligned_cols=204  Identities=12%  Similarity=0.116  Sum_probs=92.5

Q ss_pred             CCcEEcccCCC-C-CeeeEEEEEecCCCCEEEEEEcC--------CeEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEE
Q 036387          102 SAWERVYIPVD-P-GVVLLDIAFVPDDLNHGFLLGTR--------QTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISF  171 (334)
Q Consensus       102 ~tW~~~~~p~~-~-~~~l~~I~~~p~d~~~~~avG~~--------g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~  171 (334)
                      .+|..+..... + .-.-+..+..   .+.+|++|..        ..+++=+-.-.+|+.+......+.. ...-.++..
T Consensus       151 ~~W~~~~~~~~~P~pR~~h~~~~~---~~~iyv~GG~~~~~~~~~~~v~~yD~~~~~W~~~~~~g~~P~~-~~~~~~~v~  226 (470)
T PLN02193        151 GKWIKVEQKGEGPGLRCSHGIAQV---GNKIYSFGGEFTPNQPIDKHLYVFDLETRTWSISPATGDVPHL-SCLGVRMVS  226 (470)
T ss_pred             ceEEEcccCCCCCCCccccEEEEE---CCEEEEECCcCCCCCCeeCcEEEEECCCCEEEeCCCCCCCCCC-cccceEEEE
Confidence            58998764211 1 0122344443   2678887642        1133333345679976432111110 001112334


Q ss_pred             eCCeEEEEEcC------CEEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCC-----
Q 036387          172 KGKEGWIVGKP------AILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGG-----  240 (334)
Q Consensus       172 ~~~~~~~vG~~------g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g-----  240 (334)
                      .++.+|+.|..      ..+++-+=.-.+|+.+......|... +           ...+. ..++.+|+.+...     
T Consensus       227 ~~~~lYvfGG~~~~~~~ndv~~yD~~t~~W~~l~~~~~~P~~R-~-----------~h~~~-~~~~~iYv~GG~~~~~~~  293 (470)
T PLN02193        227 IGSTLYVFGGRDASRQYNGFYSFDTTTNEWKLLTPVEEGPTPR-S-----------FHSMA-ADEENVYVFGGVSATARL  293 (470)
T ss_pred             ECCEEEEECCCCCCCCCccEEEEECCCCEEEEcCcCCCCCCCc-c-----------ceEEE-EECCEEEEECCCCCCCCc
Confidence            56788887642      23444333456899876321111111 0           01111 2356788876422     


Q ss_pred             -eEEEecCCCcceeeEeccccC---CCeeeEEEEeecCCeEEEEeCC-----CcEEEEcCCCcCcEEcccC--CCcccce
Q 036387          241 -GLFLSKGTGITEEFEEVPVQS---RGFGILDVGYRSQDEAWAAGGS-----GVLLKTTNGGKTWIREKAA--DNIAANL  309 (334)
Q Consensus       241 -~i~~S~D~G~tW~w~~~~~~~---~~~~~~~v~~~~~~~~~~~G~~-----G~i~~S~DgG~tW~~~~~~--~~~~~~l  309 (334)
                       .++.-.-.-.  +|..++.+.   ....-..+... ++.+|++|..     ..++.-.-.-.+|+++...  .+.....
T Consensus       294 ~~~~~yd~~t~--~W~~~~~~~~~~~~R~~~~~~~~-~gkiyviGG~~g~~~~dv~~yD~~t~~W~~~~~~g~~P~~R~~  370 (470)
T PLN02193        294 KTLDSYNIVDK--KWFHCSTPGDSFSIRGGAGLEVV-QGKVWVVYGFNGCEVDDVHYYDPVQDKWTQVETFGVRPSERSV  370 (470)
T ss_pred             ceEEEEECCCC--EEEeCCCCCCCCCCCCCcEEEEE-CCcEEEEECCCCCccCceEEEECCCCEEEEeccCCCCCCCcce
Confidence             1222111112  466654321   11111122222 5678887652     2344444345679998652  1223344


Q ss_pred             eEEEEeeCCeEEEEeCC
Q 036387          310 YSVKFINEKKGFVLGND  326 (334)
Q Consensus       310 ~~i~~~~~~~~~a~G~~  326 (334)
                      .+++.. ++++|+.|..
T Consensus       371 ~~~~~~-~~~iyv~GG~  386 (470)
T PLN02193        371 FASAAV-GKHIVIFGGE  386 (470)
T ss_pred             eEEEEE-CCEEEEECCc
Confidence            444444 5789988763


No 113
>KOG0973 consensus Histone transcription regulator HIRA, WD repeat superfamily [Cell cycle control, cell division, chromosome partitioning; Transcription]
Probab=31.28  E-value=7.4e+02  Score=27.20  Aligned_cols=205  Identities=13%  Similarity=0.177  Sum_probs=0.0

Q ss_pred             CCcEEcccCCCCCeeeEEEEEecCCCCEEEEEEcCCeEEEEcCCCcCeEeCcCCCCcccCcceeEEEEEEeCCeEEEEEc
Q 036387          102 SAWERVYIPVDPGVVLLDIAFVPDDLNHGFLLGTRQTLLETKDGGKTWAPRSIPSAEEEDFNYRFNSISFKGKEGWIVGK  181 (334)
Q Consensus       102 ~tW~~~~~p~~~~~~l~~I~~~p~d~~~~~avG~~g~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~~~~~~~~~vG~  181 (334)
                      ++|+.+..-......+.+|...| |..-+.-++-++.|..-.  ++|++.+..-..+..    .+..+.+++-.-|++.+
T Consensus       117 E~wk~~~~l~~H~~DV~Dv~Wsp-~~~~lvS~s~DnsViiwn--~~tF~~~~vl~~H~s----~VKGvs~DP~Gky~ASq  189 (942)
T KOG0973|consen  117 ESWKVVSILRGHDSDVLDVNWSP-DDSLLVSVSLDNSVIIWN--AKTFELLKVLRGHQS----LVKGVSWDPIGKYFASQ  189 (942)
T ss_pred             ceeeEEEEEecCCCccceeccCC-CccEEEEecccceEEEEc--cccceeeeeeecccc----cccceEECCccCeeeee


Q ss_pred             CC----EEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEE----cCCeEEEecCCCccee
Q 036387          182 PA----ILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLV----RGGGLFLSKGTGITEE  253 (334)
Q Consensus       182 ~g----~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~----~~g~i~~S~D~G~tW~  253 (334)
                      ..    .|+++.|    |+....-.+.-.+.        .....+..+.++|||..+++.    +......--+-|.   
T Consensus       190 sdDrtikvwrt~d----w~i~k~It~pf~~~--------~~~T~f~RlSWSPDG~~las~nA~n~~~~~~~IieR~t---  254 (942)
T KOG0973|consen  190 SDDRTLKVWRTSD----WGIEKSITKPFEES--------PLTTFFLRLSWSPDGHHLASPNAVNGGKSTIAIIERGT---  254 (942)
T ss_pred             cCCceEEEEEccc----ceeeEeeccchhhC--------CCcceeeecccCCCcCeecchhhccCCcceeEEEecCC---


Q ss_pred             eE-eccccCCCeeeEEEEeec-----CCe------------EEEEeC-CCcE-EEEcCCCcCcEEcccCCCcccceeEEE
Q 036387          254 FE-EVPVQSRGFGILDVGYRS-----QDE------------AWAAGG-SGVL-LKTTNGGKTWIREKAADNIAANLYSVK  313 (334)
Q Consensus       254 w~-~~~~~~~~~~~~~v~~~~-----~~~------------~~~~G~-~G~i-~~S~DgG~tW~~~~~~~~~~~~l~~i~  313 (334)
                      |. ...+.+-..++.-+.|++     .+.            +.|+|. ++.| ..++=--+---.+..  -....+.++.
T Consensus       255 Wk~~~~LvGH~~p~evvrFnP~lfe~~~~ng~~~~~~~~y~i~AvgSqDrSlSVW~T~~~RPl~vi~~--lf~~SI~Dms  332 (942)
T KOG0973|consen  255 WKVDKDLVGHSAPVEVVRFNPKLFERNNKNGTSTQPNCYYCIAAVGSQDRSLSVWNTALPRPLFVIHN--LFNKSIVDMS  332 (942)
T ss_pred             ceeeeeeecCCCceEEEEeChHHhccccccCCccCCCcceEEEEEecCCccEEEEecCCCCchhhhhh--hhcCceeeee


Q ss_pred             EeeCCe-EEEEeCCeeEE
Q 036387          314 FINEKK-GFVLGNDGVLL  330 (334)
Q Consensus       314 ~~~~~~-~~a~G~~G~il  330 (334)
                      +.++|. +||+..+|.|.
T Consensus       333 WspdG~~LfacS~DGtV~  350 (942)
T KOG0973|consen  333 WSPDGFSLFACSLDGTVA  350 (942)
T ss_pred             EcCCCCeEEEEecCCeEE


No 114
>cd02847 Chitobiase_C_term Chitobiase C-terminus domain. Chitobiase (AKA N-acetylglucosaminidase) digests the beta, 1-4 glycosidic bonds of the N-acetylglucosamine (NAG) oligomers found in chitin, an important structural element of fungal cell wall and arthropod exoskeletons.  It is thought to proceed through an acid-base reaction mechanism, in which one protein carboxylate acts as catalytic acid, while the nucleophile is the polar acetamido group of the sugar in a substrate-assisted reaction with retention of the anomeric configuration. The C-terminus of chitobiase may be related to the immunoglobulin and/or fibronectin type III superfamilies.  These domains are associated with different types of catalytic domains at  either the N-terminal or C-terminal end and may be involved in homodimeric/tetrameric/dodecameric interactions.  Members of this family include members of the alpha amylase family, sialidase, galactose oxidase, cellulase, cellulose, hyaluronate lyase, chitobiase, and chit
Probab=30.83  E-value=81  Score=23.27  Aligned_cols=19  Identities=37%  Similarity=0.585  Sum_probs=15.7

Q ss_pred             CeEEEEcCCCcCeEeCcCC
Q 036387          137 QTLLETKDGGKTWAPRSIP  155 (334)
Q Consensus       137 g~i~~S~DgG~TW~~~~~p  155 (334)
                      ..|..|.|+|++|+....|
T Consensus        33 ~~i~Yt~dgg~~w~~Y~~p   51 (78)
T cd02847          33 LTLQYSTDGGKNWNIYDAA   51 (78)
T ss_pred             cEEEEEecCCccCeecccc
Confidence            3588899999999987654


No 115
>KOG1446 consensus Histone H3 (Lys4) methyltransferase complex and RNA cleavage factor II complex, subunit SWD2 [RNA processing and modification; Chromatin structure and dynamics; Posttranslational modification, protein turnover, chaperones]
Probab=30.24  E-value=2.2e+02  Score=26.79  Aligned_cols=62  Identities=16%  Similarity=0.292  Sum_probs=42.2

Q ss_pred             EEEeecCCeEEEEeCCC-cE----EEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEE-eCCeeEE
Q 036387          268 DVGYRSQDEAWAAGGSG-VL----LKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVL-GNDGVLL  330 (334)
Q Consensus       268 ~v~~~~~~~~~~~G~~G-~i----~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~-G~~G~il  330 (334)
                      .++|.+.+-++|++..+ .|    .|+.|.|- .+......+.......|.|+++|...++ .+.+.++
T Consensus       145 i~AfDp~GLifA~~~~~~~IkLyD~Rs~dkgP-F~tf~i~~~~~~ew~~l~FS~dGK~iLlsT~~s~~~  212 (311)
T KOG1446|consen  145 IAAFDPEGLIFALANGSELIKLYDLRSFDKGP-FTTFSITDNDEAEWTDLEFSPDGKSILLSTNASFIY  212 (311)
T ss_pred             ceeECCCCcEEEEecCCCeEEEEEecccCCCC-ceeEccCCCCccceeeeEEcCCCCEEEEEeCCCcEE
Confidence            45677888888887755 22    57788773 6666554344578999999988886655 4555444


No 116
>cd02112 eukary_NR_Moco molybdopterin binding domain of eukaryotic nitrate reductase (NR). Assimilatory NRs catalyze the reduction of nitrate to nitrite which is subsequently converted to NH4+ by nitrite reductase. Eukaryotic assimilatory nitrate reductases are cytosolic homodimeric enzymes with three prosthetic groups, flavin adenine dinucleotide (FAD), cytochrome b557, and Mo cofactor, which are located in three functional domains. Common features of all known members of the sulfite oxidase (SO) family of molybdopterin binding domains are that they contain one single pterin cofactor and part of the coordination of the metal (Mo) is a cysteine ligand of the protein and that they catalyze the transfer of an oxygen to or from a lone pair of electrons on the substrate.
Probab=28.90  E-value=60  Score=31.61  Aligned_cols=17  Identities=35%  Similarity=0.569  Sum_probs=14.7

Q ss_pred             EEEEcCCCcCeEeCcCC
Q 036387          139 LLETKDGGKTWAPRSIP  155 (334)
Q Consensus       139 i~~S~DgG~TW~~~~~p  155 (334)
                      +-.|.|||+||++..+.
T Consensus       305 VeVS~DgG~tW~~A~L~  321 (386)
T cd02112         305 VEVSLDDGKSWKLASID  321 (386)
T ss_pred             EEEEcCCCCCceeCCCC
Confidence            67799999999998763


No 117
>KOG2055 consensus WD40 repeat protein [General function prediction only]
Probab=27.94  E-value=6.2e+02  Score=25.30  Aligned_cols=191  Identities=14%  Similarity=0.126  Sum_probs=84.6

Q ss_pred             eeeEEEEEecCCCCEEEEEEcCCeEEEEcCC-CcCeEeCcCCCCcccCcceeEEEEEEeCCeEEEEEcCCEEEEEcCCCC
Q 036387          115 VVLLDIAFVPDDLNHGFLLGTRQTLLETKDG-GKTWAPRSIPSAEEEDFNYRFNSISFKGKEGWIVGKPAILLHTSDAGE  193 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG~~g~i~~S~Dg-G~TW~~~~~p~~~~~~~~~~~~~I~~~~~~~~~vG~~g~i~~S~DgG~  193 (334)
                      .++....|.| +....++++..-..|.+-|= -..-+++..|.... +...+...|...++.+.+.|..|.|+.-.-  +
T Consensus       258 fPi~~a~f~p-~G~~~i~~s~rrky~ysyDle~ak~~k~~~~~g~e-~~~~e~FeVShd~~fia~~G~~G~I~lLha--k  333 (514)
T KOG2055|consen  258 FPIQKAEFAP-NGHSVIFTSGRRKYLYSYDLETAKVTKLKPPYGVE-EKSMERFEVSHDSNFIAIAGNNGHIHLLHA--K  333 (514)
T ss_pred             CccceeeecC-CCceEEEecccceEEEEeeccccccccccCCCCcc-cchhheeEecCCCCeEEEcccCceEEeehh--h
Confidence            6788888988 44434444445566777773 11223333333221 111222222222355556788775544321  1


Q ss_pred             CeEEeecCCCCCCCcccccccCccccceEeeeeEeecCC-EEEEEcCCeEEEecCCCcceeeEeccccCCCeeeEEEEee
Q 036387          194 SWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGG-LWLLVRGGGLFLSKGTGITEEFEEVPVQSRGFGILDVGYR  272 (334)
Q Consensus       194 TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~-~~~~~~~g~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~  272 (334)
                      |=+-+.. -+++|              .+..+.|+.++. +|+.+..|.||.-. -++. .-...-......+-..++..
T Consensus       334 T~eli~s-~KieG--------------~v~~~~fsSdsk~l~~~~~~GeV~v~n-l~~~-~~~~rf~D~G~v~gts~~~S  396 (514)
T KOG2055|consen  334 TKELITS-FKIEG--------------VVSDFTFSSDSKELLASGGTGEVYVWN-LRQN-SCLHRFVDDGSVHGTSLCIS  396 (514)
T ss_pred             hhhhhhe-eeecc--------------EEeeEEEecCCcEEEEEcCCceEEEEe-cCCc-ceEEEEeecCccceeeeeec
Confidence            1122221 11222              233344544443 55555555554321 1110 00000011111111233333


Q ss_pred             cCCeEEEEeCC-CcEEEEcCC-----CcCcEEcccCCCcccceeEEEEeeCCeEEEEeCCe
Q 036387          273 SQDEAWAAGGS-GVLLKTTNG-----GKTWIREKAADNIAANLYSVKFINEKKGFVLGNDG  327 (334)
Q Consensus       273 ~~~~~~~~G~~-G~i~~S~Dg-----G~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G  327 (334)
                      ..+..+|+|.+ |.+ ---|+     +.+=+.+..-++....+.++.|..+.+++|...++
T Consensus       397 ~ng~ylA~GS~~GiV-NIYd~~s~~~s~~PkPik~~dNLtt~Itsl~Fn~d~qiLAiaS~~  456 (514)
T KOG2055|consen  397 LNGSYLATGSDSGIV-NIYDGNSCFASTNPKPIKTVDNLTTAITSLQFNHDAQILAIASRV  456 (514)
T ss_pred             CCCceEEeccCcceE-EEeccchhhccCCCCchhhhhhhheeeeeeeeCcchhhhhhhhhc
Confidence            45567777775 433 22232     11222222223445678899998888888876554


No 118
>PTZ00421 coronin; Provisional
Probab=27.44  E-value=6.5e+02  Score=25.32  Aligned_cols=25  Identities=28%  Similarity=0.357  Sum_probs=17.4

Q ss_pred             eeeEEEEEecCCCCEEEEEEcCCeE
Q 036387          115 VVLLDIAFVPDDLNHGFLLGTRQTL  139 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG~~g~i  139 (334)
                      ..+++|.|.|.|.+.++.++.++.|
T Consensus        76 ~~V~~v~fsP~d~~~LaSgS~DgtI  100 (493)
T PTZ00421         76 GPIIDVAFNPFDPQKLFTASEDGTI  100 (493)
T ss_pred             CCEEEEEEcCCCCCEEEEEeCCCEE
Confidence            5789999987445555555667764


No 119
>KOG2111 consensus Uncharacterized conserved protein, contains WD40 repeats [Function unknown]
Probab=27.23  E-value=3e+02  Score=26.09  Aligned_cols=64  Identities=19%  Similarity=0.266  Sum_probs=43.0

Q ss_pred             eeEEEEeecCCeEEEEeC-CCc---EEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEE-eCCeeEE
Q 036387          265 GILDVGYRSQDEAWAAGG-SGV---LLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVL-GNDGVLL  330 (334)
Q Consensus       265 ~~~~v~~~~~~~~~~~G~-~G~---i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~-G~~G~il  330 (334)
                      .+-.++..-++..+|.+. .|.   ||-|.||++ =+.+..+ -..+.+|.|+|+++..++|+ .+.|++.
T Consensus       183 ~Iacv~Ln~~Gt~vATaStkGTLIRIFdt~~g~~-l~E~RRG-~d~A~iy~iaFSp~~s~LavsSdKgTlH  251 (346)
T KOG2111|consen  183 DIACVALNLQGTLVATASTKGTLIRIFDTEDGTL-LQELRRG-VDRADIYCIAFSPNSSWLAVSSDKGTLH  251 (346)
T ss_pred             ceeEEEEcCCccEEEEeccCcEEEEEEEcCCCcE-eeeeecC-CchheEEEEEeCCCccEEEEEcCCCeEE
Confidence            344555556788877644 565   566777654 4445542 34689999999998888876 5778765


No 120
>PF06739 SBBP:  Beta-propeller repeat;  InterPro: IPR010620 This family is related to IPR001680 from INTERPRO and is likely to also form a beta-propeller. SBBP stands for Seven Bladed Beta Propeller.
Probab=27.10  E-value=1.2e+02  Score=18.80  Aligned_cols=20  Identities=10%  Similarity=0.024  Sum_probs=16.2

Q ss_pred             cceeEEEEeeCCeEEEEeCC
Q 036387          307 ANLYSVKFINEKKGFVLGND  326 (334)
Q Consensus       307 ~~l~~i~~~~~~~~~a~G~~  326 (334)
                      ....+|+.+.++.+|++|..
T Consensus        13 ~~~~~IavD~~GNiYv~G~T   32 (38)
T PF06739_consen   13 DYGNGIAVDSNGNIYVTGYT   32 (38)
T ss_pred             eeEEEEEECCCCCEEEEEee
Confidence            35788998889999999853


No 121
>KOG0310 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=26.03  E-value=1.4e+02  Score=29.59  Aligned_cols=67  Identities=22%  Similarity=0.275  Sum_probs=42.1

Q ss_pred             eeEEEEeecCCeEEEEeCCCcEEEEcCCCcCcEEcccCCCcccceeEEEEee-CCeEEEEeCCeeEEEE
Q 036387          265 GILDVGYRSQDEAWAAGGSGVLLKTTNGGKTWIREKAADNIAANLYSVKFIN-EKKGFVLGNDGVLLQY  332 (334)
Q Consensus       265 ~~~~v~~~~~~~~~~~G~~G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~-~~~~~a~G~~G~il~s  332 (334)
                      ..+++.|+.+++++++|+.-...+-.| =++=..+..-..-..++..+.|.+ +++.++.|.++.+.++
T Consensus        70 ~v~s~~fR~DG~LlaaGD~sG~V~vfD-~k~r~iLR~~~ah~apv~~~~f~~~d~t~l~s~sDd~v~k~  137 (487)
T KOG0310|consen   70 VVYSVDFRSDGRLLAAGDESGHVKVFD-MKSRVILRQLYAHQAPVHVTKFSPQDNTMLVSGSDDKVVKY  137 (487)
T ss_pred             ceeEEEeecCCeEEEccCCcCcEEEec-cccHHHHHHHhhccCceeEEEecccCCeEEEecCCCceEEE
Confidence            467889999999999988543435556 444111221111124566666654 6788888888877664


No 122
>cd02111 eukary_SO_Moco molybdopterin binding domain of sulfite oxidase (SO). SO catalyzes the terminal reaction in the oxidative degradation of the sulfur-containing amino acids cysteine and methionine. Common features of all known members of the sulfite oxidase (SO) family of molybdopterin binding domains are that they contain one single pterin cofactor and part of the coordination of the metal (Mo) is a cysteine ligand of the protein and that they catalyze the transfer of an oxygen to or from a lone pair of electrons on the substrate.
Probab=25.50  E-value=2.1e+02  Score=27.59  Aligned_cols=17  Identities=29%  Similarity=0.634  Sum_probs=14.7

Q ss_pred             EEEEcCCCcCeEeCcCC
Q 036387          139 LLETKDGGKTWAPRSIP  155 (334)
Q Consensus       139 i~~S~DgG~TW~~~~~p  155 (334)
                      +-.|.|||+||+...+.
T Consensus       281 VEVS~DgG~tW~~A~l~  297 (365)
T cd02111         281 VDVSLDGGRTWKVAELE  297 (365)
T ss_pred             EEEECCCCCcceeCCcC
Confidence            67799999999998764


No 123
>KOG4714 consensus Nucleoporin [Nuclear structure]
Probab=25.36  E-value=2.2e+02  Score=26.33  Aligned_cols=27  Identities=19%  Similarity=0.362  Sum_probs=23.9

Q ss_pred             eeeEEEEEecCCCCEEEEEEcCCeEEE
Q 036387          115 VVLLDIAFVPDDLNHGFLLGTRQTLLE  141 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG~~g~i~~  141 (334)
                      ..+..|.|.|+||++++.+.++|.+++
T Consensus       224 ~~i~eV~FHpk~p~~Lft~sedGslw~  250 (319)
T KOG4714|consen  224 AEIWEVHFHPKNPEHLFTCSEDGSLWH  250 (319)
T ss_pred             hhhhheeccCCCchheeEecCCCcEEE
Confidence            567889999999999999988888876


No 124
>KOG2445 consensus Nuclear pore complex component (sc Seh1) [Nuclear structure; Intracellular trafficking, secretion, and vesicular transport]
Probab=25.30  E-value=5.9e+02  Score=24.16  Aligned_cols=195  Identities=12%  Similarity=0.178  Sum_probs=94.9

Q ss_pred             eeeEEEEEecCCCCEEEEEEcCC--eEEEEcCCCcCeEeCcCCCCcccCcceeEEEEE-EeC--CeEEEEEc-CC--EEE
Q 036387          115 VVLLDIAFVPDDLNHGFLLGTRQ--TLLETKDGGKTWAPRSIPSAEEEDFNYRFNSIS-FKG--KEGWIVGK-PA--ILL  186 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG~~g--~i~~S~DgG~TW~~~~~p~~~~~~~~~~~~~I~-~~~--~~~~~vG~-~g--~i~  186 (334)
                      .-++++.|++. ..++-.+..++  .||.+++.-.+|.....=..++.    .+.+|. .++  +++++.-. ..  .|+
T Consensus        14 DlihdVs~D~~-GRRmAtCSsDq~vkI~d~~~~s~~W~~Ts~Wrah~~----Si~rV~WAhPEfGqvvA~cS~Drtv~iW   88 (361)
T KOG2445|consen   14 DLIHDVSFDFY-GRRMATCSSDQTVKIWDSTSDSGTWSCTSSWRAHDG----SIWRVVWAHPEFGQVVATCSYDRTVSIW   88 (361)
T ss_pred             ceeeeeeeccc-CceeeeccCCCcEEEEeccCCCCceEEeeeEEecCC----cEEEEEecCccccceEEEEecCCceeee
Confidence            45789999763 45544444455  38887777788986542111111    233443 233  34443321 11  121


Q ss_pred             ----EEcCC-CCCeEEeecCCCCCCCcccccccCccccceEeeeeEeec-CCEEE-E-EcCC--eEEEecCCC--cceee
Q 036387          187 ----HTSDA-GESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRAD-GGLWL-L-VRGG--GLFLSKGTG--ITEEF  254 (334)
Q Consensus       187 ----~S~Dg-G~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~-g~~~~-~-~~~g--~i~~S~D~G--~tW~w  254 (334)
                          ++.+. |+.|.+...-.   +.           ...+..+.|.+. -++-+ + ..+|  .||--.|-.  ..|+.
T Consensus        89 EE~~~~~~~~~~~Wv~~ttl~---Ds-----------rssV~DV~FaP~hlGLklA~~~aDG~lRIYEA~dp~nLs~W~L  154 (361)
T KOG2445|consen   89 EEQEKSEEAHGRRWVRRTTLV---DS-----------RSSVTDVKFAPKHLGLKLAAASADGILRIYEAPDPMNLSQWTL  154 (361)
T ss_pred             eecccccccccceeEEEEEee---cC-----------CcceeEEEecchhcceEEEEeccCcEEEEEecCCccccccchh
Confidence                22222 55676665321   11           112333444332 12222 2 2233  234444432  23432


Q ss_pred             Ee----ccccCC--CeeeEEEEeecC---CeEEEEeCC--------CcEEEEcCCCcCcEEcccCCCcccceeEEEEeeC
Q 036387          255 EE----VPVQSR--GFGILDVGYRSQ---DEAWAAGGS--------GVLLKTTNGGKTWIREKAADNIAANLYSVKFINE  317 (334)
Q Consensus       255 ~~----~~~~~~--~~~~~~v~~~~~---~~~~~~G~~--------G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~  317 (334)
                      +.    +..|..  ....+.+...+.   ...+++|..        -.||.-.++|..|.++..-......+++|+|.++
T Consensus       155 q~Ei~~~~~pp~~~~~~~~CvsWn~sr~~~p~iAvgs~e~a~~~~~~~Iye~~e~~rKw~kva~L~d~~dpI~di~wAPn  234 (361)
T KOG2445|consen  155 QHEIQNVIDPPGKNKQPCFCVSWNPSRMHEPLIAVGSDEDAPHLNKVKIYEYNENGRKWLKVAELPDHTDPIRDISWAPN  234 (361)
T ss_pred             hhhhhhccCCcccccCcceEEeeccccccCceEEEEcccCCccccceEEEEecCCcceeeeehhcCCCCCcceeeeeccc
Confidence            21    222221  123455555431   345666653        3689999999999999873234568999999862


Q ss_pred             -Ce---EEEE-eCCee
Q 036387          318 -KK---GFVL-GNDGV  328 (334)
Q Consensus       318 -~~---~~a~-G~~G~  328 (334)
                       |+   ++|+ ..+|+
T Consensus       235 ~Gr~y~~lAvA~kDgv  250 (361)
T KOG2445|consen  235 IGRSYHLLAVATKDGV  250 (361)
T ss_pred             cCCceeeEEEeecCcE
Confidence             22   3443 46663


No 125
>PF13570 PQQ_3:  PQQ-like domain; PDB: 3HXJ_B 3Q54_A.
Probab=24.72  E-value=1.3e+02  Score=18.41  Aligned_cols=22  Identities=23%  Similarity=0.148  Sum_probs=14.9

Q ss_pred             EEEEeeCCeEEEEeCCeeEEEEc
Q 036387          311 SVKFINEKKGFVLGNDGVLLQYL  333 (334)
Q Consensus       311 ~i~~~~~~~~~a~G~~G~il~s~  333 (334)
                      +++. .++++|+.+.+|.++..+
T Consensus        16 ~~~v-~~g~vyv~~~dg~l~ald   37 (40)
T PF13570_consen   16 SPAV-AGGRVYVGTGDGNLYALD   37 (40)
T ss_dssp             --EE-CTSEEEEE-TTSEEEEEE
T ss_pred             CCEE-ECCEEEEEcCCCEEEEEe
Confidence            3444 478999999999988754


No 126
>KOG0271 consensus Notchless-like WD40 repeat-containing protein [Function unknown]
Probab=24.62  E-value=6.7e+02  Score=24.56  Aligned_cols=62  Identities=15%  Similarity=0.309  Sum_probs=38.4

Q ss_pred             eeEEEEeecCCeEEEEeCCCcEEEEcCCCcCcEEcc----cCCC-cccceeEEEEeeCCeEEEEeCCeeEEEE
Q 036387          265 GILDVGYRSQDEAWAAGGSGVLLKTTNGGKTWIREK----AADN-IAANLYSVKFINEKKGFVLGNDGVLLQY  332 (334)
Q Consensus       265 ~~~~v~~~~~~~~~~~G~~G~i~~S~DgG~tW~~~~----~~~~-~~~~l~~i~~~~~~~~~a~G~~G~il~s  332 (334)
                      .++-++...+.++++.|..-.-++      -|..-.    ...+ -...+|++.+.++|.-++.|..-.++|.
T Consensus       411 ~VYqvawsaDsRLlVS~SkDsTLK------vw~V~tkKl~~DLpGh~DEVf~vDwspDG~rV~sggkdkv~~l  477 (480)
T KOG0271|consen  411 AVYQVAWSADSRLLVSGSKDSTLK------VWDVRTKKLKQDLPGHADEVFAVDWSPDGQRVASGGKDKVLRL  477 (480)
T ss_pred             eeEEEEeccCccEEEEcCCCceEE------EEEeeeeeecccCCCCCceEEEEEecCCCceeecCCCceEEEe
Confidence            466777777777777765432221      243321    1111 1246999999999999998877666653


No 127
>KOG1407 consensus WD40 repeat protein [Function unknown]
Probab=24.49  E-value=5.7e+02  Score=23.71  Aligned_cols=100  Identities=11%  Similarity=0.222  Sum_probs=50.9

Q ss_pred             eeEeecCCEEEEEcCCeEEEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeC-CCcE-EEEcCCCcCcEEcccC
Q 036387          225 MGWRADGGLWLLVRGGGLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGG-SGVL-LKTTNGGKTWIREKAA  302 (334)
Q Consensus       225 ~~~~~~g~~~~~~~~g~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~-~G~i-~~S~DgG~tW~~~~~~  302 (334)
                      +.+.|+|...++++.......-|.-+   .+.+....-.+-...+.+.+++.+|.... .|.+ ..|--   +=+++..-
T Consensus       112 i~wsp~g~~~~~~~kdD~it~id~r~---~~~~~~~~~~~e~ne~~w~~~nd~Fflt~GlG~v~ILsyp---sLkpv~si  185 (313)
T KOG1407|consen  112 ITWSPDGEYIAVGNKDDRITFIDART---YKIVNEEQFKFEVNEISWNNSNDLFFLTNGLGCVEILSYP---SLKPVQSI  185 (313)
T ss_pred             EEEcCCCCEEEEecCcccEEEEEecc---cceeehhcccceeeeeeecCCCCEEEEecCCceEEEEecc---cccccccc
Confidence            44567777666665554444444432   12221111112234555556666655433 2433 12211   12222211


Q ss_pred             CCcccceeEEEEeeCCeEEEEeCCeeEE
Q 036387          303 DNIAANLYSVKFINEKKGFVLGNDGVLL  330 (334)
Q Consensus       303 ~~~~~~l~~i~~~~~~~~~a~G~~G~il  330 (334)
                      ..-+.+.+.|.|.+.|+-||+|..-.+.
T Consensus       186 ~AH~snCicI~f~p~GryfA~GsADAlv  213 (313)
T KOG1407|consen  186 KAHPSNCICIEFDPDGRYFATGSADALV  213 (313)
T ss_pred             ccCCcceEEEEECCCCceEeecccccee
Confidence            1113689999999999999999765543


No 128
>KOG0286 consensus G-protein beta subunit [General function prediction only]
Probab=23.42  E-value=6.3e+02  Score=23.81  Aligned_cols=104  Identities=15%  Similarity=0.240  Sum_probs=54.3

Q ss_pred             EeeeeEeecCCEEE-EEcCCeEEEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeC-C--CcEEEEc-C-CCcC
Q 036387          222 IQNMGWRADGGLWL-LVRGGGLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGG-S--GVLLKTT-N-GGKT  295 (334)
Q Consensus       222 i~~~~~~~~g~~~~-~~~~g~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~-~--G~i~~S~-D-gG~t  295 (334)
                      |..+.+..|.+.++ +..+|.+..= |.=.+-.-..+++|.  .-++..+|.+.+..+++|. +  -.||... + .-..
T Consensus        58 i~~~~ws~Dsr~ivSaSqDGklIvW-Ds~TtnK~haipl~s--~WVMtCA~sPSg~~VAcGGLdN~Csiy~ls~~d~~g~  134 (343)
T KOG0286|consen   58 IYAMDWSTDSRRIVSASQDGKLIVW-DSFTTNKVHAIPLPS--SWVMTCAYSPSGNFVACGGLDNKCSIYPLSTRDAEGN  134 (343)
T ss_pred             eeeeEecCCcCeEEeeccCCeEEEE-EcccccceeEEecCc--eeEEEEEECCCCCeEEecCcCceeEEEeccccccccc
Confidence            44556666665443 3445543321 111110123345554  3578889988888888865 3  3465443 2 2222


Q ss_pred             cEEcccCCCcccceeEEEEeeCCeEEEEeCCee
Q 036387          296 WIREKAADNIAANLYSVKFINEKKGFVLGNDGV  328 (334)
Q Consensus       296 W~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G~  328 (334)
                      =+....-.+-..++....|.++++++....+.+
T Consensus       135 ~~v~r~l~gHtgylScC~f~dD~~ilT~SGD~T  167 (343)
T KOG0286|consen  135 VRVSRELAGHTGYLSCCRFLDDNHILTGSGDMT  167 (343)
T ss_pred             ceeeeeecCccceeEEEEEcCCCceEecCCCce
Confidence            222211112246888999999888876544443


No 129
>PTZ00420 coronin; Provisional
Probab=23.38  E-value=8.3e+02  Score=25.17  Aligned_cols=25  Identities=20%  Similarity=0.054  Sum_probs=17.2

Q ss_pred             eeeEEEEEecCCCCEEEEEEcCCeE
Q 036387          115 VVLLDIAFVPDDLNHGFLLGTRQTL  139 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG~~g~i  139 (334)
                      ..+.+|+|.|.+++.+..++.+|.|
T Consensus        75 ~~V~~lafsP~~~~lLASgS~DgtI   99 (568)
T PTZ00420         75 SSILDLQFNPCFSEILASGSEDLTI   99 (568)
T ss_pred             CCEEEEEEcCCCCCEEEEEeCCCeE
Confidence            5799999988545555555667764


No 130
>KOG2445 consensus Nuclear pore complex component (sc Seh1) [Nuclear structure; Intracellular trafficking, secretion, and vesicular transport]
Probab=23.16  E-value=6.5e+02  Score=23.89  Aligned_cols=111  Identities=15%  Similarity=0.178  Sum_probs=59.4

Q ss_pred             EeeeeEeecCCEEEEEc-CC--eEEEecCCCcceeeEeccccCCCeeeEEEEeecC--CeEEEEe-CCCc--EEE----E
Q 036387          222 IQNMGWRADGGLWLLVR-GG--GLFLSKGTGITEEFEEVPVQSRGFGILDVGYRSQ--DEAWAAG-GSGV--LLK----T  289 (334)
Q Consensus       222 i~~~~~~~~g~~~~~~~-~g--~i~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~--~~~~~~G-~~G~--i~~----S  289 (334)
                      |..+.|...|+-.++.. ++  .||.++++-.+|.-+.- -......+..|...++  ++++++- -++.  ||.    +
T Consensus        16 ihdVs~D~~GRRmAtCSsDq~vkI~d~~~~s~~W~~Ts~-Wrah~~Si~rV~WAhPEfGqvvA~cS~Drtv~iWEE~~~~   94 (361)
T KOG2445|consen   16 IHDVSFDFYGRRMATCSSDQTVKIWDSTSDSGTWSCTSS-WRAHDGSIWRVVWAHPEFGQVVATCSYDRTVSIWEEQEKS   94 (361)
T ss_pred             eeeeeecccCceeeeccCCCcEEEEeccCCCCceEEeee-EEecCCcEEEEEecCccccceEEEEecCCceeeeeecccc
Confidence            34455555666555432 22  47876655556632221 1111124666665543  4455542 2332  232    2


Q ss_pred             cC-CCcCcEEcccCCCcccceeEEEEeeCCe---EEEEeCCeeEEEEc
Q 036387          290 TN-GGKTWIREKAADNIAANLYSVKFINEKK---GFVLGNDGVLLQYL  333 (334)
Q Consensus       290 ~D-gG~tW~~~~~~~~~~~~l~~i~~~~~~~---~~a~G~~G~il~s~  333 (334)
                      .+ .|..|.+..+-......+++|.|.+...   +-+++.+|++-.++
T Consensus        95 ~~~~~~~Wv~~ttl~DsrssV~DV~FaP~hlGLklA~~~aDG~lRIYE  142 (361)
T KOG2445|consen   95 EEAHGRRWVRRTTLVDSRSSVTDVKFAPKHLGLKLAAASADGILRIYE  142 (361)
T ss_pred             cccccceeEEEEEeecCCcceeEEEecchhcceEEEEeccCcEEEEEe
Confidence            23 3678988766333457899999987433   44678888776553


No 131
>PF06462 Hyd_WA:  Propeller;  InterPro: IPR006624  Tectonins I and II are two dominant proteins in the nuclei and nuclear matrix from plasmodia of Physarum polycephalum (Slime mold) which encode 217 and 353 amino acids, respectively. Tectonin I is homologous to the C-terminal two-thirds of tectonin II. Both proteins contain six tandem repeats that are each 33-37 amino acids in length and define a new consensus sequence. Homologous repeats are found in L-6, a bacterial lipopolysaccharide-binding lectin from horseshoe crab hemocytes. The repetitive sequences of the tectonins and L-6 are reminiscent of the WD repeats of the beta-subunit of G proteins, suggesting that they form beta-propeller domains. The tectonins may be lectins that function as part of a transmembrane signalling complex during phagocytosis [].
Probab=23.05  E-value=98  Score=18.48  Aligned_cols=16  Identities=13%  Similarity=0.219  Sum_probs=12.0

Q ss_pred             CeEEEEeCCeeEEEEc
Q 036387          318 KKGFVLGNDGVLLQYL  333 (334)
Q Consensus       318 ~~~~a~G~~G~il~s~  333 (334)
                      +.+|+++.+|.++.=.
T Consensus         1 ~~VWav~~~G~v~~R~   16 (32)
T PF06462_consen    1 DQVWAVTSDGSVYFRT   16 (32)
T ss_pred             CeEEEEcCCCCEEEEC
Confidence            4688999888877543


No 132
>KOG0771 consensus Prolactin regulatory element-binding protein/Protein transport protein SEC12p [Intracellular trafficking, secretion, and vesicular transport]
Probab=22.92  E-value=3.7e+02  Score=26.23  Aligned_cols=86  Identities=14%  Similarity=0.200  Sum_probs=48.7

Q ss_pred             eeEeecCCEEEEEcCCeEEEecCCCcceeeEecc----ccCCCeeeEEEEeecCCeEEEE-eCC-CcEEEEcCCCcCcEE
Q 036387          225 MGWRADGGLWLLVRGGGLFLSKGTGITEEFEEVP----VQSRGFGILDVGYRSQDEAWAA-GGS-GVLLKTTNGGKTWIR  298 (334)
Q Consensus       225 ~~~~~~g~~~~~~~~g~i~~S~D~G~tW~w~~~~----~~~~~~~~~~v~~~~~~~~~~~-G~~-G~i~~S~DgG~tW~~  298 (334)
                      +++..+|..++++...+.+|-      |+|....    .......+-+++|.++++.++. |.+ ..|| +.+.|.-|+.
T Consensus       150 vaf~~~gs~latgg~dg~lRv------~~~Ps~~t~l~e~~~~~eV~DL~FS~dgk~lasig~d~~~VW-~~~~g~~~a~  222 (398)
T KOG0771|consen  150 VAFNGDGSKLATGGTDGTLRV------WEWPSMLTILEEIAHHAEVKDLDFSPDGKFLASIGADSARVW-SVNTGAALAR  222 (398)
T ss_pred             EEEcCCCCEeeeccccceEEE------EecCcchhhhhhHhhcCccccceeCCCCcEEEEecCCceEEE-EeccCchhhh
Confidence            556667777776643333433      3343332    1112235789999888865543 443 4554 5566777877


Q ss_pred             cccCCCcccceeEEEEeeCC
Q 036387          299 EKAADNIAANLYSVKFINEK  318 (334)
Q Consensus       299 ~~~~~~~~~~l~~i~~~~~~  318 (334)
                      ...- .....+..+.|..++
T Consensus       223 ~t~~-~k~~~~~~cRF~~d~  241 (398)
T KOG0771|consen  223 KTPF-SKDEMFSSCRFSVDN  241 (398)
T ss_pred             cCCc-ccchhhhhceecccC
Confidence            7531 223556677777666


No 133
>KOG1332 consensus Vesicle coat complex COPII, subunit SEC13 [Intracellular trafficking, secretion, and vesicular transport]
Probab=22.83  E-value=6e+02  Score=23.37  Aligned_cols=101  Identities=14%  Similarity=0.167  Sum_probs=55.9

Q ss_pred             cceEEecCCCCCcEEcccCCCCCeeeEEEEEecCC--CCEEEEE-EcCCe--EEEEcCCCcCeEeCcCCCCcccCcceeE
Q 036387           92 EQPAKSEEALSAWERVYIPVDPGVVLLDIAFVPDD--LNHGFLL-GTRQT--LLETKDGGKTWAPRSIPSAEEEDFNYRF  166 (334)
Q Consensus        92 g~i~~S~DgG~tW~~~~~p~~~~~~l~~I~~~p~d--~~~~~av-G~~g~--i~~S~DgG~TW~~~~~p~~~~~~~~~~~  166 (334)
                      .+|++=+++  +|.....-......+++|+..|..  +..-+|. +++|.  |+...-.+..|+...+-...+     .+
T Consensus       187 VkiW~~~~~--~w~~e~~l~~H~dwVRDVAwaP~~gl~~s~iAS~SqDg~viIwt~~~e~e~wk~tll~~f~~-----~~  259 (299)
T KOG1332|consen  187 VKIWKFDSD--SWKLERTLEGHKDWVRDVAWAPSVGLPKSTIASCSQDGTVIIWTKDEEYEPWKKTLLEEFPD-----VV  259 (299)
T ss_pred             eeeeecCCc--chhhhhhhhhcchhhhhhhhccccCCCceeeEEecCCCcEEEEEecCccCcccccccccCCc-----ce
Confidence            568876665  897654222223577889887743  3333443 44564  444444568998765433211     46


Q ss_pred             EEEEEeC-CeEEEE-EcCC--EEEEEcCCCCCeEEeec
Q 036387          167 NSISFKG-KEGWIV-GKPA--ILLHTSDAGESWERIPL  200 (334)
Q Consensus       167 ~~I~~~~-~~~~~v-G~~g--~i~~S~DgG~TW~~~~~  200 (334)
                      .++...- ..+.++ |...  .++|-.-.| .|+++..
T Consensus       260 w~vSWS~sGn~LaVs~GdNkvtlwke~~~G-kw~~v~~  296 (299)
T KOG1332|consen  260 WRVSWSLSGNILAVSGGDNKVTLWKENVDG-KWEEVGE  296 (299)
T ss_pred             EEEEEeccccEEEEecCCcEEEEEEeCCCC-cEEEccc
Confidence            6777663 445554 3222  555543333 5988763


No 134
>PLN00177 sulfite oxidase; Provisional
Probab=22.77  E-value=81  Score=30.82  Aligned_cols=16  Identities=44%  Similarity=0.657  Sum_probs=13.7

Q ss_pred             EEEEcCCCcCeEeCcC
Q 036387          139 LLETKDGGKTWAPRSI  154 (334)
Q Consensus       139 i~~S~DgG~TW~~~~~  154 (334)
                      +-.|.|||+||+...+
T Consensus       301 VEVS~DgG~tW~~A~l  316 (393)
T PLN00177        301 VDISVDGGKTWVEASR  316 (393)
T ss_pred             EEEEcCCCCCceeeee
Confidence            6779999999998764


No 135
>KOG1230 consensus Protein containing repeated kelch motifs [General function prediction only]
Probab=22.76  E-value=7.6e+02  Score=24.53  Aligned_cols=156  Identities=12%  Similarity=0.094  Sum_probs=0.0

Q ss_pred             EeCcCCCCcccCcceeEEEEEEeCCeEEEEEcC----------CEEEEEcCCCCCeEEeecCCCCCCCcccccccCcccc
Q 036387          150 APRSIPSAEEEDFNYRFNSISFKGKEGWIVGKP----------AILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVA  219 (334)
Q Consensus       150 ~~~~~p~~~~~~~~~~~~~I~~~~~~~~~vG~~----------g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~  219 (334)
                      +.+..+...+.++......+...-+++++.|..          +-||+-.-.-.+|+.+.    .|..+.--..|.    
T Consensus        55 ~~~e~~~~~PspRsn~sl~~nPekeELilfGGEf~ngqkT~vYndLy~Yn~k~~eWkk~~----spn~P~pRsshq----  126 (521)
T KOG1230|consen   55 HVVETSVPPPSPRSNPSLFANPEKEELILFGGEFYNGQKTHVYNDLYSYNTKKNEWKKVV----SPNAPPPRSSHQ----  126 (521)
T ss_pred             eeeeccCCCCCCCCCcceeeccCcceeEEecceeecceeEEEeeeeeEEeccccceeEec----cCCCcCCCccce----


Q ss_pred             ceEeeeeEeecCCEEEEEc------CCeEEEecCCCcce-------eeEec-----cccCCCeeeEEEEeecCCeEEEEe
Q 036387          220 RRIQNMGWRADGGLWLLVR------GGGLFLSKGTGITE-------EFEEV-----PVQSRGFGILDVGYRSQDEAWAAG  281 (334)
Q Consensus       220 ~~i~~~~~~~~g~~~~~~~------~g~i~~S~D~G~tW-------~w~~~-----~~~~~~~~~~~v~~~~~~~~~~~G  281 (334)
                           ++..+.+.+|+.+.      .-++++-.|   .|       +|+++     +.+.+++.+.+-    .+.+++.|
T Consensus       127 -----~va~~s~~l~~fGGEfaSPnq~qF~HYkD---~W~fd~~trkweql~~~g~PS~RSGHRMvaw----K~~lilFG  194 (521)
T KOG1230|consen  127 -----AVAVPSNILWLFGGEFASPNQEQFHHYKD---LWLFDLKTRKWEQLEFGGGPSPRSGHRMVAW----KRQLILFG  194 (521)
T ss_pred             -----eEEeccCeEEEeccccCCcchhhhhhhhh---eeeeeeccchheeeccCCCCCCCccceeEEe----eeeEEEEc


Q ss_pred             C----------CCcEEEEcCCCcCcEEcccCC--CcccceeEEEEeeCCeEEEEeC
Q 036387          282 G----------SGVLLKTTNGGKTWIREKAAD--NIAANLYSVKFINEKKGFVLGN  325 (334)
Q Consensus       282 ~----------~G~i~~S~DgG~tW~~~~~~~--~~~~~l~~i~~~~~~~~~a~G~  325 (334)
                      .          ...||.-.=.--+|+.+..+.  +.++.=..+...+++.+|+-|.
T Consensus       195 GFhd~nr~y~YyNDvy~FdLdtykW~Klepsga~PtpRSGcq~~vtpqg~i~vyGG  250 (521)
T KOG1230|consen  195 GFHDSNRDYIYYNDVYAFDLDTYKWSKLEPSGAGPTPRSGCQFSVTPQGGIVVYGG  250 (521)
T ss_pred             ceecCCCceEEeeeeEEEeccceeeeeccCCCCCCCCCCcceEEecCCCcEEEEcc


No 136
>COG4946 Uncharacterized protein related to the periplasmic component of the Tol biopolymer transport system [Function unknown]
Probab=22.55  E-value=8.1e+02  Score=24.78  Aligned_cols=20  Identities=45%  Similarity=0.626  Sum_probs=17.0

Q ss_pred             EcCCeEEEEcCCCcCeEeCc
Q 036387          134 GTRQTLLETKDGGKTWAPRS  153 (334)
Q Consensus       134 G~~g~i~~S~DgG~TW~~~~  153 (334)
                      |+.|.||.++|+|++++++.
T Consensus       203 GtrGklWis~d~g~tFeK~v  222 (668)
T COG4946         203 GTRGKLWISSDGGKTFEKFV  222 (668)
T ss_pred             CccceEEEEecCCcceeeee
Confidence            35688999999999999864


No 137
>KOG0639 consensus Transducin-like enhancer of split protein (contains WD40 repeats) [Chromatin structure and dynamics]
Probab=21.87  E-value=5.4e+02  Score=26.16  Aligned_cols=128  Identities=13%  Similarity=0.217  Sum_probs=66.4

Q ss_pred             EEEEEcCCCCCeEEeecCCCCCCCcccccccC------ccccceEeeeeEeecCCEEEEEc-CCeEEEecCCCcceeeEe
Q 036387          184 ILLHTSDAGESWERIPLSSQLPGDMAFWQPHN------RAVARRIQNMGWRADGGLWLLVR-GGGLFLSKGTGITEEFEE  256 (334)
Q Consensus       184 ~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~------~~~~~~i~~~~~~~~g~~~~~~~-~g~i~~S~D~G~tW~w~~  256 (334)
                      -|-.|.||-+-|+-=     ++....-|+-..      -.....|..+++++.+..++++. ++.+..-.-.+.  +-..
T Consensus       556 cIdis~dGtklWTGG-----lDntvRcWDlregrqlqqhdF~SQIfSLg~cP~~dWlavGMens~vevlh~skp--~kyq  628 (705)
T KOG0639|consen  556 CIDISKDGTKLWTGG-----LDNTVRCWDLREGRQLQQHDFSSQIFSLGYCPTGDWLAVGMENSNVEVLHTSKP--EKYQ  628 (705)
T ss_pred             eEEecCCCceeecCC-----CccceeehhhhhhhhhhhhhhhhhheecccCCCccceeeecccCcEEEEecCCc--ccee
Confidence            466778887777631     222222332111      01233566677788777666663 444332221221  1122


Q ss_pred             ccccCCCeeeEEEEeecCCeEEEE-eCCC--cEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeC
Q 036387          257 VPVQSRGFGILDVGYRSQDEAWAA-GGSG--VLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGN  325 (334)
Q Consensus       257 ~~~~~~~~~~~~v~~~~~~~~~~~-G~~G--~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~  325 (334)
                      +...  ...++.+.|..-+..|+. |.+.  ..|++.=|-+-+|.-.     ...+.+..++.+++.+++|.
T Consensus       629 lhlh--eScVLSlKFa~cGkwfvStGkDnlLnawrtPyGasiFqskE-----~SsVlsCDIS~ddkyIVTGS  693 (705)
T KOG0639|consen  629 LHLH--ESCVLSLKFAYCGKWFVSTGKDNLLNAWRTPYGASIFQSKE-----SSSVLSCDISFDDKYIVTGS  693 (705)
T ss_pred             eccc--ccEEEEEEecccCceeeecCchhhhhhccCccccceeeccc-----cCcceeeeeccCceEEEecC
Confidence            2222  247889998877887775 3333  2355554433333322     35677777766666665553


No 138
>PF11725 AvrE:  Pathogenicity factor;  InterPro: IPR021085 This family is secreted by Gram-negative Gammaproteobacteria such as Pseudomonas syringae of tomato and Erwinia amylovora (Fire blight bacteria), amongst others. It is an essential pathogenicity factor of approximately 198 kDa. Its injection into the host-plant is dependent upon the bacterial type III or Hrp secretion system []. The family is long and carries a number of predicted functional regions, including an ERMS or endoplasmic reticulum membrane retention signal at both the C- and the N-termini, a leucine-zipper motif from residues 539-560, and a nuclear localisation signal at 1358-1361. This conserved AvrE-family of effectors is among the few that are required for full virulence of many phytopathogenic pseudomonads, erwinias and pantoeas [].
Probab=21.84  E-value=3.2e+02  Score=31.85  Aligned_cols=102  Identities=17%  Similarity=0.150  Sum_probs=60.5

Q ss_pred             ceEeeeeEeecCCEEEEEcCCeE-EEecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeCCCcEEEE-------cC
Q 036387          220 RRIQNMGWRADGGLWLLVRGGGL-FLSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGGSGVLLKT-------TN  291 (334)
Q Consensus       220 ~~i~~~~~~~~g~~~~~~~~g~i-~~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~G~i~~S-------~D  291 (334)
                      +.|+.+++..+...+++...|.+ ++..++ .   -.++..+.-...+-+++.+....+|+....|.+|+=       ..
T Consensus       703 ~~i~a~Avv~~~~fvald~qg~lt~h~k~g-~---p~~l~~~gl~G~ik~l~lD~~~nL~Alt~~G~Lf~~~k~~WQ~~~  778 (1774)
T PF11725_consen  703 RVITAFAVVNDNKFVALDDQGDLTAHQKPG-R---PVPLSRPGLSGEIKDLALDEKQNLYALTSTGELFRLPKEAWQGNA  778 (1774)
T ss_pred             CcceeEEEEcCCceEEeccCCccccccCCC-C---CccCCCCCCCcchhheeeccccceeEecCCCceeecCHHHhhCcc
Confidence            34555555444455555555544 233333 1   122222211124567777667789998888877653       34


Q ss_pred             CC----cCcEEcccCCCcccceeEEEEeeCCeEEEEeCCe
Q 036387          292 GG----KTWIREKAADNIAANLYSVKFINEKKGFVLGNDG  327 (334)
Q Consensus       292 gG----~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G  327 (334)
                      .|    ..|+++..|  ....+-++....++++.+.-++|
T Consensus       779 ~~~~~~~~W~~v~lP--~~~~v~~l~~~~~~~l~~~~~d~  816 (1774)
T PF11725_consen  779 EGDQMAAKWQKVALP--DEQPVKSLRTNDDNHLSAQIEDG  816 (1774)
T ss_pred             cCCccccCceeccCC--CCCchhhhhcCCCCceEEEecCC
Confidence            55    679999985  45677787777777777776664


No 139
>KOG0296 consensus Angio-associated migratory cell protein (contains WD40 repeats) [Function unknown]
Probab=21.61  E-value=4.9e+02  Score=25.17  Aligned_cols=63  Identities=17%  Similarity=0.338  Sum_probs=40.6

Q ss_pred             eeEEEEeecCCeEEEEeCC---CcEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeC-CeeEEE
Q 036387          265 GILDVGYRSQDEAWAAGGS---GVLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGN-DGVLLQ  331 (334)
Q Consensus       265 ~~~~v~~~~~~~~~~~G~~---G~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~-~G~il~  331 (334)
                      .++++...+.+.+.+.|..   .-||.+.++-  |--.-.  +-...+..+.|..+++++|.|+ +|.++-
T Consensus        66 svFavsl~P~~~l~aTGGgDD~AflW~~~~ge--~~~elt--gHKDSVt~~~FshdgtlLATGdmsG~v~v  132 (399)
T KOG0296|consen   66 SVFAVSLHPNNNLVATGGGDDLAFLWDISTGE--FAGELT--GHKDSVTCCSFSHDGTLLATGDMSGKVLV  132 (399)
T ss_pred             ceEEEEeCCCCceEEecCCCceEEEEEccCCc--ceeEec--CCCCceEEEEEccCceEEEecCCCccEEE
Confidence            5788887665555555442   4578877754  333322  2235799999999999999874 555553


No 140
>PRK11028 6-phosphogluconolactonase; Provisional
Probab=21.57  E-value=6.3e+02  Score=23.14  Aligned_cols=95  Identities=14%  Similarity=0.081  Sum_probs=42.1

Q ss_pred             eeEeecCC-EEEEEc-CCeE--EEecCCCcceeeEe-ccccCCCeeeEEEEeecCC-eEEEEeC-CCc--EEEEcCCCcC
Q 036387          225 MGWRADGG-LWLLVR-GGGL--FLSKGTGITEEFEE-VPVQSRGFGILDVGYRSQD-EAWAAGG-SGV--LLKTTNGGKT  295 (334)
Q Consensus       225 ~~~~~~g~-~~~~~~-~g~i--~~S~D~G~tW~w~~-~~~~~~~~~~~~v~~~~~~-~~~~~G~-~G~--i~~S~DgG~t  295 (334)
                      +.+.+++. +|++.. .+.|  |.-.+.|+ ++... ...+.   ....+.+.+++ .+|++.. .+.  +|.....|..
T Consensus        40 l~~spd~~~lyv~~~~~~~i~~~~~~~~g~-l~~~~~~~~~~---~p~~i~~~~~g~~l~v~~~~~~~v~v~~~~~~g~~  115 (330)
T PRK11028         40 MVISPDKRHLYVGVRPEFRVLSYRIADDGA-LTFAAESPLPG---SPTHISTDHQGRFLFSASYNANCVSVSPLDKDGIP  115 (330)
T ss_pred             EEECCCCCEEEEEECCCCcEEEEEECCCCc-eEEeeeecCCC---CceEEEECCCCCEEEEEEcCCCeEEEEEECCCCCC
Confidence            45567776 455443 3444  44433443 21111 12221   23456666555 4565542 343  3444434544


Q ss_pred             cEEcccCCCcccceeEEEEeeCCe-EEEEe
Q 036387          296 WIREKAADNIAANLYSVKFINEKK-GFVLG  324 (334)
Q Consensus       296 W~~~~~~~~~~~~l~~i~~~~~~~-~~a~G  324 (334)
                      .+.+... ......+.+++.++++ +|++.
T Consensus       116 ~~~~~~~-~~~~~~~~~~~~p~g~~l~v~~  144 (330)
T PRK11028        116 VAPIQII-EGLEGCHSANIDPDNRTLWVPC  144 (330)
T ss_pred             CCceeec-cCCCcccEeEeCCCCCEEEEee
Confidence            4433321 1113456666776554 44444


No 141
>KOG1963 consensus WD40 repeat protein [General function prediction only]
Probab=21.13  E-value=7.4e+02  Score=26.57  Aligned_cols=91  Identities=9%  Similarity=0.125  Sum_probs=49.0

Q ss_pred             eeeeEeecCCEEEEE-cCCeEEEecCCC--------cceeeEeccccCCCeeeEEEEeecCCe-EEEEeCCCcEEEEcCC
Q 036387          223 QNMGWRADGGLWLLV-RGGGLFLSKGTG--------ITEEFEEVPVQSRGFGILDVGYRSQDE-AWAAGGSGVLLKTTNG  292 (334)
Q Consensus       223 ~~~~~~~~g~~~~~~-~~g~i~~S~D~G--------~tW~w~~~~~~~~~~~~~~v~~~~~~~-~~~~G~~G~i~~S~Dg  292 (334)
                      +...+++.++..+++ .+|+|+.=.|-|        ..|.|..-       .+.++.|..++. +|-.|..|.+.+=.++
T Consensus       209 t~~~~spn~~~~Aa~d~dGrI~vw~d~~~~~~~~t~t~lHWH~~-------~V~~L~fS~~G~~LlSGG~E~VLv~Wq~~  281 (792)
T KOG1963|consen  209 TCVALSPNERYLAAGDSDGRILVWRDFGSSDDSETCTLLHWHHD-------EVNSLSFSSDGAYLLSGGREGVLVLWQLE  281 (792)
T ss_pred             eeEEeccccceEEEeccCCcEEEEeccccccccccceEEEeccc-------ccceeEEecCCceEeecccceEEEEEeec
Confidence            334556666665554 357777666655        22334421       245666765554 4444556765332222


Q ss_pred             CcCcEEcccCCCcccceeEEEEeeCCeEEEE
Q 036387          293 GKTWIREKAADNIAANLYSVKFINEKKGFVL  323 (334)
Q Consensus       293 G~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~  323 (334)
                      =.. ++. .| ...+.+..+.+++++..|++
T Consensus       282 T~~-kqf-LP-RLgs~I~~i~vS~ds~~~sl  309 (792)
T KOG1963|consen  282 TGK-KQF-LP-RLGSPILHIVVSPDSDLYSL  309 (792)
T ss_pred             CCC-ccc-cc-ccCCeeEEEEEcCCCCeEEE
Confidence            222 332 11 24578888888888877754


No 142
>cd02110 SO_family_Moco_dimer Subgroup of sulfite oxidase (SO) family molybdopterin binding domains that contains conserved dimerization domain. This molybdopterin cofactor (Moco) binding domain is found in a variety of oxidoreductases, main members of this family are nitrate reductase (NR) and sulfite oxidase (SO).
Probab=21.06  E-value=84  Score=29.68  Aligned_cols=28  Identities=11%  Similarity=0.293  Sum_probs=19.2

Q ss_pred             eeEEEecCCCccceEEecCCCCCcEEccc
Q 036387           81 SISLAATTGLYEQPAKSEEALSAWERVYI  109 (334)
Q Consensus        81 g~~~~~g~~~~g~i~~S~DgG~tW~~~~~  109 (334)
                      |.+|..++. -..+-.|.|+|+||+....
T Consensus       229 G~A~~g~~~-I~rVEvS~DgG~tW~~A~l  256 (317)
T cd02110         229 GVAWSGGRG-IRRVEVSLDGGRTWQEARL  256 (317)
T ss_pred             EEEEcCCCC-EEEEEEEeCCCCcceEeEc
Confidence            444544332 2467889999999998765


No 143
>COG4409 NanH Neuraminidase (sialidase) [Carbohydrate transport and metabolism]
Probab=20.72  E-value=1.8e+02  Score=30.52  Aligned_cols=105  Identities=18%  Similarity=0.298  Sum_probs=50.0

Q ss_pred             cceEEecCCCCCcEEcccCCCCC---eeeEEEEEecCCCCEEEEEEcCC--eEEEEcCCCcCeEeCcC-CCCcccCccee
Q 036387           92 EQPAKSEEALSAWERVYIPVDPG---VVLLDIAFVPDDLNHGFLLGTRQ--TLLETKDGGKTWAPRSI-PSAEEEDFNYR  165 (334)
Q Consensus        92 g~i~~S~DgG~tW~~~~~p~~~~---~~l~~I~~~p~d~~~~~avG~~g--~i~~S~DgG~TW~~~~~-p~~~~~~~~~~  165 (334)
                      -....|+|+|+.|+.-..|....   ..+.-+...+ +-...+..-..+  ....+.|+|++|..... +..........
T Consensus       545 ~~~~~sDd~~~~sq~sv~~i~~~~~saeaa~vel~~-~~~~~f~Rt~~~~~~Y~~skd~G~tWs~~~y~~~~~n~~~gt~  623 (728)
T COG4409         545 LYNKLSDDGGANSQVSVTPIPSSTQSAEAAMVELSK-GKIQAFGRTDQGKIAYRTSKDGGETWSVDKYFSYGGNVSYGTQ  623 (728)
T ss_pred             cceeeecCCCCcceeeeeecCccccchhHHHHHhcc-chhhhhhhhcccceeEEEeccCCeeeehhhhccccCCccceee
Confidence            44667899999998654433210   0111111110 111223223334  46778999999985431 11100011224


Q ss_pred             EEEEEEe---C-CeEEEEEcC--------C----EEEEEcCCCCCeEE
Q 036387          166 FNSISFK---G-KEGWIVGKP--------A----ILLHTSDAGESWER  197 (334)
Q Consensus       166 ~~~I~~~---~-~~~~~vG~~--------g----~i~~S~DgG~TW~~  197 (334)
                      +.+|...   | ++++++..+        |    ++..+.|.+..|.-
T Consensus       624 ~Ssis~~~~~D~~~av~~~~pn~~~g~~~g~~~Lglin~~d~~~~wky  671 (728)
T COG4409         624 YSSISYRQLGDGEHAVIVSTPNGNIGGKDGRYRLGLINSSDNPIDWKY  671 (728)
T ss_pred             eeeeeeeccCCcceEEEEecCCCCcccccceEEeeeeeccCCcceeee
Confidence            5566532   4 566665321        1    44555666666654


No 144
>KOG2048 consensus WD40 repeat protein [General function prediction only]
Probab=20.50  E-value=1e+03  Score=25.03  Aligned_cols=193  Identities=18%  Similarity=0.198  Sum_probs=93.5

Q ss_pred             eeeEEEEEecCCCCEEEEEE-cCCeEEEEcCCCc---CeEeCcCCCCcccCcceeEEEEEEeC-CeEEEEEcCCEEEEEc
Q 036387          115 VVLLDIAFVPDDLNHGFLLG-TRQTLLETKDGGK---TWAPRSIPSAEEEDFNYRFNSISFKG-KEGWIVGKPAILLHTS  189 (334)
Q Consensus       115 ~~l~~I~~~p~d~~~~~avG-~~g~i~~S~DgG~---TW~~~~~p~~~~~~~~~~~~~I~~~~-~~~~~vG~~g~i~~S~  189 (334)
                      ..+.+|+..|.  ++..++| ++|.++. .++|-   +... .++...     -++.++.+++ ..-.+.|...++.+--
T Consensus       111 g~IWsiai~p~--~~~l~IgcddGvl~~-~s~~p~~I~~~r-~l~rq~-----sRvLslsw~~~~~~i~~Gs~Dg~Iriw  181 (691)
T KOG2048|consen  111 GAIWSIAINPE--NTILAIGCDDGVLYD-FSIGPDKITYKR-SLMRQK-----SRVLSLSWNPTGTKIAGGSIDGVIRIW  181 (691)
T ss_pred             cceeEEEeCCc--cceEEeecCCceEEE-EecCCceEEEEe-eccccc-----ceEEEEEecCCccEEEecccCceEEEE
Confidence            67788888753  5677777 6775332 33221   2222 122211     1566777775 4445666655555655


Q ss_pred             CC--CCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCCeE-EEecCCCcceeeEeccccCCCeee
Q 036387          190 DA--GESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGGGL-FLSKGTGITEEFEEVPVQSRGFGI  266 (334)
Q Consensus       190 Dg--G~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g~i-~~S~D~G~tW~w~~~~~~~~~~~~  266 (334)
                      |.  |.+=..+..  ++.+-.       ..-..-+..+.+..++.+......|.| |+-.+.|.  --+....-  ...+
T Consensus       182 d~~~~~t~~~~~~--~~d~l~-------k~~~~iVWSv~~Lrd~tI~sgDS~G~V~FWd~~~gT--LiqS~~~h--~adV  248 (691)
T KOG2048|consen  182 DVKSGQTLHIITM--QLDRLS-------KREPTIVWSVLFLRDSTIASGDSAGTVTFWDSIFGT--LIQSHSCH--DADV  248 (691)
T ss_pred             EcCCCceEEEeee--cccccc-------cCCceEEEEEEEeecCcEEEecCCceEEEEcccCcc--hhhhhhhh--hcce
Confidence            53  222221111  111100       000001122333445555444444443 22222221  00111111  1245


Q ss_pred             EEEEeec-CCeEEEEeCCCcE--EEEcCCCcCcEEcccCCCcccceeEEEEeeCCeEEEEeCCeeEE
Q 036387          267 LDVGYRS-QDEAWAAGGSGVL--LKTTNGGKTWIREKAADNIAANLYSVKFINEKKGFVLGNDGVLL  330 (334)
Q Consensus       267 ~~v~~~~-~~~~~~~G~~G~i--~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~~a~G~~G~il  330 (334)
                      ++++-.+ .+.++.+|-++.+  |+.+-.++.|......+.-...+.+++..+ ..++..|.++.+.
T Consensus       249 l~Lav~~~~d~vfsaGvd~~ii~~~~~~~~~~wv~~~~r~~h~hdvrs~av~~-~~l~sgG~d~~l~  314 (691)
T KOG2048|consen  249 LALAVADNEDRVFSAGVDPKIIQYSLTTNKSEWVINSRRDLHAHDVRSMAVIE-NALISGGRDFTLA  314 (691)
T ss_pred             eEEEEcCCCCeEEEccCCCceEEEEecCCccceeeeccccCCcccceeeeeec-ceEEecceeeEEE
Confidence            6666544 4778888888865  334444445998876444456788888775 4677777777654


No 145
>KOG2106 consensus Uncharacterized conserved protein, contains HELP and WD40 domains [Function unknown]
Probab=20.41  E-value=9.2e+02  Score=24.56  Aligned_cols=136  Identities=13%  Similarity=0.210  Sum_probs=77.9

Q ss_pred             EEEEEEeC-C-eEEEEEcCCEEEEEcCCCCCeEEeecCCCCCCCcccccccCccccceEeeeeEeecCCEEEEEcCCeEE
Q 036387          166 FNSISFKG-K-EGWIVGKPAILLHTSDAGESWERIPLSSQLPGDMAFWQPHNRAVARRIQNMGWRADGGLWLLVRGGGLF  243 (334)
Q Consensus       166 ~~~I~~~~-~-~~~~vG~~g~i~~S~DgG~TW~~~~~~~~l~g~~~~~~~~~~~~~~~i~~~~~~~~g~~~~~~~~g~i~  243 (334)
                      +..++.++ + ...-+|+...+-.-.|.---|+++...+                   ...+.|.+.| +++++...+.+
T Consensus       371 lwgla~hps~~q~~T~gqdk~v~lW~~~k~~wt~~~~d~-------------------~~~~~fhpsg-~va~Gt~~G~w  430 (626)
T KOG2106|consen  371 LWGLATHPSKNQLLTCGQDKHVRLWNDHKLEWTKIIEDP-------------------AECADFHPSG-VVAVGTATGRW  430 (626)
T ss_pred             eeeEEcCCChhheeeccCcceEEEccCCceeEEEEecCc-------------------eeEeeccCcc-eEEEeeccceE
Confidence            45555554 3 3444577664444447777899876431                   1224445555 44444322222


Q ss_pred             EecCCCcceeeEeccccCCCeeeEEEEeecCCeEEEEeCC-C--cEEEEcCCCcCcEEcccCCCcccceeEEEEeeCCeE
Q 036387          244 LSKGTGITEEFEEVPVQSRGFGILDVGYRSQDEAWAAGGS-G--VLLKTTNGGKTWIREKAADNIAANLYSVKFINEKKG  320 (334)
Q Consensus       244 ~S~D~G~tW~w~~~~~~~~~~~~~~v~~~~~~~~~~~G~~-G--~i~~S~DgG~tW~~~~~~~~~~~~l~~i~~~~~~~~  320 (334)
                      .--|-..   -.-+.+......+..+.|.+++..+|+|.. +  .||+-.++|..-.++..-  ..+++..+.++.+++.
T Consensus       431 ~V~d~e~---~~lv~~~~d~~~ls~v~ysp~G~~lAvgs~d~~iyiy~Vs~~g~~y~r~~k~--~gs~ithLDwS~Ds~~  505 (626)
T KOG2106|consen  431 FVLDTET---QDLVTIHTDNEQLSVVRYSPDGAFLAVGSHDNHIYIYRVSANGRKYSRVGKC--SGSPITHLDWSSDSQF  505 (626)
T ss_pred             EEEeccc---ceeEEEEecCCceEEEEEcCCCCEEEEecCCCeEEEEEECCCCcEEEEeeee--cCceeEEeeecCCCce
Confidence            2222211   011112111235778899888988998874 3  467778889999988763  2278999999877654


Q ss_pred             EEEeCCe
Q 036387          321 FVLGNDG  327 (334)
Q Consensus       321 ~a~G~~G  327 (334)
                       +.++.|
T Consensus       506 -~~~~S~  511 (626)
T KOG2106|consen  506 -LVSNSG  511 (626)
T ss_pred             -EEeccC
Confidence             455554


No 146
>cd02114 bact_SorA_Moco sulfite:cytochrome c oxidoreductase subunit A (SorA), molybdopterin binding domain. SorA is involved in oxidation of sulfur compounds during chemolithothrophic growth. Together with SorB, a small c-type heme containing subunit, it forms a hetrodimer. It  is a member of the sulfite oxidase (SO) family of molybdopterin binding domains. This molybdopterin cofactor (Moco) binding domain is found in a variety of oxidoreductases, main members of this family are nitrate reductase (NR) and sulfite oxidase (SO). Common features of all known members of this family are that they contain one single pterin cofactor and part of the coordination of the metal (Mo) is a cysteine ligand of the protein and that they catalyze the transfer of an oxygen to or from a lone pair of electrons on the substrate.
Probab=20.24  E-value=85  Score=30.35  Aligned_cols=28  Identities=14%  Similarity=0.374  Sum_probs=18.7

Q ss_pred             eeEEEecCCCccceEEecCCCCCcEEccc
Q 036387           81 SISLAATTGLYEQPAKSEEALSAWERVYI  109 (334)
Q Consensus        81 g~~~~~g~~~~g~i~~S~DgG~tW~~~~~  109 (334)
                      |.+|..+.. -..+-.|.|+|+||+....
T Consensus       281 G~A~~G~~~-I~rVEVS~DgG~tW~~A~l  308 (367)
T cd02114         281 GIAFDGGSG-IRRVDVSADGGDSWTQATL  308 (367)
T ss_pred             EEEEcCCCC-EEEEEEEeCCCCcceEeEe
Confidence            444543322 2457779999999998764


Done!