Query         001901
Match_columns 998
No_of_seqs    730 out of 4690
Neff          7.5 
Searched_HMMs 46136
Date          Thu Mar 28 11:57:19 2013
Command       hhsearch -i /work/01045/syshi/csienesis_hhblits_a3m/001901.a3m -d /work/01045/syshi/HHdatabase/Cdd.hhm -o /work/01045/syshi/hhsearch_cdd/001901hhsearch_cdd -cpu 12 -v 0 

 No Hit                             Prob E-value P-value  Score    SS Cols Query HMM  Template HMM
  1 KOG0372 Serine/threonine speci 100.0 1.4E-78   3E-83  610.1  17.7  286  648-957     3-288 (303)
  2 KOG0374 Serine/threonine speci 100.0 1.8E-72 3.9E-77  619.6  26.9  321  648-987     9-330 (331)
  3 KOG0373 Serine/threonine speci 100.0 1.1E-71 2.4E-76  550.4  17.6  286  648-957     6-292 (306)
  4 PTZ00480 serine/threonine-prot 100.0 9.4E-69   2E-73  588.5  29.7  294  648-957    11-304 (320)
  5 cd07420 MPP_RdgC Drosophila me 100.0 3.8E-68 8.2E-73  584.8  30.9  286  646-951     5-320 (321)
  6 cd07419 MPP_Bsu1_C Arabidopsis 100.0 1.5E-67 3.3E-72  584.5  30.0  303  651-953     1-311 (311)
  7 cd07415 MPP_PP2A_PP4_PP6 PP2A, 100.0 5.6E-67 1.2E-71  571.1  30.1  284  648-955     2-285 (285)
  8 PTZ00244 serine/threonine-prot 100.0 3.5E-67 7.6E-72  573.7  28.3  291  646-952     2-292 (294)
  9 cd07414 MPP_PP1_PPKL PP1, PPKL 100.0 4.6E-67   1E-71  574.0  28.0  291  648-954     2-292 (293)
 10 PTZ00239 serine/threonine prot 100.0 1.1E-66 2.3E-71  571.5  30.7  286  648-957     3-289 (303)
 11 cd07417 MPP_PP5_C PP5, C-termi 100.0 1.3E-65 2.9E-70  566.8  29.1  294  644-961    12-311 (316)
 12 cd07416 MPP_PP2B PP2B, metallo 100.0 7.3E-65 1.6E-69  560.4  30.9  288  648-958     3-301 (305)
 13 smart00156 PP2Ac Protein phosp 100.0 1.5E-64 3.3E-69  550.7  28.3  269  671-953     1-269 (271)
 14 cd07418 MPP_PP7 PP7, metalloph 100.0 1.6E-62 3.5E-67  546.8  31.1  300  644-953     8-365 (377)
 15 KOG0375 Serine-threonine phosp 100.0 5.8E-63 1.3E-67  518.4  12.7  273  670-955    60-343 (517)
 16 KOG0371 Serine/threonine prote 100.0 1.5E-62 3.2E-67  497.5  12.9  286  648-957    20-305 (319)
 17 KOG0377 Protein serine/threoni 100.0 5.4E-53 1.2E-57  453.0  13.6  280  648-948   121-426 (631)
 18 KOG0376 Serine-threonine phosp 100.0 1.3E-46 2.9E-51  417.1  13.5  279  671-963   183-467 (476)
 19 PLN02153 epithiospecifier prot 100.0   1E-36 2.3E-41  346.7  38.6  306   78-438     9-338 (341)
 20 PLN02193 nitrile-specifier pro 100.0 1.4E-36   3E-41  358.8  39.4  302   81-438   155-467 (470)
 21 KOG4693 Uncharacterized conser 100.0 1.6E-37 3.5E-42  316.7  24.2  301   90-444    12-350 (392)
 22 PLN02193 nitrile-specifier pro 100.0 1.1E-32 2.3E-37  325.8  36.6  278  113-443   120-414 (470)
 23 KOG4152 Host cell transcriptio 100.0 3.9E-34 8.4E-39  312.6  22.1  310   77-440    18-364 (830)
 24 KOG4441 Proteins containing BT 100.0 4.2E-33 9.1E-38  333.4  30.6  266  113-442   284-549 (571)
 25 TIGR03547 muta_rot_YjhT mutatr 100.0 5.5E-31 1.2E-35  300.4  33.7  277   87-436     3-343 (346)
 26 KOG0379 Kelch repeat-containin 100.0 6.3E-31 1.4E-35  310.0  30.3  297   83-439    52-357 (482)
 27 TIGR03548 mutarot_permut cycli 100.0 1.7E-30 3.6E-35  293.6  32.0  283   90-432     2-321 (323)
 28 PLN02153 epithiospecifier prot 100.0 2.7E-30   6E-35  294.0  32.8  260  158-442     5-287 (341)
 29 KOG4693 Uncharacterized conser 100.0 1.6E-31 3.6E-36  272.9  20.0  228   87-353    74-312 (392)
 30 PHA02713 hypothetical protein; 100.0 1.4E-30 3.1E-35  312.8  31.6  247  150-442   272-536 (557)
 31 PRK14131 N-acetylneuraminic ac 100.0 3.4E-30 7.3E-35  296.8  32.4  283   83-439    20-368 (376)
 32 KOG4441 Proteins containing BT 100.0 5.5E-30 1.2E-34  306.6  28.5  244   80-381   311-556 (571)
 33 cd00144 MPP_PPP_family phospho 100.0 2.3E-30   5E-35  277.1  20.0  218  701-939     1-224 (225)
 34 KOG1230 Protein containing rep 100.0 4.2E-30 9.1E-35  276.8  20.2  267   80-380    55-349 (521)
 35 PHA02713 hypothetical protein; 100.0 2.7E-29 5.8E-34  301.8  26.9  241   82-381   284-543 (557)
 36 KOG0379 Kelch repeat-containin 100.0 9.2E-29   2E-33  291.7  28.3  248  167-442    53-304 (482)
 37 PHA03098 kelch-like protein; P 100.0 8.8E-28 1.9E-32  289.9  30.3  251  150-442   264-514 (534)
 38 PHA03098 kelch-like protein; P 100.0 5.9E-27 1.3E-31  282.7  30.7  234   92-381   285-521 (534)
 39 TIGR03548 mutarot_permut cycli  99.9 4.8E-26 1.1E-30  257.3  26.4  225   83-356    54-316 (323)
 40 PHA02790 Kelch-like protein; P  99.9 5.2E-25 1.1E-29  261.1  28.8  207  113-378   271-477 (480)
 41 KOG1230 Protein containing rep  99.9 2.8E-25 6.1E-30  239.7  21.0  248  170-443    62-344 (521)
 42 PRK14131 N-acetylneuraminic ac  99.9 2.4E-24 5.3E-29  248.2  27.2  247   87-377    69-374 (376)
 43 KOG4152 Host cell transcriptio  99.9 2.2E-25 4.9E-30  244.3  16.9  255   80-371    70-363 (830)
 44 TIGR03547 muta_rot_YjhT mutatr  99.9 4.2E-24 9.2E-29  243.8  28.2  222  171-425     4-267 (346)
 45 PHA02790 Kelch-like protein; P  99.9 1.1E-23 2.4E-28  249.8  28.7  205  180-440   267-471 (480)
 46 cd07425 MPP_Shelphs Shewanella  99.9 3.8E-22 8.2E-27  210.3  14.6  185  701-924     1-196 (208)
 47 PRK13625 bis(5'-nucleosyl)-tet  99.9 3.4E-22 7.4E-27  216.2  11.8  131  698-830     1-145 (245)
 48 cd07423 MPP_PrpE Bacillus subt  99.8 1.2E-20 2.7E-25  203.1  11.2  130  698-830     1-142 (234)
 49 cd07413 MPP_PA3087 Pseudomonas  99.8 8.9E-20 1.9E-24  194.4  16.3  123  701-828     2-143 (222)
 50 cd07422 MPP_ApaH Escherichia c  99.8 1.8E-20 3.9E-25  202.2  10.6  129  700-841     1-134 (257)
 51 PRK00166 apaH diadenosine tetr  99.8 2.2E-19 4.8E-24  195.9  17.2  125  699-836     2-131 (275)
 52 TIGR00668 apaH bis(5'-nucleosy  99.8 6.7E-20 1.5E-24  197.5  11.9  127  699-839     2-134 (279)
 53 cd07421 MPP_Rhilphs Rhilph pho  99.8 6.9E-19 1.5E-23  189.3  15.9   82  699-780     3-85  (304)
 54 PRK11439 pphA serine/threonine  99.8 6.6E-19 1.4E-23  187.5  11.3  120  698-828    17-146 (218)
 55 cd07424 MPP_PrpA_PrpB PrpA and  99.8 1.4E-18 3.1E-23  183.6  12.7  147  698-862     1-157 (207)
 56 PHA02239 putative protein phos  99.8 5.7E-18 1.2E-22  181.2  13.8  124  699-830     2-168 (235)
 57 PRK09968 serine/threonine-spec  99.7 1.6E-17 3.5E-22  176.5   9.9  120  698-828    15-144 (218)
 58 COG3055 Uncharacterized protei  99.7 4.7E-15   1E-19  159.9  22.6  282   84-437    29-372 (381)
 59 KOG2437 Muskelin [Signal trans  99.5 3.1E-15 6.7E-20  165.3   2.9  313   86-439   255-612 (723)
 60 COG3055 Uncharacterized protei  99.4 1.2E-11 2.6E-16  133.9  19.5  236   88-368    79-371 (381)
 61 KOG2437 Muskelin [Signal trans  99.2 9.1E-12   2E-16  138.3   4.4  210  212-436   238-468 (723)
 62 PF00149 Metallophos:  Calcineu  99.0 3.8E-09 8.3E-14  105.7  11.7   78  699-782     2-85  (200)
 63 COG0639 ApaH Diadenosine tetra  98.8 7.3E-09 1.6E-13  102.5   7.0  147  776-929     2-155 (155)
 64 PLN02772 guanylate kinase       98.7 5.4E-08 1.2E-12  110.0  12.1   93   84-211    17-110 (398)
 65 PF13964 Kelch_6:  Kelch motif   98.7 2.8E-08   6E-13   80.0   6.8   50   91-175     1-50  (50)
 66 PLN02772 guanylate kinase       98.7 6.1E-08 1.3E-12  109.6  11.3   89  172-264    22-110 (398)
 67 PF13964 Kelch_6:  Kelch motif   98.7   3E-08 6.5E-13   79.8   6.3   50  174-228     1-50  (50)
 68 PF13415 Kelch_3:  Galactose ox  98.7 5.5E-08 1.2E-12   78.0   6.6   49  113-183     1-49  (49)
 69 PRK09453 phosphodiesterase; Pr  98.6 1.3E-07 2.9E-12   98.0   9.5   68  698-775     1-76  (182)
 70 PF12850 Metallophos_2:  Calcin  98.6 1.2E-06 2.5E-11   87.9  14.2   61  698-776     1-61  (156)
 71 cd00841 MPP_YfcE Escherichia c  98.5 3.3E-07 7.1E-12   92.2   9.1   59  699-775     1-59  (155)
 72 PF13418 Kelch_4:  Galactose ox  98.5 1.5E-07 3.2E-12   75.4   4.1   47   91-168     1-47  (49)
 73 PF07646 Kelch_2:  Kelch motif;  98.5 4.4E-07 9.5E-12   72.7   6.5   47  333-381     1-48  (49)
 74 TIGR00040 yfcE phosphoesterase  98.5 4.2E-06 9.1E-11   84.6  15.3   62  698-774     1-63  (158)
 75 PF13415 Kelch_3:  Galactose ox  98.4 3.7E-07 8.1E-12   73.1   5.8   48  184-236     1-49  (49)
 76 PF13418 Kelch_4:  Galactose ox  98.4 2.2E-07 4.9E-12   74.3   4.1   46  227-274     1-47  (49)
 77 cd07379 MPP_239FB Homo sapiens  98.4 1.7E-06 3.7E-11   85.1  10.6  118  699-911     1-120 (135)
 78 PF07646 Kelch_2:  Kelch motif;  98.3 1.2E-06 2.7E-11   70.1   6.5   46  227-275     1-49  (49)
 79 cd07397 MPP_DevT Myxococcus xa  98.3   2E-06 4.4E-11   91.8   9.6  113  699-830     2-160 (238)
 80 cd07388 MPP_Tt1561 Thermus the  98.3 5.2E-06 1.1E-10   88.4  12.3   71  698-775     5-75  (224)
 81 PF13854 Kelch_5:  Kelch motif   98.3 1.3E-06 2.9E-11   67.5   5.6   40  171-210     1-41  (42)
 82 PF01344 Kelch_1:  Kelch motif;  98.3 1.1E-06 2.4E-11   69.6   4.7   44  174-219     1-44  (47)
 83 PF01344 Kelch_1:  Kelch motif;  98.3 1.1E-06 2.4E-11   69.6   4.4   45  227-274     1-46  (47)
 84 PF13854 Kelch_5:  Kelch motif   98.2   2E-06 4.3E-11   66.5   5.4   39  224-263     1-41  (42)
 85 cd00838 MPP_superfamily metall  98.2 1.5E-05 3.2E-10   76.3  11.3  117  701-911     1-119 (131)
 86 PF03089 RAG2:  Recombination a  98.1 0.00087 1.9E-08   71.5  22.6  147   84-260    15-188 (337)
 87 PF07250 Glyoxal_oxid_N:  Glyox  98.0 0.00025 5.5E-09   76.2  16.9  154  203-383    48-210 (243)
 88 smart00612 Kelch Kelch domain.  98.0 1.1E-05 2.3E-10   63.3   4.7   47  115-185     1-47  (47)
 89 PF03089 RAG2:  Recombination a  97.9  0.0041   9E-08   66.5  23.7  110  186-301    40-174 (337)
 90 PF07250 Glyoxal_oxid_N:  Glyox  97.9  0.0011 2.5E-08   71.2  20.0  149  149-318    45-199 (243)
 91 cd07394 MPP_Vps29 Homo sapiens  97.9 0.00039 8.4E-09   71.8  15.8   58  699-774     1-64  (178)
 92 cd07392 MPP_PAE1087 Pyrobaculu  97.9 0.00027 5.8E-09   73.1  14.6   65  700-776     1-66  (188)
 93 smart00612 Kelch Kelch domain.  97.8 2.2E-05 4.9E-10   61.5   4.8   47  345-416     1-47  (47)
 94 KOG0376 Serine-threonine phosp  97.7 7.7E-06 1.7E-10   93.1  -0.2  238  670-929    14-299 (476)
 95 cd07403 MPP_TTHA0053 Thermus t  97.6  0.0005 1.1E-08   67.1  11.3   56  701-773     1-56  (129)
 96 TIGR01640 F_box_assoc_1 F-box   97.6   0.013 2.8E-07   63.0  22.9  206  150-373    14-230 (230)
 97 PRK05340 UDP-2,3-diacylglucosa  97.5 0.00035 7.6E-09   75.8   9.6   70  698-775     1-83  (241)
 98 cd07404 MPP_MS158 Microscilla   97.4 0.00013 2.8E-09   74.3   4.2   67  700-775     1-68  (166)
 99 cd07399 MPP_YvnB Bacillus subt  97.4    0.01 2.3E-07   63.2  18.6   69  882-953   135-213 (214)
100 cd07400 MPP_YydB Bacillus subt  97.4  0.0025 5.4E-08   63.1  12.8   41  733-774    38-80  (144)
101 PRK11340 phosphodiesterase Yae  97.3 0.00045 9.7E-09   76.4   7.5   70  698-775    50-125 (271)
102 cd07385 MPP_YkuE_C Bacillus su  97.3 0.00044 9.5E-09   73.8   6.6   70  698-775     2-76  (223)
103 COG0622 Predicted phosphoester  97.2   0.014 3.1E-07   59.7  15.7   65  698-776     2-66  (172)
104 TIGR01854 lipid_A_lpxH UDP-2,3  97.1  0.0016 3.5E-08   70.2   8.7  177  700-910     1-200 (231)
105 cd07391 MPP_PF1019 Pyrococcus   97.0  0.0018 3.9E-08   66.4   7.9   43  733-775    44-88  (172)
106 cd07390 MPP_AQ1575 Aquifex aeo  96.9  0.0027 5.9E-08   64.9   8.3   40  733-777    45-84  (168)
107 TIGR03729 acc_ester putative p  96.9  0.0017 3.7E-08   70.3   7.2   68  699-775     1-74  (239)
108 PRK11138 outer membrane biogen  96.8    0.73 1.6E-05   53.8  28.5  187  151-377    80-282 (394)
109 cd07395 MPP_CSTP1 Homo sapiens  96.8   0.059 1.3E-06   59.2  18.0   28  884-911   195-222 (262)
110 cd07396 MPP_Nbla03831 Homo sap  96.7  0.0035 7.6E-08   69.1   7.9   73  699-777     2-88  (267)
111 cd00840 MPP_Mre11_N Mre11 nucl  96.7  0.0026 5.6E-08   67.7   6.5   73  699-777     1-91  (223)
112 TIGR00619 sbcd exonuclease Sbc  96.6  0.0042   9E-08   68.0   7.4   72  698-775     1-88  (253)
113 cd00844 MPP_Dbr1_N Dbr1 RNA la  96.6  0.0043 9.3E-08   68.0   7.0   70  700-775     1-86  (262)
114 PRK04036 DNA polymerase II sma  96.5  0.0095 2.1E-07   71.5   9.8   79  697-777   243-345 (504)
115 PHA02546 47 endonuclease subun  96.4  0.0059 1.3E-07   69.8   7.1   72  698-775     1-89  (340)
116 cd07398 MPP_YbbF-LpxH Escheric  96.3  0.0075 1.6E-07   64.0   7.0   26  882-907   176-201 (217)
117 cd07402 MPP_GpdQ Enterobacter   96.3   0.011 2.3E-07   63.8   8.0   69  699-775     1-83  (240)
118 PRK11138 outer membrane biogen  96.3     1.5 3.3E-05   51.1  26.3  181  149-374   169-356 (394)
119 COG1409 Icc Predicted phosphoh  96.2    0.11 2.3E-06   57.5  15.7   74  699-779     2-82  (301)
120 KOG0918 Selenium-binding prote  96.2 0.00054 1.2E-08   76.0  -3.0  208  732-953    49-262 (476)
121 TIGR00024 SbcD_rel_arch putati  96.1   0.015 3.3E-07   62.3   7.7   69  698-776    15-103 (225)
122 cd08165 MPP_MPPE1 human MPPE1   96.0  0.0095 2.1E-07   60.2   5.4   43  733-775    41-89  (156)
123 PF13360 PQQ_2:  PQQ-like domai  96.0     2.8   6E-05   44.6  26.8  181  150-374    46-233 (238)
124 cd00839 MPP_PAPs purple acid p  95.9   0.039 8.5E-07   61.5  10.5   37  883-919   181-217 (294)
125 PRK10966 exonuclease subunit S  95.9   0.012 2.6E-07   68.7   6.4   71  699-776     2-88  (407)
126 PRK11148 cyclic 3',5'-adenosin  95.9   0.018 3.9E-07   63.8   7.4   70  698-775    15-98  (275)
127 cd07383 MPP_Dcr2 Saccharomyces  95.8   0.025 5.5E-07   59.3   7.6   41  733-773    44-87  (199)
128 TIGR01640 F_box_assoc_1 F-box   95.7       1 2.2E-05   48.2  20.1  164  201-381    14-187 (230)
129 cd07386 MPP_DNA_pol_II_small_a  95.7   0.034 7.5E-07   60.4   8.4   42  733-776    38-95  (243)
130 cd07393 MPP_DR1119 Deinococcus  95.4   0.034 7.3E-07   60.0   7.2   45  882-928   180-227 (232)
131 cd08163 MPP_Cdc1 Saccharomyces  95.4    0.42   9E-06   52.4  15.6   30  882-913   203-232 (257)
132 TIGR03300 assembly_YfgL outer   95.4     7.1 0.00015   45.1  29.7  181  151-377    76-267 (377)
133 TIGR03300 assembly_YfgL outer   95.3     4.2 9.1E-05   47.0  24.7  185  148-377   113-305 (377)
134 TIGR00583 mre11 DNA repair pro  95.2   0.043 9.4E-07   63.8   7.7   73  698-776     4-124 (405)
135 cd07401 MPP_TMEM62_N Homo sapi  95.2   0.057 1.2E-06   59.2   8.0   27  887-913   190-216 (256)
136 PF13360 PQQ_2:  PQQ-like domai  95.1     5.5 0.00012   42.3  26.6  182  151-377     4-199 (238)
137 COG2908 Uncharacterized protei  95.0    0.09 1.9E-06   55.8   8.5  196  702-945     2-229 (237)
138 PF12768 Rax2:  Cortical protei  95.0     1.3 2.9E-05   49.0  17.9  114  148-273    14-130 (281)
139 cd08166 MPP_Cdc1_like_1 unchar  94.8   0.051 1.1E-06   56.7   6.1   42  733-774    45-92  (195)
140 cd08164 MPP_Ted1 Saccharomyces  94.7   0.077 1.7E-06   55.2   7.0   65  705-774    24-110 (193)
141 COG2129 Predicted phosphoester  94.6     3.6 7.8E-05   43.6  19.0  205  698-943     4-217 (226)
142 cd07384 MPP_Cdc1_like Saccharo  94.2    0.08 1.7E-06   54.3   5.9   43  733-775    48-100 (171)
143 cd07380 MPP_CWF19_N Schizosacc  94.2     0.1 2.3E-06   52.2   6.5   68  701-773     1-68  (150)
144 PF07893 DUF1668:  Protein of u  94.1     1.2 2.6E-05   50.9  15.7  124  236-381    74-217 (342)
145 COG1408 Predicted phosphohydro  93.4    0.17 3.6E-06   56.3   6.9   71  698-776    45-119 (284)
146 COG1407 Predicted ICC-like pho  93.3    0.25 5.3E-06   52.8   7.6   76  692-777    13-112 (235)
147 cd00845 MPP_UshA_N_like Escher  92.7     0.2 4.2E-06   54.6   6.2   66  699-774     2-81  (252)
148 cd00216 PQQ_DH Dehydrogenases   92.7      21 0.00045   43.1  23.9  113  151-272    72-193 (488)
149 TIGR03075 PQQ_enz_alc_DH PQQ-d  91.8      30 0.00065   42.1  23.8  111  151-271    80-198 (527)
150 PF07893 DUF1668:  Protein of u  91.3     4.6  0.0001   46.3  15.4  111  151-274    87-217 (342)
151 PF06874 FBPase_2:  Firmicute f  91.3    0.23 5.1E-06   59.3   4.9   70  883-954   507-586 (640)
152 PRK05137 tolB translocation pr  90.3      45 0.00097   39.5  25.5  192  149-379   181-374 (435)
153 PF14582 Metallophos_3:  Metall  90.0    0.39 8.5E-06   50.6   4.6   74  698-777     6-104 (255)
154 PLN02533 probable purple acid   89.7    0.48   1E-05   55.9   5.7   25  884-908   311-335 (427)
155 COG4186 Predicted phosphoester  89.4     1.5 3.3E-05   43.4   7.8   40  733-776    48-87  (186)
156 cd00216 PQQ_DH Dehydrogenases   88.8      62  0.0013   39.0  27.4  119  148-271   173-328 (488)
157 cd07410 MPP_CpdB_N Escherichia  88.6    0.67 1.5E-05   51.3   5.6   20  887-906   209-229 (277)
158 KOG3662 Cell division control   88.3    0.84 1.8E-05   52.5   6.1   57  713-774    81-143 (410)
159 KOG0310 Conserved WD40 repeat-  87.2      32  0.0007   40.1  17.6   68  182-265   120-187 (487)
160 COG1311 HYS2 Archaeal DNA poly  86.6      12 0.00026   44.0  14.1  189  699-928   227-450 (481)
161 COG0420 SbcD DNA repair exonuc  86.5     1.6 3.5E-05   50.9   7.4   45  733-777    43-90  (390)
162 PRK03629 tolB translocation pr  85.1      89  0.0019   37.0  24.6  149  201-380   223-372 (429)
163 cd07378 MPP_ACP5 Homo sapiens   84.2       2 4.3E-05   47.4   6.4   23  884-906   190-212 (277)
164 KOG2055 WD40 repeat protein [G  83.8      48   0.001   38.6  16.8  148  184-372   269-418 (514)
165 cd07412 MPP_YhcR_N Bacillus su  82.9     1.8 3.8E-05   48.4   5.3   66  699-774     2-87  (288)
166 cd07387 MPP_PolD2_C PolD2 (DNA  82.7      38 0.00082   37.2  15.3   47  898-949   206-255 (257)
167 PRK04792 tolB translocation pr  82.4 1.2E+02  0.0025   36.2  24.6  191  149-379   197-390 (448)
168 cd07408 MPP_SA0022_N Staphyloc  80.8     2.8 6.1E-05   45.9   5.9   65  699-774     2-81  (257)
169 PF12768 Rax2:  Cortical protei  79.7      28 0.00061   38.7  13.1  113  252-380    14-130 (281)
170 cd00094 HX Hemopexin-like repe  79.3      84  0.0018   32.7  17.4  151  179-374    11-178 (194)
171 TIGR02800 propeller_TolB tol-p  79.1 1.3E+02  0.0029   34.9  24.5  147  201-380   214-363 (417)
172 COG1520 FOG: WD40-like repeat   79.0 1.3E+02  0.0028   34.6  19.6  158  181-377    65-225 (370)
173 cd07411 MPP_SoxB_N Thermus the  78.5       4 8.7E-05   44.9   6.2   35  734-774    55-94  (264)
174 TIGR03075 PQQ_enz_alc_DH PQQ-d  78.2 1.5E+02  0.0032   36.2  20.0  131  180-327    65-201 (527)
175 KOG2055 WD40 repeat protein [G  75.2      40 0.00088   39.2  12.7   99  148-264   278-376 (514)
176 cd00842 MPP_ASMase acid sphing  74.3     5.3 0.00012   44.6   5.8   46  733-778    71-125 (296)
177 COG3855 Fbp Uncharacterized pr  73.7     3.6 7.9E-05   47.3   4.1   40  733-777   193-232 (648)
178 PF14583 Pectate_lyase22:  Olig  73.1 1.2E+02  0.0027   35.1  16.2  225  150-425    60-303 (386)
179 PRK13684 Ycf48-like protein; P  72.1 1.8E+02   0.004   33.1  22.5  175  160-380   119-297 (334)
180 KOG0646 WD40 repeat protein [G  71.7      93   0.002   36.3  14.6   96  148-264   101-208 (476)
181 PRK04792 tolB translocation pr  71.1 2.3E+02  0.0049   33.7  21.5  142  150-318   242-384 (448)
182 PF02191 OLF:  Olfactomedin-lik  71.1 1.6E+02  0.0036   32.1  18.4  159  172-349    66-236 (250)
183 PRK04922 tolB translocation pr  68.2 2.5E+02  0.0054   33.1  24.2  147  201-380   228-377 (433)
184 COG1768 Predicted phosphohydro  68.2      11 0.00023   38.5   5.6   79  733-831    46-126 (230)
185 PRK09419 bifunctional 2',3'-cy  68.2     7.8 0.00017   51.8   6.2   66  699-774   662-735 (1163)
186 PF08321 PPP5:  PPP5 TPR repeat  68.0      11 0.00024   34.7   5.3   41  646-696    55-95  (95)
187 cd00094 HX Hemopexin-like repe  67.4 1.6E+02  0.0035   30.6  15.7  106  185-318    63-177 (194)
188 TIGR03074 PQQ_membr_DH membran  67.3 2.9E+02  0.0063   35.4  19.3   35  178-219   188-222 (764)
189 COG4880 Secreted protein conta  67.1      88  0.0019   36.3  12.9  184  148-381   404-600 (603)
190 KOG0649 WD40 repeat protein [G  67.0 1.6E+02  0.0034   31.9  14.0  157  159-350    98-263 (325)
191 TIGR03866 PQQ_ABC_repeats PQQ-  65.9 1.9E+02  0.0042   31.0  26.0   93  150-264    53-147 (300)
192 TIGR02800 propeller_TolB tol-p  65.5 2.6E+02  0.0057   32.3  23.2  141  150-317   214-355 (417)
193 cd07409 MPP_CD73_N CD73 ecto-5  65.1      14  0.0003   41.1   6.5   66  699-774     2-93  (281)
194 PF08268 FBA_3:  F-box associat  64.6      62  0.0014   31.1  10.3   83  240-326     7-89  (129)
195 PF06433 Me-amine-dh_H:  Methyl  62.1 1.2E+02  0.0027   34.5  13.1  103  148-264    15-128 (342)
196 KOG2863 RNA lariat debranching  61.6      12 0.00026   42.0   5.0   74  698-777     1-90  (456)
197 PRK01742 tolB translocation pr  60.7 3.4E+02  0.0073   32.0  22.6  140  201-379   228-369 (429)
198 PRK00178 tolB translocation pr  60.6 3.3E+02  0.0072   31.9  23.4  148  201-380   223-372 (430)
199 PRK05137 tolB translocation pr  60.4 3.4E+02  0.0074   31.9  22.9  195  150-380   226-421 (435)
200 COG1520 FOG: WD40-like repeat   60.0 3.2E+02  0.0068   31.4  16.9  156  148-315   161-319 (370)
201 PF04042 DNA_pol_E_B:  DNA poly  57.9      16 0.00034   38.5   5.2   72  700-777     1-93  (209)
202 TIGR03866 PQQ_ABC_repeats PQQ-  56.9 2.8E+02   0.006   29.8  22.0   92  150-264    11-105 (300)
203 PF08268 FBA_3:  F-box associat  56.6   1E+02  0.0022   29.6  10.2   86  289-380     3-89  (129)
204 TIGR00282 metallophosphoestera  55.2      24 0.00053   38.8   6.1   68  698-775     1-71  (266)
205 KOG3325 Membrane coat complex   55.1      48   0.001   32.9   7.2  103  700-845     3-107 (183)
206 KOG0306 WD40-repeat-containing  55.0 5.1E+02   0.011   32.5  17.1   95  151-264   337-444 (888)
207 PRK11028 6-phosphogluconolacto  53.2 3.7E+02   0.008   30.1  24.9   96  150-263    12-111 (330)
208 cd07406 MPP_CG11883_N Drosophi  53.1      25 0.00054   38.4   5.9   57  708-774    21-82  (257)
209 KOG1378 Purple acid phosphatas  53.0      39 0.00085   39.7   7.5   34  885-918   322-355 (452)
210 TIGR03074 PQQ_membr_DH membran  52.1 4.6E+02    0.01   33.6  17.4   35  231-272   188-222 (764)
211 KOG2476 Uncharacterized conser  51.8      34 0.00074   39.9   6.6   71  697-772     5-75  (528)
212 PF05096 Glu_cyclase_2:  Glutam  51.6 1.8E+02  0.0039   32.0  11.9   92  150-264    68-159 (264)
213 PF10282 Lactonase:  Lactonase,  50.3 4.3E+02  0.0093   30.0  16.4  175  176-380   145-333 (345)
214 PTZ00421 coronin; Provisional   50.0 5.4E+02   0.012   31.1  21.3   62  186-264   139-200 (493)
215 PF09910 DUF2139:  Uncharacteri  49.5 4.2E+02  0.0091   29.7  19.9  134  114-268    46-185 (339)
216 PRK04922 tolB translocation pr  49.5   5E+02   0.011   30.6  23.1  190  149-378   227-418 (433)
217 COG0737 UshA 5'-nucleotidase/2  48.9      23  0.0005   43.0   5.2   71  697-774    26-114 (517)
218 cd07405 MPP_UshA_N Escherichia  48.8      24 0.00052   39.3   4.9   69  700-774     3-86  (285)
219 KOG1432 Predicted DNA repair e  47.2      48   0.001   37.4   6.7   44  733-776   103-148 (379)
220 PRK00178 tolB translocation pr  46.9 5.3E+02   0.012   30.1  21.9  183  150-373   223-408 (430)
221 PF08450 SGL:  SMP-30/Gluconola  46.8 3.9E+02  0.0084   28.5  25.3  191  148-379    20-221 (246)
222 PRK04043 tolB translocation pr  46.7 5.5E+02   0.012   30.3  20.2  154  201-381   213-367 (419)
223 smart00284 OLF Olfactomedin-li  45.1 4.6E+02  0.0099   28.8  18.8  159  172-349    71-241 (255)
224 PRK02889 tolB translocation pr  43.9   6E+02   0.013   29.9  25.1  191  150-379   176-368 (427)
225 PTZ00235 DNA polymerase epsilo  43.4      62  0.0013   36.0   6.9   75  698-774    28-121 (291)
226 PLN00181 protein SPA1-RELATED;  42.8 8.4E+02   0.018   31.3  22.8   62  186-264   546-608 (793)
227 KOG0646 WD40 repeat protein [G  42.5 1.3E+02  0.0028   35.2   9.3  158  230-436    84-249 (476)
228 PF10282 Lactonase:  Lactonase,  42.5 5.6E+02   0.012   29.1  20.1  202  151-382    16-235 (345)
229 PF09910 DUF2139:  Uncharacteri  41.9 5.5E+02   0.012   28.8  18.2  136  253-421    77-219 (339)
230 cd07407 MPP_YHR202W_N Saccharo  41.3      39 0.00084   37.6   5.1   38  733-775    53-97  (282)
231 PF05096 Glu_cyclase_2:  Glutam  41.1 4.5E+02  0.0098   29.0  12.9  115  230-375    47-161 (264)
232 cd00200 WD40 WD40 domain, foun  41.1 4.2E+02  0.0091   27.3  23.4   94  150-264    73-167 (289)
233 PTZ00420 coronin; Provisional   39.7 8.2E+02   0.018   30.2  21.0   61  186-264   139-199 (568)
234 PRK09420 cpdB bifunctional 2',  37.4      48   0.001   41.5   5.5   69  696-774    24-121 (649)
235 cd07382 MPP_DR1281 Deinococcus  37.0      78  0.0017   34.7   6.5   66  699-774     1-69  (255)
236 PF02897 Peptidase_S9_N:  Proly  36.9 7.2E+02   0.016   28.8  20.1  204  149-379   149-366 (414)
237 cd08162 MPP_PhoA_N Synechococc  35.9      61  0.0013   36.7   5.6   69  700-774     3-90  (313)
238 PF14870 PSII_BNR:  Photosynthe  35.5 6.9E+02   0.015   28.2  21.9  178  158-381    89-271 (302)
239 TIGR01390 CycNucDiestase 2',3'  34.8      51  0.0011   41.0   5.2   66  699-774     4-98  (626)
240 PRK09419 bifunctional 2',3'-cy  34.7      50  0.0011   44.4   5.4   21  884-904   256-277 (1163)
241 KOG0310 Conserved WD40 repeat-  34.7 7.8E+02   0.017   29.3  14.0  117  151-302   177-301 (487)
242 PLN00033 photosystem II stabil  34.6 8.2E+02   0.018   28.7  23.1   90  267-380   271-365 (398)
243 KOG3339 Predicted glycosyltran  34.1 1.2E+02  0.0027   31.3   6.7   92  732-828    40-144 (211)
244 PRK03629 tolB translocation pr  33.9 8.4E+02   0.018   28.7  21.6  191  149-379   222-414 (429)
245 KOG0308 Conserved WD40 repeat-  32.8   1E+03   0.023   29.4  15.0   69  184-264   129-203 (735)
246 PRK11028 6-phosphogluconolacto  32.6 7.4E+02   0.016   27.6  25.2   97  151-264    58-158 (330)
247 TIGR02658 TTQ_MADH_Hv methylam  31.6 8.6E+02   0.019   28.1  28.1  104  149-264    26-138 (352)
248 PRK11907 bifunctional 2',3'-cy  31.4      64  0.0014   41.3   5.3   67  698-774   116-212 (814)
249 COG5184 ATS1 Alpha-tubulin sup  29.2 7.8E+02   0.017   29.3  12.9   22  230-251   114-135 (476)
250 PF09637 Med18:  Med18 protein;  27.8      63  0.0014   35.3   3.9   39  883-924   139-177 (250)
251 PRK04043 tolB translocation pr  27.6 1.1E+03   0.023   27.9  22.1  193  149-380   212-409 (419)
252 cd00200 WD40 WD40 domain, foun  27.5 6.8E+02   0.015   25.6  25.9   63  185-264    63-125 (289)
253 KOG3947 Phosphoesterases [Gene  26.8      82  0.0018   34.6   4.3   62  698-775    62-126 (305)
254 PTZ00421 coronin; Provisional   26.4 1.2E+03   0.026   28.1  18.8   51  240-302   139-190 (493)
255 PF03178 CPSF_A:  CPSF A subuni  26.4 9.3E+02    0.02   26.8  13.4  101  150-272    62-167 (321)
256 PF02897 Peptidase_S9_N:  Proly  26.0 1.1E+03   0.023   27.4  16.7  157  199-377   148-318 (414)
257 PF03178 CPSF_A:  CPSF A subuni  25.7 9.6E+02   0.021   26.7  15.1  124  201-351    62-190 (321)
258 KOG0281 Beta-TrCP (transducin   25.6 3.3E+02  0.0071   30.9   8.6   99  227-355   319-421 (499)
259 TIGR00282 metallophosphoestera  25.2      75  0.0016   35.1   3.9   39  733-775     2-41  (266)
260 PRK13684 Ycf48-like protein; P  24.8 1.1E+03   0.023   26.9  21.4  197  159-423    34-233 (334)
261 PRK05583 ribosomal protein L7A  24.5      67  0.0015   30.1   2.9   69  875-944    13-90  (104)
262 PTZ00422 glideosome-associated  24.4 1.2E+02  0.0025   35.5   5.4   22  886-907   239-260 (394)
263 TIGR01530 nadN NAD pyrophospha  24.2 1.4E+02  0.0031   36.6   6.5   37  733-774    52-93  (550)
264 KOG1332 Vesicle coat complex C  24.1 9.7E+02   0.021   26.2  13.5   52  319-381   245-297 (299)
265 PF02239 Cytochrom_D1:  Cytochr  21.5 1.3E+03   0.028   26.7  16.9  187  148-378    14-209 (369)
266 PF13088 BNR_2:  BNR repeat-lik  21.2 7.6E+02   0.017   26.5  11.0  136  151-296   135-275 (275)
267 KOG4649 PQQ (pyrrolo-quinoline  20.9 1.2E+03   0.025   25.9  13.0   60  201-273    33-92  (354)
268 TIGR02658 TTQ_MADH_Hv methylam  20.6 1.3E+03   0.029   26.5  16.6   72  185-265    13-88  (352)
269 KOG2321 WD40 repeat protein [G  20.4 5.7E+02   0.012   31.1   9.8  102  146-264   151-260 (703)
270 PF14870 PSII_BNR:  Photosynthe  20.1 1.3E+03   0.027   26.1  20.0  156  160-350    47-204 (302)

No 1  
>KOG0372 consensus Serine/threonine specific protein phosphatase involved in glycogen accumulation, PP2A-related [Carbohydrate transport and metabolism; Signal transduction mechanisms]
Probab=100.00  E-value=1.4e-78  Score=610.12  Aligned_cols=286  Identities=41%  Similarity=0.729  Sum_probs=273.2

Q ss_pred             HHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcCCCCCCC
Q 001901          648 PKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYGSPSTAG  727 (998)
Q Consensus       648 ~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g~~~~~~  727 (998)
                      +++.|+.|++..          .+.+.++..||.++.+||.+|++|++++.|++|||||||||+||+.+|+..|.++.. 
T Consensus         3 ldr~ie~L~~~~----------li~E~eV~~LC~~~~eiL~~E~NV~~i~tPvtvcGDIHGQf~Dllelf~igG~~~~t-   71 (303)
T KOG0372|consen    3 LDRQIEQLRRCE----------LIAESEVKALCAKVREILVEESNVQRIDTPVTVCGDIHGQFYDLLELFRIGGDVPET-   71 (303)
T ss_pred             HHHHHHHHHhcC----------CCcHHHHHHHHHHHHHHHhcCCCceecCCCcEEeecccchHHHHHHHHHhCCCCCCC-
Confidence            578899988752          688999999999999999999999999999999999999999999999999988877 


Q ss_pred             CccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhh
Q 001901          728 DIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLF  807 (998)
Q Consensus       728 ~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f  807 (998)
                           +|+|||||||||.+|+|+++||++||++||++|+|||||||++.++..|||++||.+|||.   ..+|+.++++|
T Consensus        72 -----~YLFLGDyVDRG~~SvEt~lLLl~lK~rYP~ritLiRGNHEsRqitqvYGFY~EclrKYG~---~~vWr~c~eiF  143 (303)
T KOG0372|consen   72 -----NYLFLGDYVDRGYYSVETFLLLLALKVRYPDRITLIRGNHESRQITQVYGFYDECLRKYGS---ANVWRYCTEIF  143 (303)
T ss_pred             -----ceEeecchhccccchHHHHHHHHHHhhcCcceeEEeeccchhhhhhhhhhHHHHHHHHcCC---hHHHHHHHHHH
Confidence                 8999999999999999999999999999999999999999999999999999999999995   47999999999


Q ss_pred             cccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHH
Q 001901          808 NWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRV  887 (998)
Q Consensus       808 ~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~  887 (998)
                      ++||++|+|+++|||||||++|.+.++++|+.+.|..+++.++ .++|||||||.+   ..||.-++||+| +.||.+++
T Consensus       144 dyL~l~aiid~kifCVHGGlSP~i~~lDqIr~lDR~~Eiph~g-~m~DllWSDPee---~~g~~~SPRGaG-ylFG~dvv  218 (303)
T KOG0372|consen  144 DYLSLAAIIDGKIFCVHGGLSPSIQTLDQIRVLDRKQEVPHDG-AMCDLLWSDPEE---GPGWGLSPRGAG-YLFGEDVV  218 (303)
T ss_pred             HhhhHhheecCcEEEEcCCCCcchhhHHHHHHhhccccCCCCC-cchheeccCccc---CCCcccCCCCcc-ccccHHHH
Confidence            9999999999999999999999999999999999999999877 899999999987   369999999999 78999999


Q ss_pred             HHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCeEEEEEEcCCceEEeEEeccCCCC
Q 001901          888 MEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNAGAILVLGRDLVVVPKLIHPLPPA  957 (998)
Q Consensus       888 ~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~~~~~~  957 (998)
                      ++||+.||+++|+|+||.|++||++.++++|+|||||||||++++|.||||.++++....|++|...+..
T Consensus       219 ~~F~~~N~~~~I~RaHQLv~eGyk~~F~~~v~TVWSAPNYCYrCGN~AsIl~lde~~~~~F~vFeaa~~~  288 (303)
T KOG0372|consen  219 ESFLEANGLSLICRAHQLVMEGYKWHFDEKVVTVWSAPNYCYRCGNVAAILELDEDLDKDFRVFEAAPQE  288 (303)
T ss_pred             HHHHHhCChHHHHHHHHHHHhhHHHhcCCceEEEecCCchhhhcCChHHheeeccccCcceEeeecchhh
Confidence            9999999999999999999999999999999999999999999999999999999999999999866543


No 2  
>KOG0374 consensus Serine/threonine specific protein phosphatase PP1, catalytic subunit [Signal transduction mechanisms; General function prediction only]
Probab=100.00  E-value=1.8e-72  Score=619.55  Aligned_cols=321  Identities=47%  Similarity=0.801  Sum_probs=287.4

Q ss_pred             HHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcC-CCCCC
Q 001901          648 PKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYG-SPSTA  726 (998)
Q Consensus       648 ~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g-~~~~~  726 (998)
                      ++++|..++..............|+.+||.+||.++.++|..+|+++++++||+|||||||||.||+++|+..| +|+..
T Consensus         9 ~~~~i~~~~~~~~~~~~~~~~~~l~~~ei~~l~~~~~~if~~~~~l~e~~aPV~i~GDiHGq~~DLlrlf~~~g~~pp~~   88 (331)
T KOG0374|consen    9 LDELIRKLLSVGNKKTEKKRQVPLSKSEIIKLCDKAREIFLSQPTLLELSAPVKIVGDIHGQFGDLLRLFDLLGSFPPDQ   88 (331)
T ss_pred             HHHHHHHHhhccccCCCcccceeccHHHHHHHHHHHHHHhcCCCceeecCCCEEEEccCcCCHHHHHHHHHhcCCCCCcc
Confidence            56677777765443333333455999999999999999999999999999999999999999999999999999 88766


Q ss_pred             CCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhh
Q 001901          727 GDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRL  806 (998)
Q Consensus       727 ~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~  806 (998)
                            +|||||||||||++|+|||.||+++|++||++||+||||||++.+|..|||++||.+||++   ..+|+.|+++
T Consensus        89 ------~ylFLGDYVDRG~~slE~i~LL~a~Ki~yp~~~~lLRGNHE~~~in~~yGFydE~~rr~~~---~~~w~~F~~~  159 (331)
T KOG0374|consen   89 ------NYVFLGDYVDRGKQSLETICLLFALKIKYPENVFLLRGNHECASINRIYGFYDECKRRYGE---IKLWKAFNDA  159 (331)
T ss_pred             ------cEEEecccccCCccceEEeehhhhhhhhCCceEEEeccccccccccceeeeHHHHHHhcch---HHHHHHHHHH
Confidence                  8999999999999999999999999999999999999999999999999999999999975   4799999999


Q ss_pred             hcccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHH
Q 001901          807 FNWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDR  886 (998)
Q Consensus       807 f~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~  886 (998)
                      |++||++|+|+++|+|+||||+|.+.++++|+.|.||.++++.+ +++|||||||..  .+.||.+|.||.+ +.||+++
T Consensus       160 f~~mp~~a~i~~kI~CmhGGlsp~l~~~~~i~~i~rp~~~~~~g-ll~DLlWsdp~~--~~~g~~~n~Rg~s-~~fg~~~  235 (331)
T KOG0374|consen  160 FNCLPLAALIDGKILCMHGGLSPHLKSLDQIRAIPRPTDSPDKG-LLCDLLWSDPDD--DVPGWEENDRGVS-FTFGPAV  235 (331)
T ss_pred             HhhCchhheecceEEEecCCCChhhcChHHHhhccCCcCCCccc-eeeeeeecCCCC--CCCCcccCCCcee-eEecHHH
Confidence            99999999999999999999999999999999999998887766 999999999986  4789999999999 8999999


Q ss_pred             HHHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCeEEEEEEcCCceEEeEEeccCCCCCCCCCCCCc
Q 001901          887 VMEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNAGAILVLGRDLVVVPKLIHPLPPAISSPETSPE  966 (998)
Q Consensus       887 ~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~  966 (998)
                      +++||+++++++||||||+|+||||+|++++++||||||+|||.++|+||+|.+++++.+.+++++|.....    +  +
T Consensus       236 v~~f~~~~~ldlivRaHqvv~dGyeffa~r~lvTIFSAP~Ycg~~~n~gavm~Vd~~l~~sf~~l~p~~~~~----~--~  309 (331)
T KOG0374|consen  236 VEDFCKKLDLDLIVRAHQVVEDGYEFFAGRKLVTIFSAPNYCGEFDNAGAVMRVDKNLKCSFVILRPEGGID----K--D  309 (331)
T ss_pred             HHHHHHHhCcceEEEcCccccccceEecCceEEEEecCchhccccCCceEEEEECCCCeEEEEEeccccccc----c--c
Confidence            999999999999999999999999999999999999999999999999999999999999999999954111    0  1


Q ss_pred             ccchhhHHHHhhcCCCCCCCC
Q 001901          967 RHIEDTWMQELNANRPPTPTR  987 (998)
Q Consensus       967 ~~~~~~~~~~~~~~~~~~~~~  987 (998)
                      ......|..+.+..++.++++
T Consensus       310 ~~~~~~~~~~~~~~~~~~~~~  330 (331)
T KOG0374|consen  310 KIEALGVGSDKKAILSTSKLS  330 (331)
T ss_pred             cccccccccccccccccccCC
Confidence            112234555566667666654


No 3  
>KOG0373 consensus Serine/threonine specific protein phosphatase involved in cell cycle control, PP2A-related [Cell cycle control, cell division, chromosome partitioning; Signal transduction mechanisms]
Probab=100.00  E-value=1.1e-71  Score=550.37  Aligned_cols=286  Identities=37%  Similarity=0.707  Sum_probs=270.3

Q ss_pred             HHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcCCCCCCC
Q 001901          648 PKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYGSPSTAG  727 (998)
Q Consensus       648 ~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g~~~~~~  727 (998)
                      .++.|+...+.          ..|+++|+..||+.++++|..|.++..++.|+.|+|||||||.||+.+|+..|-.+.. 
T Consensus         6 ~d~wi~~vk~c----------kyLpE~elk~LCe~v~d~L~eEsNvqPV~tPVTvCGDIHGQFyDL~eLFrtgG~vP~t-   74 (306)
T KOG0373|consen    6 LDQWIETVKKC----------KYLPENELKRLCEMVKDILMEESNVQPVSTPVTVCGDIHGQFYDLLELFRTGGQVPDT-   74 (306)
T ss_pred             HHHHHHHHHHc----------CCCCHHHHHHHHHHHHHHHhhhcCccccCCCeeEeeccchhHHHHHHHHHhcCCCCCc-
Confidence            45566665443          2689999999999999999999999999999999999999999999999999877655 


Q ss_pred             CccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhh
Q 001901          728 DIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLF  807 (998)
Q Consensus       728 ~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f  807 (998)
                           +|||+|||||||.+|+|++.+|++||.+||.+|.|||||||.+.+..+|||++||..|||..   .+|+.+.++|
T Consensus        75 -----nYiFmGDfVDRGyySLEtfT~l~~LkaryP~~ITLlRGNHEsRqitqVYGFydECq~KYGna---n~wkycckVF  146 (306)
T KOG0373|consen   75 -----NYIFMGDFVDRGYYSLETFTLLLLLKARYPAKITLLRGNHESRQITQVYGFYDECQNKYGNA---NVWKYCCKVF  146 (306)
T ss_pred             -----ceEEeccccccccccHHHHHHHHHHhhcCCceeEEeeccchhhhhhhhhhhHHHHHhhcCCc---hHHHHHHHHH
Confidence                 89999999999999999999999999999999999999999999999999999999999975   7999999999


Q ss_pred             cccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHH
Q 001901          808 NWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRV  887 (998)
Q Consensus       808 ~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~  887 (998)
                      +.|+++|+|+++|||||||++|.+.++++|+-|.|-.+++.++ .+|||+||||.+   ++.|.-++||+| +.||.+++
T Consensus       147 D~LtlaAiID~~vLCVHGGLSPdirtlDqir~i~R~qEiPh~G-~fcDlmWSDPed---ve~W~vSpRGAG-wlFGskVt  221 (306)
T KOG0373|consen  147 DFLTLAAIIDEKVLCVHGGLSPDIRTLDQIRLIERNQEIPHEG-PFCDLMWSDPED---VETWAVSPRGAG-WLFGSKVT  221 (306)
T ss_pred             hhhhHHHHhcCcEEEEcCCCCccceeHHHHHhHHhhccCCCCC-CccceeccChhh---hhhheeCCCCcc-eeechhhh
Confidence            9999999999999999999999999999999999999999887 899999999985   788999999999 57999999


Q ss_pred             HHHHHHcCCcEEEEcccccccceEEecCCe-EEEEeccccccCCCCCeEEEEEEcCCceEEeEEeccCCCC
Q 001901          888 MEFCNNNDLQLIVRAHECVMDGFERFAQGH-LITLFSATNYCGTANNAGAILVLGRDLVVVPKLIHPLPPA  957 (998)
Q Consensus       888 ~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~-~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~~~~~~  957 (998)
                      ++|+..|+|++|+|+||.|++||++.+++| |+|||||||||++++|.|+||.++++++-++|+|..+|..
T Consensus       222 ~eF~~iN~L~LicRaHQLV~EG~KymF~eK~lvTVWSAPNYCYRCGNvAsi~~~d~~~~r~~k~F~avpd~  292 (306)
T KOG0373|consen  222 TEFNHINNLNLICRAHQLVQEGFKYMFDEKGLVTVWSAPNYCYRCGNVASIMSFDDNLERETKIFSAVPDN  292 (306)
T ss_pred             HHHHhccchHHHHhHHHHHHhhHHhccCCCCEEEEecCCchhhhccCeeeEEEecccCCccceeeeecCCc
Confidence            999999999999999999999999988888 9999999999999999999999999999999999988765


No 4  
>PTZ00480 serine/threonine-protein phosphatase; Provisional
Probab=100.00  E-value=9.4e-69  Score=588.46  Aligned_cols=294  Identities=46%  Similarity=0.835  Sum_probs=275.4

Q ss_pred             HHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcCCCCCCC
Q 001901          648 PKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYGSPSTAG  727 (998)
Q Consensus       648 ~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g~~~~~~  727 (998)
                      ++++|+.+++.+.+++.  ....|++++|.+||++|+++|++||+++++..|++|||||||||.+|.++|+..++++.. 
T Consensus        11 ~~~~i~~~~~~~~~~~~--~~~~l~~~~i~~l~~~~~~il~~ep~ll~i~~~i~vvGDIHG~~~dL~~l~~~~g~~~~~-   87 (320)
T PTZ00480         11 VDNIIERLLSVRGSKPG--KNVNLTEAEVRGLCIKARDIFISQPILLELEAPLKICGDVHGQYFDLLRLFEYGGYPPES-   87 (320)
T ss_pred             HHHHHHHHHhccccCcc--ccCCCCHHHHHHHHHHHHHHHHhCCceEecCCCeEEEeecccCHHHHHHHHHhcCCCCcc-
Confidence            78899999987666542  234689999999999999999999999999999999999999999999999999998765 


Q ss_pred             CccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhh
Q 001901          728 DIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLF  807 (998)
Q Consensus       728 ~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f  807 (998)
                           +|||||||||||++++||+.+|++||+.||.+|++||||||.+.++..|||+.||..+|+    ..+|..++++|
T Consensus        88 -----~ylfLGDyVDRG~~s~evl~ll~~lki~~p~~v~llRGNHE~~~~~~~ygF~~e~~~~y~----~~l~~~~~~~F  158 (320)
T PTZ00480         88 -----NYLFLGDYVDRGKQSLETICLLLAYKIKYPENFFLLRGNHECASINRIYGFYDECKRRYT----IKLWKTFTDCF  158 (320)
T ss_pred             -----eEEEeceecCCCCCcHHHHHHHHHhcccCCCceEEEecccchhhhhhhcchHHHHHhhcC----HHHHHHHHHHH
Confidence                 899999999999999999999999999999999999999999999999999999999995    36999999999


Q ss_pred             cccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHH
Q 001901          808 NWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRV  887 (998)
Q Consensus       808 ~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~  887 (998)
                      ++||+||+|+++||||||||+|.+.++++|+.+.||.+.+..+ +++|+|||||.+  ...+|.+|+||.| +.||++++
T Consensus       159 ~~LPlaAiI~~~i~cvHGGI~p~~~~l~~i~~i~rp~~~~~~~-~~~dllWSDP~~--~~~~~~~s~RG~g-~~FG~~~~  234 (320)
T PTZ00480        159 NCLPVAALIDEKILCMHGGLSPELSNLEQIRRIMRPTDVPDTG-LLCDLLWSDPDK--DVQGWADNERGVS-YVFSQEIV  234 (320)
T ss_pred             HhccHhheecCcEEEEcCCcCcccCCHHHHhcccCCCCCCccc-hhhheeecCccc--ccCCCccCCCCCc-cccCHHHH
Confidence            9999999999999999999999999999999999999887654 899999999986  3578999999999 68999999


Q ss_pred             HHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCeEEEEEEcCCceEEeEEeccCCCC
Q 001901          888 MEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNAGAILVLGRDLVVVPKLIHPLPPA  957 (998)
Q Consensus       888 ~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~~~~~~  957 (998)
                      ++||++||+++||||||++++||+++++++||||||||||||..+|+||+|.|++++.+.++.|.|.+..
T Consensus       235 ~~Fl~~n~l~~IiR~Hq~v~~G~~~~~~~~~iTvFSa~~Y~~~~~N~ga~l~i~~~~~~~~~~~~p~~~~  304 (320)
T PTZ00480        235 QVFLKKHELDLICRAHQVVEDGYEFFSKRQLVTLFSAPNYCGEFDNAGSMMTIDESLMCSFQILKPAEQG  304 (320)
T ss_pred             HHHHHhCCCcEEEEcCccccCceEEeCCCcEEEEeCCcccCCCCCccEEEEEECCCCcEeEEEecCCccc
Confidence            9999999999999999999999999999999999999999999999999999999999999999877654


No 5  
>cd07420 MPP_RdgC Drosophila melanogaster RdgC and related proteins, metallophosphatase domain. RdgC (retinal degeneration C) is a vertebrate serine-threonine protein phosphatase that is required to prevent light-induced retinal degeneration.  In addition to its catalytic domain, RdgC has two C-terminal EF hands.  Homologs of RdgC include the human phosphatases protein phosphatase with EF hands 1 and -2 (PPEF-1 and -2).  PPEF-1 transcripts are present at low levels in the retina, PPEF-2 transcripts and PPEF-2 protein are present at high levels in photoreceptors.  The PPP (phosphoprotein phosphatase) family, to which RdgC belongs, is one of two known protein phosphatase families specific for serine and threonine.  The PPP family also includes: PP1, PP2A, PP2B (calcineurin), PP4, PP5, PP6, PP7, Bsu1, PrpE, PrpA/PrpB, and ApA4 hydrolase. The PPP catalytic domain is defined by three conserved motifs (-GDXHG-, -GDXVDRG- and -GNHE-).  The PPP enzyme family is ancient with members found in all
Probab=100.00  E-value=3.8e-68  Score=584.82  Aligned_cols=286  Identities=33%  Similarity=0.604  Sum_probs=256.6

Q ss_pred             hhHHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecC----CeEEEecCCCCHHHHHHHHHHcC
Q 001901          646 SVPKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKA----PIKIFGDLHGQFGDLMRLFDEYG  721 (998)
Q Consensus       646 ~~~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~----~i~vvGDiHG~~~dL~~il~~~g  721 (998)
                      +.++++|+.|++..          .|+++++.+||++|+++|++||+|+++..    |++|||||||||.+|+++|+..|
T Consensus         5 ~~~~~~i~~~~~~~----------~l~~~~i~~L~~~a~~il~~ep~vl~i~~~~~~~~~vvGDiHG~~~dL~~il~~~g   74 (321)
T cd07420           5 DHIDALIEAFKEKQ----------LLHAKYVLLILREARKVLKQLPNISRVSTSISKQVTICGDLHGKLDDLFLIFYKNG   74 (321)
T ss_pred             HHHHHHHHHHHccC----------CCCHHHHHHHHHHHHHHHHhCCCEEEecCCCCCCeEEEEeCCCCHHHHHHHHHHcC
Confidence            34788999998742          47899999999999999999999999986    89999999999999999999999


Q ss_pred             CCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhh
Q 001901          722 SPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWH  801 (998)
Q Consensus       722 ~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~  801 (998)
                      +++...     +|||||||||||++|+||+.+|++||++||++|++||||||.+.++..|||++||..+|+.. ...+|.
T Consensus        75 ~~~~~~-----~~lFLGDyVDRG~~s~Evl~ll~~lk~~~p~~v~llRGNHE~~~~~~~yGf~~e~~~~y~~~-~~~l~~  148 (321)
T cd07420          75 LPSPEN-----PYVFNGDFVDRGKRSIEILIILFAFFLVYPNEVHLNRGNHEDHIMNLRYGFTKEVMSKYKLH-GKKILR  148 (321)
T ss_pred             CCCccc-----eEEEeccccCCCCCcHHHHHHHHHHhhcCCCcEEEecCchhhhhhhhhcChHHHHHHHhCcc-HHHHHH
Confidence            886432     79999999999999999999999999999999999999999999999999999999999863 467999


Q ss_pred             hhhhhhcccceeEEEcCeEEEecCCccCcccCHHhhhhccCCccc-----CC---------------------CCcceec
Q 001901          802 RINRLFNWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITM-----EA---------------------GSIVLMD  855 (998)
Q Consensus       802 ~~~~~f~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~-----~~---------------------~~~~~~d  855 (998)
                      .++++|++||+||+|+++||||||||++ ..++++|+.|+|+...     +.                     +..++.|
T Consensus       149 ~~~~~F~~LPlaaii~~~i~cvHGGi~~-~~~l~~i~~i~r~~~~~~~~~p~~~~~~~~~~~~~~~~~~~~~~~~~~~~d  227 (321)
T cd07420         149 LLEDVFSWLPLATIIDNKILVVHGGISD-STDLDLLDKIDRHKYVSVLRPPLRKGMEELTGEEEDPSEPLDKTEWRQILD  227 (321)
T ss_pred             HHHHHHHhCCceEEEcCCEEEEeCCCCC-ccCHHHHHhhhccccccccCCCccccccccccccccccccccccccchhhe
Confidence            9999999999999999999999999997 5789999999885211     11                     0136789


Q ss_pred             cccCCCCCCCCCCCcccCCCCCCceeeCHHHHHHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCeE
Q 001901          856 LLWSDPTENDSVEGLRPNARGPGLVTFGPDRVMEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNAG  935 (998)
Q Consensus       856 lLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~g  935 (998)
                      +|||||.+.  ...|.++.||.| +.||++++++||++||+++||||||++++||+++++++|||||||+||||..+|+|
T Consensus       228 lLWSDP~~~--~~~~~~~~RG~g-~~FG~~~~~~Fl~~n~l~~IIR~He~v~~G~~~~~~~~~iTvFSa~nY~~~~~N~g  304 (321)
T cd07420         228 ILWSDPKAQ--KGCKPNTFRGGG-CYFGPDVTSKVLQKHGLSLLIRSHECKPEGYEFCHNNKVITIFSASNYYEEGSNRG  304 (321)
T ss_pred             eeecCCccC--CCCCccCCCCCc-cccCHHHHHHHHHHCCCcEEEEcChhhhcceEEecCCeEEEEecCCccCCCCCccE
Confidence            999999853  233666789999 68999999999999999999999999999999999999999999999999999999


Q ss_pred             EEEEEcCCceEEeEEe
Q 001901          936 AILVLGRDLVVVPKLI  951 (998)
Q Consensus       936 a~l~~~~~~~~~~~~~  951 (998)
                      |+|++++++.+.+..|
T Consensus       305 avl~i~~~~~~~f~~~  320 (321)
T cd07420         305 AYIKLGPDLTPHFVQY  320 (321)
T ss_pred             EEEEECCCCceeEEEe
Confidence            9999999988877655


No 6  
>cd07419 MPP_Bsu1_C Arabidopsis thaliana Bsu1 phosphatase and related proteins, C-terminal metallophosphatase domain. Bsu1 encodes a nuclear serine-threonine protein phosphatase found in plants and protozoans.  Bsu1 has a C-terminal phosphatase domain and an N-terminal Kelch-repeat domain.  Bsu1 is preferentially expressed in elongating plant cells. It modulates the phosphorylation state of Bes1, a transcriptional regulator phosphorylated by the glycogen synthase kinase Bin2, as part of a steroid hormone signal transduction pathway.  The PPP (phosphoprotein phosphatase) family, to which Bsu1 belongs, is one of two known protein phosphatase families specific for serine and threonine.  The PPP family also includes: PP1, PP2A, PP2B (calcineurin), PP4, PP5, PP6, PP7, Bsu1, RdgC, PrpE, PrpA/PrpB, and ApA4 hydrolase. The PPP catalytic domain is defined by three conserved motifs (-GDXHG-, -GDXVDRG- and -GNHE-).  The PPP enzyme family is ancient with members found in all eukaryotes, and in most
Probab=100.00  E-value=1.5e-67  Score=584.54  Aligned_cols=303  Identities=79%  Similarity=1.341  Sum_probs=279.2

Q ss_pred             HHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcCCCCCC--CC
Q 001901          651 VIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYGSPSTA--GD  728 (998)
Q Consensus       651 ~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g~~~~~--~~  728 (998)
                      +|++||+|+.|+++...++.|+++++.+||++|+++|++||+++++..|++|||||||||.+|.++|+.+|+++..  ++
T Consensus         1 ~~~~~~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~il~~e~~~~~i~~~~~viGDIHG~~~~L~~ll~~~g~~~~~~~~~   80 (311)
T cd07419           1 IITHLLKPRIWKPPTDRRFFFNWNEILELCDAAEDIFKQEPMVLRLRAPIKIFGDIHGQFGDLMRLFDEYGSPVTEAAGD   80 (311)
T ss_pred             ChHHhcCcccccCccccccCCCHHHHHHHHHHHHHHHHhCCCeEeeCCCEEEEEeccCCHHHHHHHHHHcCCCcccccCC
Confidence            4788999999999888888999999999999999999999999999999999999999999999999999988641  22


Q ss_pred             ccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCC--cchhhhhhhhhh
Q 001901          729 IAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGER--DGIWAWHRINRL  806 (998)
Q Consensus       729 ~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~--~~~~~~~~~~~~  806 (998)
                      ....+|||||||||||++|+|||.+|++||+.+|.+|++||||||.+.++..|||..||..+|+..  ....+|..++++
T Consensus        81 ~~~~~~vfLGDyVDRGp~s~evl~ll~~lk~~~p~~v~lLRGNHE~~~l~~~~gf~~e~~~~~~~~~~~~~~l~~~~~~~  160 (311)
T cd07419          81 IEYIDYLFLGDYVDRGSNSLETICLLLALKVKYPNQIHLIRGNHEDRDINALFGFREECKERLGEDPNDGDSVWRRINRL  160 (311)
T ss_pred             CcCceEEEECCccCCCCChHHHHHHHHHhhhcCCCcEEEeccccchHHHHHHhcccHHHHHhcCccchhhHHHHHHHHHH
Confidence            222379999999999999999999999999999999999999999999999999999999999862  235699999999


Q ss_pred             hcccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCC---CCCCc-eee
Q 001901          807 FNWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNA---RGPGL-VTF  882 (998)
Q Consensus       807 f~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~---rg~~~-~~f  882 (998)
                      |++||+++++++++|||||||+|.+.++++|+.+.||...+....+++|+|||||.+.+...+|.++.   ||.|. +.|
T Consensus       161 f~~LPl~avi~~~~l~vHgGi~p~~~~l~~i~~i~r~~~~~~~~~~~~dllWsDP~~~~~~~~~~~~~~~~rg~g~~~~f  240 (311)
T cd07419         161 FEWLPLAAIIEDKILCMHGGIGRSINHVSEIEDLKRPLTMEFGEQVVMDLLWSDPTENDSVLGLRPNAIDPRGPGLIVKF  240 (311)
T ss_pred             HHhCchhheecccEEEEccCCCCCCCcHHHHhhcCCCCCCCCCCcceeeeeccCccccccccccccCCCCCCCCCcceeE
Confidence            99999999999999999999999999999999999998544444589999999999765567888886   99995 799


Q ss_pred             CHHHHHHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCeEEEEEEcCCceEEeEEecc
Q 001901          883 GPDRVMEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNAGAILVLGRDLVVVPKLIHP  953 (998)
Q Consensus       883 g~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~~  953 (998)
                      |++++++||++||+++||||||++++||+++++++|||||||||||+..+|+||+|++++++.+.|++|+|
T Consensus       241 g~~~~~~Fl~~n~l~~iiRgHe~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~~ai~~i~~~~~~~~~~~~~  311 (311)
T cd07419         241 GPDRVHRFLEENDLQMIIRAHECVMDGFERFAQGKLITLFSATNYCGTAGNAGAILVLGRDLTIIPKLIHP  311 (311)
T ss_pred             CHHHHHHHHHHCCCeEEEEechhhhCCeEEeCCCeEEEEecCCcccCCCCceEEEEEECCCCcEeEEEeCC
Confidence            99999999999999999999999999999999999999999999999999999999999999999999987


No 7  
>cd07415 MPP_PP2A_PP4_PP6 PP2A, PP4, and PP6 phosphoprotein phosphatases, metallophosphatase domain. PP2A-like family of phosphoprotein phosphatases (PPP's) including PP4 and PP6.  PP2A (Protein phosphatase 2A) is a critical regulator of many cellular activities.  PP2A comprises about 1% of total cellular proteins.  PP2A, together with protein phosphatase 1 (PP1), accounts for more than 90% of all serine/threonine phosphatase activities in most cells and tissues. The PP2A subunit  in addition to having a catalytic domain homologous to PP1, has a unique C-terminal tail, containing a motif that is conserved in the catalytic subunits of all PP2A-like phosphatases including PP4 and PP6, and has an important role in PP2A regulation.  The PP2A-like family of phosphatases all share a similar heterotrimeric architecture, that includes: a 65kDa scaffolding subunit (A), a 36kDa catalytic subunit (C), and one of 18 regulatory subunits (B).  The PPP (phosphoprotein phosphatase) family, to which PP2
Probab=100.00  E-value=5.6e-67  Score=571.14  Aligned_cols=284  Identities=43%  Similarity=0.778  Sum_probs=267.3

Q ss_pred             HHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcCCCCCCC
Q 001901          648 PKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYGSPSTAG  727 (998)
Q Consensus       648 ~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g~~~~~~  727 (998)
                      ++++|+++++..          .|+.+++.+||++|+++|++||+++++..|++|||||||||.+|+++|+..++++.. 
T Consensus         2 ~~~~~~~~~~~~----------~l~~~~~~~l~~~~~~il~~e~~~~~i~~~i~vvGDIHG~~~dL~~ll~~~~~~~~~-   70 (285)
T cd07415           2 LDKWIEQLKKCE----------LLPESEVKSLCEKAKEILVKESNVQRVRSPVTVCGDIHGQFYDLLELFRVGGDPPDT-   70 (285)
T ss_pred             HHHHHHHHHccC----------CCCHHHHHHHHHHHHHHHHhCCCEEecCCCEEEEEeCCCCHHHHHHHHHHcCCCCCC-
Confidence            467888887642          478999999999999999999999999999999999999999999999999987765 


Q ss_pred             CccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhh
Q 001901          728 DIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLF  807 (998)
Q Consensus       728 ~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f  807 (998)
                           +|||||||||||++|+||+.+|++||+.+|.+|++||||||.+.++..|||.+||..+|+.   ..+|+.++++|
T Consensus        71 -----~~lfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~ygf~~e~~~~y~~---~~l~~~~~~~f  142 (285)
T cd07415          71 -----NYLFLGDYVDRGYYSVETFLLLLALKVRYPDRITLLRGNHESRQITQVYGFYDECLRKYGN---ANVWKYCTDLF  142 (285)
T ss_pred             -----eEEEEeEECCCCcCHHHHHHHHHHHhhcCCCcEEEEecccchHhhhhhcchhHHHHHhcCc---hHHHHHHHHHH
Confidence                 8999999999999999999999999999999999999999999999999999999999975   36999999999


Q ss_pred             cccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHH
Q 001901          808 NWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRV  887 (998)
Q Consensus       808 ~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~  887 (998)
                      ++||++|++++++|||||||+|.+.++++|+.++||.+++..+ ++.|+|||||.+.   .+|.+|.||.| +.||++++
T Consensus       143 ~~lPlaaii~~~i~cvHgGi~p~~~~~~~i~~i~r~~~~~~~~-~~~dllWsDP~~~---~~~~~~~Rg~g-~~fg~~~~  217 (285)
T cd07415         143 DYLPLAALIDNQIFCVHGGLSPSIDTLDQIRAIDRFQEVPHEG-PMCDLLWSDPDDI---EGWGISPRGAG-YLFGQDVV  217 (285)
T ss_pred             HHhHHHhEeCCeEEEEcCCCCCCcccHHHhhcccCCCCCCCCC-CccceEecCCCcc---CCCCcCCCCCc-cccCHHHH
Confidence            9999999999999999999999999999999999999887655 8899999999863   68999999999 68999999


Q ss_pred             HHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCeEEEEEEcCCceEEeEEeccCC
Q 001901          888 MEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNAGAILVLGRDLVVVPKLIHPLP  955 (998)
Q Consensus       888 ~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~~~~  955 (998)
                      ++||++||+++||||||++++||+++++++|||||||||||+..+|+||+|.+++++++.++.|.|.+
T Consensus       218 ~~Fl~~n~l~~iiR~He~~~~G~~~~~~~~~~TvfSa~~y~~~~~n~~a~l~i~~~~~~~~~~~~~~~  285 (285)
T cd07415         218 EEFNHNNGLTLICRAHQLVMEGYQWMFDDKLVTVWSAPNYCYRCGNVASIMELDEHLKRSFKVFEAAP  285 (285)
T ss_pred             HHHHHHCCCeEEEEcCccccceEEEecCCcEEEEecCCcccCCCCceEEEEEECCCCcEeEEEeccCC
Confidence            99999999999999999999999999999999999999999999999999999999999999988753


No 8  
>PTZ00244 serine/threonine-protein phosphatase PP1; Provisional
Probab=100.00  E-value=3.5e-67  Score=573.72  Aligned_cols=291  Identities=38%  Similarity=0.750  Sum_probs=270.2

Q ss_pred             hhHHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcCCCCC
Q 001901          646 SVPKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYGSPST  725 (998)
Q Consensus       646 ~~~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g~~~~  725 (998)
                      ++++++|..+++...+..  .....++.++|.+||++|+++|++||+++++..|++|||||||||.+|+++|+..++++.
T Consensus         2 ~~~~~~i~~~~~~~~~~~--~~~~~i~~~~i~~l~~~~~~il~~e~~ll~i~~p~~ViGDIHG~~~~L~~l~~~~~~~~~   79 (294)
T PTZ00244          2 SLVQTLIEKMLTVKGNRT--QRQILIREEDIRAVLTEVREIFMSQPMLLEIRPPVRVCGDTHGQYYDLLRIFEKCGFPPY   79 (294)
T ss_pred             chHHHHHHHHHhcccCCC--ccccCCCHHHHHHHHHHHHHHHHhCCCeEeccCCceeeccCCCCHHHHHHHHHHcCCCCc
Confidence            356888888888654432  234478999999999999999999999999999999999999999999999999999876


Q ss_pred             CCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhh
Q 001901          726 AGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINR  805 (998)
Q Consensus       726 ~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~  805 (998)
                      +      +|||||||||||++|+||+.+|+++|+.+|.++++||||||.+.++..|||.+||..+|+    ..+|..+++
T Consensus        80 ~------~~lfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~y~----~~l~~~~~~  149 (294)
T PTZ00244         80 S------NYLFLGDYVDRGKHSVETITLQFCYKIVYPENFFLLRGNHECASINKMYGFFDDVKRRYN----IKLFKAFTD  149 (294)
T ss_pred             c------cEEEeeeEecCCCCHHHHHHHHHHHhhccCCeEEEEecccchHhHhhccChHHHHHHHhh----HHHHHHHHH
Confidence            5      899999999999999999999999999999999999999999999999999999999996    359999999


Q ss_pred             hhcccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHH
Q 001901          806 LFNWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPD  885 (998)
Q Consensus       806 ~f~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~  885 (998)
                      +|++||++|++++++|||||||+|.+.++++|+.++||.+.+..+ +++|+|||||.+  ...+|.+|+||.| +.||++
T Consensus       150 ~f~~lPlaaii~~~il~vHgGi~p~~~~l~~i~~i~rp~~~~~~~-~~~dllWsDP~~--~~~~~~~~~Rg~g-~~fg~~  225 (294)
T PTZ00244        150 VFNTMPVCCVISEKIICMHGGLSPDLTSLASVNEIERPCDVPDRG-ILCDLLWADPED--EVRGFLESDRGVS-YLFGED  225 (294)
T ss_pred             HHHhCchheEecCeeEEEcCCCCchhhHHHHhhhhccccCCCccc-hhheeeecCccc--ccCCCCcCCCCCc-cccCHH
Confidence            999999999999999999999999999999999999999887654 899999999985  3578999999999 689999


Q ss_pred             HHHHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCeEEEEEEcCCceEEeEEec
Q 001901          886 RVMEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNAGAILVLGRDLVVVPKLIH  952 (998)
Q Consensus       886 ~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~  952 (998)
                      ++++||++||+++||||||++++||+++++++||||||||||||..+|+||+|.|++++.+.++.|.
T Consensus       226 ~~~~Fl~~n~l~~iiR~Hq~~~~G~~~~~~~~~iTvfSa~~Y~~~~~N~~a~l~i~~~~~~~f~~~~  292 (294)
T PTZ00244        226 IVNDFLDMVDMDLIVRAHQVMERGYGFFASRQLVTVFSAPNYCGEFDNDAAVMNIDDKLQCSFLIIP  292 (294)
T ss_pred             HHHHHHHHcCCcEEEEcCccccCceEEcCCCeEEEEeCCccccCCCCceEEEEEECCCCcEeEEEee
Confidence            9999999999999999999999999999999999999999999999999999999999999988764


No 9  
>cd07414 MPP_PP1_PPKL PP1, PPKL (PP1 and kelch-like) enzymes,  and related proteins, metallophosphatase domain. PP1 (protein phosphatase type 1) is a serine/threonine phosphatase that regulates many cellular processes including: cell-cycle progression, protein synthesis, muscle contraction, carbohydrate metabolism, transcription and neuronal signaling, through its interaction with at least 180 known targeting proteins.  PP1 occurs in all tissues and regulates many pathways, ranging from cell-cycle progression to carbohydrate metabolism.  Also included here are the PPKL (PP1 and kelch-like) enzymes including the PPQ, PPZ1, and PPZ2 fungal phosphatases.  These PPKLs have a large N-terminal kelch repeat in addition to a C-terminal phosphoesterase domain.  The PPP (phosphoprotein phosphatase) family, to which PP1 belongs, is one of two known protein phosphatase families specific for serine and threonine.  The PPP family also includes: PP2A, PP2B (calcineurin), PP4, PP5, PP6,  PP7, Bsu1, Rdg
Probab=100.00  E-value=4.6e-67  Score=574.00  Aligned_cols=291  Identities=48%  Similarity=0.865  Sum_probs=270.9

Q ss_pred             HHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcCCCCCCC
Q 001901          648 PKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYGSPSTAG  727 (998)
Q Consensus       648 ~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g~~~~~~  727 (998)
                      ++++|+.+++.+.++.  .....|+++++.+||++|+++|++||+++++..|++||||||||+.+|+++|+..|+++.+ 
T Consensus         2 ~~~~i~~~~~~~~~~~--~~~~~~~~~~i~~l~~~~~~il~~ep~~l~i~~~i~viGDIHG~~~~L~~l~~~~~~~~~~-   78 (293)
T cd07414           2 IDSIIERLLEVRGSRP--GKNVQLTEAEIRGLCLKSREIFLSQPILLELEAPLKICGDIHGQYYDLLRLFEYGGFPPES-   78 (293)
T ss_pred             HHHHHHHHHhccccCC--cccCCCCHHHHHHHHHHHHHHHHhCCCeEecCCceEEEEecCCCHHHHHHHHHhcCCCCcc-
Confidence            4678888887665543  2344689999999999999999999999999999999999999999999999999998765 


Q ss_pred             CccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhh
Q 001901          728 DIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLF  807 (998)
Q Consensus       728 ~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f  807 (998)
                           +|||||||||||++++||+.+|++||+.||.++++||||||.+.++..|||.+||..+|+    ..+|..++++|
T Consensus        79 -----~~lfLGDyVDRG~~s~e~i~ll~~lk~~~p~~i~llrGNHE~~~~~~~~gf~~e~~~~y~----~~l~~~~~~~f  149 (293)
T cd07414          79 -----NYLFLGDYVDRGKQSLETICLLLAYKIKYPENFFLLRGNHECASINRIYGFYDECKRRYN----IKLWKTFTDCF  149 (293)
T ss_pred             -----eEEEEeeEecCCCCcHHHHHHHHHhhhhCCCcEEEEecccchhhHhhhcchhhHHHHhhh----HHHHHHHHHHH
Confidence                 899999999999999999999999999999999999999999999999999999999986    45999999999


Q ss_pred             cccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHH
Q 001901          808 NWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRV  887 (998)
Q Consensus       808 ~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~  887 (998)
                      ++||++|++++++|||||||+|.+.++++|+.++||.+.+..+ +++|+|||||..  ...+|.+|+||.| +.||++++
T Consensus       150 ~~lPlaa~i~~~i~cvHgGi~p~~~~l~~i~~i~r~~~~~~~~-~~~dllWsDP~~--~~~~~~~~~Rg~g-~~fg~~~~  225 (293)
T cd07414         150 NCLPVAAIIDEKIFCMHGGLSPDLQSMEQIRRIMRPTDVPDQG-LLCDLLWSDPDK--DVQGWGENDRGVS-FTFGKDVV  225 (293)
T ss_pred             HHhHHHHhhCCcEEEEccCCCcccCcHHHHhcccCCCCCCchh-hHhhhhccCccc--ccCCCccCCCCcc-eecCHHHH
Confidence            9999999999999999999999999999999999999877654 899999999986  3578999999999 68999999


Q ss_pred             HHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCeEEEEEEcCCceEEeEEeccC
Q 001901          888 MEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNAGAILVLGRDLVVVPKLIHPL  954 (998)
Q Consensus       888 ~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~~~  954 (998)
                      ++||++||+++||||||++++||+++++++||||||||||||..+|+||+|.|++++.+.++.|.|.
T Consensus       226 ~~Fl~~n~l~~iiR~He~~~~G~~~~~~~~~iTvfSa~~Y~~~~~N~~a~l~i~~~~~~~~~~~~~~  292 (293)
T cd07414         226 AKFLNKHDLDLICRAHQVVEDGYEFFAKRQLVTLFSAPNYCGEFDNAGAMMSVDETLMCSFQILKPA  292 (293)
T ss_pred             HHHHHHcCCeEEEECCccccCeEEEeCCCcEEEEecCCcccCCCCceEEEEEECCCCcEEEEEecCC
Confidence            9999999999999999999999999999999999999999999999999999999999999988753


No 10 
>PTZ00239 serine/threonine protein phosphatase 2A; Provisional
Probab=100.00  E-value=1.1e-66  Score=571.47  Aligned_cols=286  Identities=41%  Similarity=0.749  Sum_probs=266.7

Q ss_pred             HHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcCCCCCCC
Q 001901          648 PKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYGSPSTAG  727 (998)
Q Consensus       648 ~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g~~~~~~  727 (998)
                      ++++|+.+++..          .|+++++.+||++|+++|++||+++++..|++|||||||||.+|.++|+..+.++.. 
T Consensus         3 ~~~~~~~~~~~~----------~l~~~~i~~l~~~~~~il~~e~~~~~i~~~i~vvGDIHG~~~~L~~l~~~~~~~~~~-   71 (303)
T PTZ00239          3 IDRHIATLLNGG----------CLPERDLKLICERAKEIFLEESNVQPVRAPVNVCGDIHGQFYDLQALFKEGGDIPNA-   71 (303)
T ss_pred             HHHHHHHHHccC----------CCCHHHHHHHHHHHHHHHHhCCCeEecCCCEEEEEeCCCCHHHHHHHHHhcCCCCCc-
Confidence            577888887642          478999999999999999999999999999999999999999999999999987655 


Q ss_pred             CccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhh
Q 001901          728 DIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLF  807 (998)
Q Consensus       728 ~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f  807 (998)
                           +|||||||||||++++||+.+|++||+.||.+|++||||||.+.++..|||.+||.++|+..   .+|+.++++|
T Consensus        72 -----~~lfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~ky~~~---~~~~~~~~~f  143 (303)
T PTZ00239         72 -----NYIFIGDFVDRGYNSVETMEYLLCLKVKYPGNITLLRGNHESRQCTQVYGFYEEILRKYGNS---NPWRLFMDVF  143 (303)
T ss_pred             -----eEEEeeeEcCCCCCHHHHHHHHHHhhhcCCCcEEEEecccchHHHhhhcChHHHHHHHhcCh---hHHHHHHHHH
Confidence                 89999999999999999999999999999999999999999999999999999999999853   5899999999


Q ss_pred             cccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHH
Q 001901          808 NWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRV  887 (998)
Q Consensus       808 ~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~  887 (998)
                      ++||++|+|++++|||||||+|.+.++++|+.+.||.+++..+ +++|+|||||.+   ..+|.+|.||.| +.||++++
T Consensus       144 ~~LPlaaii~~~i~cvHgGi~p~~~~l~~i~~i~r~~~~~~~~-~~~dllWsDP~~---~~~~~~~~Rg~g-~~fg~~~~  218 (303)
T PTZ00239        144 DCLPLAALIEGQILCVHGGLSPDMRTIDQIRTIDRKIEIPHEG-PFCDLMWSDPEE---VEYWAVNSRGAG-YLFGAKVT  218 (303)
T ss_pred             HhCchheEEcCeEEEEcCccCcccccHhhhccccCCCCCCCCC-CceeeEecCccc---cCCCccCCCCCc-cccCHHHH
Confidence            9999999999999999999999999999999999999887655 789999999985   468999999999 68999999


Q ss_pred             HHHHHHcCCcEEEEcccccccceEEecC-CeEEEEeccccccCCCCCeEEEEEEcCCceEEeEEeccCCCC
Q 001901          888 MEFCNNNDLQLIVRAHECVMDGFERFAQ-GHLITLFSATNYCGTANNAGAILVLGRDLVVVPKLIHPLPPA  957 (998)
Q Consensus       888 ~~fl~~~~l~~iiR~H~~~~~G~~~~~~-~~~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~~~~~~  957 (998)
                      ++||++||+++||||||++++||+++++ ++|||||||||||+..+|+||+|.+++++.+.++.|.|.+..
T Consensus       219 ~~Fl~~n~l~~iiR~He~~~~G~~~~~~~~~~iTvfSa~~Y~~~~~N~~ail~i~~~~~~~~~~~~~~~~~  289 (303)
T PTZ00239        219 KEFCRLNDLTLICRAHQLVMEGYKYWFPDQNLVTVWSAPNYCYRCGNIASILCLDENLQQTWKTFKEVPES  289 (303)
T ss_pred             HHHHHHCCCcEEEEcChhhccceEEEeCCCeEEEEECCCcccCCCCceEEEEEECCCCcEeeEEeeCCCcc
Confidence            9999999999999999999999998765 559999999999999999999999999999999999987654


No 11 
>cd07417 MPP_PP5_C PP5, C-terminal metallophosphatase domain. Serine/threonine protein phosphatase-5 (PP5) is a member of the PPP gene family of protein phosphatases that is highly conserved among eukaryotes and widely expressed in mammalian tissues. PP5 has a C-terminal phosphatase domain and an extended N-terminal TPR (tetratricopeptide repeat) domain containing three TPR motifs.  The PPP (phosphoprotein phosphatase) family, to which PP5 belongs, is one of two known protein phosphatase families specific for serine and threonine.  The PPP family also includes: PP1, PP2A, PP2B (calcineurin), PP4, PP6, PP7, Bsu1, RdgC, PrpE, PrpA/PrpB, and ApA4 hydrolase. The PPP catalytic domain is defined by three conserved motifs (-GDXHG-, -GDXVDRG- and -GNHE-).  The PPP enzyme family is ancient with members found in all eukaryotes, and in most bacterial and archeal genomes.  Dephosphorylation of phosphoserines and phosphothreonines on target proteins plays a central role in the regulation of many cel
Probab=100.00  E-value=1.3e-65  Score=566.79  Aligned_cols=294  Identities=35%  Similarity=0.640  Sum_probs=269.9

Q ss_pred             CChhHHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecCC----eEEEecCCCCHHHHHHHHHH
Q 001901          644 INSVPKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKAP----IKIFGDLHGQFGDLMRLFDE  719 (998)
Q Consensus       644 ~~~~~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~----i~vvGDiHG~~~dL~~il~~  719 (998)
                      +.++++++|+.+++.+          .|+.+++.+||++|+++|++||+++++..|    ++|||||||||.+|+++|+.
T Consensus        12 ~~~~~~~~~~~~~~~~----------~l~~~~~~~l~~~~~~il~~ep~l~~i~~p~~~~~~VvGDIHG~~~dL~~ll~~   81 (316)
T cd07417          12 TLEFVKEMIEWFKDQK----------KLHKKYAYQILLQVKELLKKLPSLVEITIPEGEKITVCGDTHGQFYDLLNIFEL   81 (316)
T ss_pred             CHHHHHHHHHHHHccC----------CCCHHHHHHHHHHHHHHHHhCCcceeccCCCCceeEEeecccCCHHHHHHHHHh
Confidence            4567899999988742          478999999999999999999999999866    99999999999999999999


Q ss_pred             cCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhh
Q 001901          720 YGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWA  799 (998)
Q Consensus       720 ~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~  799 (998)
                      .|+++...     +|||||||||||++|+|||.+|++||+.+|++|++||||||.+.++..|||..||..+|+.    .+
T Consensus        82 ~g~~~~~~-----~ylFLGDyVDRG~~S~Evl~ll~~lki~~p~~v~lLRGNHE~~~~~~~~gf~~e~~~k~~~----~l  152 (316)
T cd07417          82 NGLPSETN-----PYLFNGDFVDRGSFSVEVILTLFAFKLLYPNHFHLNRGNHETDNMNKMYGFEGEVKAKYNE----QM  152 (316)
T ss_pred             cCCCCccC-----eEEEEeeEecCCCChHHHHHHHHHhhhccCCceEEEeeccchHHHHHHhhhcchhhhcccH----HH
Confidence            99876542     7999999999999999999999999999999999999999999999999999999999864    59


Q ss_pred             hhhhhhhhcccceeEEEcCeEEEecCCc-cCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCCC
Q 001901          800 WHRINRLFNWLPLAALIEKKIICMHGGI-GRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGPG  878 (998)
Q Consensus       800 ~~~~~~~f~~LP~aa~i~~~il~vHgGi-~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~  878 (998)
                      |..++++|++||+++++++++||||||| ++.+.++++|++++||.+.+..+ +++|+|||||.+.   .+|.+|.||.|
T Consensus       153 ~~~~~~~f~~LPlaaii~~~~~~vHgGi~~~~~~~l~~i~~i~r~~~~~~~~-~~~dllWsDP~~~---~~~~~s~Rg~g  228 (316)
T cd07417         153 FDLFSEVFNWLPLAHLINGKVLVVHGGLFSDDGVTLDDIRKIDRFRQPPDSG-LMCELLWSDPQPQ---PGRSPSKRGVG  228 (316)
T ss_pred             HHHHHHHHHhchHhheeCCeEEEEccccccCCCccHHHhhcccCCCCCCccc-cceeeeecCCCCC---CCCCccCCCCc
Confidence            9999999999999999999999999999 56788999999999998776544 8999999999863   57999999999


Q ss_pred             ceeeCHHHHHHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCeEEEEEEcC-CceEEeEEeccCCCC
Q 001901          879 LVTFGPDRVMEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNAGAILVLGR-DLVVVPKLIHPLPPA  957 (998)
Q Consensus       879 ~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~~-~~~~~~~~~~~~~~~  957 (998)
                       +.||++++++||++||+++||||||++++||+++++++|||||||||||+..+|+||+|+|++ ++.+.++.|.+.+..
T Consensus       229 -~~fg~~~~~~Fl~~n~l~~iiR~He~~~~G~~~~~~~~~~TvfSa~~Y~~~~~N~ga~~~i~~~~~~~~~~~~~~~~~~  307 (316)
T cd07417         229 -CQFGPDVTKRFLEENNLEYIIRSHEVKDEGYEVEHDGKCITVFSAPNYCDQMGNKGAFIRITGSDLKPKFTQFEAVPHP  307 (316)
T ss_pred             -eEeCHHHHHHHHHHcCCcEEEECCcccceeEEEecCCeEEEEeCCccccCCCCcceEEEEEeCCCceeeeEeccCCCCC
Confidence             689999999999999999999999999999999999999999999999999999999999999 899999999887666


Q ss_pred             CCCC
Q 001901          958 ISSP  961 (998)
Q Consensus       958 ~~~~  961 (998)
                      ...|
T Consensus       308 ~~~~  311 (316)
T cd07417         308 NVKP  311 (316)
T ss_pred             CCCc
Confidence            5433


No 12 
>cd07416 MPP_PP2B PP2B, metallophosphatase domain. PP2B (calcineurin) is a unique serine/threonine protein phosphatase in its regulation by a second messenger (calcium and calmodulin).  PP2B is involved in many biological processes including immune responses, the second messenger cAMP pathway, sodium/potassium ion transport in the nephron, cell cycle progression in lower eukaryotes, cardiac hypertrophy, and memory formation.  PP2B is highly conserved from yeast to humans, but is absent from plants.  PP2B is a heterodimer consisting of a catalytic subunit (CnA) and a regulatory subunit (CnB); CnB  contains four Ca2+ binding motifs referred to as EF hands.  The PPP (phosphoprotein phosphatase) family, to which PP2B belongs, is one of two known protein phosphatase families specific for serine and threonine.  The PPP family also includes: PP1, PP2A, PP4, PP5, PP6, PP7, Bsu1, RdgC, PrpE, PrpA/PrpB, and ApA4 hydrolase. The PPP catalytic domain is defined by three conserved motifs (-GDXHG-, -G
Probab=100.00  E-value=7.3e-65  Score=560.38  Aligned_cols=288  Identities=35%  Similarity=0.623  Sum_probs=262.3

Q ss_pred             HHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcCCCCCCC
Q 001901          648 PKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYGSPSTAG  727 (998)
Q Consensus       648 ~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g~~~~~~  727 (998)
                      ++-+++++++..          .|+++++.+||++|+++|++||++++++.|++||||||||+.||.++|+..+.++.. 
T Consensus         3 ~~~~~~~~~~~~----------~l~~~~i~~l~~~~~~il~~e~~l~~i~~~i~ViGDIHG~~~dL~~l~~~~g~~~~~-   71 (305)
T cd07416           3 IDVLKAHFMREG----------RLSEEDALRIITEGAEILRQEPNLLRIEAPVTVCGDIHGQFYDLLKLFEVGGSPANT-   71 (305)
T ss_pred             HHHHHHHHHcCC----------CCCHHHHHHHHHHHHHHHHhCCCeEccCCCEEEEEeCCCCHHHHHHHHHhcCCCCCc-
Confidence            345666776542          478999999999999999999999999999999999999999999999999988765 


Q ss_pred             CccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhh
Q 001901          728 DIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLF  807 (998)
Q Consensus       728 ~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f  807 (998)
                           +|||||||||||++|+||+.+|++||+.||.+|++||||||.+.++..|||..||..+|+    ..+|..++++|
T Consensus        72 -----~ylFLGDyVDRG~~s~Evi~lL~~lki~~p~~v~lLRGNHE~~~l~~~~gf~~e~~~~y~----~~l~~~~~~~f  142 (305)
T cd07416          72 -----RYLFLGDYVDRGYFSIECVLYLWALKILYPKTLFLLRGNHECRHLTEYFTFKQECKIKYS----ERVYDACMEAF  142 (305)
T ss_pred             -----eEEEECCccCCCCChHHHHHHHHHHHhhcCCCEEEEeCCCcHHHHHHhhCchhHHHHhcc----HHHHHHHHHHH
Confidence                 899999999999999999999999999999999999999999999999999999999885    46899999999


Q ss_pred             cccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCC----CCcccC-CCCCCceee
Q 001901          808 NWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSV----EGLRPN-ARGPGLVTF  882 (998)
Q Consensus       808 ~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~----~~~~~n-~rg~~~~~f  882 (998)
                      ++||+++++++++|||||||+|.+.++++|+.++||.+.+..+ +++|+|||||...+..    .+|.+| .||.| +.|
T Consensus       143 ~~LPlaaii~~~i~~vHGGi~p~~~~l~~i~~i~r~~~~~~~~-~~~dllWsDP~~~~~~~~~~~~~~~~~~Rg~g-~~f  220 (305)
T cd07416         143 DCLPLAALMNQQFLCVHGGLSPELKTLDDIRKLDRFREPPAFG-PMCDLLWSDPLEDFGNEKTQEHFVHNTVRGCS-YFY  220 (305)
T ss_pred             hhccceeEEcCCEEEEcCCCCcccccHHHhcccCCCCCCCCCC-cceeeeecCcccccccccccccccccCCCCCc-eec
Confidence            9999999999999999999999999999999999998877654 8999999999764321    257776 89999 789


Q ss_pred             CHHHHHHHHHHcCCcEEEEcccccccceEEecCC------eEEEEeccccccCCCCCeEEEEEEcCCceEEeEEeccCCC
Q 001901          883 GPDRVMEFCNNNDLQLIVRAHECVMDGFERFAQG------HLITLFSATNYCGTANNAGAILVLGRDLVVVPKLIHPLPP  956 (998)
Q Consensus       883 g~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~------~~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~~~~~  956 (998)
                      |++++++||++||+++||||||++++||++++++      +||||||||||||..+|+||+|.++++. +.++.|.+.+.
T Consensus       221 G~~~~~~Fl~~n~l~~iiR~He~~~~G~~~~~~~~~~~~~~~iTvFSa~~Y~~~~~N~~a~l~i~~~~-~~~~~~~~~~~  299 (305)
T cd07416         221 SYRAVCEFLQKNNLLSIIRAHEAQDAGYRMYRKSQTTGFPSLITIFSAPNYLDVYNNKAAVLKYENNV-MNIRQFNCSPH  299 (305)
T ss_pred             CHHHHHHHHHHcCCeEEEEeccccccceEEecCCCcCCCCcEEEEeCCccccCCCCceEEEEEEcCCc-ceEEEecCCCC
Confidence            9999999999999999999999999999998886      9999999999999999999999999985 68888887765


Q ss_pred             CC
Q 001901          957 AI  958 (998)
Q Consensus       957 ~~  958 (998)
                      .+
T Consensus       300 ~~  301 (305)
T cd07416         300 PY  301 (305)
T ss_pred             CC
Confidence            43


No 13 
>smart00156 PP2Ac Protein phosphatase 2A homologues, catalytic domain. Large family of serine/threonine phosphatases, that includes PP1, PP2A and PP2B (calcineurin) family members.
Probab=100.00  E-value=1.5e-64  Score=550.67  Aligned_cols=269  Identities=47%  Similarity=0.903  Sum_probs=255.2

Q ss_pred             cCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHH
Q 001901          671 LDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLET  750 (998)
Q Consensus       671 ~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~ev  750 (998)
                      ++++++.+||++|+++|++||++++++.|++||||||||+.+|.++|+..+.++..      +|||||||||||++++||
T Consensus         1 ~~~~~i~~l~~~~~~il~~e~~~~~i~~~i~vvGDiHG~~~~l~~ll~~~~~~~~~------~~vfLGD~VDrG~~s~e~   74 (271)
T smart00156        1 LYAEEILELLREVKEIFRQEPNLVEVSAPVTVCGDIHGQFDDLLRLFDLNGPPPDT------NYVFLGDYVDRGPFSIEV   74 (271)
T ss_pred             CCHHHHHHHHHHHHHHHHhCCCeEEeCCCEEEEEeCcCCHHHHHHHHHHcCCCCCc------eEEEeCCccCCCCChHHH
Confidence            35789999999999999999999999999999999999999999999999987665      899999999999999999


Q ss_pred             HHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhhcccceeEEEcCeEEEecCCccCc
Q 001901          751 ITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLFNWLPLAALIEKKIICMHGGIGRS  830 (998)
Q Consensus       751 l~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~~~il~vHgGi~~~  830 (998)
                      +.+|++||+.+|.+|++||||||.+.++..|||.+||..+|+.    .+|+.++++|++||++|++++++|||||||+|.
T Consensus        75 l~~l~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~~~----~l~~~~~~~f~~LPl~aii~~~~~~vHgGi~~~  150 (271)
T smart00156       75 ILLLFALKILYPNRVVLLRGNHESRSMNEIYGFYDECKRKYGE----EIYEKFQEAFSWLPLAALIDNKILCMHGGLSPD  150 (271)
T ss_pred             HHHHHHHHhcCCCCEEEEeccccHHHHHHhccchhhhhhhcCH----HHHHHHHHHHhhChhheEEcCeEEEEecCCCCc
Confidence            9999999999999999999999999999999999999999963    699999999999999999999999999999999


Q ss_pred             ccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHHHHHHHHcCCcEEEEcccccccce
Q 001901          831 INHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRVMEFCNNNDLQLIVRAHECVMDGF  910 (998)
Q Consensus       831 ~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~  910 (998)
                      +.++++|+.+.||.+.+... ++.|+|||||..  ...+|.+|.||.| +.||++++++||++||+++||||||++++||
T Consensus       151 ~~~l~~i~~i~r~~~~~~~~-~~~dllWsDP~~--~~~~~~~~~Rg~g-~~fg~~~~~~Fl~~n~l~~iiR~He~~~~G~  226 (271)
T smart00156      151 LTTLDDIRKLKRPQEPPDEG-LLIDLLWSDPDQ--PVDGFQPSIRGAS-YYFGPDAVDEFLKKNNLKLIIRAHQVVDDGY  226 (271)
T ss_pred             cCCHHHHhcccCCCCCCchh-hhhheeecCCCc--ccCCCccCCCCCc-cccCHHHHHHHHHHCCCeEEEecCcccCCcE
Confidence            99999999999998876554 899999999974  3578999999999 6899999999999999999999999999999


Q ss_pred             EEecCCeEEEEeccccccCCCCCeEEEEEEcCCceEEeEEecc
Q 001901          911 ERFAQGHLITLFSATNYCGTANNAGAILVLGRDLVVVPKLIHP  953 (998)
Q Consensus       911 ~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~~  953 (998)
                      +++++++|||||||+|||+..+|+||+|.+++++.+.++.+.|
T Consensus       227 ~~~~~~~~~TvfSa~~y~~~~~n~~a~~~i~~~~~~~~~~~~~  269 (271)
T smart00156      227 EFFHDRKLVTIFSAPNYCGRFGNKAAVLKVDKDLKLSFEQFKP  269 (271)
T ss_pred             EEecCCcEEEEECCcccccCCCceEEEEEECCCCcEEEEEecC
Confidence            9999999999999999999999999999999999999988875


No 14 
>cd07418 MPP_PP7 PP7, metallophosphatase domain. PP7 is a plant phosphoprotein phosphatase that is highly expressed in a subset of stomata and thought to play an important role in sensory signaling.  PP7 acts as a positive regulator of signaling downstream of cryptochrome blue light photoreceptors.  PP7 also controls amplification of phytochrome signaling, and interacts with nucleotidediphosphate kinase 2 (NDPK2), a positive regulator of phytochrome signalling.  In addition, PP7 interacts with heat shock transcription factor HSF and up-regulates protective heat shock proteins.  PP7 may also play a role in salicylic acid-dependent defense signaling.  The PPP (phosphoprotein phosphatase) family, to which PP7 belongs, is one of two known protein phosphatase families specific for serine and threonine.  The PPP family also includes: PP2A, PP2B (calcineurin), PP4, PP5, PP6, Bsu1, RdgC, PrpE, PrpA/PrpB, and ApA4 hydrolase. The PPP catalytic domain is defined by three conserved motifs (-GDXHG-,
Probab=100.00  E-value=1.6e-62  Score=546.76  Aligned_cols=300  Identities=33%  Similarity=0.577  Sum_probs=258.8

Q ss_pred             CChhHHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeec----CCeEEEecCCCCHHHHHHHHHH
Q 001901          644 INSVPKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLK----APIKIFGDLHGQFGDLMRLFDE  719 (998)
Q Consensus       644 ~~~~~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~----~~i~vvGDiHG~~~dL~~il~~  719 (998)
                      +.+.++.+|+.+.....--++......|+.++|.+||++|+++|++||++++++    .|++||||||||+.+|+++|+.
T Consensus         8 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~i~~L~~~a~~il~~ep~ll~i~~~~~~~i~VvGDIHG~~~dL~~ll~~   87 (377)
T cd07418           8 TNEWVHELMSVFEWSSRNLPPSELPSVLPVNVFDSLVLTAHKILHREPNCVRIDVEDVCEVVVVGDVHGQLHDVLFLLED   87 (377)
T ss_pred             CHHHHHHHHHHHHhcccccCchhhccCCCHHHHHHHHHHHHHHHHhCCCeEEecCCCCCCEEEEEecCCCHHHHHHHHHH
Confidence            345678888887543221123334456899999999999999999999999998    8999999999999999999999


Q ss_pred             cCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhh
Q 001901          720 YGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWA  799 (998)
Q Consensus       720 ~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~  799 (998)
                      .|+++.+.     +|||||||||||++|+|||.+|++||+.||.+|++||||||.+.++..|||.+||..+|+.. +..+
T Consensus        88 ~g~~~~~~-----~ylFLGDyVDRGp~SlEvl~lL~~lki~~p~~v~lLRGNHE~~~i~~~~Gf~~E~~~~y~~~-~~~l  161 (377)
T cd07418          88 AGFPDQNR-----FYVFNGDYVDRGAWGLETFLLLLSWKVLLPDRVYLLRGNHESKFCTSMYGFEQEVLTKYGDK-GKHV  161 (377)
T ss_pred             hCCCCCCc-----eEEEeccccCCCCChHHHHHHHHHHhhccCCeEEEEeeecccccchhhcccchhhhhhcCch-HHHH
Confidence            99886542     69999999999999999999999999999999999999999999999999999999999864 4579


Q ss_pred             hhhhhhhhcccceeEEEcCeEEEecCCc---------------------------cCcccCHHhhhhccCCc-ccCCCC-
Q 001901          800 WHRINRLFNWLPLAALIEKKIICMHGGI---------------------------GRSINHVEQIENLQRPI-TMEAGS-  850 (998)
Q Consensus       800 ~~~~~~~f~~LP~aa~i~~~il~vHgGi---------------------------~~~~~~~~~i~~i~rp~-~~~~~~-  850 (998)
                      |+.++++|++||++++|++++|||||||                           ++.+.++++|+.++||. +++..+ 
T Consensus       162 ~~~~~~~f~~LPlaavI~~~i~cvHGGI~~~~~l~~~~~~~~~~~~~~~~~~~~~~~~l~sl~~i~~i~r~~~~~~~~~~  241 (377)
T cd07418         162 YRKCLGCFEGLPLASIIAGRVYTAHGGLFRSPSLPKRKKQKGKNRRVLLLEPESESLKLGTLDDLMKARRSVLDPPGEGS  241 (377)
T ss_pred             HHHHHHHHHhCCcEEEECCCEEEECCCcCCcccccccccccccccccccccccccCCCCCCHHHHhhCCCCCCCCCCCCc
Confidence            9999999999999999999999999999                           34567999999999985 444332 


Q ss_pred             -cceeccccCCCCCCCCCCCcccC-CCCCCceeeCHHHHHHHHHHcCCcEEEEcccc------------cccceEEecC-
Q 001901          851 -IVLMDLLWSDPTENDSVEGLRPN-ARGPGLVTFGPDRVMEFCNNNDLQLIVRAHEC------------VMDGFERFAQ-  915 (998)
Q Consensus       851 -~~~~dlLWsDP~~~~~~~~~~~n-~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~------------~~~G~~~~~~-  915 (998)
                       .+++|||||||..   ..+|.+| .||.| +.||++++++||++|++++|||||||            |++||+++++ 
T Consensus       242 ~~i~~dlLWSDP~~---~~g~~~~~~RG~g-~~FG~~~~~~FL~~n~l~~IIRsHe~~~~~~~~~~~~~v~~Gy~~~~~~  317 (377)
T cd07418         242 NLIPGDVLWSDPSL---TPGLSPNKQRGIG-LLWGPDCTEEFLEKNNLKLIIRSHEGPDAREKRPGLAGMNKGYTVDHDV  317 (377)
T ss_pred             cccceeeEeeCCcc---CCCCCccCCCCCc-cccCHHHHHHHHHHcCCcEEEECCCCcccccccccchhhhCceEEeccC
Confidence             2478999999986   3578777 79999 68999999999999999999999996            7899999887 


Q ss_pred             --CeEEEEecccccc------CCCCCeEEEEEEcCCc--eEEeEEecc
Q 001901          916 --GHLITLFSATNYC------GTANNAGAILVLGRDL--VVVPKLIHP  953 (998)
Q Consensus       916 --~~~iTvfSa~~y~------~~~~n~ga~l~~~~~~--~~~~~~~~~  953 (998)
                        ++|||||||||||      +..+|+||+++++.+-  ...++.|..
T Consensus       318 ~~~~liTvFSa~nY~~~~~~~~~~~N~ga~~~~~~~~~~~~~~~~~~~  365 (377)
T cd07418         318 ESGKLITLFSAPDYPQFQATEERYNNKGAYIILQPPDFSDPQFHTFEA  365 (377)
T ss_pred             CCCcEEEEecCCccccccccccccCcceEEEEEecCCCCCccceEeec
Confidence              9999999999999      5789999999996643  455555543


No 15 
>KOG0375 consensus Serine-threonine phosphatase 2B, catalytic subunit [General function prediction only]
Probab=100.00  E-value=5.8e-63  Score=518.44  Aligned_cols=273  Identities=37%  Similarity=0.657  Sum_probs=250.9

Q ss_pred             ccCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHH
Q 001901          670 FLDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLE  749 (998)
Q Consensus       670 ~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~e  749 (998)
                      .|+++..+.|+.++..+|++|++++++.+||.|||||||||.||+++|+..|.|...      +|+|||||||||.+|+|
T Consensus        60 rl~ee~alrIi~~~a~llr~Eknmi~v~APiTVCGDIHGQf~DLmKLFEVGG~PA~t------~YLFLGDYVDRGyFSiE  133 (517)
T KOG0375|consen   60 RLEEEQALRIINEGAALLRQEKNMIEVEAPITVCGDIHGQFFDLMKLFEVGGSPANT------RYLFLGDYVDRGYFSIE  133 (517)
T ss_pred             chhHHHHHHHHHHHHHHHhcCCceEeccCCeeEecccchHHHHHHHHHHccCCcccc------eeEeeccccccceeeee
Confidence            578999999999999999999999999999999999999999999999999988776      89999999999999999


Q ss_pred             HHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhhcccceeEEEcCeEEEecCCccC
Q 001901          750 TITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLFNWLPLAALIEKKIICMHGGIGR  829 (998)
Q Consensus       750 vl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~~~il~vHgGi~~  829 (998)
                      |+.+|.+||+.||..++|||||||++.+..+|.|..||..||.+    .+|+.+.+.|+.||+||+.++.+|||||||+|
T Consensus       134 CvlYLwsLKi~yp~tl~lLRGNHECrHLT~YFTFKqEc~iKYse----~vYdaCmesFd~LPLAAlmNqQflCVHGGlSP  209 (517)
T KOG0375|consen  134 CVLYLWSLKINYPKTLFLLRGNHECRHLTEYFTFKQECKIKYSE----RVYDACMESFDCLPLAALMNQQFLCVHGGLSP  209 (517)
T ss_pred             hHHHHHHHhcCCCCeEEEecCCcchhhhHhHhhHHHHHhHhccH----HHHHHHHHHhccchHHHHhcCceEEecCCCCc
Confidence            99999999999999999999999999999999999999999965    59999999999999999999999999999999


Q ss_pred             cccCHHhhhhccCCcccCCCCcceeccccCCCCCCC----CCCCcccC-CCCCCceeeCHHHHHHHHHHcCCcEEEEccc
Q 001901          830 SINHVEQIENLQRPITMEAGSIVLMDLLWSDPTEND----SVEGLRPN-ARGPGLVTFGPDRVMEFCNNNDLQLIVRAHE  904 (998)
Q Consensus       830 ~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~----~~~~~~~n-~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~  904 (998)
                      .+.+++||++|.|..+++..+ .+||||||||.++.    ..+.|.+| .||++ |.|.-.++.+||+.|||--|||+||
T Consensus       210 Ei~tl~DIr~l~RF~EpPa~G-pmCDLLWsDPlEdfgnek~~e~f~hNsvRGCS-yfysy~A~C~FLq~nnLLSIiRAHE  287 (517)
T KOG0375|consen  210 EIHTLDDIRKLDRFKEPPAFG-PMCDLLWSDPLEDFGNEKTSEHFTHNSVRGCS-YFYSYPAVCEFLQNNNLLSIIRAHE  287 (517)
T ss_pred             ccccHHHHHhhhhccCCCccC-cchhhhccChhhhccccccccccccCcccccc-ceechHHHHHHHHhCCchhhhhhhh
Confidence            999999999999999999877 89999999998742    13456666 79998 7899999999999999999999999


Q ss_pred             ccccceEEecCC------eEEEEeccccccCCCCCeEEEEEEcCCceEEeEEeccCC
Q 001901          905 CVMDGFERFAQG------HLITLFSATNYCGTANNAGAILVLGRDLVVVPKLIHPLP  955 (998)
Q Consensus       905 ~~~~G~~~~~~~------~~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~~~~  955 (998)
                      .+..||+.+-..      .||||||||||.+.++|+||||..+++. +....|.-.|
T Consensus       288 AQDaGYRMYrksqttGFPSLiTiFSAPNYLDvYnNKAAvLKYEnNV-MNIRQFncSP  343 (517)
T KOG0375|consen  288 AQDAGYRMYRKSQTTGFPSLITIFSAPNYLDVYNNKAAVLKYENNV-MNIRQFNCSP  343 (517)
T ss_pred             hhhhhhhhhhcccccCCchheeeecCCchhhhhccHHHHhhhhccc-ceeeccCCCC
Confidence            999999987654      4899999999999999999999998764 3444554333


No 16 
>KOG0371 consensus Serine/threonine protein phosphatase 2A, catalytic subunit [Signal transduction mechanisms]
Probab=100.00  E-value=1.5e-62  Score=497.52  Aligned_cols=286  Identities=40%  Similarity=0.706  Sum_probs=268.6

Q ss_pred             HHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeecCCeEEEecCCCCHHHHHHHHHHcCCCCCCC
Q 001901          648 PKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLKAPIKIFGDLHGQFGDLMRLFDEYGSPSTAG  727 (998)
Q Consensus       648 ~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~~~i~vvGDiHG~~~dL~~il~~~g~~~~~~  727 (998)
                      ++.-|..|.+.+          .+++.++..||+.|+++|.+|.+|..++.|++||||+||||+||+++|+..|..+.. 
T Consensus        20 vd~~ie~L~~ck----------~lse~~v~~lc~~a~~~L~~e~nV~~v~~pvtvcGDvHGqf~dl~ELfkiGG~~pdt-   88 (319)
T KOG0371|consen   20 VDPWIEQLYKCK----------PLSEVDVSSLCLLAKEILDKEENVQPVNCPVTVCGDVHGQFHDLIELFKIGGLAPDT-   88 (319)
T ss_pred             cccchHHHHhcC----------CCccccchhHHHHHHHHHhccccccccccceEEecCcchhHHHHHHHHHccCCCCCc-
Confidence            455666666542          578899999999999999999999999999999999999999999999888877765 


Q ss_pred             CccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhh
Q 001901          728 DIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLF  807 (998)
Q Consensus       728 ~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f  807 (998)
                           +|+|+|||||||++|+|++.+|.++|++||++|.+||||||.+.+..+|||++||.+|||..   .+|+.|.++|
T Consensus        89 -----nylfmGDyvdrGy~SvetVS~lva~Kvry~~rvtilrGNHEsrqitqvygfydeclRkyg~a---nvw~~Ftdlf  160 (319)
T KOG0371|consen   89 -----NYLFMGDYVDRGYYSVETVSLLVALKVRYPDRVTILRGNHESRQITQVYGFYDECLRKYGNA---NVWKYFTDLF  160 (319)
T ss_pred             -----ceeeeeeecccccchHHHHHHHHHhhccccceeEEecCchHHHHHHHHHhhHHHHHhhcccc---cchHHhhhhh
Confidence                 89999999999999999999999999999999999999999999999999999999999975   7999999999


Q ss_pred             cccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHH
Q 001901          808 NWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRV  887 (998)
Q Consensus       808 ~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~  887 (998)
                      +++|+.|+|+++|||+|||++|++.+++.++.+.|-.+++.++ .+||||||||.+   .-||..++||+| +.||.+..
T Consensus       161 dy~P~tali~~~ifc~HGgLspsi~tld~~r~~dr~~evpheg-pmcDlLwsdpdd---r~gwg~sprgag-~tfg~di~  235 (319)
T KOG0371|consen  161 DYLPLTALIESKIFCLHGGLSPSIDTLDLIRLLDRIQEVPHEG-PMCDLLWSDPDD---RCGWGISPRGAG-YTFGQDIS  235 (319)
T ss_pred             hccchHhhhccceeeccCCcCcccchHHHHHHHHHhhcccCCC-ChhheeccCccc---CCCCCCCCCCCC-cccchhhH
Confidence            9999999999999999999999999999999999988888876 788999999985   689999999999 79999999


Q ss_pred             HHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCeEEEEEEcCCceEEeEEeccCCCC
Q 001901          888 MEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNAGAILVLGRDLVVVPKLIHPLPPA  957 (998)
Q Consensus       888 ~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~~~~~~  957 (998)
                      ++|-.+||+++|-|+||.+++||.+.+...++|||||+|||+.++|.+|+|.+++.....+..|.|.+-.
T Consensus       236 ~~fn~~n~lslisRahqlvm~g~nW~~~~~~vtiFSapnycYrcgn~a~i~e~d~~~~~~f~q~~psp~k  305 (319)
T KOG0371|consen  236 EQFNHKNGLSLISRAHQLVMEGYNWYHLWNVVTIFSAPNYCYRCGNQAAIMERDDTKNYDFLQFDPSPRK  305 (319)
T ss_pred             HHhhccCCchHhHHHHHHHhcccceeeecceeEEccCCchhhccccHHHHhhhhhccCcceEEecCCccc
Confidence            9999999999999999999999999999999999999999999999999999999999999999985543


No 17 
>KOG0377 consensus Protein serine/threonine phosphatase RDGC/PPEF, contains STphosphatase and EF-hand domains [Signal transduction mechanisms]
Probab=100.00  E-value=5.4e-53  Score=453.02  Aligned_cols=280  Identities=33%  Similarity=0.637  Sum_probs=247.7

Q ss_pred             HHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeeec----CCeEEEecCCCCHHHHHHHHHHcCCC
Q 001901          648 PKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQLK----APIKIFGDLHGQFGDLMRLFDEYGSP  723 (998)
Q Consensus       648 ~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~~----~~i~vvGDiHG~~~dL~~il~~~g~~  723 (998)
                      ++.+|+.+...          ..|....+..|+.+|+++|++-|++-+++    ..|.|||||||.++||+-||.+.|+|
T Consensus       121 i~~lieaFk~k----------q~LH~kYVl~iL~EakK~lkqmPnis~isTs~S~qVTiCGDLHGklDDL~~I~yKNGlP  190 (631)
T KOG0377|consen  121 IDLLIEAFKKK----------QRLHPKYVLLILREAKKSLKQMPNISRISTSVSQQVTICGDLHGKLDDLLVILYKNGLP  190 (631)
T ss_pred             HHHHHHHHHHh----------hhccHHHHHHHHHHHHHHHHhCCCCCccccccccceEEeccccccccceEEEEecCCCC
Confidence            56677765432          25678889999999999999999999985    47999999999999999999999999


Q ss_pred             CCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhh
Q 001901          724 STAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRI  803 (998)
Q Consensus       724 ~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~  803 (998)
                      +..+     -|||.||+||||.+|+|||++|++|-+.||..+||-|||||+..+|..|||..|+..||... +..+...+
T Consensus       191 S~~n-----pYvFNGDFVDRGk~siEvLmiL~a~~lv~P~~~~LNRGNHED~mmNlRYGF~kEv~~KYk~~-~k~Ilr~l  264 (631)
T KOG0377|consen  191 SSSN-----PYVFNGDFVDRGKRSIEVLMILFALYLVYPNAVHLNRGNHEDHMMNLRYGFIKEVESKYKRH-GKRILRFL  264 (631)
T ss_pred             CCCC-----CeeecCchhhccccchhhHHHHHHHHhcCchhhhccCCchHHHHHHHHHhHHHHHHHHhhhc-ccHHHHHH
Confidence            9874     69999999999999999999999999999999999999999999999999999999999765 77888999


Q ss_pred             hhhhcccceeEEEcCeEEEecCCccCcccCHHhhhhccC---------Cccc--CC----------CCcceeccccCCCC
Q 001901          804 NRLFNWLPLAALIEKKIICMHGGIGRSINHVEQIENLQR---------PITM--EA----------GSIVLMDLLWSDPT  862 (998)
Q Consensus       804 ~~~f~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~r---------p~~~--~~----------~~~~~~dlLWsDP~  862 (998)
                      .++|.|||++.+|+.+||+|||||+.. +.++-|.+|+|         |++.  +.          +.+.+.|+|||||.
T Consensus       265 eevy~WLPi~tiid~~ilvvHGGiSd~-Tdl~ll~kIeR~k~~Svlrpp~ek~~d~e~~s~~vg~dEW~Qi~DImWSDP~  343 (631)
T KOG0377|consen  265 EEVYRWLPIGTIIDSRILVVHGGISDS-TDLDLLDKIERGKYVSVLRPPTEKGRDGEKLSKAVGVDEWQQIFDIMWSDPQ  343 (631)
T ss_pred             HHHHHhcchhhhcccceEEEecCcccc-hhHHHHhhhhccceeEEecCCcccCccCCchhhhcChHHHHHHHHHHhcCcc
Confidence            999999999999999999999999875 67777777766         2211  00          23457899999998


Q ss_pred             CCCCCCCcccC-CCCCCceeeCHHHHHHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCeEEEEEEc
Q 001901          863 ENDSVEGLRPN-ARGPGLVTFGPDRVMEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNAGAILVLG  941 (998)
Q Consensus       863 ~~~~~~~~~~n-~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~  941 (998)
                      .+   .|..|| .||.| ++||+|++.+||++++|+++||+|||.++|||+.++++|+|||||+||.....|+||++.+.
T Consensus       344 ~~---~GC~pNt~RGgG-~yFGpDvT~~~Lqk~~l~~liRSHECKpeGyEf~Hd~kvlTiFSASNYYe~GSNrGAYikl~  419 (631)
T KOG0377|consen  344 AT---MGCVPNTLRGGG-CYFGPDVTDNFLQKHRLSYLIRSHECKPEGYEFCHDNKVLTIFSASNYYEIGSNRGAYIKLG  419 (631)
T ss_pred             cc---cCCCcccccCCc-ceeCchHHHHHHHHhCceeeeeecccCCCcceeeeCCeEEEEEeccchheecCCCceEEEeC
Confidence            63   677787 69999 57999999999999999999999999999999999999999999999999999999999999


Q ss_pred             CCceEEe
Q 001901          942 RDLVVVP  948 (998)
Q Consensus       942 ~~~~~~~  948 (998)
                      +.+.-.+
T Consensus       420 ~~~~Phf  426 (631)
T KOG0377|consen  420 NQLTPHF  426 (631)
T ss_pred             CCCCchH
Confidence            8775433


No 18 
>KOG0376 consensus Serine-threonine phosphatase 2A, catalytic subunit [General function prediction only]
Probab=100.00  E-value=1.3e-46  Score=417.14  Aligned_cols=279  Identities=38%  Similarity=0.660  Sum_probs=253.7

Q ss_pred             cCHHHHHHHHHHHHHHHhcCCCeeeecC----CeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCC
Q 001901          671 LDCNEIADLCDSAERIFSSEPSVLQLKA----PIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQH  746 (998)
Q Consensus       671 ~~~~~i~~l~~~~~~~~~~ep~~l~~~~----~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~  746 (998)
                      |...-...|+..+..+++++|+++++..    .+.|+||+||||.||+++|+..|.|+...     .|+|.||+||||..
T Consensus       183 L~~k~a~~i~~~~~~~~~~l~~~ve~~~~~d~~~sv~gd~hGqfydl~nif~l~g~Ps~t~-----~ylfngdfv~rgs~  257 (476)
T KOG0376|consen  183 LPKKYAYSILDLAKTILRKLPSLVEISVPGDVKISVCGDTHGQFYDLLNIFELNGLPSETN-----PYLFNGDFVDRGSW  257 (476)
T ss_pred             cccccceeeHHHHhhHHhcCCcceEeecCCCceEEecCCccccccchhhhHhhcCCCCCcc-----cccccCceeeeccc
Confidence            4555677899999999999999999864    48999999999999999999999998764     79999999999999


Q ss_pred             hHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhhcccceeEEEcCeEEEecCC
Q 001901          747 SLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLFNWLPLAALIEKKIICMHGG  826 (998)
Q Consensus       747 s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~~~il~vHgG  826 (998)
                      |.|++..+++.|+.+|+++|++|||||...++..|||.+|+..+|.+    ..+..+.++|.+||++-+|+++++.+|||
T Consensus       258 s~e~~~~~~~~kl~~pn~~fl~rgn~Es~~m~~iy~f~~e~~~kyte----~~~~~f~~~f~~LPl~~~i~~~~~~~hgg  333 (476)
T KOG0376|consen  258 SVEVILTLFAFKLLYPNNFFLLRGNHESDNMNKIYGFEGEVKAKYTE----EMFNLFSEVFIWLPLAHLINNKVLVMHGG  333 (476)
T ss_pred             ceeeeeeehhhcccCCcceeeccCCccchHHHHHhCCCcchhhhhHH----HHHHhhhhhhccccchhhhcCceEEEecC
Confidence            99999999999999999999999999999999999999999999975    47777789999999999999999999999


Q ss_pred             ccC-cccCHHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHHHHHHHHcCCcEEEEcccc
Q 001901          827 IGR-SINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRVMEFCNNNDLQLIVRAHEC  905 (998)
Q Consensus       827 i~~-~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~  905 (998)
                      +.. .-.++++|++|.|+...+.. ..++|+|||||..   ..|..++.||.| ..||++++++||+.|++++|||+||+
T Consensus       334 lf~~~~v~l~d~r~i~r~~~~~~~-~~~~~~lws~pq~---~~g~s~S~r~~g-~~fG~d~t~~f~~~n~l~~i~rshe~  408 (476)
T KOG0376|consen  334 LFSPDGVTLEDFRNIDRFEQPPEE-GLMCELLWSDPQP---ANGRSPSKRGVG-LQFGPDVTERFLQDNNLDKIIRSHEV  408 (476)
T ss_pred             cCCCCCccHHHHHhhhhccCCccc-ccccccccCCCcc---ccCCCccccCce-eeeCCCchhhHHhhcchHHHhhcccc
Confidence            954 45689999999999555544 4899999999986   478999999999 58999999999999999999999999


Q ss_pred             cccceEEecCCeEEEEeccccccCCCCCeEEEEEEc-CCceEEeEEeccCCCCCCCCCC
Q 001901          906 VMDGFERFAQGHLITLFSATNYCGTANNAGAILVLG-RDLVVVPKLIHPLPPAISSPET  963 (998)
Q Consensus       906 ~~~G~~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~-~~~~~~~~~~~~~~~~~~~~~~  963 (998)
                      .+.||++.++|+|+|||||||||...+|.||++.++ ++++.++..|.++|..-.-++.
T Consensus       409 ~d~gy~~eh~g~l~tvfsapnycd~~~n~ga~i~~~~~~~~p~~~~~e~vp~~~~~~ma  467 (476)
T KOG0376|consen  409 KDEGYEVEHSGKLITVFSAPNYCDQMGNKGAFIHLEPDDLTPNFYTFEAVPHPDVKPMA  467 (476)
T ss_pred             CCCceeeecCCcEEEEecCcchhhhcCCcceEEEecCCCCccceeecccCCCCCCCCcc
Confidence            999999999999999999999999999999999998 7888999999888766543333


No 19 
>PLN02153 epithiospecifier protein
Probab=100.00  E-value=1e-36  Score=346.70  Aligned_cols=306  Identities=24%  Similarity=0.269  Sum_probs=233.4

Q ss_pred             eeeeecccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEEC
Q 001901           78 VNAVIEKKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDV  157 (998)
Q Consensus        78 ~~~~~~~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~  157 (998)
                      |..+....+..|.||.+|+++++            +++||||||......                   ...+++|+||+
T Consensus         9 W~~~~~~~~~~P~pR~~h~~~~~------------~~~iyv~GG~~~~~~-------------------~~~~~~~~yd~   57 (341)
T PLN02153          9 WIKVEQKGGKGPGPRCSHGIAVV------------GDKLYSFGGELKPNE-------------------HIDKDLYVFDF   57 (341)
T ss_pred             EEEecCCCCCCCCCCCcceEEEE------------CCEEEEECCccCCCC-------------------ceeCcEEEEEC
Confidence            44443445568999999999998            789999999854221                   15689999999


Q ss_pred             CCCcEEEecCCCCCCCC-ccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeec--CCCCCCCcccEEE
Q 001901          158 LTNKWSRITPFGEPPTP-RAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQ--GPGPGPRYGHVMA  234 (998)
Q Consensus       158 ~t~~W~~l~~~g~~P~p-R~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~--g~~P~~R~~hs~~  234 (998)
                      .+++|+++++++..|.. +.+|++++++++||||||.... ..++++++||+.++  +|+.++..  ...|.+|..|+++
T Consensus        58 ~~~~W~~~~~~~~~p~~~~~~~~~~~~~~~iyv~GG~~~~-~~~~~v~~yd~~t~--~W~~~~~~~~~~~p~~R~~~~~~  134 (341)
T PLN02153         58 NTHTWSIAPANGDVPRISCLGVRMVAVGTKLYIFGGRDEK-REFSDFYSYDTVKN--EWTFLTKLDEEGGPEARTFHSMA  134 (341)
T ss_pred             CCCEEEEcCccCCCCCCccCceEEEEECCEEEEECCCCCC-CccCcEEEEECCCC--EEEEeccCCCCCCCCCceeeEEE
Confidence            99999999887644443 4589999999999999998644 34689999999987  59988732  1238899999999


Q ss_pred             EECCcEEEEEcCCCCCC------CcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCC-----
Q 001901          235 LVGQRYLMAIGGNDGKR------PLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDAS-----  303 (998)
Q Consensus       235 ~~~~~~Lyv~GG~~g~~------~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~-----  303 (998)
                      ++++ +||||||.+...      .++++++||+.++  +|+.+...+..|.+|..|.++ +.+++|||+||.+..     
T Consensus       135 ~~~~-~iyv~GG~~~~~~~~~~~~~~~v~~yd~~~~--~W~~l~~~~~~~~~r~~~~~~-~~~~~iyv~GG~~~~~~~gG  210 (341)
T PLN02153        135 SDEN-HVYVFGGVSKGGLMKTPERFRTIEAYNIADG--KWVQLPDPGENFEKRGGAGFA-VVQGKIWVVYGFATSILPGG  210 (341)
T ss_pred             EECC-EEEEECCccCCCccCCCcccceEEEEECCCC--eEeeCCCCCCCCCCCCcceEE-EECCeEEEEeccccccccCC
Confidence            9987 899999986432      4689999999999  999998877666666666555 468999999997521     


Q ss_pred             --CCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCC-----CccccCCeEEEEECCCCeEE
Q 001901          304 --SVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGG-----RMVEDSSSVAVLDTAAGVWC  376 (998)
Q Consensus       304 --~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~-----~~~~~~~dv~vyD~~t~~W~  376 (998)
                        ...+++++.|++.++ +|+.....+..|.+|..|++++++++||||||.....     ......+++|+||+.+++|+
T Consensus       211 ~~~~~~~~v~~yd~~~~-~W~~~~~~g~~P~~r~~~~~~~~~~~iyv~GG~~~~~~~~~~~~~~~~n~v~~~d~~~~~W~  289 (341)
T PLN02153        211 KSDYESNAVQFFDPASG-KWTEVETTGAKPSARSVFAHAVVGKYIIIFGGEVWPDLKGHLGPGTLSNEGYALDTETLVWE  289 (341)
T ss_pred             ccceecCceEEEEcCCC-cEEeccccCCCCCCcceeeeEEECCEEEEECcccCCccccccccccccccEEEEEcCccEEE
Confidence              123678999998876 5555444455688999999999999999999974211     01123679999999999999


Q ss_pred             EcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEE--CCEEEEEcCCCCC-CCcccEEEecc
Q 001901          377 DTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAV--GDLIFIYGGLRGG-VLLDDLLVAED  438 (998)
Q Consensus       377 ~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~--~~~LyVfGG~~~~-~~l~Dv~~ld~  438 (998)
                      .+.....+|                +|..|++|+++.+  +++||||||+++. ..++|+|.++.
T Consensus       290 ~~~~~~~~~----------------~pr~~~~~~~~~v~~~~~~~~~gG~~~~~~~~~~~~~~~~  338 (341)
T PLN02153        290 KLGECGEPA----------------MPRGWTAYTTATVYGKNGLLMHGGKLPTNERTDDLYFYAV  338 (341)
T ss_pred             eccCCCCCC----------------CCCccccccccccCCcceEEEEcCcCCCCccccceEEEec
Confidence            987543221                2445665555554  3489999998764 78899999864


No 20 
>PLN02193 nitrile-specifier protein
Probab=100.00  E-value=1.4e-36  Score=358.77  Aligned_cols=302  Identities=21%  Similarity=0.316  Sum_probs=240.7

Q ss_pred             eecccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCC
Q 001901           81 VIEKKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTN  160 (998)
Q Consensus        81 ~~~~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~  160 (998)
                      .+...+..|.||++|+++.+            +++||||||.......                   ..+++|+||+.++
T Consensus       155 ~~~~~~~~P~pR~~h~~~~~------------~~~iyv~GG~~~~~~~-------------------~~~~v~~yD~~~~  203 (470)
T PLN02193        155 KVEQKGEGPGLRCSHGIAQV------------GNKIYSFGGEFTPNQP-------------------IDKHLYVFDLETR  203 (470)
T ss_pred             EcccCCCCCCCccccEEEEE------------CCEEEEECCcCCCCCC-------------------eeCcEEEEECCCC
Confidence            33455668999999999998            7899999997543211                   5578999999999


Q ss_pred             cEEEecCCCCCCC-CccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCc
Q 001901          161 KWSRITPFGEPPT-PRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQR  239 (998)
Q Consensus       161 ~W~~l~~~g~~P~-pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~  239 (998)
                      +|+.++.+++.|. +|.+|++++++++||||||.... ..++++|+||+.++  +|+.+.+.+..|.+|+.|+++++++ 
T Consensus       204 ~W~~~~~~g~~P~~~~~~~~~v~~~~~lYvfGG~~~~-~~~ndv~~yD~~t~--~W~~l~~~~~~P~~R~~h~~~~~~~-  279 (470)
T PLN02193        204 TWSISPATGDVPHLSCLGVRMVSIGSTLYVFGGRDAS-RQYNGFYSFDTTTN--EWKLLTPVEEGPTPRSFHSMAADEE-  279 (470)
T ss_pred             EEEeCCCCCCCCCCcccceEEEEECCEEEEECCCCCC-CCCccEEEEECCCC--EEEEcCcCCCCCCCccceEEEEECC-
Confidence            9999988776665 46799999999999999998643 45799999999987  5999986555699999999999987 


Q ss_pred             EEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCC
Q 001901          240 YLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDG  319 (998)
Q Consensus       240 ~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~  319 (998)
                      +||||||.++...++++++||+.++  +|+.+......|.+|..|.++ +.+++||++||.++.  .+++++.|++.++ 
T Consensus       280 ~iYv~GG~~~~~~~~~~~~yd~~t~--~W~~~~~~~~~~~~R~~~~~~-~~~gkiyviGG~~g~--~~~dv~~yD~~t~-  353 (470)
T PLN02193        280 NVYVFGGVSATARLKTLDSYNIVDK--KWFHCSTPGDSFSIRGGAGLE-VVQGKVWVVYGFNGC--EVDDVHYYDPVQD-  353 (470)
T ss_pred             EEEEECCCCCCCCcceEEEEECCCC--EEEeCCCCCCCCCCCCCcEEE-EECCcEEEEECCCCC--ccCceEEEECCCC-
Confidence            8999999988888999999999999  999998766666667666555 458999999998654  3789999999876 


Q ss_pred             eEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCC-----ccccCCeEEEEECCCCeEEEcccCcCCCCCCCCcccc
Q 001901          320 RWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGR-----MVEDSSSVAVLDTAAGVWCDTKSVVTSPRTGRYSADA  394 (998)
Q Consensus       320 ~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~-----~~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~~~~~~  394 (998)
                      +|+.....+..|.+|..|+++.++++|||+||......     .....+++|+||+.+++|+.+..+...          
T Consensus       354 ~W~~~~~~g~~P~~R~~~~~~~~~~~iyv~GG~~~~~~~~~~~~~~~~ndv~~~D~~t~~W~~~~~~~~~----------  423 (470)
T PLN02193        354 KWTQVETFGVRPSERSVFASAAVGKHIVIFGGEIAMDPLAHVGPGQLTDGTFALDTETLQWERLDKFGEE----------  423 (470)
T ss_pred             EEEEeccCCCCCCCcceeEEEEECCEEEEECCccCCccccccCccceeccEEEEEcCcCEEEEcccCCCC----------
Confidence            66655544556889999999999999999999864211     012357899999999999999876321          


Q ss_pred             CCCCCccCCCCcceeEEE--EE-C-CEEEEEcCCCC-CCCcccEEEecc
Q 001901          395 AGGDAAVELTRRCRHAAA--AV-G-DLIFIYGGLRG-GVLLDDLLVAED  438 (998)
Q Consensus       395 ~~~~~~~~p~~R~~hsa~--~~-~-~~LyVfGG~~~-~~~l~Dv~~ld~  438 (998)
                           ...|.+|..|+++  .+ + +.|+||||+++ +.+++|+|.|+.
T Consensus       424 -----~~~P~~R~~~~~~~~~~~~~~~~~~fGG~~~~~~~~~D~~~~~~  467 (470)
T PLN02193        424 -----EETPSSRGWTASTTGTIDGKKGLVMHGGKAPTNDRFDDLFFYGI  467 (470)
T ss_pred             -----CCCCCCCccccceeeEEcCCceEEEEcCCCCccccccceEEEec
Confidence                 1236688777543  23 3 46999999875 588999999975


No 21 
>KOG4693 consensus Uncharacterized conserved protein, contains kelch repeat [General function prediction only]
Probab=100.00  E-value=1.6e-37  Score=316.74  Aligned_cols=301  Identities=24%  Similarity=0.384  Sum_probs=248.7

Q ss_pred             CCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEecCC-
Q 001901           90 GPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRITPF-  168 (998)
Q Consensus        90 ~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l~~~-  168 (998)
                      +.|.+|+++++            |.+||-|||+-..+.....                ---|+++++..+.+|+++++. 
T Consensus        12 PrRVNHAavaV------------G~riYSFGGYCsGedy~~~----------------~piDVH~lNa~~~RWtk~pp~~   63 (392)
T KOG4693|consen   12 PRRVNHAAVAV------------GSRIYSFGGYCSGEDYDAK----------------DPIDVHVLNAENYRWTKMPPGI   63 (392)
T ss_pred             cccccceeeee------------cceEEecCCcccccccccC----------------CcceeEEeeccceeEEecCccc
Confidence            46999999999            7999999998765532110                334999999999999999872 


Q ss_pred             ---------CCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCc
Q 001901          169 ---------GEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQR  239 (998)
Q Consensus       169 ---------g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~  239 (998)
                               .-.|--|++|+.+.+.+++||+||.++....-|-+|.||++++  +|.++.+.|-.|..|.+|++|++++ 
T Consensus        64 ~ka~i~~~yp~VPyqRYGHtvV~y~d~~yvWGGRND~egaCN~Ly~fDp~t~--~W~~p~v~G~vPgaRDGHsAcV~gn-  140 (392)
T KOG4693|consen   64 TKATIESPYPAVPYQRYGHTVVEYQDKAYVWGGRNDDEGACNLLYEFDPETN--VWKKPEVEGFVPGARDGHSACVWGN-  140 (392)
T ss_pred             ccccccCCCCccchhhcCceEEEEcceEEEEcCccCcccccceeeeeccccc--cccccceeeecCCccCCceeeEECc-
Confidence                     1247779999999999999999999886666689999999997  5999999999999999999999998 


Q ss_pred             EEEEEcCCCC--CCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCC-------CcccE
Q 001901          240 YLMAIGGNDG--KRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSV-------PLASA  310 (998)
Q Consensus       240 ~Lyv~GG~~g--~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~-------~~~dv  310 (998)
                      .+|||||+..  +.+.+|++.||+.+.  +|+.+...+.+|.-|-+|+++++ ++++|||||+.....       .+.+.
T Consensus       141 ~MyiFGGye~~a~~FS~d~h~ld~~Tm--tWr~~~Tkg~PprwRDFH~a~~~-~~~MYiFGGR~D~~gpfHs~~e~Yc~~  217 (392)
T KOG4693|consen  141 QMYIFGGYEEDAQRFSQDTHVLDFATM--TWREMHTKGDPPRWRDFHTASVI-DGMMYIFGGRSDESGPFHSIHEQYCDT  217 (392)
T ss_pred             EEEEecChHHHHHhhhccceeEeccce--eeeehhccCCCchhhhhhhhhhc-cceEEEeccccccCCCccchhhhhcce
Confidence            8999999944  667899999999998  99999999998877777877766 799999999854331       22333


Q ss_pred             EEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcccCcCCCCCCCC
Q 001901          311 YGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKSVVTSPRTGRY  390 (998)
Q Consensus       311 ~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~~  390 (998)
                      ..+.+..++.|......++.|..|..|++.+++++||+|||+++.-.  ...+++|.||+.|..|..+...+.       
T Consensus       218 i~~ld~~T~aW~r~p~~~~~P~GRRSHS~fvYng~~Y~FGGYng~ln--~HfndLy~FdP~t~~W~~I~~~Gk-------  288 (392)
T KOG4693|consen  218 IMALDLATGAWTRTPENTMKPGGRRSHSTFVYNGKMYMFGGYNGTLN--VHFNDLYCFDPKTSMWSVISVRGK-------  288 (392)
T ss_pred             eEEEeccccccccCCCCCcCCCcccccceEEEcceEEEecccchhhh--hhhcceeecccccchheeeeccCC-------
Confidence            44444556678777677888999999999999999999999987654  458999999999999999887633       


Q ss_pred             ccccCCCCCccCCCCcceeEEEEECCEEEEEcCCCC-------------------CCCcccEEEecccccccc
Q 001901          391 SADAAGGDAAVELTRRCRHAAAAVGDLIFIYGGLRG-------------------GVLLDDLLVAEDLAAAET  444 (998)
Q Consensus       391 ~~~~~~~~~~~~p~~R~~hsa~~~~~~LyVfGG~~~-------------------~~~l~Dv~~ld~~~~~~~  444 (998)
                                 .|.+|.++++++.+++||+|||...                   -..++|+.+||..+..++
T Consensus       289 -----------~P~aRRRqC~~v~g~kv~LFGGTsP~~~~~~Spt~~~G~~~~~~LiD~SDLHvLDF~PsLKT  350 (392)
T KOG4693|consen  289 -----------YPSARRRQCSVVSGGKVYLFGGTSPLPCHPLSPTNYNGMISPSGLIDLSDLHVLDFAPSLKT  350 (392)
T ss_pred             -----------CCCcccceeEEEECCEEEEecCCCCCCCCCCCccccCCCCCcccccccccceeeecChhHHH
Confidence                       3679999999999999999999542                   035688888887664443


No 22 
>PLN02193 nitrile-specifier protein
Probab=100.00  E-value=1.1e-32  Score=325.78  Aligned_cols=278  Identities=26%  Similarity=0.379  Sum_probs=226.4

Q ss_pred             CCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCc--EEEEECCC----CcEEEecCCCCCCCCccceEEEEeCCE
Q 001901          113 GPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATAD--VHCYDVLT----NKWSRITPFGEPPTPRAAHVATAVGTM  186 (998)
Q Consensus       113 ~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~d--v~~yD~~t----~~W~~l~~~g~~P~pR~~hsa~~~~~~  186 (998)
                      +++|+.|+|....                      .++.  +|.+++.+    ++|.++.+.++.|.||.+|++++++++
T Consensus       120 ~~~ivgf~G~~~~----------------------~~~~ig~y~~~~~~~~~~~~W~~~~~~~~~P~pR~~h~~~~~~~~  177 (470)
T PLN02193        120 GGKIVGFHGRSTD----------------------VLHSLGAYISLPSTPKLLGKWIKVEQKGEGPGLRCSHGIAQVGNK  177 (470)
T ss_pred             CCeEEEEeccCCC----------------------cEEeeEEEEecCCChhhhceEEEcccCCCCCCCccccEEEEECCE
Confidence            7899999997643                      2333  34557655    799999988888999999999999999


Q ss_pred             EEEEeCCCC-CCCCcccEEEEEcCCCCCceEEeeecCCCCCC-CcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          187 VVIQGGIGP-AGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP-RYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       187 lyVfGG~~~-~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~-R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                      ||||||... .....+++|+||+.++  +|+.++..+.+|.. |.+|+++++++ +||||||.++...++++|+||+.++
T Consensus       178 iyv~GG~~~~~~~~~~~v~~yD~~~~--~W~~~~~~g~~P~~~~~~~~~v~~~~-~lYvfGG~~~~~~~ndv~~yD~~t~  254 (470)
T PLN02193        178 IYSFGGEFTPNQPIDKHLYVFDLETR--TWSISPATGDVPHLSCLGVRMVSIGS-TLYVFGGRDASRQYNGFYSFDTTTN  254 (470)
T ss_pred             EEEECCcCCCCCCeeCcEEEEECCCC--EEEeCCCCCCCCCCcccceEEEEECC-EEEEECCCCCCCCCccEEEEECCCC
Confidence            999999753 3334578999999987  59998877767764 67899999988 8999999988778999999999999


Q ss_pred             CceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECC
Q 001901          265 PYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNA  344 (998)
Q Consensus       265 ~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~  344 (998)
                        +|+++.++...|.+|..|++++ .+++||||||.+... .+++++.|++.++ +|+....++.+|.+|.+|+++++++
T Consensus       255 --~W~~l~~~~~~P~~R~~h~~~~-~~~~iYv~GG~~~~~-~~~~~~~yd~~t~-~W~~~~~~~~~~~~R~~~~~~~~~g  329 (470)
T PLN02193        255 --EWKLLTPVEEGPTPRSFHSMAA-DEENVYVFGGVSATA-RLKTLDSYNIVDK-KWFHCSTPGDSFSIRGGAGLEVVQG  329 (470)
T ss_pred             --EEEEcCcCCCCCCCccceEEEE-ECCEEEEECCCCCCC-CcceEEEEECCCC-EEEeCCCCCCCCCCCCCcEEEEECC
Confidence              9999988876677888776654 589999999987655 5789999998876 5554444444578899999999999


Q ss_pred             EEEEEcccCCCCCccccCCeEEEEECCCCeEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEECCEEEEEcCC
Q 001901          345 RLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAVGDLIFIYGGL  424 (998)
Q Consensus       345 ~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~~LyVfGG~  424 (998)
                      +|||+||.++.     ..+++++||+.+++|+++..++.                  .|.+|..|++++++++||||||.
T Consensus       330 kiyviGG~~g~-----~~~dv~~yD~~t~~W~~~~~~g~------------------~P~~R~~~~~~~~~~~iyv~GG~  386 (470)
T PLN02193        330 KVWVVYGFNGC-----EVDDVHYYDPVQDKWTQVETFGV------------------RPSERSVFASAAVGKHIVIFGGE  386 (470)
T ss_pred             cEEEEECCCCC-----ccCceEEEECCCCEEEEeccCCC------------------CCCCcceeEEEEECCEEEEECCc
Confidence            99999998643     26889999999999999886632                  25689999999999999999997


Q ss_pred             CC---------CCCcccEEEeccccccc
Q 001901          425 RG---------GVLLDDLLVAEDLAAAE  443 (998)
Q Consensus       425 ~~---------~~~l~Dv~~ld~~~~~~  443 (998)
                      ..         ..+++|+|.||......
T Consensus       387 ~~~~~~~~~~~~~~~ndv~~~D~~t~~W  414 (470)
T PLN02193        387 IAMDPLAHVGPGQLTDGTFALDTETLQW  414 (470)
T ss_pred             cCCccccccCccceeccEEEEEcCcCEE
Confidence            53         24678999999865443


No 23 
>KOG4152 consensus Host cell transcription factor HCFC1 [Cell cycle control, cell division, chromosome partitioning; Transcription]
Probab=100.00  E-value=3.9e-34  Score=312.64  Aligned_cols=310  Identities=27%  Similarity=0.415  Sum_probs=260.1

Q ss_pred             eeeeeecccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEE
Q 001901           77 VVNAVIEKKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYD  156 (998)
Q Consensus        77 ~~~~~~~~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD  156 (998)
                      -|..+....|..|.||.||-++++            ..-|++|||-+..                      ..++++.|+
T Consensus        18 rWrrV~~~tGPvPrpRHGHRAVai------------kELiviFGGGNEG----------------------iiDELHvYN   63 (830)
T KOG4152|consen   18 RWRRVQQSTGPVPRPRHGHRAVAI------------KELIVIFGGGNEG----------------------IIDELHVYN   63 (830)
T ss_pred             ceEEEecccCCCCCccccchheee------------eeeEEEecCCccc----------------------chhhhhhhc
Confidence            355566778999999999999999            6789999996542                      889999999


Q ss_pred             CCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeee----cCCCCCCCcccE
Q 001901          157 VLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVV----QGPGPGPRYGHV  232 (998)
Q Consensus       157 ~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~----~g~~P~~R~~hs  232 (998)
                      ..+++|......|+.|.+.+.|+.++.+++||+|||+.+-+.+.||+|.+....  |+|.++.+    .|.+|-||.+|+
T Consensus        64 TatnqWf~PavrGDiPpgcAA~GfvcdGtrilvFGGMvEYGkYsNdLYELQasR--WeWkrlkp~~p~nG~pPCPRlGHS  141 (830)
T KOG4152|consen   64 TATNQWFAPAVRGDIPPGCAAFGFVCDGTRILVFGGMVEYGKYSNDLYELQASR--WEWKRLKPKTPKNGPPPCPRLGHS  141 (830)
T ss_pred             cccceeecchhcCCCCCchhhcceEecCceEEEEccEeeeccccchHHHhhhhh--hhHhhcCCCCCCCCCCCCCccCce
Confidence            999999999999999999999999999999999999999999999998776544  68988764    578999999999


Q ss_pred             EEEECCcEEEEEcCCCC---------CCCcccEEEEECCCCC--ceEEEcccCCCCCCCccceEEEEEe-----CCEEEE
Q 001901          233 MALVGQRYLMAIGGNDG---------KRPLADVWALDTAAKP--YEWRKLEPEGEGPPPCMYATASARS-----DGLLLL  296 (998)
Q Consensus       233 ~~~~~~~~Lyv~GG~~g---------~~~lndv~~yD~~s~~--~~W~~v~~~~~~P~~r~~~~a~~~~-----~~~lyv  296 (998)
                      ..++++ +.|+|||...         -.|+||+|.+++.-..  .-|......+..|++|..|+++++.     ..+|||
T Consensus       142 Fsl~gn-KcYlFGGLaNdseDpknNvPrYLnDlY~leL~~Gsgvv~W~ip~t~Gv~P~pRESHTAViY~eKDs~~skmvv  220 (830)
T KOG4152|consen  142 FSLVGN-KCYLFGGLANDSEDPKNNVPRYLNDLYILELRPGSGVVAWDIPITYGVLPPPRESHTAVIYTEKDSKKSKMVV  220 (830)
T ss_pred             eEEecc-EeEEeccccccccCcccccchhhcceEEEEeccCCceEEEecccccCCCCCCcccceeEEEEeccCCcceEEE
Confidence            999998 8999999732         3469999999997443  5799999999999999999999873     238999


Q ss_pred             EeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCC----------CCCccccCCeEE
Q 001901          297 CGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALG----------GGRMVEDSSSVA  366 (998)
Q Consensus       297 fGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~----------~~~~~~~~~dv~  366 (998)
                      |||+.+..  +.|+|.+|..+- +|...+..+..|.||..|+++.++++||||||+-.          ...-....+++-
T Consensus       221 yGGM~G~R--LgDLW~Ldl~Tl-~W~kp~~~G~~PlPRSLHsa~~IGnKMyvfGGWVPl~~~~~~~~~hekEWkCTssl~  297 (830)
T KOG4152|consen  221 YGGMSGCR--LGDLWTLDLDTL-TWNKPSLSGVAPLPRSLHSATTIGNKMYVFGGWVPLVMDDVKVATHEKEWKCTSSLA  297 (830)
T ss_pred             Eccccccc--ccceeEEeccee-ecccccccCCCCCCcccccceeecceeEEecceeeeeccccccccccceeeecccee
Confidence            99998765  899999987754 88888888999999999999999999999999721          011113367788


Q ss_pred             EEECCCCeEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEECCEEEEEcCCCC-------CCCcccEEEeccc
Q 001901          367 VLDTAAGVWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAVGDLIFIYGGLRG-------GVLLDDLLVAEDL  439 (998)
Q Consensus       367 vyD~~t~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~~LyVfGG~~~-------~~~l~Dv~~ld~~  439 (998)
                      ++|+.+..|..+-....              .....|.+|.+|+++.++.+|||.-|.+|       .....|+|.||+.
T Consensus       298 clNldt~~W~tl~~d~~--------------ed~tiPR~RAGHCAvAigtRlYiWSGRDGYrKAwnnQVCCkDlWyLdTe  363 (830)
T KOG4152|consen  298 CLNLDTMAWETLLMDTL--------------EDNTIPRARAGHCAVAIGTRLYIWSGRDGYRKAWNNQVCCKDLWYLDTE  363 (830)
T ss_pred             eeeecchheeeeeeccc--------------cccccccccccceeEEeccEEEEEeccchhhHhhccccchhhhhhhccc
Confidence            99999999998754311              11125889999999999999999999765       4678999999975


Q ss_pred             c
Q 001901          440 A  440 (998)
Q Consensus       440 ~  440 (998)
                      .
T Consensus       364 k  364 (830)
T KOG4152|consen  364 K  364 (830)
T ss_pred             C
Confidence            4


No 24 
>KOG4441 consensus Proteins containing BTB/POZ and Kelch domains, involved in regulatory/signal transduction processes [Signal transduction mechanisms; General function prediction only]
Probab=100.00  E-value=4.2e-33  Score=333.36  Aligned_cols=266  Identities=23%  Similarity=0.393  Sum_probs=241.6

Q ss_pred             CCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeC
Q 001901          113 GPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGG  192 (998)
Q Consensus       113 ~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG  192 (998)
                      .+.||++||......                    ..+.+..||+.++.|..++.+   |.+|..+++++++++||+.||
T Consensus       284 ~~~l~~vGG~~~~~~--------------------~~~~ve~yd~~~~~w~~~a~m---~~~r~~~~~~~~~~~lYv~GG  340 (571)
T KOG4441|consen  284 SGKLVAVGGYNRQGQ--------------------SLRSVECYDPKTNEWSSLAPM---PSPRCRVGVAVLNGKLYVVGG  340 (571)
T ss_pred             CCeEEEECCCCCCCc--------------------ccceeEEecCCcCcEeecCCC---CcccccccEEEECCEEEEEcc
Confidence            578999999986221                    778999999999999999998   899999999999999999999


Q ss_pred             CCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcc
Q 001901          193 IGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLE  272 (998)
Q Consensus       193 ~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~  272 (998)
                      .+.+...++.+|+||+.+++  |+.++   +|+.+|.+|+++++++ .||++||.+|...++.+++||+.++  +|+.++
T Consensus       341 ~~~~~~~l~~ve~YD~~~~~--W~~~a---~M~~~R~~~~v~~l~g-~iYavGG~dg~~~l~svE~YDp~~~--~W~~va  412 (571)
T KOG4441|consen  341 YDSGSDRLSSVERYDPRTNQ--WTPVA---PMNTKRSDFGVAVLDG-KLYAVGGFDGEKSLNSVECYDPVTN--KWTPVA  412 (571)
T ss_pred             ccCCCcccceEEEecCCCCc--eeccC---CccCccccceeEEECC-EEEEEeccccccccccEEEecCCCC--cccccC
Confidence            97555678999999999985  99988   9999999999999998 8999999999999999999999999  999999


Q ss_pred             cCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEccc
Q 001901          273 PEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGA  352 (998)
Q Consensus       273 ~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~  352 (998)
                      ++..    ++..+++++.+++||++||.++...+++.+..||+.++   +|...+++ +.+|.++++++++++||++||.
T Consensus       413 ~m~~----~r~~~gv~~~~g~iYi~GG~~~~~~~l~sve~YDP~t~---~W~~~~~M-~~~R~~~g~a~~~~~iYvvGG~  484 (571)
T KOG4441|consen  413 PMLT----RRSGHGVAVLGGKLYIIGGGDGSSNCLNSVECYDPETN---TWTLIAPM-NTRRSGFGVAVLNGKIYVVGGF  484 (571)
T ss_pred             CCCc----ceeeeEEEEECCEEEEEcCcCCCccccceEEEEcCCCC---ceeecCCc-ccccccceEEEECCEEEEECCc
Confidence            8865    57788888889999999999888878999999999999   88899888 6999999999999999999999


Q ss_pred             CCCCCccccCCeEEEEECCCCeEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEECCEEEEEcCCCCCCCccc
Q 001901          353 LGGGRMVEDSSSVAVLDTAAGVWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAVGDLIFIYGGLRGGVLLDD  432 (998)
Q Consensus       353 ~~~~~~~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~~LyVfGG~~~~~~l~D  432 (998)
                      ++..    ....++.||+.+++|+.+..+                     ..+|..+++++++++||+.||+++..+++.
T Consensus       485 ~~~~----~~~~VE~ydp~~~~W~~v~~m---------------------~~~rs~~g~~~~~~~ly~vGG~~~~~~l~~  539 (571)
T KOG4441|consen  485 DGTS----ALSSVERYDPETNQWTMVAPM---------------------TSPRSAVGVVVLGGKLYAVGGFDGNNNLNT  539 (571)
T ss_pred             cCCC----ccceEEEEcCCCCceeEcccC---------------------ccccccccEEEECCEEEEEecccCccccce
Confidence            8832    256799999999999999877                     569999999999999999999999999999


Q ss_pred             EEEecccccc
Q 001901          433 LLVAEDLAAA  442 (998)
Q Consensus       433 v~~ld~~~~~  442 (998)
                      +..+|...-.
T Consensus       540 ve~ydp~~d~  549 (571)
T KOG4441|consen  540 VECYDPETDT  549 (571)
T ss_pred             eEEcCCCCCc
Confidence            9999765533


No 25 
>TIGR03547 muta_rot_YjhT mutatrotase, YjhT family. Members of this protein family contain multiple copies of the beta-propeller-forming Kelch repeat. All are full-length homologs to YjhT of Escherichia coli, which has been identified as a mutarotase for sialic acid. This protein improves bacterial ability to obtain host sialic acid, and thus serves as a virulence factor. Some bacteria carry what appears to be a cyclically permuted homolog of this protein.
Probab=100.00  E-value=5.5e-31  Score=300.45  Aligned_cols=277  Identities=22%  Similarity=0.286  Sum_probs=212.2

Q ss_pred             CCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEEC--CCCcEEE
Q 001901           87 DGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDV--LTNKWSR  164 (998)
Q Consensus        87 ~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~--~t~~W~~  164 (998)
                      ..|.||..++++++            +++|||+||..                         .+++|+||+  .+++|..
T Consensus         3 ~lp~~~~~~~~~~~------------~~~vyv~GG~~-------------------------~~~~~~~d~~~~~~~W~~   45 (346)
T TIGR03547         3 DLPVGFKNGTGAII------------GDKVYVGLGSA-------------------------GTSWYKLDLKKPSKGWQK   45 (346)
T ss_pred             CCCccccCceEEEE------------CCEEEEEcccc-------------------------CCeeEEEECCCCCCCceE
Confidence            46889999888888            78999999962                         246899996  5788999


Q ss_pred             ecCCCCCC-CCccceEEEEeCCEEEEEeCCCCCC-----CCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEE-EEC
Q 001901          165 ITPFGEPP-TPRAAHVATAVGTMVVIQGGIGPAG-----LSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMA-LVG  237 (998)
Q Consensus       165 l~~~g~~P-~pR~~hsa~~~~~~lyVfGG~~~~~-----~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~-~~~  237 (998)
                      ++.+   | .+|..|++++++++|||+||.....     ..++++|+||+.++  +|+.+.  ..+|.+|.+|+++ +++
T Consensus        46 l~~~---p~~~R~~~~~~~~~~~iYv~GG~~~~~~~~~~~~~~~v~~Yd~~~~--~W~~~~--~~~p~~~~~~~~~~~~~  118 (346)
T TIGR03547        46 IADF---PGGPRNQAVAAAIDGKLYVFGGIGKANSEGSPQVFDDVYRYDPKKN--SWQKLD--TRSPVGLLGASGFSLHN  118 (346)
T ss_pred             CCCC---CCCCcccceEEEECCEEEEEeCCCCCCCCCcceecccEEEEECCCC--EEecCC--CCCCCcccceeEEEEeC
Confidence            9887   6 5899999999999999999985322     24689999999997  499986  2467788888877 566


Q ss_pred             CcEEEEEcCCCCCC----------------------------------CcccEEEEECCCCCceEEEcccCCCCCCCccc
Q 001901          238 QRYLMAIGGNDGKR----------------------------------PLADVWALDTAAKPYEWRKLEPEGEGPPPCMY  283 (998)
Q Consensus       238 ~~~Lyv~GG~~g~~----------------------------------~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~  283 (998)
                      + +||++||.++..                                  .++++++||+.++  +|+.+.+++   ..++.
T Consensus       119 g-~IYviGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~~YDp~t~--~W~~~~~~p---~~~r~  192 (346)
T TIGR03547       119 G-QAYFTGGVNKNIFDGYFADLSAADKDSEPKDKLIAAYFSQPPEDYFWNKNVLSYDPSTN--QWRNLGENP---FLGTA  192 (346)
T ss_pred             C-EEEEEcCcChHHHHHHHhhHhhcCccchhhhhhHHHHhCCChhHcCccceEEEEECCCC--ceeECccCC---CCcCC
Confidence            6 899999986421                                  2478999999999  999997663   22455


Q ss_pred             eEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCc-------ceeEEEEECCEEEEEcccCCCC
Q 001901          284 ATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPR-------YQHAAVFVNARLHVSGGALGGG  356 (998)
Q Consensus       284 ~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR-------~~hsav~~~~~L~V~GG~~~~~  356 (998)
                      +++++..+++|||+||.........+++.|+...+ +.+|...+.+ |.+|       .+|++++++++|||+||.+...
T Consensus       193 ~~~~~~~~~~iyv~GG~~~~~~~~~~~~~y~~~~~-~~~W~~~~~m-~~~r~~~~~~~~~~~a~~~~~~Iyv~GG~~~~~  270 (346)
T TIGR03547       193 GSAIVHKGNKLLLINGEIKPGLRTAEVKQYLFTGG-KLEWNKLPPL-PPPKSSSQEGLAGAFAGISNGVLLVAGGANFPG  270 (346)
T ss_pred             CceEEEECCEEEEEeeeeCCCccchheEEEEecCC-CceeeecCCC-CCCCCCccccccEEeeeEECCEEEEeecCCCCC
Confidence            66677779999999998655434456666654211 2266667665 3443       4677888999999999986321


Q ss_pred             Cc-------------cccCCeEEEEECCCCeEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEECCEEEEEcC
Q 001901          357 RM-------------VEDSSSVAVLDTAAGVWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAVGDLIFIYGG  423 (998)
Q Consensus       357 ~~-------------~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~~LyVfGG  423 (998)
                      ..             ......+++||+++++|+.+..+                     |.+|..+++++++++|||+||
T Consensus       271 ~~~~~~~~~~~~~~~~~~~~~~e~yd~~~~~W~~~~~l---------------------p~~~~~~~~~~~~~~iyv~GG  329 (346)
T TIGR03547       271 AQENYKNGKLYAHEGLIKAWSSEVYALDNGKWSKVGKL---------------------PQGLAYGVSVSWNNGVLLIGG  329 (346)
T ss_pred             chhhhhcCCccccCCCCceeEeeEEEecCCcccccCCC---------------------CCCceeeEEEEcCCEEEEEec
Confidence            10             00124689999999999999877                     668889999999999999999


Q ss_pred             CCC-CCCcccEEEe
Q 001901          424 LRG-GVLLDDLLVA  436 (998)
Q Consensus       424 ~~~-~~~l~Dv~~l  436 (998)
                      .+. +..++|++.+
T Consensus       330 ~~~~~~~~~~v~~~  343 (346)
T TIGR03547       330 ENSGGKAVTDVYLL  343 (346)
T ss_pred             cCCCCCEeeeEEEE
Confidence            875 4778998765


No 26 
>KOG0379 consensus Kelch repeat-containing proteins [General function prediction only]
Probab=99.98  E-value=6.3e-31  Score=310.03  Aligned_cols=297  Identities=31%  Similarity=0.515  Sum_probs=248.9

Q ss_pred             cccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCC-cEEEEECCCCc
Q 001901           83 EKKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATA-DVHCYDVLTNK  161 (998)
Q Consensus        83 ~~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~-dv~~yD~~t~~  161 (998)
                      ...+..|.+|++|+++.+            ++++|||||.......                    .+ |+|+||..+..
T Consensus        52 ~~~~~~p~~R~~hs~~~~------------~~~~~vfGG~~~~~~~--------------------~~~dl~~~d~~~~~   99 (482)
T KOG0379|consen   52 DVLGVGPIPRAGHSAVLI------------GNKLYVFGGYGSGDRL--------------------TDLDLYVLDLESQL   99 (482)
T ss_pred             ccCCCCcchhhccceeEE------------CCEEEEECCCCCCCcc--------------------ccceeEEeecCCcc
Confidence            356789999999999999            7899999998776531                    22 79999999999


Q ss_pred             EEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEE
Q 001901          162 WSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYL  241 (998)
Q Consensus       162 W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~L  241 (998)
                      |......|..|.+|++|++++++++||+|||........++++.||+.+.+  |..+.+.+.+|.+|.+|+++++++ +|
T Consensus       100 w~~~~~~g~~p~~r~g~~~~~~~~~l~lfGG~~~~~~~~~~l~~~d~~t~~--W~~l~~~~~~P~~r~~Hs~~~~g~-~l  176 (482)
T KOG0379|consen  100 WTKPAATGDEPSPRYGHSLSAVGDKLYLFGGTDKKYRNLNELHSLDLSTRT--WSLLSPTGDPPPPRAGHSATVVGT-KL  176 (482)
T ss_pred             cccccccCCCCCcccceeEEEECCeEEEEccccCCCCChhheEeccCCCCc--EEEecCcCCCCCCcccceEEEECC-EE
Confidence            999999999999999999999999999999997656668999999999985  999999999999999999999997 89


Q ss_pred             EEEcCCCCCC-CcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCe
Q 001901          242 MAIGGNDGKR-PLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGR  320 (998)
Q Consensus       242 yv~GG~~g~~-~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~  320 (998)
                      |||||.+... .+||+|+||+.+.  +|.++...+..|.||..|+++++ ++++++|||.+.....++|+|.|+..+   
T Consensus       177 ~vfGG~~~~~~~~ndl~i~d~~~~--~W~~~~~~g~~P~pR~gH~~~~~-~~~~~v~gG~~~~~~~l~D~~~ldl~~---  250 (482)
T KOG0379|consen  177 VVFGGIGGTGDSLNDLHIYDLETS--TWSELDTQGEAPSPRYGHAMVVV-GNKLLVFGGGDDGDVYLNDVHILDLST---  250 (482)
T ss_pred             EEECCccCcccceeeeeeeccccc--cceecccCCCCCCCCCCceEEEE-CCeEEEEeccccCCceecceEeeeccc---
Confidence            9999998866 8999999999999  99999999999999988887777 778888888775555899999999986   


Q ss_pred             EEEEECC--CCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcccCcCCCCCCCCccccCCCC
Q 001901          321 WEWAIAP--GVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKSVVTSPRTGRYSADAAGGD  398 (998)
Q Consensus       321 W~w~~~~--g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~~~~~~~~~~  398 (998)
                      |.|....  +..|.+|+.|+.+..+.+++|+||......  ..+.++|.||.++..|..+.....               
T Consensus       251 ~~W~~~~~~g~~p~~R~~h~~~~~~~~~~l~gG~~~~~~--~~l~~~~~l~~~~~~w~~~~~~~~---------------  313 (482)
T KOG0379|consen  251 WEWKLLPTGGDLPSPRSGHSLTVSGDHLLLFGGGTDPKQ--EPLGDLYGLDLETLVWSKVESVGV---------------  313 (482)
T ss_pred             ceeeeccccCCCCCCcceeeeEEECCEEEEEcCCccccc--ccccccccccccccceeeeecccc---------------
Confidence            5666444  778999999999999999999999876421  237899999999999999988741               


Q ss_pred             CccCCCCcceeEEEEECCE----EEEEcCCC-CCCCcccEEEeccc
Q 001901          399 AAVELTRRCRHAAAAVGDL----IFIYGGLR-GGVLLDDLLVAEDL  439 (998)
Q Consensus       399 ~~~~p~~R~~hsa~~~~~~----LyVfGG~~-~~~~l~Dv~~ld~~  439 (998)
                        ..+.+|..|+++.....    ..++||.. .....++++.+...
T Consensus       314 --~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~  357 (482)
T KOG0379|consen  314 --VRPSPRLGHAAELIDELGKDGLGILGGNQILGERLADVFSLQIK  357 (482)
T ss_pred             --ccccccccccceeeccCCccceeeecCccccccchhhccccccc
Confidence              22568999998888553    44455522 23456666655443


No 27 
>TIGR03548 mutarot_permut cyclically-permuted mutatrotase family protein. Members of this protein family show essentially full-length homology, cyclically permuted, to YjhT from Escherichia coli. YjhT was shown to act as a mutarotase for sialic acid, and by this ability to be able to act as a virulence factor. Members of the YjhT family (TIGR03547) and this cyclically-permuted family have multiple repeats of the beta-propeller-forming Kelch repeat.
Probab=99.98  E-value=1.7e-30  Score=293.62  Aligned_cols=283  Identities=16%  Similarity=0.199  Sum_probs=208.8

Q ss_pred             CCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCC--CcEEEecC
Q 001901           90 GPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLT--NKWSRITP  167 (998)
Q Consensus        90 ~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t--~~W~~l~~  167 (998)
                      ..+.||.+.++            ++.|||+||.+.....         ....|.+  ..++++|+|+...  .+|..+..
T Consensus         2 ~~~~g~~~~~~------------~~~l~v~GG~~~~~~~---------~~~~g~~--~~~~~v~~~~~~~~~~~W~~~~~   58 (323)
T TIGR03548         2 LGVAGCYAGII------------GDYILVAGGCNFPEDP---------LAEGGKK--KNYKGIYIAKDENSNLKWVKDGQ   58 (323)
T ss_pred             CceeeEeeeEE------------CCEEEEeeccCCCCCc---------hhhCCcE--EeeeeeEEEecCCCceeEEEccc
Confidence            45778888888            7999999999764310         0001111  2778999996333  37999887


Q ss_pred             CCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceE-EeeecCCCCCCCcccEEEEECCcEEEEEcC
Q 001901          168 FGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWH-RVVVQGPGPGPRYGHVMALVGQRYLMAIGG  246 (998)
Q Consensus       168 ~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~-~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG  246 (998)
                      +   |.+|..|++++++++||++||.... ..++++++||+.++.  |. .+...+++|.+|..|+++++++ +|||+||
T Consensus        59 l---p~~r~~~~~~~~~~~lyviGG~~~~-~~~~~v~~~d~~~~~--w~~~~~~~~~lp~~~~~~~~~~~~~-~iYv~GG  131 (323)
T TIGR03548        59 L---PYEAAYGASVSVENGIYYIGGSNSS-ERFSSVYRITLDESK--EELICETIGNLPFTFENGSACYKDG-TLYVGGG  131 (323)
T ss_pred             C---CccccceEEEEECCEEEEEcCCCCC-CCceeEEEEEEcCCc--eeeeeeEcCCCCcCccCceEEEECC-EEEEEeC
Confidence            6   8899989999999999999998643 356899999998875  52 2233348999999999999987 8999999


Q ss_pred             CCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEEC
Q 001901          247 NDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIA  326 (998)
Q Consensus       247 ~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~  326 (998)
                      ......++++|+||+.++  +|+++++++.   .++.+++++..+++||||||.++..  ..+++.|++.++   +|..+
T Consensus       132 ~~~~~~~~~v~~yd~~~~--~W~~~~~~p~---~~r~~~~~~~~~~~iYv~GG~~~~~--~~~~~~yd~~~~---~W~~~  201 (323)
T TIGR03548       132 NRNGKPSNKSYLFNLETQ--EWFELPDFPG---EPRVQPVCVKLQNELYVFGGGSNIA--YTDGYKYSPKKN---QWQKV  201 (323)
T ss_pred             cCCCccCceEEEEcCCCC--CeeECCCCCC---CCCCcceEEEECCEEEEEcCCCCcc--ccceEEEecCCC---eeEEC
Confidence            876667899999999999  9999976532   1344555667799999999986543  467899999877   55555


Q ss_pred             CCC----CCCCcceeEE-EEECCEEEEEcccCCCCC----------------------------ccccCCeEEEEECCCC
Q 001901          327 PGV----SPSPRYQHAA-VFVNARLHVSGGALGGGR----------------------------MVEDSSSVAVLDTAAG  373 (998)
Q Consensus       327 ~g~----~P~pR~~hsa-v~~~~~L~V~GG~~~~~~----------------------------~~~~~~dv~vyD~~t~  373 (998)
                      +.+    .|..+..+++ ++.+++|||+||.+....                            .....+++++||+.++
T Consensus       202 ~~~~~~~~p~~~~~~~~~~~~~~~iyv~GG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~~yd~~~~  281 (323)
T TIGR03548       202 ADPTTDSEPISLLGAASIKINESLLLCIGGFNKDVYNDAVIDLATMKDESLKGYKKEYFLKPPEWYNWNRKILIYNVRTG  281 (323)
T ss_pred             CCCCCCCCceeccceeEEEECCCEEEEECCcCHHHHHHHHhhhhhccchhhhhhHHHHhCCCccccCcCceEEEEECCCC
Confidence            543    2334444544 445789999999864210                            0011367999999999


Q ss_pred             eEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEECCEEEEEcCCCC-CCCccc
Q 001901          374 VWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAVGDLIFIYGGLRG-GVLLDD  432 (998)
Q Consensus       374 ~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~~LyVfGG~~~-~~~l~D  432 (998)
                      +|+.++.++                    ..+|..++++.++++||++||... +.+..+
T Consensus       282 ~W~~~~~~p--------------------~~~r~~~~~~~~~~~iyv~GG~~~pg~rt~~  321 (323)
T TIGR03548       282 KWKSIGNSP--------------------FFARCGAALLLTGNNIFSINGELKPGVRTPD  321 (323)
T ss_pred             eeeEccccc--------------------ccccCchheEEECCEEEEEeccccCCcCCcC
Confidence            999998651                    148999999999999999999643 344443


No 28 
>PLN02153 epithiospecifier protein
Probab=99.98  E-value=2.7e-30  Score=294.02  Aligned_cols=260  Identities=25%  Similarity=0.398  Sum_probs=201.5

Q ss_pred             CCCcEEEecCC-CCCCCCccceEEEEeCCEEEEEeCCCCC-CCCcccEEEEEcCCCCCceEEeeecCCCCCC-CcccEEE
Q 001901          158 LTNKWSRITPF-GEPPTPRAAHVATAVGTMVVIQGGIGPA-GLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP-RYGHVMA  234 (998)
Q Consensus       158 ~t~~W~~l~~~-g~~P~pR~~hsa~~~~~~lyVfGG~~~~-~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~-R~~hs~~  234 (998)
                      ....|.++... +..|.||.+|++++++++|||+||.... ....+++|+||+.++  +|+.+++.+..|.. +.+|+++
T Consensus         5 ~~~~W~~~~~~~~~~P~pR~~h~~~~~~~~iyv~GG~~~~~~~~~~~~~~yd~~~~--~W~~~~~~~~~p~~~~~~~~~~   82 (341)
T PLN02153          5 LQGGWIKVEQKGGKGPGPRCSHGIAVVGDKLYSFGGELKPNEHIDKDLYVFDFNTH--TWSIAPANGDVPRISCLGVRMV   82 (341)
T ss_pred             cCCeEEEecCCCCCCCCCCCcceEEEECCEEEEECCccCCCCceeCcEEEEECCCC--EEEEcCccCCCCCCccCceEEE
Confidence            45679999874 3469999999999999999999998532 334689999999997  59998865555543 4588999


Q ss_pred             EECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCC--CCCCCccceEEEEEeCCEEEEEeccCCCC-----CCc
Q 001901          235 LVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEG--EGPPPCMYATASARSDGLLLLCGGRDASS-----VPL  307 (998)
Q Consensus       235 ~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~--~~P~~r~~~~a~~~~~~~lyvfGG~~~~~-----~~~  307 (998)
                      ++++ +||+|||.++...++++++||+.++  +|+.+..+.  ..|.+|..|++ ++.+++||||||.+...     ..+
T Consensus        83 ~~~~-~iyv~GG~~~~~~~~~v~~yd~~t~--~W~~~~~~~~~~~p~~R~~~~~-~~~~~~iyv~GG~~~~~~~~~~~~~  158 (341)
T PLN02153         83 AVGT-KLYIFGGRDEKREFSDFYSYDTVKN--EWTFLTKLDEEGGPEARTFHSM-ASDENHVYVFGGVSKGGLMKTPERF  158 (341)
T ss_pred             EECC-EEEEECCCCCCCccCcEEEEECCCC--EEEEeccCCCCCCCCCceeeEE-EEECCEEEEECCccCCCccCCCccc
Confidence            9998 8999999988778899999999999  999987653  23556666655 55699999999986432     235


Q ss_pred             ccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCC----CCccccCCeEEEEECCCCeEEEcccCcC
Q 001901          308 ASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGG----GRMVEDSSSVAVLDTAAGVWCDTKSVVT  383 (998)
Q Consensus       308 ~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~----~~~~~~~~dv~vyD~~t~~W~~v~~~~~  383 (998)
                      ++++.|++.++ +|+.....+.+|.+|.+|++++++++|||+||....    +......+++++||+.+++|+++...+.
T Consensus       159 ~~v~~yd~~~~-~W~~l~~~~~~~~~r~~~~~~~~~~~iyv~GG~~~~~~~gG~~~~~~~~v~~yd~~~~~W~~~~~~g~  237 (341)
T PLN02153        159 RTIEAYNIADG-KWVQLPDPGENFEKRGGAGFAVVQGKIWVVYGFATSILPGGKSDYESNAVQFFDPASGKWTEVETTGA  237 (341)
T ss_pred             ceEEEEECCCC-eEeeCCCCCCCCCCCCcceEEEECCeEEEEeccccccccCCccceecCceEEEEcCCCcEEeccccCC
Confidence            78999998877 444333333346789999999999999999997531    1111226789999999999999876522


Q ss_pred             CCCCCCCccccCCCCCccCCCCcceeEEEEECCEEEEEcCCC---------CCCCcccEEEecccccc
Q 001901          384 SPRTGRYSADAAGGDAAVELTRRCRHAAAAVGDLIFIYGGLR---------GGVLLDDLLVAEDLAAA  442 (998)
Q Consensus       384 ~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~~LyVfGG~~---------~~~~l~Dv~~ld~~~~~  442 (998)
                                        .|.+|..|++++++++||||||..         .+.+++|+|.||.....
T Consensus       238 ------------------~P~~r~~~~~~~~~~~iyv~GG~~~~~~~~~~~~~~~~n~v~~~d~~~~~  287 (341)
T PLN02153        238 ------------------KPSARSVFAHAVVGKYIIIFGGEVWPDLKGHLGPGTLSNEGYALDTETLV  287 (341)
T ss_pred             ------------------CCCCcceeeeEEECCEEEEECcccCCccccccccccccccEEEEEcCccE
Confidence                              256899999999999999999963         23567899999976543


No 29 
>KOG4693 consensus Uncharacterized conserved protein, contains kelch repeat [General function prediction only]
Probab=99.98  E-value=1.6e-31  Score=272.92  Aligned_cols=228  Identities=24%  Similarity=0.374  Sum_probs=205.1

Q ss_pred             CCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEec
Q 001901           87 DGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRIT  166 (998)
Q Consensus        87 ~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l~  166 (998)
                      ..|..|+|||.+.+            .+++||+||.+..++                    ..|-+|+||+.++.|.+..
T Consensus        74 ~VPyqRYGHtvV~y------------~d~~yvWGGRND~eg--------------------aCN~Ly~fDp~t~~W~~p~  121 (392)
T KOG4693|consen   74 AVPYQRYGHTVVEY------------QDKAYVWGGRNDDEG--------------------ACNLLYEFDPETNVWKKPE  121 (392)
T ss_pred             ccchhhcCceEEEE------------cceEEEEcCccCccc--------------------ccceeeeeccccccccccc
Confidence            46889999999999            799999999998775                    8899999999999999999


Q ss_pred             CCCCCCCCccceEEEEeCCEEEEEeCCCCC-CCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEc
Q 001901          167 PFGEPPTPRAAHVATAVGTMVVIQGGIGPA-GLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIG  245 (998)
Q Consensus       167 ~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~-~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~G  245 (998)
                      ..|-.|.+|.+|++|++++.+|||||+.+. ...++|++.+|+.+.+  |+.+.+.|..|.=|..|+++++++ .+||||
T Consensus       122 v~G~vPgaRDGHsAcV~gn~MyiFGGye~~a~~FS~d~h~ld~~Tmt--Wr~~~Tkg~PprwRDFH~a~~~~~-~MYiFG  198 (392)
T KOG4693|consen  122 VEGFVPGARDGHSACVWGNQMYIFGGYEEDAQRFSQDTHVLDFATMT--WREMHTKGDPPRWRDFHTASVIDG-MMYIFG  198 (392)
T ss_pred             eeeecCCccCCceeeEECcEEEEecChHHHHHhhhccceeEecccee--eeehhccCCCchhhhhhhhhhccc-eEEEec
Confidence            999999999999999999999999998643 4567999999999985  999999999999999999999997 899999


Q ss_pred             CCCC---------CCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCC-CCcccEEEEec
Q 001901          246 GNDG---------KRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASS-VPLASAYGLAK  315 (998)
Q Consensus       246 G~~g---------~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~-~~~~dv~~~~~  315 (998)
                      |...         ..+.+.+-.||+.+.  .|......+..|..|+.|++.++ +++||+|||+++.- ..++|+|.|++
T Consensus       199 GR~D~~gpfHs~~e~Yc~~i~~ld~~T~--aW~r~p~~~~~P~GRRSHS~fvY-ng~~Y~FGGYng~ln~HfndLy~FdP  275 (392)
T KOG4693|consen  199 GRSDESGPFHSIHEQYCDTIMALDLATG--AWTRTPENTMKPGGRRSHSTFVY-NGKMYMFGGYNGTLNVHFNDLYCFDP  275 (392)
T ss_pred             cccccCCCccchhhhhcceeEEEecccc--ccccCCCCCcCCCcccccceEEE-cceEEEecccchhhhhhhcceeeccc
Confidence            9843         234677889999999  99999888888999999987776 99999999997643 46899999999


Q ss_pred             CCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccC
Q 001901          316 HRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGAL  353 (998)
Q Consensus       316 ~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~  353 (998)
                      .+. .|....+.+.-|.+|..+++++.++++|+|||..
T Consensus       276 ~t~-~W~~I~~~Gk~P~aRRRqC~~v~g~kv~LFGGTs  312 (392)
T KOG4693|consen  276 KTS-MWSVISVRGKYPSARRRQCSVVSGGKVYLFGGTS  312 (392)
T ss_pred             ccc-hheeeeccCCCCCcccceeEEEECCEEEEecCCC
Confidence            876 8998999998899999999999999999999964


No 30 
>PHA02713 hypothetical protein; Provisional
Probab=99.98  E-value=1.4e-30  Score=312.83  Aligned_cols=247  Identities=13%  Similarity=0.137  Sum_probs=207.9

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCc
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRY  229 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~  229 (998)
                      ..+++||+.+++|..++++   |.+|..|++++++++|||+||........+++++||+.++.  |..++   +||.+|.
T Consensus       272 ~~v~~yd~~~~~W~~l~~m---p~~r~~~~~a~l~~~IYviGG~~~~~~~~~~v~~Yd~~~n~--W~~~~---~m~~~R~  343 (557)
T PHA02713        272 PCILVYNINTMEYSVISTI---PNHIINYASAIVDNEIIIAGGYNFNNPSLNKVYKINIENKI--HVELP---PMIKNRC  343 (557)
T ss_pred             CCEEEEeCCCCeEEECCCC---CccccceEEEEECCEEEEEcCCCCCCCccceEEEEECCCCe--EeeCC---CCcchhh
Confidence            4789999999999999887   88999999999999999999975444557899999999974  99887   8999999


Q ss_pred             ccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCC-----
Q 001901          230 GHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASS-----  304 (998)
Q Consensus       230 ~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~-----  304 (998)
                      .|+++++++ +||++||.++...++++++||+.++  +|+.+++++.   +|..+ ++++.+++||++||.++..     
T Consensus       344 ~~~~~~~~g-~IYviGG~~~~~~~~sve~Ydp~~~--~W~~~~~mp~---~r~~~-~~~~~~g~IYviGG~~~~~~~~~~  416 (557)
T PHA02713        344 RFSLAVIDD-TIYAIGGQNGTNVERTIECYTMGDD--KWKMLPDMPI---ALSSY-GMCVLDQYIYIIGGRTEHIDYTSV  416 (557)
T ss_pred             ceeEEEECC-EEEEECCcCCCCCCceEEEEECCCC--eEEECCCCCc---ccccc-cEEEECCEEEEEeCCCcccccccc
Confidence            999999998 8999999988777899999999999  9999987644   35444 4556699999999986431     


Q ss_pred             ------------CCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCC
Q 001901          305 ------------VPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAA  372 (998)
Q Consensus       305 ------------~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t  372 (998)
                                  ..++.++.|++.++   +|..++++ +.+|..+++++++++|||+||.++...   ..+.+++||+++
T Consensus       417 ~~~~~~~~~~~~~~~~~ve~YDP~td---~W~~v~~m-~~~r~~~~~~~~~~~IYv~GG~~~~~~---~~~~ve~Ydp~~  489 (557)
T PHA02713        417 HHMNSIDMEEDTHSSNKVIRYDTVNN---IWETLPNF-WTGTIRPGVVSHKDDIYVVCDIKDEKN---VKTCIFRYNTNT  489 (557)
T ss_pred             cccccccccccccccceEEEECCCCC---eEeecCCC-CcccccCcEEEECCEEEEEeCCCCCCc---cceeEEEecCCC
Confidence                        12578999999988   77777776 688999999999999999999875332   135689999999


Q ss_pred             -CeEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEECCEEEEEcCCCCCCCcccEEEecccccc
Q 001901          373 -GVWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAVGDLIFIYGGLRGGVLLDDLLVAEDLAAA  442 (998)
Q Consensus       373 -~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~~LyVfGG~~~~~~l~Dv~~ld~~~~~  442 (998)
                       ++|+.++.+                     |.+|..+++++++++||++||+++.   .++.++|...-.
T Consensus       490 ~~~W~~~~~m---------------------~~~r~~~~~~~~~~~iyv~Gg~~~~---~~~e~yd~~~~~  536 (557)
T PHA02713        490 YNGWELITTT---------------------ESRLSALHTILHDNTIMMLHCYESY---MLQDTFNVYTYE  536 (557)
T ss_pred             CCCeeEcccc---------------------CcccccceeEEECCEEEEEeeecce---eehhhcCccccc
Confidence             899999988                     6799999999999999999998863   356666655433


No 31 
>PRK14131 N-acetylneuraminic acid mutarotase; Provisional
Probab=99.98  E-value=3.4e-30  Score=296.85  Aligned_cols=283  Identities=19%  Similarity=0.243  Sum_probs=213.4

Q ss_pred             cccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECC--CC
Q 001901           83 EKKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVL--TN  160 (998)
Q Consensus        83 ~~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~--t~  160 (998)
                      ......|.||..++++.+            +++|||+||...                         +.+|+||+.  ++
T Consensus        20 ~~l~~lP~~~~~~~~~~~------------~~~iyv~gG~~~-------------------------~~~~~~d~~~~~~   62 (376)
T PRK14131         20 EQLPDLPVPFKNGTGAID------------NNTVYVGLGSAG-------------------------TSWYKLDLNAPSK   62 (376)
T ss_pred             ccCCCCCcCccCCeEEEE------------CCEEEEEeCCCC-------------------------CeEEEEECCCCCC
Confidence            445678999998888887            789999999621                         257899986  47


Q ss_pred             cEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCC-----CCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEE
Q 001901          161 KWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPA-----GLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMAL  235 (998)
Q Consensus       161 ~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~-----~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~  235 (998)
                      +|..++++  +..+|.+|++++++++|||+||....     ...++++|+||+.++  +|+.++.  ..|.+|.+|++++
T Consensus        63 ~W~~l~~~--p~~~r~~~~~v~~~~~IYV~GG~~~~~~~~~~~~~~~v~~YD~~~n--~W~~~~~--~~p~~~~~~~~~~  136 (376)
T PRK14131         63 GWTKIAAF--PGGPREQAVAAFIDGKLYVFGGIGKTNSEGSPQVFDDVYKYDPKTN--SWQKLDT--RSPVGLAGHVAVS  136 (376)
T ss_pred             CeEECCcC--CCCCcccceEEEECCEEEEEcCCCCCCCCCceeEcccEEEEeCCCC--EEEeCCC--CCCCcccceEEEE
Confidence            89999876  12589999999999999999998641     134689999999987  4999872  3477888898877


Q ss_pred             -ECCcEEEEEcCCCCC----------------------------------CCcccEEEEECCCCCceEEEcccCCCCCCC
Q 001901          236 -VGQRYLMAIGGNDGK----------------------------------RPLADVWALDTAAKPYEWRKLEPEGEGPPP  280 (998)
Q Consensus       236 -~~~~~Lyv~GG~~g~----------------------------------~~lndv~~yD~~s~~~~W~~v~~~~~~P~~  280 (998)
                       .++ +||++||.+..                                  ...+++++||+.++  +|+.+.++   |.+
T Consensus       137 ~~~~-~IYv~GG~~~~~~~~~~~d~~~~~~~~~~~~~i~~~~~~~~~~~~~~~~~v~~YD~~t~--~W~~~~~~---p~~  210 (376)
T PRK14131        137 LHNG-KAYITGGVNKNIFDGYFEDLAAAGKDKTPKDKINDAYFDKKPEDYFFNKEVLSYDPSTN--QWKNAGES---PFL  210 (376)
T ss_pred             eeCC-EEEEECCCCHHHHHHHHhhhhhcccchhhhhhhHHHHhcCChhhcCcCceEEEEECCCC--eeeECCcC---CCC
Confidence             555 89999998642                                  12478999999999  99998754   333


Q ss_pred             ccceEEEEEeCCEEEEEeccCCCCCCcccEEEEe--cCCCCeEEEEECCCCCCCCcc--------eeEEEEECCEEEEEc
Q 001901          281 CMYATASARSDGLLLLCGGRDASSVPLASAYGLA--KHRDGRWEWAIAPGVSPSPRY--------QHAAVFVNARLHVSG  350 (998)
Q Consensus       281 r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~--~~~~~~W~w~~~~g~~P~pR~--------~hsav~~~~~L~V~G  350 (998)
                      ++.+++++..+++|||+||.........++|.|.  +..+   +|..++.+ |.+|.        ++.+++++++|||+|
T Consensus       211 ~~~~~a~v~~~~~iYv~GG~~~~~~~~~~~~~~~~~~~~~---~W~~~~~~-p~~~~~~~~~~~~~~~a~~~~~~iyv~G  286 (376)
T PRK14131        211 GTAGSAVVIKGNKLWLINGEIKPGLRTDAVKQGKFTGNNL---KWQKLPDL-PPAPGGSSQEGVAGAFAGYSNGVLLVAG  286 (376)
T ss_pred             CCCcceEEEECCEEEEEeeeECCCcCChhheEEEecCCCc---ceeecCCC-CCCCcCCcCCccceEeceeECCEEEEee
Confidence            4566677778999999999865544455666554  3433   66677655 34442        344678899999999


Q ss_pred             ccCCCCCc-------------cccCCeEEEEECCCCeEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEECCE
Q 001901          351 GALGGGRM-------------VEDSSSVAVLDTAAGVWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAVGDL  417 (998)
Q Consensus       351 G~~~~~~~-------------~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~~  417 (998)
                      |.+.....             ......+++||+++++|+.+..+                     |.+|..|++++++++
T Consensus       287 G~~~~~~~~~~~~~~~~~~~~~~~~~~~e~yd~~~~~W~~~~~l---------------------p~~r~~~~av~~~~~  345 (376)
T PRK14131        287 GANFPGARENYQNGKLYAHEGLKKSWSDEIYALVNGKWQKVGEL---------------------PQGLAYGVSVSWNNG  345 (376)
T ss_pred             ccCCCCChhhhhcCCcccccCCcceeehheEEecCCcccccCcC---------------------CCCccceEEEEeCCE
Confidence            98642210             01123578999999999998877                     678999999999999


Q ss_pred             EEEEcCCCC-CCCcccEEEeccc
Q 001901          418 IFIYGGLRG-GVLLDDLLVAEDL  439 (998)
Q Consensus       418 LyVfGG~~~-~~~l~Dv~~ld~~  439 (998)
                      |||+||... ...++|++.++..
T Consensus       346 iyv~GG~~~~~~~~~~v~~~~~~  368 (376)
T PRK14131        346 VLLIGGETAGGKAVSDVTLLSWD  368 (376)
T ss_pred             EEEEcCCCCCCcEeeeEEEEEEc
Confidence            999999764 4679999988743


No 32 
>KOG4441 consensus Proteins containing BTB/POZ and Kelch domains, involved in regulatory/signal transduction processes [Signal transduction mechanisms; General function prediction only]
Probab=99.97  E-value=5.5e-30  Score=306.62  Aligned_cols=244  Identities=24%  Similarity=0.426  Sum_probs=217.2

Q ss_pred             eeecccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCC-CCCCCCCCCCCCCCCCccccccccCCcEEEEECC
Q 001901           80 AVIEKKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATA-LEGNSAASGTPSSAGSAGIRLAGATADVHCYDVL  158 (998)
Q Consensus        80 ~~~~~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~-~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~  158 (998)
                      ..+......|.+|..|+++++            +++||++||.+. ..                     ..+.+++||+.
T Consensus       311 ~~w~~~a~m~~~r~~~~~~~~------------~~~lYv~GG~~~~~~---------------------~l~~ve~YD~~  357 (571)
T KOG4441|consen  311 NEWSSLAPMPSPRCRVGVAVL------------NGKLYVVGGYDSGSD---------------------RLSSVERYDPR  357 (571)
T ss_pred             CcEeecCCCCcccccccEEEE------------CCEEEEEccccCCCc---------------------ccceEEEecCC
Confidence            344566788999999999999            789999999984 32                     78999999999


Q ss_pred             CCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECC
Q 001901          159 TNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQ  238 (998)
Q Consensus       159 t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~  238 (998)
                      +++|+.++++   ..+|..|++++++++||+.||.+ +...++.+++||+.++  +|+.+.   +|+.+|++|+++++++
T Consensus       358 ~~~W~~~a~M---~~~R~~~~v~~l~g~iYavGG~d-g~~~l~svE~YDp~~~--~W~~va---~m~~~r~~~gv~~~~g  428 (571)
T KOG4441|consen  358 TNQWTPVAPM---NTKRSDFGVAVLDGKLYAVGGFD-GEKSLNSVECYDPVTN--KWTPVA---PMLTRRSGHGVAVLGG  428 (571)
T ss_pred             CCceeccCCc---cCccccceeEEECCEEEEEeccc-cccccccEEEecCCCC--cccccC---CCCcceeeeEEEEECC
Confidence            9999999998   89999999999999999999996 4556789999999998  599997   8999999999999998


Q ss_pred             cEEEEEcCCCCCC-CcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCC
Q 001901          239 RYLMAIGGNDGKR-PLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHR  317 (998)
Q Consensus       239 ~~Lyv~GG~~g~~-~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~  317 (998)
                       +||++||.++.. +++.+++||+.++  +|+.++++..    ++.++++++.+++||++||+++ ...+..++.|++.+
T Consensus       429 -~iYi~GG~~~~~~~l~sve~YDP~t~--~W~~~~~M~~----~R~~~g~a~~~~~iYvvGG~~~-~~~~~~VE~ydp~~  500 (571)
T KOG4441|consen  429 -KLYIIGGGDGSSNCLNSVECYDPETN--TWTLIAPMNT----RRSGFGVAVLNGKIYVVGGFDG-TSALSSVERYDPET  500 (571)
T ss_pred             -EEEEEcCcCCCccccceEEEEcCCCC--ceeecCCccc----ccccceEEEECCEEEEECCccC-CCccceEEEEcCCC
Confidence             899999999877 8999999999999  9999999977    5666667777999999999998 44677899999999


Q ss_pred             CCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcccC
Q 001901          318 DGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKSV  381 (998)
Q Consensus       318 ~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~~  381 (998)
                      +   +|..++++ +.+|..++++.+++++|++||+++...    ++.+..||+.+++|+....+
T Consensus       501 ~---~W~~v~~m-~~~rs~~g~~~~~~~ly~vGG~~~~~~----l~~ve~ydp~~d~W~~~~~~  556 (571)
T KOG4441|consen  501 N---QWTMVAPM-TSPRSAVGVVVLGGKLYAVGGFDGNNN----LNTVECYDPETDTWTEVTEP  556 (571)
T ss_pred             C---ceeEcccC-ccccccccEEEECCEEEEEecccCccc----cceeEEcCCCCCceeeCCCc
Confidence            9   77777665 689999999999999999999877654    78999999999999998874


No 33 
>cd00144 MPP_PPP_family phosphoprotein phosphatases of the metallophosphatase superfamily, metallophosphatase domain. The PPP (phosphoprotein phosphatase) family is one of two known protein phosphatase families specific for serine and threonine.  This family includes: PP1, PP2A, PP2B (calcineurin), PP4, PP5, PP6, PP7, Bsu1, RdgC, PrpE, PrpA/PrpB, and ApA4 hydrolase. The PPP catalytic domain is defined by three conserved motifs (-GDXHG-, -GDXVDRG- and -GNHE-).  The PPP enzyme family is ancient with members found in all eukaryotes, and in most bacterial and archeal genomes.  Dephosphorylation of phosphoserines and phosphothreonines on target proteins plays a central role in the regulation of many cellular processes.  PPPs belong to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate
Probab=99.97  E-value=2.3e-30  Score=277.15  Aligned_cols=218  Identities=47%  Similarity=0.755  Sum_probs=174.7

Q ss_pred             EEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhh
Q 001901          701 KIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINAL  780 (998)
Q Consensus       701 ~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~  780 (998)
                      +|||||||++.+|.++|+.++....+      .+||||||||||+++.||+.+|+.++.. |.++++||||||.+.++..
T Consensus         1 ~~igDiHg~~~~l~~~l~~~~~~~~d------~li~lGD~vdrg~~~~~~l~~l~~~~~~-~~~~~~l~GNHe~~~~~~~   73 (225)
T cd00144           1 YVIGDIHGCLDDLLRLLEKIGFPPND------KLIFLGDYVDRGPDSVEVIDLLLALKIL-PDNVILLRGNHEDMLLNFL   73 (225)
T ss_pred             CEEeCCCCCHHHHHHHHHHhCCCCCC------EEEEECCEeCCCCCcHHHHHHHHHhcCC-CCcEEEEccCchhhhhhhh
Confidence            58999999999999999999886554      8999999999999999999999999888 8899999999999998887


Q ss_pred             cCChHHHH-----HHhCCCcchhhhhhhhhhhcccceeEEEcC-eEEEecCCccCcccCHHhhhhccCCcccCCCCccee
Q 001901          781 FGFRIECI-----ERMGERDGIWAWHRINRLFNWLPLAALIEK-KIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLM  854 (998)
Q Consensus       781 ~gf~~e~~-----~~~g~~~~~~~~~~~~~~f~~LP~aa~i~~-~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~  854 (998)
                      +++..+..     ..........++..+.++|..||+++.++. +++|||||+.+.....+++.      ..+ ......
T Consensus        74 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~lp~~~~~~~~~~~~vHag~~~~~~~~~~~~------~~~-~~~~~~  146 (225)
T cd00144          74 YGFYDEDEWIGGTLRLLKKLGEDLWEEFNDVFFYLPLAALIETKKVLCVHGGLSPGLPLEEQIK------EEP-EDQLPE  146 (225)
T ss_pred             cCCcchhhccchhHHHHHhhCHHHHHHHHHHHHhCcHheEeCCCeEEEEeCCCCCccchHHhhh------cCc-ccccce
Confidence            77664421     001111234577888899999999999987 99999999998866554444      111 123678


Q ss_pred             ccccCCCCCCCCCCCcccCCCCCCceeeCHHHHHHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCe
Q 001901          855 DLLWSDPTENDSVEGLRPNARGPGLVTFGPDRVMEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNA  934 (998)
Q Consensus       855 dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~  934 (998)
                      +++|++|....  .....+.|+.     |+++++.|++.++.++|||||+++..|+.....+++|||+|++.|++..+|.
T Consensus       147 ~~lw~r~~~~~--~~~~~~~~~~-----~~~~~~~~~~~~~~~~ii~GHt~~~~~~~~~~~~~~i~IDtg~~~~~~~~~~  219 (225)
T cd00144         147 DLLWSDPLELP--GGFGSSRRGG-----GPDAVEWFLKKNGLKLIVRGHTPVEEGYEFGHDGNLITIDSGCNYCGGGGNK  219 (225)
T ss_pred             eeeecCCCCCC--CCCcCCCCCC-----CHHHHHHHHHHCCCeEEEEcCccccCccEEcCCCCEEEEecCCcccCCCCcc
Confidence            99999997532  2222333433     8999999999999999999999999998767789999999999998877777


Q ss_pred             EEEEE
Q 001901          935 GAILV  939 (998)
Q Consensus       935 ga~l~  939 (998)
                      .+++.
T Consensus       220 l~~~~  224 (225)
T cd00144         220 LAALV  224 (225)
T ss_pred             EEEEe
Confidence            77654


No 34 
>KOG1230 consensus Protein containing repeated kelch motifs [General function prediction only]
Probab=99.97  E-value=4.2e-30  Score=276.80  Aligned_cols=267  Identities=27%  Similarity=0.473  Sum_probs=220.9

Q ss_pred             eeecccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCC
Q 001901           80 AVIEKKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLT  159 (998)
Q Consensus        80 ~~~~~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t  159 (998)
                      .+.+....+|.||.+.++++-+.          .+.|++|||...+....                 -+++|+|.||+.+
T Consensus        55 ~~~e~~~~~PspRsn~sl~~nPe----------keELilfGGEf~ngqkT-----------------~vYndLy~Yn~k~  107 (521)
T KOG1230|consen   55 HVVETSVPPPSPRSNPSLFANPE----------KEELILFGGEFYNGQKT-----------------HVYNDLYSYNTKK  107 (521)
T ss_pred             eeeeccCCCCCCCCCcceeeccC----------cceeEEecceeecceeE-----------------EEeeeeeEEeccc
Confidence            34566778999999999999754          56899999987654321                 1899999999999


Q ss_pred             CcEEEecCCCCCCCCccceEEEEeC-CEEEEEeCCCC--C---CCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEE
Q 001901          160 NKWSRITPFGEPPTPRAAHVATAVG-TMVVIQGGIGP--A---GLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVM  233 (998)
Q Consensus       160 ~~W~~l~~~g~~P~pR~~hsa~~~~-~~lyVfGG~~~--~---~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~  233 (998)
                      ++|+++..- +.|.||++|.++++. +.+|+|||.-.  .   .....|+|+||+.++  +|.++...| .|.+|.+|-|
T Consensus       108 ~eWkk~~sp-n~P~pRsshq~va~~s~~l~~fGGEfaSPnq~qF~HYkD~W~fd~~tr--kweql~~~g-~PS~RSGHRM  183 (521)
T KOG1230|consen  108 NEWKKVVSP-NAPPPRSSHQAVAVPSNILWLFGGEFASPNQEQFHHYKDLWLFDLKTR--KWEQLEFGG-GPSPRSGHRM  183 (521)
T ss_pred             cceeEeccC-CCcCCCccceeEEeccCeEEEeccccCCcchhhhhhhhheeeeeeccc--hheeeccCC-CCCCCcccee
Confidence            999999643 469999999999996 79999999532  1   234699999999998  599998665 7999999999


Q ss_pred             EEECCcEEEEEcCCCC----CCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCC-------
Q 001901          234 ALVGQRYLMAIGGNDG----KRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDA-------  302 (998)
Q Consensus       234 ~~~~~~~Lyv~GG~~g----~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~-------  302 (998)
                      +++.. +|++|||+..    ..|+||+|+||+.+-  +|+++.+.+..|.+|.++...+..++.|||.||+..       
T Consensus       184 vawK~-~lilFGGFhd~nr~y~YyNDvy~FdLdty--kW~Klepsga~PtpRSGcq~~vtpqg~i~vyGGYsK~~~kK~~  260 (521)
T KOG1230|consen  184 VAWKR-QLILFGGFHDSNRDYIYYNDVYAFDLDTY--KWSKLEPSGAGPTPRSGCQFSVTPQGGIVVYGGYSKQRVKKDV  260 (521)
T ss_pred             EEeee-eEEEEcceecCCCceEEeeeeEEEeccce--eeeeccCCCCCCCCCCcceEEecCCCcEEEEcchhHhhhhhhh
Confidence            99998 8999999954    346999999999888  999999988889999999888888999999999742       


Q ss_pred             -CCCCcccEEEEecCC--CCeEEEEECC--CCCCCCcceeEEEEEC-CEEEEEcccCCCC-----CccccCCeEEEEECC
Q 001901          303 -SSVPLASAYGLAKHR--DGRWEWAIAP--GVSPSPRYQHAAVFVN-ARLHVSGGALGGG-----RMVEDSSSVAVLDTA  371 (998)
Q Consensus       303 -~~~~~~dv~~~~~~~--~~~W~w~~~~--g~~P~pR~~hsav~~~-~~L~V~GG~~~~~-----~~~~~~~dv~vyD~~  371 (998)
                       .+...+|+|.+++..  ..+|.|..+.  ++.|.||.++++++.. ++-+.|||..+-.     -.....|++|.||+.
T Consensus       261 dKG~~hsDmf~L~p~~~~~dKw~W~kvkp~g~kPspRsgfsv~va~n~kal~FGGV~D~eeeeEsl~g~F~NDLy~fdlt  340 (521)
T KOG1230|consen  261 DKGTRHSDMFLLKPEDGREDKWVWTKVKPSGVKPSPRSGFSVAVAKNHKALFFGGVCDLEEEEESLSGEFFNDLYFFDLT  340 (521)
T ss_pred             hcCceeeeeeeecCCcCCCcceeEeeccCCCCCCCCCCceeEEEecCCceEEecceecccccchhhhhhhhhhhhheecc
Confidence             345689999998876  4589998886  6889999999999885 5999999986511     111348999999999


Q ss_pred             CCeEEEccc
Q 001901          372 AGVWCDTKS  380 (998)
Q Consensus       372 t~~W~~v~~  380 (998)
                      .++|.....
T Consensus       341 ~nrW~~~ql  349 (521)
T KOG1230|consen  341 RNRWSEGQL  349 (521)
T ss_pred             cchhhHhhh
Confidence            999987643


No 35 
>PHA02713 hypothetical protein; Provisional
Probab=99.97  E-value=2.7e-29  Score=301.82  Aligned_cols=241  Identities=11%  Similarity=0.120  Sum_probs=200.5

Q ss_pred             ecccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCc
Q 001901           82 IEKKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNK  161 (998)
Q Consensus        82 ~~~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~  161 (998)
                      +......|.+|.+|+++++            +++||++||......                    .++++++||+.+++
T Consensus       284 W~~l~~mp~~r~~~~~a~l------------~~~IYviGG~~~~~~--------------------~~~~v~~Yd~~~n~  331 (557)
T PHA02713        284 YSVISTIPNHIINYASAIV------------DNEIIIAGGYNFNNP--------------------SLNKVYKINIENKI  331 (557)
T ss_pred             EEECCCCCccccceEEEEE------------CCEEEEEcCCCCCCC--------------------ccceEEEEECCCCe
Confidence            3445578899999999988            799999999753221                    56899999999999


Q ss_pred             EEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEE
Q 001901          162 WSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYL  241 (998)
Q Consensus       162 W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~L  241 (998)
                      |..++++   |.+|..|++++++++||++||.+. ....+++++||+.+++  |+.++   ++|.+|.+|+++++++ +|
T Consensus       332 W~~~~~m---~~~R~~~~~~~~~g~IYviGG~~~-~~~~~sve~Ydp~~~~--W~~~~---~mp~~r~~~~~~~~~g-~I  401 (557)
T PHA02713        332 HVELPPM---IKNRCRFSLAVIDDTIYAIGGQNG-TNVERTIECYTMGDDK--WKMLP---DMPIALSSYGMCVLDQ-YI  401 (557)
T ss_pred             EeeCCCC---cchhhceeEEEECCEEEEECCcCC-CCCCceEEEEECCCCe--EEECC---CCCcccccccEEEECC-EE
Confidence            9999887   899999999999999999999853 3456889999999984  99988   8999999999999987 89


Q ss_pred             EEEcCCCCCC------------------CcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCC
Q 001901          242 MAIGGNDGKR------------------PLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDAS  303 (998)
Q Consensus       242 yv~GG~~g~~------------------~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~  303 (998)
                      |++||.++..                  .++.+++||+.++  +|+.++++..   +|. .+++++.+++||++||.++.
T Consensus       402 YviGG~~~~~~~~~~~~~~~~~~~~~~~~~~~ve~YDP~td--~W~~v~~m~~---~r~-~~~~~~~~~~IYv~GG~~~~  475 (557)
T PHA02713        402 YIIGGRTEHIDYTSVHHMNSIDMEEDTHSSNKVIRYDTVNN--IWETLPNFWT---GTI-RPGVVSHKDDIYVVCDIKDE  475 (557)
T ss_pred             EEEeCCCcccccccccccccccccccccccceEEEECCCCC--eEeecCCCCc---ccc-cCcEEEECCEEEEEeCCCCC
Confidence            9999986421                  3678999999999  9999988754   244 45566779999999998754


Q ss_pred             CCCcccEEEEecCC-CCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcccC
Q 001901          304 SVPLASAYGLAKHR-DGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKSV  381 (998)
Q Consensus       304 ~~~~~dv~~~~~~~-~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~~  381 (998)
                      ....+.++.|++.+ +   +|..++.+ |.+|..+++++++++|||+||+++.       .++++||+.|++|+.+.+.
T Consensus       476 ~~~~~~ve~Ydp~~~~---~W~~~~~m-~~~r~~~~~~~~~~~iyv~Gg~~~~-------~~~e~yd~~~~~W~~~~~~  543 (557)
T PHA02713        476 KNVKTCIFRYNTNTYN---GWELITTT-ESRLSALHTILHDNTIMMLHCYESY-------MLQDTFNVYTYEWNHICHQ  543 (557)
T ss_pred             CccceeEEEecCCCCC---CeeEcccc-CcccccceeEEECCEEEEEeeecce-------eehhhcCcccccccchhhh
Confidence            43345678999998 6   56666665 7899999999999999999998762       3689999999999988765


No 36 
>KOG0379 consensus Kelch repeat-containing proteins [General function prediction only]
Probab=99.97  E-value=9.2e-29  Score=291.73  Aligned_cols=248  Identities=31%  Similarity=0.496  Sum_probs=217.3

Q ss_pred             CCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcc-cEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEc
Q 001901          167 PFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAE-DLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIG  245 (998)
Q Consensus       167 ~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~-dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~G  245 (998)
                      ..+..|.+|++|+++.+++++|||||........+ |+|+||+.+.  .|......|..|.+|++|+++++++ +||+||
T Consensus        53 ~~~~~p~~R~~hs~~~~~~~~~vfGG~~~~~~~~~~dl~~~d~~~~--~w~~~~~~g~~p~~r~g~~~~~~~~-~l~lfG  129 (482)
T KOG0379|consen   53 VLGVGPIPRAGHSAVLIGNKLYVFGGYGSGDRLTDLDLYVLDLESQ--LWTKPAATGDEPSPRYGHSLSAVGD-KLYLFG  129 (482)
T ss_pred             cCCCCcchhhccceeEECCEEEEECCCCCCCccccceeEEeecCCc--ccccccccCCCCCcccceeEEEECC-eEEEEc
Confidence            45567999999999999999999999865544333 6999999986  5999999999999999999999998 899999


Q ss_pred             CCCC-CCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEE
Q 001901          246 GNDG-KRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWA  324 (998)
Q Consensus       246 G~~g-~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~  324 (998)
                      |.+. ...+++++.||+.+.  +|..+.+.+.+|++|.+|+++++ +++||||||.+.....++++|.|+..+. +|...
T Consensus       130 G~~~~~~~~~~l~~~d~~t~--~W~~l~~~~~~P~~r~~Hs~~~~-g~~l~vfGG~~~~~~~~ndl~i~d~~~~-~W~~~  205 (482)
T KOG0379|consen  130 GTDKKYRNLNELHSLDLSTR--TWSLLSPTGDPPPPRAGHSATVV-GTKLVVFGGIGGTGDSLNDLHIYDLETS-TWSEL  205 (482)
T ss_pred             cccCCCCChhheEeccCCCC--cEEEecCcCCCCCCcccceEEEE-CCEEEEECCccCcccceeeeeeeccccc-cceec
Confidence            9984 666899999999999  99999999998888988888877 6999999999888778999999999877 68888


Q ss_pred             ECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcccCcCCCCCCCCccccCCCCCccCCC
Q 001901          325 IAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKSVVTSPRTGRYSADAAGGDAAVELT  404 (998)
Q Consensus       325 ~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~  404 (998)
                      .+.+..|.||++|++++++++++|+||.+...   .+++|+|+||+.+.+|.++...+                  ..|.
T Consensus       206 ~~~g~~P~pR~gH~~~~~~~~~~v~gG~~~~~---~~l~D~~~ldl~~~~W~~~~~~g------------------~~p~  264 (482)
T KOG0379|consen  206 DTQGEAPSPRYGHAMVVVGNKLLVFGGGDDGD---VYLNDVHILDLSTWEWKLLPTGG------------------DLPS  264 (482)
T ss_pred             ccCCCCCCCCCCceEEEECCeEEEEeccccCC---ceecceEeeecccceeeeccccC------------------CCCC
Confidence            88899999999999999999999999988433   35899999999999999776653                  3377


Q ss_pred             CcceeEEEEECCEEEEEcCCCCC-C-CcccEEEecccccc
Q 001901          405 RRCRHAAAAVGDLIFIYGGLRGG-V-LLDDLLVAEDLAAA  442 (998)
Q Consensus       405 ~R~~hsa~~~~~~LyVfGG~~~~-~-~l~Dv~~ld~~~~~  442 (998)
                      +|++|+.++.+.+++|+||.... . .+.|+|.|+.....
T Consensus       265 ~R~~h~~~~~~~~~~l~gG~~~~~~~~l~~~~~l~~~~~~  304 (482)
T KOG0379|consen  265 PRSGHSLTVSGDHLLLFGGGTDPKQEPLGDLYGLDLETLV  304 (482)
T ss_pred             CcceeeeEEECCEEEEEcCCcccccccccccccccccccc
Confidence            99999999999999999997764 3 79999999987433


No 37 
>PHA03098 kelch-like protein; Provisional
Probab=99.96  E-value=8.8e-28  Score=289.88  Aligned_cols=251  Identities=16%  Similarity=0.250  Sum_probs=207.7

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCc
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRY  229 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~  229 (998)
                      ..+..|+..+.+|..+...   | .+..|+++++++.|||+||........+++++||+.++  +|..++   ++|.+|.
T Consensus       264 ~~~~~~~~~~~~~~~~~~~---~-~~~~~~~~~~~~~lyv~GG~~~~~~~~~~v~~yd~~~~--~W~~~~---~~~~~R~  334 (534)
T PHA03098        264 YNYITNYSPLSEINTIIDI---H-YVYCFGSVVLNNVIYFIGGMNKNNLSVNSVVSYDTKTK--SWNKVP---ELIYPRK  334 (534)
T ss_pred             ceeeecchhhhhcccccCc---c-ccccceEEEECCEEEEECCCcCCCCeeccEEEEeCCCC--eeeECC---CCCcccc
Confidence            3456788888899988643   3 35567999999999999998766667789999999987  498887   8899999


Q ss_pred             ccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCccc
Q 001901          230 GHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLAS  309 (998)
Q Consensus       230 ~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~d  309 (998)
                      +|+++++++ +||++||.++...++++++||+.++  +|+.+++++   .+|..+++ +..+++||++||.......+++
T Consensus       335 ~~~~~~~~~-~lyv~GG~~~~~~~~~v~~yd~~~~--~W~~~~~lp---~~r~~~~~-~~~~~~iYv~GG~~~~~~~~~~  407 (534)
T PHA03098        335 NPGVTVFNN-RIYVIGGIYNSISLNTVESWKPGES--KWREEPPLI---FPRYNPCV-VNVNNLIYVIGGISKNDELLKT  407 (534)
T ss_pred             cceEEEECC-EEEEEeCCCCCEecceEEEEcCCCC--ceeeCCCcC---cCCccceE-EEECCEEEEECCcCCCCcccce
Confidence            999999987 8999999987778899999999999  999987764   44655554 5669999999998655556789


Q ss_pred             EEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcccCcCCCCCCC
Q 001901          310 AYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKSVVTSPRTGR  389 (998)
Q Consensus       310 v~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~  389 (998)
                      ++.|++.++   +|...+++ |.+|.+|+++.++++|||+||.+..... ...+.+++||+.+++|+.++.+        
T Consensus       408 v~~yd~~t~---~W~~~~~~-p~~r~~~~~~~~~~~iyv~GG~~~~~~~-~~~~~v~~yd~~~~~W~~~~~~--------  474 (534)
T PHA03098        408 VECFSLNTN---KWSKGSPL-PISHYGGCAIYHDGKIYVIGGISYIDNI-KVYNIVESYNPVTNKWTELSSL--------  474 (534)
T ss_pred             EEEEeCCCC---eeeecCCC-CccccCceEEEECCEEEEECCccCCCCC-cccceEEEecCCCCceeeCCCC--------
Confidence            999999877   66666654 7899999999999999999998654321 2256799999999999999876        


Q ss_pred             CccccCCCCCccCCCCcceeEEEEECCEEEEEcCCCCCCCcccEEEecccccc
Q 001901          390 YSADAAGGDAAVELTRRCRHAAAAVGDLIFIYGGLRGGVLLDDLLVAEDLAAA  442 (998)
Q Consensus       390 ~~~~~~~~~~~~~p~~R~~hsa~~~~~~LyVfGG~~~~~~l~Dv~~ld~~~~~  442 (998)
                                   +.+|..|++++++++|||+||.++....++++++|...-.
T Consensus       475 -------------~~~r~~~~~~~~~~~iyv~GG~~~~~~~~~v~~yd~~~~~  514 (534)
T PHA03098        475 -------------NFPRINASLCIFNNKIYVVGGDKYEYYINEIEVYDDKTNT  514 (534)
T ss_pred             -------------CcccccceEEEECCEEEEEcCCcCCcccceeEEEeCCCCE
Confidence                         5589999999999999999999877778999999866543


No 38 
>PHA03098 kelch-like protein; Provisional
Probab=99.96  E-value=5.9e-27  Score=282.67  Aligned_cols=234  Identities=18%  Similarity=0.282  Sum_probs=193.5

Q ss_pred             CcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEecCCCCC
Q 001901           92 RCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRITPFGEP  171 (998)
Q Consensus        92 R~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l~~~g~~  171 (998)
                      +..|+++++            +++||++||......                    ..+++++||+.+++|..++.+   
T Consensus       285 ~~~~~~~~~------------~~~lyv~GG~~~~~~--------------------~~~~v~~yd~~~~~W~~~~~~---  329 (534)
T PHA03098        285 VYCFGSVVL------------NNVIYFIGGMNKNNL--------------------SVNSVVSYDTKTKSWNKVPEL---  329 (534)
T ss_pred             cccceEEEE------------CCEEEEECCCcCCCC--------------------eeccEEEEeCCCCeeeECCCC---
Confidence            445677777            789999999865432                    567999999999999998876   


Q ss_pred             CCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCC-C
Q 001901          172 PTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDG-K  250 (998)
Q Consensus       172 P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g-~  250 (998)
                      |.+|.+|++++++++||++||.. .....+++++||+.+++  |+.++   ++|.+|++|+++.+++ +||++||... .
T Consensus       330 ~~~R~~~~~~~~~~~lyv~GG~~-~~~~~~~v~~yd~~~~~--W~~~~---~lp~~r~~~~~~~~~~-~iYv~GG~~~~~  402 (534)
T PHA03098        330 IYPRKNPGVTVFNNRIYVIGGIY-NSISLNTVESWKPGESK--WREEP---PLIFPRYNPCVVNVNN-LIYVIGGISKND  402 (534)
T ss_pred             CcccccceEEEECCEEEEEeCCC-CCEecceEEEEcCCCCc--eeeCC---CcCcCCccceEEEECC-EEEEECCcCCCC
Confidence            78999999999999999999986 34457899999999874  99887   8999999999999988 8999999743 4


Q ss_pred             CCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCC--CCcccEEEEecCCCCeEEEEECCC
Q 001901          251 RPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASS--VPLASAYGLAKHRDGRWEWAIAPG  328 (998)
Q Consensus       251 ~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~--~~~~dv~~~~~~~~~~W~w~~~~g  328 (998)
                      ..++++++||+.++  +|+.+.++   |.+|..|+ ++..+++||++||.+...  ..++.++.|++.++   +|..++.
T Consensus       403 ~~~~~v~~yd~~t~--~W~~~~~~---p~~r~~~~-~~~~~~~iyv~GG~~~~~~~~~~~~v~~yd~~~~---~W~~~~~  473 (534)
T PHA03098        403 ELLKTVECFSLNTN--KWSKGSPL---PISHYGGC-AIYHDGKIYVIGGISYIDNIKVYNIVESYNPVTN---KWTELSS  473 (534)
T ss_pred             cccceEEEEeCCCC--eeeecCCC---CccccCce-EEEECCEEEEECCccCCCCCcccceEEEecCCCC---ceeeCCC
Confidence            45799999999999  99998765   34455554 555699999999986443  23567999999887   6667765


Q ss_pred             CCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcccC
Q 001901          329 VSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKSV  381 (998)
Q Consensus       329 ~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~~  381 (998)
                      + |.+|..++++.++++|||+||.+...    ..+++++||+++++|+.++..
T Consensus       474 ~-~~~r~~~~~~~~~~~iyv~GG~~~~~----~~~~v~~yd~~~~~W~~~~~~  521 (534)
T PHA03098        474 L-NFPRINASLCIFNNKIYVVGGDKYEY----YINEIEVYDDKTNTWTLFCKF  521 (534)
T ss_pred             C-CcccccceEEEECCEEEEEcCCcCCc----ccceeEEEeCCCCEEEecCCC
Confidence            5 67899999999999999999987543    267899999999999998875


No 39 
>TIGR03548 mutarot_permut cyclically-permuted mutatrotase family protein. Members of this protein family show essentially full-length homology, cyclically permuted, to YjhT from Escherichia coli. YjhT was shown to act as a mutarotase for sialic acid, and by this ability to be able to act as a virulence factor. Members of the YjhT family (TIGR03547) and this cyclically-permuted family have multiple repeats of the beta-propeller-forming Kelch repeat.
Probab=99.95  E-value=4.8e-26  Score=257.27  Aligned_cols=225  Identities=18%  Similarity=0.205  Sum_probs=179.8

Q ss_pred             cccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcE
Q 001901           83 EKKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKW  162 (998)
Q Consensus        83 ~~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W  162 (998)
                      ......|.||..|+++++            +++||++||.....                     .++++++||+.+++|
T Consensus        54 ~~~~~lp~~r~~~~~~~~------------~~~lyviGG~~~~~---------------------~~~~v~~~d~~~~~w  100 (323)
T TIGR03548        54 VKDGQLPYEAAYGASVSV------------ENGIYYIGGSNSSE---------------------RFSSVYRITLDESKE  100 (323)
T ss_pred             EEcccCCccccceEEEEE------------CCEEEEEcCCCCCC---------------------CceeEEEEEEcCCce
Confidence            344578999988888887            78999999986433                     678999999999998


Q ss_pred             ----EEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCC-CCCcccEEEEEC
Q 001901          163 ----SRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGP-GPRYGHVMALVG  237 (998)
Q Consensus       163 ----~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P-~~R~~hs~~~~~  237 (998)
                          +.+++   .|.+|..|++++++++|||+||... +...+++++||+.++  +|+.++   ++| .+|..|++++++
T Consensus       101 ~~~~~~~~~---lp~~~~~~~~~~~~~~iYv~GG~~~-~~~~~~v~~yd~~~~--~W~~~~---~~p~~~r~~~~~~~~~  171 (323)
T TIGR03548       101 ELICETIGN---LPFTFENGSACYKDGTLYVGGGNRN-GKPSNKSYLFNLETQ--EWFELP---DFPGEPRVQPVCVKLQ  171 (323)
T ss_pred             eeeeeEcCC---CCcCccCceEEEECCEEEEEeCcCC-CccCceEEEEcCCCC--CeeECC---CCCCCCCCcceEEEEC
Confidence                44444   4899999999999999999999743 345789999999987  499987   666 479999998888


Q ss_pred             CcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCC--CCCCccceEEEEEeCCEEEEEeccCCCCC----------
Q 001901          238 QRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGE--GPPPCMYATASARSDGLLLLCGGRDASSV----------  305 (998)
Q Consensus       238 ~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~--~P~~r~~~~a~~~~~~~lyvfGG~~~~~~----------  305 (998)
                      + +||||||.++.. ..++++||+.++  +|+.+.++..  .|..+..++++++.+++|||+||.+....          
T Consensus       172 ~-~iYv~GG~~~~~-~~~~~~yd~~~~--~W~~~~~~~~~~~p~~~~~~~~~~~~~~~iyv~GG~~~~~~~~~~~~~~~~  247 (323)
T TIGR03548       172 N-ELYVFGGGSNIA-YTDGYKYSPKKN--QWQKVADPTTDSEPISLLGAASIKINESLLLCIGGFNKDVYNDAVIDLATM  247 (323)
T ss_pred             C-EEEEEcCCCCcc-ccceEEEecCCC--eeEECCCCCCCCCceeccceeEEEECCCEEEEECCcCHHHHHHHHhhhhhc
Confidence            7 899999987643 468999999999  9999987643  23334456666677899999999864310          


Q ss_pred             ---------------------CcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCC
Q 001901          306 ---------------------PLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGG  356 (998)
Q Consensus       306 ---------------------~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~  356 (998)
                                           ..++++.||+.++   +|..++.++..+|..++++.++++|||+||....+
T Consensus       248 ~~~~~~~~~~~~~~~~~~~~~~~~~v~~yd~~~~---~W~~~~~~p~~~r~~~~~~~~~~~iyv~GG~~~pg  316 (323)
T TIGR03548       248 KDESLKGYKKEYFLKPPEWYNWNRKILIYNVRTG---KWKSIGNSPFFARCGAALLLTGNNIFSINGELKPG  316 (323)
T ss_pred             cchhhhhhHHHHhCCCccccCcCceEEEEECCCC---eeeEcccccccccCchheEEECCEEEEEeccccCC
Confidence                                 1257999999988   67776655446899999999999999999986544


No 40 
>PHA02790 Kelch-like protein; Provisional
Probab=99.94  E-value=5.2e-25  Score=261.11  Aligned_cols=207  Identities=18%  Similarity=0.276  Sum_probs=173.6

Q ss_pred             CCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeC
Q 001901          113 GPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGG  192 (998)
Q Consensus       113 ~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG  192 (998)
                      ++.||++||.....                     ..+.+++||+.+++|..++++   |.+|..|++++++++||++||
T Consensus       271 ~~~lyviGG~~~~~---------------------~~~~v~~Ydp~~~~W~~~~~m---~~~r~~~~~v~~~~~iYviGG  326 (480)
T PHA02790        271 GEVVYLIGGWMNNE---------------------IHNNAIAVNYISNNWIPIPPM---NSPRLYASGVPANNKLYVVGG  326 (480)
T ss_pred             CCEEEEEcCCCCCC---------------------cCCeEEEEECCCCEEEECCCC---CchhhcceEEEECCEEEEECC
Confidence            78999999985432                     667899999999999999987   889999999999999999999


Q ss_pred             CCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcc
Q 001901          193 IGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLE  272 (998)
Q Consensus       193 ~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~  272 (998)
                      ...    .+.+++||+.++  +|..++   ++|.+|.+|+++++++ +||++||.++.  .+.+++||+.++  +|+.++
T Consensus       327 ~~~----~~sve~ydp~~n--~W~~~~---~l~~~r~~~~~~~~~g-~IYviGG~~~~--~~~ve~ydp~~~--~W~~~~  392 (480)
T PHA02790        327 LPN----PTSVERWFHGDA--AWVNMP---SLLKPRCNPAVASINN-VIYVIGGHSET--DTTTEYLLPNHD--QWQFGP  392 (480)
T ss_pred             cCC----CCceEEEECCCC--eEEECC---CCCCCCcccEEEEECC-EEEEecCcCCC--CccEEEEeCCCC--EEEeCC
Confidence            742    256899999887  499987   8999999999999988 89999998654  368999999999  999998


Q ss_pred             cCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEccc
Q 001901          273 PEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGA  352 (998)
Q Consensus       273 ~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~  352 (998)
                      ++..   +|..+ ++++.+++||++||.         +..|++.++   +|..++++ |.+|..+++++++++|||+||.
T Consensus       393 ~m~~---~r~~~-~~~~~~~~IYv~GG~---------~e~ydp~~~---~W~~~~~m-~~~r~~~~~~v~~~~IYviGG~  455 (480)
T PHA02790        393 STYY---PHYKS-CALVFGRRLFLVGRN---------AEFYCESSN---TWTLIDDP-IYPRDNPELIIVDNKLLLIGGF  455 (480)
T ss_pred             CCCC---ccccc-eEEEECCEEEEECCc---------eEEecCCCC---cEeEcCCC-CCCccccEEEEECCEEEEECCc
Confidence            7644   35554 555679999999983         456777776   66667665 6899999999999999999998


Q ss_pred             CCCCCccccCCeEEEEECCCCeEEEc
Q 001901          353 LGGGRMVEDSSSVAVLDTAAGVWCDT  378 (998)
Q Consensus       353 ~~~~~~~~~~~dv~vyD~~t~~W~~v  378 (998)
                      ++..    ..+.+++||+.+++|+..
T Consensus       456 ~~~~----~~~~ve~Yd~~~~~W~~~  477 (480)
T PHA02790        456 YRGS----YIDTIEVYNNRTYSWNIW  477 (480)
T ss_pred             CCCc----ccceEEEEECCCCeEEec
Confidence            7432    257899999999999764


No 41 
>KOG1230 consensus Protein containing repeated kelch motifs [General function prediction only]
Probab=99.93  E-value=2.8e-25  Score=239.71  Aligned_cols=248  Identities=23%  Similarity=0.367  Sum_probs=201.4

Q ss_pred             CCCCCccceEEEEeC--CEEEEEeCCCCCC---CCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEE
Q 001901          170 EPPTPRAAHVATAVG--TMVVIQGGIGPAG---LSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAI  244 (998)
Q Consensus       170 ~~P~pR~~hsa~~~~--~~lyVfGG~~~~~---~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~  244 (998)
                      .+|+||.+.++++.-  +.+++|||.-.++   ...+|+|.||+.++.  |..+... ..|.||+.|.++++..+.||+|
T Consensus        62 ~~PspRsn~sl~~nPekeELilfGGEf~ngqkT~vYndLy~Yn~k~~e--Wkk~~sp-n~P~pRsshq~va~~s~~l~~f  138 (521)
T KOG1230|consen   62 PPPSPRSNPSLFANPEKEELILFGGEFYNGQKTHVYNDLYSYNTKKNE--WKKVVSP-NAPPPRSSHQAVAVPSNILWLF  138 (521)
T ss_pred             CCCCCCCCcceeeccCcceeEEecceeecceeEEEeeeeeEEeccccc--eeEeccC-CCcCCCccceeEEeccCeEEEe
Confidence            479999999998873  4999999954333   346999999999985  9988733 5689999999999986699999


Q ss_pred             cCCCC------CCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCC---CCCcccEEEEec
Q 001901          245 GGNDG------KRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDAS---SVPLASAYGLAK  315 (998)
Q Consensus       245 GG~~g------~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~---~~~~~dv~~~~~  315 (998)
                      ||...      ..-+.|+|.||+.++  +|+++...+ .|.+|.+|-+++. ..+|+||||+...   ...+||+|.|+.
T Consensus       139 GGEfaSPnq~qF~HYkD~W~fd~~tr--kweql~~~g-~PS~RSGHRMvaw-K~~lilFGGFhd~nr~y~YyNDvy~FdL  214 (521)
T KOG1230|consen  139 GGEFASPNQEQFHHYKDLWLFDLKTR--KWEQLEFGG-GPSPRSGHRMVAW-KRQLILFGGFHDSNRDYIYYNDVYAFDL  214 (521)
T ss_pred             ccccCCcchhhhhhhhheeeeeeccc--hheeeccCC-CCCCCccceeEEe-eeeEEEEcceecCCCceEEeeeeEEEec
Confidence            99843      123789999999999  999998776 5888988887766 8899999997432   356899999988


Q ss_pred             CCCCeEEEEECCCCCCCCcceeEEEEE-CCEEEEEcccCCCC-----CccccCCeEEEEECCC-----CeEEEcccCcCC
Q 001901          316 HRDGRWEWAIAPGVSPSPRYQHAAVFV-NARLHVSGGALGGG-----RMVEDSSSVAVLDTAA-----GVWCDTKSVVTS  384 (998)
Q Consensus       316 ~~~~~W~w~~~~g~~P~pR~~hsav~~-~~~L~V~GG~~~~~-----~~~~~~~dv~vyD~~t-----~~W~~v~~~~~~  384 (998)
                      .+- +|...+.++.-|.||.+|...+. .+.|||+||++...     ......+|+|.++++.     .+|.++.+.+.+
T Consensus       215 dty-kW~Klepsga~PtpRSGcq~~vtpqg~i~vyGGYsK~~~kK~~dKG~~hsDmf~L~p~~~~~dKw~W~kvkp~g~k  293 (521)
T KOG1230|consen  215 DTY-KWSKLEPSGAGPTPRSGCQFSVTPQGGIVVYGGYSKQRVKKDVDKGTRHSDMFLLKPEDGREDKWVWTKVKPSGVK  293 (521)
T ss_pred             cce-eeeeccCCCCCCCCCCcceEEecCCCcEEEEcchhHhhhhhhhhcCceeeeeeeecCCcCCCcceeEeeccCCCCC
Confidence            754 77777777777999999999888 99999999985321     0012378999999999     899999988665


Q ss_pred             CCCCCCccccCCCCCccCCCCcceeEEEEECC-EEEEEcCCCC---------CCCcccEEEeccccccc
Q 001901          385 PRTGRYSADAAGGDAAVELTRRCRHAAAAVGD-LIFIYGGLRG---------GVLLDDLLVAEDLAAAE  443 (998)
Q Consensus       385 p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~-~LyVfGG~~~---------~~~l~Dv~~ld~~~~~~  443 (998)
                                        |.+|.++++++..+ +-+.|||..+         +.++||+|.+|+.....
T Consensus       294 ------------------PspRsgfsv~va~n~kal~FGGV~D~eeeeEsl~g~F~NDLy~fdlt~nrW  344 (521)
T KOG1230|consen  294 ------------------PSPRSGFSVAVAKNHKALFFGGVCDLEEEEESLSGEFFNDLYFFDLTRNRW  344 (521)
T ss_pred             ------------------CCCCCceeEEEecCCceEEecceecccccchhhhhhhhhhhhheecccchh
Confidence                              56999999999955 9999999654         47899999999765443


No 42 
>PRK14131 N-acetylneuraminic acid mutarotase; Provisional
Probab=99.93  E-value=2.4e-24  Score=248.23  Aligned_cols=247  Identities=22%  Similarity=0.301  Sum_probs=180.8

Q ss_pred             CCC-CCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEe
Q 001901           87 DGP-GPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRI  165 (998)
Q Consensus        87 ~~P-~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l  165 (998)
                      ..| .+|.+|+++++            +++|||+||........               ....++++|+||+.+++|+++
T Consensus        69 ~~p~~~r~~~~~v~~------------~~~IYV~GG~~~~~~~~---------------~~~~~~~v~~YD~~~n~W~~~  121 (376)
T PRK14131         69 AFPGGPREQAVAAFI------------DGKLYVFGGIGKTNSEG---------------SPQVFDDVYKYDPKTNSWQKL  121 (376)
T ss_pred             cCCCCCcccceEEEE------------CCEEEEEcCCCCCCCCC---------------ceeEcccEEEEeCCCCEEEeC
Confidence            445 48999999988            78999999986411000               001578999999999999999


Q ss_pred             cCCCCCCCCccceEEEE-eCCEEEEEeCCCCCC---------------------------------CCcccEEEEEcCCC
Q 001901          166 TPFGEPPTPRAAHVATA-VGTMVVIQGGIGPAG---------------------------------LSAEDLHVLDLTQQ  211 (998)
Q Consensus       166 ~~~g~~P~pR~~hsa~~-~~~~lyVfGG~~~~~---------------------------------~~~~dv~~~Dl~t~  211 (998)
                      +..  .|.+|.+|++++ .+++||++||.....                                 ...+++++||+.++
T Consensus       122 ~~~--~p~~~~~~~~~~~~~~~IYv~GG~~~~~~~~~~~d~~~~~~~~~~~~~i~~~~~~~~~~~~~~~~~v~~YD~~t~  199 (376)
T PRK14131        122 DTR--SPVGLAGHVAVSLHNGKAYITGGVNKNIFDGYFEDLAAAGKDKTPKDKINDAYFDKKPEDYFFNKEVLSYDPSTN  199 (376)
T ss_pred             CCC--CCCcccceEEEEeeCCEEEEECCCCHHHHHHHHhhhhhcccchhhhhhhHHHHhcCChhhcCcCceEEEEECCCC
Confidence            853  377788898887 789999999975310                                 12478999999998


Q ss_pred             CCceEEeeecCCCCC-CCcccEEEEECCcEEEEEcCCCCCC-CcccEEE--EECCCCCceEEEcccCCCCCC---C-ccc
Q 001901          212 RPRWHRVVVQGPGPG-PRYGHVMALVGQRYLMAIGGNDGKR-PLADVWA--LDTAAKPYEWRKLEPEGEGPP---P-CMY  283 (998)
Q Consensus       212 t~~W~~l~~~g~~P~-~R~~hs~~~~~~~~Lyv~GG~~g~~-~lndv~~--yD~~s~~~~W~~v~~~~~~P~---~-r~~  283 (998)
                      .  |+.+.   ++|. +|.+|+++.+++ +|||+||..... ...++|.  ||+.++  +|+.+.+++.++.   + ++.
T Consensus       200 ~--W~~~~---~~p~~~~~~~a~v~~~~-~iYv~GG~~~~~~~~~~~~~~~~~~~~~--~W~~~~~~p~~~~~~~~~~~~  271 (376)
T PRK14131        200 Q--WKNAG---ESPFLGTAGSAVVIKGN-KLWLINGEIKPGLRTDAVKQGKFTGNNL--KWQKLPDLPPAPGGSSQEGVA  271 (376)
T ss_pred             e--eeECC---cCCCCCCCcceEEEECC-EEEEEeeeECCCcCChhheEEEecCCCc--ceeecCCCCCCCcCCcCCccc
Confidence            4  99876   7785 788899888887 899999975422 3455554  466777  9999987754321   1 123


Q ss_pred             eEEEEEeCCEEEEEeccCCCCC----------------CcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEE
Q 001901          284 ATASARSDGLLLLCGGRDASSV----------------PLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLH  347 (998)
Q Consensus       284 ~~a~~~~~~~lyvfGG~~~~~~----------------~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~  347 (998)
                      ++.+++.+++|||+||.+....                ....+..|++.++   +|..+..+ |.+|..++++.++++||
T Consensus       272 ~~~a~~~~~~iyv~GG~~~~~~~~~~~~~~~~~~~~~~~~~~~e~yd~~~~---~W~~~~~l-p~~r~~~~av~~~~~iy  347 (376)
T PRK14131        272 GAFAGYSNGVLLVAGGANFPGARENYQNGKLYAHEGLKKSWSDEIYALVNG---KWQKVGEL-PQGLAYGVSVSWNNGVL  347 (376)
T ss_pred             eEeceeECCEEEEeeccCCCCChhhhhcCCcccccCCcceeehheEEecCC---cccccCcC-CCCccceEEEEeCCEEE
Confidence            3445667999999999753210                1123556777766   55566554 78999999999999999


Q ss_pred             EEcccCCCCCccccCCeEEEEECCCCeEEE
Q 001901          348 VSGGALGGGRMVEDSSSVAVLDTAAGVWCD  377 (998)
Q Consensus       348 V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~  377 (998)
                      |+||.....   ...+++++|+++.+.|+.
T Consensus       348 v~GG~~~~~---~~~~~v~~~~~~~~~~~~  374 (376)
T PRK14131        348 LIGGETAGG---KAVSDVTLLSWDGKKLTV  374 (376)
T ss_pred             EEcCCCCCC---cEeeeEEEEEEcCCEEEE
Confidence            999986543   237899999999888864


No 43 
>KOG4152 consensus Host cell transcription factor HCFC1 [Cell cycle control, cell division, chromosome partitioning; Transcription]
Probab=99.93  E-value=2.2e-25  Score=244.32  Aligned_cols=255  Identities=25%  Similarity=0.376  Sum_probs=203.2

Q ss_pred             eeecccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCC
Q 001901           80 AVIEKKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLT  159 (998)
Q Consensus        80 ~~~~~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t  159 (998)
                      ......|+.|.+-..|.++..            |.+||+|||......                    +.||+|.+-...
T Consensus        70 f~PavrGDiPpgcAA~Gfvcd------------GtrilvFGGMvEYGk--------------------YsNdLYELQasR  117 (830)
T KOG4152|consen   70 FAPAVRGDIPPGCAAFGFVCD------------GTRILVFGGMVEYGK--------------------YSNDLYELQASR  117 (830)
T ss_pred             ecchhcCCCCCchhhcceEec------------CceEEEEccEeeecc--------------------ccchHHHhhhhh
Confidence            344567899999999999887            899999999987654                    889999988888


Q ss_pred             CcEEEecC----CCCCCCCccceEEEEeCCEEEEEeCCCCC--------CCCcccEEEEEcCCC--CCceEEeeecCCCC
Q 001901          160 NKWSRITP----FGEPPTPRAAHVATAVGTMVVIQGGIGPA--------GLSAEDLHVLDLTQQ--RPRWHRVVVQGPGP  225 (998)
Q Consensus       160 ~~W~~l~~----~g~~P~pR~~hsa~~~~~~lyVfGG~~~~--------~~~~~dv~~~Dl~t~--t~~W~~l~~~g~~P  225 (998)
                      -.|+++.+    .|.+|-||.+|+..+++++.|+|||...+        ..+++|+|++++.-.  ..-|..+.+.|.+|
T Consensus       118 WeWkrlkp~~p~nG~pPCPRlGHSFsl~gnKcYlFGGLaNdseDpknNvPrYLnDlY~leL~~Gsgvv~W~ip~t~Gv~P  197 (830)
T KOG4152|consen  118 WEWKRLKPKTPKNGPPPCPRLGHSFSLVGNKCYLFGGLANDSEDPKNNVPRYLNDLYILELRPGSGVVAWDIPITYGVLP  197 (830)
T ss_pred             hhHhhcCCCCCCCCCCCCCccCceeEEeccEeEEeccccccccCcccccchhhcceEEEEeccCCceEEEecccccCCCC
Confidence            88998865    46789999999999999999999996422        246899999999843  34599999999999


Q ss_pred             CCCcccEEEEEC-----CcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEecc
Q 001901          226 GPRYGHVMALVG-----QRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGR  300 (998)
Q Consensus       226 ~~R~~hs~~~~~-----~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~  300 (998)
                      .+|..|+++++-     ..++|||||+.|. .+.|+|.+|+.+.  +|.+....+..|.||.-|+++++ +++||||||.
T Consensus       198 ~pRESHTAViY~eKDs~~skmvvyGGM~G~-RLgDLW~Ldl~Tl--~W~kp~~~G~~PlPRSLHsa~~I-GnKMyvfGGW  273 (830)
T KOG4152|consen  198 PPRESHTAVIYTEKDSKKSKMVVYGGMSGC-RLGDLWTLDLDTL--TWNKPSLSGVAPLPRSLHSATTI-GNKMYVFGGW  273 (830)
T ss_pred             CCcccceeEEEEeccCCcceEEEEcccccc-cccceeEEeccee--ecccccccCCCCCCcccccceee-cceeEEecce
Confidence            999999999982     2389999999885 4899999999988  99999999999999999998877 9999999996


Q ss_pred             C-----C--------CCCCcccEEEEecCCCCeEEEEECC----CCCCCCcceeEEEEECCEEEEEcccCCCCCc---cc
Q 001901          301 D-----A--------SSVPLASAYGLAKHRDGRWEWAIAP----GVSPSPRYQHAAVFVNARLHVSGGALGGGRM---VE  360 (998)
Q Consensus       301 ~-----~--------~~~~~~dv~~~~~~~~~~W~w~~~~----g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~---~~  360 (998)
                      -     .        ...+.+.+-+++..+. .|+-....    ...|.+|.+|+++.++.+||+.-|+++-...   ..
T Consensus       274 VPl~~~~~~~~~hekEWkCTssl~clNldt~-~W~tl~~d~~ed~tiPR~RAGHCAvAigtRlYiWSGRDGYrKAwnnQV  352 (830)
T KOG4152|consen  274 VPLVMDDVKVATHEKEWKCTSSLACLNLDTM-AWETLLMDTLEDNTIPRARAGHCAVAIGTRLYIWSGRDGYRKAWNNQV  352 (830)
T ss_pred             eeeeccccccccccceeeeccceeeeeecch-heeeeeeccccccccccccccceeEEeccEEEEEeccchhhHhhcccc
Confidence            1     1        1123444444555544 55543332    2368999999999999999999998764321   13


Q ss_pred             cCCeEEEEECC
Q 001901          361 DSSSVAVLDTA  371 (998)
Q Consensus       361 ~~~dv~vyD~~  371 (998)
                      ...|+|.+|++
T Consensus       353 CCkDlWyLdTe  363 (830)
T KOG4152|consen  353 CCKDLWYLDTE  363 (830)
T ss_pred             chhhhhhhccc
Confidence            46788888764


No 44 
>TIGR03547 muta_rot_YjhT mutatrotase, YjhT family. Members of this protein family contain multiple copies of the beta-propeller-forming Kelch repeat. All are full-length homologs to YjhT of Escherichia coli, which has been identified as a mutarotase for sialic acid. This protein improves bacterial ability to obtain host sialic acid, and thus serves as a virulence factor. Some bacteria carry what appears to be a cyclically permuted homolog of this protein.
Probab=99.93  E-value=4.2e-24  Score=243.81  Aligned_cols=222  Identities=18%  Similarity=0.263  Sum_probs=168.7

Q ss_pred             CCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCC-CCCcccEEEEECCcEEEEEcCCCC
Q 001901          171 PPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGP-GPRYGHVMALVGQRYLMAIGGNDG  249 (998)
Q Consensus       171 ~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P-~~R~~hs~~~~~~~~Lyv~GG~~g  249 (998)
                      +|.+|..+++++++++|||+||..     .+++|+||+...+.+|..++   ++| .+|..|+++++++ +|||+||...
T Consensus         4 lp~~~~~~~~~~~~~~vyv~GG~~-----~~~~~~~d~~~~~~~W~~l~---~~p~~~R~~~~~~~~~~-~iYv~GG~~~   74 (346)
T TIGR03547         4 LPVGFKNGTGAIIGDKVYVGLGSA-----GTSWYKLDLKKPSKGWQKIA---DFPGGPRNQAVAAAIDG-KLYVFGGIGK   74 (346)
T ss_pred             CCccccCceEEEECCEEEEEcccc-----CCeeEEEECCCCCCCceECC---CCCCCCcccceEEEECC-EEEEEeCCCC
Confidence            488999999999999999999973     26799999854334699998   888 5899999999988 8999999854


Q ss_pred             C------CCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCC-------------------
Q 001901          250 K------RPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASS-------------------  304 (998)
Q Consensus       250 ~------~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~-------------------  304 (998)
                      .      ..++++|+||+.++  +|+.+..  ..|..+..+.++++.+++||++||.+...                   
T Consensus        75 ~~~~~~~~~~~~v~~Yd~~~~--~W~~~~~--~~p~~~~~~~~~~~~~g~IYviGG~~~~~~~~~~~~~~~~~~~~~~~~  150 (346)
T TIGR03547        75 ANSEGSPQVFDDVYRYDPKKN--SWQKLDT--RSPVGLLGASGFSLHNGQAYFTGGVNKNIFDGYFADLSAADKDSEPKD  150 (346)
T ss_pred             CCCCCcceecccEEEEECCCC--EEecCCC--CCCCcccceeEEEEeCCEEEEEcCcChHHHHHHHhhHhhcCccchhhh
Confidence            2      25789999999999  9999973  22444555555557899999999986421                   


Q ss_pred             --------------CCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEE-
Q 001901          305 --------------VPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLD-  369 (998)
Q Consensus       305 --------------~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD-  369 (998)
                                    ..+++++.|++.++   +|..++.++..+|..|+++.++++|||+||......   ...+++.|| 
T Consensus       151 ~~~~~~~~~~~~~~~~~~~v~~YDp~t~---~W~~~~~~p~~~r~~~~~~~~~~~iyv~GG~~~~~~---~~~~~~~y~~  224 (346)
T TIGR03547       151 KLIAAYFSQPPEDYFWNKNVLSYDPSTN---QWRNLGENPFLGTAGSAIVHKGNKLLLINGEIKPGL---RTAEVKQYLF  224 (346)
T ss_pred             hhHHHHhCCChhHcCccceEEEEECCCC---ceeECccCCCCcCCCceEEEECCEEEEEeeeeCCCc---cchheEEEEe
Confidence                          01478999999988   677777664347899999999999999999864331   134566665 


Q ss_pred             -CCCCeEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEECCEEEEEcCCC
Q 001901          370 -TAAGVWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAVGDLIFIYGGLR  425 (998)
Q Consensus       370 -~~t~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~~LyVfGG~~  425 (998)
                       +.+++|+.+..++.+ +.             ..+..|.+|++++++++|||+||.+
T Consensus       225 ~~~~~~W~~~~~m~~~-r~-------------~~~~~~~~~~a~~~~~~Iyv~GG~~  267 (346)
T TIGR03547       225 TGGKLEWNKLPPLPPP-KS-------------SSQEGLAGAFAGISNGVLLVAGGAN  267 (346)
T ss_pred             cCCCceeeecCCCCCC-CC-------------CccccccEEeeeEECCEEEEeecCC
Confidence             577899999887321 10             0122456788889999999999975


No 45 
>PHA02790 Kelch-like protein; Provisional
Probab=99.92  E-value=1.1e-23  Score=249.85  Aligned_cols=205  Identities=19%  Similarity=0.313  Sum_probs=171.7

Q ss_pred             EEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEE
Q 001901          180 ATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWAL  259 (998)
Q Consensus       180 a~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~y  259 (998)
                      ++.+++.||++||.+. ....+.+++||+.++  +|..++   ++|.+|..++++.+++ +||++||.++.   +.+++|
T Consensus       267 ~~~~~~~lyviGG~~~-~~~~~~v~~Ydp~~~--~W~~~~---~m~~~r~~~~~v~~~~-~iYviGG~~~~---~sve~y  336 (480)
T PHA02790        267 STHVGEVVYLIGGWMN-NEIHNNAIAVNYISN--NWIPIP---PMNSPRLYASGVPANN-KLYVVGGLPNP---TSVERW  336 (480)
T ss_pred             eEEECCEEEEEcCCCC-CCcCCeEEEEECCCC--EEEECC---CCCchhhcceEEEECC-EEEEECCcCCC---CceEEE
Confidence            3458999999999853 345678999999987  499998   8999999999999987 89999998642   679999


Q ss_pred             ECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEE
Q 001901          260 DTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAA  339 (998)
Q Consensus       260 D~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsa  339 (998)
                      |+.++  +|..+++++.   +|. .+++++.+++||++||.++.   .+.+..|++.++   +|...+++ |.+|..|++
T Consensus       337 dp~~n--~W~~~~~l~~---~r~-~~~~~~~~g~IYviGG~~~~---~~~ve~ydp~~~---~W~~~~~m-~~~r~~~~~  403 (480)
T PHA02790        337 FHGDA--AWVNMPSLLK---PRC-NPAVASINNVIYVIGGHSET---DTTTEYLLPNHD---QWQFGPST-YYPHYKSCA  403 (480)
T ss_pred             ECCCC--eEEECCCCCC---CCc-ccEEEEECCEEEEecCcCCC---CccEEEEeCCCC---EEEeCCCC-CCccccceE
Confidence            99999  9999987754   355 45566679999999998643   356788998877   66777765 689999999


Q ss_pred             EEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEECCEEE
Q 001901          340 VFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAVGDLIF  419 (998)
Q Consensus       340 v~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~~Ly  419 (998)
                      ++++++|||+||.            +++||+++++|+.++++                     +.+|..+++++++++||
T Consensus       404 ~~~~~~IYv~GG~------------~e~ydp~~~~W~~~~~m---------------------~~~r~~~~~~v~~~~IY  450 (480)
T PHA02790        404 LVFGRRLFLVGRN------------AEFYCESSNTWTLIDDP---------------------IYPRDNPELIIVDNKLL  450 (480)
T ss_pred             EEECCEEEEECCc------------eEEecCCCCcEeEcCCC---------------------CCCccccEEEEECCEEE
Confidence            9999999999983            57899999999999887                     66899999999999999


Q ss_pred             EEcCCCCCCCcccEEEecccc
Q 001901          420 IYGGLRGGVLLDDLLVAEDLA  440 (998)
Q Consensus       420 VfGG~~~~~~l~Dv~~ld~~~  440 (998)
                      |+||+++...++.++++|...
T Consensus       451 viGG~~~~~~~~~ve~Yd~~~  471 (480)
T PHA02790        451 LIGGFYRGSYIDTIEVYNNRT  471 (480)
T ss_pred             EECCcCCCcccceEEEEECCC
Confidence            999988766678888888654


No 46 
>cd07425 MPP_Shelphs Shewanella-like phosphatases, metallophosphatase domain. This family includes bacterial, eukaryotic, and archeal proteins orthologous to the Shewanella cold-active protein-tyrosine phosphatase, CAPTPase.  CAPTPase is an uncharacterized protein that belongs to the Shelph (Shewanella-like phosphatase) family of PPP (phosphoprotein phosphatases).  The PPP family is one of two known protein phosphatase families specific for serine and threonine.  In addition to Shelps, the PPP family also includes: PP1, PP2A, PP2B (calcineurin), PP4, PP5, PP6, PP7, Bsu1, RdgC, PrpE, PrpA/PrpB, and ApA4 hydrolase. The PPP catalytic domain is defined by three conserved motifs (-GDXHG-, -GDXVDRG- and -GNHE-).  The PPP enzyme family is ancient with members found in all eukaryotes, and in most bacterial and archeal genomes.  Dephosphorylation of phosphoserines and phosphothreonines on target proteins plays a central role in the regulation of many cellular processes.  PPPs belong to the metal
Probab=99.88  E-value=3.8e-22  Score=210.30  Aligned_cols=185  Identities=21%  Similarity=0.359  Sum_probs=130.7

Q ss_pred             EEEecCCCCHHHHHHHHHHcCCCCCCCCcc--ceeEEEeccccCCCCChHHHHHHHHHhhhc---CCCcEEEeecCcccc
Q 001901          701 KIFGDLHGQFGDLMRLFDEYGSPSTAGDIA--YIDYLFLGDYVDRGQHSLETITLLLALKVE---YPNNVHLIRGNHEAA  775 (998)
Q Consensus       701 ~vvGDiHG~~~dL~~il~~~g~~~~~~~~~--~~~~vfLGDyVDRG~~s~evl~ll~~lk~~---~p~~v~llrGNHE~~  775 (998)
                      +||||||||+..|.++|+.+++......+.  ...+||||||||||+++.|||.+|+.|+..   .+.++++|+||||.+
T Consensus         1 ~vi~DIHG~~~~l~~ll~~~~~~~~~~~~~~~~d~lv~lGD~vdrG~~~~~vl~~l~~l~~~~~~~~~~v~~l~GNHE~~   80 (208)
T cd07425           1 VAIGDLHGDLDAFREILKGAGVIDSNDHWIGGSTHLVQLGDIFDRGPDVIEILWLLYKLEQEAAKAGGKVHFLLGNHELM   80 (208)
T ss_pred             CEEeCccCCHHHHHHHHHHCCCCCccccccCCCcEEEEECCCcCCCcCHHHHHHHHHHHHHHHHhcCCeEEEeeCCCcHH
Confidence            589999999999999999988643221111  227999999999999999999999999854   456899999999999


Q ss_pred             chhhhcCChHH-HHHHhCCC--cchhhh---hhhhhhhcccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCC
Q 001901          776 DINALFGFRIE-CIERMGER--DGIWAW---HRINRLFNWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAG  849 (998)
Q Consensus       776 ~~~~~~gf~~e-~~~~~g~~--~~~~~~---~~~~~~f~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~  849 (998)
                      .++..+.+... ....+...  ....++   ..+.++++.||+...++ ++++||||+.|                    
T Consensus        81 ~l~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~L~~lP~~~~~~-~~~fvHag~~~--------------------  139 (208)
T cd07425          81 NLCGDFRYVHPKYFNEFGGLAMRRRELFSPGGELGRWLRSKPVIVKVN-DTLFVHGGLGP--------------------  139 (208)
T ss_pred             HHcchhccCChhHHHHHHhhhhhHHHhcCCccHHHHHHHhCCeEEEEC-CEEEEeCCcHH--------------------
Confidence            88754433211 11111100  001122   34478899999998886 68889999922                    


Q ss_pred             CcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHHHHHHHHcCCcEEEEcccccccceEEecCCeEEEEecc
Q 001901          850 SIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRVMEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSA  924 (998)
Q Consensus       850 ~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa  924 (998)
                             +|+...-       .+....    .=+...++++|+.++.++||+||+.++.|...+++|++|+|.+.
T Consensus       140 -------~w~r~y~-------~~~~~~----~~~~~~~~~~l~~~~~~~iv~GHTh~~~~~~~~~~g~~i~ID~g  196 (208)
T cd07425         140 -------LWYRGYS-------KETSDK----ECAAAHLDKVLERLGAKRMVVGHTPQEGGIVTFCGGKVIRIDVG  196 (208)
T ss_pred             -------HHhhHhh-------hhhhhc----cchHHHHHHHHHHcCCCeEEEcCeeeecCceEEECCEEEEEeCC
Confidence                   3321110       000000    01236788999999999999999999888776899999999873


No 47 
>PRK13625 bis(5'-nucleosyl)-tetraphosphatase PrpE; Provisional
Probab=99.87  E-value=3.4e-22  Score=216.23  Aligned_cols=131  Identities=22%  Similarity=0.364  Sum_probs=98.4

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCCCCCCC---ccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccc
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSPSTAGD---IAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~---~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~  774 (998)
                      ++++||||||||++.|.++|+++++....+.   ....++||||||||||++|+|||.+|++|.  .+.++++||||||.
T Consensus         1 ~~~~vIGDIHG~~~~L~~lL~~~~~~~~~~~~~~~~~d~li~lGDliDRGp~S~~vl~~~~~~~--~~~~~~~l~GNHE~   78 (245)
T PRK13625          1 MKYDIIGDIHGCYQEFQALTEKLGYNWSSGLPVHPDQRKLAFVGDLTDRGPHSLRMIEIVWELV--EKKAAYYVPGNHCN   78 (245)
T ss_pred             CceEEEEECccCHHHHHHHHHHcCCCcccCcccCCCCCEEEEECcccCCCcChHHHHHHHHHHh--hCCCEEEEeCccHH
Confidence            3689999999999999999999987421100   001279999999999999999999999885  44689999999999


Q ss_pred             cchhhhcCC-------hHHHHHHhCCC---cchhhhhhhhhhhcccceeEEEc-CeEEEecCCccCc
Q 001901          775 ADINALFGF-------RIECIERMGER---DGIWAWHRINRLFNWLPLAALIE-KKIICMHGGIGRS  830 (998)
Q Consensus       775 ~~~~~~~gf-------~~e~~~~~g~~---~~~~~~~~~~~~f~~LP~aa~i~-~~il~vHgGi~~~  830 (998)
                      +.++...+-       ..+....|...   ....+++.+.++|+.||++.+++ ++++|||||+.+.
T Consensus        79 ~~l~~~~~~~~~~~~gg~~tl~~~~~~~~~~~~~~~~~~~~~~~~lPl~~~~~~~~~~~vHAG~~~~  145 (245)
T PRK13625         79 KLYRFFLGRNVTIAHGLETTVAEYEALPSHKQNMIKEKFITLYEQAPLYHILDEGRLVVAHAGIRQD  145 (245)
T ss_pred             HHHHHHhCCCccccchhHhHHHHHhccChhhHHHHHHHHHHHHHhCCceEEEeCCCEEEEECCCChH
Confidence            887655331       12222333221   12346678899999999998774 6899999999876


No 48 
>cd07423 MPP_PrpE Bacillus subtilis PrpE and related proteins, metallophosphatase domain. PrpE (protein phosphatase E) is a bacterial member of the PPP (phosphoprotein phosphatase) family of serine/threonine phosphatases and a key signal transduction pathway component controlling the expression of spore germination receptors GerA and GerK in Bacillus subtilis. PrpE is closely related to ApaH (also known symmetrical Ap(4)A hydrolase and bis(5'nucleosyl)-tetraphosphatase).  PrpE has specificity for phosphotyrosine only, unlike the serine/threonine phosphatases to which it is related. The Bacilli members of this family are single domain proteins while the other members have N- and C-terminal domains in addition to this phosphatase domain.  The PPP (phosphoprotein phosphatase) family, to which PrpE belongs, is one of two known protein phosphatase families specific for serine and threonine.  The PPP family also includes: PP1, PP2A, PP2B (calcineurin), PP4, PP5, PP6, PP7, Bsu1, RdgC, PrpA/Prp
Probab=99.83  E-value=1.2e-20  Score=203.06  Aligned_cols=130  Identities=24%  Similarity=0.415  Sum_probs=98.8

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCCCCCC----CccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCcc
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSPSTAG----DIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHE  773 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~~~~~----~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE  773 (998)
                      ++|.||||||||+..|+++|+++++...+.    .....++||||||||||++|.|||.+|+.|+..  .++++||||||
T Consensus         1 ~~i~vigDIHG~~~~L~~ll~~~~~~~~~~~~~~~~~~d~lv~lGDlIDrG~~s~evl~~l~~l~~~--~~~~~v~GNHE   78 (234)
T cd07423           1 GPFDIIGDVHGCYDELEELLEKLGYRIKRVGTVTHPEGRRAVFVGDLVDRGPDSPEVLRLVMSMVAA--GAALCVPGNHD   78 (234)
T ss_pred             CCeEEEEECCCCHHHHHHHHHHcCCccccCccccCCCCCEEEEECCccCCCCCHHHHHHHHHHHhhC--CcEEEEECCcH
Confidence            479999999999999999999998764320    000127999999999999999999999998754  47999999999


Q ss_pred             ccchhhhcCCh-------HHHHHHhCCCcchhhhhhhhhhhcccceeEEEc-CeEEEecCCccCc
Q 001901          774 AADINALFGFR-------IECIERMGERDGIWAWHRINRLFNWLPLAALIE-KKIICMHGGIGRS  830 (998)
Q Consensus       774 ~~~~~~~~gf~-------~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~-~~il~vHgGi~~~  830 (998)
                      .+.++...+..       .+....|... ...+.+.+.++|+.||+...++ ++++|||||+++.
T Consensus        79 ~~l~~~~~~~~~~~~~~~~~t~~~~~~~-~~~~~~~~~~~l~~lP~~~~~~~~~~~~vHag~~~~  142 (234)
T cd07423          79 NKLYRKLQGRNVKITHGLEETVAQLEAE-SEEFKEEVIEFYESLPSHLVLDEGKLVVAHAGIKEE  142 (234)
T ss_pred             HHHHHHhcCCCccccCcccchHHHHhhc-cHHHHHHHHHHHHhCCcEEEeCCCcEEEEeCCCChH
Confidence            98876543311       1222333221 2345678889999999998775 5799999998864


No 49 
>cd07413 MPP_PA3087 Pseudomonas aeruginosa PA3087 and related proteins, metallophosphatase domain. PA3087 is an uncharacterized protein from Pseudomonas aeruginosa with a metallophosphatase domain that belongs to the phosphoprotein phosphatase (PPP) family.  The PPP family also includes: PP1, PP2A, PP2B (calcineurin), PP4, PP5, PP6, PP7, Bsu1, RdgC, PrpE, PrpA/PrpB, and ApA4 hydrolase. The PPP catalytic domain is defined by three conserved motifs (-GDXHG-, -GDXVDRG- and -GNHE-).  The PPP enzyme family is ancient with members found in all eukaryotes, and in most bacterial and archeal genomes.  Dephosphorylation of phosphoserines and phosphothreonines on target proteins plays a central role in the regulation of many cellular processes.  PPPs belong to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of 
Probab=99.82  E-value=8.9e-20  Score=194.37  Aligned_cols=123  Identities=23%  Similarity=0.294  Sum_probs=92.1

Q ss_pred             EEEecCCCCHHHHHHHHHHcCCCCCCCC--ccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchh
Q 001901          701 KIFGDLHGQFGDLMRLFDEYGSPSTAGD--IAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADIN  778 (998)
Q Consensus       701 ~vvGDiHG~~~dL~~il~~~g~~~~~~~--~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~  778 (998)
                      +||||||||++.|.++|+++++....+.  ....++||||||||||++|.|||.+|+.|+..  .++++|+||||.+.+.
T Consensus         2 ~vIGDIHG~~~~L~~lL~~i~~~~~~~~~~~~~d~lvflGD~IDRGp~S~~vl~~l~~l~~~--~~~~~l~GNHE~~ll~   79 (222)
T cd07413           2 DFIGDIHGHAEKLVVLLHKLGYQELSGVYRHPERQVVFLGDLIDRGPEIRELLEIVKSMVDA--GHALAVMGNHEFNAIA   79 (222)
T ss_pred             EEEEeccCCHHHHHHHHHHcCCCccccccCCCCCEEEEeCcccCCCCCHHHHHHHHHHhhcC--CCEEEEEccCcHHHHH
Confidence            7999999999999999999987532100  00117999999999999999999999998644  4899999999998875


Q ss_pred             hhcCC-h----------------HHHHHHhCCCcchhhhhhhhhhhcccceeEEEcCeEEEecCCcc
Q 001901          779 ALFGF-R----------------IECIERMGERDGIWAWHRINRLFNWLPLAALIEKKIICMHGGIG  828 (998)
Q Consensus       779 ~~~gf-~----------------~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~~~il~vHgGi~  828 (998)
                      ...+. .                .+..+.++.  ....++.+.++|+.||+.... ++++|||||+.
T Consensus        80 ~~~~~~~~~~w~~~~~~~~~~~~~~~l~~~~~--~~~~~~~~~~~l~~lP~~~~~-~~~~~VHAg~~  143 (222)
T cd07413          80 WHTKDPSGGEWLRAHSKKNLRQHQAFLEQFRE--HSEEHKDWLEWFKTLPLFLDL-GGVRVVHACWD  143 (222)
T ss_pred             hhhCCcccchhhhcCCCcccccHHHHHHHHhc--cchhHHHHHHHHhcCCcEEEE-CCEEEEECCcC
Confidence            43321 0                112222321  123567788999999999776 47999999985


No 50 
>cd07422 MPP_ApaH Escherichia coli ApaH and related proteins, metallophosphatase domain. ApaH (also known as symmetrically cleaving Ap4A hydrolase and bis(5'nucleosyl)-tetraphosphatase) is a bacterial member of the PPP (phosphoprotein phosphatase) family of serine/threonine phosphatases that hydrolyzes the nucleotide-signaling molecule diadenosine tetraphosphate (Ap(4)A) into two ADP and also hydrolyzes Ap(5)A, Gp(4)G, and other extending compounds.  Null mutations in apaH result in high intracellular levels of Ap(4)A which correlate with multiple phenotypes, including a decreased expression of catabolite-repressible genes, a reduction in the expression of flagellar operons, and an increased sensitivity to UV  and heat.  Ap4A hydrolase is important in responding to heat shock and oxidative stress via regulating the concentration of Ap4A in bacteria.  Ap4A hydrolase is also thought to play a role in siderophore production, but the mechanism by which ApaH interacts with siderophore pathwa
Probab=99.82  E-value=1.8e-20  Score=202.21  Aligned_cols=129  Identities=22%  Similarity=0.372  Sum_probs=99.9

Q ss_pred             eEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhh
Q 001901          700 IKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINA  779 (998)
Q Consensus       700 i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~  779 (998)
                      ++||||||||+..|+++|+++++.+..+     +++|||||||||++|+|||.+|+.|+    .++++|+||||.+.++.
T Consensus         1 ~yvIGDIHG~~~~L~~LL~~i~~~~~~D-----~Li~lGDlVdRGp~s~evl~~l~~l~----~~v~~VlGNHD~~ll~~   71 (257)
T cd07422           1 TYAIGDIQGCYDELQRLLEKINFDPAKD-----RLWLVGDLVNRGPDSLETLRFVKSLG----DSAKTVLGNHDLHLLAV   71 (257)
T ss_pred             CEEEECCCCCHHHHHHHHHhcCCCCCCC-----EEEEecCcCCCCcCHHHHHHHHHhcC----CCeEEEcCCchHHHHHH
Confidence            5899999999999999999998764322     89999999999999999999999986    58999999999998887


Q ss_pred             hcCChHH----HHHHhCCCcchhhhhhhhhhhcccceeEEEcC-eEEEecCCccCcccCHHhhhhcc
Q 001901          780 LFGFRIE----CIERMGERDGIWAWHRINRLFNWLPLAALIEK-KIICMHGGIGRSINHVEQIENLQ  841 (998)
Q Consensus       780 ~~gf~~e----~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~~-~il~vHgGi~~~~~~~~~i~~i~  841 (998)
                      .+|+...    ....+-   .....+.+.+++..+|+...+++ ++++|||||+|.. ++++...+.
T Consensus        72 ~~g~~~~~~~~t~~~~l---~~~~~~~~~~wLr~lPl~~~~~~~~~l~vHAGi~p~w-~~~~~~~~a  134 (257)
T cd07422          72 AAGIKKPKKKDTLDDIL---NAPDRDELLDWLRHQPLLHRDPELGILMVHAGIPPQW-SIEQALKLA  134 (257)
T ss_pred             hcCccccccHhHHHHHH---hccchHHHHHHHHhCCCEEEECCccEEEEccCCCCCC-CHHHHHHHH
Confidence            6664311    111110   01123567888999999988864 8999999999974 455544433


No 51 
>PRK00166 apaH diadenosine tetraphosphatase; Reviewed
Probab=99.82  E-value=2.2e-19  Score=195.92  Aligned_cols=125  Identities=20%  Similarity=0.357  Sum_probs=97.4

Q ss_pred             CeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchh
Q 001901          699 PIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADIN  778 (998)
Q Consensus       699 ~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~  778 (998)
                      .++||||||||+..|.++|+++++.+..+     .++|||||||||++|+|||.+|+.+    +.++++|+||||.+.+.
T Consensus         2 ~~~vIGDIHG~~~~l~~ll~~~~~~~~~D-----~li~lGDlVdrGp~s~~vl~~l~~l----~~~~~~VlGNHD~~ll~   72 (275)
T PRK00166          2 ATYAIGDIQGCYDELQRLLEKIDFDPAKD-----TLWLVGDLVNRGPDSLEVLRFVKSL----GDSAVTVLGNHDLHLLA   72 (275)
T ss_pred             cEEEEEccCCCHHHHHHHHHhcCCCCCCC-----EEEEeCCccCCCcCHHHHHHHHHhc----CCCeEEEecChhHHHHH
Confidence            58999999999999999999998753321     7999999999999999999999987    35799999999999888


Q ss_pred             hhcCChHH----HHHHhCCCcchhhhhhhhhhhcccceeEEE-cCeEEEecCCccCcccCHHh
Q 001901          779 ALFGFRIE----CIERMGERDGIWAWHRINRLFNWLPLAALI-EKKIICMHGGIGRSINHVEQ  836 (998)
Q Consensus       779 ~~~gf~~e----~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i-~~~il~vHgGi~~~~~~~~~  836 (998)
                      ..+|+...    ....+-   .....+.+.++++.||+...+ ++++++|||||+|.. ++++
T Consensus        73 ~~~g~~~~~~~~~l~~~l---~~~~~~~~~~~L~~lPl~~~~~~~~~l~vHAGi~p~~-~~~~  131 (275)
T PRK00166         73 VAAGIKRNKKKDTLDPIL---EAPDRDELLDWLRHQPLLHVDEELGLVMVHAGIPPQW-DLAT  131 (275)
T ss_pred             hhcCCccccchhHHHHHH---ccccHHHHHHHHHCCCcEEEECCCCEEEEccCCCCCC-CHHH
Confidence            77765321    111110   012345677889999998776 568999999999874 4433


No 52 
>TIGR00668 apaH bis(5'-nucleosyl)-tetraphosphatase (symmetrical). Alternate names include diadenosine-tetraphosphatase and Ap4A hydrolase.
Probab=99.81  E-value=6.7e-20  Score=197.52  Aligned_cols=127  Identities=24%  Similarity=0.347  Sum_probs=100.8

Q ss_pred             CeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchh
Q 001901          699 PIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADIN  778 (998)
Q Consensus       699 ~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~  778 (998)
                      .++||||||||++.|.++|+++++.+..+     +++|||||||||++|+|||.+|.+++    .++++|+||||.+.+.
T Consensus         2 ~~YvIGDIHGc~daL~~LL~~i~f~~~~D-----~l~~lGDlVdRGP~slevL~~l~~l~----~~~~~VlGNHD~~lL~   72 (279)
T TIGR00668         2 ATYLIGDLHGCYDELQALLERVEFDPGQD-----TLWLTGDLVARGPGSLEVLRYVKSLG----DAVRLVLGNHDLHLLA   72 (279)
T ss_pred             cEEEEEcccCCHHHHHHHHHHhCcCCCCC-----EEEEeCCccCCCCCHHHHHHHHHhcC----CCeEEEEChhHHHHHH
Confidence            58999999999999999999998765332     79999999999999999999999874    4688999999999998


Q ss_pred             hhcCCh-----HHHHHHhCCCcchhhhhhhhhhhcccceeEEEc-CeEEEecCCccCcccCHHhhhh
Q 001901          779 ALFGFR-----IECIERMGERDGIWAWHRINRLFNWLPLAALIE-KKIICMHGGIGRSINHVEQIEN  839 (998)
Q Consensus       779 ~~~gf~-----~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~-~~il~vHgGi~~~~~~~~~i~~  839 (998)
                      ..+|+.     +.....+.    ....+.+.+++..+|+....+ .++++|||||+|.. ++++...
T Consensus        73 ~~~g~~~~~~~d~l~~~l~----a~~~~ell~wLr~lPl~i~~~~~~~~lVHAGi~P~w-~l~~a~~  134 (279)
T TIGR00668        73 VFAGISRNKPKDRLDPLLE----APDADELLNWLRRQPLLQHDEEKKLVMAHAGITPQW-DLQTAKE  134 (279)
T ss_pred             HhcCCCccCchHHHHHHHH----ccCHHHHHHHHHcCCcEEEeCCCCEEEEecCCCCCC-cHHHHHH
Confidence            887763     12222121    124567788999999997654 47999999999984 4555443


No 53 
>cd07421 MPP_Rhilphs Rhilph phosphatases, metallophosphatase domain. Rhilphs (Rhizobiales/ Rhodobacterales/ Rhodospirillaceae-like phosphatases) are a phylogenetically distinct group of PPP (phosphoprotein phosphatases), found only in land plants. They are named for their close relationship to to PPP phosphatases from alpha-Proteobacteria, including Rhizobiales, Rhodobacterales and Rhodospirillaceae.  The PPP (phosphoprotein phosphatase) family, to which the Rhilphs belong, is one of two known protein phosphatase families specific for serine and threonine.  The PPP family also includes: PP1, PP2A, PP2B (calcineurin), PP4, PP5, PP6, PP7, Bsu1, RdgC, PrpE, PrpA/PrpB, and ApA4 hydrolase. The PPP catalytic domain is defined by three conserved motifs (-GDXHG-, -GDXVDRG- and -GNHE-).  The PPP enzyme family is ancient with members found in all eukaryotes, and in most bacterial and archeal genomes.  Dephosphorylation of phosphoserines and phosphothreonines on target proteins plays a central rol
Probab=99.80  E-value=6.9e-19  Score=189.33  Aligned_cols=82  Identities=32%  Similarity=0.479  Sum_probs=66.1

Q ss_pred             CeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCC-cEEEeecCccccch
Q 001901          699 PIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPN-NVHLIRGNHEAADI  777 (998)
Q Consensus       699 ~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~-~v~llrGNHE~~~~  777 (998)
                      ++++||||||+++.|.++|+.+.............+||||||||||++|.|||.+|++++..+|. .+++||||||.+.+
T Consensus         3 ~iyaIGDIHG~~d~L~~lL~~I~~d~~~~~~~~~~iVfLGDyVDRGPdS~eVld~L~~l~~~~~~~~vv~LrGNHE~~~l   82 (304)
T cd07421           3 VVICVGDIHGYISKLNNLWLNLQSALGPSDFASALVIFLGDYCDRGPETRKVIDFLISLPEKHPKQRHVFLCGNHDFAFA   82 (304)
T ss_pred             eEEEEEeccCCHHHHHHHHHHhhhhcCcCcCCCcEEEEeCCcCCCCCCHHHHHHHHHHhhhcccccceEEEecCChHHHH
Confidence            68999999999999999998764321100001126999999999999999999999999999986 68999999998866


Q ss_pred             hhh
Q 001901          778 NAL  780 (998)
Q Consensus       778 ~~~  780 (998)
                      ..+
T Consensus        83 ~fL   85 (304)
T cd07421          83 AFL   85 (304)
T ss_pred             hHh
Confidence            443


No 54 
>PRK11439 pphA serine/threonine protein phosphatase 1; Provisional
Probab=99.78  E-value=6.6e-19  Score=187.46  Aligned_cols=120  Identities=26%  Similarity=0.336  Sum_probs=90.4

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccch
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADI  777 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~  777 (998)
                      ++++||||||||+..|+++|+.+++.+..+     +++|||||||||++|.|||.+|..      .++++||||||.+.+
T Consensus        17 ~ri~vigDIHG~~~~L~~lL~~i~~~~~~D-----~li~lGDlvDrGp~s~~vl~~l~~------~~~~~v~GNHE~~~l   85 (218)
T PRK11439         17 RHIWLVGDIHGCFEQLMRKLRHCRFDPWRD-----LLISVGDLIDRGPQSLRCLQLLEE------HWVRAVRGNHEQMAL   85 (218)
T ss_pred             CeEEEEEcccCCHHHHHHHHHhcCCCcccC-----EEEEcCcccCCCcCHHHHHHHHHc------CCceEeeCchHHHHH
Confidence            489999999999999999999998753221     799999999999999999999976      368899999999988


Q ss_pred             hhhcCChHHHHHHhCCC-------cchhhhhhhhhhhcccceeEEE---cCeEEEecCCcc
Q 001901          778 NALFGFRIECIERMGER-------DGIWAWHRINRLFNWLPLAALI---EKKIICMHGGIG  828 (998)
Q Consensus       778 ~~~~gf~~e~~~~~g~~-------~~~~~~~~~~~~f~~LP~aa~i---~~~il~vHgGi~  828 (998)
                      +...+-....+...|..       .....+..+.++++.||+...+   ++++++||||++
T Consensus        86 ~~~~~~~~~~w~~~gg~~~~~l~~~~~~~~~~~~~~l~~LP~~~~~~~~~~~~~~vHAg~p  146 (218)
T PRK11439         86 DALASQQMSLWLMNGGDWFIALTDNQQKQAKTLLEKCQRLPFILEVHCRTGKHVIAHADYP  146 (218)
T ss_pred             HHHHCCccchhhhCCChhhhhcchhhhHHHHHHHHHHhcCCcEEEeeccCCCEEEEeCCCC
Confidence            76543211122222211       1122345566889999999765   357999999984


No 55 
>cd07424 MPP_PrpA_PrpB PrpA and PrpB, metallophosphatase domain. PrpA and PrpB are bacterial type I serine/threonine and tyrosine phosphatases thought to modulate the expression of proteins that protect the cell upon accumulation of misfolded proteins in the periplasm.  The PPP (phosphoprotein phosphatase) family, to which PrpA and PrpB belong, is one of two known protein phosphatase families specific for serine and threonine.  This family also includes: PP1, PP2A, PP2B (calcineurin), PP4, PP5, PP6, PP7, Bsu1, RdgC, PrpE, and ApA4 hydrolase. The PPP catalytic domain is defined by three conserved motifs (-GDXHG-, -GDXVDRG- and -GNHE-).  The PPP enzyme family is ancient with members found in all eukaryotes, and in most bacterial and archeal genomes.  Dephosphorylation of phosphoserines and phosphothreonines on target proteins plays a central role in the regulation of many cellular processes.  PPPs belong to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all 
Probab=99.77  E-value=1.4e-18  Score=183.60  Aligned_cols=147  Identities=26%  Similarity=0.333  Sum_probs=105.4

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccch
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADI  777 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~  777 (998)
                      ++++|||||||++..|.++++..++....+     .++|+|||||||+++.||+.+|..      ..+++||||||.+.+
T Consensus         1 ~ri~~isDiHg~~~~l~~~l~~~~~~~~~d-----~~~~~GD~v~~g~~~~~~~~~l~~------~~~~~v~GNhe~~~~   69 (207)
T cd07424           1 GRDFVVGDIHGHYSLLQKALDAVGFDPARD-----RLISVGDLIDRGPESLACLELLLE------PWFHAVRGNHEQMAI   69 (207)
T ss_pred             CCEEEEECCCCCHHHHHHHHHHcCCCCCCC-----EEEEeCCcccCCCCHHHHHHHHhc------CCEEEeECCChHHHH
Confidence            478999999999999999999987643221     799999999999999999999876      368999999999988


Q ss_pred             hhhcC--ChHHHHHHhCCCcc-----hhhhhhhhhhhcccceeEEEc---CeEEEecCCccCcccCHHhhhhccCCcccC
Q 001901          778 NALFG--FRIECIERMGERDG-----IWAWHRINRLFNWLPLAALIE---KKIICMHGGIGRSINHVEQIENLQRPITME  847 (998)
Q Consensus       778 ~~~~g--f~~e~~~~~g~~~~-----~~~~~~~~~~f~~LP~aa~i~---~~il~vHgGi~~~~~~~~~i~~i~rp~~~~  847 (998)
                      ....+  +..+.+.+++....     ..+++.+.++|+.||+...++   .+++|||||+.+... .+.+..  .+..  
T Consensus        70 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~lP~~~~i~~~g~~~~~vHag~~~~~~-~~~~~~--~~~~--  144 (207)
T cd07424          70 DALRAEPLDAVRWLANGGEWFLDLPDEELRRWLALKLEQLPLAIEVETEGGKVGIVHADYPSDDW-SDGVGA--VTLR--  144 (207)
T ss_pred             hHhhCCCcchhHHHhcCCeehhhcChHHHHHHHHHHHHhCCeEEEEEeCCCEEEEECCCCCcchh-hhhhhc--cccC--
Confidence            87655  33344444443311     113455788999999998774   479999999965421 111110  1111  


Q ss_pred             CCCcceeccccCCCC
Q 001901          848 AGSIVLMDLLWSDPT  862 (998)
Q Consensus       848 ~~~~~~~dlLWsDP~  862 (998)
                        .....+++|+++.
T Consensus       145 --~~~~~~~~w~~~~  157 (207)
T cd07424         145 --PEDIEELLWSRTR  157 (207)
T ss_pred             --cccceeeeeccch
Confidence              1256678998764


No 56 
>PHA02239 putative protein phosphatase
Probab=99.75  E-value=5.7e-18  Score=181.19  Aligned_cols=124  Identities=25%  Similarity=0.370  Sum_probs=91.9

Q ss_pred             CeEEEecCCCCHHHHHHHHHHcCCC--CCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccc
Q 001901          699 PIKIFGDLHGQFGDLMRLFDEYGSP--STAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAAD  776 (998)
Q Consensus       699 ~i~vvGDiHG~~~dL~~il~~~g~~--~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~  776 (998)
                      ++++||||||++..|.++++.+...  +.+      .+||||||||||++|.+|+.+|+.++. .+.++++|+||||.+.
T Consensus         2 ~~~~IsDIHG~~~~l~~ll~~i~~~~~~~d------~li~lGD~iDrG~~s~~v~~~l~~~~~-~~~~~~~l~GNHE~~~   74 (235)
T PHA02239          2 AIYVVPDIHGEYQKLLTIMDKINNERKPEE------TIVFLGDYVDRGKRSKDVVNYIFDLMS-NDDNVVTLLGNHDDEF   74 (235)
T ss_pred             eEEEEECCCCCHHHHHHHHHHHhhcCCCCC------EEEEecCcCCCCCChHHHHHHHHHHhh-cCCCeEEEECCcHHHH
Confidence            6899999999999999999987532  122      799999999999999999999999754 3568999999999987


Q ss_pred             hhhhcCC--------------hHHHHHHhCCCcc---------------------------hhhhhhhhhhhcccceeEE
Q 001901          777 INALFGF--------------RIECIERMGERDG---------------------------IWAWHRINRLFNWLPLAAL  815 (998)
Q Consensus       777 ~~~~~gf--------------~~e~~~~~g~~~~---------------------------~~~~~~~~~~f~~LP~aa~  815 (998)
                      +....+.              ..+....||-...                           ...+..+..+++.||+...
T Consensus        75 l~~~~~~~~~~~~~~~wl~~GG~~Tl~Syg~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~fl~~lp~~~~  154 (235)
T PHA02239         75 YNIMENVDRLSIYDIEWLSRYCIETLNSYGVSTVTLKYSSVEENLRNNYDFIKSELKKLKESDDYRKFKILMVNCRKYYK  154 (235)
T ss_pred             HHHHhCchhcccchHHHHHcCCHHHHHHcCCCCccchhhHHHHHHHHhhhhhhhhhhhcccchhhHHHHHHHHhCcceEE
Confidence            6543211              1223344542210                           0123455568888999977


Q ss_pred             EcCeEEEecCCccCc
Q 001901          816 IEKKIICMHGGIGRS  830 (998)
Q Consensus       816 i~~~il~vHgGi~~~  830 (998)
                      .+ +++|||||+.|.
T Consensus       155 ~~-~~ifVHAGi~p~  168 (235)
T PHA02239        155 ED-KYIFSHSGGVSW  168 (235)
T ss_pred             EC-CEEEEeCCCCCC
Confidence            65 799999999875


No 57 
>PRK09968 serine/threonine-specific protein phosphatase 2; Provisional
Probab=99.71  E-value=1.6e-17  Score=176.54  Aligned_cols=120  Identities=23%  Similarity=0.244  Sum_probs=86.9

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccch
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADI  777 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~  777 (998)
                      ++++||||||||+..|+++|+.+.+....+     .++|||||||||++|.|||.+|.+      .+++.||||||.+.+
T Consensus        15 ~ri~visDiHg~~~~l~~~l~~~~~~~~~d-----~l~~lGD~vdrG~~~~~~l~~l~~------~~~~~v~GNHE~~~~   83 (218)
T PRK09968         15 RHIWVVGDIHGEYQLLQSRLHQLSFCPETD-----LLISVGDNIDRGPESLNVLRLLNQ------PWFISVKGNHEAMAL   83 (218)
T ss_pred             CeEEEEEeccCCHHHHHHHHHhcCCCCCCC-----EEEECCCCcCCCcCHHHHHHHHhh------CCcEEEECchHHHHH
Confidence            489999999999999999999987543221     799999999999999999999865      368999999999888


Q ss_pred             hhhcCChHHHHHHhCCCc-------chhhhhhhhhhhcccceeEEEc---CeEEEecCCcc
Q 001901          778 NALFGFRIECIERMGERD-------GIWAWHRINRLFNWLPLAALIE---KKIICMHGGIG  828 (998)
Q Consensus       778 ~~~~gf~~e~~~~~g~~~-------~~~~~~~~~~~f~~LP~aa~i~---~~il~vHgGi~  828 (998)
                      .....-....+...|...       .......+..+++.||+...+.   .++++||||++
T Consensus        84 ~~~~~~~~~~~~~~gg~~~~~l~~~~~~~~~~~~~~L~~LP~~~~~~~~g~~~~~vHAg~p  144 (218)
T PRK09968         84 DAFETGDGNMWLASGGDWFFDLNDSEQQEATDLLLKFHHLPHIIEITNDNIKYVIAHADYP  144 (218)
T ss_pred             HHHhcCChhHHHHccCHHHhcCCHHHHHHHHHHHHHHhcCCeEEEEeeCCCcEEEEeCCCC
Confidence            654321111111111110       0112233455789999997663   47999999984


No 58 
>COG3055 Uncharacterized protein conserved in bacteria [Function unknown]
Probab=99.67  E-value=4.7e-15  Score=159.87  Aligned_cols=282  Identities=18%  Similarity=0.215  Sum_probs=209.1

Q ss_pred             ccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCC--Cc
Q 001901           84 KKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLT--NK  161 (998)
Q Consensus        84 ~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t--~~  161 (998)
                      +..+.|.+--+-+-..+            ++.+||-=|..                         -...|.+|+..  ..
T Consensus        29 ~lPdlPvg~KnG~Ga~i------------g~~~YVGLGs~-------------------------G~afy~ldL~~~~k~   71 (381)
T COG3055          29 QLPDLPVGFKNGAGALI------------GDTVYVGLGSA-------------------------GTAFYVLDLKKPGKG   71 (381)
T ss_pred             cCCCCCcccccccccee------------cceEEEEeccC-------------------------CccceehhhhcCCCC
Confidence            34456666655555555            77888877742                         23667888875  57


Q ss_pred             EEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCC----CCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEEC
Q 001901          162 WSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAG----LSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVG  237 (998)
Q Consensus       162 W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~----~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~  237 (998)
                      |++++..  +-.+|....+++++++||||||.+...    ...+|+|+||+.+++  |+++.+.  .|..-.+|+++.++
T Consensus        72 W~~~a~F--pG~~rnqa~~a~~~~kLyvFgG~Gk~~~~~~~~~nd~Y~y~p~~ns--W~kl~t~--sP~gl~G~~~~~~~  145 (381)
T COG3055          72 WTKIADF--PGGARNQAVAAVIGGKLYVFGGYGKSVSSSPQVFNDAYRYDPSTNS--WHKLDTR--SPTGLVGASTFSLN  145 (381)
T ss_pred             ceEcccC--CCcccccchheeeCCeEEEeeccccCCCCCceEeeeeEEecCCCCh--hheeccc--cccccccceeEecC
Confidence            9999987  467899999999999999999987443    347999999999986  9999854  36678899999999


Q ss_pred             CcEEEEEcCCCC----------------------------------CCCcccEEEEECCCCCceEEEcccCCCCCCCccc
Q 001901          238 QRYLMAIGGNDG----------------------------------KRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMY  283 (998)
Q Consensus       238 ~~~Lyv~GG~~g----------------------------------~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~  283 (998)
                      +..+|++||.+.                                  ......++.||+.++  +|+.+...+.   -..+
T Consensus       146 ~~~i~f~GGvn~~if~~yf~dv~~a~~d~~~~~~i~~~yf~~~~~dy~~n~ev~sy~p~~n--~W~~~G~~pf---~~~a  220 (381)
T COG3055         146 GTKIYFFGGVNQNIFNGYFEDVGAAGKDKEAVDKIIAHYFDKKAEDYFFNKEVLSYDPSTN--QWRNLGENPF---YGNA  220 (381)
T ss_pred             CceEEEEccccHHhhhhhHHhhhhhcccHHHHHHHHHHHhCCCHHHhcccccccccccccc--hhhhcCcCcc---cCcc
Confidence            889999999841                                  112457899999999  9998764433   3456


Q ss_pred             eEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCc------ceeEEEEECCEEEEEcccCCCC-
Q 001901          284 ATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPR------YQHAAVFVNARLHVSGGALGGG-  356 (998)
Q Consensus       284 ~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR------~~hsav~~~~~L~V~GG~~~~~-  356 (998)
                      .++++..++++.++-|.-........++.++...+ .-+|......++..-      .++-.-..++.++|.||.+..+ 
T Consensus       221 Gsa~~~~~n~~~lInGEiKpGLRt~~~k~~~~~~~-~~~w~~l~~lp~~~~~~~eGvAGaf~G~s~~~~lv~GGAnF~Ga  299 (381)
T COG3055         221 GSAVVIKGNKLTLINGEIKPGLRTAEVKQADFGGD-NLKWLKLSDLPAPIGSNKEGVAGAFSGKSNGEVLVAGGANFPGA  299 (381)
T ss_pred             CcceeecCCeEEEEcceecCCccccceeEEEeccC-ceeeeeccCCCCCCCCCccccceeccceeCCeEEEecCCCChhH
Confidence            67788888999999998777777778888877644 446666665433322      2222334468899999963211 


Q ss_pred             --------------CccccCCeEEEEECCCCeEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEECCEEEEEc
Q 001901          357 --------------RMVEDSSSVAVLDTAAGVWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAVGDLIFIYG  422 (998)
Q Consensus       357 --------------~~~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~~LyVfG  422 (998)
                                    .......+||+||  .+.|+.+..+                     |.++++..++..++.||++|
T Consensus       300 ~~~y~~Gk~~AH~Gl~K~w~~~Vy~~d--~g~Wk~~GeL---------------------p~~l~YG~s~~~nn~vl~IG  356 (381)
T COG3055         300 LKAYKNGKFYAHEGLSKSWNSEVYIFD--NGSWKIVGEL---------------------PQGLAYGVSLSYNNKVLLIG  356 (381)
T ss_pred             HHHHHhcccccccchhhhhhceEEEEc--CCceeeeccc---------------------CCCccceEEEecCCcEEEEc
Confidence                          1123467899998  9999999888                     66888889999999999999


Q ss_pred             CC-CCCCCcccEEEec
Q 001901          423 GL-RGGVLLDDLLVAE  437 (998)
Q Consensus       423 G~-~~~~~l~Dv~~ld  437 (998)
                      |- +++..+..++.+-
T Consensus       357 GE~~~Gka~~~v~~l~  372 (381)
T COG3055         357 GETSGGKATTRVYSLS  372 (381)
T ss_pred             cccCCCeeeeeEEEEE
Confidence            94 4667788887764


No 59 
>KOG2437 consensus Muskelin [Signal transduction mechanisms]
Probab=99.52  E-value=3.1e-15  Score=165.33  Aligned_cols=313  Identities=17%  Similarity=0.257  Sum_probs=207.4

Q ss_pred             CCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEe
Q 001901           86 EDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRI  165 (998)
Q Consensus        86 g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l  165 (998)
                      ...|.-|.||.++....          .+.||++||.++..                     .+.|+|.|+...+.|+.+
T Consensus       255 ~~~p~~RgGHQMV~~~~----------~~CiYLYGGWdG~~---------------------~l~DFW~Y~v~e~~W~~i  303 (723)
T KOG2437|consen  255 DNRPGMRGGHQMVIDVQ----------TECVYLYGGWDGTQ---------------------DLADFWAYSVKENQWTCI  303 (723)
T ss_pred             ccCccccCcceEEEeCC----------CcEEEEecCcccch---------------------hHHHHHhhcCCcceeEEe
Confidence            36899999999999853          47999999998876                     788999999999999999


Q ss_pred             cCCCCCCCCccceEEEEeCC--EEEEEeCCCCCC-----CCcccEEEEEcCCCCCceEEeeec---CCCCCCCcccEEEE
Q 001901          166 TPFGEPPTPRAAHVATAVGT--MVVIQGGIGPAG-----LSAEDLHVLDLTQQRPRWHRVVVQ---GPGPGPRYGHVMAL  235 (998)
Q Consensus       166 ~~~g~~P~pR~~hsa~~~~~--~lyVfGG~~~~~-----~~~~dv~~~Dl~t~t~~W~~l~~~---g~~P~~R~~hs~~~  235 (998)
                      ...+..|..|..|-++....  ++|+.|-+-+.+     ..-.|+|+||..+++  |..+.-.   ..-|..-+.|.+++
T Consensus       304 N~~t~~PG~RsCHRMVid~S~~KLYLlG~Y~~sS~r~~~s~RsDfW~FDi~~~~--W~~ls~dt~~dGGP~~vfDHqM~V  381 (723)
T KOG2437|consen  304 NRDTEGPGARSCHRMVIDISRRKLYLLGRYLDSSVRNSKSLRSDFWRFDIDTNT--WMLLSEDTAADGGPKLVFDHQMCV  381 (723)
T ss_pred             ecCCCCCcchhhhhhhhhhhHhHHhhhhhccccccccccccccceEEEecCCce--eEEecccccccCCcceeecceeeE
Confidence            98888899999999999876  999999754322     235899999999986  9987632   23588899999999


Q ss_pred             ECCc-EEEEEcCCCC--C-CCcccEEEEECCCCCceEEEcccCCCC-------CCCccceEEEE-EeCCEEEEEeccCCC
Q 001901          236 VGQR-YLMAIGGNDG--K-RPLADVWALDTAAKPYEWRKLEPEGEG-------PPPCMYATASA-RSDGLLLLCGGRDAS  303 (998)
Q Consensus       236 ~~~~-~Lyv~GG~~g--~-~~lndv~~yD~~s~~~~W~~v~~~~~~-------P~~r~~~~a~~-~~~~~lyvfGG~~~~  303 (998)
                      .+++ .+|||||..-  + -.+.-++.||+...  .|..+......       -..|..|.+-. ..+.++|+|||...+
T Consensus       382 d~~k~~iyVfGGr~~~~~e~~f~GLYaf~~~~~--~w~~l~e~~~~~~~vvE~~~sR~ghcmE~~~~n~~ly~fggq~s~  459 (723)
T KOG2437|consen  382 DSEKHMIYVFGGRILTCNEPQFSGLYAFNCQCQ--TWKLLREDSCNAGPVVEDIQSRIGHCMEFHSKNRCLYVFGGQRSK  459 (723)
T ss_pred             ecCcceEEEecCeeccCCCccccceEEEecCCc--cHHHHHHHHhhcCcchhHHHHHHHHHHHhcCCCCeEEeccCcccc
Confidence            9873 3999999843  2 34788999999998  88776432110       01133443332 346789999997655


Q ss_pred             CCCcccEEEEecCCCCeEE----EEECCCCCCCCcceeEEEEE---CCEEEEEcccCCCCCc--cccCCeEEEEECCCCe
Q 001901          304 SVPLASAYGLAKHRDGRWE----WAIAPGVSPSPRYQHAAVFV---NARLHVSGGALGGGRM--VEDSSSVAVLDTAAGV  374 (998)
Q Consensus       304 ~~~~~dv~~~~~~~~~~W~----w~~~~g~~P~pR~~hsav~~---~~~L~V~GG~~~~~~~--~~~~~dv~vyD~~t~~  374 (998)
                      . .++-.+.|+....+.=.    ....+.+.|.+-...- +..   ...|++.-|.......  ....+++|+|+..+..
T Consensus       460 ~-El~L~f~y~I~~E~~~~~s~~~k~dsS~~pS~~f~qR-s~~dp~~~~i~~~~G~~~~~~~~e~~~rns~wi~~i~~~~  537 (723)
T KOG2437|consen  460 T-ELNLFFSYDIDSEHVDIISDGTKKDSSMVPSTGFTQR-ATIDPELNEIHVLSGLSKDKEKREENVRNSFWIYDIVRNS  537 (723)
T ss_pred             e-EEeehhcceeccccchhhhccCcCccccCCCcchhhh-cccCCCCcchhhhcccchhccCccccccCcEEEEEecccc
Confidence            4 34444444332110000    0001122222211111 222   3467777776432211  1236889999999999


Q ss_pred             EEEcccCcCCC-------CCCCCccccCCCCCccCCCCcceeEEEEE--CCEEEEEcCCCCC-----CCcccEEEeccc
Q 001901          375 WCDTKSVVTSP-------RTGRYSADAAGGDAAVELTRRCRHAAAAV--GDLIFIYGGLRGG-----VLLDDLLVAEDL  439 (998)
Q Consensus       375 W~~v~~~~~~p-------~~~~~~~~~~~~~~~~~p~~R~~hsa~~~--~~~LyVfGG~~~~-----~~l~Dv~~ld~~  439 (998)
                      |..+.......       +..++    .--.....+.+|++|+.++.  -.-+|.+||+.+.     ..++|.|.++..
T Consensus       538 w~cI~~I~~~~~d~dtvfsvpFp----~ks~~~~~~~~rf~h~~~~dL~~~~~yl~Ggn~~~~~~~~m~l~dfW~l~I~  612 (723)
T KOG2437|consen  538 WSCIYKIDQAAKDNDTVFSVPFP----TKSLQEEEPCPRFAHQLVYDLLHKVHYLFGGNPGKSCSPKMRLDDFWSLKIC  612 (723)
T ss_pred             hhhHhhhHHhhccCCceeeccCC----cccccceeccccchhHHHHHHhhhhhhhhcCCCCCCCCchhhhhhHHHHhhc
Confidence            98876552110       00001    01112345789999987655  5568999997653     567888888754


No 60 
>COG3055 Uncharacterized protein conserved in bacteria [Function unknown]
Probab=99.40  E-value=1.2e-11  Score=133.86  Aligned_cols=236  Identities=21%  Similarity=0.317  Sum_probs=165.6

Q ss_pred             CCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEecC
Q 001901           88 GPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRITP  167 (998)
Q Consensus        88 ~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l~~  167 (998)
                      +-.+|-+.+++++            +++||||||.......                .....+|+|+||+.+++|.++..
T Consensus        79 pG~~rnqa~~a~~------------~~kLyvFgG~Gk~~~~----------------~~~~~nd~Y~y~p~~nsW~kl~t  130 (381)
T COG3055          79 PGGARNQAVAAVI------------GGKLYVFGGYGKSVSS----------------SPQVFNDAYRYDPSTNSWHKLDT  130 (381)
T ss_pred             CCcccccchheee------------CCeEEEeeccccCCCC----------------CceEeeeeEEecCCCChhheecc
Confidence            4467888888888            7999999998765531                11289999999999999999998


Q ss_pred             CCCCCCCccceEEEEeCC-EEEEEeCCCCC---------------------------------CCCcccEEEEEcCCCCC
Q 001901          168 FGEPPTPRAAHVATAVGT-MVVIQGGIGPA---------------------------------GLSAEDLHVLDLTQQRP  213 (998)
Q Consensus       168 ~g~~P~pR~~hsa~~~~~-~lyVfGG~~~~---------------------------------~~~~~dv~~~Dl~t~t~  213 (998)
                      .  .|....+|+++.+++ ++|++||.+..                                 .....+++.|++.++  
T Consensus       131 ~--sP~gl~G~~~~~~~~~~i~f~GGvn~~if~~yf~dv~~a~~d~~~~~~i~~~yf~~~~~dy~~n~ev~sy~p~~n--  206 (381)
T COG3055         131 R--SPTGLVGASTFSLNGTKIYFFGGVNQNIFNGYFEDVGAAGKDKEAVDKIIAHYFDKKAEDYFFNKEVLSYDPSTN--  206 (381)
T ss_pred             c--cccccccceeEecCCceEEEEccccHHhhhhhHHhhhhhcccHHHHHHHHHHHhCCCHHHhcccccccccccccc--
Confidence            7  477788999999988 99999996411                                 112577888999887  


Q ss_pred             ceEEeeecCCCC-CCCcccEEEEECCcEEEEEcCCCC-CCCcccEEEEECCCCCceEEEcccCCCCCCCcc---ceEEEE
Q 001901          214 RWHRVVVQGPGP-GPRYGHVMALVGQRYLMAIGGNDG-KRPLADVWALDTAAKPYEWRKLEPEGEGPPPCM---YATASA  288 (998)
Q Consensus       214 ~W~~l~~~g~~P-~~R~~hs~~~~~~~~Lyv~GG~~g-~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~---~~~a~~  288 (998)
                      +|..+-   ..| .++++++. +..++++.++-|.-- .-+...+++++...+..+|..+.+.+.+.....   ..+...
T Consensus       207 ~W~~~G---~~pf~~~aGsa~-~~~~n~~~lInGEiKpGLRt~~~k~~~~~~~~~~w~~l~~lp~~~~~~~eGvAGaf~G  282 (381)
T COG3055         207 QWRNLG---ENPFYGNAGSAV-VIKGNKLTLINGEIKPGLRTAEVKQADFGGDNLKWLKLSDLPAPIGSNKEGVAGAFSG  282 (381)
T ss_pred             hhhhcC---cCcccCccCcce-eecCCeEEEEcceecCCccccceeEEEeccCceeeeeccCCCCCCCCCccccceeccc
Confidence            488774   444 57777555 444447888877632 234567888888877779999977654332221   122223


Q ss_pred             EeCCEEEEEeccCC---------------CC---CCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEc
Q 001901          289 RSDGLLLLCGGRDA---------------SS---VPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSG  350 (998)
Q Consensus       289 ~~~~~lyvfGG~~~---------------~~---~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~G  350 (998)
                      ..++.+++.||..-               .+   .-..++|.|+   ++.|+  .+ +..|.++....++..++.||++|
T Consensus       283 ~s~~~~lv~GGAnF~Ga~~~y~~Gk~~AH~Gl~K~w~~~Vy~~d---~g~Wk--~~-GeLp~~l~YG~s~~~nn~vl~IG  356 (381)
T COG3055         283 KSNGEVLVAGGANFPGALKAYKNGKFYAHEGLSKSWNSEVYIFD---NGSWK--IV-GELPQGLAYGVSLSYNNKVLLIG  356 (381)
T ss_pred             eeCCeEEEecCCCChhHHHHHHhcccccccchhhhhhceEEEEc---CCcee--ee-cccCCCccceEEEecCCcEEEEc
Confidence            55788889888421               11   1235677776   44555  33 34477888888899999999999


Q ss_pred             ccCCCCCccccCCeEEEE
Q 001901          351 GALGGGRMVEDSSSVAVL  368 (998)
Q Consensus       351 G~~~~~~~~~~~~dv~vy  368 (998)
                      |.+..+..   ...++.+
T Consensus       357 GE~~~Gka---~~~v~~l  371 (381)
T COG3055         357 GETSGGKA---TTRVYSL  371 (381)
T ss_pred             cccCCCee---eeeEEEE
Confidence            99877653   3445544


No 61 
>KOG2437 consensus Muskelin [Signal transduction mechanisms]
Probab=99.20  E-value=9.1e-12  Score=138.26  Aligned_cols=210  Identities=21%  Similarity=0.362  Sum_probs=154.7

Q ss_pred             CCceEEeeecC-------CCCCCCcccEEEEEC-CcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccc
Q 001901          212 RPRWHRVVVQG-------PGPGPRYGHVMALVG-QRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMY  283 (998)
Q Consensus       212 t~~W~~l~~~g-------~~P~~R~~hs~~~~~-~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~  283 (998)
                      +.+|+++....       ..|..|.+|-++.-. ++.+|++||.+|-..+.|+|.|+...+  .|+.+...+..|..|.+
T Consensus       238 ~~~W~~i~~~~~~~~~~~~~p~~RgGHQMV~~~~~~CiYLYGGWdG~~~l~DFW~Y~v~e~--~W~~iN~~t~~PG~RsC  315 (723)
T KOG2437|consen  238 KPRWSQIIPKSTKGDGEDNRPGMRGGHQMVIDVQTECVYLYGGWDGTQDLADFWAYSVKEN--QWTCINRDTEGPGARSC  315 (723)
T ss_pred             cccccccCchhhcccccccCccccCcceEEEeCCCcEEEEecCcccchhHHHHHhhcCCcc--eeEEeecCCCCCcchhh
Confidence            35799887654       578899999998764 359999999999999999999999999  99999988888999999


Q ss_pred             eEEEEE-eCCEEEEEeccCCCC-----CCcccEEEEecCCCCeEEEEECCCC---CCCCcceeEEEEECCE--EEEEccc
Q 001901          284 ATASAR-SDGLLLLCGGRDASS-----VPLASAYGLAKHRDGRWEWAIAPGV---SPSPRYQHAAVFVNAR--LHVSGGA  352 (998)
Q Consensus       284 ~~a~~~-~~~~lyvfGG~~~~~-----~~~~dv~~~~~~~~~~W~w~~~~g~---~P~pR~~hsav~~~~~--L~V~GG~  352 (998)
                      |-++.- ...+||+.|-+-+..     ..-+|.|.||..++ .|........   -|..-+.|.+++.+.+  +||+||.
T Consensus       316 HRMVid~S~~KLYLlG~Y~~sS~r~~~s~RsDfW~FDi~~~-~W~~ls~dt~~dGGP~~vfDHqM~Vd~~k~~iyVfGGr  394 (723)
T KOG2437|consen  316 HRMVIDISRRKLYLLGRYLDSSVRNSKSLRSDFWRFDIDTN-TWMLLSEDTAADGGPKLVFDHQMCVDSEKHMIYVFGGR  394 (723)
T ss_pred             hhhhhhhhHhHHhhhhhccccccccccccccceEEEecCCc-eeEEecccccccCCcceeecceeeEecCcceEEEecCe
Confidence            987763 456999998753221     23578999999877 6655444321   2677899999999887  9999998


Q ss_pred             CCCCCccccCCeEEEEECCCCeEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEE--CCEEEEEcCCCCCCCc
Q 001901          353 LGGGRMVEDSSSVAVLDTAAGVWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAV--GDLIFIYGGLRGGVLL  430 (998)
Q Consensus       353 ~~~~~~~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~--~~~LyVfGG~~~~~~l  430 (998)
                      .-... .....-+|.||.....|..+......          +.+ .-+....|.+|++-.+  ++.+|+|||.+....+
T Consensus       395 ~~~~~-e~~f~GLYaf~~~~~~w~~l~e~~~~----------~~~-vvE~~~sR~ghcmE~~~~n~~ly~fggq~s~~El  462 (723)
T KOG2437|consen  395 ILTCN-EPQFSGLYAFNCQCQTWKLLREDSCN----------AGP-VVEDIQSRIGHCMEFHSKNRCLYVFGGQRSKTEL  462 (723)
T ss_pred             eccCC-CccccceEEEecCCccHHHHHHHHhh----------cCc-chhHHHHHHHHHHHhcCCCCeEEeccCcccceEE
Confidence            54322 12367799999999999877654110          011 1223457888887666  5589999997765444


Q ss_pred             ccEEEe
Q 001901          431 DDLLVA  436 (998)
Q Consensus       431 ~Dv~~l  436 (998)
                      +=.+.+
T Consensus       463 ~L~f~y  468 (723)
T KOG2437|consen  463 NLFFSY  468 (723)
T ss_pred             eehhcc
Confidence            433333


No 62 
>PF00149 Metallophos:  Calcineurin-like phosphoesterase;  InterPro: IPR004843 This domain is found in a diverse range of phosphoesterases [], including protein phosphoserine phosphatases, nucleotidases, sphingomyelin phosphodiesterases and 2'-3' cAMP phosphodiesterases, as well as nucleases such as bacterial SbcD or yeast MRE11. The most conserved regions in this domain centre around the metal chelating residues.; GO: 0016787 hydrolase activity; PDB: 2IAE_C 3DW8_F 3FGA_C 2IE4_C 2NYM_C 2NYL_C 3K7V_C 2NPP_C 2IE3_C 3K7W_C ....
Probab=98.97  E-value=3.8e-09  Score=105.72  Aligned_cols=78  Identities=29%  Similarity=0.372  Sum_probs=57.1

Q ss_pred             CeEEEecCCCCHHHH---HHH-HHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHH--HHhhhcCCCcEEEeecCc
Q 001901          699 PIKIFGDLHGQFGDL---MRL-FDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLL--LALKVEYPNNVHLIRGNH  772 (998)
Q Consensus       699 ~i~vvGDiHG~~~dL---~~i-l~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll--~~lk~~~p~~v~llrGNH  772 (998)
                      +|+++||+|+.+...   .+. .........+      -+|++||++|+|..+.+.....  +..+...+..+++++|||
T Consensus         2 ri~~isD~H~~~~~~~~~~~~~~~~~~~~~~d------~ii~~GD~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~GNH   75 (200)
T PF00149_consen    2 RILVISDLHGGYDDDSDAFRKLDEIAAENKPD------FIIFLGDLVDGGNPSEEWRAQFWFFIRLLNPKIPVYFILGNH   75 (200)
T ss_dssp             EEEEEEBBTTTHHHHCHHHHHHHHHHHHTTTS------EEEEESTSSSSSSHHHHHHHHHHHHHHHHHTTTTEEEEE-TT
T ss_pred             eEEEEcCCCCCCcchhHHHHHHHHHhccCCCC------EEEeeccccccccccccchhhhccchhhhhcccccccccccc
Confidence            689999999999987   333 3322222222      6899999999999988877765  555666778999999999


Q ss_pred             cccchhhhcC
Q 001901          773 EAADINALFG  782 (998)
Q Consensus       773 E~~~~~~~~g  782 (998)
                      |.......+.
T Consensus        76 D~~~~~~~~~   85 (200)
T PF00149_consen   76 DYYSGNSFYG   85 (200)
T ss_dssp             SSHHHHHHHH
T ss_pred             ccceeccccc
Confidence            9987655443


No 63 
>COG0639 ApaH Diadenosine tetraphosphatase and related serine/threonine protein phosphatases [Signal transduction mechanisms]
Probab=98.81  E-value=7.3e-09  Score=102.47  Aligned_cols=147  Identities=35%  Similarity=0.484  Sum_probs=118.6

Q ss_pred             chhhhcCChHHHHHHhCCCcchhhhhh---hhhhhcccceeEEEcC-eEEEecCCccCcc-cCHHhhhhccCCc--ccCC
Q 001901          776 DINALFGFRIECIERMGERDGIWAWHR---INRLFNWLPLAALIEK-KIICMHGGIGRSI-NHVEQIENLQRPI--TMEA  848 (998)
Q Consensus       776 ~~~~~~gf~~e~~~~~g~~~~~~~~~~---~~~~f~~LP~aa~i~~-~il~vHgGi~~~~-~~~~~i~~i~rp~--~~~~  848 (998)
                      .++..+|+.++|...++..   ..|..   +.++|+.||+.+++++ .++|.|+++++.+ ..+++++.+.|..  .+..
T Consensus         2 ~l~~~~~~~~~~~~~~~~~---~~w~~~~g~~~~~~~lp~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~r~~~~~~~~   78 (155)
T COG0639           2 LLTALYGFYDEKLRKYGEE---LEWLRAAGGLETFDSLPLAAVAEGGKLLCHHGGLSPGLDRLLDIIEVLDRLRACEVPH   78 (155)
T ss_pred             hhhhhhchhHHhhhhcCCc---eeeeeccchhhHHHhhhHHHHhcCCceeeecCCCCcchhhhHHHHHHHhhhhcccCCC
Confidence            4566788998988877653   34655   9999999999999988 9999999999976 6778888877765  3333


Q ss_pred             CCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHHHHHHHHcCCcEEEEcccccccceEEecCCeEEEEecccccc
Q 001901          849 GSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRVMEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYC  928 (998)
Q Consensus       849 ~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~  928 (998)
                      .+ ...+.+|+++... ....|.+..||.+. .| ++....|+..+..+.|.|+|+.+..++...+.+..+|+|++++||
T Consensus        79 ~g-~~~~~~~~~~~~~-~~~~w~~~~~g~~~-~~-~~~~~~f~~~~~~~~~~~~~~~~~~d~~~~~~~~~lt~~~~~~~~  154 (155)
T COG0639          79 AG-HTHDLLWSDPDGG-DRRIWNPGPRGVPR-DG-GDVTAVFGIVHTPKLIERAHVLYDIDTGAVFGGGLLTAFSAPNYC  154 (155)
T ss_pred             cc-ccccccCCCCCCC-cccccccCCCCCCc-cc-cchhhHHhhhcccceEEEEeEEEecCceEEeCCCeeeEEeccccc
Confidence            33 5666699998752 25779999999983 34 788889998898888999999999999988776899999999997


Q ss_pred             C
Q 001901          929 G  929 (998)
Q Consensus       929 ~  929 (998)
                      .
T Consensus       155 ~  155 (155)
T COG0639         155 Y  155 (155)
T ss_pred             C
Confidence            3


No 64 
>PLN02772 guanylate kinase
Probab=98.74  E-value=5.4e-08  Score=110.00  Aligned_cols=93  Identities=17%  Similarity=0.312  Sum_probs=79.0

Q ss_pred             ccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEE
Q 001901           84 KKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWS  163 (998)
Q Consensus        84 ~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~  163 (998)
                      +.|-.+.|+..||++.+            ++++|||||.+....                    ..+++|+||..+.+|.
T Consensus        17 ~~~~~~~~~~~~tav~i------------gdk~yv~GG~~d~~~--------------------~~~~v~i~D~~t~~W~   64 (398)
T PLN02772         17 TNGFGVKPKNRETSVTI------------GDKTYVIGGNHEGNT--------------------LSIGVQILDKITNNWV   64 (398)
T ss_pred             ccCccCCCCCcceeEEE------------CCEEEEEcccCCCcc--------------------ccceEEEEECCCCcEe
Confidence            34456779999999999            899999999876432                    6789999999999999


Q ss_pred             EecCCCCCCCCccceEEEEeCC-EEEEEeCCCCCCCCcccEEEEEcCCC
Q 001901          164 RITPFGEPPTPRAAHVATAVGT-MVVIQGGIGPAGLSAEDLHVLDLTQQ  211 (998)
Q Consensus       164 ~l~~~g~~P~pR~~hsa~~~~~-~lyVfGG~~~~~~~~~dv~~~Dl~t~  211 (998)
                      .....|.+|.||.+|+++++++ +|+|+++...   ..+++|.+.+.+.
T Consensus        65 ~P~V~G~~P~~r~GhSa~v~~~~rilv~~~~~~---~~~~~w~l~~~t~  110 (398)
T PLN02772         65 SPIVLGTGPKPCKGYSAVVLNKDRILVIKKGSA---PDDSIWFLEVDTP  110 (398)
T ss_pred             cccccCCCCCCCCcceEEEECCceEEEEeCCCC---CccceEEEEcCCH
Confidence            9999999999999999999965 9999987543   3488999998873


No 65 
>PF13964 Kelch_6:  Kelch motif
Probab=98.73  E-value=2.8e-08  Score=80.03  Aligned_cols=50  Identities=42%  Similarity=0.823  Sum_probs=44.3

Q ss_pred             CCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEecCCCC
Q 001901           91 PRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRITPFGE  170 (998)
Q Consensus        91 pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l~~~g~  170 (998)
                      ||++|+++++            +++||||||......                    .++++++||+.+++|++++++  
T Consensus         1 pR~~~s~v~~------------~~~iyv~GG~~~~~~--------------------~~~~v~~yd~~t~~W~~~~~m--   46 (50)
T PF13964_consen    1 PRYGHSAVVV------------GGKIYVFGGYDNSGK--------------------YSNDVERYDPETNTWEQLPPM--   46 (50)
T ss_pred             CCccCEEEEE------------CCEEEEECCCCCCCC--------------------ccccEEEEcCCCCcEEECCCC--
Confidence            7999999999            799999999987421                    789999999999999999887  


Q ss_pred             CCCCc
Q 001901          171 PPTPR  175 (998)
Q Consensus       171 ~P~pR  175 (998)
                       |.||
T Consensus        47 -p~pR   50 (50)
T PF13964_consen   47 -PTPR   50 (50)
T ss_pred             -CCCC
Confidence             7776


No 66 
>PLN02772 guanylate kinase
Probab=98.71  E-value=6.1e-08  Score=109.58  Aligned_cols=89  Identities=18%  Similarity=0.412  Sum_probs=78.8

Q ss_pred             CCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCC
Q 001901          172 PTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKR  251 (998)
Q Consensus       172 P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~  251 (998)
                      +.|+.+|+++++++++|||||.++.+...+++|+||..+.+  |..+.+.|..|.+|.+|+++++++.+|+|+++..+..
T Consensus        22 ~~~~~~~tav~igdk~yv~GG~~d~~~~~~~v~i~D~~t~~--W~~P~V~G~~P~~r~GhSa~v~~~~rilv~~~~~~~~   99 (398)
T PLN02772         22 VKPKNRETSVTIGDKTYVIGGNHEGNTLSIGVQILDKITNN--WVSPIVLGTGPKPCKGYSAVVLNKDRILVIKKGSAPD   99 (398)
T ss_pred             CCCCCcceeEEECCEEEEEcccCCCccccceEEEEECCCCc--EecccccCCCCCCCCcceEEEECCceEEEEeCCCCCc
Confidence            56899999999999999999988766577999999999975  9999999999999999999999888999998765543


Q ss_pred             CcccEEEEECCCC
Q 001901          252 PLADVWALDTAAK  264 (998)
Q Consensus       252 ~lndv~~yD~~s~  264 (998)
                        .++|.+.+.+.
T Consensus       100 --~~~w~l~~~t~  110 (398)
T PLN02772        100 --DSIWFLEVDTP  110 (398)
T ss_pred             --cceEEEEcCCH
Confidence              78999888764


No 67 
>PF13964 Kelch_6:  Kelch motif
Probab=98.71  E-value=3e-08  Score=79.81  Aligned_cols=50  Identities=32%  Similarity=0.615  Sum_probs=45.7

Q ss_pred             CccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCC
Q 001901          174 PRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPR  228 (998)
Q Consensus       174 pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R  228 (998)
                      ||.+|++++++++|||+||........+++++||+.+++  |+.++   +||.+|
T Consensus         1 pR~~~s~v~~~~~iyv~GG~~~~~~~~~~v~~yd~~t~~--W~~~~---~mp~pR   50 (50)
T PF13964_consen    1 PRYGHSAVVVGGKIYVFGGYDNSGKYSNDVERYDPETNT--WEQLP---PMPTPR   50 (50)
T ss_pred             CCccCEEEEECCEEEEECCCCCCCCccccEEEEcCCCCc--EEECC---CCCCCC
Confidence            699999999999999999997767788999999999985  99998   899887


No 68 
>PF13415 Kelch_3:  Galactose oxidase, central domain
Probab=98.66  E-value=5.5e-08  Score=77.96  Aligned_cols=49  Identities=43%  Similarity=0.814  Sum_probs=41.0

Q ss_pred             CCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEecCCCCCCCCccceEEEEe
Q 001901          113 GPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAV  183 (998)
Q Consensus       113 ~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~  183 (998)
                      |++||||||.......                   .++|+|+||+.+++|+++   ++.|.||.+|+++++
T Consensus         1 g~~~~vfGG~~~~~~~-------------------~~nd~~~~~~~~~~W~~~---~~~P~~R~~h~~~~i   49 (49)
T PF13415_consen    1 GNKLYVFGGYDDDGGT-------------------RLNDVWVFDLDTNTWTRI---GDLPPPRSGHTATVI   49 (49)
T ss_pred             CCEEEEECCcCCCCCC-------------------EecCEEEEECCCCEEEEC---CCCCCCccceEEEEC
Confidence            4789999999842211                   889999999999999999   446999999999874


No 69 
>PRK09453 phosphodiesterase; Provisional
Probab=98.61  E-value=1.3e-07  Score=97.96  Aligned_cols=68  Identities=19%  Similarity=0.342  Sum_probs=53.2

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCC--------hHHHHHHHHHhhhcCCCcEEEee
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQH--------SLETITLLLALKVEYPNNVHLIR  769 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~--------s~evl~ll~~lk~~~p~~v~llr  769 (998)
                      +++.|++|+||++..|.++++.+.....+      .++++||++|+|+.        ..+++.+|..+    ...+++++
T Consensus         1 mri~viSD~Hg~~~~~~~~l~~~~~~~~d------~ii~lGDi~~~~~~~~~~~~~~~~~~~~~l~~~----~~~v~~V~   70 (182)
T PRK09453          1 MKLMFASDTHGSLPATEKALELFAQSGAD------WLVHLGDVLYHGPRNPLPEGYAPKKVAELLNAY----ADKIIAVR   70 (182)
T ss_pred             CeEEEEEeccCCHHHHHHHHHHHHhcCCC------EEEEcccccccCcCCCCccccCHHHHHHHHHhc----CCceEEEc
Confidence            36899999999999999998877433333      79999999999873        45677666554    24699999


Q ss_pred             cCcccc
Q 001901          770 GNHEAA  775 (998)
Q Consensus       770 GNHE~~  775 (998)
                      ||||..
T Consensus        71 GNhD~~   76 (182)
T PRK09453         71 GNCDSE   76 (182)
T ss_pred             cCCcch
Confidence            999974


No 70 
>PF12850 Metallophos_2:  Calcineurin-like phosphoesterase superfamily domain;  InterPro: IPR024654 Domains in this entry are members of the calcineurin-like phosphoesterase domain superfamily [].; PDB: 2GJU_A 1Z2W_A 1Z2X_B 3PSO_B 3PSN_B 1W24_A 2R17_B 3QFN_B 3QFO_A 3QFM_A ....
Probab=98.55  E-value=1.2e-06  Score=87.86  Aligned_cols=61  Identities=30%  Similarity=0.486  Sum_probs=44.7

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccc
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAAD  776 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~  776 (998)
                      ++|.++||+|++...+.++++.+.-  .+      .++++||++|+    .+++.++..+      .+++++||||...
T Consensus         1 Mki~~~sD~H~~~~~~~~~~~~~~~--~d------~vi~~GDi~~~----~~~~~~~~~~------~~~~v~GNHD~~~   61 (156)
T PF12850_consen    1 MKIAVISDLHGNLDALEAVLEYINE--PD------FVIILGDIFDP----EEVLELLRDI------PVYVVRGNHDNWA   61 (156)
T ss_dssp             EEEEEEE--TTTHHHHHHHHHHHTT--ES------EEEEES-SCSH----HHHHHHHHHH------EEEEE--CCHSTH
T ss_pred             CEEEEEeCCCCChhHHHHHHHHhcC--CC------EEEECCCchhH----HHHHHHHhcC------CEEEEeCCccccc
Confidence            3689999999999999999999821  22      68899999993    7777777555      6999999999644


No 71 
>cd00841 MPP_YfcE Escherichia coli YfcE and related proteins, metallophosphatase domain. YfcE is a manganase-dependent metallophosphatase, found in bacteria and archaea, that cleaves bis-p-nitrophenyl phosphate, thymidine 5'-monophosphate-p-nitrophenyl ester, and p-nitrophenyl phosphorylcholine, but is unable to hydrolyze 2',3 ' or 3',5' cyclic nucleic phosphodiesters, and various phosphomonoesters, including p-nitrophenyl phosphate. This family also includes the Bacilus subtilis YsnB and Methanococcus jannaschii MJ0936 proteins.  This domain family belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid ph
Probab=98.51  E-value=3.3e-07  Score=92.23  Aligned_cols=59  Identities=24%  Similarity=0.400  Sum_probs=47.8

Q ss_pred             CeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCcccc
Q 001901          699 PIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAA  775 (998)
Q Consensus       699 ~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~  775 (998)
                      ++.+++|+||++..+.++++.+..  .+      .++++||+++++....        ++.  ...+++++||||..
T Consensus         1 ~i~~isD~H~~~~~~~~~~~~~~~--~d------~ii~~GD~~~~~~~~~--------~~~--~~~~~~V~GNhD~~   59 (155)
T cd00841           1 KIGVISDTHGSLELLEKALELFGD--VD------LIIHAGDVLYPGPLNE--------LEL--KAPVIAVRGNCDGE   59 (155)
T ss_pred             CEEEEecCCCCHHHHHHHHHHhcC--CC------EEEECCccccccccch--------hhc--CCcEEEEeCCCCCc
Confidence            478999999999999999998754  22      7999999999998754        222  24699999999974


No 72 
>PF13418 Kelch_4:  Galactose oxidase, central domain; PDB: 2UVK_B.
Probab=98.47  E-value=1.5e-07  Score=75.42  Aligned_cols=47  Identities=28%  Similarity=0.678  Sum_probs=30.8

Q ss_pred             CCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEecCC
Q 001901           91 PRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRITPF  168 (998)
Q Consensus        91 pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l~~~  168 (998)
                      ||++|+++.+.           +++||||||......                    .++|+|+||+.+++|++++++
T Consensus         1 pR~~h~~~~~~-----------~~~i~v~GG~~~~~~--------------------~~~d~~~~d~~~~~W~~~~~~   47 (49)
T PF13418_consen    1 PRYGHSAVSIG-----------DNSIYVFGGRDSSGS--------------------PLNDLWIFDIETNTWTRLPSM   47 (49)
T ss_dssp             --BS-EEEEE------------TTEEEEE--EEE-TE--------------------E---EEEEETTTTEEEE--SS
T ss_pred             CcceEEEEEEe-----------CCeEEEECCCCCCCc--------------------ccCCEEEEECCCCEEEECCCC
Confidence            79999999984           479999999987542                    899999999999999999554


No 73 
>PF07646 Kelch_2:  Kelch motif;  InterPro: IPR011498 Kelch is a 50-residue motif, named after the Drosophila mutant in which it was first identified []. This sequence motif represents one beta-sheet blade, and several of these repeats can associate to form a beta-propeller. For instance, the motif appears 6 times in Drosophila egg-chamber regulatory protein, creating a 6-bladed beta-propeller. The motif is also found in mouse protein MIPP [] and in a number of poxviruses. In addition, kelch repeats have been recognised in alpha- and beta-scruin [, ], and in galactose oxidase from the fungus Dactylium dendroides [, ]. The structure of galactose oxidase reveals that the repeated sequence corresponds to a 4-stranded anti-parallel beta-sheet motif that forms the repeat unit in a super-barrel structural fold []. The known functions of kelch-containing proteins are diverse: scruin is an actin cross-linking protein; galactose oxidase catalyses the oxidation of the hydroxyl group at the C6 position in D-galactose; neuraminidase hydrolyses sialic acid residues from glycoproteins; and kelch may have a cytoskeletal function, as it is localised to the actin-rich ring canals that connect the 15 nurse cells to the developing oocyte in Drosophila []. Nevertheless, based on the location of the kelch pattern in the catalytic unit in galactose oxidase, functionally important residues have been predicted in glyoxal oxidase []. This entry represents a type of kelch sequence motif that comprises one beta-sheet blade.; GO: 0005515 protein binding
Probab=98.45  E-value=4.4e-07  Score=72.72  Aligned_cols=47  Identities=34%  Similarity=0.620  Sum_probs=40.1

Q ss_pred             CcceeEEEEECCEEEEEccc-CCCCCccccCCeEEEEECCCCeEEEcccC
Q 001901          333 PRYQHAAVFVNARLHVSGGA-LGGGRMVEDSSSVAVLDTAAGVWCDTKSV  381 (998)
Q Consensus       333 pR~~hsav~~~~~L~V~GG~-~~~~~~~~~~~dv~vyD~~t~~W~~v~~~  381 (998)
                      ||++|++++++++|||+||+ ....  ....+++++||+++.+|+.+..+
T Consensus         1 ~r~~hs~~~~~~kiyv~GG~~~~~~--~~~~~~v~~~d~~t~~W~~~~~~   48 (49)
T PF07646_consen    1 PRYGHSAVVLDGKIYVFGGYGTDNG--GSSSNDVWVFDTETNQWTELSPM   48 (49)
T ss_pred             CccceEEEEECCEEEEECCcccCCC--CcccceeEEEECCCCEEeecCCC
Confidence            68999999999999999999 2221  24589999999999999998876


No 74 
>TIGR00040 yfcE phosphoesterase, MJ0936 family. Members of this largely uncharacterized family share a motif approximating DXH(X25)GDXXD(X25)GNHD as found in several phosphoesterases, including the nucleases SbcD and Mre11, and a family of uncharacterized archaeal putative phosphoesterases described by TIGR00024. In this family, the His residue in GNHD portion of the motif is not conserved. The member MJ0936, one of two from Methanococcus jannaschii, was shown (PubMed:15128743) to act on model phosphodiesterase substrates; a divalent cation was required.
Probab=98.45  E-value=4.2e-06  Score=84.62  Aligned_cols=62  Identities=19%  Similarity=0.253  Sum_probs=46.9

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCC-CCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccc
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSP-STAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~-~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~  774 (998)
                      +++.|++|+||++..+..+++..... ..+      .++++||++     +.+++.+|..+.    ..++.++||||.
T Consensus         1 m~i~viSD~H~~~~~~~~~~~~~~~~~~~d------~ii~~GD~~-----~~~~~~~l~~~~----~~~~~V~GN~D~   63 (158)
T TIGR00040         1 MKILVISDTHGPLRATELPVELFNLESNVD------LVIHAGDLT-----SPFVLKEFEDLA----AKVIAVRGNNDG   63 (158)
T ss_pred             CEEEEEecccCCcchhHhHHHHHhhccCCC------EEEEcCCCC-----CHHHHHHHHHhC----CceEEEccCCCc
Confidence            36899999999998777666655433 223      789999999     467777776542    359999999998


No 75 
>PF13415 Kelch_3:  Galactose oxidase, central domain
Probab=98.44  E-value=3.7e-07  Score=73.13  Aligned_cols=48  Identities=33%  Similarity=0.704  Sum_probs=41.9

Q ss_pred             CCEEEEEeCCC-CCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEE
Q 001901          184 GTMVVIQGGIG-PAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALV  236 (998)
Q Consensus       184 ~~~lyVfGG~~-~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~  236 (998)
                      +++||||||.+ .....++|+|+||+.+.  +|+++   +++|.+|++|+++++
T Consensus         1 g~~~~vfGG~~~~~~~~~nd~~~~~~~~~--~W~~~---~~~P~~R~~h~~~~i   49 (49)
T PF13415_consen    1 GNKLYVFGGYDDDGGTRLNDVWVFDLDTN--TWTRI---GDLPPPRSGHTATVI   49 (49)
T ss_pred             CCEEEEECCcCCCCCCEecCEEEEECCCC--EEEEC---CCCCCCccceEEEEC
Confidence            57999999998 46778899999999987  59988   589999999999864


No 76 
>PF13418 Kelch_4:  Galactose oxidase, central domain; PDB: 2UVK_B.
Probab=98.42  E-value=2.2e-07  Score=74.34  Aligned_cols=46  Identities=35%  Similarity=0.850  Sum_probs=30.6

Q ss_pred             CCcccEEEEECCcEEEEEcCCCCC-CCcccEEEEECCCCCceEEEcccC
Q 001901          227 PRYGHVMALVGQRYLMAIGGNDGK-RPLADVWALDTAAKPYEWRKLEPE  274 (998)
Q Consensus       227 ~R~~hs~~~~~~~~Lyv~GG~~g~-~~lndv~~yD~~s~~~~W~~v~~~  274 (998)
                      ||++|+++.++++.||||||.+.. ..++|+|+||+.++  +|+++.++
T Consensus         1 pR~~h~~~~~~~~~i~v~GG~~~~~~~~~d~~~~d~~~~--~W~~~~~~   47 (49)
T PF13418_consen    1 PRYGHSAVSIGDNSIYVFGGRDSSGSPLNDLWIFDIETN--TWTRLPSM   47 (49)
T ss_dssp             --BS-EEEEE-TTEEEEE--EEE-TEE---EEEEETTTT--EEEE--SS
T ss_pred             CcceEEEEEEeCCeEEEECCCCCCCcccCCEEEEECCCC--EEEECCCC
Confidence            699999999975699999999886 68999999999999  99999443


No 77 
>cd07379 MPP_239FB Homo sapiens 239FB and related proteins, metallophosphatase domain. 239FB (Fetal brain protein 239) is thought to play a role in central nervous system development, but its specific role in unknown.  239FB is expressed predominantly in human fetal brain from a gene located in the chromosome 11p13 region associated with the mental retardation component of the WAGR (Wilms tumor, Aniridia, Genitourinary anomalies, Mental retardation) syndrome. Orthologous brp-like (brain protein 239-like) proteins have been identified in the invertebrate amphioxus group and in vertebrates.  239FB belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzyme
Probab=98.40  E-value=1.7e-06  Score=85.06  Aligned_cols=118  Identities=22%  Similarity=0.265  Sum_probs=77.5

Q ss_pred             CeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChH--HHHHHHHHhhhcCCCcEEEeecCccccc
Q 001901          699 PIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSL--ETITLLLALKVEYPNNVHLIRGNHEAAD  776 (998)
Q Consensus       699 ~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~--evl~ll~~lk~~~p~~v~llrGNHE~~~  776 (998)
                      ++.+++|+||++.    .+   .....+      .+|++||++++|...-  +++.++..++  .| .+++++||||...
T Consensus         1 ~i~~isD~H~~~~----~~---~~~~~D------~vi~~GD~~~~~~~~~~~~~~~~l~~~~--~~-~~~~v~GNHD~~~   64 (135)
T cd07379           1 RFVCISDTHSRHR----TI---SIPDGD------VLIHAGDLTERGTLEELQKFLDWLKSLP--HP-HKIVIAGNHDLTL   64 (135)
T ss_pred             CEEEEeCCCCCCC----cC---cCCCCC------EEEECCCCCCCCCHHHHHHHHHHHHhCC--CC-eEEEEECCCCCcC
Confidence            4789999999987    11   111222      6888999999986532  2444444432  22 3678999999631


Q ss_pred             hhhhcCChHHHHHHhCCCcchhhhhhhhhhhcccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceecc
Q 001901          777 INALFGFRIECIERMGERDGIWAWHRINRLFNWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDL  856 (998)
Q Consensus       777 ~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dl  856 (998)
                      .                                     .-+.+++++||.+....                       +.
T Consensus        65 ~-------------------------------------~~~~~ilv~H~~p~~~~-----------------------~~   84 (135)
T cd07379          65 D-------------------------------------PEDTDILVTHGPPYGHL-----------------------DL   84 (135)
T ss_pred             C-------------------------------------CCCCEEEEECCCCCcCc-----------------------cc
Confidence            1                                     11347899999642210                       00


Q ss_pred             ccCCCCCCCCCCCcccCCCCCCceeeCHHHHHHHHHHcCCcEEEEcccccccceE
Q 001901          857 LWSDPTENDSVEGLRPNARGPGLVTFGPDRVMEFCNNNDLQLIVRAHECVMDGFE  911 (998)
Q Consensus       857 LWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~  911 (998)
                      ++  +                . ..+|.+.+.+++++.+.+++|-||.-.+.|++
T Consensus        85 ~~--~----------------~-~~~g~~~~~~~~~~~~~~~~i~GH~H~~~~~~  120 (135)
T cd07379          85 VS--S----------------G-QRVGCEELLNRVQRVRPKLHVFGHIHEGYGAE  120 (135)
T ss_pred             cc--c----------------C-cccCCHHHHHHHHHHCCcEEEEcCcCCcCcee
Confidence            00  0                0 23677889999999999999999999888887


No 78 
>PF07646 Kelch_2:  Kelch motif;  InterPro: IPR011498 Kelch is a 50-residue motif, named after the Drosophila mutant in which it was first identified []. This sequence motif represents one beta-sheet blade, and several of these repeats can associate to form a beta-propeller. For instance, the motif appears 6 times in Drosophila egg-chamber regulatory protein, creating a 6-bladed beta-propeller. The motif is also found in mouse protein MIPP [] and in a number of poxviruses. In addition, kelch repeats have been recognised in alpha- and beta-scruin [, ], and in galactose oxidase from the fungus Dactylium dendroides [, ]. The structure of galactose oxidase reveals that the repeated sequence corresponds to a 4-stranded anti-parallel beta-sheet motif that forms the repeat unit in a super-barrel structural fold []. The known functions of kelch-containing proteins are diverse: scruin is an actin cross-linking protein; galactose oxidase catalyses the oxidation of the hydroxyl group at the C6 position in D-galactose; neuraminidase hydrolyses sialic acid residues from glycoproteins; and kelch may have a cytoskeletal function, as it is localised to the actin-rich ring canals that connect the 15 nurse cells to the developing oocyte in Drosophila []. Nevertheless, based on the location of the kelch pattern in the catalytic unit in galactose oxidase, functionally important residues have been predicted in glyoxal oxidase []. This entry represents a type of kelch sequence motif that comprises one beta-sheet blade.; GO: 0005515 protein binding
Probab=98.34  E-value=1.2e-06  Score=70.11  Aligned_cols=46  Identities=37%  Similarity=0.862  Sum_probs=41.0

Q ss_pred             CCcccEEEEECCcEEEEEcCC---CCCCCcccEEEEECCCCCceEEEcccCC
Q 001901          227 PRYGHVMALVGQRYLMAIGGN---DGKRPLADVWALDTAAKPYEWRKLEPEG  275 (998)
Q Consensus       227 ~R~~hs~~~~~~~~Lyv~GG~---~g~~~lndv~~yD~~s~~~~W~~v~~~~  275 (998)
                      +|++|+++++++ +||||||.   +.....+++++||+.+.  +|+.+.+++
T Consensus         1 ~r~~hs~~~~~~-kiyv~GG~~~~~~~~~~~~v~~~d~~t~--~W~~~~~~g   49 (49)
T PF07646_consen    1 PRYGHSAVVLDG-KIYVFGGYGTDNGGSSSNDVWVFDTETN--QWTELSPMG   49 (49)
T ss_pred             CccceEEEEECC-EEEEECCcccCCCCcccceeEEEECCCC--EEeecCCCC
Confidence            699999999998 89999999   55667999999999999  999998753


No 79 
>cd07397 MPP_DevT Myxococcus xanthus DevT and related proteins, metallophosphatase domain. DevT is a component in the C-signal response pathway in Myxococcus xanthus that stimulates the developmentally regulated expression of the FruA response regulator protein and is required for methylation of FrzCD during fruiting body formation.  DevT mutants having an in-frame deletion in the devT gene, display delayed aggregation and a cell autonomous sporulation defect.  DevT belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomy
Probab=98.32  E-value=2e-06  Score=91.78  Aligned_cols=113  Identities=23%  Similarity=0.239  Sum_probs=72.9

Q ss_pred             CeEEEecCCCCHHHHH-HHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccch
Q 001901          699 PIKIFGDLHGQFGDLM-RLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADI  777 (998)
Q Consensus       699 ~i~vvGDiHG~~~dL~-~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~  777 (998)
                      +|.++|||||++.... +.++..+  + +      .+||+||+++.   +.+++..|..+    +..+++++||||....
T Consensus         2 rIa~isDiHg~~~~~~~~~l~~~~--p-D------~Vl~~GDi~~~---~~~~~~~l~~l----~~p~~~V~GNHD~~~~   65 (238)
T cd07397           2 RIAIVGDVHGQWDLEDIKALHLLQ--P-D------LVLFVGDFGNE---SVQLVRAISSL----PLPKAVILGNHDAWYD   65 (238)
T ss_pred             EEEEEecCCCCchHHHHHHHhccC--C-C------EEEECCCCCcC---hHHHHHHHHhC----CCCeEEEcCCCccccc
Confidence            5899999999987642 3343332  1 2      69999999864   56777776654    2358999999997543


Q ss_pred             hhh---cC-----------------------------------------C-hHHHHHHhCCCcchhhhhhhhhhhcccce
Q 001901          778 NAL---FG-----------------------------------------F-RIECIERMGERDGIWAWHRINRLFNWLPL  812 (998)
Q Consensus       778 ~~~---~g-----------------------------------------f-~~e~~~~~g~~~~~~~~~~~~~~f~~LP~  812 (998)
                      ...   +.                                         + ..++..+|+-   ...++.+..+++.++.
T Consensus        66 ~~~~~k~~~l~~~L~~lg~~~l~~~~~~~~~~~~~vvG~R~~~~~g~~~~~~~~vr~~fgi---~s~~eA~~~ive~~~~  142 (238)
T cd07397          66 ATFRKKGDRVQEQLELLGDLHCGWGRLDFPPLPLSVVGGRPFSAGGGFWLSKKAVKAVYGV---ISLEESAQRIIAAAKK  142 (238)
T ss_pred             ccccchHHHHHHHHHHhCCcEEeecccccCCCCeEEEeeCCccCCCccccCHHHHHHHhCC---CCHHHHHHHHHHHhhh
Confidence            200   00                                         0 1245555652   2455677777888864


Q ss_pred             eEEEcCeEEEecCCccCc
Q 001901          813 AALIEKKIICMHGGIGRS  830 (998)
Q Consensus       813 aa~i~~~il~vHgGi~~~  830 (998)
                      +......||+.|+++.-.
T Consensus       143 ~~~~~~~VliaH~~~~G~  160 (238)
T cd07397         143 APPDLPLILLAHNGPSGL  160 (238)
T ss_pred             cCCCCCeEEEeCcCCcCC
Confidence            434445799999998643


No 80 
>cd07388 MPP_Tt1561 Thermus thermophilus Tt1561 and related proteins, metallophosphatase domain. This family includes bacterial proteins related to Tt1561 (also known as Aq1956 in Aquifex aeolicus), an uncharacterized Thermus thermophilus protein.  The conserved domain present in members of this family belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets,
Probab=98.30  E-value=5.2e-06  Score=88.43  Aligned_cols=71  Identities=11%  Similarity=0.178  Sum_probs=55.5

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCcccc
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAA  775 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~  775 (998)
                      .+|.+++||||++..|.++++.+.....+      .+|++||++++|...-++..++-.|... +..+++++||||..
T Consensus         5 ~kIl~iSDiHgn~~~le~l~~~~~~~~~D------~vv~~GDl~~~g~~~~~~~~~l~~l~~l-~~pv~~V~GNhD~~   75 (224)
T cd07388           5 RYVLATSNPKGDLEALEKLVGLAPETGAD------AIVLIGNLLPKAAKSEDYAAFFRILGEA-HLPTFYVPGPQDAP   75 (224)
T ss_pred             eEEEEEEecCCCHHHHHHHHHHHhhcCCC------EEEECCCCCCCCCCHHHHHHHHHHHHhc-CCceEEEcCCCChH
Confidence            46999999999999999999876322223      6999999999997666676666666432 34699999999975


No 81 
>PF13854 Kelch_5:  Kelch motif
Probab=98.29  E-value=1.3e-06  Score=67.47  Aligned_cols=40  Identities=40%  Similarity=0.578  Sum_probs=36.2

Q ss_pred             CCCCccceEEEEeCCEEEEEeCCC-CCCCCcccEEEEEcCC
Q 001901          171 PPTPRAAHVATAVGTMVVIQGGIG-PAGLSAEDLHVLDLTQ  210 (998)
Q Consensus       171 ~P~pR~~hsa~~~~~~lyVfGG~~-~~~~~~~dv~~~Dl~t  210 (998)
                      +|.||.+|++++++++||||||.. ......+|+|+||+.+
T Consensus         1 ~P~~R~~hs~~~~~~~iyi~GG~~~~~~~~~~d~~~l~l~s   41 (42)
T PF13854_consen    1 IPSPRYGHSAVVVGNNIYIFGGYSGNNNSYSNDLYVLDLPS   41 (42)
T ss_pred             CCCCccceEEEEECCEEEEEcCccCCCCCEECcEEEEECCC
Confidence            489999999999999999999998 3677889999999876


No 82 
>PF01344 Kelch_1:  Kelch motif;  InterPro: IPR006652 Kelch is a 50-residue motif, named after the Drosophila mutant in which it was first identified []. This sequence motif represents one beta-sheet blade, and several of these repeats can associate to form a beta-propeller. For instance, the motif appears 6 times in Drosophila egg-chamber regulatory protein, creating a 6-bladed beta-propeller. The motif is also found in mouse protein MIPP [] and in a number of poxviruses. In addition, kelch repeats have been recognised in alpha- and beta-scruin [, ], and in galactose oxidase from the fungus Dactylium dendroides [, ]. The structure of galactose oxidase reveals that the repeated sequence corresponds to a 4-stranded anti-parallel beta-sheet motif that forms the repeat unit in a super-barrel structural fold []. The known functions of kelch-containing proteins are diverse: scruin is an actin cross-linking protein; galactose oxidase catalyses the oxidation of the hydroxyl group at the C6 position in D-galactose; neuraminidase hydrolyses sialic acid residues from glycoproteins; and kelch may have a cytoskeletal function, as it is localised to the actin-rich ring canals that connect the 15 nurse cells to the developing oocyte in Drosophila []. Nevertheless, based on the location of the kelch pattern in the catalytic unit in galactose oxidase, functionally important residues have been predicted in glyoxal oxidase []. This entry represents a type of kelch sequence motif that comprises one beta-sheet blade.; GO: 0005515 protein binding; PDB: 2XN4_A 2WOZ_A 3II7_A 4ASC_A 1U6D_X 1ZGK_A 2FLU_X 2VPJ_A 2DYH_A 1X2R_A ....
Probab=98.27  E-value=1.1e-06  Score=69.58  Aligned_cols=44  Identities=25%  Similarity=0.532  Sum_probs=40.2

Q ss_pred             CccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEee
Q 001901          174 PRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVV  219 (998)
Q Consensus       174 pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~  219 (998)
                      ||.+|++++++++|||+||.......++++++||+.++  +|..++
T Consensus         1 pR~~~~~~~~~~~iyv~GG~~~~~~~~~~v~~yd~~~~--~W~~~~   44 (47)
T PF01344_consen    1 PRSGHAAVVVGNKIYVIGGYDGNNQPTNSVEVYDPETN--TWEELP   44 (47)
T ss_dssp             -BBSEEEEEETTEEEEEEEBESTSSBEEEEEEEETTTT--EEEEEE
T ss_pred             CCccCEEEEECCEEEEEeeecccCceeeeEEEEeCCCC--EEEEcC
Confidence            69999999999999999999887788999999999998  599997


No 83 
>PF01344 Kelch_1:  Kelch motif;  InterPro: IPR006652 Kelch is a 50-residue motif, named after the Drosophila mutant in which it was first identified []. This sequence motif represents one beta-sheet blade, and several of these repeats can associate to form a beta-propeller. For instance, the motif appears 6 times in Drosophila egg-chamber regulatory protein, creating a 6-bladed beta-propeller. The motif is also found in mouse protein MIPP [] and in a number of poxviruses. In addition, kelch repeats have been recognised in alpha- and beta-scruin [, ], and in galactose oxidase from the fungus Dactylium dendroides [, ]. The structure of galactose oxidase reveals that the repeated sequence corresponds to a 4-stranded anti-parallel beta-sheet motif that forms the repeat unit in a super-barrel structural fold []. The known functions of kelch-containing proteins are diverse: scruin is an actin cross-linking protein; galactose oxidase catalyses the oxidation of the hydroxyl group at the C6 position in D-galactose; neuraminidase hydrolyses sialic acid residues from glycoproteins; and kelch may have a cytoskeletal function, as it is localised to the actin-rich ring canals that connect the 15 nurse cells to the developing oocyte in Drosophila []. Nevertheless, based on the location of the kelch pattern in the catalytic unit in galactose oxidase, functionally important residues have been predicted in glyoxal oxidase []. This entry represents a type of kelch sequence motif that comprises one beta-sheet blade.; GO: 0005515 protein binding; PDB: 2XN4_A 2WOZ_A 3II7_A 4ASC_A 1U6D_X 1ZGK_A 2FLU_X 2VPJ_A 2DYH_A 1X2R_A ....
Probab=98.25  E-value=1.1e-06  Score=69.56  Aligned_cols=45  Identities=38%  Similarity=0.753  Sum_probs=41.0

Q ss_pred             CCcccEEEEECCcEEEEEcCCCC-CCCcccEEEEECCCCCceEEEcccC
Q 001901          227 PRYGHVMALVGQRYLMAIGGNDG-KRPLADVWALDTAAKPYEWRKLEPE  274 (998)
Q Consensus       227 ~R~~hs~~~~~~~~Lyv~GG~~g-~~~lndv~~yD~~s~~~~W~~v~~~  274 (998)
                      ||++|+++++++ +|||+||.++ ...++++++||+.++  +|+.++++
T Consensus         1 pR~~~~~~~~~~-~iyv~GG~~~~~~~~~~v~~yd~~~~--~W~~~~~m   46 (47)
T PF01344_consen    1 PRSGHAAVVVGN-KIYVIGGYDGNNQPTNSVEVYDPETN--TWEELPPM   46 (47)
T ss_dssp             -BBSEEEEEETT-EEEEEEEBESTSSBEEEEEEEETTTT--EEEEEEEE
T ss_pred             CCccCEEEEECC-EEEEEeeecccCceeeeEEEEeCCCC--EEEEcCCC
Confidence            689999999998 8999999988 778999999999999  99998765


No 84 
>PF13854 Kelch_5:  Kelch motif
Probab=98.23  E-value=2e-06  Score=66.51  Aligned_cols=39  Identities=36%  Similarity=0.701  Sum_probs=35.4

Q ss_pred             CCCCCcccEEEEECCcEEEEEcCCCC--CCCcccEEEEECCC
Q 001901          224 GPGPRYGHVMALVGQRYLMAIGGNDG--KRPLADVWALDTAA  263 (998)
Q Consensus       224 ~P~~R~~hs~~~~~~~~Lyv~GG~~g--~~~lndv~~yD~~s  263 (998)
                      +|.+|++|+++++++ +||||||.++  ...++|+|+||+.+
T Consensus         1 ~P~~R~~hs~~~~~~-~iyi~GG~~~~~~~~~~d~~~l~l~s   41 (42)
T PF13854_consen    1 IPSPRYGHSAVVVGN-NIYIFGGYSGNNNSYSNDLYVLDLPS   41 (42)
T ss_pred             CCCCccceEEEEECC-EEEEEcCccCCCCCEECcEEEEECCC
Confidence            488999999999997 8999999994  77799999999976


No 85 
>cd00838 MPP_superfamily metallophosphatase superfamily, metallophosphatase domain. Metallophosphatases (MPPs), also known as metallophosphoesterases, phosphodiesterases (PDEs), binuclear metallophosphoesterases, and dimetal-containing phosphoesterases (DMPs), represent a diverse superfamily of enzymes with a conserved domain containing an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. This superfamily includes: the phosphoprotein phosphatases (PPPs), Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets.  This domain is thought to allow for productive me
Probab=98.17  E-value=1.5e-05  Score=76.32  Aligned_cols=117  Identities=23%  Similarity=0.365  Sum_probs=82.0

Q ss_pred             EEEecCCCCHHHHHHHH--HHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchh
Q 001901          701 KIFGDLHGQFGDLMRLF--DEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADIN  778 (998)
Q Consensus       701 ~vvGDiHG~~~dL~~il--~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~  778 (998)
                      +++||+|+.........  ........+      .+|++||+++.+....+........+......++++.||||     
T Consensus         1 ~~~gD~h~~~~~~~~~~~~~~~~~~~~~------~vi~~GD~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~GNHD-----   69 (131)
T cd00838           1 AVISDIHGNLEALEAVLEAALAAAEKPD------FVLVLGDLVGDGPDPEEVLAAALALLLLLGIPVYVVPGNHD-----   69 (131)
T ss_pred             CeeecccCCccchHHHHHHHHhcccCCC------EEEECCcccCCCCCchHHHHHHHHHhhcCCCCEEEeCCCce-----
Confidence            47999999998888764  221111112      68999999999998877766544444455678999999999     


Q ss_pred             hhcCChHHHHHHhCCCcchhhhhhhhhhhcccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceecccc
Q 001901          779 ALFGFRIECIERMGERDGIWAWHRINRLFNWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLW  858 (998)
Q Consensus       779 ~~~gf~~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLW  858 (998)
                                                               |+++|..+.+.....              ..        
T Consensus        70 -----------------------------------------i~~~H~~~~~~~~~~--------------~~--------   86 (131)
T cd00838          70 -----------------------------------------ILLTHGPPYDPLDEL--------------SP--------   86 (131)
T ss_pred             -----------------------------------------EEEeccCCCCCchhh--------------cc--------
Confidence                                                     889999886541100              00        


Q ss_pred             CCCCCCCCCCCcccCCCCCCceeeCHHHHHHHHHHcCCcEEEEcccccccceE
Q 001901          859 SDPTENDSVEGLRPNARGPGLVTFGPDRVMEFCNNNDLQLIVRAHECVMDGFE  911 (998)
Q Consensus       859 sDP~~~~~~~~~~~n~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~  911 (998)
                              .            .......+...+...+..++|-||.-....+.
T Consensus        87 --------~------------~~~~~~~~~~~~~~~~~~~~~~GH~H~~~~~~  119 (131)
T cd00838          87 --------D------------EDPGSEALLELLEKYGVDLVLSGHTHVYERRE  119 (131)
T ss_pred             --------c------------chhhHHHHHHHHHHhCCCEEEeCCeecccccc
Confidence                    0            00155678888999999999999997765554


No 86 
>PF03089 RAG2:  Recombination activating protein 2;  InterPro: IPR004321 The variable portion of the genes encoding immunoglobulins and T cell receptors are assembled from component V, D, and J DNA segments by a site-specific recombination reaction termed V(D)J recombination. V(D)J recombination is targeted to specific sites on the chromosome by recombination signal sequences (RSSs) that flank antigen receptor gene segments. The RSS consists of a conserved heptamer (consensus, 5'-CACAGTG-3') and nonamer (consensus, 5'-ACAAAAACC-3') separated by a spacer of either 12 or 23 bp. Efficient recombination occurs between a 12-RSS and a 23-RSS, a restriction known as the 12/23 rule. V(D)J recombination can be divided into two phases, DNA cleavage and DNA joining. DNA cleavage requires two lymphocyte-specific factors, the products of the recombination activating genes, RAG1 and RAG2, which together recognise the RSSs and create double strand breaks at the RSS-coding segment junctions []. RAG-mediated DNA cleavage occurs in a synaptic complex termed the paired complex, which is constituted from two distinct RSS-RAG complexes, a 12-SC and a 23-SC (where SC stands for signal complex). The DNA cleavage reaction involves two distinct enzymatic steps, initial nicking that creates a 3'-OH between a coding segment and its RSS, followed by hairpin formation in which the newly created 3'-OH attacks a phosphodiester bond on the opposite DNA strand. This generates a blunt, 5' phosphorylated signal end containing all of the RSS elements, and a covalently sealed hairpin coding end.  The second phase of V(D)J recombination, in which broken DNA fragments are processed and joined, is less well characterised. Signal ends are typically joined precisely to form a signal joint, whereas joining of the coding ends requires the hairpin structure to be opened and typically involves nucleotide addition and deletion before formation of the coding joint. The factors involved in these processes include ubiquitously expressed proteins involved in the repair of DNA double strand breaks by nonhomologous end joining, terminal deoxynucleotidyl transferase, and Artemis protein. In addition to their critical roles in RSS recognition and DNA cleavage, the RAG proteins may perform two distinct types of functions in the postcleavage phase of V(D)J. A structural function has been inferred from the finding that, after DNA cleavage in vitro, the DNA ends remain associated with the RAG proteins in a "four end" complex known as the cleaved signal complex. After release of the coding ends in vitro, and after coding joint formation in vivo, the RAG proteins remain in a stable signal end complex (SEC) containing the two signal ends. These postcleavage complexes may serve as essential scaffolds for the second phase of the reaction, with the RAG proteins acting to organise the DNA processing and joining events.  The second type of RAG protein-mediated postcleavage activity is the catalysis of phosphodiester bond hydrolysis and strand transfer reactions. The RAG proteins are capable of opening hairpin coding ends in vitro. The RAG proteins also show 3' flap endonuclease activity that may contribute to coding end processing/joining and can utilise the 3' OH group on the signal ends to attack hairpin coding ends (forming hybrid or open/shut joints) or virtually any DNA duplex (forming a transposition product).; GO: 0003677 DNA binding, 0006310 DNA recombination, 0005634 nucleus
Probab=98.07  E-value=0.00087  Score=71.47  Aligned_cols=147  Identities=18%  Similarity=0.210  Sum_probs=93.8

Q ss_pred             ccCCCCCCCcCceEEEEccCCcCCCCCccCCEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCc--
Q 001901           84 KKEDGPGPRCGHTLTAVAAVGEEGTPGYIGPRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNK--  161 (998)
Q Consensus        84 ~~g~~P~pR~ght~t~v~~~~~~~~~~~~~~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~--  161 (998)
                      ...-.|+-|+-+.+..-....+.      -...++.||.+.+..                    +.+.+|++...+..  
T Consensus        15 dSCYLPPLR~PAv~~~~~~~~~~------~~~YlIHGGrTPNNE--------------------lS~~LY~ls~~s~~cN   68 (337)
T PF03089_consen   15 DSCYLPPLRCPAVCHLSDPSDGE------PEQYLIHGGRTPNNE--------------------LSSSLYILSVDSRGCN   68 (337)
T ss_pred             CcccCCCCCCccEeeecCCCCCC------eeeEEecCCcCCCcc--------------------cccceEEEEeecCCCC
Confidence            34456777777666663332221      346777888887664                    77888988776543  


Q ss_pred             ------EEEecCCCCCCCCccceEEEEe---C-CEEEEEeCCCC--CC-----------CCcccEEEEEcCCCCCceEEe
Q 001901          162 ------WSRITPFGEPPTPRAAHVATAV---G-TMVVIQGGIGP--AG-----------LSAEDLHVLDLTQQRPRWHRV  218 (998)
Q Consensus       162 ------W~~l~~~g~~P~pR~~hsa~~~---~-~~lyVfGG~~~--~~-----------~~~~dv~~~Dl~t~t~~W~~l  218 (998)
                            ...-.-.|+.|.+|++|++.++   | ..+++|||..-  .+           .+.-.|+++|+.-.-..=..+
T Consensus        69 kK~tl~C~EKeLvGdvP~aRYGHt~~vV~SrGKta~VlFGGRSY~P~~qRTTenWNsVvDC~P~VfLiDleFGC~tah~l  148 (337)
T PF03089_consen   69 KKVTLCCQEKELVGDVPEARYGHTINVVHSRGKTACVLFGGRSYMPPGQRTTENWNSVVDCPPQVFLIDLEFGCCTAHTL  148 (337)
T ss_pred             ceeEEEEecceecCCCCcccccceEEEEEECCcEEEEEECCcccCCccccchhhcceeccCCCeEEEEeccccccccccc
Confidence                  3344556899999999999888   3 38899999641  11           123567788877431011223


Q ss_pred             eecCCCCCCCcccEEEEECCcEEEEEcCCCC--CCCcccEEEEE
Q 001901          219 VVQGPGPGPRYGHVMALVGQRYLMAIGGNDG--KRPLADVWALD  260 (998)
Q Consensus       219 ~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g--~~~lndv~~yD  260 (998)
                      +   .+.-+...|.+..-++ .+|++||..-  +..-..++++.
T Consensus       149 p---El~dG~SFHvslar~D-~VYilGGHsl~sd~Rpp~l~rlk  188 (337)
T PF03089_consen  149 P---ELQDGQSFHVSLARND-CVYILGGHSLESDSRPPRLYRLK  188 (337)
T ss_pred             h---hhcCCeEEEEEEecCc-eEEEEccEEccCCCCCCcEEEEE
Confidence            2   5556777888877777 8999999742  23334555543


No 87 
>PF07250 Glyoxal_oxid_N:  Glyoxal oxidase N-terminus;  InterPro: IPR009880 This entry represents the N terminus (approximately 300 residues) of a number of plant and fungal glyoxal oxidase enzymes. Glyoxal oxidase catalyses the oxidation of aldehydes to carboxylic acids, coupled with reduction of dioxygen to hydrogen peroxide. It is an essential component of the extracellular lignin degradation pathways of the wood-rot fungus Phanerochaete chrysosporium [].
Probab=97.97  E-value=0.00025  Score=76.17  Aligned_cols=154  Identities=14%  Similarity=0.231  Sum_probs=99.1

Q ss_pred             EEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCC--CCceEEEcccCCCCCCC
Q 001901          203 LHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAA--KPYEWRKLEPEGEGPPP  280 (998)
Q Consensus       203 v~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s--~~~~W~~v~~~~~~P~~  280 (998)
                      -.+||+.+++  ++.+.+    +..-+..+.+.+.++.+++.||....  ...+-.|++..  ..-.|......  .-.+
T Consensus        48 s~~yD~~tn~--~rpl~v----~td~FCSgg~~L~dG~ll~tGG~~~G--~~~ir~~~p~~~~~~~~w~e~~~~--m~~~  117 (243)
T PF07250_consen   48 SVEYDPNTNT--FRPLTV----QTDTFCSGGAFLPDGRLLQTGGDNDG--NKAIRIFTPCTSDGTCDWTESPND--MQSG  117 (243)
T ss_pred             EEEEecCCCc--EEeccC----CCCCcccCcCCCCCCCEEEeCCCCcc--ccceEEEecCCCCCCCCceECccc--ccCC
Confidence            3478998874  776642    33344444456667789999998542  34677788765  11278877542  1234


Q ss_pred             ccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCC---CCeEEEEECC---CCCCCCcceeEEEEECCEEEEEcccCC
Q 001901          281 CMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHR---DGRWEWAIAP---GVSPSPRYQHAAVFVNARLHVSGGALG  354 (998)
Q Consensus       281 r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~---~~~W~w~~~~---g~~P~pR~~hsav~~~~~L~V~GG~~~  354 (998)
                      |-+.++....+|+++|+||..      +..+.|.+..   ...+.|....   ...+...|-+..+.-+|+||+++..  
T Consensus       118 RWYpT~~~L~DG~vlIvGG~~------~~t~E~~P~~~~~~~~~~~~~l~~~~~~~~~nlYP~~~llPdG~lFi~an~--  189 (243)
T PF07250_consen  118 RWYPTATTLPDGRVLIVGGSN------NPTYEFWPPKGPGPGPVTLPFLSQTSDTLPNNLYPFVHLLPDGNLFIFANR--  189 (243)
T ss_pred             CccccceECCCCCEEEEeCcC------CCcccccCCccCCCCceeeecchhhhccCccccCceEEEcCCCCEEEEEcC--
Confidence            888899999999999999986      3345554542   2223332221   1123445556666668999999863  


Q ss_pred             CCCccccCCeEEEEECCCCeE-EEcccCcC
Q 001901          355 GGRMVEDSSSVAVLDTAAGVW-CDTKSVVT  383 (998)
Q Consensus       355 ~~~~~~~~~dv~vyD~~t~~W-~~v~~~~~  383 (998)
                               +-.+||..++++ +.++.++.
T Consensus       190 ---------~s~i~d~~~n~v~~~lP~lPg  210 (243)
T PF07250_consen  190 ---------GSIIYDYKTNTVVRTLPDLPG  210 (243)
T ss_pred             ---------CcEEEeCCCCeEEeeCCCCCC
Confidence                     356789999987 77887744


No 88 
>smart00612 Kelch Kelch domain.
Probab=97.96  E-value=1.1e-05  Score=63.35  Aligned_cols=47  Identities=30%  Similarity=0.599  Sum_probs=40.0

Q ss_pred             EEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCC
Q 001901          115 RLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGT  185 (998)
Q Consensus       115 ~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~  185 (998)
                      +||++||.....                     .++++++||+.+++|+.++++   |.+|..|+++++++
T Consensus         1 ~iyv~GG~~~~~---------------------~~~~v~~yd~~~~~W~~~~~~---~~~r~~~~~~~~~g   47 (47)
T smart00612        1 KIYVVGGFDGGQ---------------------RLKSVEVYDPETNKWTPLPSM---PTPRSGHGVAVING   47 (47)
T ss_pred             CEEEEeCCCCCc---------------------eeeeEEEECCCCCeEccCCCC---CCccccceEEEeCC
Confidence            489999986422                     678999999999999999876   89999999988764


No 89 
>PF03089 RAG2:  Recombination activating protein 2;  InterPro: IPR004321 The variable portion of the genes encoding immunoglobulins and T cell receptors are assembled from component V, D, and J DNA segments by a site-specific recombination reaction termed V(D)J recombination. V(D)J recombination is targeted to specific sites on the chromosome by recombination signal sequences (RSSs) that flank antigen receptor gene segments. The RSS consists of a conserved heptamer (consensus, 5'-CACAGTG-3') and nonamer (consensus, 5'-ACAAAAACC-3') separated by a spacer of either 12 or 23 bp. Efficient recombination occurs between a 12-RSS and a 23-RSS, a restriction known as the 12/23 rule. V(D)J recombination can be divided into two phases, DNA cleavage and DNA joining. DNA cleavage requires two lymphocyte-specific factors, the products of the recombination activating genes, RAG1 and RAG2, which together recognise the RSSs and create double strand breaks at the RSS-coding segment junctions []. RAG-mediated DNA cleavage occurs in a synaptic complex termed the paired complex, which is constituted from two distinct RSS-RAG complexes, a 12-SC and a 23-SC (where SC stands for signal complex). The DNA cleavage reaction involves two distinct enzymatic steps, initial nicking that creates a 3'-OH between a coding segment and its RSS, followed by hairpin formation in which the newly created 3'-OH attacks a phosphodiester bond on the opposite DNA strand. This generates a blunt, 5' phosphorylated signal end containing all of the RSS elements, and a covalently sealed hairpin coding end.  The second phase of V(D)J recombination, in which broken DNA fragments are processed and joined, is less well characterised. Signal ends are typically joined precisely to form a signal joint, whereas joining of the coding ends requires the hairpin structure to be opened and typically involves nucleotide addition and deletion before formation of the coding joint. The factors involved in these processes include ubiquitously expressed proteins involved in the repair of DNA double strand breaks by nonhomologous end joining, terminal deoxynucleotidyl transferase, and Artemis protein. In addition to their critical roles in RSS recognition and DNA cleavage, the RAG proteins may perform two distinct types of functions in the postcleavage phase of V(D)J. A structural function has been inferred from the finding that, after DNA cleavage in vitro, the DNA ends remain associated with the RAG proteins in a "four end" complex known as the cleaved signal complex. After release of the coding ends in vitro, and after coding joint formation in vivo, the RAG proteins remain in a stable signal end complex (SEC) containing the two signal ends. These postcleavage complexes may serve as essential scaffolds for the second phase of the reaction, with the RAG proteins acting to organise the DNA processing and joining events.  The second type of RAG protein-mediated postcleavage activity is the catalysis of phosphodiester bond hydrolysis and strand transfer reactions. The RAG proteins are capable of opening hairpin coding ends in vitro. The RAG proteins also show 3' flap endonuclease activity that may contribute to coding end processing/joining and can utilise the 3' OH group on the signal ends to attack hairpin coding ends (forming hybrid or open/shut joints) or virtually any DNA duplex (forming a transposition product).; GO: 0003677 DNA binding, 0006310 DNA recombination, 0005634 nucleus
Probab=97.89  E-value=0.0041  Score=66.47  Aligned_cols=110  Identities=19%  Similarity=0.257  Sum_probs=72.7

Q ss_pred             EEEEEeCCCCCCCCcccEEEEEcCCCC------CceEEeeecCCCCCCCcccEEEEEC---CcEEEEEcCCCC-------
Q 001901          186 MVVIQGGIGPAGLSAEDLHVLDLTQQR------PRWHRVVVQGPGPGPRYGHVMALVG---QRYLMAIGGNDG-------  249 (998)
Q Consensus       186 ~lyVfGG~~~~~~~~~dv~~~Dl~t~t------~~W~~l~~~g~~P~~R~~hs~~~~~---~~~Lyv~GG~~g-------  249 (998)
                      .-+|-||.+++....+.+|++.+.+..      ....+-...|+.|.+||+|++-++.   ....++|||+.-       
T Consensus        40 ~YlIHGGrTPNNElS~~LY~ls~~s~~cNkK~tl~C~EKeLvGdvP~aRYGHt~~vV~SrGKta~VlFGGRSY~P~~qRT  119 (337)
T PF03089_consen   40 QYLIHGGRTPNNELSSSLYILSVDSRGCNKKVTLCCQEKELVGDVPEARYGHTINVVHSRGKTACVLFGGRSYMPPGQRT  119 (337)
T ss_pred             eEEecCCcCCCcccccceEEEEeecCCCCceeEEEEecceecCCCCcccccceEEEEEECCcEEEEEECCcccCCccccc
Confidence            567779999998888999999887632      1223333468999999999998773   336888999831       


Q ss_pred             -------CCCcccEEEEECCCCCceEEE--cccCCCCCCCccceEEEEEeCCEEEEEeccC
Q 001901          250 -------KRPLADVWALDTAAKPYEWRK--LEPEGEGPPPCMYATASARSDGLLLLCGGRD  301 (998)
Q Consensus       250 -------~~~lndv~~yD~~s~~~~W~~--v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~  301 (998)
                             -.+.-.|+.+|++-.  .++.  ++....    ....+.+...++.+|+.||+.
T Consensus       120 TenWNsVvDC~P~VfLiDleFG--C~tah~lpEl~d----G~SFHvslar~D~VYilGGHs  174 (337)
T PF03089_consen  120 TENWNSVVDCPPQVFLIDLEFG--CCTAHTLPELQD----GQSFHVSLARNDCVYILGGHS  174 (337)
T ss_pred             hhhcceeccCCCeEEEEecccc--ccccccchhhcC----CeEEEEEEecCceEEEEccEE
Confidence                   112345777777654  3322  122211    233444556699999999974


No 90 
>PF07250 Glyoxal_oxid_N:  Glyoxal oxidase N-terminus;  InterPro: IPR009880 This entry represents the N terminus (approximately 300 residues) of a number of plant and fungal glyoxal oxidase enzymes. Glyoxal oxidase catalyses the oxidation of aldehydes to carboxylic acids, coupled with reduction of dioxygen to hydrogen peroxide. It is an essential component of the extracellular lignin degradation pathways of the wood-rot fungus Phanerochaete chrysosporium [].
Probab=97.88  E-value=0.0011  Score=71.20  Aligned_cols=149  Identities=14%  Similarity=0.171  Sum_probs=93.9

Q ss_pred             CCcEEEEECCCCcEEEecCCCCCCCCccceEEEEe-CCEEEEEeCCCCCCCCcccEEEEEcCC--CCCceEEeeecCCCC
Q 001901          149 TADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAV-GTMVVIQGGIGPAGLSAEDLHVLDLTQ--QRPRWHRVVVQGPGP  225 (998)
Q Consensus       149 ~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~-~~~lyVfGG~~~~~~~~~dv~~~Dl~t--~t~~W~~l~~~g~~P  225 (998)
                      ...-..||+.+++++.+...    .--.+.+.+.+ ++++++.||....   ...+..|+...  .+..|.+..  ..|-
T Consensus        45 ~a~s~~yD~~tn~~rpl~v~----td~FCSgg~~L~dG~ll~tGG~~~G---~~~ir~~~p~~~~~~~~w~e~~--~~m~  115 (243)
T PF07250_consen   45 PAHSVEYDPNTNTFRPLTVQ----TDTFCSGGAFLPDGRLLQTGGDNDG---NKAIRIFTPCTSDGTCDWTESP--NDMQ  115 (243)
T ss_pred             eEEEEEEecCCCcEEeccCC----CCCcccCcCCCCCCCEEEeCCCCcc---ccceEEEecCCCCCCCCceECc--cccc
Confidence            55667899999999988754    22222222333 5599999998552   24577788765  112588775  2489


Q ss_pred             CCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCC---CCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCC
Q 001901          226 GPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAA---KPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDA  302 (998)
Q Consensus       226 ~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s---~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~  302 (998)
                      .+|+..+++.+.++.++|+||....    ..+.+....   ....|..+......-+.-.+-...+..+|+||+|+..  
T Consensus       116 ~~RWYpT~~~L~DG~vlIvGG~~~~----t~E~~P~~~~~~~~~~~~~l~~~~~~~~~nlYP~~~llPdG~lFi~an~--  189 (243)
T PF07250_consen  116 SGRWYPTATTLPDGRVLIVGGSNNP----TYEFWPPKGPGPGPVTLPFLSQTSDTLPNNLYPFVHLLPDGNLFIFANR--  189 (243)
T ss_pred             CCCccccceECCCCCEEEEeCcCCC----cccccCCccCCCCceeeecchhhhccCccccCceEEEcCCCCEEEEEcC--
Confidence            9999999999999999999998732    223333211   1134444432221112234556667779999999874  


Q ss_pred             CCCCcccEEEEecCCC
Q 001901          303 SSVPLASAYGLAKHRD  318 (998)
Q Consensus       303 ~~~~~~dv~~~~~~~~  318 (998)
                            +.+.||...+
T Consensus       190 ------~s~i~d~~~n  199 (243)
T PF07250_consen  190 ------GSIIYDYKTN  199 (243)
T ss_pred             ------CcEEEeCCCC
Confidence                  3445566655


No 91 
>cd07394 MPP_Vps29 Homo sapiens Vps29 and related proteins, metallophosphatase domain. Vps29 (vacuolar sorting protein 29), also known as vacuolar membrane protein Pep11, is a subunit of the retromer complex which is responsible for the retrieval of mannose-6-phosphate receptors (MPRs) from the endosomes for retrograde transport back to the Golgi. Vps29 has a phosphoesterase fold that acts as a protein interaction scaffold for retromer complex assembly as well as a phosphatase with specificity for the cytoplasmic tail of the MPR.  The retromer includes the following 5 subunits: Vps35, Vps26, Vps29, and a dimer of the sorting nexins Vps5 (Snx1), and Vps17 (Snx2).  Vps29 belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily incl
Probab=97.87  E-value=0.00039  Score=71.84  Aligned_cols=58  Identities=24%  Similarity=0.427  Sum_probs=42.2

Q ss_pred             CeEEEecCC-CCHH-----HHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCc
Q 001901          699 PIKIFGDLH-GQFG-----DLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNH  772 (998)
Q Consensus       699 ~i~vvGDiH-G~~~-----dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNH  772 (998)
                      .|.||+|+| |.-.     .+.++|+..   ..+      .++.+||+++     .+++.+|..++    ..++.++|||
T Consensus         1 ~i~viSDtHl~~~~~~~~~~~~~~~~~~---~~d------~iih~GDi~~-----~~~~~~l~~~~----~~~~~V~GN~   62 (178)
T cd07394           1 LVLVIGDLHIPHRASDLPAKFKKLLVPG---KIQ------HVLCTGNLCS-----KETYDYLKTIA----PDVHIVRGDF   62 (178)
T ss_pred             CEEEEEecCCCCCchhhHHHHHHHhccC---CCC------EEEECCCCCC-----HHHHHHHHhhC----CceEEEECCC
Confidence            378999999 6543     356666541   122      6899999987     77887776652    2599999999


Q ss_pred             cc
Q 001901          773 EA  774 (998)
Q Consensus       773 E~  774 (998)
                      |.
T Consensus        63 D~   64 (178)
T cd07394          63 DE   64 (178)
T ss_pred             Cc
Confidence            97


No 92 
>cd07392 MPP_PAE1087 Pyrobaculum aerophilum PAE1087 and related proteins, metallophosphatase domain. PAE1087 is an uncharacterized Pyrobaculum aerophilum protein with a metallophosphatase domain.  The domain present in members of this family belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for productive metal coordina
Probab=97.87  E-value=0.00027  Score=73.09  Aligned_cols=65  Identities=25%  Similarity=0.323  Sum_probs=44.2

Q ss_pred             eEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCCh-HHHHHHHHHhhhcCCCcEEEeecCccccc
Q 001901          700 IKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHS-LETITLLLALKVEYPNNVHLIRGNHEAAD  776 (998)
Q Consensus       700 i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s-~evl~ll~~lk~~~p~~v~llrGNHE~~~  776 (998)
                      |.+++||||++..|.+  ........+      -+|+.||++++|... .+.+..|..    .+..++.++||||...
T Consensus         1 i~~~sD~H~~~~~~~~--~~~~~~~~D------~vv~~GDl~~~~~~~~~~~~~~l~~----~~~p~~~v~GNHD~~~   66 (188)
T cd07392           1 ILAISDIHGDVEKLEA--IILKAEEAD------AVIVAGDITNFGGKEAAVEINLLLA----IGVPVLAVPGNCDTPE   66 (188)
T ss_pred             CEEEEecCCCHHHHHH--HHhhccCCC------EEEECCCccCcCCHHHHHHHHHHHh----cCCCEEEEcCCCCCHH
Confidence            5789999999998876  222111112      688999999999763 333333332    2456999999999754


No 93 
>smart00612 Kelch Kelch domain.
Probab=97.85  E-value=2.2e-05  Score=61.51  Aligned_cols=47  Identities=32%  Similarity=0.490  Sum_probs=39.1

Q ss_pred             EEEEEcccCCCCCccccCCeEEEEECCCCeEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEECC
Q 001901          345 RLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAVGD  416 (998)
Q Consensus       345 ~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~  416 (998)
                      +|||+||....    ...+++++||+.+++|+.++.+                     +.+|..|+++++++
T Consensus         1 ~iyv~GG~~~~----~~~~~v~~yd~~~~~W~~~~~~---------------------~~~r~~~~~~~~~g   47 (47)
T smart00612        1 KIYVVGGFDGG----QRLKSVEVYDPETNKWTPLPSM---------------------PTPRSGHGVAVING   47 (47)
T ss_pred             CEEEEeCCCCC----ceeeeEEEECCCCCeEccCCCC---------------------CCccccceEEEeCC
Confidence            48999998653    2378899999999999998877                     67999999988764


No 94 
>KOG0376 consensus Serine-threonine phosphatase 2A, catalytic subunit [General function prediction only]
Probab=97.70  E-value=7.7e-06  Score=93.08  Aligned_cols=238  Identities=13%  Similarity=0.023  Sum_probs=164.2

Q ss_pred             ccCHHHHHHHHHHHHHHHhcCCCeeeecC----CeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCC
Q 001901          670 FLDCNEIADLCDSAERIFSSEPSVLQLKA----PIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQ  745 (998)
Q Consensus       670 ~~~~~~i~~l~~~~~~~~~~ep~~l~~~~----~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~  745 (998)
                      .|...++..+++.+.+++..+|+...+.+    -.+.++|.||.+.|+.+.++.-  |.-.     .-|++-|++|+++.
T Consensus        14 ~l~~~~fd~avdlysKaI~ldpnca~~~anRa~a~lK~e~~~~Al~Da~kaie~d--P~~~-----K~Y~rrg~a~m~l~   86 (476)
T KOG0376|consen   14 ALKDKVFDVAVDLYSKAIELDPNCAIYFANRALAHLKVESFGGALHDALKAIELD--PTYI-----KAYVRRGTAVMALG   86 (476)
T ss_pred             hcccchHHHHHHHHHHHHhcCCcceeeechhhhhheeechhhhHHHHHHhhhhcC--chhh-----heeeeccHHHHhHH
Confidence            46778899999999999999998887642    4788999999999999988764  2211     15999999999999


Q ss_pred             ChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhhcccceeEEEcCeEEEecC
Q 001901          746 HSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLFNWLPLAALIEKKIICMHG  825 (998)
Q Consensus       746 ~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~~~il~vHg  825 (998)
                      ...+.+..|...+...|+...+.|++||+..+-..++|..+....+++. +..++..+...+-. |++..+.+.++=-| 
T Consensus        87 ~~~~A~~~l~~~~~l~Pnd~~~~r~~~Ec~~~vs~~~fe~ai~~~~~d~-~s~~~~~~~~~~~~-~i~~~y~g~~le~~-  163 (476)
T KOG0376|consen   87 EFKKALLDLEKVKKLAPNDPDATRKIDECNKIVSEEKFEKAILTPEGDK-KSVVEMKIDEEDMD-LIESDYSGPVLEDH-  163 (476)
T ss_pred             HHHHHHHHHHHhhhcCcCcHHHHHHHHHHHHHHHHHhhhhcccCCccCC-cccccccccccccc-ccccccCCcccccc-
Confidence            9999999999999999999999999999999999999998888777654 23333333333322 14445554333333 


Q ss_pred             CccCcccCHHhhhh-----------------------------ccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCC
Q 001901          826 GIGRSINHVEQIEN-----------------------------LQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARG  876 (998)
Q Consensus       826 Gi~~~~~~~~~i~~-----------------------------i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg  876 (998)
                      -+     +++.+..                             +.-++++    ..-.|.+|+++...  -.-+-...++
T Consensus       164 kv-----t~e~vk~~~~~~~~~~~L~~k~a~~i~~~~~~~~~~l~~~ve~----~~~~d~~~sv~gd~--hGqfydl~ni  232 (476)
T KOG0376|consen  164 KV-----TLEFVKTLMEVFKNQKKLPKKYAYSILDLAKTILRKLPSLVEI----SVPGDVKISVCGDT--HGQFYDLLNI  232 (476)
T ss_pred             hh-----hHHHHHHHHHhhhcccccccccceeeHHHHhhHHhcCCcceEe----ecCCCceEEecCCc--cccccchhhh
Confidence            11     1111111                             1112221    14467789888752  2233344555


Q ss_pred             CCceeeCHHHHHHHHHHcCCcEEEEcccccc-----------c-ceEEec---CCeEEEEeccccccC
Q 001901          877 PGLVTFGPDRVMEFCNNNDLQLIVRAHECVM-----------D-GFERFA---QGHLITLFSATNYCG  929 (998)
Q Consensus       877 ~~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~-----------~-G~~~~~---~~~~iTvfSa~~y~~  929 (998)
                      .+ ...+++....||.+.++.-+++.|.-+.           + +|...+   .+.+++||+++.+|-
T Consensus       233 f~-l~g~Ps~t~~ylfngdfv~rgs~s~e~~~~~~~~kl~~pn~~fl~rgn~Es~~m~~iy~f~~e~~  299 (476)
T KOG0376|consen  233 FE-LNGLPSETNPYLFNGDFVDRGSWSVEVILTLFAFKLLYPNNFFLLRGNHESDNMNKIYGFEGEVK  299 (476)
T ss_pred             Hh-hcCCCCCcccccccCceeeecccceeeeeeehhhcccCCcceeeccCCccchHHHHHhCCCcchh
Confidence            55 3467778888999999999998886542           1 121111   235899999998874


No 95 
>cd07403 MPP_TTHA0053 Thermus thermophilus TTHA0053 and related proteins, metallophosphatase domain. TTHA0053 is an uncharacterized Thermus thermophilus protein with a domain that belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for productive metal coordination.
Probab=97.62  E-value=0.0005  Score=67.12  Aligned_cols=56  Identities=18%  Similarity=0.142  Sum_probs=40.0

Q ss_pred             EEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCcc
Q 001901          701 KIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHE  773 (998)
Q Consensus       701 ~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE  773 (998)
                      .|++|.||....+.+++...  ...+      .++++||+.      .+++.++..++   ...++.++||||
T Consensus         1 ~viSDtH~~~~~~~~~~~~~--~~~d------~ii~~GD~~------~~~~~~~~~~~---~~~~~~V~GN~D   56 (129)
T cd07403           1 LVISDTESPALYSPEIKVRL--EGVD------LILSAGDLP------KEYLEYLVTML---NVPVYYVHGNHD   56 (129)
T ss_pred             CeeccccCccccchHHHhhC--CCCC------EEEECCCCC------hHHHHHHHHHc---CCCEEEEeCCCc
Confidence            38999999988887777652  2222      799999984      34566665542   225899999999


No 96 
>TIGR01640 F_box_assoc_1 F-box protein interaction domain. This model describes a large family of plant domains, with several hundred members in Arabidopsis thaliana. Most examples are found C-terminal to an F-box (pfam00646), a 60 amino acid motif involved in ubiquitination of target proteins to mark them for degradation. Two-hybid experiments support the idea that most members are interchangeable F-box subunits of SCF E3 complexes. Some members have two copies of this domain.
Probab=97.59  E-value=0.013  Score=63.04  Aligned_cols=206  Identities=8%  Similarity=0.069  Sum_probs=113.0

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccce-EEEEe----CC-EEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCC
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAH-VATAV----GT-MVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGP  223 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~h-sa~~~----~~-~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~  223 (998)
                      ..++++||.|++|..++....+......+ ....+    +. +|+.+...... .....+++|++.++.  |+.+...  
T Consensus        14 ~~~~V~NP~T~~~~~LP~~~~~~~~~~~~~~~~G~d~~~~~YKVv~~~~~~~~-~~~~~~~Vys~~~~~--Wr~~~~~--   88 (230)
T TIGR01640        14 KRLVVWNPSTGQSRWLPTPKSRRSNKESDTYFLGYDPIEKQYKVLCFSDRSGN-RNQSEHQVYTLGSNS--WRTIECS--   88 (230)
T ss_pred             CcEEEECCCCCCEEecCCCCCcccccccceEEEeecccCCcEEEEEEEeecCC-CCCccEEEEEeCCCC--ccccccC--
Confidence            46899999999999997531100001111 11112    12 77777543211 123578899999874  9988622  


Q ss_pred             CCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEE-cccCCCCCCCccceEEEEEeCCEEEEEeccCC
Q 001901          224 GPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRK-LEPEGEGPPPCMYATASARSDGLLLLCGGRDA  302 (998)
Q Consensus       224 ~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~-v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~  302 (998)
                      .+........+.+++ .||-+.-.........+..||+.+.  +|.. +... ...............+|+|.++.....
T Consensus        89 ~~~~~~~~~~v~~~G-~lyw~~~~~~~~~~~~IvsFDl~~E--~f~~~i~~P-~~~~~~~~~~~L~~~~G~L~~v~~~~~  164 (230)
T TIGR01640        89 PPHHPLKSRGVCING-VLYYLAYTLKTNPDYFIVSFDVSSE--RFKEFIPLP-CGNSDSVDYLSLINYKGKLAVLKQKKD  164 (230)
T ss_pred             CCCccccCCeEEECC-EEEEEEEECCCCCcEEEEEEEcccc--eEeeeeecC-ccccccccceEEEEECCEEEEEEecCC
Confidence            122122222556666 6877764332121226999999999  8885 4321 111101123344556788888765422


Q ss_pred             CCCCcccEEEEecCCCCeEEEEECCCCCCCCcc----eeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCC
Q 001901          303 SSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRY----QHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAG  373 (998)
Q Consensus       303 ~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~----~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~  373 (998)
                      .  ..-++|.+.......|+..-.-+.++.+..    ....+..+++|++.... ..      ..-+.+||+.++
T Consensus       165 ~--~~~~IWvl~d~~~~~W~k~~~i~~~~~~~~~~~~~~~~~~~~g~I~~~~~~-~~------~~~~~~y~~~~~  230 (230)
T TIGR01640       165 T--NNFDLWVLNDAGKQEWSKLFTVPIPPLPDLVDDNFLSGFTDKGEIVLCCED-EN------PFYIFYYNVGEN  230 (230)
T ss_pred             C--CcEEEEEECCCCCCceeEEEEEcCcchhhhhhheeEeEEeeCCEEEEEeCC-CC------ceEEEEEeccCC
Confidence            1  236899987665567875433333222222    13445567888877542 10      123888998764


No 97 
>PRK05340 UDP-2,3-diacylglucosamine hydrolase; Provisional
Probab=97.52  E-value=0.00035  Score=75.81  Aligned_cols=70  Identities=21%  Similarity=0.302  Sum_probs=46.8

Q ss_pred             CCeEEEecCCCCH------HHHHHHHHHcCCCCCCCCccceeEEEeccccCC--C-----CChHHHHHHHHHhhhcCCCc
Q 001901          698 APIKIFGDLHGQF------GDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDR--G-----QHSLETITLLLALKVEYPNN  764 (998)
Q Consensus       698 ~~i~vvGDiHG~~------~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDR--G-----~~s~evl~ll~~lk~~~p~~  764 (998)
                      +++++++|+|...      ..|.++|+.... ..+      .++++||++|.  |     +...+++.+|..|+.. +-.
T Consensus         1 M~i~~iSDlHl~~~~~~~~~~~~~~l~~~~~-~~d------~l~i~GDl~d~~~g~~~~~~~~~~~~~~l~~l~~~-g~~   72 (241)
T PRK05340          1 MPTLFISDLHLSPERPAITAAFLRFLRGEAR-QAD------ALYILGDLFEAWIGDDDPSPFAREIAAALKALSDS-GVP   72 (241)
T ss_pred             CcEEEEeecCCCCCChhHHHHHHHHHHhhhc-cCC------EEEEccceeccccccCcCCHHHHHHHHHHHHHHHc-CCe
Confidence            3689999999542      235555543211 112      68999999985  2     2346777777777643 246


Q ss_pred             EEEeecCcccc
Q 001901          765 VHLIRGNHEAA  775 (998)
Q Consensus       765 v~llrGNHE~~  775 (998)
                      |++++||||..
T Consensus        73 v~~v~GNHD~~   83 (241)
T PRK05340         73 CYFMHGNRDFL   83 (241)
T ss_pred             EEEEeCCCchh
Confidence            99999999973


No 98 
>cd07404 MPP_MS158 Microscilla MS158 and related proteins, metallophosphatase domain. MS158 is an uncharacterized Microscilla protein with a metallophosphatase domain.  Microscilla proteins MS152, and MS153 are also included in this family.  The domain present in members of this family belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is t
Probab=97.40  E-value=0.00013  Score=74.27  Aligned_cols=67  Identities=27%  Similarity=0.236  Sum_probs=45.3

Q ss_pred             eEEEecCCCCHHHHHHHHHH-cCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCcccc
Q 001901          700 IKIFGDLHGQFGDLMRLFDE-YGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAA  775 (998)
Q Consensus       700 i~vvGDiHG~~~dL~~il~~-~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~  775 (998)
                      +.+++|||+....+...+.. ......+      -++++||+++++.....+. ++..  ...+..+++++||||..
T Consensus         1 ~~~iSDlH~~~~~~~~~~~~~~~~~~~d------~li~~GDi~~~~~~~~~~~-~~~~--~~~~~~v~~v~GNHD~~   68 (166)
T cd07404           1 IQYLSDLHLEFEDNLADLLNFPIAPDAD------ILVLAGDIGYLTDAPRFAP-LLLA--LKGFEPVIYVPGNHEFY   68 (166)
T ss_pred             CceEccccccCccccccccccCCCCCCC------EEEECCCCCCCcchHHHHH-HHHh--hcCCccEEEeCCCcceE
Confidence            46899999998777665431 1111112      6889999999987765544 2222  23345799999999985


No 99 
>cd07399 MPP_YvnB Bacillus subtilis YvnB and related proteins, metallophosphatase domain. YvnB (BSU35040) is an uncharacterized Bacillus subtilis protein with a metallophosphatase domain.  This family includes bacterial and eukaryotic proteins similar to YvnB.  YvnB belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for 
Probab=97.39  E-value=0.01  Score=63.15  Aligned_cols=69  Identities=16%  Similarity=0.244  Sum_probs=40.2

Q ss_pred             eCHHHHHHHHHHc-CCcEEEEcccccccceEEe-----cCCeEEEEeccccccC--CCCCe-EEEEEEcCC-ceEEeEEe
Q 001901          882 FGPDRVMEFCNNN-DLQLIVRAHECVMDGFERF-----AQGHLITLFSATNYCG--TANNA-GAILVLGRD-LVVVPKLI  951 (998)
Q Consensus       882 fg~~~~~~fl~~~-~l~~iiR~H~~~~~G~~~~-----~~~~~iTvfSa~~y~~--~~~n~-ga~l~~~~~-~~~~~~~~  951 (998)
                      .+...+.+.++++ ++++++-||.=. .+....     .++.+..+++  +|-.  ..+|. =.++.++.+ ..|..+.+
T Consensus       135 ~~~~~~~~ll~~~~~V~~v~~GH~H~-~~~~~~~~~~~~g~~v~~~~~--~~q~~~~~g~~~~r~~~f~~~~~~i~~~ty  211 (214)
T cd07399         135 DGQQIWDKLVKKNDNVFMVLSGHVHG-AGRTTLVSVGDAGRTVHQMLA--DYQGEPNGGNGFLRLLEFDPDNNKIDVRTY  211 (214)
T ss_pred             cHHHHHHHHHhCCCCEEEEEccccCC-CceEEEcccCCCCCEeeEEee--cccCCCCCCcceEEEEEEecCCCEEEEEeC
Confidence            4566788889988 899999999632 333332     1334555543  3421  11221 134555555 57777777


Q ss_pred             cc
Q 001901          952 HP  953 (998)
Q Consensus       952 ~~  953 (998)
                      .|
T Consensus       212 sp  213 (214)
T cd07399         212 SP  213 (214)
T ss_pred             CC
Confidence            66


No 100
>cd07400 MPP_YydB Bacillus subtilis YydB and related proteins, metallophosphatase domain. YydB (BSU40220) is an uncharacterized Bacillus subtilis protein that  belongs to the following Bacillus subtilis gene cluster yydB-yydC-yydD-yydG-yydH-yydI-yydJ.  YydB belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for productiv
Probab=97.37  E-value=0.0025  Score=63.06  Aligned_cols=41  Identities=29%  Similarity=0.434  Sum_probs=28.1

Q ss_pred             eEEEeccccCCCCCh-H-HHHHHHHHhhhcCCCcEEEeecCccc
Q 001901          733 DYLFLGDYVDRGQHS-L-ETITLLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s-~-evl~ll~~lk~~~p~~v~llrGNHE~  774 (998)
                      .+|++||+++.|... . +...++-.++... ..+++++||||.
T Consensus        38 ~vi~~GDl~~~~~~~~~~~~~~~~~~l~~~~-~~~~~v~GNHD~   80 (144)
T cd07400          38 LVVITGDLTQRGLPEEFEEAREFLDALPAPL-EPVLVVPGNHDV   80 (144)
T ss_pred             EEEECCCCCCCCCHHHHHHHHHHHHHccccC-CcEEEeCCCCeE
Confidence            688999999998742 2 2334444443322 379999999998


No 101
>PRK11340 phosphodiesterase YaeI; Provisional
Probab=97.32  E-value=0.00045  Score=76.36  Aligned_cols=70  Identities=20%  Similarity=0.082  Sum_probs=49.7

Q ss_pred             CCeEEEecCCCC----HHHHHHHHHHcCCCCCCCCccceeEEEeccccCCC--CChHHHHHHHHHhhhcCCCcEEEeecC
Q 001901          698 APIKIFGDLHGQ----FGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRG--QHSLETITLLLALKVEYPNNVHLIRGN  771 (998)
Q Consensus       698 ~~i~vvGDiHG~----~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG--~~s~evl~ll~~lk~~~p~~v~llrGN  771 (998)
                      .+|.+++|||..    ...+.++++.......+      -++++|||+|++  ...-+++.+|..|+...  .+|.+.||
T Consensus        50 ~rI~~lSDlH~~~~~~~~~l~~~v~~i~~~~pD------lVli~GD~~d~~~~~~~~~~~~~L~~L~~~~--pv~~V~GN  121 (271)
T PRK11340         50 FKILFLADLHYSRFVPLSLISDAIALGIEQKPD------LILLGGDYVLFDMPLNFSAFSDVLSPLAECA--PTFACFGN  121 (271)
T ss_pred             cEEEEEcccCCCCcCCHHHHHHHHHHHHhcCCC------EEEEccCcCCCCccccHHHHHHHHHHHhhcC--CEEEecCC
Confidence            469999999976    45577777665432222      688999999954  23345666777776554  49999999


Q ss_pred             cccc
Q 001901          772 HEAA  775 (998)
Q Consensus       772 HE~~  775 (998)
                      ||..
T Consensus       122 HD~~  125 (271)
T PRK11340        122 HDRP  125 (271)
T ss_pred             CCcc
Confidence            9973


No 102
>cd07385 MPP_YkuE_C Bacillus subtilis YkuE and related proteins, C-terminal metallophosphatase domain. YkuE is an uncharacterized Bacillus subtilis protein with a C-terminal metallophosphatase domain and an N-terminal twin-arginine (RR) motif. An RR-signal peptide derived from the Bacillus subtilis YkuE protein can direct Tat-dependent secretion of agarase in Streptomyces lividans. This is an indication that YkuE is transported by the Bacillus subtilis Tat (Twin-arginine translocation) pathway machinery.  YkuE belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-dia
Probab=97.28  E-value=0.00044  Score=73.83  Aligned_cols=70  Identities=30%  Similarity=0.300  Sum_probs=49.6

Q ss_pred             CCeEEEecCCCCHH----HHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChH-HHHHHHHHhhhcCCCcEEEeecCc
Q 001901          698 APIKIFGDLHGQFG----DLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSL-ETITLLLALKVEYPNNVHLIRGNH  772 (998)
Q Consensus       698 ~~i~vvGDiHG~~~----dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~-evl~ll~~lk~~~p~~v~llrGNH  772 (998)
                      .++.+++|+|....    .+.++++.+.....+      -+|+.||++|.+.... ++..++..++  .+..++++.|||
T Consensus         2 ~~i~~~sDlH~~~~~~~~~~~~~~~~~~~~~~d------~vl~~GD~~~~~~~~~~~~~~~l~~l~--~~~~v~~v~GNH   73 (223)
T cd07385           2 LRIAHLSDLHLGPFVSRERLERLVEKINALKPD------LVVLTGDLVDGSVDVLELLLELLKKLK--APLGVYAVLGNH   73 (223)
T ss_pred             CEEEEEeecCCCccCCHHHHHHHHHHHhccCCC------EEEEcCcccCCcchhhHHHHHHHhccC--CCCCEEEECCCc
Confidence            36899999998743    566776665432222      6888999999987765 5555555443  234699999999


Q ss_pred             ccc
Q 001901          773 EAA  775 (998)
Q Consensus       773 E~~  775 (998)
                      |..
T Consensus        74 D~~   76 (223)
T cd07385          74 DYY   76 (223)
T ss_pred             ccc
Confidence            984


No 103
>COG0622 Predicted phosphoesterase [General function prediction only]
Probab=97.16  E-value=0.014  Score=59.68  Aligned_cols=65  Identities=17%  Similarity=0.252  Sum_probs=44.7

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccc
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAAD  776 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~  776 (998)
                      +.|.|++|.||...+..+.++.......+      -+|.+||++......        +|......+++.+|||.|...
T Consensus         2 m~ilviSDtH~~~~~~~~~~~~~~~~~~d------~vih~GD~~~~~~~~--------~l~~~~~~~i~~V~GN~D~~~   66 (172)
T COG0622           2 MKILVISDTHGPLRAIEKALKIFNLEKVD------AVIHAGDSTSPFTLD--------ALEGGLAAKLIAVRGNCDGEV   66 (172)
T ss_pred             cEEEEEeccCCChhhhhHHHHHhhhcCCC------EEEECCCcCCccchH--------HhhcccccceEEEEccCCCcc
Confidence            46899999999997655555554433333      688899999865531        221112368999999999843


No 104
>TIGR01854 lipid_A_lpxH UDP-2,3-diacylglucosamine hydrolase. This model represents LpxH, UDP-2,3-diacylglucosamine hydrolase, and essential enzyme in E. coli that catalyzes the fourth step in lipid A biosynthesis. Note that Pseudomonas aeruginosa has both a member of this family that shares this function and a more distant homolog, designated LpxH2, that does not. Many species that produce lipid A lack an lpxH gene in this family; some of those species have an lpxH2 gene instead, although for which the function is unknown.
Probab=97.09  E-value=0.0016  Score=70.16  Aligned_cols=177  Identities=13%  Similarity=0.188  Sum_probs=87.8

Q ss_pred             eEEEecCCCCH------HHHHHHHHHcCCCCCCCCccceeEEEeccccCC--CC---C--hHHHHHHHHHhhhcCCCcEE
Q 001901          700 IKIFGDLHGQF------GDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDR--GQ---H--SLETITLLLALKVEYPNNVH  766 (998)
Q Consensus       700 i~vvGDiHG~~------~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDR--G~---~--s~evl~ll~~lk~~~p~~v~  766 (998)
                      +++++|+|...      ..+++.+..... ..+      .++++||++|.  |.   .  ..+++.+|..|+.. +..|+
T Consensus         1 ~~~iSDlHl~~~~~~~~~~~l~~l~~~~~-~~d------~lii~GDi~d~~~~~~~~~~~~~~~~~~l~~L~~~-~~~v~   72 (231)
T TIGR01854         1 TLFISDLHLSPERPDITALFLDFLREEAR-KAD------ALYILGDLFEAWIGDDDPSTLARSVAQAIRQVSDQ-GVPCY   72 (231)
T ss_pred             CeEEEecCCCCCChhHHHHHHHHHHhhhc-cCC------EEEEcCceeccccCCCCCCHHHHHHHHHHHHHHHC-CCeEE
Confidence            36899999542      234454544321 112      68899999995  21   1  13456666666543 35799


Q ss_pred             EeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhhcccceeE-EEcCeEEEecCCccCccc-CHHhhhhccC-C
Q 001901          767 LIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLFNWLPLAA-LIEKKIICMHGGIGRSIN-HVEQIENLQR-P  843 (998)
Q Consensus       767 llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa-~i~~~il~vHgGi~~~~~-~~~~i~~i~r-p  843 (998)
                      +++||||...-.       ...+..|    .       .++.. +... +-+.+++++||-.-..-. ...-.+++-| |
T Consensus        73 ~v~GNHD~~~~~-------~~~~~~g----i-------~~l~~-~~~~~~~g~~ill~HGd~~~~~d~~y~~~r~~~r~~  133 (231)
T TIGR01854        73 FMHGNRDFLIGK-------RFAREAG----M-------TLLPD-PSVIDLYGQKVLLMHGDTLCTDDTAYQAFRAKVHQP  133 (231)
T ss_pred             EEcCCCchhhhH-------HHHHHCC----C-------EEECC-CEEEEECCEEEEEEcCccccCCCHHHHHHHHHHhCH
Confidence            999999973211       0111111    1       11111 1122 235689999997643100 0111122111 1


Q ss_pred             cc------cCC-CCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHHHHHHHHcCCcEEEEcccccccce
Q 001901          844 IT------MEA-GSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRVMEFCNNNDLQLIVRAHECVMDGF  910 (998)
Q Consensus       844 ~~------~~~-~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~  910 (998)
                      ..      ++. ....+...+++-.....   .    .+..-.....+..+.++++..+.+++|-||.=.+.=+
T Consensus       134 ~~~~~~~~l~~~~r~~l~~~~~~~s~~~~---~----~~~~~~~~~~~~~~~~~~~~~~~~~~i~GHtH~~~~~  200 (231)
T TIGR01854       134 WLQRLFLHLPLAVRVKLARKIRAESRADK---Q----MKSQDIMDVNPAEVAAVMRRYGVDRLIHGHTHRPAIH  200 (231)
T ss_pred             HHHHHHHhCCHHHHHHHHHHHHHHHHHhc---C----CCcchhhCCCHHHHHHHHHHcCCCEEEECCccCccee
Confidence            10      000 00112233333221100   0    0001123346788899999999999999998544333


No 105
>cd07391 MPP_PF1019 Pyrococcus furiosus PF1019 and related proteins, metallophosphatase domain. This family includes bacterial and archeal proteins homologous to PF1019, an uncharacterized Pyrococcus furiosus protein.  The domain present in members of this family belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for pro
Probab=97.02  E-value=0.0018  Score=66.43  Aligned_cols=43  Identities=26%  Similarity=0.271  Sum_probs=27.0

Q ss_pred             eEEEeccccCCCCCh--HHHHHHHHHhhhcCCCcEEEeecCcccc
Q 001901          733 DYLFLGDYVDRGQHS--LETITLLLALKVEYPNNVHLIRGNHEAA  775 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s--~evl~ll~~lk~~~p~~v~llrGNHE~~  775 (998)
                      .+|++||++|.....  .+...+-+.......-.+++++||||..
T Consensus        44 ~lii~GDl~~~~~~~~~~~~~~~~~~~~~~~~~~v~~i~GNHD~~   88 (172)
T cd07391          44 RLIILGDLKHSFGGLSRQEFEEVAFLRLLAKDVDVILIRGNHDGG   88 (172)
T ss_pred             EEEEeCcccccccccCHHHHHHHHHHHhccCCCeEEEEcccCccc
Confidence            799999999865432  2222211111223345799999999984


No 106
>cd07390 MPP_AQ1575 Aquifex aeolicus AQ1575 and related proteins, metallophosphatase domain. This family includes bacterial and archeal proteins homologous to AQ1575, an uncharacterized Aquifex aeolicus protein.  AQ1575 may play an accessory role in DNA repair, based on the close proximity of its gene to Holliday junction resolvasome genes.  The domain present in members of this family belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a d
Probab=96.94  E-value=0.0027  Score=64.89  Aligned_cols=40  Identities=35%  Similarity=0.535  Sum_probs=29.8

Q ss_pred             eEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccch
Q 001901          733 DYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADI  777 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~  777 (998)
                      .+|++||++++|..... +.+|..+    +..+++++||||....
T Consensus        45 ~vi~~GDl~~~~~~~~~-~~~l~~~----~~~~~~v~GNHD~~~~   84 (168)
T cd07390          45 TVYHLGDFSFGGKAGTE-LELLSRL----NGRKHLIKGNHDSSLE   84 (168)
T ss_pred             EEEEeCCCCCCCChHHH-HHHHHhC----CCCeEEEeCCCCchhh
Confidence            79999999999987644 4444443    3469999999997543


No 107
>TIGR03729 acc_ester putative phosphoesterase. Members of this protein family belong to the larger family pfam00149 (calcineurin-like phosphoesterase), a family largely defined by small motifs of metal-chelating residues. The subfamily in this model shows a good but imperfect co-occurrence in species with domain TIGR03715 that defines a novel class of signal peptide typical of the accessory secretory system.
Probab=96.94  E-value=0.0017  Score=70.31  Aligned_cols=68  Identities=26%  Similarity=0.215  Sum_probs=46.4

Q ss_pred             CeEEEecCCCCH-----H-HHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCc
Q 001901          699 PIKIFGDLHGQF-----G-DLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNH  772 (998)
Q Consensus       699 ~i~vvGDiHG~~-----~-dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNH  772 (998)
                      +|.+++|+|..+     . .|.++++.+.-...+      -+|+.||++++.....+++..|..+   .+..|+++.|||
T Consensus         1 ki~~iSDlH~~~~~~~~~~~l~~~~~~~~~~~~d------~vv~~GDl~~~~~~~~~~~~~l~~~---~~~pv~~v~GNH   71 (239)
T TIGR03729         1 KIAFSSDLHIDLNHFDTEEMLETLAQYLKKQKID------HLHIAGDISNDFQRSLPFIEKLQEL---KGIKVTFNAGNH   71 (239)
T ss_pred             CEEEEEeecCCCCCCCHHHHHHHHHHHHHhcCCC------EEEECCccccchhhHHHHHHHHHHh---cCCcEEEECCCC
Confidence            478999999763     1 245565555322222      6899999999876666666555543   335699999999


Q ss_pred             ccc
Q 001901          773 EAA  775 (998)
Q Consensus       773 E~~  775 (998)
                      |..
T Consensus        72 D~~   74 (239)
T TIGR03729        72 DML   74 (239)
T ss_pred             CCC
Confidence            974


No 108
>PRK11138 outer membrane biogenesis protein BamB; Provisional
Probab=96.83  E-value=0.73  Score=53.78  Aligned_cols=187  Identities=16%  Similarity=0.173  Sum_probs=100.6

Q ss_pred             cEEEEECCCCc--EEEecCCCC-----CCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCC
Q 001901          151 DVHCYDVLTNK--WSRITPFGE-----PPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGP  223 (998)
Q Consensus       151 dv~~yD~~t~~--W~~l~~~g~-----~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~  223 (998)
                      .+++||..+.+  |+.-.....     ...++..-+.++.+++||+.+.       ...++.||..+....|+.-.    
T Consensus        80 ~l~ald~~tG~~~W~~~~~~~~~~~~~~~~~~~~~~~~v~~~~v~v~~~-------~g~l~ald~~tG~~~W~~~~----  148 (394)
T PRK11138         80 LVKALDADTGKEIWSVDLSEKDGWFSKNKSALLSGGVTVAGGKVYIGSE-------KGQVYALNAEDGEVAWQTKV----  148 (394)
T ss_pred             eEEEEECCCCcEeeEEcCCCcccccccccccccccccEEECCEEEEEcC-------CCEEEEEECCCCCCcccccC----
Confidence            67889988664  875332100     0112333345666788887543       24699999988766797643    


Q ss_pred             CCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCC
Q 001901          224 GPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDAS  303 (998)
Q Consensus       224 ~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~  303 (998)
                       +.. ...+-++.++ .+|+..+ +     ..++.||+.+....|+.-.....  ...+...+-++.++.+|+..+.   
T Consensus       149 -~~~-~~ssP~v~~~-~v~v~~~-~-----g~l~ald~~tG~~~W~~~~~~~~--~~~~~~~sP~v~~~~v~~~~~~---  214 (394)
T PRK11138        149 -AGE-ALSRPVVSDG-LVLVHTS-N-----GMLQALNESDGAVKWTVNLDVPS--LTLRGESAPATAFGGAIVGGDN---  214 (394)
T ss_pred             -CCc-eecCCEEECC-EEEEECC-C-----CEEEEEEccCCCEeeeecCCCCc--ccccCCCCCEEECCEEEEEcCC---
Confidence             111 1122234444 6776433 1     36999999998888988543211  0001112233456776664321   


Q ss_pred             CCCcccEEEEecCCCCeEEEEECCCCCCC----Cc---ceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCe--
Q 001901          304 SVPLASAYGLAKHRDGRWEWAIAPGVSPS----PR---YQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGV--  374 (998)
Q Consensus       304 ~~~~~dv~~~~~~~~~~W~w~~~~g~~P~----pR---~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~--  374 (998)
                          ..++.++.. +++-.|......+..    .|   ...+-++.++.+|+.+.          ...++.+|+.+.+  
T Consensus       215 ----g~v~a~d~~-~G~~~W~~~~~~~~~~~~~~~~~~~~~sP~v~~~~vy~~~~----------~g~l~ald~~tG~~~  279 (394)
T PRK11138        215 ----GRVSAVLME-QGQLIWQQRISQPTGATEIDRLVDVDTTPVVVGGVVYALAY----------NGNLVALDLRSGQIV  279 (394)
T ss_pred             ----CEEEEEEcc-CChhhheeccccCCCccchhcccccCCCcEEECCEEEEEEc----------CCeEEEEECCCCCEE
Confidence                234555543 344344332211110    01   12344567888888642          2358999998874  


Q ss_pred             EEE
Q 001901          375 WCD  377 (998)
Q Consensus       375 W~~  377 (998)
                      |+.
T Consensus       280 W~~  282 (394)
T PRK11138        280 WKR  282 (394)
T ss_pred             Eee
Confidence            764


No 109
>cd07395 MPP_CSTP1 Homo sapiens CSTP1 and related proteins, metallophosphatase domain. CSTP1 (complete S-transactivated protein 1) is an uncharacterized Homo sapiens protein with a metallophosphatase domain, that is transactivated by the complete S protein of hepatitis B virus.  CSTP1 belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is th
Probab=96.80  E-value=0.059  Score=59.17  Aligned_cols=28  Identities=7%  Similarity=0.100  Sum_probs=22.0

Q ss_pred             HHHHHHHHHHcCCcEEEEcccccccceE
Q 001901          884 PDRVMEFCNNNDLQLIVRAHECVMDGFE  911 (998)
Q Consensus       884 ~~~~~~fl~~~~l~~iiR~H~~~~~G~~  911 (998)
                      ...+.+.|++.++++++-||.=......
T Consensus       195 ~~~l~~ll~~~~V~~v~~GH~H~~~~~~  222 (262)
T cd07395         195 RKPLLDKFKKAGVKAVFSGHYHRNAGGR  222 (262)
T ss_pred             HHHHHHHHHhcCceEEEECccccCCceE
Confidence            3567778899999999999997655543


No 110
>cd07396 MPP_Nbla03831 Homo sapiens Nbla03831 and related proteins, metallophosphatase domain. Nbla03831 (also known as LOC56985) is an uncharacterized Homo sapiens protein with a domain that belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for productive metal coordination.
Probab=96.75  E-value=0.0035  Score=69.12  Aligned_cols=73  Identities=23%  Similarity=0.350  Sum_probs=47.3

Q ss_pred             CeEEEecCC-CC------------HHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCC-hHHHHHHHHHhhhcCCCc
Q 001901          699 PIKIFGDLH-GQ------------FGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQH-SLETITLLLALKVEYPNN  764 (998)
Q Consensus       699 ~i~vvGDiH-G~------------~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~-s~evl~ll~~lk~~~p~~  764 (998)
                      ++.+++|+| +.            ...|.++++.+.....+      -+|++||+++.|.. +.+-+..++.+-...+-.
T Consensus         2 r~~~iSD~H~~~~~~~~~~~~~~~~~~l~~~i~~i~~~~~d------~vv~~GDlv~~~~~~~~~~~~~~~~~l~~l~~p   75 (267)
T cd07396           2 RFGIIADIQYADEDDTRPRYYRNSLEKLEEAVEEWNRESLD------FVVQLGDIIDGDNARAEEALDAVLAILDRLKGP   75 (267)
T ss_pred             eEEEEeccccccCCCcccchHHHhHHHHHHHHHHHHcCCCC------EEEECCCeecCCCchHHHHHHHHHHHHHhcCCC
Confidence            588999999 22            45666677666432222      58899999998873 223333333333333356


Q ss_pred             EEEeecCccccch
Q 001901          765 VHLIRGNHEAADI  777 (998)
Q Consensus       765 v~llrGNHE~~~~  777 (998)
                      ++++.||||....
T Consensus        76 ~~~v~GNHD~~~~   88 (267)
T cd07396          76 VHHVLGNHDLYNP   88 (267)
T ss_pred             EEEecCccccccc
Confidence            9999999998644


No 111
>cd00840 MPP_Mre11_N Mre11 nuclease, N-terminal metallophosphatase domain. Mre11 (also known as SbcD in Escherichia coli) is a subunit of the MRX protein complex. This complex includes: Mre11, Rad50, and Xrs2/Nbs1, and plays a vital role in several nuclear processes including DNA double-strand break repair, telomere length maintenance, cell cycle checkpoint control, and meiotic recombination, in eukaryotes.  During double-strand break repair, the MRX complex is required to hold the two ends of a broken chromosome together.  In vitro studies show that Mre11 has 3'-5' exonuclease activity on dsDNA templates and endonuclease activity on dsDNA and ssDNA templates. In addition to the N-terminal phosphatase domain, the eukaryotic MRE11 members of this family have a C-terminal DNA binding domain (not included in this alignment model).  MRE11-like proteins are found in prokaryotes and archaea was well as in eukaryotes.  Mre11 belongs to the metallophosphatase (MPP) superfamily.  MPPs are functi
Probab=96.73  E-value=0.0026  Score=67.67  Aligned_cols=73  Identities=22%  Similarity=0.243  Sum_probs=46.1

Q ss_pred             CeEEEecCC-CCH--------------HHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcC--
Q 001901          699 PIKIFGDLH-GQF--------------GDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEY--  761 (998)
Q Consensus       699 ~i~vvGDiH-G~~--------------~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~--  761 (998)
                      +++.++|+| |..              ..|.++++.+.....+      .+|+.||++|....+.+.+..+..+-.++  
T Consensus         1 ~i~~~sD~Hlg~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~d------~i~~~GD~~~~~~~~~~~~~~~~~~~~~~~~   74 (223)
T cd00840           1 RFLHTADWHLGKPLKGLSRDRRREDQFEAFEEIVELAIEEKVD------FVLIAGDLFDSNNPSPEALELLIEALRRLKE   74 (223)
T ss_pred             CeEEeccccCCccccCcCcccchHHHHHHHHHHHHHHHhcCCC------EEEECCcccCCCCCCHHHHHHHHHHHHHHHH
Confidence            478999999 422              2355555554332222      68999999998876555443333332222  


Q ss_pred             -CCcEEEeecCccccch
Q 001901          762 -PNNVHLIRGNHEAADI  777 (998)
Q Consensus       762 -p~~v~llrGNHE~~~~  777 (998)
                       .-.++++.||||....
T Consensus        75 ~~~~v~~~~GNHD~~~~   91 (223)
T cd00840          75 AGIPVFIIAGNHDSPSR   91 (223)
T ss_pred             CCCCEEEecCCCCCccc
Confidence             3469999999998654


No 112
>TIGR00619 sbcd exonuclease SbcD. This family is based on the phylogenomic analysis of JA Eisen (1999, Ph.D. Thesis, Stanford University).
Probab=96.64  E-value=0.0042  Score=67.96  Aligned_cols=72  Identities=25%  Similarity=0.295  Sum_probs=45.9

Q ss_pred             CCeEEEecCC-CC-----------HHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHH----HHHHHhhhcC
Q 001901          698 APIKIFGDLH-GQ-----------FGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETI----TLLLALKVEY  761 (998)
Q Consensus       698 ~~i~vvGDiH-G~-----------~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl----~ll~~lk~~~  761 (998)
                      .+++.++|+| |.           +..|.++++.+.-...+      .+|+.||++|+..-+.+..    .+|..|+...
T Consensus         1 mkilh~SD~Hlg~~~~~~~~~~~~~~~l~~l~~~~~~~~~D------~lli~GDi~d~~~p~~~~~~~~~~~l~~l~~~~   74 (253)
T TIGR00619         1 MRILHTSDWHLGKTLEGVSRLAEQKAFLDDLLEFAKAEQID------ALLVAGDVFDTANPPAEAQELFNAFFRNLSDAN   74 (253)
T ss_pred             CEEEEEhhhcCCCccCCCChHHHHHHHHHHHHHHHHHcCCC------EEEECCccCCCCCCCHHHHHHHHHHHHHHHhcC
Confidence            3688999999 32           22344444443222222      6899999999986655443    3444554443


Q ss_pred             CCcEEEeecCcccc
Q 001901          762 PNNVHLIRGNHEAA  775 (998)
Q Consensus       762 p~~v~llrGNHE~~  775 (998)
                      |-.|+++.||||..
T Consensus        75 ~i~v~~i~GNHD~~   88 (253)
T TIGR00619        75 PIPIVVISGNHDSA   88 (253)
T ss_pred             CceEEEEccCCCCh
Confidence            35799999999984


No 113
>cd00844 MPP_Dbr1_N Dbr1 RNA lariat debranching enzyme, N-terminal metallophosphatase domain. Dbr1 is an RNA lariat debranching enzyme that hydrolyzes 2'-5' phosphodiester bonds at the branch points of excised intron lariats.  This alignment model represents the N-terminal metallophosphatase domain of Dbr1.  This domain belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal s
Probab=96.59  E-value=0.0043  Score=67.98  Aligned_cols=70  Identities=20%  Similarity=0.328  Sum_probs=44.4

Q ss_pred             eEEEecCCCCHHHHHHHHHHcCC---CCCCCCccceeEEEeccccCCCC-ChHHHHH------HHHHh------hhcCCC
Q 001901          700 IKIFGDLHGQFGDLMRLFDEYGS---PSTAGDIAYIDYLFLGDYVDRGQ-HSLETIT------LLLAL------KVEYPN  763 (998)
Q Consensus       700 i~vvGDiHG~~~dL~~il~~~g~---~~~~~~~~~~~~vfLGDyVDRG~-~s~evl~------ll~~l------k~~~p~  763 (998)
                      |+|+||+||++..+.+.++....   ...+      -+|++||+-..+. ..++.+.      -+..+      ..+.|-
T Consensus         1 i~v~Gd~HG~~~~~~~~~~~~~~~~~~~~D------~lI~~GDf~~~~~~~d~~~~~~p~k~~~~~~f~~~~~g~~~~p~   74 (262)
T cd00844           1 IAVEGCCHGELDKIYETLEKIEKKEGTKVD------LLICCGDFQAVRNEADLKCMAVPPKYRKMGDFYKYYSGEKKAPI   74 (262)
T ss_pred             CEEEecCCccHHHHHHHHHHHHHhcCCCCc------EEEEcCCCCCcCCcchhhhhccchhhhhhhhHHHHhcCCccCCe
Confidence            68999999999888775544321   1222      5888999975443 3343331      11111      334566


Q ss_pred             cEEEeecCcccc
Q 001901          764 NVHLIRGNHEAA  775 (998)
Q Consensus       764 ~v~llrGNHE~~  775 (998)
                      -+++|-||||..
T Consensus        75 ~t~fi~GNHE~~   86 (262)
T cd00844          75 LTIFIGGNHEAS   86 (262)
T ss_pred             eEEEECCCCCCH
Confidence            789999999974


No 114
>PRK04036 DNA polymerase II small subunit; Validated
Probab=96.50  E-value=0.0095  Score=71.55  Aligned_cols=79  Identities=20%  Similarity=0.250  Sum_probs=44.2

Q ss_pred             cCCeEEEecCC-CCH----HHHHHHHHHc-CCCCCCC--CccceeEEEeccccCC-CCCh---------------HHHHH
Q 001901          697 KAPIKIFGDLH-GQF----GDLMRLFDEY-GSPSTAG--DIAYIDYLFLGDYVDR-GQHS---------------LETIT  752 (998)
Q Consensus       697 ~~~i~vvGDiH-G~~----~dL~~il~~~-g~~~~~~--~~~~~~~vfLGDyVDR-G~~s---------------~evl~  752 (998)
                      ...+++++||| |.-    ..+.++++.+ |......  ...-..+|++||+||. |.+.               -++..
T Consensus       243 ~~~i~~ISDlHlgs~~~~~~~l~~li~~L~g~~~~~~~~~~~~d~lVIaGDivd~~~~~p~~~~~~~~~~~~~~~~~l~~  322 (504)
T PRK04036        243 KVYAVFISDVHVGSKEFLEDAFEKFIDWLNGEVGNEEEIASRVKYLIIAGDLVDGIGIYPGQEEELEIVDIYEQYEAAAE  322 (504)
T ss_pred             ccEEEEEcccCCCCcchhHHHHHHHHHHHhCCCccchhhhhcCCEEEEeCcccccccCCccchhhccchhhHHHHHHHHH
Confidence            35689999999 652    2234444433 2221100  0001268999999994 3211               13444


Q ss_pred             HHHHhhhcCCCcEEEeecCccccch
Q 001901          753 LLLALKVEYPNNVHLIRGNHEAADI  777 (998)
Q Consensus       753 ll~~lk~~~p~~v~llrGNHE~~~~  777 (998)
                      +|..|..  .-.|++++||||....
T Consensus       323 ~L~~L~~--~i~V~~ipGNHD~~~~  345 (504)
T PRK04036        323 YLKQIPE--DIKIIISPGNHDAVRQ  345 (504)
T ss_pred             HHHhhhc--CCeEEEecCCCcchhh
Confidence            5555432  2369999999997543


No 115
>PHA02546 47 endonuclease subunit; Provisional
Probab=96.41  E-value=0.0059  Score=69.76  Aligned_cols=72  Identities=24%  Similarity=0.350  Sum_probs=44.8

Q ss_pred             CCeEEEecCC-C-----------CHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCC-CChHHHHHHHHH----hhhc
Q 001901          698 APIKIFGDLH-G-----------QFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRG-QHSLETITLLLA----LKVE  760 (998)
Q Consensus       698 ~~i~vvGDiH-G-----------~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG-~~s~evl~ll~~----lk~~  760 (998)
                      ++++.++|+| |           +...|.++++.+.-...+      -+|+.||++|+. ..+.+++.++..    +-..
T Consensus         1 MKilhiSD~HLG~~~~~~~~~~~~~~~l~~ii~~a~~~~vD------~VliaGDlfD~~~~~~~~~~~~~~~~l~~~L~~   74 (340)
T PHA02546          1 MKILLIGDQHLGVRKDDPWFQNYQLKFIKQAIEYSKAHGIT------TWIQLGDTFDVRKAITQNTMNFVREKIFDLLKE   74 (340)
T ss_pred             CeEEEEeeecCCCcCCChhhHHHHHHHHHHHHHHHHHcCCC------EEEECCcccCCCCCCCHHHHHHHHHHHHHHHHH
Confidence            3688999999 4           223445554444322222      688999999985 445555444432    2122


Q ss_pred             CCCcEEEeecCcccc
Q 001901          761 YPNNVHLIRGNHEAA  775 (998)
Q Consensus       761 ~p~~v~llrGNHE~~  775 (998)
                      .+-.|++|.||||..
T Consensus        75 ~gi~v~~I~GNHD~~   89 (340)
T PHA02546         75 AGITLHVLVGNHDMY   89 (340)
T ss_pred             CCCeEEEEccCCCcc
Confidence            345799999999974


No 116
>cd07398 MPP_YbbF-LpxH Escherichia coli YbbF/LpxH and related proteins, metallophosphatase domain. YbbF/LpxH is an Escherichia coli UDP-2,3-diacylglucosamine hydrolase thought to catalyze the fourth step of lipid A biosynthesis, in which a precursor UDP-2,3-diacylglucosamine is hydrolyzed to yield 2,3-diacylglucosamine 1-phosphate and UMP.  YbbF belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues l
Probab=96.34  E-value=0.0075  Score=64.00  Aligned_cols=26  Identities=8%  Similarity=0.087  Sum_probs=20.7

Q ss_pred             eCHHHHHHHHHHcCCcEEEEcccccc
Q 001901          882 FGPDRVMEFCNNNDLQLIVRAHECVM  907 (998)
Q Consensus       882 fg~~~~~~fl~~~~l~~iiR~H~~~~  907 (998)
                      .....+.+.++..+.+++|-||.=..
T Consensus       176 ~~~~~~~~~~~~~~~~~~i~GH~H~~  201 (217)
T cd07398         176 VFEEAVARLARRKGVDGVICGHTHRP  201 (217)
T ss_pred             HHHHHHHHHHHhcCCCEEEECCCCCC
Confidence            34566777888999999999998554


No 117
>cd07402 MPP_GpdQ Enterobacter aerogenes GpdQ and related proteins, metallophosphatase domain. GpdQ (glycerophosphodiesterase Q, also known as Rv0805 in Mycobacterium tuberculosis) is a binuclear metallophosphoesterase from Enterobacter aerogenes that catalyzes the hydrolysis of mono-, di-, and triester substrates, including some organophosphate pesticides and products of the degradation of nerve agents.  The GpdQ homolog, Rv0805, has 2',3'-cyclic nucleotide phosphodiesterase activity. GpdQ and Rv0805 belong to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosa
Probab=96.29  E-value=0.011  Score=63.85  Aligned_cols=69  Identities=26%  Similarity=0.328  Sum_probs=43.9

Q ss_pred             CeEEEecCCCC------------HHHHHHHHHHcCCC--CCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCc
Q 001901          699 PIKIFGDLHGQ------------FGDLMRLFDEYGSP--STAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNN  764 (998)
Q Consensus       699 ~i~vvGDiHG~------------~~dL~~il~~~g~~--~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~  764 (998)
                      ++.+++|||=.            ...|.++++.+...  ..+      -+|++||+++.|..  +-...++.+..+.+-.
T Consensus         1 r~~~iSDlH~~~~~~~~~~~~~~~~~l~~~~~~i~~~~~~~d------~vi~~GDl~~~~~~--~~~~~~~~~l~~~~~p   72 (240)
T cd07402           1 LLAQISDLHLRADGEGALLGVDTAASLEAVLAHINALHPRPD------LVLVTGDLTDDGSP--ESYERLRELLAALPIP   72 (240)
T ss_pred             CEEEEeCCccCCCCcceecCcCHHHHHHHHHHHHHhcCCCCC------EEEECccCCCCCCH--HHHHHHHHHHhhcCCC
Confidence            47899999944            34567777765432  222      58899999998753  2222222222223456


Q ss_pred             EEEeecCcccc
Q 001901          765 VHLIRGNHEAA  775 (998)
Q Consensus       765 v~llrGNHE~~  775 (998)
                      ++.++||||..
T Consensus        73 ~~~v~GNHD~~   83 (240)
T cd07402          73 VYLLPGNHDDR   83 (240)
T ss_pred             EEEeCCCCCCH
Confidence            99999999974


No 118
>PRK11138 outer membrane biogenesis protein BamB; Provisional
Probab=96.26  E-value=1.5  Score=51.08  Aligned_cols=181  Identities=17%  Similarity=0.209  Sum_probs=100.4

Q ss_pred             CCcEEEEECCCCc--EEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeec--CCC
Q 001901          149 TADVHCYDVLTNK--WSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQ--GPG  224 (998)
Q Consensus       149 ~~dv~~yD~~t~~--W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~--g~~  224 (998)
                      .+.++.||..+.+  |+.-.... ....+...+-++.++.+|+..+.       ..++.+|..+....|......  +..
T Consensus       169 ~g~l~ald~~tG~~~W~~~~~~~-~~~~~~~~sP~v~~~~v~~~~~~-------g~v~a~d~~~G~~~W~~~~~~~~~~~  240 (394)
T PRK11138        169 NGMLQALNESDGAVKWTVNLDVP-SLTLRGESAPATAFGGAIVGGDN-------GRVSAVLMEQGQLIWQQRISQPTGAT  240 (394)
T ss_pred             CCEEEEEEccCCCEeeeecCCCC-cccccCCCCCEEECCEEEEEcCC-------CEEEEEEccCChhhheeccccCCCcc
Confidence            3568999998875  87643220 01112222334456676664432       458889998876678753211  100


Q ss_pred             CCCC---cccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccC
Q 001901          225 PGPR---YGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRD  301 (998)
Q Consensus       225 P~~R---~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~  301 (998)
                      ...|   ...+-++.++ .+|+.+. +     ..++++|+.+....|+.-..  ..       ...++.+++||+...  
T Consensus       241 ~~~~~~~~~~sP~v~~~-~vy~~~~-~-----g~l~ald~~tG~~~W~~~~~--~~-------~~~~~~~~~vy~~~~--  302 (394)
T PRK11138        241 EIDRLVDVDTTPVVVGG-VVYALAY-N-----GNLVALDLRSGQIVWKREYG--SV-------NDFAVDGGRIYLVDQ--  302 (394)
T ss_pred             chhcccccCCCcEEECC-EEEEEEc-C-----CeEEEEECCCCCEEEeecCC--Cc-------cCcEEECCEEEEEcC--
Confidence            0001   1123344555 7887553 2     36899999988778986421  10       123456889998753  


Q ss_pred             CCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCe
Q 001901          302 ASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGV  374 (998)
Q Consensus       302 ~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~  374 (998)
                           ...++.++..+ ++=.|....   ...+...+.++.++++|+...          ...++++|..+.+
T Consensus       303 -----~g~l~ald~~t-G~~~W~~~~---~~~~~~~sp~v~~g~l~v~~~----------~G~l~~ld~~tG~  356 (394)
T PRK11138        303 -----NDRVYALDTRG-GVELWSQSD---LLHRLLTAPVLYNGYLVVGDS----------EGYLHWINREDGR  356 (394)
T ss_pred             -----CCeEEEEECCC-CcEEEcccc---cCCCcccCCEEECCEEEEEeC----------CCEEEEEECCCCC
Confidence                 23467776643 333343221   112333445667899987532          2348889998875


No 119
>COG1409 Icc Predicted phosphohydrolases [General function prediction only]
Probab=96.21  E-value=0.11  Score=57.55  Aligned_cols=74  Identities=27%  Similarity=0.357  Sum_probs=50.0

Q ss_pred             CeEEEecCCCC------HHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCC-hHHHHHHHHHhhhcCCCcEEEeecC
Q 001901          699 PIKIFGDLHGQ------FGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQH-SLETITLLLALKVEYPNNVHLIRGN  771 (998)
Q Consensus       699 ~i~vvGDiHG~------~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~-s~evl~ll~~lk~~~p~~v~llrGN  771 (998)
                      ++..|+|+|--      ...+.++++.+.....+      -+|+.||+.++|.. ..+-+..++. +...+..+++++||
T Consensus         2 ~i~~isD~H~~~~~~~~~~~~~~~~~~i~~~~~D------~~v~tGDl~~~~~~~~~~~~~~~l~-~~~~~~~~~~vpGN   74 (301)
T COG1409           2 RIAHISDLHLGALGVDSEELLEALLAAIEQLKPD------LLVVTGDLTNDGEPEEYRRLKELLA-RLELPAPVIVVPGN   74 (301)
T ss_pred             eEEEEecCcccccccchHHHHHHHHHHHhcCCCC------EEEEccCcCCCCCHHHHHHHHHHHh-hccCCCceEeeCCC
Confidence            57889999976      34556666776643333      69999999999642 2222222222 23667889999999


Q ss_pred             ccccchhh
Q 001901          772 HEAADINA  779 (998)
Q Consensus       772 HE~~~~~~  779 (998)
                      ||....+.
T Consensus        75 HD~~~~~~   82 (301)
T COG1409          75 HDARVVNG   82 (301)
T ss_pred             CcCCchHH
Confidence            99976653


No 120
>KOG0918 consensus Selenium-binding protein [Inorganic ion transport and metabolism]
Probab=96.17  E-value=0.00054  Score=76.00  Aligned_cols=208  Identities=9%  Similarity=-0.119  Sum_probs=138.5

Q ss_pred             eeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhhcccc
Q 001901          732 IDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLFNWLP  811 (998)
Q Consensus       732 ~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f~~LP  811 (998)
                      ...|+|+++++++...++.+-+.+..++.|-.+-..++++|+     ..+++++++.-.-.......+|+.+++.+..++
T Consensus        49 latVdvdp~s~t~c~vI~r~~~~~~gdelhhsgwn~~ssc~~-----~~~~~R~~LVlp~l~S~riyvid~~~ep~~~~l  123 (476)
T KOG0918|consen   49 LATVDVDPSSPTYCQVIHRLPMPYLGDELHHSGWNSCSSCHG-----DSSFKRRYLVLPSLNSGRIYVIDVKTEPRKPSL  123 (476)
T ss_pred             eeEEecCCCCCcceeeEEEeccCcccchhcccchhhhhhhcc-----CcchhhhheeecccccCceEEEEeccCcCccce
Confidence            368999999999999999999999999998888889999994     355667766666566667789999999999999


Q ss_pred             eeEEEcCeEEEecCCccCcccCHHhhhhccCCcccCCCCcceeccccCCCCCCCC--CCCcccCCCCCCceeeCHH--HH
Q 001901          812 LAALIEKKIICMHGGIGRSINHVEQIENLQRPITMEAGSIVLMDLLWSDPTENDS--VEGLRPNARGPGLVTFGPD--RV  887 (998)
Q Consensus       812 ~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~--~~~~~~n~rg~~~~~fg~~--~~  887 (998)
                      ..++.. +++|.||++.|...+...+.++.-...-+.+  ...+. |-++.+.+.  ..-|.  .++.. ..||-|  ..
T Consensus       124 ~k~i~~-~il~~~~l~~Pht~hcla~g~v~vs~lGd~~--gn~kg-~f~llD~~~~~k~tw~--~~~~~-p~~gyDfwyq  196 (476)
T KOG0918|consen  124 EKTIDP-DILEKTGLACPHTSHCLASGNVMVSCLGDAE--GNAKG-GFLLLDSDFNEKGTWE--KPGHS-PLFGYDFWYQ  196 (476)
T ss_pred             eeeech-hhHhhcCCcCCcccccccCCCeeEEeecccc--cCCcC-CeEEecCccceecccc--cCCCc-cccccceeec
Confidence            997777 9999999999987766555433211111111  11111 333332110  11121  11211 223322  22


Q ss_pred             HHHHHHcCCcEEEEcccccccceEEecCCeEEEEeccccccCCCCCeEEEEEEcCC--ceEEeEEecc
Q 001901          888 MEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYCGTANNAGAILVLGRD--LVVVPKLIHP  953 (998)
Q Consensus       888 ~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~~~~~n~ga~l~~~~~--~~~~~~~~~~  953 (998)
                      -.+......+.+.+.|...-.++..+.++  ++.|+..-|.-...|.++.+-++.+  +.++.+.+|-
T Consensus       197 pr~~~mIstewgap~~~~~gf~~~~v~d~--lyg~~lhvy~w~~~~~~QtidL~~~gllpleiRfLh~  262 (476)
T KOG0918|consen  197 PRHNVMISTEWGAPNALRKGFNPADVEDG--LYGSHLHVYQWSPGELKQTIDLGDTGLLPLEIRFLHN  262 (476)
T ss_pred             cccceEEeecccCchhhhcCCChhHhhcc--ceeeeeEEEecCCccceeEEecCCCCcceEEeeeccC
Confidence            34556667777888888544444455565  8889999998888899999988875  2334444443


No 121
>TIGR00024 SbcD_rel_arch putative phosphoesterase, SbcD/Mre11-related. Members of this uncharacterized family share a motif approximating DXH(X25)GDXXD(X25)GNHD as found in several phosphoesterases, including the nucleases SbcD and Mre11. SbcD is a subunit of the SbcCD nuclease of E. coli that can cleave DNA hairpins to unblock stalled DNA replication. All members of this family are archaeal.
Probab=96.10  E-value=0.015  Score=62.30  Aligned_cols=69  Identities=20%  Similarity=0.206  Sum_probs=41.4

Q ss_pred             CCeEEEecCC-CCHHH----------------HHHHHHHcCCCCCCCCccceeEEEeccccCCCCCh---HHHHHHHHHh
Q 001901          698 APIKIFGDLH-GQFGD----------------LMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHS---LETITLLLAL  757 (998)
Q Consensus       698 ~~i~vvGDiH-G~~~d----------------L~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s---~evl~ll~~l  757 (998)
                      +.+.||+|+| |--..                |.++.+.......+      .+|++||+++.....   -++..+|..+
T Consensus        15 ~~~LvisDlHLG~~~~~~~~Gi~~P~~~~~~~l~rl~~li~~~~~d------~vIi~GDl~h~~~~~~~~~~~~~~l~~~   88 (225)
T TIGR00024        15 GDKAVIADLHLGFERHLDEQGVMVPGFQFREIIERALSIADKYGIE------ALIINGDLKHEFKKGLEWRFIREFIEVT   88 (225)
T ss_pred             cCeEEEEeccCCCHHHHHhcCCcCChhHHHHHHHHHHHHHhhcCCC------EEEEcCccccccCChHHHHHHHHHHHhc
Confidence            6799999999 54222                22232322221122      799999999765542   2223333332


Q ss_pred             hhcCCCcEEEeecCccccc
Q 001901          758 KVEYPNNVHLIRGNHEAAD  776 (998)
Q Consensus       758 k~~~p~~v~llrGNHE~~~  776 (998)
                          ...+++++||||...
T Consensus        89 ----~~~v~~V~GNHD~~~  103 (225)
T TIGR00024        89 ----FRDLILIRGNHDALI  103 (225)
T ss_pred             ----CCcEEEECCCCCCcc
Confidence                247999999999743


No 122
>cd08165 MPP_MPPE1 human MPPE1 and related proteins, metallophosphatase domain. MPPE1 is a functionally uncharacterized metallophosphatase domain-containing protein. The MPPE1 gene is located on chromosome 18 and is a candidate susceptibility gene for Bipolar disorder.  MPPE1 belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to 
Probab=96.01  E-value=0.0095  Score=60.16  Aligned_cols=43  Identities=23%  Similarity=0.349  Sum_probs=27.7

Q ss_pred             eEEEeccccCCCCCh--H---HHHHHHHHhhhcC-CCcEEEeecCcccc
Q 001901          733 DYLFLGDYVDRGQHS--L---ETITLLLALKVEY-PNNVHLIRGNHEAA  775 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s--~---evl~ll~~lk~~~-p~~v~llrGNHE~~  775 (998)
                      .+||+||++|.+...  .   +.+..+..+.... .-.++++.||||..
T Consensus        41 ~vv~~GDl~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~i~~v~GNHD~~   89 (156)
T cd08165          41 VVFVLGDLFDEGKWSTDEEWEDYVERFKKMFGHPPDLPLHVVVGNHDIG   89 (156)
T ss_pred             EEEECCCCCCCCccCCHHHHHHHHHHHHHHhccCCCCeEEEEcCCCCcC
Confidence            699999999988642  1   2222233322222 24699999999974


No 123
>PF13360 PQQ_2:  PQQ-like domain; PDB: 3HXJ_B 1YIQ_A 1KV9_A 3Q54_A 2YH3_A 3PRW_A 3P1L_A 3Q7M_A 3Q7O_A 3Q7N_A ....
Probab=95.97  E-value=2.8  Score=44.59  Aligned_cols=181  Identities=19%  Similarity=0.215  Sum_probs=103.2

Q ss_pred             CcEEEEECCCCc--EEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEE-eeecCCCCC
Q 001901          150 ADVHCYDVLTNK--WSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHR-VVVQGPGPG  226 (998)
Q Consensus       150 ~dv~~yD~~t~~--W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~-l~~~g~~P~  226 (998)
                      ..+++||..+++  |+.-...      +.....+..++.+|+..+.       +.++.+|..+....|.. .......+ 
T Consensus        46 ~~l~~~d~~tG~~~W~~~~~~------~~~~~~~~~~~~v~v~~~~-------~~l~~~d~~tG~~~W~~~~~~~~~~~-  111 (238)
T PF13360_consen   46 GNLYALDAKTGKVLWRFDLPG------PISGAPVVDGGRVYVGTSD-------GSLYALDAKTGKVLWSIYLTSSPPAG-  111 (238)
T ss_dssp             SEEEEEETTTSEEEEEEECSS------CGGSGEEEETTEEEEEETT-------SEEEEEETTTSCEEEEEEE-SSCTCS-
T ss_pred             CEEEEEECCCCCEEEEeeccc------cccceeeecccccccccce-------eeeEecccCCcceeeeeccccccccc-
Confidence            489999998875  7665422      2222246778888887632       37999998887778994 43211111 


Q ss_pred             CCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCC----ccceEEEEEeCCEEEEEeccCC
Q 001901          227 PRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPP----CMYATASARSDGLLLLCGGRDA  302 (998)
Q Consensus       227 ~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~----r~~~~a~~~~~~~lyvfGG~~~  302 (998)
                      .+......+.++ .+|+...      -..++.+|+.+....|......+.....    .......++.++.+|++.+.. 
T Consensus       112 ~~~~~~~~~~~~-~~~~~~~------~g~l~~~d~~tG~~~w~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~~~~~~g-  183 (238)
T PF13360_consen  112 VRSSSSPAVDGD-RLYVGTS------SGKLVALDPKTGKLLWKYPVGEPRGSSPISSFSDINGSPVISDGRVYVSSGDG-  183 (238)
T ss_dssp             TB--SEEEEETT-EEEEEET------CSEEEEEETTTTEEEEEEESSTT-SS--EEEETTEEEEEECCTTEEEEECCTS-
T ss_pred             cccccCceEecC-EEEEEec------cCcEEEEecCCCcEEEEeecCCCCCCcceeeecccccceEEECCEEEEEcCCC-
Confidence            233344444454 5666543      2478999999888789885533211000    001233445567888876533 


Q ss_pred             CCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCe
Q 001901          303 SSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGV  374 (998)
Q Consensus       303 ~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~  374 (998)
                            .++.++ ..++.-.|......     ........++.||+.. .         ...++++|++|++
T Consensus       184 ------~~~~~d-~~tg~~~w~~~~~~-----~~~~~~~~~~~l~~~~-~---------~~~l~~~d~~tG~  233 (238)
T PF13360_consen  184 ------RVVAVD-LATGEKLWSKPISG-----IYSLPSVDGGTLYVTS-S---------DGRLYALDLKTGK  233 (238)
T ss_dssp             ------SEEEEE-TTTTEEEEEECSS------ECECEECCCTEEEEEE-T---------TTEEEEEETTTTE
T ss_pred             ------eEEEEE-CCCCCEEEEecCCC-----ccCCceeeCCEEEEEe-C---------CCEEEEEECCCCC
Confidence                  156664 44455345332111     1122455577888765 2         2459999999985


No 124
>cd00839 MPP_PAPs purple acid phosphatases of the metallophosphatase superfamily, metallophosphatase domain. Purple acid phosphatases (PAPs) belong to a diverse family of binuclear metallohydrolases that have been identified and characterized in plants, animals, and fungi.   PAPs contain a binuclear metal center and their characteristic pink or purple color derives from a charge-transfer transition between a tyrosine residue and a chromophoric ferric ion within the binuclear center.  PAPs catalyze the hydrolysis of a wide range of activated phosphoric acid mono- and di-esters and anhydrides.  PAPs are distinguished from the other phosphatases by their insensitivity to L-(+) tartrate inhibition and are therefore also known as tartrate resistant acid phosphatases (TRAPs).  While only a few copies of PAP-like genes are present in mammalian and fungal genomes, multiple copies are present in plant genomes.  PAPs belong to the metallophosphatase (MPP) superfamily.  MPPs are functionally diver
Probab=95.95  E-value=0.039  Score=61.54  Aligned_cols=37  Identities=8%  Similarity=0.151  Sum_probs=25.6

Q ss_pred             CHHHHHHHHHHcCCcEEEEcccccccceEEecCCeEE
Q 001901          883 GPDRVMEFCNNNDLQLIVRAHECVMDGFERFAQGHLI  919 (998)
Q Consensus       883 g~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~i  919 (998)
                      ....+.+.|+++++++++-||.-...-+....+++++
T Consensus       181 ~~~~l~~ll~~~~v~~vl~GH~H~y~r~~p~~~~~~~  217 (294)
T cd00839         181 MRAALEDLFYKYGVDLVLSGHVHAYERTCPVYNGTVV  217 (294)
T ss_pred             HHHHHHHHHHHhCCCEEEEccceeeEeechhhCCEec
Confidence            3456778899999999999998654433334455543


No 125
>PRK10966 exonuclease subunit SbcD; Provisional
Probab=95.91  E-value=0.012  Score=68.75  Aligned_cols=71  Identities=23%  Similarity=0.371  Sum_probs=43.5

Q ss_pred             CeEEEecCC-CC-H------HH----HHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHH----HHHHHhhhcCC
Q 001901          699 PIKIFGDLH-GQ-F------GD----LMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETI----TLLLALKVEYP  762 (998)
Q Consensus       699 ~i~vvGDiH-G~-~------~d----L~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl----~ll~~lk~~~p  762 (998)
                      +++.++|+| |. +      .+    |.++.+.+.-...+      -+|+.||++|++..+.+..    .++..|+.. +
T Consensus         2 kilh~SDlHlG~~~~~~~~~~~~~~~l~~l~~~i~~~~~D------~viIaGDifD~~~p~~~a~~~~~~~l~~L~~~-~   74 (407)
T PRK10966          2 RILHTSDWHLGQNFYSKSRAAEHQAFLDWLLEQVQEHQVD------AIIVAGDIFDTGSPPSYARELYNRFVVNLQQT-G   74 (407)
T ss_pred             EEEEEcccCCCCcccCcccHHHHHHHHHHHHHHHHhcCCC------EEEECCccccCCCCcHHHHHHHHHHHHHHHhc-C
Confidence            688999999 42 1      11    22333333222222      6889999999986554432    334445432 3


Q ss_pred             CcEEEeecCccccc
Q 001901          763 NNVHLIRGNHEAAD  776 (998)
Q Consensus       763 ~~v~llrGNHE~~~  776 (998)
                      -.|+++.||||...
T Consensus        75 ~~v~~I~GNHD~~~   88 (407)
T PRK10966         75 CQLVVLAGNHDSVA   88 (407)
T ss_pred             CcEEEEcCCCCChh
Confidence            46999999999753


No 126
>PRK11148 cyclic 3',5'-adenosine monophosphate phosphodiesterase; Provisional
Probab=95.88  E-value=0.018  Score=63.77  Aligned_cols=70  Identities=13%  Similarity=0.102  Sum_probs=45.6

Q ss_pred             CCeEEEecCC-C-----------CHHHHHHHHHHcCCC--CCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCC
Q 001901          698 APIKIFGDLH-G-----------QFGDLMRLFDEYGSP--STAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPN  763 (998)
Q Consensus       698 ~~i~vvGDiH-G-----------~~~dL~~il~~~g~~--~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~  763 (998)
                      .+++.++|+| .           ....|.++++.+...  ..+      -+|+.||++|.|.  .+-+..++..-.+.+.
T Consensus        15 ~~i~~iSD~Hl~~~~~~~~~~~~~~~~l~~~i~~i~~~~~~~D------~vvitGDl~~~~~--~~~~~~~~~~l~~l~~   86 (275)
T PRK11148         15 VRILQITDTHLFADEHETLLGVNTWESYQAVLEAIRAQQHEFD------LIVATGDLAQDHS--SEAYQHFAEGIAPLRK   86 (275)
T ss_pred             EEEEEEcCcccCCCCCCceeccCHHHHHHHHHHHHHhhCCCCC------EEEECCCCCCCCC--HHHHHHHHHHHhhcCC
Confidence            4589999999 1           145677777765321  112      5889999999885  2333333333333456


Q ss_pred             cEEEeecCcccc
Q 001901          764 NVHLIRGNHEAA  775 (998)
Q Consensus       764 ~v~llrGNHE~~  775 (998)
                      .++++.||||..
T Consensus        87 Pv~~v~GNHD~~   98 (275)
T PRK11148         87 PCVWLPGNHDFQ   98 (275)
T ss_pred             cEEEeCCCCCCh
Confidence            799999999973


No 127
>cd07383 MPP_Dcr2 Saccharomyces cerevisiae DCR2 phosphatase and related proteins, metallophosphatase domain. DCR2 phosphatase (Dosage-dependent Cell Cycle Regulator 2) functions together with DCR1 (Gid8) in a common pathway to accelerate initiation of DNA replication in Saccharomyces cerevisiae. Genetic analysis suggests that DCR1 functions upstream of DCR2.  DCR2 interacts with and dephosphorylates Sic1, an inhibitor of mitotic cyclin/cyclin-dependent kinase complexes, which may serve to trigger the initiation of cell division.  DCR2 belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAP
Probab=95.78  E-value=0.025  Score=59.35  Aligned_cols=41  Identities=15%  Similarity=0.174  Sum_probs=30.1

Q ss_pred             eEEEeccccCCCCC---hHHHHHHHHHhhhcCCCcEEEeecCcc
Q 001901          733 DYLFLGDYVDRGQH---SLETITLLLALKVEYPNNVHLIRGNHE  773 (998)
Q Consensus       733 ~~vfLGDyVDRG~~---s~evl~ll~~lk~~~p~~v~llrGNHE  773 (998)
                      .+|++||+++.+..   +.+.+..++.......-.++++.||||
T Consensus        44 ~vv~~GDl~~~~~~~~~~~~~~~~~~~~l~~~~~p~~~~~GNHD   87 (199)
T cd07383          44 LVVLTGDLITGENTNDNSTSALDKAVSPMIDRKIPWAATFGNHD   87 (199)
T ss_pred             EEEECCccccCCCCchHHHHHHHHHHHHHHHcCCCEEEECccCC
Confidence            68999999997765   356666555544434456899999999


No 128
>TIGR01640 F_box_assoc_1 F-box protein interaction domain. This model describes a large family of plant domains, with several hundred members in Arabidopsis thaliana. Most examples are found C-terminal to an F-box (pfam00646), a 60 amino acid motif involved in ubiquitination of target proteins to mark them for degradation. Two-hybid experiments support the idea that most members are interchangeable F-box subunits of SCF E3 complexes. Some members have two copies of this domain.
Probab=95.74  E-value=1  Score=48.24  Aligned_cols=164  Identities=13%  Similarity=0.137  Sum_probs=91.7

Q ss_pred             ccEEEEEcCCCCCceEEeeecCCCCCCC---ccc-EEEEE----CCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcc
Q 001901          201 EDLHVLDLTQQRPRWHRVVVQGPGPGPR---YGH-VMALV----GQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLE  272 (998)
Q Consensus       201 ~dv~~~Dl~t~t~~W~~l~~~g~~P~~R---~~h-s~~~~----~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~  272 (998)
                      ..++++|+.|.  +|..++.   .+.++   ..+ ...-+    ++-+++.+....+......+++|++.++  .|+.+.
T Consensus        14 ~~~~V~NP~T~--~~~~LP~---~~~~~~~~~~~~~~~G~d~~~~~YKVv~~~~~~~~~~~~~~~Vys~~~~--~Wr~~~   86 (230)
T TIGR01640        14 KRLVVWNPSTG--QSRWLPT---PKSRRSNKESDTYFLGYDPIEKQYKVLCFSDRSGNRNQSEHQVYTLGSN--SWRTIE   86 (230)
T ss_pred             CcEEEECCCCC--CEEecCC---CCCcccccccceEEEeecccCCcEEEEEEEeecCCCCCccEEEEEeCCC--Cccccc
Confidence            46999999997  5888862   22211   111 11111    1225555544322223457899999999  999987


Q ss_pred             cCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEE-EEECCCCCCCCcceeEEEEECCEEEEEcc
Q 001901          273 PEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWE-WAIAPGVSPSPRYQHAAVFVNARLHVSGG  351 (998)
Q Consensus       273 ~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~-w~~~~g~~P~pR~~hsav~~~~~L~V~GG  351 (998)
                      ...  +....... .+..+|.||-+.-..... ....+..||..+. +|. ....+............+.++|+|.++..
T Consensus        87 ~~~--~~~~~~~~-~v~~~G~lyw~~~~~~~~-~~~~IvsFDl~~E-~f~~~i~~P~~~~~~~~~~~L~~~~G~L~~v~~  161 (230)
T TIGR01640        87 CSP--PHHPLKSR-GVCINGVLYYLAYTLKTN-PDYFIVSFDVSSE-RFKEFIPLPCGNSDSVDYLSLINYKGKLAVLKQ  161 (230)
T ss_pred             cCC--CCccccCC-eEEECCEEEEEEEECCCC-CcEEEEEEEcccc-eEeeeeecCccccccccceEEEEECCEEEEEEe
Confidence            432  11111222 456688888876433211 1225777877765 555 34333211111223456777899888765


Q ss_pred             cCCCCCccccCCeEEEEE-CCCCeEEEcccC
Q 001901          352 ALGGGRMVEDSSSVAVLD-TAAGVWCDTKSV  381 (998)
Q Consensus       352 ~~~~~~~~~~~~dv~vyD-~~t~~W~~v~~~  381 (998)
                      .....     .-+||+++ ....+|+++-..
T Consensus       162 ~~~~~-----~~~IWvl~d~~~~~W~k~~~i  187 (230)
T TIGR01640       162 KKDTN-----NFDLWVLNDAGKQEWSKLFTV  187 (230)
T ss_pred             cCCCC-----cEEEEEECCCCCCceeEEEEE
Confidence            32211     35799996 446679987665


No 129
>cd07386 MPP_DNA_pol_II_small_archeal_C archeal DNA polymerase II, small subunit, C-terminal metallophosphatase domain. The small subunit of the archeal DNA polymerase II contains a C-terminal metallophosphatase domain.  This domain is thought to be functionally active because the active site residues required for phosphoesterase activity in other members of this superfamily are intact.  The archeal replicative DNA polymerases are thought to possess intrinsic phosphatase activity that hydrolyzes the pyrophosphate released during nucleotide polymerization.  This domain belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiestera
Probab=95.68  E-value=0.034  Score=60.37  Aligned_cols=42  Identities=26%  Similarity=0.308  Sum_probs=26.8

Q ss_pred             eEEEeccccCCCC-----C-------h----HHHHHHHHHhhhcCCCcEEEeecCccccc
Q 001901          733 DYLFLGDYVDRGQ-----H-------S----LETITLLLALKVEYPNNVHLIRGNHEAAD  776 (998)
Q Consensus       733 ~~vfLGDyVDRG~-----~-------s----~evl~ll~~lk~~~p~~v~llrGNHE~~~  776 (998)
                      .+|++||++|+..     .       .    .++..+|-.|..  .-.|+++.||||...
T Consensus        38 ~lvi~GDl~d~~~~~~~~~~~~~~~~~~~~~~~~~~~l~~L~~--~~~v~~ipGNHD~~~   95 (243)
T cd07386          38 YLIIAGDLVDGIGVYPGQEEELEILDIYEQYEEAAEYLSDVPS--HIKIIIIPGNHDAVR   95 (243)
T ss_pred             EEEEeCCcccccccCCcchhhhhhhhHHHHHHHHHHHHHhccc--CCeEEEeCCCCCccc
Confidence            7899999999731     0       0    122334344432  246999999999853


No 130
>cd07393 MPP_DR1119 Deinococcus radiodurans DR1119 and related proteins, metallophosphatase domain. DR1119 is an uncharacterized Deinococcus radiodurans protein with a metallophosphatase domain.  The domain present in members of this family belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for productive metal coordinat
Probab=95.43  E-value=0.034  Score=60.03  Aligned_cols=45  Identities=9%  Similarity=-0.020  Sum_probs=28.7

Q ss_pred             eCHHHHHHHHHHcCCcEEEEcccccccceE---EecCCeEEEEecccccc
Q 001901          882 FGPDRVMEFCNNNDLQLIVRAHECVMDGFE---RFAQGHLITLFSATNYC  928 (998)
Q Consensus       882 fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~---~~~~~~~iTvfSa~~y~  928 (998)
                      ++...+.+.+++.++++++-||.=...-..   ...+|  |+.++++.=|
T Consensus       180 ~~~~~~~~~~~~~~v~~vl~GH~H~~~~~~~~~~~~~g--i~~~~~~~~~  227 (232)
T cd07393         180 GDDSPISKLIEEYGVDICVYGHLHGVGRDRAINGERGG--IRYQLVSADY  227 (232)
T ss_pred             CCHHHHHHHHHHcCCCEEEECCCCCCcccccccceECC--EEEEEEcchh
Confidence            355677888899999999999974322211   12333  5666666544


No 131
>cd08163 MPP_Cdc1 Saccharomyces cerevisiae CDC1 and related proteins, metallophosphatase domain. Cdc1 (also known as XlCdc1 in Xenopus laevis) is an endoplasmic reticulum-localized transmembrane lipid phosphatase with a metallophosphatase domain facing the ER lumen.  In budding yeast, the gene encoding CDC1 is essential while nonlethal mutations cause defects in Golgi inheritance and actin polarization.  Cdc1 mutant cells accumulate an unidentified phospholipid, suggesting that Cdc1 is a lipid phosphatase.  Cdc1 mutant cells also have highly elevated intracellular calcium levels suggesting a possible role for Cdc1 in calcium regulation.  The 5' flanking region of Cdc1 is a regulatory region with conserved binding site motifs for AP1, AP2, Sp1, NF-1 and CREB.  DNA polymerase delta consists of at least four subunits - Pol3, Cdc1, Cdc27, and Cdm1.  Cdc1 belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site 
Probab=95.41  E-value=0.42  Score=52.44  Aligned_cols=30  Identities=10%  Similarity=0.035  Sum_probs=24.0

Q ss_pred             eCHHHHHHHHHHcCCcEEEEcccccccceEEe
Q 001901          882 FGPDRVMEFCNNNDLQLIVRAHECVMDGFERF  913 (998)
Q Consensus       882 fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~  913 (998)
                      -.++..++.|+..+-.+|.-||+-  ++.+..
T Consensus       203 l~~~~s~~il~~~~P~~vfsGhdH--~~C~~~  232 (257)
T cd08163         203 LEPSLSEVILKAVQPVIAFSGDDH--DYCEVV  232 (257)
T ss_pred             cCHHHHHHHHHhhCCcEEEecCCC--ccceeE
Confidence            478999999999999999999983  444443


No 132
>TIGR03300 assembly_YfgL outer membrane assembly lipoprotein YfgL. Members of this protein family are YfgL, a lipoprotein component of a complex that acts protein insertion into the bacterial outer membrane. Other members of this complex are NlpB, YfiO, and YaeT. This protein contains multiple copies of a repeat that, in other contexts, are associated with binding of the coenzyme PQQ.
Probab=95.38  E-value=7.1  Score=45.07  Aligned_cols=181  Identities=18%  Similarity=0.192  Sum_probs=94.7

Q ss_pred             cEEEEECCCCc--EEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCC
Q 001901          151 DVHCYDVLTNK--WSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPR  228 (998)
Q Consensus       151 dv~~yD~~t~~--W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R  228 (998)
                      .+++||..+++  |+.-...      +..-+.++.++.+|+.+.       ...++.||..+....|....     +.. 
T Consensus        76 ~v~a~d~~tG~~~W~~~~~~------~~~~~p~v~~~~v~v~~~-------~g~l~ald~~tG~~~W~~~~-----~~~-  136 (377)
T TIGR03300        76 TVVALDAETGKRLWRVDLDE------RLSGGVGADGGLVFVGTE-------KGEVIALDAEDGKELWRAKL-----SSE-  136 (377)
T ss_pred             eEEEEEccCCcEeeeecCCC------CcccceEEcCCEEEEEcC-------CCEEEEEECCCCcEeeeecc-----Cce-
Confidence            68899988764  8654322      112233444667776443       24699999987666787543     111 


Q ss_pred             cccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcc
Q 001901          229 YGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLA  308 (998)
Q Consensus       229 ~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~  308 (998)
                      ...+.++.++ .+|+..+ +     ..++.||+.+....|+.-.....  .........++.++.+| +|..+      .
T Consensus       137 ~~~~p~v~~~-~v~v~~~-~-----g~l~a~d~~tG~~~W~~~~~~~~--~~~~~~~sp~~~~~~v~-~~~~~------g  200 (377)
T TIGR03300       137 VLSPPLVANG-LVVVRTN-D-----GRLTALDAATGERLWTYSRVTPA--LTLRGSASPVIADGGVL-VGFAG------G  200 (377)
T ss_pred             eecCCEEECC-EEEEECC-C-----CeEEEEEcCCCceeeEEccCCCc--eeecCCCCCEEECCEEE-EECCC------C
Confidence            1122333444 6666433 2     35899999888778986533211  00111122334466554 44321      2


Q ss_pred             cEEEEecCCCCeEEEEECCCCCC----CCc---ceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCe--EEE
Q 001901          309 SAYGLAKHRDGRWEWAIAPGVSP----SPR---YQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGV--WCD  377 (998)
Q Consensus       309 dv~~~~~~~~~~W~w~~~~g~~P----~pR---~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~--W~~  377 (998)
                      .++.++.. +++-.|......+.    ..|   ...+.++.++.+|+...          ...+++||+++.+  |..
T Consensus       201 ~v~ald~~-tG~~~W~~~~~~~~g~~~~~~~~~~~~~p~~~~~~vy~~~~----------~g~l~a~d~~tG~~~W~~  267 (377)
T TIGR03300       201 KLVALDLQ-TGQPLWEQRVALPKGRTELERLVDVDGDPVVDGGQVYAVSY----------QGRVAALDLRSGRVLWKR  267 (377)
T ss_pred             EEEEEEcc-CCCEeeeeccccCCCCCchhhhhccCCccEEECCEEEEEEc----------CCEEEEEECCCCcEEEee
Confidence            45666654 33334432211110    001   12334556788887542          2358999998764  654


No 133
>TIGR03300 assembly_YfgL outer membrane assembly lipoprotein YfgL. Members of this protein family are YfgL, a lipoprotein component of a complex that acts protein insertion into the bacterial outer membrane. Other members of this complex are NlpB, YfiO, and YaeT. This protein contains multiple copies of a repeat that, in other contexts, are associated with binding of the coenzyme PQQ.
Probab=95.32  E-value=4.2  Score=46.97  Aligned_cols=185  Identities=18%  Similarity=0.238  Sum_probs=99.6

Q ss_pred             cCCcEEEEECCCCc--EEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCC
Q 001901          148 ATADVHCYDVLTNK--WSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGP  225 (998)
Q Consensus       148 ~~~dv~~yD~~t~~--W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P  225 (998)
                      ....++.||..+.+  |+.-...      ....+.++.++.+|+..+       ...++.+|..+....|..-... +..
T Consensus       113 ~~g~l~ald~~tG~~~W~~~~~~------~~~~~p~v~~~~v~v~~~-------~g~l~a~d~~tG~~~W~~~~~~-~~~  178 (377)
T TIGR03300       113 EKGEVIALDAEDGKELWRAKLSS------EVLSPPLVANGLVVVRTN-------DGRLTALDAATGERLWTYSRVT-PAL  178 (377)
T ss_pred             CCCEEEEEECCCCcEeeeeccCc------eeecCCEEECCEEEEECC-------CCeEEEEEcCCCceeeEEccCC-Cce
Confidence            34578999987764  8754321      112233445677777543       2459999998866678764311 100


Q ss_pred             CCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCC--CCCcc--ceEEEEEeCCEEEEEeccC
Q 001901          226 GPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEG--PPPCM--YATASARSDGLLLLCGGRD  301 (998)
Q Consensus       226 ~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~--P~~r~--~~~a~~~~~~~lyvfGG~~  301 (998)
                      ..+...+.++.++ .+ ++|..++     .+..+|+.+....|+.-...+..  ...+.  ......+.++.+|+...  
T Consensus       179 ~~~~~~sp~~~~~-~v-~~~~~~g-----~v~ald~~tG~~~W~~~~~~~~g~~~~~~~~~~~~~p~~~~~~vy~~~~--  249 (377)
T TIGR03300       179 TLRGSASPVIADG-GV-LVGFAGG-----KLVALDLQTGQPLWEQRVALPKGRTELERLVDVDGDPVVDGGQVYAVSY--  249 (377)
T ss_pred             eecCCCCCEEECC-EE-EEECCCC-----EEEEEEccCCCEeeeeccccCCCCCchhhhhccCCccEEECCEEEEEEc--
Confidence            1122233444554 44 4444332     68899998887788753221110  00010  11223456788887542  


Q ss_pred             CCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCC--eEEE
Q 001901          302 ASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAG--VWCD  377 (998)
Q Consensus       302 ~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~--~W~~  377 (998)
                           ...++.++.. +++-.|....+      ...+.++.++++|+...          ...++++|..+.  .|+.
T Consensus       250 -----~g~l~a~d~~-tG~~~W~~~~~------~~~~p~~~~~~vyv~~~----------~G~l~~~d~~tG~~~W~~  305 (377)
T TIGR03300       250 -----QGRVAALDLR-SGRVLWKRDAS------SYQGPAVDDNRLYVTDA----------DGVVVALDRRSGSELWKN  305 (377)
T ss_pred             -----CCEEEEEECC-CCcEEEeeccC------CccCceEeCCEEEEECC----------CCeEEEEECCCCcEEEcc
Confidence                 1246677664 33333433211      11234567888988642          245899998876  4754


No 134
>TIGR00583 mre11 DNA repair protein (mre11). All proteins in this family for which functions are known are subunits of a nuclease complex made up of multiple proteins including MRE11 and RAD50 homologs. The functions of this nuclease complex include recombinational repair and non-homolgous end joining. This family is based on the phylogenomic analysis of JA Eisen (1999, Ph.D. Thesis, Stanford University). The proteins in this family are distantly related to proteins in the SbcCD complex of bacteria.
Probab=95.25  E-value=0.043  Score=63.80  Aligned_cols=73  Identities=18%  Similarity=0.167  Sum_probs=53.2

Q ss_pred             CCeEEEecCCCC------------HHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhc-----
Q 001901          698 APIKIFGDLHGQ------------FGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVE-----  760 (998)
Q Consensus       698 ~~i~vvGDiHG~------------~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~-----  760 (998)
                      .+|.+++|+|--            +..|.++++.+.-...+      -+|+-||++|+..-|.+++..++.+-.+     
T Consensus         4 mKIlh~SD~HlG~~~~~~~r~~D~~~~f~eil~~a~~~~vD------~VLiaGDLFd~~~Ps~~~~~~~~~~lr~~~~g~   77 (405)
T TIGR00583         4 IRILVSTDNHVGYGENDPVRGDDSWNTFEEVLQIAKEQDVD------MILLGGDLFHENKPSRKSLYQVLRSLRLYCLGD   77 (405)
T ss_pred             eEEEEEcCCCCCCccCCchhhhhHHHHHHHHHHHHHHcCCC------EEEECCccCCCCCCCHHHHHHHHHHHHHhhccC
Confidence            468999999932            45677777776433333      5888999999999998888665554332     


Q ss_pred             -------------------------------CCCcEEEeecCccccc
Q 001901          761 -------------------------------YPNNVHLIRGNHEAAD  776 (998)
Q Consensus       761 -------------------------------~p~~v~llrGNHE~~~  776 (998)
                                                     ..--||+|-||||...
T Consensus        78 ~p~~~~~Lsd~~~~~~~~~~~~~ny~d~~~~~~iPVf~I~GNHD~p~  124 (405)
T TIGR00583        78 KPCELEFLSDASVVFNQSAFGNVNYEDPNINVAIPVFSIHGNHDDPS  124 (405)
T ss_pred             CccchhhccchhhhcccccccccccccccccCCCCEEEEcCCCCCcc
Confidence                                           1237999999999965


No 135
>cd07401 MPP_TMEM62_N Homo sapiens TMEM62, N-terminal metallophosphatase domain. TMEM62 (transmembrane protein 62) is an uncharacterized Homo sapiens transmembrane protein with an N-terminal metallophosphatase domain.  TMEM62 belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for productive metal coordination.
Probab=95.16  E-value=0.057  Score=59.21  Aligned_cols=27  Identities=11%  Similarity=0.233  Sum_probs=21.8

Q ss_pred             HHHHHHHcCCcEEEEcccccccceEEe
Q 001901          887 VMEFCNNNDLQLIVRAHECVMDGFERF  913 (998)
Q Consensus       887 ~~~fl~~~~l~~iiR~H~~~~~G~~~~  913 (998)
                      +.+.|++.++++++-||.=...+.+..
T Consensus       190 ~~~ll~~~~v~~vl~GH~H~~~~~~p~  216 (256)
T cd07401         190 FKDLLKKYNVTAYLCGHLHPLGGLEPV  216 (256)
T ss_pred             HHHHHHhcCCcEEEeCCccCCCcceee
Confidence            778899999999999999766664544


No 136
>PF13360 PQQ_2:  PQQ-like domain; PDB: 3HXJ_B 1YIQ_A 1KV9_A 3Q54_A 2YH3_A 3PRW_A 3P1L_A 3Q7M_A 3Q7O_A 3Q7N_A ....
Probab=95.11  E-value=5.5  Score=42.29  Aligned_cols=182  Identities=21%  Similarity=0.306  Sum_probs=102.6

Q ss_pred             cEEEEECCCCc--EEEecCCCCCCCCccceE--EEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCC
Q 001901          151 DVHCYDVLTNK--WSRITPFGEPPTPRAAHV--ATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPG  226 (998)
Q Consensus       151 dv~~yD~~t~~--W~~l~~~g~~P~pR~~hs--a~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~  226 (998)
                      .+..+|+.+++  |+.-..    + +..+..  .+..++.+|+..+       ...+++||..+....|+.-.     + 
T Consensus         4 ~l~~~d~~tG~~~W~~~~~----~-~~~~~~~~~~~~~~~v~~~~~-------~~~l~~~d~~tG~~~W~~~~-----~-   65 (238)
T PF13360_consen    4 TLSALDPRTGKELWSYDLG----P-GIGGPVATAVPDGGRVYVASG-------DGNLYALDAKTGKVLWRFDL-----P-   65 (238)
T ss_dssp             EEEEEETTTTEEEEEEECS----S-SCSSEEETEEEETTEEEEEET-------TSEEEEEETTTSEEEEEEEC-----S-
T ss_pred             EEEEEECCCCCEEEEEECC----C-CCCCccceEEEeCCEEEEEcC-------CCEEEEEECCCCCEEEEeec-----c-
Confidence            57788887764  876321    1 122222  3336778888843       36799999988766788764     1 


Q ss_pred             CCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEE-cccCCCCCCCccceEEEEEeCCEEEEEeccCCCCC
Q 001901          227 PRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRK-LEPEGEGPPPCMYATASARSDGLLLLCGGRDASSV  305 (998)
Q Consensus       227 ~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~-v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~  305 (998)
                      .+.....+..++ .+|+..+.      +.++.||..+....|+. ......  ..........+.++.+|+...      
T Consensus        66 ~~~~~~~~~~~~-~v~v~~~~------~~l~~~d~~tG~~~W~~~~~~~~~--~~~~~~~~~~~~~~~~~~~~~------  130 (238)
T PF13360_consen   66 GPISGAPVVDGG-RVYVGTSD------GSLYALDAKTGKVLWSIYLTSSPP--AGVRSSSSPAVDGDRLYVGTS------  130 (238)
T ss_dssp             SCGGSGEEEETT-EEEEEETT------SEEEEEETTTSCEEEEEEE-SSCT--CSTB--SEEEEETTEEEEEET------
T ss_pred             ccccceeeeccc-ccccccce------eeeEecccCCcceeeeeccccccc--cccccccCceEecCEEEEEec------
Confidence            122222445555 67776521      27999999998889994 443211  112233344445777777643      


Q ss_pred             CcccEEEEecCCCCeEEEEECCCCCCCC-------cceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCe--EE
Q 001901          306 PLASAYGLAKHRDGRWEWAIAPGVSPSP-------RYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGV--WC  376 (998)
Q Consensus       306 ~~~dv~~~~~~~~~~W~w~~~~g~~P~p-------R~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~--W~  376 (998)
                       ...++.++.. +|+-.|......++..       ......++.++.+|+..+.          ..+..+|.++.+  |+
T Consensus       131 -~g~l~~~d~~-tG~~~w~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~~~~~~----------g~~~~~d~~tg~~~w~  198 (238)
T PF13360_consen  131 -SGKLVALDPK-TGKLLWKYPVGEPRGSSPISSFSDINGSPVISDGRVYVSSGD----------GRVVAVDLATGEKLWS  198 (238)
T ss_dssp             -CSEEEEEETT-TTEEEEEEESSTT-SS--EEEETTEEEEEECCTTEEEEECCT----------SSEEEEETTTTEEEEE
T ss_pred             -cCcEEEEecC-CCcEEEEeecCCCCCCcceeeecccccceEEECCEEEEEcCC----------CeEEEEECCCCCEEEE
Confidence             3456777655 3443444433332211       1123444456788887653          125666999997  84


Q ss_pred             E
Q 001901          377 D  377 (998)
Q Consensus       377 ~  377 (998)
                      .
T Consensus       199 ~  199 (238)
T PF13360_consen  199 K  199 (238)
T ss_dssp             E
T ss_pred             e
Confidence            3


No 137
>COG2908 Uncharacterized protein conserved in bacteria [Function unknown]
Probab=95.02  E-value=0.09  Score=55.84  Aligned_cols=196  Identities=19%  Similarity=0.238  Sum_probs=101.4

Q ss_pred             EEecCCCC------HHHHHHHHHHcCCCCCCCCccceeEEEeccccC--CCCC-----hHHHHHHHHHhhhcCCCcEEEe
Q 001901          702 IFGDLHGQ------FGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVD--RGQH-----SLETITLLLALKVEYPNNVHLI  768 (998)
Q Consensus       702 vvGDiHG~------~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVD--RG~~-----s~evl~ll~~lk~~~p~~v~ll  768 (998)
                      .|+|+|=.      -+-|+++++.... ..+      .+.+|||++|  .|.+     --+|...|..+.. -..++|.+
T Consensus         2 FISDlHL~~~~p~~t~~fl~Fl~~~a~-~ad------~lyilGDifd~w~g~~~~~~~~~~V~~~l~~~a~-~G~~v~~i   73 (237)
T COG2908           2 FISDLHLGPKRPALTAFFLDFLREEAA-QAD------ALYILGDIFDGWIGDDEPPQLHRQVAQKLLRLAR-KGTRVYYI   73 (237)
T ss_pred             eeeccccCCCCcHHHHHHHHHHHhccc-cCc------EEEEechhhhhhhcCCcccHHHHHHHHHHHHHHh-cCCeEEEe
Confidence            57888844      2344555554322 222      6889999998  3433     2345555554432 34689999


Q ss_pred             ecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhhcccceeEEE---cCeEEEecCCccCcccC------------
Q 001901          769 RGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLFNWLPLAALI---EKKIICMHGGIGRSINH------------  833 (998)
Q Consensus       769 rGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i---~~~il~vHgGi~~~~~~------------  833 (998)
                      .||||. .+...+      ....|             .+.-+|-..++   +.+++++||-.-.....            
T Consensus        74 ~GN~Df-ll~~~f------~~~~g-------------~~~l~~~~~~~~l~g~~~Ll~HGD~f~t~~~~y~~~r~~~~~~  133 (237)
T COG2908          74 HGNHDF-LLGKRF------AQEAG-------------GMTLLPDPIVLDLYGKRILLAHGDTFCTDDRAYQWFRYKVHWA  133 (237)
T ss_pred             cCchHH-HHHHHH------HhhcC-------------ceEEcCcceeeeecCcEEEEEeCCcccchHHHHHHHHHHcccH
Confidence            999995 332222      11122             12334444433   67999999976432100            


Q ss_pred             HHhhhhccCCcccCCCCcceeccccCCCCCCCCCCCcccCCCCC--CceeeCHHHHHHHHHHcCCcEEEEcccccccceE
Q 001901          834 VEQIENLQRPITMEAGSIVLMDLLWSDPTENDSVEGLRPNARGP--GLVTFGPDRVMEFCNNNDLQLIVRAHECVMDGFE  911 (998)
Q Consensus       834 ~~~i~~i~rp~~~~~~~~~~~dlLWsDP~~~~~~~~~~~n~rg~--~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~  911 (998)
                      ..++.-+.+|+...   ..+..=+|+.-.       |.......  -.....+.++.+-++++|++.+|.||.=.+..-.
T Consensus       134 ~~~~lflnl~l~~R---~ri~~k~r~~s~-------~~k~~~~~~~~i~d~~~~~v~~~~~~~~vd~vI~GH~Hr~ai~~  203 (237)
T COG2908         134 WLQLLFLNLPLRVR---RRIAYKIRSLSS-------WAKKKVKKAVNIMDVNPAAVADEARRHGVDGVIHGHTHRPAIHN  203 (237)
T ss_pred             HHHHHHHHhHHHHH---HHHHHHHHHhhH-------HhHHhhhhHHHHHHhhHHHHHHHHHHcCCCEEEecCcccHhhcc
Confidence            01111122222210   011122444431       11110000  0122467778888999999999999986654443


Q ss_pred             EecCCeEEEEecccccc--CCCCCeEEEEEEcCCce
Q 001901          912 RFAQGHLITLFSATNYC--GTANNAGAILVLGRDLV  945 (998)
Q Consensus       912 ~~~~~~~iTvfSa~~y~--~~~~n~ga~l~~~~~~~  945 (998)
                      ..  +        ..||  |.--..++++.++.+..
T Consensus       204 i~--~--------~~yi~lGdW~~~~s~~~v~~~~~  229 (237)
T COG2908         204 IP--G--------ITYINLGDWVSEGSILEVDDGGL  229 (237)
T ss_pred             CC--C--------ceEEecCcchhcceEEEEecCcE
Confidence            32  2        1222  22234678888877653


No 138
>PF12768 Rax2:  Cortical protein marker for cell polarity
Probab=94.96  E-value=1.3  Score=49.02  Aligned_cols=114  Identities=14%  Similarity=0.218  Sum_probs=71.6

Q ss_pred             cCCcEEEEECCCCcEEEecCCCCCCCCccceEEEEe-CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeec--CCC
Q 001901          148 ATADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAV-GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQ--GPG  224 (998)
Q Consensus       148 ~~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~-~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~--g~~  224 (998)
                      ....+..||..+.+|..+...   -..-. +++... +++||+.|-..-.+.....+-.||..+.+  |+.+...  ..+
T Consensus        14 ~C~~lC~yd~~~~qW~~~g~~---i~G~V-~~l~~~~~~~Llv~G~ft~~~~~~~~la~yd~~~~~--w~~~~~~~s~~i   87 (281)
T PF12768_consen   14 PCPGLCLYDTDNSQWSSPGNG---ISGTV-TDLQWASNNQLLVGGNFTLNGTNSSNLATYDFKNQT--WSSLGGGSSNSI   87 (281)
T ss_pred             CCCEEEEEECCCCEeecCCCC---ceEEE-EEEEEecCCEEEEEEeeEECCCCceeEEEEecCCCe--eeecCCcccccC
Confidence            356888999999999988653   11111 333333 56888888665554345668899999875  9888742  345


Q ss_pred             CCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEccc
Q 001901          225 PGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEP  273 (998)
Q Consensus       225 P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~  273 (998)
                      |.+-..-+....+...+++.|....  -..-+..||=  .  +|..+..
T Consensus        88 pgpv~a~~~~~~d~~~~~~aG~~~~--g~~~l~~~dG--s--~W~~i~~  130 (281)
T PF12768_consen   88 PGPVTALTFISNDGSNFWVAGRSAN--GSTFLMKYDG--S--SWSSIGS  130 (281)
T ss_pred             CCcEEEEEeeccCCceEEEeceecC--CCceEEEEcC--C--ceEeccc
Confidence            6664333332223336777776521  1345666754  5  8999876


No 139
>cd08166 MPP_Cdc1_like_1 uncharacterized subgroup related to Saccharomyces cerevisiae CDC1, metallophosphatase domain. A functionally uncharacterized subgroup related to the metallophosphatase domain of Saccharomyces cerevisiae Cdc1, S. cerevisiae Ted1 and human MPPE1. Cdc1 is an endoplasmic reticulum-localized transmembrane lipid phosphatase and is a subunit of DNA polymerase delta. TED1 (trafficking of Emp24p/Erv25p-dependent cargo disrupted 1), acts together with Emp24p and Erv25p in cargo exit from the ER.  The MPPE1 gene is a candidate susceptibility gene for Bipolar disorder.  Proteins in this uncharacterized subgroup belong to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like R
Probab=94.84  E-value=0.051  Score=56.65  Aligned_cols=42  Identities=19%  Similarity=0.369  Sum_probs=32.1

Q ss_pred             eEEEeccccCCCCCh--HHHHHHHHHhhhcCC----CcEEEeecCccc
Q 001901          733 DYLFLGDYVDRGQHS--LETITLLLALKVEYP----NNVHLIRGNHEA  774 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s--~evl~ll~~lk~~~p----~~v~llrGNHE~  774 (998)
                      -+|||||++|.|+.+  .|.+..+..++..|.    -.++.|.||||.
T Consensus        45 ~Vi~lGDL~D~G~~~~~~e~~e~l~Rf~~If~~~~~~~~~~VpGNHDI   92 (195)
T cd08166          45 IVIFLGDLMDEGSIANDDEYYSYVQRFINIFEVPNGTKIIYLPGDNDI   92 (195)
T ss_pred             EEEEeccccCCCCCCCHHHHHHHHHHHHHHhcCCCCCcEEEECCCCCc
Confidence            589999999999853  346666666664433    368899999997


No 140
>cd08164 MPP_Ted1 Saccharomyces cerevisiae Ted1 and related proteins, metallophosphatase domain. Saccharomyces cerevisiae Ted1 (trafficking of Emp24p/Erv25p-dependent cargo disrupted 1) is a metallophosphatase domain-containing protein which acts together with Emp24p and Erv25p in cargo exit from the ER.  Ted1 belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the
Probab=94.70  E-value=0.077  Score=55.22  Aligned_cols=65  Identities=18%  Similarity=0.098  Sum_probs=39.8

Q ss_pred             cCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChH-HHHHHHHHhhhcC---------------------C
Q 001901          705 DLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSL-ETITLLLALKVEY---------------------P  762 (998)
Q Consensus       705 DiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~-evl~ll~~lk~~~---------------------p  762 (998)
                      |++|+=.=|.++++.+-....-.     .++||||++|.|--+- |-......++..+                     .
T Consensus        24 d~~~~D~YL~~~~~~~~~~l~Pd-----~V~fLGDLfd~~w~~D~ef~~~~~RF~~if~~~~~~~~~~~~~~~~~~~~~~   98 (193)
T cd08164          24 DLFGNDYFLGHIVSMMQFWLKPD-----AVVVLGDLFSSQWIDDEEFAKRADRYRRRFFGRNDWQVGNISLAARTFEDGK   98 (193)
T ss_pred             hhhhhHHHHHHHHHHHHHhcCCC-----EEEEeccccCCCcccHHHHHHHHHHHHHHhcCCcccccccccccccccccCC
Confidence            44666666777776653322111     6889999999875332 2234444443333                     1


Q ss_pred             CcEEEeecCccc
Q 001901          763 NNVHLIRGNHEA  774 (998)
Q Consensus       763 ~~v~llrGNHE~  774 (998)
                      -.+++|.||||.
T Consensus        99 i~~i~V~GNHDI  110 (193)
T cd08164          99 TPLINIAGNHDV  110 (193)
T ss_pred             ceEEEECCcccC
Confidence            357899999998


No 141
>COG2129 Predicted phosphoesterases, related to the Icc protein [General function prediction only]
Probab=94.65  E-value=3.6  Score=43.58  Aligned_cols=205  Identities=19%  Similarity=0.205  Sum_probs=115.4

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEecccc--CCCCChHHHHHH-HHHhhhcCCCcEEEeecCccc
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYV--DRGQHSLETITL-LLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyV--DRG~~s~evl~l-l~~lk~~~p~~v~llrGNHE~  774 (998)
                      .++..+.||||.++.+.++++.+.....+      -+++-||+.  ++|+.-.-.... +-.++. +-..|+.+.||.|.
T Consensus         4 mkil~vtDlHg~~~~~~k~~~~~~~~~~D------~lviaGDlt~~~~~~~~~~~~~~~~e~l~~-~~~~v~avpGNcD~   76 (226)
T COG2129           4 MKILAVTDLHGSEDSLKKLLNAAADIRAD------LLVIAGDLTYFHFGPKEVAEELNKLEALKE-LGIPVLAVPGNCDP   76 (226)
T ss_pred             ceEEEEeccccchHHHHHHHHHHhhccCC------EEEEecceehhhcCchHHHHhhhHHHHHHh-cCCeEEEEcCCCCh
Confidence            57899999999999999999887644333      678899999  887753222211 333332 23579999999887


Q ss_pred             cchhhhcCChHHHHHHhCCCcchhhhhhhhhhhcccceeEEEcCeEEEecCCccCcc-c-----CHHhhhhccCCcccCC
Q 001901          775 ADINALFGFRIECIERMGERDGIWAWHRINRLFNWLPLAALIEKKIICMHGGIGRSI-N-----HVEQIENLQRPITMEA  848 (998)
Q Consensus       775 ~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~~~il~vHgGi~~~~-~-----~~~~i~~i~rp~~~~~  848 (998)
                      ..+-..       .+..+.    .+..          -...+++--||-=||..+.- .     +-++|....+-.....
T Consensus        77 ~~v~~~-------l~~~~~----~v~~----------~v~~i~~~~~~G~Ggsn~tp~nt~~e~~E~~I~s~l~~~v~~~  135 (226)
T COG2129          77 PEVIDV-------LKNAGV----NVHG----------RVVEIGGYGFVGFGGSNPTPFNTPREFSEDEIYSKLKSLVKKA  135 (226)
T ss_pred             HHHHHH-------HHhccc----cccc----------ceEEecCcEEEEecccCCCCCCCccccCHHHHHHHHHHHHhcc
Confidence            544221       111211    1111          11234444455557776542 1     2344544333211111


Q ss_pred             CCcceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHHHHHHHHcCCcEEEEcccccccceEEecCCeEEEEecccccc
Q 001901          849 GSIVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRVMEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSATNYC  928 (998)
Q Consensus       849 ~~~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa~~y~  928 (998)
                      .+..-.=++-+-|.. ...+    ++-|  ..--|..++++++++.+-.+.|.||==...|++.--    =||+-.|.-.
T Consensus       136 ~~~~~Il~~HaPP~g-t~~d----~~~g--~~hvGS~~vr~~ieefqP~l~i~GHIHEs~G~d~iG----~TivVNPG~~  204 (226)
T COG2129         136 DNPVNILLTHAPPYG-TLLD----TPSG--YVHVGSKAVRKLIEEFQPLLGLHGHIHESRGIDKIG----NTIVVNPGPL  204 (226)
T ss_pred             cCcceEEEecCCCCC-cccc----CCCC--ccccchHHHHHHHHHhCCceEEEeeecccccccccC----CeEEECCCCc
Confidence            110001112233332 1111    2333  123489999999999999999999865567776431    2667666543


Q ss_pred             CCCCCeEEEEEEcCC
Q 001901          929 GTANNAGAILVLGRD  943 (998)
Q Consensus       929 ~~~~n~ga~l~~~~~  943 (998)
                      +  .-..|++.+++.
T Consensus       205 ~--~g~yA~i~l~~~  217 (226)
T COG2129         205 G--EGRYALIELEKE  217 (226)
T ss_pred             c--CceEEEEEecCc
Confidence            2  235688888777


No 142
>cd07384 MPP_Cdc1_like Saccharomyces cerevisiae CDC1 and related proteins, metallophosphatase domain. Cdc1 (also known as XlCdc1 in Xenopus laevis) is an endoplasmic reticulum-localized transmembrane lipid phosphatase with a metallophosphatase domain facing the ER lumen.  In budding yeast, the gene encoding CDC1 is essential while nonlethal mutations cause defects in Golgi inheritance and actin polarization.  Cdc1 mutant cells accumulate an unidentified phospholipid, suggesting that Cdc1 is a lipid phosphatase.  Cdc1 mutant cells also have highly elevated intracellular calcium levels suggesting a possible role for Cdc1 in calcium regulation.  The 5' flanking region of Cdc1 is a regulatory region with conserved binding site motifs for AP1, AP2, Sp1, NF-1 and CREB.  DNA polymerase delta consists of at least four subunits - Pol3, Cdc1, Cdc27, and Cdm1.  This group also contains Saccharomyces cerevisiae TED1 (Trafficking of Emp24p/Erv25p-dependent cargo disrupted 1), which acts together wit
Probab=94.25  E-value=0.08  Score=54.32  Aligned_cols=43  Identities=28%  Similarity=0.342  Sum_probs=28.0

Q ss_pred             eEEEeccccCCCCCh--HH---HHHHHHHhhhcC-----CCcEEEeecCcccc
Q 001901          733 DYLFLGDYVDRGQHS--LE---TITLLLALKVEY-----PNNVHLIRGNHEAA  775 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s--~e---vl~ll~~lk~~~-----p~~v~llrGNHE~~  775 (998)
                      .+|||||++|.+...  .+   .+..+..+....     .-.+++|.||||..
T Consensus        48 ~vi~lGDl~d~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~v~GNHD~g  100 (171)
T cd07384          48 VVLFLGDLFDGGRIADSEEWEEYVKRFKKIFFLPSNGLEDIPVYYVPGNHDIG  100 (171)
T ss_pred             EEEEeccccCCcEeCCHHHHHHHHHHHHHHhcccccccCCceEEEECCccccC
Confidence            699999999988743  22   232232322111     34699999999985


No 143
>cd07380 MPP_CWF19_N Schizosaccharomyces pombe CWF19 and related proteins, N-terminal metallophosphatase domain. CWF19 cell cycle control protein (also known as CWF19-like 1 (CWF19L1) in Homo sapiens), N-terminal metallophosphatase domain.   CWF19 contains C-terminal domains similar to that found in the CwfJ cell cycle control protein.   The metallophosphatase domain belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site
Probab=94.22  E-value=0.1  Score=52.18  Aligned_cols=68  Identities=18%  Similarity=0.356  Sum_probs=49.3

Q ss_pred             EEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCcc
Q 001901          701 KIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHE  773 (998)
Q Consensus       701 ~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE  773 (998)
                      .|+||+||+++.+..-++...-.  .+.  ..-+|++||+..-.... +-+.-++.=+++.|--.|++-||||
T Consensus         1 LV~G~~~G~l~~~~~kv~~~~~k--~gp--Fd~~ic~Gdff~~~~~~-~~~~~y~~g~~~~pipTyf~ggn~~   68 (150)
T cd07380           1 LVCGDVNGRLKALFEKVNTINKK--KGP--FDALLCVGDFFGDDEDD-EELEAYKDGSKKVPIPTYFLGGNNP   68 (150)
T ss_pred             CeeecCCccHHHHHHHHHHHhcc--cCC--eeEEEEecCccCCccch-hhHHHHhcCCccCCCCEEEECCCCC
Confidence            48999999999998887775321  121  22588899999866555 3444444556678889999999998


No 144
>PF07893 DUF1668:  Protein of unknown function (DUF1668);  InterPro: IPR012871 The hypothetical proteins found in this family are expressed by Oryza sativa (Rice) and are of unknown function. 
Probab=94.10  E-value=1.2  Score=50.95  Aligned_cols=124  Identities=15%  Similarity=0.159  Sum_probs=73.6

Q ss_pred             ECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCC------ccc
Q 001901          236 VGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVP------LAS  309 (998)
Q Consensus       236 ~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~------~~d  309 (998)
                      +.+.+|+..+..      ....+||..+.  .=.   ..+..+.+...- .++..+++||+..........      .-+
T Consensus        74 l~gskIv~~d~~------~~t~vyDt~t~--av~---~~P~l~~pk~~p-isv~VG~~LY~m~~~~~~~~~~~~~~~~FE  141 (342)
T PF07893_consen   74 LHGSKIVAVDQS------GRTLVYDTDTR--AVA---TGPRLHSPKRCP-ISVSVGDKLYAMDRSPFPEPAGRPDFPCFE  141 (342)
T ss_pred             ecCCeEEEEcCC------CCeEEEECCCC--eEe---ccCCCCCCCcce-EEEEeCCeEEEeeccCccccccCccceeEE
Confidence            333478888654      34789999887  333   333333334444 444458889999876433211      222


Q ss_pred             EEEEec-----CCCCeEEEEECCCCCCCCcc-------eeEEEEE-CCEEEEE-cccCCCCCccccCCeEEEEECCCCeE
Q 001901          310 AYGLAK-----HRDGRWEWAIAPGVSPSPRY-------QHAAVFV-NARLHVS-GGALGGGRMVEDSSSVAVLDTAAGVW  375 (998)
Q Consensus       310 v~~~~~-----~~~~~W~w~~~~g~~P~pR~-------~hsav~~-~~~L~V~-GG~~~~~~~~~~~~dv~vyD~~t~~W  375 (998)
                      ++.|..     .....|.|...++ +|..+.       -.+-+++ +..|||. -|..         .-.|.||+++.+|
T Consensus       142 ~l~~~~~~~~~~~~~~w~W~~LP~-PPf~~~~~~~~~~i~sYavv~g~~I~vS~~~~~---------~GTysfDt~~~~W  211 (342)
T PF07893_consen  142 ALVYRPPPDDPSPEESWSWRSLPP-PPFVRDRRYSDYRITSYAVVDGRTIFVSVNGRR---------WGTYSFDTESHEW  211 (342)
T ss_pred             EeccccccccccCCCcceEEcCCC-CCccccCCcccceEEEEEEecCCeEEEEecCCc---------eEEEEEEcCCcce
Confidence            333332     3456899999876 344432       2344555 6678883 2211         2389999999999


Q ss_pred             EEcccC
Q 001901          376 CDTKSV  381 (998)
Q Consensus       376 ~~v~~~  381 (998)
                      +++..-
T Consensus       212 ~~~GdW  217 (342)
T PF07893_consen  212 RKHGDW  217 (342)
T ss_pred             eeccce
Confidence            998655


No 145
>COG1408 Predicted phosphohydrolases [General function prediction only]
Probab=93.42  E-value=0.17  Score=56.26  Aligned_cols=71  Identities=25%  Similarity=0.270  Sum_probs=45.9

Q ss_pred             CCeEEEecCCCCHHH--HHHHHHHcCCCCCCCCccceeEEEeccccCC-CCCh-HHHHHHHHHhhhcCCCcEEEeecCcc
Q 001901          698 APIKIFGDLHGQFGD--LMRLFDEYGSPSTAGDIAYIDYLFLGDYVDR-GQHS-LETITLLLALKVEYPNNVHLIRGNHE  773 (998)
Q Consensus       698 ~~i~vvGDiHG~~~d--L~~il~~~g~~~~~~~~~~~~~vfLGDyVDR-G~~s-~evl~ll~~lk~~~p~~v~llrGNHE  773 (998)
                      .+|+-+.|+|-....  ..+.+........+      -+++.|||+|+ .+.. -.++..|..|+.  |-.+|.+.||||
T Consensus        45 ~~iv~lSDlH~~~~~~~~~~~~~~i~~~~~D------livltGD~~~~~~~~~~~~~~~~L~~L~~--~~gv~av~GNHd  116 (284)
T COG1408          45 LKIVQLSDLHSLPFREEKLALLIAIANELPD------LIVLTGDYVDGDRPPGVAALALFLAKLKA--PLGVFAVLGNHD  116 (284)
T ss_pred             eEEEEeehhhhchhhHHHHHHHHHHHhcCCC------EEEEEeeeecCCCCCCHHHHHHHHHhhhc--cCCEEEEecccc
Confidence            458999999987554  22223222221112      68999999996 5444 445566666654  457999999998


Q ss_pred             ccc
Q 001901          774 AAD  776 (998)
Q Consensus       774 ~~~  776 (998)
                      ...
T Consensus       117 ~~~  119 (284)
T COG1408         117 YGV  119 (284)
T ss_pred             ccc
Confidence            743


No 146
>COG1407 Predicted ICC-like phosphoesterases [General function prediction only]
Probab=93.33  E-value=0.25  Score=52.78  Aligned_cols=76  Identities=25%  Similarity=0.309  Sum_probs=46.1

Q ss_pred             Ceeee-cCCeEEEecCCCCHHHH----------------HHHHHHc--CCCCCCCCccceeEEEeccccCCCCC-----h
Q 001901          692 SVLQL-KAPIKIFGDLHGQFGDL----------------MRLFDEY--GSPSTAGDIAYIDYLFLGDYVDRGQH-----S  747 (998)
Q Consensus       692 ~~l~~-~~~i~vvGDiHG~~~dL----------------~~il~~~--g~~~~~~~~~~~~~vfLGDyVDRG~~-----s  747 (998)
                      ..+.+ ...+.||.|+|==|+.-                .+.+..+  .+.+ +      ++|+|||+-.-...     .
T Consensus        13 ~~~~l~~~~~lVvADlHlG~e~~~~r~Gi~lP~~~~~~~~~~l~~ii~~~~p-~------~lIilGD~KH~~~~~~~~e~   85 (235)
T COG1407          13 GVLYLPLGRTLVVADLHLGYEESLARRGINLPRYQTDRILKRLDRIIERYGP-K------RLIILGDLKHEFGKSLRQEK   85 (235)
T ss_pred             ceeEeccCcEEEEEecccchhHHHHhcCcccCchhHHHHHHHHHHHHHhcCC-C------EEEEcCccccccCccccccH
Confidence            34444 47899999999544332                2222211  1111 1      79999999964433     3


Q ss_pred             HHHHHHHHHhhhcCCCcEEEeecCccccch
Q 001901          748 LETITLLLALKVEYPNNVHLIRGNHEAADI  777 (998)
Q Consensus       748 ~evl~ll~~lk~~~p~~v~llrGNHE~~~~  777 (998)
                      .|+..++-.++..   .++++|||||...-
T Consensus        86 ~~~~~f~~~~~~~---evi~i~GNHD~~i~  112 (235)
T COG1407          86 EEVREFLELLDER---EVIIIRGNHDNGIE  112 (235)
T ss_pred             HHHHHHHHHhccC---cEEEEeccCCCccc
Confidence            5555555555443   59999999998443


No 147
>cd00845 MPP_UshA_N_like Escherichia coli UshA-like family, N-terminal metallophosphatase domain. This family includes the bacterial enzyme UshA, and related enzymes including SoxB, CpdB, YhcR, and CD73.  All members have a similar domain architecture which includes an N-terminal metallophosphatase domain and a C-terminal nucleotidase domain.  The N-terminal metallophosphatase domain belongs to a large superfamily of distantly related metallophosphatases (MPPs) that includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The conserved domain is a double beta-sheet sandwich 
Probab=92.74  E-value=0.2  Score=54.62  Aligned_cols=66  Identities=33%  Similarity=0.353  Sum_probs=42.0

Q ss_pred             CeEEEecCCCCH---------HHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChH-----HHHHHHHHhhhcCCCc
Q 001901          699 PIKIFGDLHGQF---------GDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSL-----ETITLLLALKVEYPNN  764 (998)
Q Consensus       699 ~i~vvGDiHG~~---------~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~-----evl~ll~~lk~~~p~~  764 (998)
                      .|+.++|+||.+         ..|.++++...-...+     .-+|..||+++....+-     .++..|-++.     -
T Consensus         2 ~i~~~sD~hg~~~~~~~~~g~~~l~~~v~~~~~~~~~-----~l~v~~GD~~~~~~~~~~~~~~~~~~~l~~~g-----~   71 (252)
T cd00845           2 TILHTNDLHGHFEPAGGVGGAARLATLIKEERAENEN-----TLLLDAGDNFDGSPPSTATKGEANIELMNALG-----Y   71 (252)
T ss_pred             EEEEecccccCccccCCcCCHHHHHHHHHHHHhcCCC-----eEEEeCCccCCCccchhccCCcHHHHHHHhcC-----C
Confidence            478899999887         4566666665432111     14577999999887643     4444444432     2


Q ss_pred             EEEeecCccc
Q 001901          765 VHLIRGNHEA  774 (998)
Q Consensus       765 v~llrGNHE~  774 (998)
                      .++..||||.
T Consensus        72 d~~~~GNHe~   81 (252)
T cd00845          72 DAVTIGNHEF   81 (252)
T ss_pred             CEEeeccccc
Confidence            3345699996


No 148
>cd00216 PQQ_DH Dehydrogenases with pyrrolo-quinoline quinone (PQQ) as cofactor, like ethanol, methanol, and membrane bound glucose dehydrogenases. The alignment model contains an 8-bladed beta-propeller.
Probab=92.65  E-value=21  Score=43.08  Aligned_cols=113  Identities=16%  Similarity=0.173  Sum_probs=60.9

Q ss_pred             cEEEEECCCCc--EEEecCCC-CCCCCc-cceEEEEeC-CEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCC
Q 001901          151 DVHCYDVLTNK--WSRITPFG-EPPTPR-AAHVATAVG-TMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGP  225 (998)
Q Consensus       151 dv~~yD~~t~~--W~~l~~~g-~~P~pR-~~hsa~~~~-~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P  225 (998)
                      .++.+|..+.+  |+.-.... ....+. .....++.+ ++||+...       ...++.+|..+....|+.-......+
T Consensus        72 ~l~AlD~~tG~~~W~~~~~~~~~~~~~~~~~~g~~~~~~~~V~v~~~-------~g~v~AlD~~TG~~~W~~~~~~~~~~  144 (488)
T cd00216          72 ALFALDAATGKVLWRYDPKLPADRGCCDVVNRGVAYWDPRKVFFGTF-------DGRLVALDAETGKQVWKFGNNDQVPP  144 (488)
T ss_pred             cEEEEECCCChhhceeCCCCCccccccccccCCcEEccCCeEEEecC-------CCeEEEEECCCCCEeeeecCCCCcCc
Confidence            67889988764  87643221 001111 112234445 67776432       24799999998766788643110000


Q ss_pred             CCCcccEEEEECCcEEEEEcCCCCC----CCcccEEEEECCCCCceEEEcc
Q 001901          226 GPRYGHVMALVGQRYLMAIGGNDGK----RPLADVWALDTAAKPYEWRKLE  272 (998)
Q Consensus       226 ~~R~~hs~~~~~~~~Lyv~GG~~g~----~~lndv~~yD~~s~~~~W~~v~  272 (998)
                      .-....+.++.++ .+| +|..++.    .....++.||..+....|+.-.
T Consensus       145 ~~~i~ssP~v~~~-~v~-vg~~~~~~~~~~~~g~v~alD~~TG~~~W~~~~  193 (488)
T cd00216         145 GYTMTGAPTIVKK-LVI-IGSSGAEFFACGVRGALRAYDVETGKLLWRFYT  193 (488)
T ss_pred             ceEecCCCEEECC-EEE-EeccccccccCCCCcEEEEEECCCCceeeEeec
Confidence            0012233344554 444 4433222    2246799999999888897643


No 149
>TIGR03075 PQQ_enz_alc_DH PQQ-dependent dehydrogenase, methanol/ethanol family. This protein family has a phylogenetic distribution very similar to that coenzyme PQQ biosynthesis enzymes, as shown by partial phylogenetic profiling. Genes in this family often are found adjacent to the PQQ biosynthesis genes themselves. An unusual, strained disulfide bond between adjacent Cys residues contributes to PQQ-binding, as does a Trp residue that is part of a PQQ enzyme repeat (see pfam01011). Characterized members include the dehydrogenase subunit of a membrane-anchored, three subunit alcohol (ethanol) dehydrogenase of Gluconobacter suboxydans, a homodimeric ethanol dehydrogenase in Pseudomonas aeruginosa, and the large subunit of an alpha2/beta2 heterotetrameric methanol dehydrogenase in Methylobacterium extorquens.
Probab=91.79  E-value=30  Score=42.12  Aligned_cols=111  Identities=15%  Similarity=0.107  Sum_probs=61.8

Q ss_pred             cEEEEECCCC--cEEEecCCCC--CC---CCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCC
Q 001901          151 DVHCYDVLTN--KWSRITPFGE--PP---TPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGP  223 (998)
Q Consensus       151 dv~~yD~~t~--~W~~l~~~g~--~P---~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~  223 (998)
                      .++.+|..+.  .|+.-.....  .+   ......+.++.+++||+...       ...++.+|..+....|..-.  +.
T Consensus        80 ~v~AlDa~TGk~lW~~~~~~~~~~~~~~~~~~~~rg~av~~~~v~v~t~-------dg~l~ALDa~TGk~~W~~~~--~~  150 (527)
T TIGR03075        80 RVYALDAKTGKELWKYDPKLPDDVIPVMCCDVVNRGVALYDGKVFFGTL-------DARLVALDAKTGKVVWSKKN--GD  150 (527)
T ss_pred             cEEEEECCCCceeeEecCCCCcccccccccccccccceEECCEEEEEcC-------CCEEEEEECCCCCEEeeccc--cc
Confidence            6888898875  4875432210  00   01122334556778776432       24699999998776787643  11


Q ss_pred             CCCC-CcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEc
Q 001901          224 GPGP-RYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKL  271 (998)
Q Consensus       224 ~P~~-R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v  271 (998)
                      .... ....+-++.++ .+|+.........-..+..||.++....|+.-
T Consensus       151 ~~~~~~~tssP~v~~g-~Vivg~~~~~~~~~G~v~AlD~~TG~~lW~~~  198 (527)
T TIGR03075       151 YKAGYTITAAPLVVKG-KVITGISGGEFGVRGYVTAYDAKTGKLVWRRY  198 (527)
T ss_pred             ccccccccCCcEEECC-EEEEeecccccCCCcEEEEEECCCCceeEecc
Confidence            1111 12233345555 56664322222234579999999998788754


No 150
>PF07893 DUF1668:  Protein of unknown function (DUF1668);  InterPro: IPR012871 The hypothetical proteins found in this family are expressed by Oryza sativa (Rice) and are of unknown function. 
Probab=91.31  E-value=4.6  Score=46.25  Aligned_cols=111  Identities=19%  Similarity=0.273  Sum_probs=67.4

Q ss_pred             cEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCc----ccEEEE--E------cCCCCCceEEe
Q 001901          151 DVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSA----EDLHVL--D------LTQQRPRWHRV  218 (998)
Q Consensus       151 dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~----~dv~~~--D------l~t~t~~W~~l  218 (998)
                      .+.+||..+..-..++.+   +.+...-.++.++++||+...........    ...+.+  +      .....|.|..+
T Consensus        87 ~t~vyDt~t~av~~~P~l---~~pk~~pisv~VG~~LY~m~~~~~~~~~~~~~~~~FE~l~~~~~~~~~~~~~~w~W~~L  163 (342)
T PF07893_consen   87 RTLVYDTDTRAVATGPRL---HSPKRCPISVSVGDKLYAMDRSPFPEPAGRPDFPCFEALVYRPPPDDPSPEESWSWRSL  163 (342)
T ss_pred             CeEEEECCCCeEeccCCC---CCCCcceEEEEeCCeEEEeeccCccccccCccceeEEEeccccccccccCCCcceEEcC
Confidence            467899999887765554   45555567778899999998753221110    033333  3      22345778888


Q ss_pred             eecCCCCCCCcc-------cEEEEECCcEEEE-EcCCCCCCCcccEEEEECCCCCceEEEcccC
Q 001901          219 VVQGPGPGPRYG-------HVMALVGQRYLMA-IGGNDGKRPLADVWALDTAAKPYEWRKLEPE  274 (998)
Q Consensus       219 ~~~g~~P~~R~~-------hs~~~~~~~~Lyv-~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~  274 (998)
                      +   +.|-.+..       .+-+++++..|+| .-|..     .-.+.||+.+.  +|+++..-
T Consensus       164 P---~PPf~~~~~~~~~~i~sYavv~g~~I~vS~~~~~-----~GTysfDt~~~--~W~~~GdW  217 (342)
T PF07893_consen  164 P---PPPFVRDRRYSDYRITSYAVVDGRTIFVSVNGRR-----WGTYSFDTESH--EWRKHGDW  217 (342)
T ss_pred             C---CCCccccCCcccceEEEEEEecCCeEEEEecCCc-----eEEEEEEcCCc--ceeeccce
Confidence            6   44433332       2223344557777 33321     24799999999  99998543


No 151
>PF06874 FBPase_2:  Firmicute fructose-1,6-bisphosphatase;  InterPro: IPR009164 Fructose 1,6-bisphosphatase catalyses the hydrolysis of fructose 1,6-bisphosphate to fructose 6-phosphate []. This is an essential reaction in the process of gluconeogenesis, the process by which non-carbohydrate precursors are converted to glucose, and hence this enzyme is found almost universally. Enzyme activity can be regulated by a number of different mechanisms including AMP inhibition, cylic AMP-dependent phosphorylation and light-dependent-activation. This entry represents a group of fructose 1,6-bisphosphatases found within the Firmicutes (low GC Gram-positive bacteria) which do not show any significant sequence similarity to the enzymes from other organisms. The Bacillus subtilis enzyme is inhibited by AMP, though this can be overcome by phosphoenolpyruvate, and is dependent on Mn(2+) [, ]. Mutants lacking this enzyme are apparently still able to grow on gluconeogenic growth substrates such as malate and glycerol.; GO: 0042132 fructose 1,6-bisphosphate 1-phosphatase activity, 0006094 gluconeogenesis
Probab=91.29  E-value=0.23  Score=59.28  Aligned_cols=70  Identities=20%  Similarity=0.222  Sum_probs=48.0

Q ss_pred             CHHHHHHHHHHcCCc----EEEEcccccc--cceE-EecCCeEEEE---eccccccCCCCCeEEEEEEcCCceEEeEEec
Q 001901          883 GPDRVMEFCNNNDLQ----LIVRAHECVM--DGFE-RFAQGHLITL---FSATNYCGTANNAGAILVLGRDLVVVPKLIH  952 (998)
Q Consensus       883 g~~~~~~fl~~~~l~----~iiR~H~~~~--~G~~-~~~~~~~iTv---fSa~~y~~~~~n~ga~l~~~~~~~~~~~~~~  952 (998)
                      .++..++.|+..||+    .||-||.+|.  .|=. ..++||++.|   ||.. |..+.+ -|++-+|.+...+....-+
T Consensus       507 ~e~~c~~IL~EFgl~~~~~hIINGHvPVk~k~GEsPIKa~Gkl~VIDGGfskA-Yqk~TG-IAGYTLiyNS~gl~L~~H~  584 (640)
T PF06874_consen  507 DEEICDKILEEFGLDPERGHIINGHVPVKVKKGESPIKANGKLIVIDGGFSKA-YQKTTG-IAGYTLIYNSYGLQLVAHQ  584 (640)
T ss_pred             CHHHHHHHHHHhCCCCCCCeEECCccccccCCCCCCccCCCEEEEEcChhhhh-hccccC-ccceEEEecCCcceeccCC
Confidence            577788899999998    9999999997  5643 4689999999   7754 443332 3455555454444444445


Q ss_pred             cC
Q 001901          953 PL  954 (998)
Q Consensus       953 ~~  954 (998)
                      |.
T Consensus       585 pF  586 (640)
T PF06874_consen  585 PF  586 (640)
T ss_pred             CC
Confidence            43


No 152
>PRK05137 tolB translocation protein TolB; Provisional
Probab=90.32  E-value=45  Score=39.46  Aligned_cols=192  Identities=13%  Similarity=0.069  Sum_probs=86.7

Q ss_pred             CCcEEEEECCCCcEEEecCCCCCCCCccceEEEEeC-CEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC
Q 001901          149 TADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVG-TMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP  227 (998)
Q Consensus       149 ~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~-~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~  227 (998)
                      ...+|+.|.....=+.+....   .+ ..+-...-+ ++|++..-. . +  ...+|++|+.+..  ...+.   ..+..
T Consensus       181 ~~~l~~~d~dg~~~~~lt~~~---~~-v~~p~wSpDG~~lay~s~~-~-g--~~~i~~~dl~~g~--~~~l~---~~~g~  247 (435)
T PRK05137        181 IKRLAIMDQDGANVRYLTDGS---SL-VLTPRFSPNRQEITYMSYA-N-G--RPRVYLLDLETGQ--RELVG---NFPGM  247 (435)
T ss_pred             ceEEEEECCCCCCcEEEecCC---CC-eEeeEECCCCCEEEEEEec-C-C--CCEEEEEECCCCc--EEEee---cCCCc
Confidence            457888887654434443221   11 111111113 344443321 1 1  2579999998763  55554   22221


Q ss_pred             CcccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCC
Q 001901          228 RYGHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVP  306 (998)
Q Consensus       228 R~~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~  306 (998)
                      -.  +...- ++++|++....++   ..++|.+|+.+.  ....+.....     .........+++-++|..... +  
T Consensus       248 ~~--~~~~SPDG~~la~~~~~~g---~~~Iy~~d~~~~--~~~~Lt~~~~-----~~~~~~~spDG~~i~f~s~~~-g--  312 (435)
T PRK05137        248 TF--APRFSPDGRKVVMSLSQGG---NTDIYTMDLRSG--TTTRLTDSPA-----IDTSPSYSPDGSQIVFESDRS-G--  312 (435)
T ss_pred             cc--CcEECCCCCEEEEEEecCC---CceEEEEECCCC--ceEEccCCCC-----ccCceeEcCCCCEEEEEECCC-C--
Confidence            11  12222 2324544433333   258999999888  6666644221     111223334555444443211 1  


Q ss_pred             cccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcc
Q 001901          307 LASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTK  379 (998)
Q Consensus       307 ~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~  379 (998)
                      ...+|.++.... ..+.....    ..+.......-+++.+++......      ...++++|+.+..+..+.
T Consensus       313 ~~~Iy~~d~~g~-~~~~lt~~----~~~~~~~~~SpdG~~ia~~~~~~~------~~~i~~~d~~~~~~~~lt  374 (435)
T PRK05137        313 SPQLYVMNADGS-NPRRISFG----GGRYSTPVWSPRGDLIAFTKQGGG------QFSIGVMKPDGSGERILT  374 (435)
T ss_pred             CCeEEEEECCCC-CeEEeecC----CCcccCeEECCCCCEEEEEEcCCC------ceEEEEEECCCCceEecc
Confidence            246777765432 22222111    111212222234544444332211      246899998777665543


No 153
>PF14582 Metallophos_3:  Metallophosphoesterase, calcineurin superfamily; PDB: 1UF3_B 2YVT_A.
Probab=89.98  E-value=0.39  Score=50.56  Aligned_cols=74  Identities=22%  Similarity=0.324  Sum_probs=44.1

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChH-------------------------HHHH
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSL-------------------------ETIT  752 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~-------------------------evl~  752 (998)
                      ..|..+.|.||+++.|.++.+.+.-...+      -+||+||++-....+-                         |.|.
T Consensus         6 ~kilA~s~~~g~~e~l~~l~~~~~e~~~D------~~v~~G~~~~~~a~~~e~~~a~~~~r~p~k~~i~~e~~~~~e~~~   79 (255)
T PF14582_consen    6 RKILAISNFRGDFELLERLVEVIPEKGPD------AVVFVGDLLKAEARSDEYERAQEEQREPDKSEINEEECYDSEALD   79 (255)
T ss_dssp             -EEEEEE--TT-HHHHHHHHHHHHHHT-S------EEEEES-SS-TCHHHHHHHHHHHTT----THHHHHHHHHHHHHHH
T ss_pred             hhheeecCcchHHHHHHHHHhhccccCCC------EEEEeccccccchhhhHHHHHhhhccCcchhhhhhhhhhhHHHHH
Confidence            46899999999999999998876433222      6999999997554333                         3344


Q ss_pred             HHHHhhhcCCCcEEEeecCccccch
Q 001901          753 LLLALKVEYPNNVHLIRGNHEAADI  777 (998)
Q Consensus       753 ll~~lk~~~p~~v~llrGNHE~~~~  777 (998)
                      -+|..--..+--+++|.||||....
T Consensus        80 ~ff~~L~~~~~p~~~vPG~~Dap~~  104 (255)
T PF14582_consen   80 KFFRILGELGVPVFVVPGNMDAPER  104 (255)
T ss_dssp             HHHHHHHCC-SEEEEE--TTS-SHH
T ss_pred             HHHHHHHhcCCcEEEecCCCCchHH
Confidence            4444444556689999999998543


No 154
>PLN02533 probable purple acid phosphatase
Probab=89.69  E-value=0.48  Score=55.93  Aligned_cols=25  Identities=8%  Similarity=0.214  Sum_probs=20.8

Q ss_pred             HHHHHHHHHHcCCcEEEEccccccc
Q 001901          884 PDRVMEFCNNNDLQLIVRAHECVMD  908 (998)
Q Consensus       884 ~~~~~~fl~~~~l~~iiR~H~~~~~  908 (998)
                      .+.++.+|+++++++++-||.-.-+
T Consensus       311 r~~le~Ll~~~~VdlvlsGH~H~Ye  335 (427)
T PLN02533        311 KESMETLLYKARVDLVFAGHVHAYE  335 (427)
T ss_pred             HHHHHHHHHHhCCcEEEecceeccc
Confidence            4578889999999999999986533


No 155
>COG4186 Predicted phosphoesterase or phosphohydrolase [General function prediction only]
Probab=89.39  E-value=1.5  Score=43.41  Aligned_cols=40  Identities=25%  Similarity=0.351  Sum_probs=28.0

Q ss_pred             eEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccc
Q 001901          733 DYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAAD  776 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~  776 (998)
                      .+.+|||+.-.-..--+..+++-+|    +.+++|++||||--.
T Consensus        48 ~lwhLGDl~~~~n~~~~a~~IlerL----nGrkhlv~GNhDk~~   87 (186)
T COG4186          48 VLWHLGDLSSGANRERAAGLILERL----NGRKHLVPGNHDKCH   87 (186)
T ss_pred             eEEEecccccccchhhHHHHHHHHc----CCcEEEeeCCCCCCc
Confidence            6889999986544434444444443    688999999999743


No 156
>cd00216 PQQ_DH Dehydrogenases with pyrrolo-quinoline quinone (PQQ) as cofactor, like ethanol, methanol, and membrane bound glucose dehydrogenases. The alignment model contains an 8-bladed beta-propeller.
Probab=88.84  E-value=62  Score=39.02  Aligned_cols=119  Identities=17%  Similarity=0.179  Sum_probs=61.2

Q ss_pred             cCCcEEEEECCCCc--EEEecCCCCCCC---------------CccceEEEEe--CCEEEEEeCCCC-----------CC
Q 001901          148 ATADVHCYDVLTNK--WSRITPFGEPPT---------------PRAAHVATAV--GTMVVIQGGIGP-----------AG  197 (998)
Q Consensus       148 ~~~dv~~yD~~t~~--W~~l~~~g~~P~---------------pR~~hsa~~~--~~~lyVfGG~~~-----------~~  197 (998)
                      ....++.||..|.+  |+.-.....+..               +....+.++.  ++.||+-.|...           ..
T Consensus       173 ~~g~v~alD~~TG~~~W~~~~~~~~~~~~~~~~~~~~~~~~~g~~vw~~pa~d~~~g~V~vg~~~g~~~~~~~~~~~~~~  252 (488)
T cd00216         173 VRGALRAYDVETGKLLWRFYTTEPDPNAFPTWGPDRQMWGPGGGTSWASPTYDPKTNLVYVGTGNGSPWNWGGRRTPGDN  252 (488)
T ss_pred             CCcEEEEEECCCCceeeEeeccCCCcCCCCCCCCCcceecCCCCCccCCeeEeCCCCEEEEECCCCCCCccCCccCCCCC
Confidence            34678999998764  875432211111               1111222332  356666544220           12


Q ss_pred             CCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEE-----ECCc--EEEEEcCCCCCCCcccEEEEECCCCCceEEE
Q 001901          198 LSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMAL-----VGQR--YLMAIGGNDGKRPLADVWALDTAAKPYEWRK  270 (998)
Q Consensus       198 ~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~-----~~~~--~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~  270 (998)
                      ...+.++.+|..+....|..-....+...-+.....++     +.+.  .++++|..++     .++.||..+....|+.
T Consensus       253 ~~~~~l~Ald~~tG~~~W~~~~~~~~~~~~~~~s~p~~~~~~~~~g~~~~~V~~g~~~G-----~l~ald~~tG~~~W~~  327 (488)
T cd00216         253 LYTDSIVALDADTGKVKWFYQTTPHDLWDYDGPNQPSLADIKPKDGKPVPAIVHAPKNG-----FFYVLDRTTGKLISAR  327 (488)
T ss_pred             CceeeEEEEcCCCCCEEEEeeCCCCCCcccccCCCCeEEeccccCCCeeEEEEEECCCc-----eEEEEECCCCcEeeEe
Confidence            23457999999998778986431111100011111111     1121  2445555443     5899999999888986


Q ss_pred             c
Q 001901          271 L  271 (998)
Q Consensus       271 v  271 (998)
                      -
T Consensus       328 ~  328 (488)
T cd00216         328 P  328 (488)
T ss_pred             E
Confidence            4


No 157
>cd07410 MPP_CpdB_N Escherichia coli CpdB and related proteins, N-terminal metallophosphatase domain. CpdB is a bacterial periplasmic protein with an N-terminal metallophosphatase domain and a C-terminal 3'-nucleotidase domain.  This alignment model represents the N-terminal metallophosphatase domain, which has 2',3'-cyclic phosphodiesterase activity, hydrolyzing the 2',3'-cyclic phosphates of adenosine, guanosine, cytosine and uridine to yield nucleoside and phosphate.  CpdB also hydrolyzes the chromogenic substrates p-nitrophenyl phosphate (PNPP), bis(PNPP) and p-nitrophenyl phosphorylcholine (NPPC).  CpdB is thought to play a scavenging role during RNA hydrolysis by converting the non-transportable nucleotides produced by RNaseI to nucleosides which can easily enter a cell for use as a carbon source.  This family also includes YfkN, a Bacillus subtilis nucleotide phosphoesterase with two copies of each of the metallophosphatase and 3'-nucleotidase domains.  The N-terminal metallophos
Probab=88.59  E-value=0.67  Score=51.34  Aligned_cols=20  Identities=15%  Similarity=0.335  Sum_probs=15.0

Q ss_pred             HHHHHHH-cCCcEEEEccccc
Q 001901          887 VMEFCNN-NDLQLIVRAHECV  906 (998)
Q Consensus       887 ~~~fl~~-~~l~~iiR~H~~~  906 (998)
                      ..+++++ -++++||-||+-+
T Consensus       209 ~~~la~~~~~vD~IlgGHsH~  229 (277)
T cd07410         209 AYELAEEVPGIDAILTGHQHR  229 (277)
T ss_pred             HHHHHhcCCCCcEEEeCCCcc
Confidence            4566666 6899999999854


No 158
>KOG3662 consensus Cell division control protein/predicted DNA repair exonuclease [Replication, recombination and repair]
Probab=88.29  E-value=0.84  Score=52.54  Aligned_cols=57  Identities=32%  Similarity=0.354  Sum_probs=38.5

Q ss_pred             HHHHHHHcCCCCCCCCccceeEEEeccccCCCCCh--HHHHHHHHHhhhcCCC----cEEEeecCccc
Q 001901          713 LMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHS--LETITLLLALKVEYPN----NVHLIRGNHEA  774 (998)
Q Consensus       713 L~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s--~evl~ll~~lk~~~p~----~v~llrGNHE~  774 (998)
                      |.+.|...-+....+     -.+|||||+|-|...  -|--.....+|..|+.    .++.+.||||-
T Consensus        81 lrr~f~~~~~~lkPd-----vvffLGDLfDeG~~~~~eEf~~~~~RfkkIf~~k~~~~~~~i~GNhDI  143 (410)
T KOG3662|consen   81 LRRSFDMSQWRLKPD-----VVFFLGDLFDEGQWAGDEEFKKRYERFKKIFGRKGNIKVIYIAGNHDI  143 (410)
T ss_pred             HHHHHHHHHhccCCC-----EEEEeccccccCccCChHHHHHHHHHHHHhhCCCCCCeeEEeCCcccc
Confidence            455555543332221     578899999988753  4555666666666665    78999999997


No 159
>KOG0310 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=87.18  E-value=32  Score=40.14  Aligned_cols=68  Identities=19%  Similarity=0.284  Sum_probs=41.7

Q ss_pred             EeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEEC
Q 001901          182 AVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDT  261 (998)
Q Consensus       182 ~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~  261 (998)
                      ..++.++++|+-+      .-+-.+|+.+.   ..+....|..-.-|++... ..+ ++|++-||+|+.     +-.||+
T Consensus       120 ~~d~t~l~s~sDd------~v~k~~d~s~a---~v~~~l~~htDYVR~g~~~-~~~-~hivvtGsYDg~-----vrl~Dt  183 (487)
T KOG0310|consen  120 PQDNTMLVSGSDD------KVVKYWDLSTA---YVQAELSGHTDYVRCGDIS-PAN-DHIVVTGSYDGK-----VRLWDT  183 (487)
T ss_pred             ccCCeEEEecCCC------ceEEEEEcCCc---EEEEEecCCcceeEeeccc-cCC-CeEEEecCCCce-----EEEEEe
Confidence            3578999998742      23555677665   3344445554445554332 223 489999999984     556777


Q ss_pred             CCCC
Q 001901          262 AAKP  265 (998)
Q Consensus       262 ~s~~  265 (998)
                      .+.+
T Consensus       184 R~~~  187 (487)
T KOG0310|consen  184 RSLT  187 (487)
T ss_pred             ccCC
Confidence            6663


No 160
>COG1311 HYS2 Archaeal DNA polymerase II, small subunit/DNA polymerase delta, subunit B [DNA replication, recombination, and repair]
Probab=86.60  E-value=12  Score=43.99  Aligned_cols=189  Identities=19%  Similarity=0.206  Sum_probs=98.4

Q ss_pred             CeEEEecCCC-CH----HHHHHHHHHcCCCCCCCCccceeEEE-eccccCC-CC-----------ChHHHHHHHHHhhhc
Q 001901          699 PIKIFGDLHG-QF----GDLMRLFDEYGSPSTAGDIAYIDYLF-LGDYVDR-GQ-----------HSLETITLLLALKVE  760 (998)
Q Consensus       699 ~i~vvGDiHG-~~----~dL~~il~~~g~~~~~~~~~~~~~vf-LGDyVDR-G~-----------~s~evl~ll~~lk~~  760 (998)
                      .+.+++|+|= .-    +.+.++++.++-+..  --...+|+. -||.||- |-           +-.|-...+-.+--.
T Consensus       227 ~v~~isDih~GSk~F~~~~f~~fi~wl~g~~~--~a~~vkyliiagd~VDGigiYpgq~~eL~i~di~~qy~~~A~~L~~  304 (481)
T COG1311         227 YVALISDIHRGSKEFLEDEFEKFIDWLNGPGD--LASRVKYLIIAGDVVDGIGIYPGQEEELVIADIYEQYEELAEFLDQ  304 (481)
T ss_pred             EEEEEeeeecccHHHHHHHHHHHHHHhcCCcc--cccceEEEEEecccccccccccCcccccccccchHHHHHHHHHHhh
Confidence            4788999995 22    334444444443321  112336665 6799993 21           223334444444444


Q ss_pred             CCC--cEEEeecCccccchhhhc-CChHHHHHHhCCCcchhhhhhhhhhhcccceeEEEc-CeEEEecCCccCcccCHHh
Q 001901          761 YPN--NVHLIRGNHEAADINALF-GFRIECIERMGERDGIWAWHRINRLFNWLPLAALIE-KKIICMHGGIGRSINHVEQ  836 (998)
Q Consensus       761 ~p~--~v~llrGNHE~~~~~~~~-gf~~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~-~~il~vHgGi~~~~~~~~~  836 (998)
                      -|.  .|++..||||........ .|.......|         ...+-.|=.=|...-++ ..+|..||      .+++|
T Consensus       305 vp~~I~v~i~PGnhDa~r~a~PQp~~~~~~kslf---------~~~n~~~v~NP~~~~l~G~~vL~~hG------~sidD  369 (481)
T COG1311         305 VPEHIKVFIMPGNHDAVRQALPQPHFPELIKSLF---------SLNNLLFVSNPALVSLHGVDVLIYHG------RSIDD  369 (481)
T ss_pred             CCCCceEEEecCCCCccccccCCCCcchhhcccc---------cccceEecCCCcEEEECCEEEEEecC------CCHHH
Confidence            555  689999999986554332 3333322222         22221111114333333 46777887      35566


Q ss_pred             hhhccCCcccCCCC-------------cceeccccCCCCCCCCCCCcccCCCCCCceeeCHHHHHHHHHHcCCcEEEEcc
Q 001901          837 IENLQRPITMEAGS-------------IVLMDLLWSDPTENDSVEGLRPNARGPGLVTFGPDRVMEFCNNNDLQLIVRAH  903 (998)
Q Consensus       837 i~~i~rp~~~~~~~-------------~~~~dlLWsDP~~~~~~~~~~~n~rg~~~~~fg~~~~~~fl~~~~l~~iiR~H  903 (998)
                      |...-.......-.             ...-+-+|.-|...|               +|   ++++     --++++-||
T Consensus       370 ii~~vP~~~~~~~~~ame~lLk~rHlaPtygg~~p~aP~~kD---------------~l---VIee-----vPDv~~~Gh  426 (481)
T COG1311         370 IIKLVPGADYDSPLKAMEELLKRRHLAPTYGGTLPIAPETKD---------------YL---VIEE-----VPDVFHTGH  426 (481)
T ss_pred             HHhhCCCCCccchHHHHHHHHHhcccCCCCCCccccccCCcC---------------ce---eecc-----CCcEEEEcc
Confidence            54433222211100             123344555554321               01   0111     145678899


Q ss_pred             cccccceEEecCCeEEEEecccccc
Q 001901          904 ECVMDGFERFAQGHLITLFSATNYC  928 (998)
Q Consensus       904 ~~~~~G~~~~~~~~~iTvfSa~~y~  928 (998)
                      +.. .|+..+.+.++|..++-+.+.
T Consensus       427 vh~-~g~~~y~gv~~vns~T~q~qT  450 (481)
T COG1311         427 VHK-FGTGVYEGVNLVNSGTWQEQT  450 (481)
T ss_pred             ccc-cceeEEeccceEEeeeecchh
Confidence            976 899998888898888877654


No 161
>COG0420 SbcD DNA repair exonuclease [DNA replication, recombination, and repair]
Probab=86.48  E-value=1.6  Score=50.85  Aligned_cols=45  Identities=27%  Similarity=0.327  Sum_probs=34.2

Q ss_pred             eEEEeccccCCCCChHHHHHHHHHhhhcCC---CcEEEeecCccccch
Q 001901          733 DYLFLGDYVDRGQHSLETITLLLALKVEYP---NNVHLIRGNHEAADI  777 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s~evl~ll~~lk~~~p---~~v~llrGNHE~~~~  777 (998)
                      -+|+-||+.|+..-|.+++.++...-.+.-   -.||+|.||||...-
T Consensus        43 ~vliAGDlFd~~~Ps~~a~~~~~~~l~~l~~~~Ipv~~I~GNHD~~~~   90 (390)
T COG0420          43 FVLIAGDLFDTNNPSPRALKLFLEALRRLKDAGIPVVVIAGNHDSPSR   90 (390)
T ss_pred             EEEEccccccCCCCCHHHHHHHHHHHHHhccCCCcEEEecCCCCchhc
Confidence            588899999999988888766555443332   279999999998643


No 162
>PRK03629 tolB translocation protein TolB; Provisional
Probab=85.08  E-value=89  Score=36.95  Aligned_cols=149  Identities=17%  Similarity=0.127  Sum_probs=72.3

Q ss_pred             ccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCC
Q 001901          201 EDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPP  279 (998)
Q Consensus       201 ~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~  279 (998)
                      ..+|++|+.+..  -..+.   ..+..  ......- ++++|++....++.   .++|.+|+.+.  +.+++.....   
T Consensus       223 ~~i~i~dl~~G~--~~~l~---~~~~~--~~~~~~SPDG~~La~~~~~~g~---~~I~~~d~~tg--~~~~lt~~~~---  287 (429)
T PRK03629        223 SALVIQTLANGA--VRQVA---SFPRH--NGAPAFSPDGSKLAFALSKTGS---LNLYVMDLASG--QIRQVTDGRS---  287 (429)
T ss_pred             cEEEEEECCCCC--eEEcc---CCCCC--cCCeEECCCCCEEEEEEcCCCC---cEEEEEECCCC--CEEEccCCCC---
Confidence            579999987752  33333   22211  1112222 33355554333332   36999999887  6666644321   


Q ss_pred             CccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCcc
Q 001901          280 PCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMV  359 (998)
Q Consensus       280 ~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~  359 (998)
                        .........+++.++|......   ...+|.++.... ........+    .........-+++.+++.+....    
T Consensus       288 --~~~~~~wSPDG~~I~f~s~~~g---~~~Iy~~d~~~g-~~~~lt~~~----~~~~~~~~SpDG~~Ia~~~~~~g----  353 (429)
T PRK03629        288 --NNTEPTWFPDSQNLAYTSDQAG---RPQVYKVNINGG-APQRITWEG----SQNQDADVSSDGKFMVMVSSNGG----  353 (429)
T ss_pred             --CcCceEECCCCCEEEEEeCCCC---CceEEEEECCCC-CeEEeecCC----CCccCEEECCCCCEEEEEEccCC----
Confidence              1122233345655555432211   236777765543 222221111    11111222234554444433221    


Q ss_pred             ccCCeEEEEECCCCeEEEccc
Q 001901          360 EDSSSVAVLDTAAGVWCDTKS  380 (998)
Q Consensus       360 ~~~~dv~vyD~~t~~W~~v~~  380 (998)
                        ...++++|+.+.+++.+..
T Consensus       354 --~~~I~~~dl~~g~~~~Lt~  372 (429)
T PRK03629        354 --QQHIAKQDLATGGVQVLTD  372 (429)
T ss_pred             --CceEEEEECCCCCeEEeCC
Confidence              2469999999999887663


No 163
>cd07378 MPP_ACP5 Homo sapiens acid phosphatase 5 and related proteins, metallophosphatase domain. Acid phosphatase 5 (ACP5) removes the mannose 6-phosphate recognition marker from lysosomal proteins.  The exact site of dephosphorylation is not clear. Evidence suggests dephosphorylation may take place in a prelysosomal compartment as well as in the lysosome.  ACP5 belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site ma
Probab=84.16  E-value=2  Score=47.37  Aligned_cols=23  Identities=13%  Similarity=0.306  Sum_probs=19.5

Q ss_pred             HHHHHHHHHHcCCcEEEEccccc
Q 001901          884 PDRVMEFCNNNDLQLIVRAHECV  906 (998)
Q Consensus       884 ~~~~~~fl~~~~l~~iiR~H~~~  906 (998)
                      ...+.++++++++++++-||.-.
T Consensus       190 ~~~l~~l~~~~~v~~vl~GH~H~  212 (277)
T cd07378         190 VDRLLPLLKKYKVDAYLSGHDHN  212 (277)
T ss_pred             HHHHHHHHHHcCCCEEEeCCccc
Confidence            45678899999999999999754


No 164
>KOG2055 consensus WD40 repeat protein [General function prediction only]
Probab=83.82  E-value=48  Score=38.58  Aligned_cols=148  Identities=16%  Similarity=0.165  Sum_probs=75.4

Q ss_pred             CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCC
Q 001901          184 GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAA  263 (998)
Q Consensus       184 ~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s  263 (998)
                      |...++++|..      .=+|.||+.+.  +-+++.+...++..-...-.+...+ .++++-|..|     -++.+...|
T Consensus       269 G~~~i~~s~rr------ky~ysyDle~a--k~~k~~~~~g~e~~~~e~FeVShd~-~fia~~G~~G-----~I~lLhakT  334 (514)
T KOG2055|consen  269 GHSVIFTSGRR------KYLYSYDLETA--KVTKLKPPYGVEEKSMERFEVSHDS-NFIAIAGNNG-----HIHLLHAKT  334 (514)
T ss_pred             CceEEEecccc------eEEEEeecccc--ccccccCCCCcccchhheeEecCCC-CeEEEcccCc-----eEEeehhhh
Confidence            34588888853      34889999886  4666653333332111111222333 4777777655     455666666


Q ss_pred             CCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCC-eEEEEECCCCCCCCcceeE-EEE
Q 001901          264 KPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDG-RWEWAIAPGVSPSPRYQHA-AVF  341 (998)
Q Consensus       264 ~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~-~W~w~~~~g~~P~pR~~hs-av~  341 (998)
                      .  .|..---.    ..+....+....+.+||+.||.       ..+|.++...+. .-+|..-.+.     .+-+ |..
T Consensus       335 ~--eli~s~Ki----eG~v~~~~fsSdsk~l~~~~~~-------GeV~v~nl~~~~~~~rf~D~G~v-----~gts~~~S  396 (514)
T KOG2055|consen  335 K--ELITSFKI----EGVVSDFTFSSDSKELLASGGT-------GEVYVWNLRQNSCLHRFVDDGSV-----HGTSLCIS  396 (514)
T ss_pred             h--hhhheeee----ccEEeeEEEecCCcEEEEEcCC-------ceEEEEecCCcceEEEEeecCcc-----ceeeeeec
Confidence            6  55321111    1123333333445678888774       357777665542 2234443322     2222 334


Q ss_pred             ECCEEEEEcccCCCCCccccCCeEEEEECCC
Q 001901          342 VNARLHVSGGALGGGRMVEDSSSVAVLDTAA  372 (998)
Q Consensus       342 ~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t  372 (998)
                      .++.++.+|...         .-|-+||..+
T Consensus       397 ~ng~ylA~GS~~---------GiVNIYd~~s  418 (514)
T KOG2055|consen  397 LNGSYLATGSDS---------GIVNIYDGNS  418 (514)
T ss_pred             CCCceEEeccCc---------ceEEEeccch
Confidence            566766666432         2366777544


No 165
>cd07412 MPP_YhcR_N Bacillus subtilis YhcR endonuclease and related proteins, N-terminal metallophosphatase domain. YhcR is a Bacillus subtilis sugar-nonspecific endonuclease. It cleaves endonucleolytically to yield nucleotide 3'-monophosphate products, similar to Staphylococcus aureus micrococcal nuclease. YhcR appears to be located in the cell wall, and is thought to be a substrate for a Bacillus subtilis sortase. YhcR is the major calcium-activated nuclease of B. subtilis.  The N-terminal metallophosphatase domain belongs to a large superfamily of distantly related metallophosphatases (MPPs) that includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated wi
Probab=82.92  E-value=1.8  Score=48.41  Aligned_cols=66  Identities=29%  Similarity=0.364  Sum_probs=41.0

Q ss_pred             CeEEEecCCCCHHH--------------HHHHHHHcCCCCCCCCccceeEEEeccccCCCCC-h-----HHHHHHHHHhh
Q 001901          699 PIKIFGDLHGQFGD--------------LMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQH-S-----LETITLLLALK  758 (998)
Q Consensus       699 ~i~vvGDiHG~~~d--------------L~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~-s-----~evl~ll~~lk  758 (998)
                      .|+.+.|+||++..              |..+++.......     ..-+|..||++...+. +     -.++.+|-++.
T Consensus         2 ~il~tnD~Hg~~~~~~~~~~~~~gG~arl~~~i~~~r~~~~-----~~l~ld~GD~~~gs~~~s~~~~g~~~~~~~n~~g   76 (288)
T cd07412           2 QILAINDFHGRLEPPGKVVTVPAGGAAYLAAYLDEARAQNP-----NSLFVSAGDLIGASPFESALLQDEPTIEALNAMG   76 (288)
T ss_pred             eEEEEeccccCccCCCCccccccccHHHHHHHHHHHHhcCC-----CeEEEeCCcccccccchhhcccCCcHHHHHHhhC
Confidence            47789999998653              5566666543211     1257779999986553 2     24455555553


Q ss_pred             hcCCCcEEEeecCccc
Q 001901          759 VEYPNNVHLIRGNHEA  774 (998)
Q Consensus       759 ~~~p~~v~llrGNHE~  774 (998)
                      .    . .+..||||.
T Consensus        77 ~----D-a~t~GNHef   87 (288)
T cd07412          77 V----D-ASAVGNHEF   87 (288)
T ss_pred             C----e-eeeeccccc
Confidence            2    2 455699996


No 166
>cd07387 MPP_PolD2_C PolD2 (DNA polymerase delta, subunit 2), C-terminal domain. PolD2 (DNA polymerase delta, subunit 2) is an auxiliary subunit of the eukaryotic DNA polymerase delta (PolD) complex thought to play a regulatory role and to serve as a scaffold for PolD assembly by interacting simultaneously with all of the other three subunits.  PolD2 is catalytically inactive and lacks the active site residues required for phosphoesterase activity in other members of this superfamily.  PolD2 is also involved in the recruitment of several proteins regulating DNA metabolism, including p21, PDIP1, PDIP38, PDIP46, and WRN. Human PolD consists of four subunits: p125 (PolD1), p50 (PolD2), p66(PolD3), and p12(PolD4).  PolD is one of three major replicases in eukaryotes. PolD also plays an essential role in translesion DNA synthesis, homologous recombination, and DNA repair.  Within the PolD complex, PolD2 tightly associates with PolD3.  PolD2 belongs to the metallophosphatase (MPP) superfamily
Probab=82.73  E-value=38  Score=37.17  Aligned_cols=47  Identities=15%  Similarity=0.231  Sum_probs=27.1

Q ss_pred             EEEEcccccccceEEecC--CeEEEEeccccccCCCCCeEEEEEE-cCCceEEeE
Q 001901          898 LIVRAHECVMDGFERFAQ--GHLITLFSATNYCGTANNAGAILVL-GRDLVVVPK  949 (998)
Q Consensus       898 ~iiR~H~~~~~G~~~~~~--~~~iTvfSa~~y~~~~~n~ga~l~~-~~~~~~~~~  949 (998)
                      .++-|||.. -|.+.+.+  ++-+.+.|.|.|..    .|.++++ =+++++.+.
T Consensus       206 Vyf~Gnq~~-f~t~~~~~~~~~~v~lv~vP~Fs~----t~~~vlvdl~tLe~~~v  255 (257)
T cd07387         206 VYFAGNQPK-FGTKLVEGEEGQRVLLVCVPSFSK----TGTAVLVNLRTLECEPI  255 (257)
T ss_pred             EEEeCCCcc-eeeeEEEcCCCCeEEEEEeCCcCc----CCEEEEEECCcCcEEEE
Confidence            344678865 55555432  56677777788753    3444444 445666543


No 167
>PRK04792 tolB translocation protein TolB; Provisional
Probab=82.45  E-value=1.2e+02  Score=36.25  Aligned_cols=191  Identities=14%  Similarity=0.126  Sum_probs=90.8

Q ss_pred             CCcEEEEECCCCcEEEecCCCCCCCCccceEEEEeC-CEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC
Q 001901          149 TADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVG-TMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP  227 (998)
Q Consensus       149 ~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~-~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~  227 (998)
                      ...++..|.....-+.+....   .+ .......-+ ++|++.- .. .+  ..++|++|+.+..  -..+.   ..+..
T Consensus       197 ~~~l~i~d~dG~~~~~l~~~~---~~-~~~p~wSPDG~~La~~s-~~-~g--~~~L~~~dl~tg~--~~~lt---~~~g~  263 (448)
T PRK04792        197 PYQLMIADYDGYNEQMLLRSP---EP-LMSPAWSPDGRKLAYVS-FE-NR--KAEIFVQDIYTQV--REKVT---SFPGI  263 (448)
T ss_pred             ceEEEEEeCCCCCceEeecCC---Cc-ccCceECCCCCEEEEEE-ec-CC--CcEEEEEECCCCC--eEEec---CCCCC
Confidence            346777777665555444331   11 111111123 3444332 11 11  2579999998753  44443   22211


Q ss_pred             CcccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEec-cCCCCC
Q 001901          228 RYGHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGG-RDASSV  305 (998)
Q Consensus       228 R~~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG-~~~~~~  305 (998)
                        ......- ++++|++....++   ..++|.+|+.+.  +.+++.....     .........+++.++|.. .++   
T Consensus       264 --~~~~~wSPDG~~La~~~~~~g---~~~Iy~~dl~tg--~~~~lt~~~~-----~~~~p~wSpDG~~I~f~s~~~g---  328 (448)
T PRK04792        264 --NGAPRFSPDGKKLALVLSKDG---QPEIYVVDIATK--ALTRITRHRA-----IDTEPSWHPDGKSLIFTSERGG---  328 (448)
T ss_pred             --cCCeeECCCCCEEEEEEeCCC---CeEEEEEECCCC--CeEECccCCC-----CccceEECCCCCEEEEEECCCC---
Confidence              1122222 3335655543333   258999999988  7777654321     111222333554444432 222   


Q ss_pred             CcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcc
Q 001901          306 PLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTK  379 (998)
Q Consensus       306 ~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~  379 (998)
                       ..++|.++.... .++.....+.    .....+..-+++.+++.+....      ...++++|+.+.++..+.
T Consensus       329 -~~~Iy~~dl~~g-~~~~Lt~~g~----~~~~~~~SpDG~~l~~~~~~~g------~~~I~~~dl~~g~~~~lt  390 (448)
T PRK04792        329 -KPQIYRVNLASG-KVSRLTFEGE----QNLGGSITPDGRSMIMVNRTNG------KFNIARQDLETGAMQVLT  390 (448)
T ss_pred             -CceEEEEECCCC-CEEEEecCCC----CCcCeeECCCCCEEEEEEecCC------ceEEEEEECCCCCeEEcc
Confidence             246777776543 4443332221    1111122234544444433221      346999999999887664


No 168
>cd07408 MPP_SA0022_N Staphylococcus aureus SA0022 and related proteins, N-terminal metallophosphatase domain. SA0022 is an uncharacterized Staphylococcus aureus UshA-like protein with two putative domains, an N-terminal metallophosphatase domain and  a C-terminal nucleotidase domain.  SA0022 also contains a putative C-terminal cell wall anchor domain.  The N-terminal metallophosphatase domain belongs to a large superfamily of distantly related metallophosphatases (MPPs) that includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The conserved domain is a double beta-sheet
Probab=80.80  E-value=2.8  Score=45.91  Aligned_cols=65  Identities=23%  Similarity=0.223  Sum_probs=38.4

Q ss_pred             CeEEEecCCCCHH----------HHHHHHHHcCCCCCCCCccceeEEEeccccCCCCCh-----HHHHHHHHHhhhcCCC
Q 001901          699 PIKIFGDLHGQFG----------DLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHS-----LETITLLLALKVEYPN  763 (998)
Q Consensus       699 ~i~vvGDiHG~~~----------dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s-----~evl~ll~~lk~~~p~  763 (998)
                      .|+-+.|+||++.          .|..+++...-.+      ..-+|..||+++..+.+     ..++..|-.+.    -
T Consensus         2 ~il~~~D~H~~~~~~~~~~~g~~~l~~~i~~~~~~~------~~l~l~~GD~~~gs~~~~~~~g~~~~~~ln~~g----~   71 (257)
T cd07408           2 TILHTNDIHGRIDEDDNNGIGYAKLATYKKEMNKLD------NDLLVDAGDAIQGLPISDLDKGETIIKIMNAVG----Y   71 (257)
T ss_pred             EEEEeccCcccccCCCCccccHHHHHHHHHHHHhcC------CEEEEeCCCcCCCchhhhhcCCcHHHHHHHhcC----C
Confidence            4677999999853          4556666653221      12577799999865533     22333333331    2


Q ss_pred             cEEEeecCccc
Q 001901          764 NVHLIRGNHEA  774 (998)
Q Consensus       764 ~v~llrGNHE~  774 (998)
                      .+ +..||||.
T Consensus        72 d~-~~~GNHef   81 (257)
T cd07408          72 DA-VTPGNHEF   81 (257)
T ss_pred             cE-Eccccccc
Confidence            34 45699996


No 169
>PF12768 Rax2:  Cortical protein marker for cell polarity
Probab=79.74  E-value=28  Score=38.72  Aligned_cols=113  Identities=16%  Similarity=0.201  Sum_probs=64.8

Q ss_pred             CcccEEEEECCCCCceEEEcccCCCCCCCccceEEEE-EeCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEECC--C
Q 001901          252 PLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASA-RSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAP--G  328 (998)
Q Consensus       252 ~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~-~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~--g  328 (998)
                      ....+..||+.+.  +|..+...-.     ....+.. +.++.||+.|-.+........+-.|+.... +|+.....  .
T Consensus        14 ~C~~lC~yd~~~~--qW~~~g~~i~-----G~V~~l~~~~~~~Llv~G~ft~~~~~~~~la~yd~~~~-~w~~~~~~~s~   85 (281)
T PF12768_consen   14 PCPGLCLYDTDNS--QWSSPGNGIS-----GTVTDLQWASNNQLLVGGNFTLNGTNSSNLATYDFKNQ-TWSSLGGGSSN   85 (281)
T ss_pred             CCCEEEEEECCCC--EeecCCCCce-----EEEEEEEEecCCEEEEEEeeEECCCCceeEEEEecCCC-eeeecCCcccc
Confidence            3678999999999  9999866421     2223333 347788887765544423445566666655 55433331  1


Q ss_pred             CCCCCcceeEEEEEC-CEEEEEcccCCCCCccccCCeEEEEECCCCeEEEccc
Q 001901          329 VSPSPRYQHAAVFVN-ARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKS  380 (998)
Q Consensus       329 ~~P~pR~~hsav~~~-~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~  380 (998)
                      ..|.+-........+ ..+++.|.. ..+     ..-+..|  ...+|..+..
T Consensus        86 ~ipgpv~a~~~~~~d~~~~~~aG~~-~~g-----~~~l~~~--dGs~W~~i~~  130 (281)
T PF12768_consen   86 SIPGPVTALTFISNDGSNFWVAGRS-ANG-----STFLMKY--DGSSWSSIGS  130 (281)
T ss_pred             cCCCcEEEEEeeccCCceEEEecee-cCC-----CceEEEE--cCCceEeccc
Confidence            234443222222223 468877765 222     2346666  5679999887


No 170
>cd00094 HX Hemopexin-like repeats.; Hemopexin is a heme-binding protein that transports heme to the liver. Hemopexin-like repeats occur in vitronectin and some matrix metalloproteinases family (matrixins). The HX repeats of some matrixins bind tissue inhibitor of metalloproteinases (TIMPs). This CD contains 4 instances of the repeat.
Probab=79.31  E-value=84  Score=32.70  Aligned_cols=151  Identities=13%  Similarity=0.070  Sum_probs=75.5

Q ss_pred             EEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCC-CCCcccEEEEECC-cEEEEEcCCCCCCCcccE
Q 001901          179 VATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGP-GPRYGHVMALVGQ-RYLMAIGGNDGKRPLADV  256 (998)
Q Consensus       179 sa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P-~~R~~hs~~~~~~-~~Lyv~GG~~g~~~lndv  256 (998)
                      +++...+++|+|-|        +.+|+++.......-..+.  ...| .+..=.++....+ +++|+|-|       +..
T Consensus        11 A~~~~~g~~y~FkG--------~~~w~~~~~~~~~~p~~I~--~~w~~~p~~IDAa~~~~~~~~~yfFkg-------~~y   73 (194)
T cd00094          11 AVTTLRGELYFFKG--------RYFWRLSPGKPPGSPFLIS--SFWPSLPSPVDAAFERPDTGKIYFFKG-------DKY   73 (194)
T ss_pred             eEEEeCCEEEEEeC--------CEEEEEeCCCCCCCCeEhh--hhCCCCCCCccEEEEECCCCEEEEECC-------CEE
Confidence            34445689999977        3578887652110111111  1112 1122223333332 58999977       478


Q ss_pred             EEEECCCCCceEE---EcccCCCCCCCccceEEEEEe-CCEEEEEeccCCCCCCcccEEEEecCCCCeE----------E
Q 001901          257 WALDTAAKPYEWR---KLEPEGEGPPPCMYATASARS-DGLLLLCGGRDASSVPLASAYGLAKHRDGRW----------E  322 (998)
Q Consensus       257 ~~yD~~s~~~~W~---~v~~~~~~P~~r~~~~a~~~~-~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W----------~  322 (998)
                      |+||..+.  .+.   .+...+.++.+..-.++.... ++++|+|.|.        ..|.|+.... +.          .
T Consensus        74 w~~~~~~~--~~~~Pk~i~~~~~~~~~~~iDAA~~~~~~~~~yfFkg~--------~y~ry~~~~~-~v~~~yP~~i~~~  142 (194)
T cd00094          74 WVYTGKNL--EPGYPKPISDLGFPPTVKQIDAALRWPDNGKTYFFKGD--------KYWRYDEKTQ-KMDPGYPKLIETD  142 (194)
T ss_pred             EEEcCccc--ccCCCcchhhcCCCCCCCCccEEEEEcCCCEEEEEeCC--------EEEEEeCCCc-cccCCCCcchhhc
Confidence            88887642  221   111112211112233444443 6899999772        3455544322 00          1


Q ss_pred             EEECCCCCCCCcceeEEEEEC-CEEEEEcccCCCCCccccCCeEEEEECCCCe
Q 001901          323 WAIAPGVSPSPRYQHAAVFVN-ARLHVSGGALGGGRMVEDSSSVAVLDTAAGV  374 (998)
Q Consensus       323 w~~~~g~~P~pR~~hsav~~~-~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~  374 (998)
                      |   .+   .+..-.++.... +++|.|-|           +..|.||..+.+
T Consensus       143 w---~g---~p~~idaa~~~~~~~~yfF~g-----------~~y~~~d~~~~~  178 (194)
T cd00094         143 F---PG---VPDKVDAAFRWLDGYYYFFKG-----------DQYWRFDPRSKE  178 (194)
T ss_pred             C---CC---cCCCcceeEEeCCCcEEEEEC-----------CEEEEEeCccce
Confidence            1   11   122123333344 88999865           358999988776


No 171
>TIGR02800 propeller_TolB tol-pal system beta propeller repeat protein TolB. The Tol-PAL system is required for bacterial outer membrane integrity. E. coli TolB is involved in the tonB-independent uptake of group A colicins (colicins A, E1, E2, E3 and K), and is necessary for the colicins to reach their respective targets after initial binding to the bacteria. It is also involved in uptake of filamentous DNA. Study of its structure suggest that the TolB protein might be involved in the recycling of peptidoglycan or in its covalent linking with lipoproteins. The Tol-Pal system is also implicated in pathogenesis of E. coli, Haemophilus ducreyi, Salmonella enterica and Vibrio cholerae, but the mechanism(s) is unclear.
Probab=79.14  E-value=1.3e+02  Score=34.86  Aligned_cols=147  Identities=19%  Similarity=0.199  Sum_probs=72.5

Q ss_pred             ccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCC
Q 001901          201 EDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPP  279 (998)
Q Consensus       201 ~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~  279 (998)
                      ..++++|+.+..  ...+.   ..+....  +.... +++.|++....++   ..++|.+|+.+.  ....+......  
T Consensus       214 ~~i~v~d~~~g~--~~~~~---~~~~~~~--~~~~spDg~~l~~~~~~~~---~~~i~~~d~~~~--~~~~l~~~~~~--  279 (417)
T TIGR02800       214 PEIYVQDLATGQ--REKVA---SFPGMNG--APAFSPDGSKLAVSLSKDG---NPDIYVMDLDGK--QLTRLTNGPGI--  279 (417)
T ss_pred             cEEEEEECCCCC--EEEee---cCCCCcc--ceEECCCCCEEEEEECCCC---CccEEEEECCCC--CEEECCCCCCC--
Confidence            579999998753  44443   2221111  22222 2334655443332   258999999887  66666443211  


Q ss_pred             CccceEEEEEeCCE-EEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEE-ECCEEEEEcccCCCCC
Q 001901          280 PCMYATASARSDGL-LLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVF-VNARLHVSGGALGGGR  357 (998)
Q Consensus       280 ~r~~~~a~~~~~~~-lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~-~~~~L~V~GG~~~~~~  357 (998)
                         ........+++ |++.....+    ...+|.++.... .+......+     .......+ -+++.+++......  
T Consensus       280 ---~~~~~~s~dg~~l~~~s~~~g----~~~iy~~d~~~~-~~~~l~~~~-----~~~~~~~~spdg~~i~~~~~~~~--  344 (417)
T TIGR02800       280 ---DTEPSWSPDGKSIAFTSDRGG----SPQIYMMDADGG-EVRRLTFRG-----GYNASPSWSPDGDLIAFVHREGG--  344 (417)
T ss_pred             ---CCCEEECCCCCEEEEEECCCC----CceEEEEECCCC-CEEEeecCC-----CCccCeEECCCCCEEEEEEccCC--
Confidence               11112223454 444433222    236777765543 333222211     11222222 35666666544321  


Q ss_pred             ccccCCeEEEEECCCCeEEEccc
Q 001901          358 MVEDSSSVAVLDTAAGVWCDTKS  380 (998)
Q Consensus       358 ~~~~~~dv~vyD~~t~~W~~v~~  380 (998)
                          ...++++|+.+..++.+..
T Consensus       345 ----~~~i~~~d~~~~~~~~l~~  363 (417)
T TIGR02800       345 ----GFNIAVMDLDGGGERVLTD  363 (417)
T ss_pred             ----ceEEEEEeCCCCCeEEccC
Confidence                3469999999977766543


No 172
>COG1520 FOG: WD40-like repeat [Function unknown]
Probab=78.96  E-value=1.3e+02  Score=34.65  Aligned_cols=158  Identities=15%  Similarity=0.216  Sum_probs=86.8

Q ss_pred             EEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEE
Q 001901          181 TAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALD  260 (998)
Q Consensus       181 ~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD  260 (998)
                      +..++++|+.-.       ...++.+|..+....|......    ....-.+-....+++||+ |..++     .+++||
T Consensus        65 ~~~dg~v~~~~~-------~G~i~A~d~~~g~~~W~~~~~~----~~~~~~~~~~~~~G~i~~-g~~~g-----~~y~ld  127 (370)
T COG1520          65 ADGDGTVYVGTR-------DGNIFALNPDTGLVKWSYPLLG----AVAQLSGPILGSDGKIYV-GSWDG-----KLYALD  127 (370)
T ss_pred             EeeCCeEEEecC-------CCcEEEEeCCCCcEEecccCcC----cceeccCceEEeCCeEEE-ecccc-----eEEEEE
Confidence            555678888711       1279999999876568765421    011111122222445544 44444     799999


Q ss_pred             CCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCC-CCeEEEEECCCCCCCCcceeEE
Q 001901          261 TAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHR-DGRWEWAIAPGVSPSPRYQHAA  339 (998)
Q Consensus       261 ~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~-~~~W~w~~~~g~~P~pR~~hsa  339 (998)
                      ..+.+..|..-... .    .+...+.++.++.+|+.-       ....++.++..+ ...|+.....+ . ..+...+.
T Consensus       128 ~~~G~~~W~~~~~~-~----~~~~~~~v~~~~~v~~~s-------~~g~~~al~~~tG~~~W~~~~~~~-~-~~~~~~~~  193 (370)
T COG1520         128 ASTGTLVWSRNVGG-S----PYYASPPVVGDGTVYVGT-------DDGHLYALNADTGTLKWTYETPAP-L-SLSIYGSP  193 (370)
T ss_pred             CCCCcEEEEEecCC-C----eEEecCcEEcCcEEEEec-------CCCeEEEEEccCCcEEEEEecCCc-c-ccccccCc
Confidence            98887899987655 1    234445566677777653       123456665552 22455434332 1 22322233


Q ss_pred             EEECCEEEEEcccCCCCCccccCCeEEEEECCCC--eEEE
Q 001901          340 VFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAG--VWCD  377 (998)
Q Consensus       340 v~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~--~W~~  377 (998)
                      +..++.+|+- ... .      ...++.+|+++.  .|..
T Consensus       194 ~~~~~~vy~~-~~~-~------~~~~~a~~~~~G~~~w~~  225 (370)
T COG1520         194 AIASGTVYVG-SDG-Y------DGILYALNAEDGTLKWSQ  225 (370)
T ss_pred             eeecceEEEe-cCC-C------cceEEEEEccCCcEeeee
Confidence            3555666654 221 0      125999999777  4764


No 173
>cd07411 MPP_SoxB_N Thermus thermophilus SoxB and related proteins, N-terminal metallophosphatase domain. SoxB (sulfur oxidation protein B) is a periplasmic thiosulfohydrolase and an essential component of the sulfur oxidation pathway in archaea and bacteria.  SoxB has a dinuclear manganese cluster and is thought to catalyze the release of sulfate from a protein-bound cysteine S-thiosulfonate.  SoxB is expressed from the sox (sulfur oxidation) gene cluster, which encodes 15 other sox genes, and has two domains, an N-terminal metallophosphatase domain and a C-terminal 5'-nucleotidase domain.  SoxB binds the SoxYZ complex and is thought to function as a sulfate-thiohydrolase.  SoxB is closely related to the UshA, YchR, and CpdB proteins, all of which have the same two-domain architecture.  The N-terminal metallophosphatase domain belongs to a large superfamily of distantly related metallophosphatases (MPPs) that includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzy
Probab=78.48  E-value=4  Score=44.87  Aligned_cols=35  Identities=26%  Similarity=0.212  Sum_probs=20.7

Q ss_pred             EEEeccccCCCCChH-----HHHHHHHHhhhcCCCcEEEeecCccc
Q 001901          734 YLFLGDYVDRGQHSL-----ETITLLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       734 ~vfLGDyVDRG~~s~-----evl~ll~~lk~~~p~~v~llrGNHE~  774 (998)
                      +|..||+++....+.     .++.+|-.+    + --.+. ||||.
T Consensus        55 ~l~~GD~~~gs~~~~~~~g~~~~~~l~~~----g-~da~~-GNHef   94 (264)
T cd07411          55 LLDGGDTWQGSGEALYTRGQAMVDALNAL----G-VDAMV-GHWEF   94 (264)
T ss_pred             EEeCCCccCCChHHhhcCChhHHHHHHhh----C-CeEEe-ccccc
Confidence            456899998765432     334444443    2 22334 99996


No 174
>TIGR03075 PQQ_enz_alc_DH PQQ-dependent dehydrogenase, methanol/ethanol family. This protein family has a phylogenetic distribution very similar to that coenzyme PQQ biosynthesis enzymes, as shown by partial phylogenetic profiling. Genes in this family often are found adjacent to the PQQ biosynthesis genes themselves. An unusual, strained disulfide bond between adjacent Cys residues contributes to PQQ-binding, as does a Trp residue that is part of a PQQ enzyme repeat (see pfam01011). Characterized members include the dehydrogenase subunit of a membrane-anchored, three subunit alcohol (ethanol) dehydrogenase of Gluconobacter suboxydans, a homodimeric ethanol dehydrogenase in Pseudomonas aeruginosa, and the large subunit of an alpha2/beta2 heterotetrameric methanol dehydrogenase in Methylobacterium extorquens.
Probab=78.16  E-value=1.5e+02  Score=36.19  Aligned_cols=131  Identities=14%  Similarity=0.087  Sum_probs=69.9

Q ss_pred             EEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecC-C-CC---CCCcccEEEEECCcEEEEEcCCCCCCCcc
Q 001901          180 ATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQG-P-GP---GPRYGHVMALVGQRYLMAIGGNDGKRPLA  254 (998)
Q Consensus       180 a~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g-~-~P---~~R~~hs~~~~~~~~Lyv~GG~~g~~~ln  254 (998)
                      -++.++.||+....       ..++.+|..+....|+.-.... . .+   ........++.++ ++|+. ..+     .
T Consensus        65 Pvv~~g~vyv~s~~-------g~v~AlDa~TGk~lW~~~~~~~~~~~~~~~~~~~~rg~av~~~-~v~v~-t~d-----g  130 (527)
T TIGR03075        65 PLVVDGVMYVTTSY-------SRVYALDAKTGKELWKYDPKLPDDVIPVMCCDVVNRGVALYDG-KVFFG-TLD-----A  130 (527)
T ss_pred             CEEECCEEEEECCC-------CcEEEEECCCCceeeEecCCCCcccccccccccccccceEECC-EEEEE-cCC-----C
Confidence            45668888886542       3699999998766798654110 0 01   0011122344454 66653 222     3


Q ss_pred             cEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCC-CeEEEEECC
Q 001901          255 DVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRD-GRWEWAIAP  327 (998)
Q Consensus       255 dv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~-~~W~w~~~~  327 (998)
                      .++++|..+....|+.-.....  ......++-++.++++|+........ ....++.|+..+. -.|++...+
T Consensus       131 ~l~ALDa~TGk~~W~~~~~~~~--~~~~~tssP~v~~g~Vivg~~~~~~~-~~G~v~AlD~~TG~~lW~~~~~p  201 (527)
T TIGR03075       131 RLVALDAKTGKVVWSKKNGDYK--AGYTITAAPLVVKGKVITGISGGEFG-VRGYVTAYDAKTGKLVWRRYTVP  201 (527)
T ss_pred             EEEEEECCCCCEEeeccccccc--ccccccCCcEEECCEEEEeecccccC-CCcEEEEEECCCCceeEeccCcC
Confidence            6899999999889986432111  00112223355688877753221111 2345666666432 246665554


No 175
>KOG2055 consensus WD40 repeat protein [General function prediction only]
Probab=75.17  E-value=40  Score=39.19  Aligned_cols=99  Identities=14%  Similarity=0.191  Sum_probs=58.3

Q ss_pred             cCCcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC
Q 001901          148 ATADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP  227 (998)
Q Consensus       148 ~~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~  227 (998)
                      ...-+|.||+.+.+-.++.+....+.+-...-.+...+.++++-|..      .-++++...++  +|..--   .++..
T Consensus       278 rrky~ysyDle~ak~~k~~~~~g~e~~~~e~FeVShd~~fia~~G~~------G~I~lLhakT~--eli~s~---KieG~  346 (514)
T KOG2055|consen  278 RRKYLYSYDLETAKVTKLKPPYGVEEKSMERFEVSHDSNFIAIAGNN------GHIHLLHAKTK--ELITSF---KIEGV  346 (514)
T ss_pred             cceEEEEeeccccccccccCCCCcccchhheeEecCCCCeEEEcccC------ceEEeehhhhh--hhhhee---eeccE
Confidence            45578999999999999887654442222222233344455555532      24666666665  464332   23333


Q ss_pred             CcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          228 RYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       228 R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                      -...+... .++.||+.||.      ..||+||+.++
T Consensus       347 v~~~~fsS-dsk~l~~~~~~------GeV~v~nl~~~  376 (514)
T KOG2055|consen  347 VSDFTFSS-DSKELLASGGT------GEVYVWNLRQN  376 (514)
T ss_pred             EeeEEEec-CCcEEEEEcCC------ceEEEEecCCc
Confidence            33333332 33478888884      37999999887


No 176
>cd00842 MPP_ASMase acid sphingomyelinase and related proteins, metallophosphatase domain. Acid sphingomyelinase (ASMase) is a ubiquitously expressed phosphodiesterase which hydrolyzes sphingomyelin in acid pH conditions to form ceramide, a bioactive second messenger, as part of the sphingomyelin signaling pathway.  ASMase is localized at the noncytosolic leaflet of biomembranes (for example the luminal leaflet of endosomes, lysosomes and phagosomes, and the extracellular leaflet of plasma membranes).  ASMase-deficient humans develop Niemann-Pick disease. This disease is characterized by lysosomal storage of sphingomyelin in all tissues.  Although ASMase-deficient mice are resistant to stress-induced apoptosis, they have greater susceptibility to bacterial infection. The latter correlates with defective phagolysosomal fusion and antibacterial killing activity in ASMase-deficient macrophages.  ASMase belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but
Probab=74.32  E-value=5.3  Score=44.58  Aligned_cols=46  Identities=28%  Similarity=0.371  Sum_probs=30.3

Q ss_pred             eEEEeccccCCCCChH--------HHHHHHHHhhhcCCC-cEEEeecCccccchh
Q 001901          733 DYLFLGDYVDRGQHSL--------ETITLLLALKVEYPN-NVHLIRGNHEAADIN  778 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s~--------evl~ll~~lk~~~p~-~v~llrGNHE~~~~~  778 (998)
                      -+||.||+|+.+....        ..-.+...|+..+|. .|+.+.||||....+
T Consensus        71 fii~tGD~v~h~~~~~~~~~~~~~~~~~~~~~l~~~~~~~pv~~~~GNHD~~p~~  125 (296)
T cd00842          71 FILWTGDLVRHDVDEQTPETLVLISISNLTSLLKKAFPDTPVYPALGNHDSYPVN  125 (296)
T ss_pred             EEEEcCCCCCCCchhhchhHHHHHHHHHHHHHHHHhCCCCCEEEcCCCCCCCccc
Confidence            5888999998876431        122233345545554 699999999986543


No 177
>COG3855 Fbp Uncharacterized protein conserved in bacteria [Carbohydrate transport and metabolism]
Probab=73.74  E-value=3.6  Score=47.27  Aligned_cols=40  Identities=25%  Similarity=0.407  Sum_probs=35.1

Q ss_pred             eEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccch
Q 001901          733 DYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADI  777 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~  777 (998)
                      .+-.+||+-||||++-.+++-|..+     ..+-+-.||||..++
T Consensus       193 hLHiVGDIyDRGP~pd~Imd~L~~y-----hsvDiQWGNHDilWm  232 (648)
T COG3855         193 HLHIVGDIYDRGPYPDKIMDTLINY-----HSVDIQWGNHDILWM  232 (648)
T ss_pred             heeeecccccCCCCchHHHHHHhhc-----ccccccccCcceEEe
Confidence            5778999999999999999999887     578889999997655


No 178
>PF14583 Pectate_lyase22:  Oligogalacturonate lyase; PDB: 3C5M_C 3PE7_A.
Probab=73.07  E-value=1.2e+02  Score=35.11  Aligned_cols=225  Identities=12%  Similarity=0.085  Sum_probs=101.6

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEE-eCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCC
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQ-GGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPR  228 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVf-GG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R  228 (998)
                      ..+|.+|+.+.+-++|....  .....+-..+.-++.+|.+ .+        ..++.+|+.+..  =+.+.   ..|..-
T Consensus        60 ~nly~lDL~t~~i~QLTdg~--g~~~~g~~~s~~~~~~~Yv~~~--------~~l~~vdL~T~e--~~~vy---~~p~~~  124 (386)
T PF14583_consen   60 RNLYLLDLATGEITQLTDGP--GDNTFGGFLSPDDRALYYVKNG--------RSLRRVDLDTLE--ERVVY---EVPDDW  124 (386)
T ss_dssp             -EEEEEETTT-EEEE---SS---B-TTT-EE-TTSSEEEEEETT--------TEEEEEETTT----EEEEE---E--TTE
T ss_pred             cceEEEEcccCEEEECccCC--CCCccceEEecCCCeEEEEECC--------CeEEEEECCcCc--EEEEE---ECCccc
Confidence            47899999999999998641  1222332222223466544 33        368888888752  33443   334333


Q ss_pred             cccEEEEECCcEEEEEcCC----CC--------------CCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEe
Q 001901          229 YGHVMALVGQRYLMAIGGN----DG--------------KRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARS  290 (998)
Q Consensus       229 ~~hs~~~~~~~~Lyv~GG~----~g--------------~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~  290 (998)
                      .+....+.+...-.++|=.    +.              ....+.+...|+.+.  +.+.+-....    -..|.-..-.
T Consensus       125 ~g~gt~v~n~d~t~~~g~e~~~~d~~~l~~~~~f~e~~~a~p~~~i~~idl~tG--~~~~v~~~~~----wlgH~~fsP~  198 (386)
T PF14583_consen  125 KGYGTWVANSDCTKLVGIEISREDWKPLTKWKGFREFYEARPHCRIFTIDLKTG--ERKVVFEDTD----WLGHVQFSPT  198 (386)
T ss_dssp             EEEEEEEE-TTSSEEEEEEEEGGG-----SHHHHHHHHHC---EEEEEEETTT----EEEEEEESS-----EEEEEEETT
T ss_pred             ccccceeeCCCccEEEEEEEeehhccCccccHHHHHHHhhCCCceEEEEECCCC--ceeEEEecCc----cccCcccCCC
Confidence            3322322221111222211    00              123567888899888  7766644332    2344444434


Q ss_pred             CCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEEC
Q 001901          291 DGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDT  370 (998)
Q Consensus       291 ~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~  370 (998)
                      +..+++|-=.+.....-..+|..+....+.|...   ...+.-..+|---..+|..+.+=++...+.    ..-+..||+
T Consensus       199 dp~li~fCHEGpw~~Vd~RiW~i~~dg~~~~~v~---~~~~~e~~gHEfw~~DG~~i~y~~~~~~~~----~~~i~~~d~  271 (386)
T PF14583_consen  199 DPTLIMFCHEGPWDLVDQRIWTINTDGSNVKKVH---RRMEGESVGHEFWVPDGSTIWYDSYTPGGQ----DFWIAGYDP  271 (386)
T ss_dssp             EEEEEEEEE-S-TTTSS-SEEEEETTS---EESS------TTEEEEEEEE-TTSS-EEEEEEETTT------EEEEEE-T
T ss_pred             CCCEEEEeccCCcceeceEEEEEEcCCCcceeee---cCCCCcccccccccCCCCEEEEEeecCCCC----ceEEEeeCC
Confidence            4555555211122212246888887666444422   222345566666666664333323322221    234888999


Q ss_pred             CCCeEEEcccCcCCCCCCCCccccCCCCCccCCCCcceeEEEEECCEEEEEcCCC
Q 001901          371 AAGVWCDTKSVVTSPRTGRYSADAAGGDAAVELTRRCRHAAAAVGDLIFIYGGLR  425 (998)
Q Consensus       371 ~t~~W~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~~~~LyVfGG~~  425 (998)
                      .|.+=+.+..+                       +++.|-....+++|++--|.+
T Consensus       272 ~t~~~~~~~~~-----------------------p~~~H~~ss~Dg~L~vGDG~d  303 (386)
T PF14583_consen  272 DTGERRRLMEM-----------------------PWCSHFMSSPDGKLFVGDGGD  303 (386)
T ss_dssp             TT--EEEEEEE------------------------SEEEEEE-TTSSEEEEEE--
T ss_pred             CCCCceEEEeC-----------------------CceeeeEEcCCCCEEEecCCC
Confidence            99865555444                       567888888899999876644


No 179
>PRK13684 Ycf48-like protein; Provisional
Probab=72.09  E-value=1.8e+02  Score=33.08  Aligned_cols=175  Identities=12%  Similarity=0.218  Sum_probs=80.9

Q ss_pred             CcEEEecCCCCCCCCccceEEEEeC-CEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECC
Q 001901          160 NKWSRITPFGEPPTPRAAHVATAVG-TMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQ  238 (998)
Q Consensus       160 ~~W~~l~~~g~~P~pR~~hsa~~~~-~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~  238 (998)
                      .+|+++....  ..+........++ +.+++.|..       ..+++-+-...  .|+.+..    +..-.-+.+....+
T Consensus       119 ~tW~~~~~~~--~~~~~~~~i~~~~~~~~~~~g~~-------G~i~~S~DgG~--tW~~~~~----~~~g~~~~i~~~~~  183 (334)
T PRK13684        119 KNWTRIPLSE--KLPGSPYLITALGPGTAEMATNV-------GAIYRTTDGGK--NWEALVE----DAAGVVRNLRRSPD  183 (334)
T ss_pred             CCCeEccCCc--CCCCCceEEEEECCCcceeeecc-------ceEEEECCCCC--CceeCcC----CCcceEEEEEECCC
Confidence            4899885321  1122223344444 356665542       23444333333  4998752    22223344555555


Q ss_pred             cEEEEEcCCCCCCCcccEEEE-ECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEe-cC
Q 001901          239 RYLMAIGGNDGKRPLADVWAL-DTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLA-KH  316 (998)
Q Consensus       239 ~~Lyv~GG~~g~~~lndv~~y-D~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~-~~  316 (998)
                      +.+ +..|..|     .++.. |....  +|+.+.....    +.........++.+|++|....        ..+. ..
T Consensus       184 g~~-v~~g~~G-----~i~~s~~~gg~--tW~~~~~~~~----~~l~~i~~~~~g~~~~vg~~G~--------~~~~s~d  243 (334)
T PRK13684        184 GKY-VAVSSRG-----NFYSTWEPGQT--AWTPHQRNSS----RRLQSMGFQPDGNLWMLARGGQ--------IRFNDPD  243 (334)
T ss_pred             CeE-EEEeCCc-----eEEEEcCCCCC--eEEEeeCCCc----ccceeeeEcCCCCEEEEecCCE--------EEEccCC
Confidence            434 4434333     23322 33334  7988754322    3334444456788888875321        2221 22


Q ss_pred             CCCeEEEEECCCCCCCCcceeEEEEE-CCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEccc
Q 001901          317 RDGRWEWAIAPGVSPSPRYQHAAVFV-NARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKS  380 (998)
Q Consensus       317 ~~~~W~w~~~~g~~P~pR~~hsav~~-~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~  380 (998)
                      ...+|+-...+... .....+++++. ++.+|++|..          ..++.-.....+|+.+..
T Consensus       244 ~G~sW~~~~~~~~~-~~~~l~~v~~~~~~~~~~~G~~----------G~v~~S~d~G~tW~~~~~  297 (334)
T PRK13684        244 DLESWSKPIIPEIT-NGYGYLDLAYRTPGEIWAGGGN----------GTLLVSKDGGKTWEKDPV  297 (334)
T ss_pred             CCCccccccCCccc-cccceeeEEEcCCCCEEEEcCC----------CeEEEeCCCCCCCeECCc
Confidence            22356643221110 11122334444 5678887752          124444445678988764


No 180
>KOG0646 consensus WD40 repeat protein [General function prediction only]
Probab=71.71  E-value=93  Score=36.35  Aligned_cols=96  Identities=13%  Similarity=0.108  Sum_probs=48.4

Q ss_pred             cCCcEEEEECCCCcEEEecCCCCCCCCccceEEEEe----CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCC
Q 001901          148 ATADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAV----GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGP  223 (998)
Q Consensus       148 ~~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~----~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~  223 (998)
                      ...++|++.+.++.--.+-       -+++.+.+.+    +++++|-||.+      ..|.+|++..-   -..-..  .
T Consensus       101 i~g~lYlWelssG~LL~v~-------~aHYQ~ITcL~fs~dgs~iiTgskD------g~V~vW~l~~l---v~a~~~--~  162 (476)
T KOG0646|consen  101 ISGNLYLWELSSGILLNVL-------SAHYQSITCLKFSDDGSHIITGSKD------GAVLVWLLTDL---VSADND--H  162 (476)
T ss_pred             ccCcEEEEEeccccHHHHH-------HhhccceeEEEEeCCCcEEEecCCC------ccEEEEEEEee---cccccC--C
Confidence            4457888888876532221       1333444443    45888888863      34666665431   000110  1


Q ss_pred             CCCCCc---ccEEEEECCcEEEE-EcCCCCCCC----cccEEEEECCCC
Q 001901          224 GPGPRY---GHVMALVGQRYLMA-IGGNDGKRP----LADVWALDTAAK  264 (998)
Q Consensus       224 ~P~~R~---~hs~~~~~~~~Lyv-~GG~~g~~~----lndv~~yD~~s~  264 (998)
                      .|.|++   .|++.+. +  |++ +||.+..-+    -..+-+||+...
T Consensus       163 ~~~p~~~f~~HtlsIT-D--l~ig~Gg~~~rl~TaS~D~t~k~wdlS~g  208 (476)
T KOG0646|consen  163 SVKPLHIFSDHTLSIT-D--LQIGSGGTNARLYTASEDRTIKLWDLSLG  208 (476)
T ss_pred             CccceeeeccCcceeE-E--EEecCCCccceEEEecCCceEEEEEeccc
Confidence            233443   5666554 2  444 566544221    235667787766


No 181
>PRK04792 tolB translocation protein TolB; Provisional
Probab=71.14  E-value=2.3e+02  Score=33.75  Aligned_cols=142  Identities=17%  Similarity=0.227  Sum_probs=72.2

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCc
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRY  229 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~  229 (998)
                      .++|++|+.+.+-+.+...   +..-...+..-.++.|++....+  +  ..++|++|+.+.  +...+...   . . .
T Consensus       242 ~~L~~~dl~tg~~~~lt~~---~g~~~~~~wSPDG~~La~~~~~~--g--~~~Iy~~dl~tg--~~~~lt~~---~-~-~  307 (448)
T PRK04792        242 AEIFVQDIYTQVREKVTSF---PGINGAPRFSPDGKKLALVLSKD--G--QPEIYVVDIATK--ALTRITRH---R-A-I  307 (448)
T ss_pred             cEEEEEECCCCCeEEecCC---CCCcCCeeECCCCCEEEEEEeCC--C--CeEEEEEECCCC--CeEECccC---C-C-C
Confidence            4799999998887776543   11111111111234565553321  1  257999999876  36655421   1 1 1


Q ss_pred             ccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcc
Q 001901          230 GHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLA  308 (998)
Q Consensus       230 ~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~  308 (998)
                      ....+.. ++++|++....++.   .++|.+|+.+.  +++.+...+.     .........+++.++|.+....   ..
T Consensus       308 ~~~p~wSpDG~~I~f~s~~~g~---~~Iy~~dl~~g--~~~~Lt~~g~-----~~~~~~~SpDG~~l~~~~~~~g---~~  374 (448)
T PRK04792        308 DTEPSWHPDGKSLIFTSERGGK---PQIYRVNLASG--KVSRLTFEGE-----QNLGGSITPDGRSMIMVNRTNG---KF  374 (448)
T ss_pred             ccceEECCCCCEEEEEECCCCC---ceEEEEECCCC--CEEEEecCCC-----CCcCeeECCCCCEEEEEEecCC---ce
Confidence            1112222 33345554433332   58999999888  7877753221     1112233445555555443322   24


Q ss_pred             cEEEEecCCC
Q 001901          309 SAYGLAKHRD  318 (998)
Q Consensus       309 dv~~~~~~~~  318 (998)
                      .+|.++....
T Consensus       375 ~I~~~dl~~g  384 (448)
T PRK04792        375 NIARQDLETG  384 (448)
T ss_pred             EEEEEECCCC
Confidence            5777765543


No 182
>PF02191 OLF:  Olfactomedin-like domain;  InterPro: IPR003112 The olfactomedin-domain was first identified in olfactomedin, an extracellular matrix protein of the olfactory neuroepithelium []. Members of this extracellular domain-family have since been shown to be present in several metazoan proteins, such as latrophilins, myocilins, optimedins and noelins, the latter being involved in the generation of neural crest cells. Myocilin is of considerable interest, as mutations in its olfactomedin-domain can lead to glaucoma []. The olfactomedin-domains in myocilin and optimedin are essential for the interaction between these two proteins [].; GO: 0005515 protein binding
Probab=71.11  E-value=1.6e+02  Score=32.11  Aligned_cols=159  Identities=16%  Similarity=0.069  Sum_probs=82.5

Q ss_pred             CCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCc-eEEeeecCCC---CCCCcccEE---EEECCcEEEEE
Q 001901          172 PTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPR-WHRVVVQGPG---PGPRYGHVM---ALVGQRYLMAI  244 (998)
Q Consensus       172 P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~-W~~l~~~g~~---P~~R~~hs~---~~~~~~~Lyv~  244 (998)
                      |.+-.+-+.+++++.+|.--.      ..+++.+||+.+.... |..++-.+..   |-...+++-   ++-.+ -|+|+
T Consensus        66 p~~~~GtG~vVYngslYY~~~------~s~~IvkydL~t~~v~~~~~L~~A~~~n~~~y~~~~~t~iD~AvDE~-GLWvI  138 (250)
T PF02191_consen   66 PYPWQGTGHVVYNGSLYYNKY------NSRNIVKYDLTTRSVVARRELPGAGYNNRFPYYWSGYTDIDFAVDEN-GLWVI  138 (250)
T ss_pred             eceeccCCeEEECCcEEEEec------CCceEEEEECcCCcEEEEEECCccccccccceecCCCceEEEEEcCC-CEEEE
Confidence            445556666777776666533      3478999999997533 4444422111   111112222   22233 47777


Q ss_pred             cCCCCCCCcccEEEEECCCCC--ceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEE
Q 001901          245 GGNDGKRPLADVWALDTAAKP--YEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWE  322 (998)
Q Consensus       245 GG~~g~~~lndv~~yD~~s~~--~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~  322 (998)
                      -......-.--+-++|+.+..  -+|..--.       +.....+.+.-|.||+....+...  ..-.+.||..++   +
T Consensus       139 Yat~~~~g~ivvskld~~tL~v~~tw~T~~~-------k~~~~naFmvCGvLY~~~s~~~~~--~~I~yafDt~t~---~  206 (250)
T PF02191_consen  139 YATEDNNGNIVVSKLDPETLSVEQTWNTSYP-------KRSAGNAFMVCGVLYATDSYDTRD--TEIFYAFDTYTG---K  206 (250)
T ss_pred             EecCCCCCcEEEEeeCcccCceEEEEEeccC-------chhhcceeeEeeEEEEEEECCCCC--cEEEEEEECCCC---c
Confidence            554433222345567776553  25654211       233444556678999987665443  233456666654   2


Q ss_pred             EEECCCCCCCCcceeEEEEEC---CEEEEE
Q 001901          323 WAIAPGVSPSPRYQHAAVFVN---ARLHVS  349 (998)
Q Consensus       323 w~~~~g~~P~pR~~hsav~~~---~~L~V~  349 (998)
                      ...+.-..+.+-..++++.++   .+||+.
T Consensus       207 ~~~~~i~f~~~~~~~~~l~YNP~dk~LY~w  236 (250)
T PF02191_consen  207 EEDVSIPFPNPYGNISMLSYNPRDKKLYAW  236 (250)
T ss_pred             eeceeeeeccccCceEeeeECCCCCeEEEE
Confidence            222221122333455555553   578887


No 183
>PRK04922 tolB translocation protein TolB; Provisional
Probab=68.23  E-value=2.5e+02  Score=33.10  Aligned_cols=147  Identities=19%  Similarity=0.239  Sum_probs=71.1

Q ss_pred             ccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCC
Q 001901          201 EDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPP  280 (998)
Q Consensus       201 ~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~  280 (998)
                      ..+|++|+.+..  ...+.   ..+.. .......-++++|++....++.   .++|.+|+.+.  ...++.....    
T Consensus       228 ~~l~~~dl~~g~--~~~l~---~~~g~-~~~~~~SpDG~~l~~~~s~~g~---~~Iy~~d~~~g--~~~~lt~~~~----  292 (433)
T PRK04922        228 SAIYVQDLATGQ--RELVA---SFRGI-NGAPSFSPDGRRLALTLSRDGN---PEIYVMDLGSR--QLTRLTNHFG----  292 (433)
T ss_pred             cEEEEEECCCCC--EEEec---cCCCC-ccCceECCCCCEEEEEEeCCCC---ceEEEEECCCC--CeEECccCCC----
Confidence            579999998753  44443   22211 1111111123355544333332   58999999888  6556543211    


Q ss_pred             ccceEEEEEeCCEEEEEec-cCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEE-ECC-EEEEEcccCCCCC
Q 001901          281 CMYATASARSDGLLLLCGG-RDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVF-VNA-RLHVSGGALGGGR  357 (998)
Q Consensus       281 r~~~~a~~~~~~~lyvfGG-~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~-~~~-~L~V~GG~~~~~~  357 (998)
                       .........+++-++|.. ..+    ..++|.++.... .++.....+     .+.....+ -++ .|++..+ .+.  
T Consensus       293 -~~~~~~~spDG~~l~f~sd~~g----~~~iy~~dl~~g-~~~~lt~~g-----~~~~~~~~SpDG~~Ia~~~~-~~~--  358 (433)
T PRK04922        293 -IDTEPTWAPDGKSIYFTSDRGG----RPQIYRVAASGG-SAERLTFQG-----NYNARASVSPDGKKIAMVHG-SGG--  358 (433)
T ss_pred             -CccceEECCCCCEEEEEECCCC----CceEEEEECCCC-CeEEeecCC-----CCccCEEECCCCCEEEEEEC-CCC--
Confidence             111223344555444443 221    235777765433 333332221     11222222 244 4444433 211  


Q ss_pred             ccccCCeEEEEECCCCeEEEccc
Q 001901          358 MVEDSSSVAVLDTAAGVWCDTKS  380 (998)
Q Consensus       358 ~~~~~~dv~vyD~~t~~W~~v~~  380 (998)
                          ...++++|+.+.+++.+..
T Consensus       359 ----~~~I~v~d~~~g~~~~Lt~  377 (433)
T PRK04922        359 ----QYRIAVMDLSTGSVRTLTP  377 (433)
T ss_pred             ----ceeEEEEECCCCCeEECCC
Confidence                2369999999998876643


No 184
>COG1768 Predicted phosphohydrolase [General function prediction only]
Probab=68.22  E-value=11  Score=38.47  Aligned_cols=79  Identities=23%  Similarity=0.236  Sum_probs=46.1

Q ss_pred             eEEEecccc--CCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHHHHHHhCCCcchhhhhhhhhhhccc
Q 001901          733 DYLFLGDYV--DRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIECIERMGERDGIWAWHRINRLFNWL  810 (998)
Q Consensus       733 ~~vfLGDyV--DRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f~~L  810 (998)
                      .++.-||+-  -|=+...+=+.+|-+|    |..-++||||||...-..     ..+...+..     .....++.|+.+
T Consensus        46 iVllpGDiSWaM~l~ea~~Dl~~i~~L----PG~K~m~rGNHDYWw~s~-----skl~n~lp~-----~l~~~n~~f~l~  111 (230)
T COG1768          46 IVLLPGDISWAMRLEEAEEDLRFIGDL----PGTKYMIRGNHDYWWSSI-----SKLNNALPP-----ILFYLNNGFELL  111 (230)
T ss_pred             EEEecccchhheechhhhhhhhhhhcC----CCcEEEEecCCccccchH-----HHHHhhcCc-----hHhhhccceeEe
Confidence            466678875  3555566667777665    789999999999854311     112222221     234556777766


Q ss_pred             ceeEEEcCeEEEecCCccCcc
Q 001901          811 PLAALIEKKIICMHGGIGRSI  831 (998)
Q Consensus       811 P~aa~i~~~il~vHgGi~~~~  831 (998)
                      -+| +++     +-|=+++++
T Consensus       112 n~a-I~G-----~RgW~s~~~  126 (230)
T COG1768         112 NYA-IVG-----VRGWDSPSF  126 (230)
T ss_pred             eEE-EEE-----eecccCCCC
Confidence            643 333     445555544


No 185
>PRK09419 bifunctional 2',3'-cyclic nucleotide 2'-phosphodiesterase/3'-nucleotidase precursor protein; Reviewed
Probab=68.17  E-value=7.8  Score=51.83  Aligned_cols=66  Identities=20%  Similarity=0.208  Sum_probs=39.2

Q ss_pred             CeEEEecCCCCHH---HHHHHHHHcCCCCCCCCccceeEEEeccccCCCCCh-----HHHHHHHHHhhhcCCCcEEEeec
Q 001901          699 PIKIFGDLHGQFG---DLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHS-----LETITLLLALKVEYPNNVHLIRG  770 (998)
Q Consensus       699 ~i~vvGDiHG~~~---dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s-----~evl~ll~~lk~~~p~~v~llrG  770 (998)
                      .|+.+.|+||.+.   .+..+++........     .-+|..||+++....+     ..++.+|-.+     .--++..|
T Consensus       662 ~Il~~nD~Hg~l~g~~r~~~~i~~~r~~~~~-----~l~ld~GD~~~gs~~~~~~~g~~~~~~ln~l-----g~d~~~~G  731 (1163)
T PRK09419        662 TILHTNDFHGHLDGAAKRVTKIKEVKEENPN-----TILVDAGDVYQGSLYSNLLKGLPVLKMMKEM-----GYDASTFG  731 (1163)
T ss_pred             EEEEEeecccCCCCHHHHHHHHHHHHhhCCC-----eEEEecCCCCCCcchhhhcCChHHHHHHhCc-----CCCEEEec
Confidence            4788999999864   444445443211111     1234479999977644     2345554444     23356899


Q ss_pred             Cccc
Q 001901          771 NHEA  774 (998)
Q Consensus       771 NHE~  774 (998)
                      |||.
T Consensus       732 NHEf  735 (1163)
T PRK09419        732 NHEF  735 (1163)
T ss_pred             cccc
Confidence            9997


No 186
>PF08321 PPP5:  PPP5 TPR repeat region;  InterPro: IPR013235 This domain is specific to the PPP5 subfamily of serine/threonine phosphatases.; GO: 0004722 protein serine/threonine phosphatase activity, 0046872 metal ion binding; PDB: 3ICF_B 3H60_B 3H63_A 3H66_A 3H62_B 1A17_A 1S95_B 3H69_A 3H68_D 3H64_D ....
Probab=68.04  E-value=11  Score=34.66  Aligned_cols=41  Identities=15%  Similarity=0.258  Sum_probs=31.3

Q ss_pred             hhHHHHHHHHhCCCCCCCCCccccccCHHHHHHHHHHHHHHHhcCCCeeee
Q 001901          646 SVPKKVIAHLLKPRGWKPPVRRQFFLDCNEIADLCDSAERIFSSEPSVLQL  696 (998)
Q Consensus       646 ~~~~~~i~~l~~~~~~~~~~~~~~~~~~~~i~~l~~~~~~~~~~ep~~l~~  696 (998)
                      ++++.+|+.+-+.+          .|....+..|+.++.++|+++|++++|
T Consensus        55 efv~~mie~FK~~K----------~Lhkkyv~~Il~~~~~llk~~PslVeI   95 (95)
T PF08321_consen   55 EFVKAMIEWFKNQK----------KLHKKYVYQILLEAKKLLKQLPSLVEI   95 (95)
T ss_dssp             HHHHHHHHHHHCT--------------HHHHHHHHHHHHHHHHTS-SEEEE
T ss_pred             HHHHHHHHHHHhCC----------CccHHHHHHHHHHHHHHHHhCcCccCC
Confidence            56788888876543          467888999999999999999999985


No 187
>cd00094 HX Hemopexin-like repeats.; Hemopexin is a heme-binding protein that transports heme to the liver. Hemopexin-like repeats occur in vitronectin and some matrix metalloproteinases family (matrixins). The HX repeats of some matrixins bind tissue inhibitor of metalloproteinases (TIMPs). This CD contains 4 instances of the repeat.
Probab=67.36  E-value=1.6e+02  Score=30.57  Aligned_cols=106  Identities=13%  Similarity=0.150  Sum_probs=54.3

Q ss_pred             CEEEEEeCCCCCCCCcccEEEEEcCCCCCceE-EeeecCCCCC--CCcccEEEEEC-CcEEEEEcCCCCCCCcccEEEEE
Q 001901          185 TMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWH-RVVVQGPGPG--PRYGHVMALVG-QRYLMAIGGNDGKRPLADVWALD  260 (998)
Q Consensus       185 ~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~-~l~~~g~~P~--~R~~hs~~~~~-~~~Lyv~GG~~g~~~lndv~~yD  260 (998)
                      +++|+|=|        +.+|+|+..+.....- .+... ..|.  .... ++.... ++++|+|.|       +..|+||
T Consensus        63 ~~~yfFkg--------~~yw~~~~~~~~~~~Pk~i~~~-~~~~~~~~iD-AA~~~~~~~~~yfFkg-------~~y~ry~  125 (194)
T cd00094          63 GKIYFFKG--------DKYWVYTGKNLEPGYPKPISDL-GFPPTVKQID-AALRWPDNGKTYFFKG-------DKYWRYD  125 (194)
T ss_pred             CEEEEECC--------CEEEEEcCcccccCCCcchhhc-CCCCCCCCcc-EEEEEcCCCEEEEEeC-------CEEEEEe
Confidence            68999976        3688888664210111 11110 1121  2222 333343 458999988       5788999


Q ss_pred             CCCCCceEEE-----cccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCC
Q 001901          261 TAAKPYEWRK-----LEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRD  318 (998)
Q Consensus       261 ~~s~~~~W~~-----v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~  318 (998)
                      ..+.  +...     +...-.. .+....++....++++|+|-|        +..|.|+....
T Consensus       126 ~~~~--~v~~~yP~~i~~~w~g-~p~~idaa~~~~~~~~yfF~g--------~~y~~~d~~~~  177 (194)
T cd00094         126 EKTQ--KMDPGYPKLIETDFPG-VPDKVDAAFRWLDGYYYFFKG--------DQYWRFDPRSK  177 (194)
T ss_pred             CCCc--cccCCCCcchhhcCCC-cCCCcceeEEeCCCcEEEEEC--------CEEEEEeCccc
Confidence            8665  2210     1100000 111233444444589999976        35677766543


No 188
>TIGR03074 PQQ_membr_DH membrane-bound PQQ-dependent dehydrogenase, glucose/quinate/shikimate family. This protein family has a phylogenetic distribution very similar to that coenzyme PQQ biosynthesis enzymes, as shown by partial phylogenetic profiling. Members of this family have several predicted transmembrane helices in the N-terminal region, and include the quinoprotein glucose dehydrogenase (EC 1.1.5.2) of Escherichia coli and the quinate/shikimate dehydrogenase of Acinetobacter sp. ADP1 (EC 1.1.99.25). Sequences closely related except for the absense of the N-terminal hydrophobic region, scoring in the gray zone between the trusted and noise cutoffs, include PQQ-dependent glycerol (EC 1.1.99.22) and and other polyol (sugar alcohol) dehydrogenases.
Probab=67.25  E-value=2.9e+02  Score=35.37  Aligned_cols=35  Identities=14%  Similarity=0.225  Sum_probs=25.8

Q ss_pred             eEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEee
Q 001901          178 HVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVV  219 (998)
Q Consensus       178 hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~  219 (998)
                      .+-.++++.||+....       +.++.+|..+....|+.-.
T Consensus       188 ~TPlvvgg~lYv~t~~-------~~V~ALDa~TGk~lW~~d~  222 (764)
T TIGR03074       188 ATPLKVGDTLYLCTPH-------NKVIALDAATGKEKWKFDP  222 (764)
T ss_pred             cCCEEECCEEEEECCC-------CeEEEEECCCCcEEEEEcC
Confidence            4456678999998542       5689999988766788654


No 189
>COG4880 Secreted protein containing C-terminal beta-propeller domain distantly related to WD-40 repeats [General function prediction only]
Probab=67.05  E-value=88  Score=36.30  Aligned_cols=184  Identities=18%  Similarity=0.222  Sum_probs=101.8

Q ss_pred             cCCcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC
Q 001901          148 ATADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP  227 (998)
Q Consensus       148 ~~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~  227 (998)
                      .++++|++|-.-+---++...+  |..|-. ++-.+++.+|+.-=     ..++-+++.|+.+-.    ...+.|.+..|
T Consensus       404 ~~N~vYilDe~lnvvGkltGl~--~gERIY-AvRf~gdv~yiVTf-----rqtDPlfviDlsNPe----nPkvlGeLKIP  471 (603)
T COG4880         404 PVNAVYILDENLNVVGKLTGLA--PGERIY-AVRFVGDVLYIVTF-----RQTDPLFVIDLSNPE----NPKVLGELKIP  471 (603)
T ss_pred             ccceeEEEcCCCcEEEEEeccC--CCceEE-EEEEeCceEEEEEE-----eccCceEEEEcCCCC----CCceeEEEecC
Confidence            7899999998888777776653  566654 55566887777642     235678999998732    23334555555


Q ss_pred             CcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCC-----------ceEEEcccCCCCCCCccceEEEEEeCC-EEE
Q 001901          228 RYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKP-----------YEWRKLEPEGEGPPPCMYATASARSDG-LLL  295 (998)
Q Consensus       228 R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~-----------~~W~~v~~~~~~P~~r~~~~a~~~~~~-~ly  295 (998)
                      -+..-.--++++.++=+|-.+|+-   .+..||+....           --|+.         .-+.|+|...... .|+
T Consensus       472 GfS~YLHpigen~~lGvG~~~g~v---KiSLFdiSdl~~PkEv~~y~l~~~wsp---------vf~dhHAFl~d~~~~if  539 (603)
T COG4880         472 GFSEYLHPIGENRLLGVGAYQGGV---KISLFDISDLAAPKEVSNYTLSNAWSP---------VFYDHHAFLYDPEAEIF  539 (603)
T ss_pred             CchhhccccCCCcEEEeecccCCc---eEEEEeccCCCCchhhhheehhhhcch---------hhhccceeecCCcccEE
Confidence            554444456666666677666543   45556654321           02322         2355666655322 233


Q ss_pred             EEeccCCCCCCcccEEEEecCCCCeEEEEECC-CCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCe
Q 001901          296 LCGGRDASSVPLASAYGLAKHRDGRWEWAIAP-GVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGV  374 (998)
Q Consensus       296 vfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~-g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~  374 (998)
                      ..=       .....+.|....+-  +..... -..+.    --+.++++.+|++||           +.+|+||  .+.
T Consensus       540 FlP-------ay~~gyif~iedg~--kl~k~~e~k~na----~RA~fi~dylY~vg~-----------~ev~~ld--ens  593 (603)
T COG4880         540 FLP-------AYLGGYIFFIEDGS--KLRKRAERKLNA----DRAFFIKDYLYLVGG-----------NEVWKLD--ENS  593 (603)
T ss_pred             Eec-------ccCccEEEEEecCc--eeeehhhhcccc----eeeEEecceEEEecc-----------ceeEEec--cch
Confidence            221       12222333322220  111110 00111    125678999999997           4589887  456


Q ss_pred             EEEcccC
Q 001901          375 WCDTKSV  381 (998)
Q Consensus       375 W~~v~~~  381 (998)
                      |..++..
T Consensus       594 we~Vge~  600 (603)
T COG4880         594 WEVVGEA  600 (603)
T ss_pred             Hhhhhhe
Confidence            7766543


No 190
>KOG0649 consensus WD40 repeat protein [General function prediction only]
Probab=66.97  E-value=1.6e+02  Score=31.87  Aligned_cols=157  Identities=22%  Similarity=0.332  Sum_probs=83.1

Q ss_pred             CCcEEEecCCC--CCCCCccceEEEEe--CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEE
Q 001901          159 TNKWSRITPFG--EPPTPRAAHVATAV--GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMA  234 (998)
Q Consensus       159 t~~W~~l~~~g--~~P~pR~~hsa~~~--~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~  234 (998)
                      ...|+...++-  ..+.|-.. ++-+.  .|.|+..||.       ..+|..|+++.+  .++.- .|   ..-|-|+++
T Consensus        98 K~lwe~~~P~~~~~~evPeIN-am~ldP~enSi~~AgGD-------~~~y~~dlE~G~--i~r~~-rG---HtDYvH~vv  163 (325)
T KOG0649|consen   98 KRLWEVKIPMQVDAVEVPEIN-AMWLDPSENSILFAGGD-------GVIYQVDLEDGR--IQREY-RG---HTDYVHSVV  163 (325)
T ss_pred             hhhhhhcCccccCcccCCccc-eeEeccCCCcEEEecCC-------eEEEEEEecCCE--EEEEE-cC---Ccceeeeee
Confidence            34577766652  22333322 33333  5688888884       468999999863  44332 22   345677777


Q ss_pred             EECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEc-ccCCCCCCCcc--ce--EEEEEeCCEEEEEeccCCCCCCccc
Q 001901          235 LVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKL-EPEGEGPPPCM--YA--TASARSDGLLLLCGGRDASSVPLAS  309 (998)
Q Consensus       235 ~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v-~~~~~~P~~r~--~~--~a~~~~~~~lyvfGG~~~~~~~~~d  309 (998)
                      .-+..-=++-|+.||     .+-.+|+++.  +-.++ .+... |.--|  ..  .+++..+..-+++||.     +...
T Consensus       164 ~R~~~~qilsG~EDG-----tvRvWd~kt~--k~v~~ie~yk~-~~~lRp~~g~wigala~~edWlvCGgG-----p~ls  230 (325)
T KOG0649|consen  164 GRNANGQILSGAEDG-----TVRVWDTKTQ--KHVSMIEPYKN-PNLLRPDWGKWIGALAVNEDWLVCGGG-----PKLS  230 (325)
T ss_pred             ecccCcceeecCCCc-----cEEEEecccc--ceeEEeccccC-hhhcCcccCceeEEEeccCceEEecCC-----Ccee
Confidence            644434566677776     4567788777  54443 33222 11111  11  2344445666677764     2344


Q ss_pred             EEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEc
Q 001901          310 AYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSG  350 (998)
Q Consensus       310 v~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~G  350 (998)
                      +|.+.....   +  .   ..|.|-..|-+.++++.+++.|
T Consensus       231 lwhLrsse~---t--~---vfpipa~v~~v~F~~d~vl~~G  263 (325)
T KOG0649|consen  231 LWHLRSSES---T--C---VFPIPARVHLVDFVDDCVLIGG  263 (325)
T ss_pred             EEeccCCCc---e--E---EEecccceeEeeeecceEEEec
Confidence            565543322   1  1   1134444455666666666655


No 191
>TIGR03866 PQQ_ABC_repeats PQQ-dependent catabolism-associated beta-propeller protein. Members of this protein family consist of seven repeats each of the YVTN family beta-propeller repeat (see TIGR02276). Members occur invariably as part of a transport operon that is associated with PQQ-dependent catabolism of alcohols such as phenylethanol.
Probab=65.92  E-value=1.9e+02  Score=30.98  Aligned_cols=93  Identities=16%  Similarity=0.197  Sum_probs=47.5

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccceEEEEe--CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAV--GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP  227 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~--~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~  227 (998)
                      +.+++||+.+.+....-..+  ..+   +..+..  ++.+|+.++.      ...+++||+.+.. ....+      +..
T Consensus        53 ~~v~~~d~~~~~~~~~~~~~--~~~---~~~~~~~~g~~l~~~~~~------~~~l~~~d~~~~~-~~~~~------~~~  114 (300)
T TIGR03866        53 DTIQVIDLATGEVIGTLPSG--PDP---ELFALHPNGKILYIANED------DNLVTVIDIETRK-VLAEI------PVG  114 (300)
T ss_pred             CeEEEEECCCCcEEEeccCC--CCc---cEEEECCCCCEEEEEcCC------CCeEEEEECCCCe-EEeEe------eCC
Confidence            36888999887765432221  122   122332  3366666542      2468999998742 11112      111


Q ss_pred             CcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          228 RYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       228 R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                      ..-++++...++.+++++..++    +.+..||..+.
T Consensus       115 ~~~~~~~~~~dg~~l~~~~~~~----~~~~~~d~~~~  147 (300)
T TIGR03866       115 VEPEGMAVSPDGKIVVNTSETT----NMAHFIDTKTY  147 (300)
T ss_pred             CCcceEEECCCCCEEEEEecCC----CeEEEEeCCCC
Confidence            1223444444445666665432    24566788665


No 192
>TIGR02800 propeller_TolB tol-pal system beta propeller repeat protein TolB. The Tol-PAL system is required for bacterial outer membrane integrity. E. coli TolB is involved in the tonB-independent uptake of group A colicins (colicins A, E1, E2, E3 and K), and is necessary for the colicins to reach their respective targets after initial binding to the bacteria. It is also involved in uptake of filamentous DNA. Study of its structure suggest that the TolB protein might be involved in the recycling of peptidoglycan or in its covalent linking with lipoproteins. The Tol-Pal system is also implicated in pathogenesis of E. coli, Haemophilus ducreyi, Salmonella enterica and Vibrio cholerae, but the mechanism(s) is unclear.
Probab=65.45  E-value=2.6e+02  Score=32.33  Aligned_cols=141  Identities=17%  Similarity=0.218  Sum_probs=72.0

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCc
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRY  229 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~  229 (998)
                      ..++++|+.+.....+...   +......+...-++.|++.....    -..++|++|+.+..  ...+....   ..  
T Consensus       214 ~~i~v~d~~~g~~~~~~~~---~~~~~~~~~spDg~~l~~~~~~~----~~~~i~~~d~~~~~--~~~l~~~~---~~--  279 (417)
T TIGR02800       214 PEIYVQDLATGQREKVASF---PGMNGAPAFSPDGSKLAVSLSKD----GNPDIYVMDLDGKQ--LTRLTNGP---GI--  279 (417)
T ss_pred             cEEEEEECCCCCEEEeecC---CCCccceEECCCCCEEEEEECCC----CCccEEEEECCCCC--EEECCCCC---CC--
Confidence            5799999998877766543   11111111111133565544321    12579999998752  55554211   11  


Q ss_pred             ccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcc
Q 001901          230 GHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLA  308 (998)
Q Consensus       230 ~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~  308 (998)
                      ....... .+++|++.....+   ...+|.+|+.+.  .+..+.....     .........+++.+++.....   ...
T Consensus       280 ~~~~~~s~dg~~l~~~s~~~g---~~~iy~~d~~~~--~~~~l~~~~~-----~~~~~~~spdg~~i~~~~~~~---~~~  346 (417)
T TIGR02800       280 DTEPSWSPDGKSIAFTSDRGG---SPQIYMMDADGG--EVRRLTFRGG-----YNASPSWSPDGDLIAFVHREG---GGF  346 (417)
T ss_pred             CCCEEECCCCCEEEEEECCCC---CceEEEEECCCC--CEEEeecCCC-----CccCeEECCCCCEEEEEEccC---Cce
Confidence            1111122 3334544433332   247999999887  7776654322     222233344666666665443   124


Q ss_pred             cEEEEecCC
Q 001901          309 SAYGLAKHR  317 (998)
Q Consensus       309 dv~~~~~~~  317 (998)
                      .++.++...
T Consensus       347 ~i~~~d~~~  355 (417)
T TIGR02800       347 NIAVMDLDG  355 (417)
T ss_pred             EEEEEeCCC
Confidence            567776654


No 193
>cd07409 MPP_CD73_N CD73 ecto-5'-nucleotidase and related proteins, N-terminal metallophosphatase domain. CD73 is a mammalian ecto-5'-nucleotidase expressed in endothelial cells and lymphocytes that catalyzes the conversion of 5'-AMP to adenosine in the final step of a pathway that generates adenosine from ATP.  This pathway also includes a CD39 nucleoside triphosphate dephosphorylase that mediates the dephosphorylation of ATP to ADP and then to 5'-AMP.  These enzymes all have an N-terminal metallophosphatase domain and a C-terminal 5'nucleotidase domain.  The N-terminal metallophosphatase domain belongs to a large superfamily of distantly related metallophosphatases (MPPs) that includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  MPPs are functionally diverse, but all share a conserved domain with an active si
Probab=65.06  E-value=14  Score=41.11  Aligned_cols=66  Identities=21%  Similarity=0.254  Sum_probs=36.1

Q ss_pred             CeEEEecCCCCH---------------------HHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCCh-----HHHHH
Q 001901          699 PIKIFGDLHGQF---------------------GDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHS-----LETIT  752 (998)
Q Consensus       699 ~i~vvGDiHG~~---------------------~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s-----~evl~  752 (998)
                      .|+-+.|+||++                     ..+..+++.......     ..-+|..||+++..+.+     ..++.
T Consensus         2 ~il~tnD~Hg~l~~~~~~~~~~~~~~~~~~gG~ar~~~~v~~~r~~~~-----~~l~ld~GD~~~gs~~~~~~~g~~~~~   76 (281)
T cd07409           2 TILHTNDHHSRFEETNPSGGVKDAATEKCYGGFARVATLVKELRAENP-----NVLFLNAGDAFQGTLWYTLYKGNADAE   76 (281)
T ss_pred             EEEEeccccccccccCccccccccccccccCCHHHHHHHHHHHHhcCC-----CEEEEeCCCCCCCcchhhhcCChHHHH
Confidence            367789999875                     334445555432111     11355589999876532     23333


Q ss_pred             HHHHhhhcCCCcEEEeecCccc
Q 001901          753 LLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       753 ll~~lk~~~p~~v~llrGNHE~  774 (998)
                      .|-.+.    -.+ +..||||.
T Consensus        77 ~ln~~g----~D~-~~lGNHef   93 (281)
T cd07409          77 FMNLLG----YDA-MTLGNHEF   93 (281)
T ss_pred             HHHhcC----CCE-EEeccccc
Confidence            333332    133 44599997


No 194
>PF08268 FBA_3:  F-box associated domain;  InterPro: IPR013187 This domain occurs in a diverse superfamily of genes in plants. Most examples are found C-terminal to an F-box (IPR001810 from INTERPRO), a 60 amino acid motif involved in ubiquitination of target proteins to mark them for degradation. Two-hybid experiments support the idea that most members are interchangeable F-box subunits of SCF E3 complexes []. Some members have two copies of this domain.
Probab=64.57  E-value=62  Score=31.15  Aligned_cols=83  Identities=13%  Similarity=0.131  Sum_probs=53.4

Q ss_pred             EEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCC
Q 001901          240 YLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDG  319 (998)
Q Consensus       240 ~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~  319 (998)
                      .+|...-. .....+.+.+||+.+.  +|+.+... ..+.........+..+|+|-++.-........-++|.+.+....
T Consensus         7 vly~~a~~-~~~~~~~IvsFDv~~E--~f~~i~~P-~~~~~~~~~~~L~~~~G~L~~v~~~~~~~~~~~~iWvLeD~~k~   82 (129)
T PF08268_consen    7 VLYWLAWS-EDSDNNVIVSFDVRSE--KFRFIKLP-EDPYSSDCSSTLIEYKGKLALVSYNDQGEPDSIDIWVLEDYEKQ   82 (129)
T ss_pred             EEEeEEEE-CCCCCcEEEEEEcCCc--eEEEEEee-eeeccccCccEEEEeCCeEEEEEecCCCCcceEEEEEeeccccc
Confidence            56665544 3334578999999999  88777543 11222344455566788888875543332345789999888778


Q ss_pred             eEEEEEC
Q 001901          320 RWEWAIA  326 (998)
Q Consensus       320 ~W~w~~~  326 (998)
                      .|.....
T Consensus        83 ~Wsk~~~   89 (129)
T PF08268_consen   83 EWSKKHI   89 (129)
T ss_pred             eEEEEEE
Confidence            8885544


No 195
>PF06433 Me-amine-dh_H:  Methylamine dehydrogenase heavy chain (MADH);  InterPro: IPR009451 Methylamine dehydrogenase (1.4.99.3 from EC) is a periplasmic quinoprotein found in several methyltrophic bacteria []. It is induced when grown on methylamine as a carbon source MADH and catalyses the oxidative deamination of amines to their corresponding aldehydes. The redox cofactor of this enzyme is tryptophan tryptophylquinone (TTQ). Electrons derived from the oxidation of methylamine are passed to an electron acceptor, which is usually the blue-copper protein amicyanin (IPR002386 from INTERPRO).  RCH2NH2 + H2O + acceptor = RCHO + NH3 + reduced acceptor  MADH is a hetero-tetramer, comprised of two heavy subunits and two light subunits. The heavy subunit forms a seven-bladed beta-propeller like structure [].; GO: 0030058 amine dehydrogenase activity, 0030416 methylamine metabolic process, 0055114 oxidation-reduction process, 0042597 periplasmic space; PDB: 3RN1_F 3SVW_F 3PXT_F 3L4O_F 3L4M_D 3SJL_F 3PXS_D 3ORV_F 3RMZ_F 3RLM_F ....
Probab=62.13  E-value=1.2e+02  Score=34.52  Aligned_cols=103  Identities=21%  Similarity=0.252  Sum_probs=60.1

Q ss_pred             cCCcEEEEECCCCcEEEecCCCCCCCCccceEEEEeC-CEEEEEeCC---CCCCCCcccEEEEEcCCCCCceEEeeecCC
Q 001901          148 ATADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVG-TMVVIQGGI---GPAGLSAEDLHVLDLTQQRPRWHRVVVQGP  223 (998)
Q Consensus       148 ~~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~-~~lyVfGG~---~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~  223 (998)
                      .+..+++||..+++-.-.-     +..-.++.+..-+ ..+|+..=+   ...+..++-+.+||..+..+++...-    
T Consensus        15 ~~~rv~viD~d~~k~lGmi-----~~g~~~~~~~spdgk~~y~a~T~~sR~~rG~RtDvv~~~D~~TL~~~~EI~i----   85 (342)
T PF06433_consen   15 MTSRVYVIDADSGKLLGMI-----DTGFLGNVALSPDGKTIYVAETFYSRGTRGERTDVVEIWDTQTLSPTGEIEI----   85 (342)
T ss_dssp             SSEEEEEEETTTTEEEEEE-----EEESSEEEEE-TTSSEEEEEEEEEEETTEEEEEEEEEEEETTTTEEEEEEEE----
T ss_pred             ccceEEEEECCCCcEEEEe-----ecccCCceeECCCCCEEEEEEEEEeccccccceeEEEEEecCcCcccceEec----
Confidence            3468999999988754332     3334455443333 367765532   23345677888999999766676544    


Q ss_pred             CCC-CCcc-----cEEE-EECCcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          224 GPG-PRYG-----HVMA-LVGQRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       224 ~P~-~R~~-----hs~~-~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                       |. +|..     +... .-+++++||+-    -.....|-+.|+...
T Consensus        86 -P~k~R~~~~~~~~~~~ls~dgk~~~V~N----~TPa~SVtVVDl~~~  128 (342)
T PF06433_consen   86 -PPKPRAQVVPYKNMFALSADGKFLYVQN----FTPATSVTVVDLAAK  128 (342)
T ss_dssp             -TTS-B--BS--GGGEEE-TTSSEEEEEE----ESSSEEEEEEETTTT
T ss_pred             -CCcchheecccccceEEccCCcEEEEEc----cCCCCeEEEEECCCC
Confidence             32 2442     2222 23555777753    234568888999888


No 196
>KOG2863 consensus RNA lariat debranching enzyme [RNA processing and modification]
Probab=61.63  E-value=12  Score=42.03  Aligned_cols=74  Identities=23%  Similarity=0.384  Sum_probs=46.0

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHc---CCCCCCCCccceeEEEeccccC-CCCC---hHHH---------HHHHHHhhhcC
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEY---GSPSTAGDIAYIDYLFLGDYVD-RGQH---SLET---------ITLLLALKVEY  761 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~---g~~~~~~~~~~~~~vfLGDyVD-RG~~---s~ev---------l~ll~~lk~~~  761 (998)
                      ++|.|-|=-||+++.+-+-+..+   |-.+.+      -+|++||+=- |...   ++.|         ..--+.=.+..
T Consensus         1 MrIaVqGCcHG~Ld~iYkti~~~ek~~~tkVD------LLlccGDFQavRn~~D~~siavPpKy~~m~~F~~YYsge~~A   74 (456)
T KOG2863|consen    1 MRIAVQGCCHGELDNIYKTISLIEKRGNTKVD------LLLCCGDFQAVRNEQDLKSIAVPPKYRRMGDFYKYYSGEIKA   74 (456)
T ss_pred             CceeeecccchhHHHHHHHHHHHHHcCCCCcc------EEEEccchHhhcchhhcccccCCHHHHHHHHHHHHhCCcccC
Confidence            36889999999999998655443   322332      6888999863 3322   2222         11112222455


Q ss_pred             CCcEEEeecCccccch
Q 001901          762 PNNVHLIRGNHEAADI  777 (998)
Q Consensus       762 p~~v~llrGNHE~~~~  777 (998)
                      |=--++|=||||.++.
T Consensus        75 PVlTIFIGGNHEAsny   90 (456)
T KOG2863|consen   75 PVLTIFIGGNHEASNY   90 (456)
T ss_pred             ceeEEEecCchHHHHH
Confidence            6667889999999753


No 197
>PRK01742 tolB translocation protein TolB; Provisional
Probab=60.73  E-value=3.4e+02  Score=31.98  Aligned_cols=140  Identities=17%  Similarity=0.153  Sum_probs=65.6

Q ss_pred             ccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCc-EEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCC
Q 001901          201 EDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQR-YLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPP  279 (998)
Q Consensus       201 ~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~-~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~  279 (998)
                      ..+|++|+.+..  -..+.   ..+.  .......-.++ +|++....++.   .++|.+|+.+.  ....+.....   
T Consensus       228 ~~i~i~dl~tg~--~~~l~---~~~g--~~~~~~wSPDG~~La~~~~~~g~---~~Iy~~d~~~~--~~~~lt~~~~---  292 (429)
T PRK01742        228 SQLVVHDLRSGA--RKVVA---SFRG--HNGAPAFSPDGSRLAFASSKDGV---LNIYVMGANGG--TPSQLTSGAG---  292 (429)
T ss_pred             cEEEEEeCCCCc--eEEEe---cCCC--ccCceeECCCCCEEEEEEecCCc---EEEEEEECCCC--CeEeeccCCC---
Confidence            469999997752  33343   2221  11122232333 44443333332   36999999877  6666543211   


Q ss_pred             CccceEEEEEeCCEEEEEec-cCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCc
Q 001901          280 PCMYATASARSDGLLLLCGG-RDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRM  358 (998)
Q Consensus       280 ~r~~~~a~~~~~~~lyvfGG-~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~  358 (998)
                        .........+++.++|.. .++    ...+|.++.... .-...  ..   . .+. ....-+++.+++.+.      
T Consensus       293 --~~~~~~wSpDG~~i~f~s~~~g----~~~I~~~~~~~~-~~~~l--~~---~-~~~-~~~SpDG~~ia~~~~------  352 (429)
T PRK01742        293 --NNTEPSWSPDGQSILFTSDRSG----SPQVYRMSASGG-GASLV--GG---R-GYS-AQISADGKTLVMING------  352 (429)
T ss_pred             --CcCCEEECCCCCEEEEEECCCC----CceEEEEECCCC-CeEEe--cC---C-CCC-ccCCCCCCEEEEEcC------
Confidence              122233344555444433 222    236666655433 11111  11   1 111 112224444444332      


Q ss_pred             cccCCeEEEEECCCCeEEEcc
Q 001901          359 VEDSSSVAVLDTAAGVWCDTK  379 (998)
Q Consensus       359 ~~~~~dv~vyD~~t~~W~~v~  379 (998)
                          +.++.+|+.+.+|..+.
T Consensus       353 ----~~i~~~Dl~~g~~~~lt  369 (429)
T PRK01742        353 ----DNVVKQDLTSGSTEVLS  369 (429)
T ss_pred             ----CCEEEEECCCCCeEEec
Confidence                23778999999887654


No 198
>PRK00178 tolB translocation protein TolB; Provisional
Probab=60.59  E-value=3.3e+02  Score=31.86  Aligned_cols=148  Identities=16%  Similarity=0.167  Sum_probs=71.0

Q ss_pred             ccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCC
Q 001901          201 EDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPP  279 (998)
Q Consensus       201 ~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~  279 (998)
                      ..+|++|+.+..  -..+.   ..+.  ........ ++++|++....++.   .++|++|+.+.  .++.+.....   
T Consensus       223 ~~l~~~~l~~g~--~~~l~---~~~g--~~~~~~~SpDG~~la~~~~~~g~---~~Iy~~d~~~~--~~~~lt~~~~---  287 (430)
T PRK00178        223 PRIFVQNLDTGR--REQIT---NFEG--LNGAPAWSPDGSKLAFVLSKDGN---PEIYVMDLASR--QLSRVTNHPA---  287 (430)
T ss_pred             CEEEEEECCCCC--EEEcc---CCCC--CcCCeEECCCCCEEEEEEccCCC---ceEEEEECCCC--CeEEcccCCC---
Confidence            479999998763  44443   1111  11122222 22245443322222   58999999988  7777654221   


Q ss_pred             CccceEEEEEeCCE-EEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCc
Q 001901          280 PCMYATASARSDGL-LLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRM  358 (998)
Q Consensus       280 ~r~~~~a~~~~~~~-lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~  358 (998)
                        .........+++ |++.....+    ...+|.++.... .+......+    .........-+++.+++.....+   
T Consensus       288 --~~~~~~~spDg~~i~f~s~~~g----~~~iy~~d~~~g-~~~~lt~~~----~~~~~~~~Spdg~~i~~~~~~~~---  353 (430)
T PRK00178        288 --IDTEPFWGKDGRTLYFTSDRGG----KPQIYKVNVNGG-RAERVTFVG----NYNARPRLSADGKTLVMVHRQDG---  353 (430)
T ss_pred             --CcCCeEECCCCCEEEEEECCCC----CceEEEEECCCC-CEEEeecCC----CCccceEECCCCCEEEEEEccCC---
Confidence              111222333444 444432221    236777765433 343332211    11111122224443444332221   


Q ss_pred             cccCCeEEEEECCCCeEEEccc
Q 001901          359 VEDSSSVAVLDTAAGVWCDTKS  380 (998)
Q Consensus       359 ~~~~~dv~vyD~~t~~W~~v~~  380 (998)
                         ...++++|+.+.+++.+..
T Consensus       354 ---~~~l~~~dl~tg~~~~lt~  372 (430)
T PRK00178        354 ---NFHVAAQDLQRGSVRILTD  372 (430)
T ss_pred             ---ceEEEEEECCCCCEEEccC
Confidence               2359999999998877654


No 199
>PRK05137 tolB translocation protein TolB; Provisional
Probab=60.36  E-value=3.4e+02  Score=31.94  Aligned_cols=195  Identities=15%  Similarity=0.124  Sum_probs=91.8

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCc
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRY  229 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~  229 (998)
                      ..+|++|+.+.+.+.+...   +..-...+..-.+.+|++....+  +  ..++|++|+.+..  ..++.   ..+.  .
T Consensus       226 ~~i~~~dl~~g~~~~l~~~---~g~~~~~~~SPDG~~la~~~~~~--g--~~~Iy~~d~~~~~--~~~Lt---~~~~--~  291 (435)
T PRK05137        226 PRVYLLDLETGQRELVGNF---PGMTFAPRFSPDGRKVVMSLSQG--G--NTDIYTMDLRSGT--TTRLT---DSPA--I  291 (435)
T ss_pred             CEEEEEECCCCcEEEeecC---CCcccCcEECCCCCEEEEEEecC--C--CceEEEEECCCCc--eEEcc---CCCC--c
Confidence            5899999999988877643   21111111111233555443321  1  2579999998753  44443   1111  1


Q ss_pred             ccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcc
Q 001901          230 GHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLA  308 (998)
Q Consensus       230 ~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~  308 (998)
                      ......- .+++|++.....+   ...+|.+|+.+.  ..+.+....     ..........+++.+++......   ..
T Consensus       292 ~~~~~~spDG~~i~f~s~~~g---~~~Iy~~d~~g~--~~~~lt~~~-----~~~~~~~~SpdG~~ia~~~~~~~---~~  358 (435)
T PRK05137        292 DTSPSYSPDGSQIVFESDRSG---SPQLYVMNADGS--NPRRISFGG-----GRYSTPVWSPRGDLIAFTKQGGG---QF  358 (435)
T ss_pred             cCceeEcCCCCEEEEEECCCC---CCeEEEEECCCC--CeEEeecCC-----CcccCeEECCCCCEEEEEEcCCC---ce
Confidence            1112222 2324443332222   257999998877  566654321     11222233345554444433221   23


Q ss_pred             cEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEccc
Q 001901          309 SAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKS  380 (998)
Q Consensus       309 dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~  380 (998)
                      .++.++.... ...... .+    .....-...-+++++++-.......   ....+|++|+....-+.+..
T Consensus       359 ~i~~~d~~~~-~~~~lt-~~----~~~~~p~~spDG~~i~~~~~~~~~~---~~~~L~~~dl~g~~~~~l~~  421 (435)
T PRK05137        359 SIGVMKPDGS-GERILT-SG----FLVEGPTWAPNGRVIMFFRQTPGSG---GAPKLYTVDLTGRNEREVPT  421 (435)
T ss_pred             EEEEEECCCC-ceEecc-CC----CCCCCCeECCCCCEEEEEEccCCCC---CcceEEEEECCCCceEEccC
Confidence            5666665332 222211 11    1111112222555555543322110   02469999998887776653


No 200
>COG1520 FOG: WD40-like repeat [Function unknown]
Probab=60.04  E-value=3.2e+02  Score=31.42  Aligned_cols=156  Identities=18%  Similarity=0.172  Sum_probs=77.1

Q ss_pred             cCCcEEEEECCCC--cEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCC
Q 001901          148 ATADVHCYDVLTN--KWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGP  225 (998)
Q Consensus       148 ~~~dv~~yD~~t~--~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P  225 (998)
                      ..+.++.+|..+.  .|+.-...+  ...+..-+.+...+.+|+ |..+   . ...++.+|..+.+.+|..-..   .+
T Consensus       161 ~~g~~~al~~~tG~~~W~~~~~~~--~~~~~~~~~~~~~~~vy~-~~~~---~-~~~~~a~~~~~G~~~w~~~~~---~~  230 (370)
T COG1520         161 DDGHLYALNADTGTLKWTYETPAP--LSLSIYGSPAIASGTVYV-GSDG---Y-DGILYALNAEDGTLKWSQKVS---QT  230 (370)
T ss_pred             CCCeEEEEEccCCcEEEEEecCCc--cccccccCceeecceEEE-ecCC---C-cceEEEEEccCCcEeeeeeee---cc
Confidence            3578888888855  587443321  112222222233444444 4332   1 236999999887778985321   11


Q ss_pred             CCCccc-EEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCC
Q 001901          226 GPRYGH-VMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASS  304 (998)
Q Consensus       226 ~~R~~h-s~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~  304 (998)
                      ..+..- ....+....+|+-|+.-.......+.++|..+.+..|+.-..... ...+.........+|++|+........
T Consensus       231 ~~~~~~~~~~~~~~~~v~v~~~~~~~~~~g~~~~l~~~~G~~~W~~~~~~~~-~~~~~~~~~~~~~dG~v~~~~~~~~~~  309 (370)
T COG1520         231 IGRTAISTTPAVDGGPVYVDGGVYAGSYGGKLLCLDADTGELIWSFPAGGSV-QGSGLYTTPVAGADGKVYIGFTDNDGR  309 (370)
T ss_pred             cCcccccccccccCceEEECCcEEEEecCCeEEEEEcCCCceEEEEecccEe-ccCCeeEEeecCCCccEEEEEeccccc
Confidence            111110 111222224444444211111234899999988889988764111 111222222333578888765433221


Q ss_pred             CCcccEEEEec
Q 001901          305 VPLASAYGLAK  315 (998)
Q Consensus       305 ~~~~dv~~~~~  315 (998)
                       .....+.++.
T Consensus       310 -~~~~~~~~~~  319 (370)
T COG1520         310 -GSGSLYALAD  319 (370)
T ss_pred             -cccceEEEec
Confidence             3455666665


No 201
>PF04042 DNA_pol_E_B:  DNA polymerase alpha/epsilon subunit B;  InterPro: IPR007185 DNA polymerase epsilon is essential for cell viability and chromosomal DNA replication in budding yeast. In addition, DNA polymerase epsilon may be involved in DNA repair and cell-cycle checkpoint control. The enzyme consists of at least four subunits in mammalian cells as well as in yeast. The largest subunit of DNA polymerase epsilon is responsible for polymerase activity. In mouse, the DNA polymerase epsilon subunit B is the second largest subunit of the DNA polymerase. A part of the N-terminal was found to be responsible for the interaction with SAP18. Experimental evidence suggests that this subunit may recruit histone deacetylase to the replication fork to modify the chromatin structure [].; GO: 0003677 DNA binding, 0003887 DNA-directed DNA polymerase activity, 0006260 DNA replication; PDB: 3E0J_C 3FLO_G.
Probab=57.93  E-value=16  Score=38.47  Aligned_cols=72  Identities=13%  Similarity=0.191  Sum_probs=36.8

Q ss_pred             eEEEecCCCC-----HHHHHHHHHHcC-CCCCCCCccceeEEEeccccCCCCChH-------------HHHHHHHHhhhc
Q 001901          700 IKIFGDLHGQ-----FGDLMRLFDEYG-SPSTAGDIAYIDYLFLGDYVDRGQHSL-------------ETITLLLALKVE  760 (998)
Q Consensus       700 i~vvGDiHG~-----~~dL~~il~~~g-~~~~~~~~~~~~~vfLGDyVDRG~~s~-------------evl~ll~~lk~~  760 (998)
                      |+|++|+|=.     ++.|.++|..+. .....      .+|++|+++|.-....             +-+..+..+...
T Consensus         1 Iv~~Sg~~~~~~~~~~~~L~~~l~~~~~~~~p~------~lIl~G~fi~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~   74 (209)
T PF04042_consen    1 IVFASGPFLDSDNLSLEPLRDLLSGVEDASKPD------VLILMGPFIDSPHPYISSGSVPDSYSFEEDFLKELDSFLES   74 (209)
T ss_dssp             EEEEES--CTTT-HHHHHHHHHHHCCCHCTTEC------EEEEES-SCBTTSHHHHHT---HHCCHHHHHHHHCHHHHCC
T ss_pred             CEEEecCccCCCHhHHHHHHHHHHhccccCCCc------EEEEeCCCcCccccccccccccccccccHHHHHHHHHHHhh
Confidence            5677787755     556666676554 22112      7999999999633221             111112111111


Q ss_pred             CC--CcEEEeecCccccch
Q 001901          761 YP--NNVHLIRGNHEAADI  777 (998)
Q Consensus       761 ~p--~~v~llrGNHE~~~~  777 (998)
                      ..  -+|+++.|+||....
T Consensus        75 i~~~~~vvlvPg~~D~~~~   93 (209)
T PF04042_consen   75 ILPSTQVVLVPGPNDPTSS   93 (209)
T ss_dssp             CHCCSEEEEE--TTCTT-S
T ss_pred             cccccEEEEeCCCcccccc
Confidence            11  389999999998655


No 202
>TIGR03866 PQQ_ABC_repeats PQQ-dependent catabolism-associated beta-propeller protein. Members of this protein family consist of seven repeats each of the YVTN family beta-propeller repeat (see TIGR02276). Members occur invariably as part of a transport operon that is associated with PQQ-dependent catabolism of alcohols such as phenylethanol.
Probab=56.87  E-value=2.8e+02  Score=29.76  Aligned_cols=92  Identities=23%  Similarity=0.358  Sum_probs=47.6

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccceEEEEe--CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAV--GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP  227 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~--~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~  227 (998)
                      +.+++||+.+++-...-..+  ..++   +++..  +..+|+.++.      .+.+++||+.+..  .......+  ..+
T Consensus        11 ~~v~~~d~~t~~~~~~~~~~--~~~~---~l~~~~dg~~l~~~~~~------~~~v~~~d~~~~~--~~~~~~~~--~~~   75 (300)
T TIGR03866        11 NTISVIDTATLEVTRTFPVG--QRPR---GITLSKDGKLLYVCASD------SDTIQVIDLATGE--VIGTLPSG--PDP   75 (300)
T ss_pred             CEEEEEECCCCceEEEEECC--CCCC---ceEECCCCCEEEEEECC------CCeEEEEECCCCc--EEEeccCC--CCc
Confidence            47888998877643332221  1122   23332  2367777653      2568899988753  33211111  111


Q ss_pred             CcccEEEEEC-CcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          228 RYGHVMALVG-QRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       228 R~~hs~~~~~-~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                         ..++... ++.+|+.++.+     ..+..||+.+.
T Consensus        76 ---~~~~~~~~g~~l~~~~~~~-----~~l~~~d~~~~  105 (300)
T TIGR03866        76 ---ELFALHPNGKILYIANEDD-----NLVTVIDIETR  105 (300)
T ss_pred             ---cEEEECCCCCEEEEEcCCC-----CeEEEEECCCC
Confidence               2233333 33566665433     36888999876


No 203
>PF08268 FBA_3:  F-box associated domain;  InterPro: IPR013187 This domain occurs in a diverse superfamily of genes in plants. Most examples are found C-terminal to an F-box (IPR001810 from INTERPRO), a 60 amino acid motif involved in ubiquitination of target proteins to mark them for degradation. Two-hybid experiments support the idea that most members are interchangeable F-box subunits of SCF E3 complexes []. Some members have two copies of this domain.
Probab=56.63  E-value=1e+02  Score=29.64  Aligned_cols=86  Identities=14%  Similarity=0.149  Sum_probs=55.7

Q ss_pred             EeCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEE
Q 001901          289 RSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVL  368 (998)
Q Consensus       289 ~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vy  368 (998)
                      ..+|.+|-..-.  ......-+..||..+. +|+....+............+.++|+|-++.-.....   ...-++|++
T Consensus         3 cinGvly~~a~~--~~~~~~~IvsFDv~~E-~f~~i~~P~~~~~~~~~~~L~~~~G~L~~v~~~~~~~---~~~~~iWvL   76 (129)
T PF08268_consen    3 CINGVLYWLAWS--EDSDNNVIVSFDVRSE-KFRFIKLPEDPYSSDCSSTLIEYKGKLALVSYNDQGE---PDSIDIWVL   76 (129)
T ss_pred             EECcEEEeEEEE--CCCCCcEEEEEEcCCc-eEEEEEeeeeeccccCccEEEEeCCeEEEEEecCCCC---cceEEEEEe
Confidence            347777776554  1223456777777754 7877777622335567777888899988875443221   124689999


Q ss_pred             -ECCCCeEEEccc
Q 001901          369 -DTAAGVWCDTKS  380 (998)
Q Consensus       369 -D~~t~~W~~v~~  380 (998)
                       |..+.+|.+...
T Consensus        77 eD~~k~~Wsk~~~   89 (129)
T PF08268_consen   77 EDYEKQEWSKKHI   89 (129)
T ss_pred             eccccceEEEEEE
Confidence             567789997754


No 204
>TIGR00282 metallophosphoesterase, MG_246/BB_0505 family. A member of this family from Mycoplasma Pneumoniae has been crystallized and described as a novel phosphatase.
Probab=55.23  E-value=24  Score=38.82  Aligned_cols=68  Identities=21%  Similarity=0.189  Sum_probs=46.4

Q ss_pred             CCeEEEecCCCC--HHHHHHHHHHcCCCCCCCCccceeEEEeccccCCC-CChHHHHHHHHHhhhcCCCcEEEeecCccc
Q 001901          698 APIKIFGDLHGQ--FGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRG-QHSLETITLLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       698 ~~i~vvGDiHG~--~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG-~~s~evl~ll~~lk~~~p~~v~llrGNHE~  774 (998)
                      ++|.++|||=|.  ...|...|..+......+     -+|..||...-| --+-+++..|+.+-+    .++.+ |||+.
T Consensus         1 m~ilfiGDi~G~~Gr~~l~~~L~~lk~~~~~D-----~vIaNgEn~~gG~Gi~~~~~~~L~~~Gv----DviT~-GNH~~   70 (266)
T TIGR00282         1 IKFLFIGDVYGKAGRKIVKNNLPQLKSKYQAD-----LVIANGENTTHGKGLTLKIYEFLKQSGV----NYITM-GNHTW   70 (266)
T ss_pred             CeEEEEEecCCHHHHHHHHHHHHHHHHhCCCC-----EEEEcCcccCCCCCCCHHHHHHHHhcCC----CEEEc-cchhc
Confidence            368999999999  566666776654322220     344579999766 456788888887643    45555 99997


Q ss_pred             c
Q 001901          775 A  775 (998)
Q Consensus       775 ~  775 (998)
                      -
T Consensus        71 D   71 (266)
T TIGR00282        71 F   71 (266)
T ss_pred             c
Confidence            4


No 205
>KOG3325 consensus Membrane coat complex Retromer, subunit VPS29/PEP11 [Intracellular trafficking, secretion, and vesicular transport]
Probab=55.09  E-value=48  Score=32.88  Aligned_cols=103  Identities=25%  Similarity=0.342  Sum_probs=66.6

Q ss_pred             eEEEecCCCC--HHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccch
Q 001901          700 IKIFGDLHGQ--FGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADI  777 (998)
Q Consensus       700 i~vvGDiHG~--~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~  777 (998)
                      +.++||+|=-  -.+|-.-|++.=.|..-.     .++++|++.     |-|++.+|..+.    ..++++||--|..  
T Consensus         3 vL~lgD~HiP~Ra~~Lp~KFkklLvPgki~-----hilctGNlc-----s~e~~dylk~l~----~dvhiVrGeFD~~--   66 (183)
T KOG3325|consen    3 VLVLGDLHIPHRANDLPAKFKKLLVPGKIQ-----HILCTGNLC-----SKESYDYLKTLS----SDVHIVRGEFDEN--   66 (183)
T ss_pred             EEEeccccCCccccccCHHHHhccCCCcee-----EEEEeCCcc-----hHHHHHHHHhhC----CCcEEEecccCcc--
Confidence            5789999853  345555555554554321     689999976     568888888774    6899999987662  


Q ss_pred             hhhcCChHHHHHHhCCCcchhhhhhhhhhhcccceeEEEcCeEEEecCCccCcccCHHhhhhccCCcc
Q 001901          778 NALFGFRIECIERMGERDGIWAWHRINRLFNWLPLAALIEKKIICMHGGIGRSINHVEQIENLQRPIT  845 (998)
Q Consensus       778 ~~~~gf~~e~~~~~g~~~~~~~~~~~~~~f~~LP~aa~i~~~il~vHgGi~~~~~~~~~i~~i~rp~~  845 (998)
                                 .+|.+..                ...+-.=||-||||-.--...+.+.+.-+.|-+.
T Consensus        67 -----------~~yP~~k----------------vvtvGqfkIG~chGhqViP~gd~~sL~~LaRqld  107 (183)
T KOG3325|consen   67 -----------LKYPENK----------------VVTVGQFKIGLCHGHQVIPWGDPESLALLARQLD  107 (183)
T ss_pred             -----------ccCCccc----------------eEEeccEEEEeecCcEeecCCCHHHHHHHHHhcC
Confidence                       2333220                0011123899999976544467777888888554


No 206
>KOG0306 consensus WD40-repeat-containing subunit of the 18S rRNA processing complex [RNA processing and modification]
Probab=54.99  E-value=5.1e+02  Score=32.52  Aligned_cols=95  Identities=15%  Similarity=0.267  Sum_probs=54.6

Q ss_pred             cEEEEECCCCcEEEecCCCCC-CCCcc-------ce-----EEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEE
Q 001901          151 DVHCYDVLTNKWSRITPFGEP-PTPRA-------AH-----VATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHR  217 (998)
Q Consensus       151 dv~~yD~~t~~W~~l~~~g~~-P~pR~-------~h-----sa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~  217 (998)
                      .+..+--.+..|..+...+.+ |.|-.       +|     +.++..+.+.++.|.+      +.+-+|+..+..    .
T Consensus       337 ~lv~l~nNtv~~ysl~~s~~~~p~~~~~~~i~~~GHR~dVRsl~vS~d~~~~~Sga~------~SikiWn~~t~k----c  406 (888)
T KOG0306|consen  337 TLVLLANNTVEWYSLENSGKTSPEADRTSNIEIGGHRSDVRSLCVSSDSILLASGAG------ESIKIWNRDTLK----C  406 (888)
T ss_pred             eEEEeecCceEEEEeccCCCCCccccccceeeeccchhheeEEEeecCceeeeecCC------CcEEEEEccCcc----e
Confidence            333344455678888874332 33322       22     2333345555555532      457777777642    2


Q ss_pred             eeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          218 VVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       218 l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                      +.   .++.. |-+++..+.++..+|.|+.+|     .+..||+.+.
T Consensus       407 iR---Ti~~~-y~l~~~Fvpgd~~Iv~G~k~G-----el~vfdlaS~  444 (888)
T KOG0306|consen  407 IR---TITCG-YILASKFVPGDRYIVLGTKNG-----ELQVFDLASA  444 (888)
T ss_pred             eE---Eeccc-cEEEEEecCCCceEEEeccCC-----ceEEEEeehh
Confidence            22   22222 888888888767777787665     5778888765


No 207
>PRK11028 6-phosphogluconolactonase; Provisional
Probab=53.24  E-value=3.7e+02  Score=30.09  Aligned_cols=96  Identities=8%  Similarity=0.038  Sum_probs=46.1

Q ss_pred             CcEEEEECCC-CcEEEecCCCCCCCCccceEEEEe--CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCC
Q 001901          150 ADVHCYDVLT-NKWSRITPFGEPPTPRAAHVATAV--GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPG  226 (998)
Q Consensus       150 ~dv~~yD~~t-~~W~~l~~~g~~P~pR~~hsa~~~--~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~  226 (998)
                      +.+..||+.+ .+++.+...   +.....+.++.-  ++.+|+.+..      ...+..|++... .++..+..   .+.
T Consensus        12 ~~I~~~~~~~~g~l~~~~~~---~~~~~~~~l~~spd~~~lyv~~~~------~~~i~~~~~~~~-g~l~~~~~---~~~   78 (330)
T PRK11028         12 QQIHVWNLNHEGALTLLQVV---DVPGQVQPMVISPDKRHLYVGVRP------EFRVLSYRIADD-GALTFAAE---SPL   78 (330)
T ss_pred             CCEEEEEECCCCceeeeeEE---ecCCCCccEEECCCCCEEEEEECC------CCcEEEEEECCC-CceEEeee---ecC
Confidence            3567777753 567666543   222222333333  3466765431      256777887632 24654442   121


Q ss_pred             CCcccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCC
Q 001901          227 PRYGHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAA  263 (998)
Q Consensus       227 ~R~~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s  263 (998)
                      +-.-+.++.. .++.||+..-.     -+.+.+||+.+
T Consensus        79 ~~~p~~i~~~~~g~~l~v~~~~-----~~~v~v~~~~~  111 (330)
T PRK11028         79 PGSPTHISTDHQGRFLFSASYN-----ANCVSVSPLDK  111 (330)
T ss_pred             CCCceEEEECCCCCEEEEEEcC-----CCeEEEEEECC
Confidence            1111223233 34456665422     24677787754


No 208
>cd07406 MPP_CG11883_N Drosophila melanogaster CG11883 and related proteins, N-terminal metallophosphatase domain. CG11883 is an uncharacterized Drosophila melanogaster UshA-like protein with two domains, an N-terminal metallophosphatase domain and  a C-terminal nucleotidase domain.  The N-terminal metallophosphatase domain belongs to a large superfamily of distantly related metallophosphatases (MPPs) that includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at th
Probab=53.10  E-value=25  Score=38.45  Aligned_cols=57  Identities=23%  Similarity=0.197  Sum_probs=34.4

Q ss_pred             CCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCC-----hHHHHHHHHHhhhcCCCcEEEeecCccc
Q 001901          708 GQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQH-----SLETITLLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       708 G~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~-----s~evl~ll~~lk~~~p~~v~llrGNHE~  774 (998)
                      |-+.-+..++++......     ..-+|..||+++..+.     ...++..|-.+.     --+...||||.
T Consensus        21 gG~~rl~~~i~~~r~~~~-----~~l~l~~GD~~~g~~~~~~~~g~~~~~~l~~l~-----~d~~~~GNHef   82 (257)
T cd07406          21 GGAARFATLRKQLRKENP-----NTLVLFSGDVLSPSLLSTATKGKQMVPVLNALG-----VDLACFGNHEF   82 (257)
T ss_pred             CCHHHHHHHHHHHHhcCC-----CEEEEECCCccCCccchhhcCCccHHHHHHhcC-----CcEEeeccccc
Confidence            446667777776543211     1246779999987653     234555555543     23567899996


No 209
>KOG1378 consensus Purple acid phosphatase [Carbohydrate transport and metabolism]
Probab=53.05  E-value=39  Score=39.70  Aligned_cols=34  Identities=6%  Similarity=0.100  Sum_probs=26.7

Q ss_pred             HHHHHHHHHcCCcEEEEcccccccceEEecCCeE
Q 001901          885 DRVMEFCNNNDLQLIVRAHECVMDGFERFAQGHL  918 (998)
Q Consensus       885 ~~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~  918 (998)
                      ..+++.+.++++++.+=||.=.-+.+..-.|.++
T Consensus       322 ~~LE~l~~~~~VDvvf~GHvH~YER~~piyn~~~  355 (452)
T KOG1378|consen  322 EGLEPLFVKYKVDVVFWGHVHRYERFCPIYNNTC  355 (452)
T ss_pred             HHHHHHHHHhceeEEEeccceehhccchhhccee
Confidence            3699999999999999999966666555556554


No 210
>TIGR03074 PQQ_membr_DH membrane-bound PQQ-dependent dehydrogenase, glucose/quinate/shikimate family. This protein family has a phylogenetic distribution very similar to that coenzyme PQQ biosynthesis enzymes, as shown by partial phylogenetic profiling. Members of this family have several predicted transmembrane helices in the N-terminal region, and include the quinoprotein glucose dehydrogenase (EC 1.1.5.2) of Escherichia coli and the quinate/shikimate dehydrogenase of Acinetobacter sp. ADP1 (EC 1.1.99.25). Sequences closely related except for the absense of the N-terminal hydrophobic region, scoring in the gray zone between the trusted and noise cutoffs, include PQQ-dependent glycerol (EC 1.1.99.22) and and other polyol (sugar alcohol) dehydrogenases.
Probab=52.15  E-value=4.6e+02  Score=33.57  Aligned_cols=35  Identities=26%  Similarity=0.209  Sum_probs=25.1

Q ss_pred             cEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcc
Q 001901          231 HVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLE  272 (998)
Q Consensus       231 hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~  272 (998)
                      .+-+++++ .||+...      .+.++.+|..+.+..|+.-.
T Consensus       188 ~TPlvvgg-~lYv~t~------~~~V~ALDa~TGk~lW~~d~  222 (764)
T TIGR03074       188 ATPLKVGD-TLYLCTP------HNKVIALDAATGKEKWKFDP  222 (764)
T ss_pred             cCCEEECC-EEEEECC------CCeEEEEECCCCcEEEEEcC
Confidence            34456666 7998754      25789999988888888654


No 211
>KOG2476 consensus Uncharacterized conserved protein [Function unknown]
Probab=51.75  E-value=34  Score=39.88  Aligned_cols=71  Identities=18%  Similarity=0.352  Sum_probs=52.3

Q ss_pred             cCCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCc
Q 001901          697 KAPIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNH  772 (998)
Q Consensus       697 ~~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNH  772 (998)
                      .++|.||||.-|.+..|.+-.+......  |  .+.-++++|++.+--..+-|++.+.-.- ...|--++++-+|-
T Consensus         5 ~~kILv~Gd~~Gr~~eli~rI~~v~Kk~--G--pFd~liCvGnfF~~~~~~~e~~~ykng~-~~vPiptY~~g~~~   75 (528)
T KOG2476|consen    5 DAKILVCGDVEGRFDELIKRIQKVNKKS--G--PFDLLICVGNFFGHDTQNAEVEKYKNGT-KKVPIPTYFLGDNA   75 (528)
T ss_pred             CceEEEEcCccccHHHHHHHHHHHhhcC--C--CceEEEEecccCCCccchhHHHHHhcCC-ccCceeEEEecCCC
Confidence            4789999999999999988776653322  1  1225788999999767778887776553 46677788887776


No 212
>PF05096 Glu_cyclase_2:  Glutamine cyclotransferase;  InterPro: IPR007788 This family of enzymes 2.3.2.5 from EC catalyse the cyclization of free L-glutamine and N-terminal glutaminyl residues in proteins to pyroglutamate (5-oxoproline) and pyroglutamyl residues respectively []. This family includes plant and bacterial enzymes and seems unrelated to the mammalian enzymes.; PDB: 3NOK_B 2FAW_A 2IWA_A 3NOM_A 3NOL_A 3MBR_X.
Probab=51.59  E-value=1.8e+02  Score=32.03  Aligned_cols=92  Identities=18%  Similarity=0.161  Sum_probs=60.8

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCc
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRY  229 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~  229 (998)
                      +.+..+|+.+++-.+....   |..-.+=+++.++++||..==.      ....++||..+.    ..+.   ..+.+..
T Consensus        68 S~l~~~d~~tg~~~~~~~l---~~~~FgEGit~~~d~l~qLTWk------~~~~f~yd~~tl----~~~~---~~~y~~E  131 (264)
T PF05096_consen   68 SSLRKVDLETGKVLQSVPL---PPRYFGEGITILGDKLYQLTWK------EGTGFVYDPNTL----KKIG---TFPYPGE  131 (264)
T ss_dssp             EEEEEEETTTSSEEEEEE----TTT--EEEEEEETTEEEEEESS------SSEEEEEETTTT----EEEE---EEE-SSS
T ss_pred             EEEEEEECCCCcEEEEEEC---CccccceeEEEECCEEEEEEec------CCeEEEEccccc----eEEE---EEecCCc
Confidence            3788999999987655555   5666788999999999988422      356889999873    3443   3344467


Q ss_pred             ccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          230 GHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       230 ~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                      +..++.-++ .||+--|      .+.++.+|+.+.
T Consensus       132 GWGLt~dg~-~Li~SDG------S~~L~~~dP~~f  159 (264)
T PF05096_consen  132 GWGLTSDGK-RLIMSDG------SSRLYFLDPETF  159 (264)
T ss_dssp             --EEEECSS-CEEEE-S------SSEEEEE-TTT-
T ss_pred             ceEEEcCCC-EEEEECC------ccceEEECCccc
Confidence            888886665 7888766      367899999765


No 213
>PF10282 Lactonase:  Lactonase, 7-bladed beta-propeller;  InterPro: IPR019405  6-phosphogluconolactonases (6PGL) 3.1.1.31 from EC, which hydrolyses 6-phosphogluconolactone to 6-phosphogluconate is opne of the enzymes in the pentose phosphate pathway. Two families of structurally dissimilar 6PGLs are known to exist: the Escherichia coli (strain K12) YbhE IPR022528 from INTERPRO [] and the Pseudomonas aeruginosa DevB IPR005900 from INTERPRO [] types.  This entry contains bacterial 6-phosphogluconolactonases (6PGL) YbhE-type 3.1.1.31 from EC which hydrolyse 6-phosphogluconolactone to 6-phosphogluconate. The entry also contains the fungal muconate lactonizing enzyme carboxy-cis,cis-muconate cyclase 5.5.1.5 from EC and muconate cycloisomerase 5.5.1.1 from EC, which convert cis,cis-muconates to muconolactones and vice versa as part of the microbial beta-ketoadipate pathway. Structures have been reported for the E. coli 6-phosphogluconolactonase and Neurospora crassa muconate cycloisomerase. Structures of proteins in this family have revealed a 7-bladed beta-propeller fold [].; PDB: 3SCY_A 1L0Q_A 3HFQ_B 3FGB_A 1RI6_A 3U4Y_A 3BWS_A 1JOF_H.
Probab=50.33  E-value=4.3e+02  Score=30.04  Aligned_cols=175  Identities=16%  Similarity=0.085  Sum_probs=81.4

Q ss_pred             cceEEEEeC--CEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC-CcccEEEEECCcEEEEEcCCCCCCC
Q 001901          176 AAHVATAVG--TMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP-RYGHVMALVGQRYLMAIGGNDGKRP  252 (998)
Q Consensus       176 ~~hsa~~~~--~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~-R~~hs~~~~~~~~Lyv~GG~~g~~~  252 (998)
                      ..|.+....  +.+|+..=      -.+.+++|++.....+....... ..|.+ --+|.+..-+++++||..-.     
T Consensus       145 h~H~v~~~pdg~~v~v~dl------G~D~v~~~~~~~~~~~l~~~~~~-~~~~G~GPRh~~f~pdg~~~Yv~~e~-----  212 (345)
T PF10282_consen  145 HPHQVVFSPDGRFVYVPDL------GADRVYVYDIDDDTGKLTPVDSI-KVPPGSGPRHLAFSPDGKYAYVVNEL-----  212 (345)
T ss_dssp             CEEEEEE-TTSSEEEEEET------TTTEEEEEEE-TTS-TEEEEEEE-ECSTTSSEEEEEE-TTSSEEEEEETT-----
T ss_pred             cceeEEECCCCCEEEEEec------CCCEEEEEEEeCCCceEEEeecc-ccccCCCCcEEEEcCCcCEEEEecCC-----
Confidence            346665553  36777531      13679999998764335443322 22222 22344444345589998654     


Q ss_pred             cccEEEEECCCCCceEEEcccCCCC---CCCccceEEEEEe--CCEEEEEeccCCCCCCcccEEEEec-CCCCeEEEEEC
Q 001901          253 LADVWALDTAAKPYEWRKLEPEGEG---PPPCMYATASARS--DGLLLLCGGRDASSVPLASAYGLAK-HRDGRWEWAIA  326 (998)
Q Consensus       253 lndv~~yD~~s~~~~W~~v~~~~~~---P~~r~~~~a~~~~--~~~lyvfGG~~~~~~~~~dv~~~~~-~~~~~W~w~~~  326 (998)
                      .+.+.+|+.......|+.+......   .......+...+.  +..||+.- +.     .+.+..|+. ..+++.++...
T Consensus       213 s~~v~v~~~~~~~g~~~~~~~~~~~~~~~~~~~~~~~i~ispdg~~lyvsn-r~-----~~sI~vf~~d~~~g~l~~~~~  286 (345)
T PF10282_consen  213 SNTVSVFDYDPSDGSLTEIQTISTLPEGFTGENAPAEIAISPDGRFLYVSN-RG-----SNSISVFDLDPATGTLTLVQT  286 (345)
T ss_dssp             TTEEEEEEEETTTTEEEEEEEEESCETTSCSSSSEEEEEE-TTSSEEEEEE-CT-----TTEEEEEEECTTTTTEEEEEE
T ss_pred             CCcEEEEeecccCCceeEEEEeeeccccccccCCceeEEEecCCCEEEEEe-cc-----CCEEEEEEEecCCCceEEEEE
Confidence            3566666666222255554322222   1112123333333  34566643 22     234444544 23344444333


Q ss_pred             C---CCCCCCcceeEEEE--ECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEccc
Q 001901          327 P---GVSPSPRYQHAAVF--VNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKS  380 (998)
Q Consensus       327 ~---g~~P~pR~~hsav~--~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~  380 (998)
                      .   +.  .||   .+++  -+..|||.... .+      .-.++..|.++..+..+..
T Consensus       287 ~~~~G~--~Pr---~~~~s~~g~~l~Va~~~-s~------~v~vf~~d~~tG~l~~~~~  333 (345)
T PF10282_consen  287 VPTGGK--FPR---HFAFSPDGRYLYVANQD-SN------TVSVFDIDPDTGKLTPVGS  333 (345)
T ss_dssp             EEESSS--SEE---EEEE-TTSSEEEEEETT-TT------EEEEEEEETTTTEEEEEEE
T ss_pred             EeCCCC--Ccc---EEEEeCCCCEEEEEecC-CC------eEEEEEEeCCCCcEEEecc
Confidence            2   22  233   2333  24456664322 11      1234455778999988764


No 214
>PTZ00421 coronin; Provisional
Probab=49.99  E-value=5.4e+02  Score=31.11  Aligned_cols=62  Identities=11%  Similarity=0.067  Sum_probs=34.0

Q ss_pred             EEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          186 MVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       186 ~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                      .+++.||.      ...+.+||+.+.. ....+.  + .  ...-.++....++.+++.|+.++     .+..||+.+.
T Consensus       139 ~iLaSgs~------DgtVrIWDl~tg~-~~~~l~--~-h--~~~V~sla~spdG~lLatgs~Dg-----~IrIwD~rsg  200 (493)
T PTZ00421        139 NVLASAGA------DMVVNVWDVERGK-AVEVIK--C-H--SDQITSLEWNLDGSLLCTTSKDK-----KLNIIDPRDG  200 (493)
T ss_pred             CEEEEEeC------CCEEEEEECCCCe-EEEEEc--C-C--CCceEEEEEECCCCEEEEecCCC-----EEEEEECCCC
Confidence            56666664      2468899998752 111111  1 0  11112232333446777787665     5778999876


No 215
>PF09910 DUF2139:  Uncharacterized protein conserved in archaea (DUF2139);  InterPro: IPR016675 There is currently no experimental data for members of this group or their homologues, nor do they exhibit features indicative of any function.
Probab=49.51  E-value=4.2e+02  Score=29.70  Aligned_cols=134  Identities=16%  Similarity=0.183  Sum_probs=67.6

Q ss_pred             CEEEEEcCCCCCCCCCCCCCCCCCCCCccccccccCCcEEEEECCCCcEEEecCCCCCCCCccceEEE---Ee---CCEE
Q 001901          114 PRLILFGGATALEGNSAASGTPSSAGSAGIRLAGATADVHCYDVLTNKWSRITPFGEPPTPRAAHVAT---AV---GTMV  187 (998)
Q Consensus       114 ~~lyvfGG~~~~~~~~~~~~~~~~~~~~~~~~~~~~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~---~~---~~~l  187 (998)
                      +..+.|||+.-.-..+..    -..+..-+.+..-++.++.||.++++-+.|-.-+ .--++...+=+   .+   ++.+
T Consensus        46 Dd~IyFGGWVHAPa~y~g----k~~g~~~IdF~NKYSHVH~yd~e~~~VrLLWkes-ih~~~~WaGEVSdIlYdP~~D~L  120 (339)
T PF09910_consen   46 DDFIYFGGWVHAPAVYEG----KGDGRATIDFRNKYSHVHEYDTENDSVRLLWKES-IHDKTKWAGEVSDILYDPYEDRL  120 (339)
T ss_pred             cceEEEeeeecCCceeee----ccCCceEEEEeeccceEEEEEcCCCeEEEEEecc-cCCccccccchhheeeCCCcCEE
Confidence            346779997543211110    0011122344457789999999988744332211 01112221111   11   4577


Q ss_pred             EEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCce
Q 001901          188 VIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYE  267 (998)
Q Consensus       188 yVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~  267 (998)
                      ++.=+-   +...--+|.+|..+..  -..+.   .-|...   .+ .+.+..+|  |=.+...-+..+.+||+.+.  +
T Consensus       121 LlAR~D---Gh~nLGvy~ldr~~g~--~~~L~---~~ps~K---G~-~~~D~a~F--~i~~~~~g~~~i~~~Dli~~--~  184 (339)
T PF09910_consen  121 LLARAD---GHANLGVYSLDRRTGK--AEKLS---SNPSLK---GT-LVHDYACF--GINNFHKGVSGIHCLDLISG--K  184 (339)
T ss_pred             EEEecC---CcceeeeEEEcccCCc--eeecc---CCCCcC---ce-EeeeeEEE--eccccccCCceEEEEEccCC--e
Confidence            776543   3333467888877753  44443   333331   12 33331222  22333444788999999999  8


Q ss_pred             E
Q 001901          268 W  268 (998)
Q Consensus       268 W  268 (998)
                      |
T Consensus       185 ~  185 (339)
T PF09910_consen  185 W  185 (339)
T ss_pred             E
Confidence            9


No 216
>PRK04922 tolB translocation protein TolB; Provisional
Probab=49.50  E-value=5e+02  Score=30.55  Aligned_cols=190  Identities=13%  Similarity=0.114  Sum_probs=89.7

Q ss_pred             CCcEEEEECCCCcEEEecCCCCCCCCccceEEEEe-CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC
Q 001901          149 TADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAV-GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP  227 (998)
Q Consensus       149 ~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~-~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~  227 (998)
                      ...+|++|+.+++...+...   +.. .......- +.+|++.....  +  ..++|++|+.+..  ...+...   .. 
T Consensus       227 ~~~l~~~dl~~g~~~~l~~~---~g~-~~~~~~SpDG~~l~~~~s~~--g--~~~Iy~~d~~~g~--~~~lt~~---~~-  292 (433)
T PRK04922        227 RSAIYVQDLATGQRELVASF---RGI-NGAPSFSPDGRRLALTLSRD--G--NPEIYVMDLGSRQ--LTRLTNH---FG-  292 (433)
T ss_pred             CcEEEEEECCCCCEEEeccC---CCC-ccCceECCCCCEEEEEEeCC--C--CceEEEEECCCCC--eEECccC---CC-
Confidence            34699999998887777543   111 11111111 33555443221  1  2579999998763  4444311   11 


Q ss_pred             CcccEEEEECCc-EEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCC
Q 001901          228 RYGHVMALVGQR-YLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVP  306 (998)
Q Consensus       228 R~~hs~~~~~~~-~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~  306 (998)
                       .........++ +|++.....+   ..++|.+|+.+.  +++.+...+.     .........+++.+++....+.   
T Consensus       293 -~~~~~~~spDG~~l~f~sd~~g---~~~iy~~dl~~g--~~~~lt~~g~-----~~~~~~~SpDG~~Ia~~~~~~~---  358 (433)
T PRK04922        293 -IDTEPTWAPDGKSIYFTSDRGG---RPQIYRVAASGG--SAERLTFQGN-----YNARASVSPDGKKIAMVHGSGG---  358 (433)
T ss_pred             -CccceEECCCCCEEEEEECCCC---CceEEEEECCCC--CeEEeecCCC-----CccCEEECCCCCEEEEEECCCC---
Confidence             11122233333 4444433332   247999999887  7776653221     2222233335544444322221   


Q ss_pred             cccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEc
Q 001901          307 LASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDT  378 (998)
Q Consensus       307 ~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v  378 (998)
                      ...++.++.... .+.  .....   .....-...-+++.+++......      ...++.+|+....=.++
T Consensus       359 ~~~I~v~d~~~g-~~~--~Lt~~---~~~~~p~~spdG~~i~~~s~~~g------~~~L~~~~~~g~~~~~l  418 (433)
T PRK04922        359 QYRIAVMDLSTG-SVR--TLTPG---SLDESPSFAPNGSMVLYATREGG------RGVLAAVSTDGRVRQRL  418 (433)
T ss_pred             ceeEEEEECCCC-CeE--ECCCC---CCCCCceECCCCCEEEEEEecCC------ceEEEEEECCCCceEEc
Confidence            125666665433 333  22211   11111123335666666543321      34689999866543333


No 217
>COG0737 UshA 5'-nucleotidase/2',3'-cyclic phosphodiesterase and related esterases [Nucleotide transport and metabolism]
Probab=48.92  E-value=23  Score=42.98  Aligned_cols=71  Identities=28%  Similarity=0.298  Sum_probs=41.2

Q ss_pred             cCCeEEEecCCCCHH------------HHHHHHHHcCCCCCCCCccceeEEEeccccCCCC------ChHHHHHHHHHhh
Q 001901          697 KAPIKIFGDLHGQFG------------DLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQ------HSLETITLLLALK  758 (998)
Q Consensus       697 ~~~i~vvGDiHG~~~------------dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~------~s~evl~ll~~lk  758 (998)
                      +-.|+-..|+||++.            -+.++.........+..  ..-+|=.||+++..+      .....+.+|-.|+
T Consensus        26 ~l~ilhtnD~H~~l~~~~~~~~~~~~~g~~~~~~~v~~~ra~~~--~~llld~GD~~~G~~l~~~~~~g~~~~~~mN~m~  103 (517)
T COG0737          26 KLTILHTNDLHGHLEPYDYDDDGDTDGGLARIATLVKQLRAENK--NVLLLDAGDLIQGSPLSDYLTKGEPTVDLLNALG  103 (517)
T ss_pred             eEEEEEeccccccceeccccccCcccccHHHHHHHHHHHHhhcC--CeEEEeCCcccCCccccccccCCChHHHHHhhcC
Confidence            345788999999998            33333322211111110  113444999999843      3344566666664


Q ss_pred             hcCCCcEEEeecCccc
Q 001901          759 VEYPNNVHLIRGNHEA  774 (998)
Q Consensus       759 ~~~p~~v~llrGNHE~  774 (998)
                           -=.+..||||.
T Consensus       104 -----yDa~tiGNHEF  114 (517)
T COG0737         104 -----YDAMTLGNHEF  114 (517)
T ss_pred             -----CcEEeeccccc
Confidence                 33677899998


No 218
>cd07405 MPP_UshA_N Escherichia coli UshA and related proteins, N-terminal metallophosphatase domain. UshA is a bacterial periplasmic enzyme with UDP-sugar hydrolase and dinucleoside-polyphosphate hydrolase activities associated with its N-terminal metallophosphatase domain, and 5'-nucleotidase activity associated with its C-terminal domain.  UshA has been studied in Escherichia coli where it is expressed from the ushA gene as an immature precursor and proteolytically cleaved to form a mature product upon export to the periplasm.  UshA hydrolyzes many different nucleotides and nucleotide derivitives and has been shown to degrade external UDP-glucose to uridine, glucose 1-phosphate and phosphate for utilization by the cell.  The N-terminal metallophosphatase domain belongs to a large superfamily of distantly related metallophosphatases (MPPs) that includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs
Probab=48.80  E-value=24  Score=39.31  Aligned_cols=69  Identities=23%  Similarity=0.186  Sum_probs=34.9

Q ss_pred             eEEEecCCCCHHH----------HHHHHHHcCCCCCCCCccceeEEEeccccCCCCC-----hHHHHHHHHHhhhcCCCc
Q 001901          700 IKIFGDLHGQFGD----------LMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQH-----SLETITLLLALKVEYPNN  764 (998)
Q Consensus       700 i~vvGDiHG~~~d----------L~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~-----s~evl~ll~~lk~~~p~~  764 (998)
                      |+-+.|+||++..          +..+++........ +....-+|-.||++.--+.     ..-++.+|-.+..    .
T Consensus         3 Il~tnD~Hg~l~~~~~~~gG~ar~a~~i~~~r~~~~~-~~~~~l~ld~GD~~~Gs~~~~~~~g~~~~~~~n~~g~----D   77 (285)
T cd07405           3 ILHTNDHHGHFWPNGTGEYGLAAQKTLVDGVRREVAA-QGGYVLLLSGGDINTGVPESDLQDAEPDFRGMNLVGY----D   77 (285)
T ss_pred             EEEEcccccccccCCCCCccHHHHHHHHHHHHHHhhc-cCCCEEEEeCCCcCCCchhHHhcCcchHHHHHHhhCC----c
Confidence            6778999998643          44455544211000 0011135559999832221     2233444444422    3


Q ss_pred             EEEeecCccc
Q 001901          765 VHLIRGNHEA  774 (998)
Q Consensus       765 v~llrGNHE~  774 (998)
                      + +..||||.
T Consensus        78 a-~~~GNHEf   86 (285)
T cd07405          78 A-MAVGNHEF   86 (285)
T ss_pred             E-Eeeccccc
Confidence            3 34499996


No 219
>KOG1432 consensus Predicted DNA repair exonuclease SIA1 [General function prediction only]
Probab=47.19  E-value=48  Score=37.44  Aligned_cols=44  Identities=18%  Similarity=0.218  Sum_probs=28.7

Q ss_pred             eEEEeccccCCC--CChHHHHHHHHHhhhcCCCcEEEeecCccccc
Q 001901          733 DYLFLGDYVDRG--QHSLETITLLLALKVEYPNNVHLIRGNHEAAD  776 (998)
Q Consensus       733 ~~vfLGDyVDRG--~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~  776 (998)
                      -+||+||.|+--  .+...+|+..++=.+.+.=--..+.||||...
T Consensus       103 lVVfTGD~i~g~~t~Da~~sl~kAvaP~I~~~IPwA~~lGNHDdes  148 (379)
T KOG1432|consen  103 LVVFTGDNIFGHSTQDAATSLMKAVAPAIDRKIPWAAVLGNHDDES  148 (379)
T ss_pred             EEEEeCCcccccccHhHHHHHHHHhhhHhhcCCCeEEEeccccccc
Confidence            589999999961  13344444444444554445678899999753


No 220
>PRK00178 tolB translocation protein TolB; Provisional
Probab=46.89  E-value=5.3e+02  Score=30.12  Aligned_cols=183  Identities=14%  Similarity=0.141  Sum_probs=88.2

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccceEEEEe--CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAV--GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP  227 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~--~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~  227 (998)
                      ..+|++|+.+++-+.+....   .  ...+....  +++|++..-.  .+  ..++|++|+.+..  +..+..   .+. 
T Consensus       223 ~~l~~~~l~~g~~~~l~~~~---g--~~~~~~~SpDG~~la~~~~~--~g--~~~Iy~~d~~~~~--~~~lt~---~~~-  287 (430)
T PRK00178        223 PRIFVQNLDTGRREQITNFE---G--LNGAPAWSPDGSKLAFVLSK--DG--NPEIYVMDLASRQ--LSRVTN---HPA-  287 (430)
T ss_pred             CEEEEEECCCCCEEEccCCC---C--CcCCeEECCCCCEEEEEEcc--CC--CceEEEEECCCCC--eEEccc---CCC-
Confidence            47999999998887775431   1  11111222  3355543321  11  2589999998863  665541   111 


Q ss_pred             CcccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCC
Q 001901          228 RYGHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVP  306 (998)
Q Consensus       228 R~~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~  306 (998)
                       ........ ++++|++.....+   ...+|.+|+.+.  +++.+...+.     .........+++.+++......   
T Consensus       288 -~~~~~~~spDg~~i~f~s~~~g---~~~iy~~d~~~g--~~~~lt~~~~-----~~~~~~~Spdg~~i~~~~~~~~---  353 (430)
T PRK00178        288 -IDTEPFWGKDGRTLYFTSDRGG---KPQIYKVNVNGG--RAERVTFVGN-----YNARPRLSADGKTLVMVHRQDG---  353 (430)
T ss_pred             -CcCCeEECCCCCEEEEEECCCC---CceEEEEECCCC--CEEEeecCCC-----CccceEECCCCCEEEEEEccCC---
Confidence             11112222 3335555433222   247999999888  7777643221     2222233334444444433221   


Q ss_pred             cccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCC
Q 001901          307 LASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAG  373 (998)
Q Consensus       307 ~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~  373 (998)
                      ...++.++.... .++......     ........-+++++++....++      ...+++.+....
T Consensus       354 ~~~l~~~dl~tg-~~~~lt~~~-----~~~~p~~spdg~~i~~~~~~~g------~~~l~~~~~~g~  408 (430)
T PRK00178        354 NFHVAAQDLQRG-SVRILTDTS-----LDESPSVAPNGTMLIYATRQQG------RGVLMLVSINGR  408 (430)
T ss_pred             ceEEEEEECCCC-CEEEccCCC-----CCCCceECCCCCEEEEEEecCC------ceEEEEEECCCC
Confidence            234677766543 333322111     1111122336666666543322      245788887544


No 221
>PF08450 SGL:  SMP-30/Gluconolaconase/LRE-like region;  InterPro: IPR013658 This family describes a region that is found in proteins expressed by a variety of eukaryotic and prokaryotic species. These proteins include various enzymes, such as senescence marker protein 30 (SMP-30, Q15493 from SWISSPROT), gluconolactonase (Q01578 from SWISSPROT) and luciferin-regenerating enzyme (LRE, Q86DU5 from SWISSPROT). SMP-30 is known to hydrolyse diisopropyl phosphorofluoridate in the liver, and has been noted as having sequence similarity, in the region described in this family, with PON1 (P52430 from SWISSPROT) and LRE. ; PDB: 2GHS_A 2DG0_L 2DG1_D 2DSO_D 3E5Z_A 2IAT_A 2IAV_A 2GVV_A 3HLI_A 2GVU_A ....
Probab=46.84  E-value=3.9e+02  Score=28.49  Aligned_cols=191  Identities=13%  Similarity=0.067  Sum_probs=99.4

Q ss_pred             cCCcEEEEECCCCcEEEecCCCCCCCCccceEEEEe--CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeec--CC
Q 001901          148 ATADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAV--GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQ--GP  223 (998)
Q Consensus       148 ~~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~--~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~--g~  223 (998)
                      ....++++|+.+..-..+...    .   ..+++..  ++.+|+....        .+.++|+.+.  +++.+...  +.
T Consensus        20 ~~~~i~~~~~~~~~~~~~~~~----~---~~G~~~~~~~g~l~v~~~~--------~~~~~d~~~g--~~~~~~~~~~~~   82 (246)
T PF08450_consen   20 PGGRIYRVDPDTGEVEVIDLP----G---PNGMAFDRPDGRLYVADSG--------GIAVVDPDTG--KVTVLADLPDGG   82 (246)
T ss_dssp             TTTEEEEEETTTTEEEEEESS----S---EEEEEEECTTSEEEEEETT--------CEEEEETTTT--EEEEEEEEETTC
T ss_pred             CCCEEEEEECCCCeEEEEecC----C---CceEEEEccCCEEEEEEcC--------ceEEEecCCC--cEEEEeeccCCC
Confidence            345899999999877665543    2   3445554  5688887653        3567798876  47776643  22


Q ss_pred             CCCCCcccEEEEECCcEEEEEcCCC-CCCCc--ccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCC-EEEEEec
Q 001901          224 GPGPRYGHVMALVGQRYLMAIGGND-GKRPL--ADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDG-LLLLCGG  299 (998)
Q Consensus       224 ~P~~R~~hs~~~~~~~~Lyv~GG~~-g~~~l--ndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~-~lyvfGG  299 (998)
                      .+..|.+..+ +-.++.||+---.. .....  ..+|++++. .  +...+...-.     .-...+...++ .||+.--
T Consensus        83 ~~~~~~ND~~-vd~~G~ly~t~~~~~~~~~~~~g~v~~~~~~-~--~~~~~~~~~~-----~pNGi~~s~dg~~lyv~ds  153 (246)
T PF08450_consen   83 VPFNRPNDVA-VDPDGNLYVTDSGGGGASGIDPGSVYRIDPD-G--KVTVVADGLG-----FPNGIAFSPDGKTLYVADS  153 (246)
T ss_dssp             SCTEEEEEEE-E-TTS-EEEEEECCBCTTCGGSEEEEEEETT-S--EEEEEEEEES-----SEEEEEEETTSSEEEEEET
T ss_pred             cccCCCceEE-EcCCCCEEEEecCCCccccccccceEEECCC-C--eEEEEecCcc-----cccceEECCcchheeeccc
Confidence            2334444444 33444677742211 11112  579999998 5  5555433211     11222233344 6776421


Q ss_pred             cCCCCCCcccEEEEecCCCCe-EEEEECCCCCCCC-cceeEEEEE-CCEEEEEcccCCCCCccccCCeEEEEECCCCeEE
Q 001901          300 RDASSVPLASAYGLAKHRDGR-WEWAIAPGVSPSP-RYQHAAVFV-NARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWC  376 (998)
Q Consensus       300 ~~~~~~~~~dv~~~~~~~~~~-W~w~~~~g~~P~p-R~~hsav~~-~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~  376 (998)
                            ....+|.|+....+. +.-...-...+.. ..--++++- +++|||..-.         ...|++||+....-.
T Consensus       154 ------~~~~i~~~~~~~~~~~~~~~~~~~~~~~~~g~pDG~~vD~~G~l~va~~~---------~~~I~~~~p~G~~~~  218 (246)
T PF08450_consen  154 ------FNGRIWRFDLDADGGELSNRRVFIDFPGGPGYPDGLAVDSDGNLWVADWG---------GGRIVVFDPDGKLLR  218 (246)
T ss_dssp             ------TTTEEEEEEEETTTCCEEEEEEEEE-SSSSCEEEEEEEBTTS-EEEEEET---------TTEEEEEETTSCEEE
T ss_pred             ------ccceeEEEeccccccceeeeeeEEEcCCCCcCCCcceEcCCCCEEEEEcC---------CCEEEEECCCccEEE
Confidence                  234578887754432 3322211111111 223344443 5789987321         356999999955554


Q ss_pred             Ecc
Q 001901          377 DTK  379 (998)
Q Consensus       377 ~v~  379 (998)
                      .+.
T Consensus       219 ~i~  221 (246)
T PF08450_consen  219 EIE  221 (246)
T ss_dssp             EEE
T ss_pred             EEc
Confidence            444


No 222
>PRK04043 tolB translocation protein TolB; Provisional
Probab=46.75  E-value=5.5e+02  Score=30.26  Aligned_cols=154  Identities=10%  Similarity=0.056  Sum_probs=76.9

Q ss_pred             ccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCC
Q 001901          201 EDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPP  280 (998)
Q Consensus       201 ~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~  280 (998)
                      .++|++|+.+..  =..+.   ..+ .........-++++|++.-..++   ..++|.+|+.+.  .++++.....    
T Consensus       213 ~~Iyv~dl~tg~--~~~lt---~~~-g~~~~~~~SPDG~~la~~~~~~g---~~~Iy~~dl~~g--~~~~LT~~~~----  277 (419)
T PRK04043        213 PTLYKYNLYTGK--KEKIA---SSQ-GMLVVSDVSKDGSKLLLTMAPKG---QPDIYLYDTNTK--TLTQITNYPG----  277 (419)
T ss_pred             CEEEEEECCCCc--EEEEe---cCC-CcEEeeEECCCCCEEEEEEccCC---CcEEEEEECCCC--cEEEcccCCC----
Confidence            389999998752  33333   111 11111111223335555443333   368999999888  8888865321    


Q ss_pred             ccceEEEEEeCC-EEEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCcc
Q 001901          281 CMYATASARSDG-LLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMV  359 (998)
Q Consensus       281 r~~~~a~~~~~~-~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~  359 (998)
                       .........++ +|++.-.+.    ...++|.++.... ..+.....+     .+.. ...-+++.+++-.........
T Consensus       278 -~d~~p~~SPDG~~I~F~Sdr~----g~~~Iy~~dl~~g-~~~rlt~~g-----~~~~-~~SPDG~~Ia~~~~~~~~~~~  345 (419)
T PRK04043        278 -IDVNGNFVEDDKRIVFVSDRL----GYPNIFMKKLNSG-SVEQVVFHG-----KNNS-SVSTYKNYIVYSSRETNNEFG  345 (419)
T ss_pred             -ccCccEECCCCCEEEEEECCC----CCceEEEEECCCC-CeEeCccCC-----CcCc-eECCCCCEEEEEEcCCCcccC
Confidence             12222333344 566554332    1357787776543 332221111     1112 223345434443322211100


Q ss_pred             ccCCeEEEEECCCCeEEEcccC
Q 001901          360 EDSSSVAVLDTAAGVWCDTKSV  381 (998)
Q Consensus       360 ~~~~dv~vyD~~t~~W~~v~~~  381 (998)
                      ....+++++|+++..++.+...
T Consensus       346 ~~~~~I~v~d~~~g~~~~LT~~  367 (419)
T PRK04043        346 KNTFNLYLISTNSDYIRRLTAN  367 (419)
T ss_pred             CCCcEEEEEECCCCCeEECCCC
Confidence            1136899999999999887654


No 223
>smart00284 OLF Olfactomedin-like domains.
Probab=45.12  E-value=4.6e+02  Score=28.82  Aligned_cols=159  Identities=13%  Similarity=0.012  Sum_probs=76.5

Q ss_pred             CCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCc-eEEeeecC---CCCCCCcccE---EEEECCcEEEEE
Q 001901          172 PTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPR-WHRVVVQG---PGPGPRYGHV---MALVGQRYLMAI  244 (998)
Q Consensus       172 P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~-W~~l~~~g---~~P~~R~~hs---~~~~~~~~Lyv~  244 (998)
                      |.+-.+-+.+++++.+|.--..      ..++..||+.+.+.. +..++..+   ..|-...+++   .++-.+ -|+|+
T Consensus        71 p~~~~GtG~VVYngslYY~~~~------s~~iiKydL~t~~v~~~~~Lp~a~y~~~~~Y~~~~~sdiDlAvDE~-GLWvI  143 (255)
T smart00284       71 PHAGQGTGVVVYNGSLYFNKFN------SHDICRFDLTTETYQKEPLLNGAGYNNRFPYAWGGFSDIDLAVDEN-GLWVI  143 (255)
T ss_pred             CCccccccEEEECceEEEEecC------CccEEEEECCCCcEEEEEecCccccccccccccCCCccEEEEEcCC-ceEEE
Confidence            5666777888889888885432      367999999997521 33232110   1111111111   122233 36665


Q ss_pred             cCCCCCCCcccEEEEECCCCC--ceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEE
Q 001901          245 GGNDGKRPLADVWALDTAAKP--YEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWE  322 (998)
Q Consensus       245 GG~~g~~~lndv~~yD~~s~~--~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~  322 (998)
                      =....+.-.-.+-++|+.+..  -+|..--+       +.....+.+.-|.||+.-.....  ...-.+.||..+. +=.
T Consensus       144 Yat~~~~g~ivvSkLnp~tL~ve~tW~T~~~-------k~sa~naFmvCGvLY~~~s~~~~--~~~I~yayDt~t~-~~~  213 (255)
T smart00284      144 YATEQNAGKIVISKLNPATLTIENTWITTYN-------KRSASNAFMICGILYVTRSLGSK--GEKVFYAYDTNTG-KEG  213 (255)
T ss_pred             EeccCCCCCEEEEeeCcccceEEEEEEcCCC-------cccccccEEEeeEEEEEccCCCC--CcEEEEEEECCCC-ccc
Confidence            332222112234566766552  25654221       33444555567889988532211  1223455666544 212


Q ss_pred             EEECCCCCCCCcceeEEEEE---CCEEEEE
Q 001901          323 WAIAPGVSPSPRYQHAAVFV---NARLHVS  349 (998)
Q Consensus       323 w~~~~g~~P~pR~~hsav~~---~~~L~V~  349 (998)
                      ...++  .+.+-..+++.-+   +.+||+.
T Consensus       214 ~~~i~--f~n~y~~~s~l~YNP~d~~LY~w  241 (255)
T smart00284      214 HLDIP--FENMYEYISMLDYNPNDRKLYAW  241 (255)
T ss_pred             eeeee--eccccccceeceeCCCCCeEEEE
Confidence            22221  1222333444444   3578876


No 224
>PRK02889 tolB translocation protein TolB; Provisional
Probab=43.87  E-value=6e+02  Score=29.86  Aligned_cols=191  Identities=15%  Similarity=0.119  Sum_probs=86.6

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCc
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRY  229 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~  229 (998)
                      ..+|..|........+....   .+-.. -...-+++.++|.....   ...++|++|+.+..  =..+.   ..+.  .
T Consensus       176 ~~L~~~D~dG~~~~~l~~~~---~~v~~-p~wSPDG~~la~~s~~~---~~~~I~~~dl~~g~--~~~l~---~~~g--~  241 (427)
T PRK02889        176 YQLQISDADGQNAQSALSSP---EPIIS-PAWSPDGTKLAYVSFES---KKPVVYVHDLATGR--RRVVA---NFKG--S  241 (427)
T ss_pred             cEEEEECCCCCCceEeccCC---CCccc-ceEcCCCCEEEEEEccC---CCcEEEEEECCCCC--EEEee---cCCC--C
Confidence            46777777655555553321   11111 11111333333333211   12469999998753  23332   1221  1


Q ss_pred             ccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcc
Q 001901          230 GHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLA  308 (998)
Q Consensus       230 ~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~  308 (998)
                      ..+...- ++++|++....++   ..++|.+|+.+.  ..+++.....     .........+++.++|..... +  ..
T Consensus       242 ~~~~~~SPDG~~la~~~~~~g---~~~Iy~~d~~~~--~~~~lt~~~~-----~~~~~~wSpDG~~l~f~s~~~-g--~~  308 (427)
T PRK02889        242 NSAPAWSPDGRTLAVALSRDG---NSQIYTVNADGS--GLRRLTQSSG-----IDTEPFFSPDGRSIYFTSDRG-G--AP  308 (427)
T ss_pred             ccceEECCCCCEEEEEEccCC---CceEEEEECCCC--CcEECCCCCC-----CCcCeEEcCCCCEEEEEecCC-C--Cc
Confidence            1122222 2334554444333   268999999877  5555543211     111223444565444433211 1  23


Q ss_pred             cEEEEecCCCCeEEEEECCCCCCCCcceeE-EEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcc
Q 001901          309 SAYGLAKHRDGRWEWAIAPGVSPSPRYQHA-AVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTK  379 (998)
Q Consensus       309 dv~~~~~~~~~~W~w~~~~g~~P~pR~~hs-av~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~  379 (998)
                      .+|.++.... ..+.....+     .+... ...-+++.+++....+.      ...++++|+.+.+.+.+.
T Consensus       309 ~Iy~~~~~~g-~~~~lt~~g-----~~~~~~~~SpDG~~Ia~~s~~~g------~~~I~v~d~~~g~~~~lt  368 (427)
T PRK02889        309 QIYRMPASGG-AAQRVTFTG-----SYNTSPRISPDGKLLAYISRVGG------AFKLYVQDLATGQVTALT  368 (427)
T ss_pred             EEEEEECCCC-ceEEEecCC-----CCcCceEECCCCCEEEEEEccCC------cEEEEEEECCCCCeEEcc
Confidence            5677664432 333222211     11112 22224544444332221      236999999998877664


No 225
>PTZ00235 DNA polymerase epsilon subunit B; Provisional
Probab=43.37  E-value=62  Score=35.97  Aligned_cols=75  Identities=15%  Similarity=0.274  Sum_probs=48.8

Q ss_pred             CCeEEEecCCC----CHHHHHHHHHHcC-CCCCCCCccceeEEEeccccCCC----CChH----HHHHHHHHh-hhcCC-
Q 001901          698 APIKIFGDLHG----QFGDLMRLFDEYG-SPSTAGDIAYIDYLFLGDYVDRG----QHSL----ETITLLLAL-KVEYP-  762 (998)
Q Consensus       698 ~~i~vvGDiHG----~~~dL~~il~~~g-~~~~~~~~~~~~~vfLGDyVDRG----~~s~----evl~ll~~l-k~~~p-  762 (998)
                      ..++|+||+|=    .++.|.++|+.+. ..+. .+ ...-+||+|+++-+.    ..+.    |-..-|..| ..+|| 
T Consensus        28 ~~~VilSDV~LD~p~tl~~L~kvf~~y~~~~~~-~~-~P~~fVL~GnF~S~p~~~~~~~~~~yk~~Fd~La~llls~fp~  105 (291)
T PTZ00235         28 HNWIIMHDVYLDSPYTFEVLDKMLSLYVNTYPE-NE-LPVGFIFMGDFISLKFDYNRNFHKVYIKGFEKLSVMLISKFKL  105 (291)
T ss_pred             eEEEEEEeeccCCHHHHHHHHHHHHHhhccCcc-cC-CCeEEEEecCccCCcccCCCCchHHHHHHHHHHHHHHHHhChH
Confidence            56999999995    4778888888873 2111 11 133699999998763    2222    334444442 33565 


Q ss_pred             ----CcEEEeecCccc
Q 001901          763 ----NNVHLIRGNHEA  774 (998)
Q Consensus       763 ----~~v~llrGNHE~  774 (998)
                          .+++++.|-.|-
T Consensus       106 L~~~s~fVFVPGpnDP  121 (291)
T PTZ00235        106 ILEHCYLIFIPGINDP  121 (291)
T ss_pred             HHhcCeEEEECCCCCC
Confidence                489999999996


No 226
>PLN00181 protein SPA1-RELATED; Provisional
Probab=42.79  E-value=8.4e+02  Score=31.27  Aligned_cols=62  Identities=16%  Similarity=0.159  Sum_probs=31.9

Q ss_pred             EEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          186 MVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       186 ~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                      ..++.|+.      ...+.+||+.+..    .+....  .....-.++... .++.+++.||.++     .+..||+.+.
T Consensus       546 ~~las~~~------Dg~v~lWd~~~~~----~~~~~~--~H~~~V~~l~~~p~~~~~L~Sgs~Dg-----~v~iWd~~~~  608 (793)
T PLN00181        546 SQVASSNF------EGVVQVWDVARSQ----LVTEMK--EHEKRVWSIDYSSADPTLLASGSDDG-----SVKLWSINQG  608 (793)
T ss_pred             CEEEEEeC------CCeEEEEECCCCe----EEEEec--CCCCCEEEEEEcCCCCCEEEEEcCCC-----EEEEEECCCC
Confidence            44555554      2468889987642    222110  011111223232 2336778888765     4677888654


No 227
>KOG0646 consensus WD40 repeat protein [General function prediction only]
Probab=42.53  E-value=1.3e+02  Score=35.24  Aligned_cols=158  Identities=16%  Similarity=0.171  Sum_probs=77.0

Q ss_pred             ccEEEEECCcEEEEEcC-CCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEE--E-EEeCCEEEEEeccCCCCC
Q 001901          230 GHVMALVGQRYLMAIGG-NDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATA--S-ARSDGLLLLCGGRDASSV  305 (998)
Q Consensus       230 ~hs~~~~~~~~Lyv~GG-~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a--~-~~~~~~lyvfGG~~~~~~  305 (998)
                      -|+.+..+.+ .|++|| ..+     ++|.+.+.+..  --.+-.       +.|...  . ...++.+++.||.|+.- 
T Consensus        84 v~al~s~n~G-~~l~ag~i~g-----~lYlWelssG~--LL~v~~-------aHYQ~ITcL~fs~dgs~iiTgskDg~V-  147 (476)
T KOG0646|consen   84 VHALASSNLG-YFLLAGTISG-----NLYLWELSSGI--LLNVLS-------AHYQSITCLKFSDDGSHIITGSKDGAV-  147 (476)
T ss_pred             eeeeecCCCc-eEEEeecccC-----cEEEEEecccc--HHHHHH-------hhccceeEEEEeCCCcEEEecCCCccE-
Confidence            4566666665 566666 444     57777777762  111110       122222  2 23577888888877653 


Q ss_pred             CcccEEEEecCCCCeEEEEECCCCCCCCc---ceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcccCc
Q 001901          306 PLASAYGLAKHRDGRWEWAIAPGVSPSPR---YQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKSVV  382 (998)
Q Consensus       306 ~~~dv~~~~~~~~~~W~w~~~~g~~P~pR---~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~~~  382 (998)
                         -+|.+-..-+      ......+.|+   ..|+..+. +.-+-+||.+..-.....-..+-+||+..+.--.--   
T Consensus       148 ---~vW~l~~lv~------a~~~~~~~p~~~f~~HtlsIT-Dl~ig~Gg~~~rl~TaS~D~t~k~wdlS~g~LLlti---  214 (476)
T KOG0646|consen  148 ---LVWLLTDLVS------ADNDHSVKPLHIFSDHTLSIT-DLQIGSGGTNARLYTASEDRTIKLWDLSLGVLLLTI---  214 (476)
T ss_pred             ---EEEEEEeecc------cccCCCccceeeeccCcceeE-EEEecCCCccceEEEecCCceEEEEEeccceeeEEE---
Confidence               2333211111      0000123333   33333332 222334553322211122345778888777432221   


Q ss_pred             CCCCCCCCccccCCCCCccCCCCcceeEEEEE-CCEEEEEcCCCCCCCcccEEEe
Q 001901          383 TSPRTGRYSADAAGGDAAVELTRRCRHAAAAV-GDLIFIYGGLRGGVLLDDLLVA  436 (998)
Q Consensus       383 ~~p~~~~~~~~~~~~~~~~~p~~R~~hsa~~~-~~~LyVfGG~~~~~~l~Dv~~l  436 (998)
                                          ..++.-+++++- .++.+.+|+..|..+..+++.+
T Consensus       215 --------------------~fp~si~av~lDpae~~~yiGt~~G~I~~~~~~~~  249 (476)
T KOG0646|consen  215 --------------------TFPSSIKAVALDPAERVVYIGTEEGKIFQNLLFKL  249 (476)
T ss_pred             --------------------ecCCcceeEEEcccccEEEecCCcceEEeeehhcC
Confidence                                235556666665 4477777887777666666554


No 228
>PF10282 Lactonase:  Lactonase, 7-bladed beta-propeller;  InterPro: IPR019405  6-phosphogluconolactonases (6PGL) 3.1.1.31 from EC, which hydrolyses 6-phosphogluconolactone to 6-phosphogluconate is opne of the enzymes in the pentose phosphate pathway. Two families of structurally dissimilar 6PGLs are known to exist: the Escherichia coli (strain K12) YbhE IPR022528 from INTERPRO [] and the Pseudomonas aeruginosa DevB IPR005900 from INTERPRO [] types.  This entry contains bacterial 6-phosphogluconolactonases (6PGL) YbhE-type 3.1.1.31 from EC which hydrolyse 6-phosphogluconolactone to 6-phosphogluconate. The entry also contains the fungal muconate lactonizing enzyme carboxy-cis,cis-muconate cyclase 5.5.1.5 from EC and muconate cycloisomerase 5.5.1.1 from EC, which convert cis,cis-muconates to muconolactones and vice versa as part of the microbial beta-ketoadipate pathway. Structures have been reported for the E. coli 6-phosphogluconolactonase and Neurospora crassa muconate cycloisomerase. Structures of proteins in this family have revealed a 7-bladed beta-propeller fold [].; PDB: 3SCY_A 1L0Q_A 3HFQ_B 3FGB_A 1RI6_A 3U4Y_A 3BWS_A 1JOF_H.
Probab=42.52  E-value=5.6e+02  Score=29.11  Aligned_cols=202  Identities=13%  Similarity=0.102  Sum_probs=90.6

Q ss_pred             cEEEEECCCCcEEEecCCCCCCCCccceEEEE--eCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCC-CC
Q 001901          151 DVHCYDVLTNKWSRITPFGEPPTPRAAHVATA--VGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGP-GP  227 (998)
Q Consensus       151 dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~--~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P-~~  227 (998)
                      .++.||..+.+++.+........|.   -.+.  -++.||+.....   .....+..|.+...+.+.+.+.   ..+ .+
T Consensus        16 ~~~~~d~~~g~l~~~~~~~~~~~Ps---~l~~~~~~~~LY~~~e~~---~~~g~v~~~~i~~~~g~L~~~~---~~~~~g   86 (345)
T PF10282_consen   16 YVFRFDEETGTLTLVQTVAEGENPS---WLAVSPDGRRLYVVNEGS---GDSGGVSSYRIDPDTGTLTLLN---SVPSGG   86 (345)
T ss_dssp             EEEEEETTTTEEEEEEEEEESSSEC---CEEE-TTSSEEEEEETTS---STTTEEEEEEEETTTTEEEEEE---EEEESS
T ss_pred             EEEEEcCCCCCceEeeeecCCCCCc---eEEEEeCCCEEEEEEccc---cCCCCEEEEEECCCcceeEEee---eeccCC
Confidence            4556677999998876531111211   1222  245888886543   1234566777665433566655   223 22


Q ss_pred             Cc-ccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEc---------ccCCCCCCCccceEEEEEeCC-EEEE
Q 001901          228 RY-GHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKL---------EPEGEGPPPCMYATASARSDG-LLLL  296 (998)
Q Consensus       228 R~-~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v---------~~~~~~P~~r~~~~a~~~~~~-~lyv  296 (998)
                      .. .|.++.-.+++||+.--.     -..+.+|++.... +=...         .+..........|......++ .+|+
T Consensus        87 ~~p~~i~~~~~g~~l~vany~-----~g~v~v~~l~~~g-~l~~~~~~~~~~g~g~~~~rq~~~h~H~v~~~pdg~~v~v  160 (345)
T PF10282_consen   87 SSPCHIAVDPDGRFLYVANYG-----GGSVSVFPLDDDG-SLGEVVQTVRHEGSGPNPDRQEGPHPHQVVFSPDGRFVYV  160 (345)
T ss_dssp             SCEEEEEECTTSSEEEEEETT-----TTEEEEEEECTTS-EEEEEEEEEESEEEESSTTTTSSTCEEEEEE-TTSSEEEE
T ss_pred             CCcEEEEEecCCCEEEEEEcc-----CCeEEEEEccCCc-ccceeeeecccCCCCCcccccccccceeEEECCCCCEEEE
Confidence            22 232222244466664211     2467778776631 11111         011111111233444444444 5665


Q ss_pred             EeccCCCCCCcccEEEEecCCCC-eEEEEECCCCCCCCcceeEEEEEC-CEEEEEcccCCCCCccccCCeEEEEECC--C
Q 001901          297 CGGRDASSVPLASAYGLAKHRDG-RWEWAIAPGVSPSPRYQHAAVFVN-ARLHVSGGALGGGRMVEDSSSVAVLDTA--A  372 (998)
Q Consensus       297 fGG~~~~~~~~~dv~~~~~~~~~-~W~w~~~~g~~P~pR~~hsav~~~-~~L~V~GG~~~~~~~~~~~~dv~vyD~~--t  372 (998)
                      .. .     -.+.++.|+..... ..........++..--.|.+..-+ ..+||..-.         .+.|.+|+..  +
T Consensus       161 ~d-l-----G~D~v~~~~~~~~~~~l~~~~~~~~~~G~GPRh~~f~pdg~~~Yv~~e~---------s~~v~v~~~~~~~  225 (345)
T PF10282_consen  161 PD-L-----GADRVYVYDIDDDTGKLTPVDSIKVPPGSGPRHLAFSPDGKYAYVVNEL---------SNTVSVFDYDPSD  225 (345)
T ss_dssp             EE-T-----TTTEEEEEEE-TTS-TEEEEEEEECSTTSSEEEEEE-TTSSEEEEEETT---------TTEEEEEEEETTT
T ss_pred             Ee-c-----CCCEEEEEEEeCCCceEEEeeccccccCCCCcEEEEcCCcCEEEEecCC---------CCcEEEEeecccC
Confidence            42 2     13445666554432 232211111111111123332223 478998643         3445555544  7


Q ss_pred             CeEEEcccCc
Q 001901          373 GVWCDTKSVV  382 (998)
Q Consensus       373 ~~W~~v~~~~  382 (998)
                      ..|+.+....
T Consensus       226 g~~~~~~~~~  235 (345)
T PF10282_consen  226 GSLTEIQTIS  235 (345)
T ss_dssp             TEEEEEEEEE
T ss_pred             CceeEEEEee
Confidence            7787776653


No 229
>PF09910 DUF2139:  Uncharacterized protein conserved in archaea (DUF2139);  InterPro: IPR016675 There is currently no experimental data for members of this group or their homologues, nor do they exhibit features indicative of any function.
Probab=41.91  E-value=5.5e+02  Score=28.85  Aligned_cols=136  Identities=16%  Similarity=0.152  Sum_probs=67.7

Q ss_pred             cccEEEEECCCCC--ceEEEcccCCCCCCCccceEEEEE---eCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEECC
Q 001901          253 LADVWALDTAAKP--YEWRKLEPEGEGPPPCMYATASAR---SDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAP  327 (998)
Q Consensus       253 lndv~~yD~~s~~--~~W~~v~~~~~~P~~r~~~~a~~~---~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~  327 (998)
                      ++.++.||++...  .-|..--.-...   -.+-.+-.+   .+++|++.-+-   +..---+|.++..+. .-++..-.
T Consensus        77 YSHVH~yd~e~~~VrLLWkesih~~~~---WaGEVSdIlYdP~~D~LLlAR~D---Gh~nLGvy~ldr~~g-~~~~L~~~  149 (339)
T PF09910_consen   77 YSHVHEYDTENDSVRLLWKESIHDKTK---WAGEVSDILYDPYEDRLLLARAD---GHANLGVYSLDRRTG-KAEKLSSN  149 (339)
T ss_pred             cceEEEEEcCCCeEEEEEecccCCccc---cccchhheeeCCCcCEEEEEecC---CcceeeeEEEcccCC-ceeeccCC
Confidence            5779999998874  356543221111   111111122   36778776432   222346777776654 22222222


Q ss_pred             CCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeE--EEcccCcCCCCCCCCccccCCCCCccCCCC
Q 001901          328 GVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVW--CDTKSVVTSPRTGRYSADAAGGDAAVELTR  405 (998)
Q Consensus       328 g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W--~~v~~~~~~p~~~~~~~~~~~~~~~~~p~~  405 (998)
                         |.+   -.+.+++..+|-+  .+.    ......+.+||+.+++|  ..++... ++.             +.....
T Consensus       150 ---ps~---KG~~~~D~a~F~i--~~~----~~g~~~i~~~Dli~~~~~~e~f~~~~-s~D-------------g~~~~~  203 (339)
T PF09910_consen  150 ---PSL---KGTLVHDYACFGI--NNF----HKGVSGIHCLDLISGKWVIESFDVSL-SVD-------------GGPVIR  203 (339)
T ss_pred             ---CCc---CceEeeeeEEEec--ccc----ccCCceEEEEEccCCeEEEEeccccc-CCC-------------CCceEe
Confidence               222   2344444444433  111    13367899999999999  4333221 111             111234


Q ss_pred             cceeEEEEECCEEEEE
Q 001901          406 RCRHAAAAVGDLIFIY  421 (998)
Q Consensus       406 R~~hsa~~~~~~LyVf  421 (998)
                      |..-.++..-+++|.|
T Consensus       204 ~~~G~~~s~ynR~faF  219 (339)
T PF09910_consen  204 PELGAMASAYNRLFAF  219 (339)
T ss_pred             eccccEEEEeeeEEEE
Confidence            4555566666776665


No 230
>cd07407 MPP_YHR202W_N Saccharomyces cerevisiae YHR202W and related proteins, N-terminal metallophosphatase domain. YHR202W is an uncharacterized Saccharomyces cerevisiae UshA-like protein with two domains, an N-terminal metallophosphatase domain and  a C-terminal nucleotidase domain.  The N-terminal metallophosphatase domain belongs to a large superfamily of distantly related metallophosphatases (MPPs) that includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at 
Probab=41.35  E-value=39  Score=37.64  Aligned_cols=38  Identities=24%  Similarity=0.124  Sum_probs=22.9

Q ss_pred             eEEEeccccCCCCCh-------HHHHHHHHHhhhcCCCcEEEeecCcccc
Q 001901          733 DYLFLGDYVDRGQHS-------LETITLLLALKVEYPNNVHLIRGNHEAA  775 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s-------~evl~ll~~lk~~~p~~v~llrGNHE~~  775 (998)
                      -+|.-||+++.-+.+       .-.+.+|=.+     .-=.+..||||.-
T Consensus        53 Llld~GD~~qGs~~~~~~~~~g~~~~~~mN~m-----gyDa~tlGNHEFd   97 (282)
T cd07407          53 LLVDTGDLHDGNGLSDASPPPGSYSNPIFRMM-----PYDLLTIGNHELY   97 (282)
T ss_pred             EEEeCCCccCCeeceeeecCCChHHHHHHHhc-----CCcEEeecccccC
Confidence            356699999754322       2234444444     3456788999993


No 231
>PF05096 Glu_cyclase_2:  Glutamine cyclotransferase;  InterPro: IPR007788 This family of enzymes 2.3.2.5 from EC catalyse the cyclization of free L-glutamine and N-terminal glutaminyl residues in proteins to pyroglutamate (5-oxoproline) and pyroglutamyl residues respectively []. This family includes plant and bacterial enzymes and seems unrelated to the mammalian enzymes.; PDB: 3NOK_B 2FAW_A 2IWA_A 3NOM_A 3NOL_A 3MBR_X.
Probab=41.08  E-value=4.5e+02  Score=28.98  Aligned_cols=115  Identities=15%  Similarity=0.072  Sum_probs=69.2

Q ss_pred             ccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCccc
Q 001901          230 GHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLAS  309 (998)
Q Consensus       230 ~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~d  309 (998)
                      -.+..+..++.||.--|..|.   +.+.++|+.+.  +=......+    ++.+.=+.++.+++||..--.      ...
T Consensus        47 TQGL~~~~~g~LyESTG~yG~---S~l~~~d~~tg--~~~~~~~l~----~~~FgEGit~~~d~l~qLTWk------~~~  111 (264)
T PF05096_consen   47 TQGLEFLDDGTLYESTGLYGQ---SSLRKVDLETG--KVLQSVPLP----PRYFGEGITILGDKLYQLTWK------EGT  111 (264)
T ss_dssp             EEEEEEEETTEEEEEECSTTE---EEEEEEETTTS--SEEEEEE-T----TT--EEEEEEETTEEEEEESS------SSE
T ss_pred             CccEEecCCCEEEEeCCCCCc---EEEEEEECCCC--cEEEEEECC----ccccceeEEEECCEEEEEEec------CCe
Confidence            344555455589998887764   57889999998  433333332    257777788889999998543      344


Q ss_pred             EEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeE
Q 001901          310 AYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVW  375 (998)
Q Consensus       310 v~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W  375 (998)
                      .+.|+..+-   +....-   +.+..+-+.+..+..|++.-|          ++.++.+||++.+=
T Consensus       112 ~f~yd~~tl---~~~~~~---~y~~EGWGLt~dg~~Li~SDG----------S~~L~~~dP~~f~~  161 (264)
T PF05096_consen  112 GFVYDPNTL---KKIGTF---PYPGEGWGLTSDGKRLIMSDG----------SSRLYFLDPETFKE  161 (264)
T ss_dssp             EEEEETTTT---EEEEEE---E-SSS--EEEECSSCEEEE-S----------SSEEEEE-TTT-SE
T ss_pred             EEEEccccc---eEEEEE---ecCCcceEEEcCCCEEEEECC----------ccceEEECCcccce
Confidence            566766533   222211   223466777777788888766          46699999987753


No 232
>cd00200 WD40 WD40 domain, found in a number of eukaryotic proteins that cover a wide variety of functions including adaptor/regulatory modules in signal transduction, pre-mRNA processing and cytoskeleton assembly; typically contains a GH dipeptide 11-24 residues from its N-terminus and the WD dipeptide at its C-terminus and is 40 residues long, hence the name WD40; between GH and WD lies a conserved core; serves as a stable propeller-like platform to which proteins can bind either stably or reversibly; forms a propeller-like structure with several blades where each blade is composed of a four-stranded anti-parallel b-sheet; instances with few detectable copies are hypothesized to form larger structures by dimerization; each WD40 sequence repeat forms the first three strands of one blade and the last strand in the next blade; the last C-terminal WD40 repeat completes the blade structure of the first WD40 repeat to create the closed ring propeller-structure; residues on the top and botto
Probab=41.05  E-value=4.2e+02  Score=27.26  Aligned_cols=94  Identities=10%  Similarity=0.080  Sum_probs=43.3

Q ss_pred             CcEEEEECCCCcEEEecCCCCCCCCccceEEEEeC-CEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCC
Q 001901          150 ADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVG-TMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPR  228 (998)
Q Consensus       150 ~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~-~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R  228 (998)
                      +.+.+||..+......-..    ....-.++.... +.+++.|+.      ...+.+||+.+.. ....+.     ....
T Consensus        73 ~~i~i~~~~~~~~~~~~~~----~~~~i~~~~~~~~~~~~~~~~~------~~~i~~~~~~~~~-~~~~~~-----~~~~  136 (289)
T cd00200          73 KTIRLWDLETGECVRTLTG----HTSYVSSVAFSPDGRILSSSSR------DKTIKVWDVETGK-CLTTLR-----GHTD  136 (289)
T ss_pred             CeEEEEEcCcccceEEEec----cCCcEEEEEEcCCCCEEEEecC------CCeEEEEECCCcE-EEEEec-----cCCC
Confidence            3678888877432221111    111112223333 366666652      2468899988542 111111     1111


Q ss_pred             cccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          229 YGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       229 ~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                      .-.++....++.+++.|+.+     ..+..||+.+.
T Consensus       137 ~i~~~~~~~~~~~l~~~~~~-----~~i~i~d~~~~  167 (289)
T cd00200         137 WVNSVAFSPDGTFVASSSQD-----GTIKLWDLRTG  167 (289)
T ss_pred             cEEEEEEcCcCCEEEEEcCC-----CcEEEEEcccc
Confidence            12233333333455555433     35788888654


No 233
>PTZ00420 coronin; Provisional
Probab=39.69  E-value=8.2e+02  Score=30.22  Aligned_cols=61  Identities=10%  Similarity=0.152  Sum_probs=33.7

Q ss_pred             EEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          186 MVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       186 ~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                      .+++.||.+      ..+.+||+.+.. .-..+.    .+  ..-.++....++.+++.++.++     .+..||+.+.
T Consensus       139 ~iLaSgS~D------gtIrIWDl~tg~-~~~~i~----~~--~~V~SlswspdG~lLat~s~D~-----~IrIwD~Rsg  199 (568)
T PTZ00420        139 YIMCSSGFD------SFVNIWDIENEK-RAFQIN----MP--KKLSSLKWNIKGNLLSGTCVGK-----HMHIIDPRKQ  199 (568)
T ss_pred             eEEEEEeCC------CeEEEEECCCCc-EEEEEe----cC--CcEEEEEECCCCCEEEEEecCC-----EEEEEECCCC
Confidence            555566642      468899998753 111221    11  1123333333446777776543     5888999776


No 234
>PRK09420 cpdB bifunctional 2',3'-cyclic nucleotide 2'-phosphodiesterase/3'-nucleotidase periplasmic precursor protein; Reviewed
Probab=37.44  E-value=48  Score=41.47  Aligned_cols=69  Identities=19%  Similarity=0.103  Sum_probs=41.1

Q ss_pred             ecCCeEEEecCCCCHHH----------------HHHHHHHcCCCCCCCCccceeEEEeccccCCCCChH-----------
Q 001901          696 LKAPIKIFGDLHGQFGD----------------LMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSL-----------  748 (998)
Q Consensus       696 ~~~~i~vvGDiHG~~~d----------------L~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~-----------  748 (998)
                      +.-+|.-..|+||++..                +..++++..-...     ..-+|-.||++...+.+-           
T Consensus        24 ~~L~IL~TnDlHg~l~~~dy~~~~~~~~~Glar~atli~~~R~e~~-----n~llvD~GD~~qGsp~~~~~~~~~~~~g~   98 (649)
T PRK09420         24 VDLRIMETTDLHSNMMDFDYYKDKPTEKFGLVRTASLIKAARAEAK-----NSVLVDNGDLIQGSPLGDYMAAKGLKAGD   98 (649)
T ss_pred             ceEEEEEEcccccCccCCccccCCcccccCHHHHHHHHHHHHHhCC-----CEEEEECCCcCCCchhhhhhhhccccCCC
Confidence            34567889999999743                3334444321111     124666999997655331           


Q ss_pred             --HHHHHHHHhhhcCCCcEEEeecCccc
Q 001901          749 --ETITLLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       749 --evl~ll~~lk~~~p~~v~llrGNHE~  774 (998)
                        -++..|=.|     .--....||||.
T Consensus        99 ~~p~i~amN~l-----gyDa~tlGNHEF  121 (649)
T PRK09420         99 VHPVYKAMNTL-----DYDVGNLGNHEF  121 (649)
T ss_pred             cchHHHHHHhc-----CCcEEeccchhh
Confidence              245555555     345677899996


No 235
>cd07382 MPP_DR1281 Deinococcus radiodurans DR1281 and related proteins, metallophosphatase domain. DR1281 is an uncharacterized Deinococcus radiodurans protein with a domain that belongs to the metallophosphatase (MPP) superfamily.  MPPs are functionally diverse, but all share a conserved domain with an active site consisting of two metal ions (usually manganese, iron, or zinc) coordinated with octahedral geometry by a cage of histidine, aspartate, and asparagine residues. The MPP superfamily includes: Mre11/SbcD-like exonucleases, Dbr1-like RNA lariat debranching enzymes, YfcE-like phosphodiesterases, purple acid phosphatases (PAPs), YbbF-like UDP-2,3-diacylglucosamine hydrolases, and acid sphingomyelinases (ASMases).  The conserved domain is a double beta-sheet sandwich with a di-metal active site made up of residues located at the C-terminal side of the sheets. This domain is thought to allow for productive metal coordination.
Probab=37.03  E-value=78  Score=34.73  Aligned_cols=66  Identities=21%  Similarity=0.235  Sum_probs=42.6

Q ss_pred             CeEEEecCCCCH--HHHHHHHHHcCCCCCCCCccceeEEEeccccCCC-CChHHHHHHHHHhhhcCCCcEEEeecCccc
Q 001901          699 PIKIFGDLHGQF--GDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRG-QHSLETITLLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       699 ~i~vvGDiHG~~--~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG-~~s~evl~ll~~lk~~~p~~v~llrGNHE~  774 (998)
                      +|.++|||=|.-  ..+.+.|..+...... |    -+|-.||..--| .-+-++...|..+..    .++.+ ||||.
T Consensus         1 ~ilfigdi~g~~G~~~~~~~l~~lk~~~~~-D----~vi~NgEn~~gg~gl~~~~~~~L~~~G~----D~iTl-GNH~f   69 (255)
T cd07382           1 KILFIGDIVGKPGRKAVKEHLPKLKKEYKI-D----FVIANGENAAGGKGITPKIAKELLSAGV----DVITM-GNHTW   69 (255)
T ss_pred             CEEEEEeCCCHHHHHHHHHHHHHHHHHCCC-C----EEEECCccccCCCCCCHHHHHHHHhcCC----CEEEe-ccccc
Confidence            478999999984  4455556554321111 0    244479998766 367788888888754    34444 99986


No 236
>PF02897 Peptidase_S9_N:  Prolyl oligopeptidase, N-terminal beta-propeller domain;  InterPro: IPR004106 In the MEROPS database peptidases and peptidase homologues are grouped into clans and families. Clans are groups of families for which there is evidence of common ancestry based on a common structural fold:  Each clan is identified with two letters, the first representing the catalytic type of the families included in the clan (with the letter 'P' being used for a clan containing families of more than one of the catalytic types serine, threonine and cysteine). Some families cannot yet be assigned to clans, and when a formal assignment is required, such a family is described as belonging to clan A-, C-, M-, N-, S-, T- or U-, according to the catalytic type. Some clans are divided into subclans because there is evidence of a very ancient divergence within the clan, for example MA(E), the gluzincins, and MA(M), the metzincins. Peptidase families are grouped by their catalytic type, the first character representing the catalytic type: A, aspartic; C, cysteine; G, glutamic acid; M, metallo; N, asparagine; S, serine; T, threonine; and U, unknown. The serine, threonine and cysteine peptidases utilise the amino acid as a nucleophile and form an acyl intermediate - these peptidases can also readily act as transferases. In the case of aspartic, glutamic and metallopeptidases, the nucleophile is an activated water molecule. In the case of the asparagine endopeptidases, the nucleophile is asparagine and all are self-processing endopeptidases.   In many instances the structural protein fold that characterises the clan or family may have lost its catalytic activity, yet retain its function in protein recognition and binding.  Proteolytic enzymes that exploit serine in their catalytic activity are ubiquitous, being found in viruses, bacteria and eukaryotes []. They include a wide range of peptidase activity, including exopeptidase, endopeptidase, oligopeptidase and omega-peptidase activity. Over 20 families (denoted S1 - S66) of serine protease have been identified, these being grouped into clans on the basis of structural similarity and other functional evidence []. Structures are known for members of the clans and the structures indicate that some appear to be totally unrelated, suggesting different evolutionary origins for the serine peptidases []. Not withstanding their different evolutionary origins, there are similarities in the reaction mechanisms of several peptidases. Chymotrypsin, subtilisin and carboxypeptidase C have a catalytic triad of serine, aspartate and histidine in common: serine acts as a nucleophile, aspartate as an electrophile, and histidine as a base []. The geometric orientations of the catalytic residues are similar between families, despite different protein folds []. The linear arrangements of the catalytic residues commonly reflect clan relationships. For example the catalytic triad in the chymotrypsin clan (PA) is ordered HDS, but is ordered DHS in the subtilisin clan (SB) and SDH in the carboxypeptidase clan (SC) [, ]. This entry represents the beta-propeller domain found at the N-terminal of prolyl oligopeptidase, including acylamino-acid-releasing enzyme (also known as acylaminoacyl peptidase), which belong to the MEROPS peptidase family S9 (clan SC), subfamily S9A. The prolyl oligopeptidase family consist of a number of evolutionary related peptidases whose catalytic activity seems to be provided by a charge relay system similar to that of the trypsin family of serine proteases, but which evolved by independent convergent evolution. The N-terminal domain of prolyl oligopeptidases form an unusual 7-bladed beta-propeller consisting of seven 4-stranded beta-sheet motifs.  Prolyl oligopeptidase is a large cytosolic enzyme involved in the maturation and degradation of peptide hormones and neuropeptides, which relate to the induction of amnesia. The enzyme contains a peptidase domain, where its catalytic triad (Ser554, His680, Asp641) is covered by the central tunnel of the N-terminal beta-propeller domain. In this way, large structured peptides are excluded from the active site, thereby protecting larger peptides and proteins from proteolysis in the cytosol []. The protein fold of the peptidase domain for members of this family resembles that of serine carboxypeptidase D, the type example of clan SC. Mammalian acylaminoacyl peptidase is an exopeptidase that is a member of the same prolyl oligopeptidase family of serine peptidases. This enzyme removes acylated amino acid residues from the N terminus of oligopeptides [].; GO: 0004252 serine-type endopeptidase activity, 0006508 proteolysis; PDB: 2BKL_B 3DDU_A 1YR2_A 2XE4_A 1VZ3_A 3EQ9_A 1O6F_A 3EQ7_A 4AN0_A 1UOP_A ....
Probab=36.85  E-value=7.2e+02  Score=28.78  Aligned_cols=204  Identities=13%  Similarity=0.067  Sum_probs=102.4

Q ss_pred             CCcEEEEECCCCcEEEecCCCCCCCCccceE-EEEeCC-EEEEEeCCCCCCC-----CcccEEEEEcCCCCCceEEeeec
Q 001901          149 TADVHCYDVLTNKWSRITPFGEPPTPRAAHV-ATAVGT-MVVIQGGIGPAGL-----SAEDLHVLDLTQQRPRWHRVVVQ  221 (998)
Q Consensus       149 ~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hs-a~~~~~-~lyVfGG~~~~~~-----~~~dv~~~Dl~t~t~~W~~l~~~  221 (998)
                      ...++++|+.+++...-.      .++...+ ++-..+ ..+++........     .-..+|++.+.+...+=..+-  
T Consensus       149 ~~~l~v~Dl~tg~~l~d~------i~~~~~~~~~W~~d~~~~~y~~~~~~~~~~~~~~~~~v~~~~~gt~~~~d~lvf--  220 (414)
T PF02897_consen  149 WYTLRVFDLETGKFLPDG------IENPKFSSVSWSDDGKGFFYTRFDEDQRTSDSGYPRQVYRHKLGTPQSEDELVF--  220 (414)
T ss_dssp             EEEEEEEETTTTEEEEEE------EEEEESEEEEECTTSSEEEEEECSTTTSS-CCGCCEEEEEEETTS-GGG-EEEE--
T ss_pred             eEEEEEEECCCCcCcCCc------ccccccceEEEeCCCCEEEEEEeCcccccccCCCCcEEEEEECCCChHhCeeEE--
Confidence            347899999998543221      1122223 343433 5555554433222     257899999887531211222  


Q ss_pred             CCCCCCCc-ccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCC---CceEEEcccCCCCCCCccceEEEEEeCCEEEEE
Q 001901          222 GPGPGPRY-GHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAK---PYEWRKLEPEGEGPPPCMYATASARSDGLLLLC  297 (998)
Q Consensus       222 g~~P~~R~-~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~---~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvf  297 (998)
                       ..+.... ...+..-.+++.+++.-..+.. .+++|.+|+...   ...|..+.....     .....+...++.+|+.
T Consensus       221 -e~~~~~~~~~~~~~s~d~~~l~i~~~~~~~-~s~v~~~d~~~~~~~~~~~~~l~~~~~-----~~~~~v~~~~~~~yi~  293 (414)
T PF02897_consen  221 -EEPDEPFWFVSVSRSKDGRYLFISSSSGTS-ESEVYLLDLDDGGSPDAKPKLLSPRED-----GVEYYVDHHGDRLYIL  293 (414)
T ss_dssp             -C-TTCTTSEEEEEE-TTSSEEEEEEESSSS-EEEEEEEECCCTTTSS-SEEEEEESSS-----S-EEEEEEETTEEEEE
T ss_pred             -eecCCCcEEEEEEecCcccEEEEEEEcccc-CCeEEEEeccccCCCcCCcEEEeCCCC-----ceEEEEEccCCEEEEe
Confidence             2222232 2222233333333333322322 589999999874   347888865322     2223344458899988


Q ss_pred             eccCCCCCCcccEEEEecCCCC--eEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECC-CCe
Q 001901          298 GGRDASSVPLASAYGLAKHRDG--RWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTA-AGV  374 (998)
Q Consensus       298 GG~~~~~~~~~dv~~~~~~~~~--~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~-t~~  374 (998)
                      -..+.   ....++.++.....  .|.-..++..  ....--.+...+++|++.-=.++       ...+.+||+. +..
T Consensus       294 Tn~~a---~~~~l~~~~l~~~~~~~~~~~l~~~~--~~~~l~~~~~~~~~Lvl~~~~~~-------~~~l~v~~~~~~~~  361 (414)
T PF02897_consen  294 TNDDA---PNGRLVAVDLADPSPAEWWTVLIPED--EDVSLEDVSLFKDYLVLSYRENG-------SSRLRVYDLDDGKE  361 (414)
T ss_dssp             E-TT----TT-EEEEEETTSTSGGGEEEEEE--S--SSEEEEEEEEETTEEEEEEEETT-------EEEEEEEETT-TEE
T ss_pred             eCCCC---CCcEEEEecccccccccceeEEcCCC--CceeEEEEEEECCEEEEEEEECC-------ccEEEEEECCCCcE
Confidence            65332   33456666555443  3553333211  12344455667888887743322       4569999998 444


Q ss_pred             EEEcc
Q 001901          375 WCDTK  379 (998)
Q Consensus       375 W~~v~  379 (998)
                      -..++
T Consensus       362 ~~~~~  366 (414)
T PF02897_consen  362 SREIP  366 (414)
T ss_dssp             EEEEE
T ss_pred             Eeeec
Confidence            43333


No 237
>cd08162 MPP_PhoA_N Synechococcus sp. strain PCC 7942  PhoA and related proteins, N-terminal metallophosphatase domain. Synechococcus sp. strain PCC 7942 PhoA is a large atypical alkaline phosphatase.  It is known to be transported across the inner cytoplasmic membrane and into the periplasmic space.  In vivo inactivation of the gene encoding PhoA leads to a loss of extracellular, phosphate-regulated phosphatase activity, but does not appear to affect the cells capacity for phosphate uptake.  PhoA may play a role in scavenging phosphate during growth of Synechococcus sp. strain PCC 7942 in its natural environment.  PhoA  belongs to a domain family which includes the bacterial enzyme UshA and several other related enzymes including SoxB, CpdB, YhcR, and CD73.  All members have a similar domain architecture which includes an N-terminal metallophosphatase domain and a C-terminal nucleotidase domain.  The N-terminal metallophosphatase domain belongs to a large superfamily of distantly relat
Probab=35.92  E-value=61  Score=36.69  Aligned_cols=69  Identities=22%  Similarity=0.147  Sum_probs=38.5

Q ss_pred             eEEEecCCCCHH------HHHHHHHHcCCCCCCCCccceeEEEeccccCCCCC-------------hHHHHHHHHHhhhc
Q 001901          700 IKIFGDLHGQFG------DLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQH-------------SLETITLLLALKVE  760 (998)
Q Consensus       700 i~vvGDiHG~~~------dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~-------------s~evl~ll~~lk~~  760 (998)
                      |+-+-|+||++.      .+..+++......... ....-+|.-||.+.-++.             ..-++.+|=++.  
T Consensus         3 IlhtnD~Hg~~~~~gg~ar~a~~i~~~r~~~~~~-~~~~l~ldaGD~~qGs~~~~~~~~~~~~~~~G~~~i~~mN~~g--   79 (313)
T cd08162           3 LLHTSDGESGLLAEDDAPNFSALVNALKDEAAAE-YDNTLTLSSGDNFIPGPFFNASLDPLIYGDPGRADILILNALG--   79 (313)
T ss_pred             EEEecccccCccccCCHHHHHHHHHHHHHhhhcc-CCCeEEEecCccccCchhhhhhccccccccCChHHHHHHhccC--
Confidence            566889999964      3433444432110000 011256779999875432             334455555553  


Q ss_pred             CCCcEEEeecCccc
Q 001901          761 YPNNVHLIRGNHEA  774 (998)
Q Consensus       761 ~p~~v~llrGNHE~  774 (998)
                         -=.+..||||.
T Consensus        80 ---~Da~tlGNHEF   90 (313)
T cd08162          80 ---VQAIALGNHEF   90 (313)
T ss_pred             ---CcEEecccccc
Confidence               34677899996


No 238
>PF14870 PSII_BNR:  Photosynthesis system II assembly factor YCF48; PDB: 2XBG_A.
Probab=35.53  E-value=6.9e+02  Score=28.15  Aligned_cols=178  Identities=13%  Similarity=0.209  Sum_probs=75.2

Q ss_pred             CCCcEEEecCCCCCCCCccceEEEEeC-CEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEE
Q 001901          158 LTNKWSRITPFGEPPTPRAAHVATAVG-TMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALV  236 (998)
Q Consensus       158 ~t~~W~~l~~~g~~P~pR~~hsa~~~~-~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~  236 (998)
                      .-.+|+++....  +.|-..+....++ +.++++|..       ..+|+=.-...  .|..+...   .. -.-..+...
T Consensus        89 gG~tW~~v~l~~--~lpgs~~~i~~l~~~~~~l~~~~-------G~iy~T~DgG~--tW~~~~~~---~~-gs~~~~~r~  153 (302)
T PF14870_consen   89 GGKTWERVPLSS--KLPGSPFGITALGDGSAELAGDR-------GAIYRTTDGGK--TWQAVVSE---TS-GSINDITRS  153 (302)
T ss_dssp             TTSS-EE----T--T-SS-EEEEEEEETTEEEEEETT---------EEEESSTTS--SEEEEE-S--------EEEEEE-
T ss_pred             CCCCcEEeecCC--CCCCCeeEEEEcCCCcEEEEcCC-------CcEEEeCCCCC--CeeEcccC---Cc-ceeEeEEEC
Confidence            356899987432  3444455566654 477777643       23443322233  49987621   11 112223344


Q ss_pred             CCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEec-
Q 001901          237 GQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAK-  315 (998)
Q Consensus       237 ~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~-  315 (998)
                      .++.+++++. .|.    -+...|+-..  .|+.......    |+...+....++.||+.. +.+.       ..+.. 
T Consensus       154 ~dG~~vavs~-~G~----~~~s~~~G~~--~w~~~~r~~~----~riq~~gf~~~~~lw~~~-~Gg~-------~~~s~~  214 (302)
T PF14870_consen  154 SDGRYVAVSS-RGN----FYSSWDPGQT--TWQPHNRNSS----RRIQSMGFSPDGNLWMLA-RGGQ-------IQFSDD  214 (302)
T ss_dssp             TTS-EEEEET-TSS----EEEEE-TT-S--S-EEEE--SS----S-EEEEEE-TTS-EEEEE-TTTE-------EEEEE-
T ss_pred             CCCcEEEEEC-ccc----EEEEecCCCc--cceEEccCcc----ceehhceecCCCCEEEEe-CCcE-------EEEccC
Confidence            5555555553 332    1234566666  7887755433    677777777888998865 2221       22222 


Q ss_pred             -CCCCeEEEEECCCCCCCCcceeE-EEEE-CCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcccC
Q 001901          316 -HRDGRWEWAIAPGVSPSPRYQHA-AVFV-NARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKSV  381 (998)
Q Consensus       316 -~~~~~W~w~~~~g~~P~pR~~hs-av~~-~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~~  381 (998)
                       ....+|  .+.........++.- ++.. ++.+++.||.          ..+++=.-.-.+|++....
T Consensus       215 ~~~~~~w--~~~~~~~~~~~~~~ld~a~~~~~~~wa~gg~----------G~l~~S~DgGktW~~~~~~  271 (302)
T PF14870_consen  215 PDDGETW--SEPIIPIKTNGYGILDLAYRPPNEIWAVGGS----------GTLLVSTDGGKTWQKDRVG  271 (302)
T ss_dssp             TTEEEEE-----B-TTSS--S-EEEEEESSSS-EEEEEST----------T-EEEESSTTSS-EE-GGG
T ss_pred             CCCcccc--ccccCCcccCceeeEEEEecCCCCEEEEeCC----------ccEEEeCCCCccceECccc
Confidence             112234  342211112233322 2333 4789999884          2355555567789998764


No 239
>TIGR01390 CycNucDiestase 2',3'-cyclic-nucleotide 2'-phosphodiesterase. 2',3'-cyclic-nucleotide 2'-phosphodiesterase is a bifunctional enzyme localized to the periplasm of Gram-negative bacteria. 2',3'-cyclic-nucleotide 2'-phosphodiesters are intermediates formed during the hydrolysis of RNA by the ribonuclease I, which is also found to the periplasm, and other enzymes of the RNAse T2 family. Bacteria are unable to transport 2',3'-cyclic-nucleotides into the cytoplasm. 2',3'-cyclic-nucleotide 2'-phosphodiesterase contains 2 active sites which catalyze the reactions that convert the 2',3'-cyclic-nucleotide into a 3'-nucleotide, which is then converted into nucleic acid and phosphate. Both final products can be transported into the cytoplasm. Thus, it has been suggested that 2',3'-cyclic-nucleotide 2'-phosphodiesterase has a 'scavenging' function. Experimental evidence indicates that 2',3'-cyclic-nucleotide 2'-phosphodiesterase enables Yersinia enterocolitica O:8 to grow on 2'3'-cAMP as a
Probab=34.77  E-value=51  Score=41.04  Aligned_cols=66  Identities=20%  Similarity=0.087  Sum_probs=38.1

Q ss_pred             CeEEEecCCCCHHH----------------HHHHHHHcCCCCCCCCccceeEEEeccccCCCCCh-------------HH
Q 001901          699 PIKIFGDLHGQFGD----------------LMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHS-------------LE  749 (998)
Q Consensus       699 ~i~vvGDiHG~~~d----------------L~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s-------------~e  749 (998)
                      +|+-..||||++..                +..++++..-...     ..-+|-.||.+.--+.+             .-
T Consensus         4 ~Il~TnDlH~~l~~~dy~~~~~~~~~Glar~atli~~~R~e~~-----n~lllD~GD~~qGsp~~~~~~~~~~~~~~~~p   78 (626)
T TIGR01390         4 RIVETTDLHTNLMDYDYYKDKPTDKFGLTRTATLIKQARAEVK-----NSVLVDNGDLIQGSPLGDYMAAQGLKAGQMHP   78 (626)
T ss_pred             EEEEEcCCccCccCCcccCCCCCCCcCHHHHHHHHHHHHhhCC-----CeEEEECCCcCCCccchhhhhhccccCCCcCh
Confidence            47778999999753                3334444321111     12466699999854432             12


Q ss_pred             HHHHHHHhhhcCCCcEEEeecCccc
Q 001901          750 TITLLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       750 vl~ll~~lk~~~p~~v~llrGNHE~  774 (998)
                      ++.+|=.|     .-=.+..||||.
T Consensus        79 ~~~~mN~l-----gyDa~tlGNHEF   98 (626)
T TIGR01390        79 VYKAMNLL-----KYDVGNLGNHEF   98 (626)
T ss_pred             HHHHHhhc-----CccEEecccccc
Confidence            44444444     234577899996


No 240
>PRK09419 bifunctional 2',3'-cyclic nucleotide 2'-phosphodiesterase/3'-nucleotidase precursor protein; Reviewed
Probab=34.70  E-value=50  Score=44.41  Aligned_cols=21  Identities=24%  Similarity=0.517  Sum_probs=15.1

Q ss_pred             HHHHHHHHHH-cCCcEEEEccc
Q 001901          884 PDRVMEFCNN-NDLQLIVRAHE  904 (998)
Q Consensus       884 ~~~~~~fl~~-~~l~~iiR~H~  904 (998)
                      ++++.+..++ -++++||-||+
T Consensus       256 en~~~~la~~~~gID~Il~GHs  277 (1163)
T PRK09419        256 EDSVYDLAEKTKGIDAIVAGHQ  277 (1163)
T ss_pred             chHHHHHHHhCCCCcEEEeCCC
Confidence            3455566644 58999999996


No 241
>KOG0310 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=34.66  E-value=7.8e+02  Score=29.27  Aligned_cols=117  Identities=17%  Similarity=0.207  Sum_probs=59.1

Q ss_pred             cEEEEECCCC-cEEEecCCCCCCCCccceEEEEeC--CEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC
Q 001901          151 DVHCYDVLTN-KWSRITPFGEPPTPRAAHVATAVG--TMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP  227 (998)
Q Consensus       151 dv~~yD~~t~-~W~~l~~~g~~P~pR~~hsa~~~~--~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~  227 (998)
                      .+-.||+.+. .|..--..|. |..    .++.+.  ..|.-.||        +.+-+||+.+..          .++.-
T Consensus       177 ~vrl~DtR~~~~~v~elnhg~-pVe----~vl~lpsgs~iasAgG--------n~vkVWDl~~G~----------qll~~  233 (487)
T KOG0310|consen  177 KVRLWDTRSLTSRVVELNHGC-PVE----SVLALPSGSLIASAGG--------NSVKVWDLTTGG----------QLLTS  233 (487)
T ss_pred             eEEEEEeccCCceeEEecCCC-cee----eEEEcCCCCEEEEcCC--------CeEEEEEecCCc----------eehhh
Confidence            4556777766 4543333321 211    233332  35556666        568888988542          33333


Q ss_pred             Cccc-----EEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCC
Q 001901          228 RYGH-----VMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDA  302 (998)
Q Consensus       228 R~~h-----s~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~  302 (998)
                      +..|     |+....++.-++-||.|+     .+-+||+.    .|+.+.....+ .  ---+.++..++.-.++|+.++
T Consensus       234 ~~~H~KtVTcL~l~s~~~rLlS~sLD~-----~VKVfd~t----~~Kvv~s~~~~-~--pvLsiavs~dd~t~viGmsnG  301 (487)
T KOG0310|consen  234 MFNHNKTVTCLRLASDSTRLLSGSLDR-----HVKVFDTT----NYKVVHSWKYP-G--PVLSIAVSPDDQTVVIGMSNG  301 (487)
T ss_pred             hhcccceEEEEEeecCCceEeeccccc-----ceEEEEcc----ceEEEEeeecc-c--ceeeEEecCCCceEEEecccc
Confidence            4423     223334445677788776     35678843    35555444331 1  112334445667777776443


No 242
>PLN00033 photosystem II stability/assembly factor; Provisional
Probab=34.64  E-value=8.2e+02  Score=28.73  Aligned_cols=90  Identities=14%  Similarity=0.128  Sum_probs=46.2

Q ss_pred             eEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeE---EEEECCCCCCCCcc-eeEEEEE
Q 001901          267 EWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRW---EWAIAPGVSPSPRY-QHAAVFV  342 (998)
Q Consensus       267 ~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W---~w~~~~g~~P~pR~-~hsav~~  342 (998)
                      .|+.+....    .+.........++.++++|...       .++.-.. ....|   +|.+..-  +..++ -.++...
T Consensus       271 ~W~~~~~~~----~~~l~~v~~~~dg~l~l~g~~G-------~l~~S~d-~G~~~~~~~f~~~~~--~~~~~~l~~v~~~  336 (398)
T PLN00033        271 YWQPHNRAS----ARRIQNMGWRADGGLWLLTRGG-------GLYVSKG-TGLTEEDFDFEEADI--KSRGFGILDVGYR  336 (398)
T ss_pred             ceEEecCCC----ccceeeeeEcCCCCEEEEeCCc-------eEEEecC-CCCcccccceeeccc--CCCCcceEEEEEc
Confidence            488775432    2333444445688888887431       1222211 12245   3444332  12233 2333344


Q ss_pred             -CCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEccc
Q 001901          343 -NARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKS  380 (998)
Q Consensus       343 -~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~  380 (998)
                       ++.+++.|..          .-++.-...-.+|+++..
T Consensus       337 ~d~~~~a~G~~----------G~v~~s~D~G~tW~~~~~  365 (398)
T PLN00033        337 SKKEAWAAGGS----------GILLRSTDGGKSWKRDKG  365 (398)
T ss_pred             CCCcEEEEECC----------CcEEEeCCCCcceeEccc
Confidence             5678888753          225566667778998764


No 243
>KOG3339 consensus Predicted glycosyltransferase [General function prediction only]
Probab=34.14  E-value=1.2e+02  Score=31.31  Aligned_cols=92  Identities=22%  Similarity=0.288  Sum_probs=63.5

Q ss_pred             eeEEEeccccCCCCChHHHHHHHHHhhhcCCCcEEEeecCccccchhhhcCChHH---HHH---------HhCCCcchhh
Q 001901          732 IDYLFLGDYVDRGQHSLETITLLLALKVEYPNNVHLIRGNHEAADINALFGFRIE---CIE---------RMGERDGIWA  799 (998)
Q Consensus       732 ~~~vfLGDyVDRG~~s~evl~ll~~lk~~~p~~v~llrGNHE~~~~~~~~gf~~e---~~~---------~~g~~~~~~~  799 (998)
                      ..+||||    -|-+.-|.+.||-+|+.+|-.+.++ .|+-|.|..+....|...   |..         ..|...-..+
T Consensus        40 ~~lVvlG----SGGHT~EMlrLl~~l~~~y~~r~yI-~a~tD~mS~~k~~~F~~~~a~~~a~~~~ipRsReVgQS~ltSv  114 (211)
T KOG3339|consen   40 STLVVLG----SGGHTGEMLRLLEALQDLYSPRSYI-AADTDEMSEQKARSFELSLAHCKAKNYEIPRSREVGQSWLTSV  114 (211)
T ss_pred             eEEEEEc----CCCcHHHHHHHHHHHHhhcCceEEE-EecCchhhHHHHHhhhccccccchhheecchhhhhhhhhhhhH
Confidence            3799998    5889999999999999999766655 899999988765554321   111         1122222345


Q ss_pred             hhhhhhhhcccceeEEEcCeEEEecC-Ccc
Q 001901          800 WHRINRLFNWLPLAALIEKKIICMHG-GIG  828 (998)
Q Consensus       800 ~~~~~~~f~~LP~aa~i~~~il~vHg-Gi~  828 (998)
                      |..+..+.-.+++...+-.+++.+-| |-.
T Consensus       115 ~Tti~all~s~~lv~RirPdlil~NGPGTC  144 (211)
T KOG3339|consen  115 FTTIWALLQSFVLVWRIRPDLILCNGPGTC  144 (211)
T ss_pred             HHHHHHHHHHheEEEecCCCEEEECCCCcE
Confidence            66677776677777777667777777 654


No 244
>PRK03629 tolB translocation protein TolB; Provisional
Probab=33.86  E-value=8.4e+02  Score=28.67  Aligned_cols=191  Identities=12%  Similarity=0.117  Sum_probs=90.4

Q ss_pred             CCcEEEEECCCCcEEEecCCCCCCCCccceEEEEe--CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCC
Q 001901          149 TADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAV--GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPG  226 (998)
Q Consensus       149 ~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~--~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~  226 (998)
                      ...+|++|+.+++-+.+...   +.  ...+....  +.+|++.....  +  ..++|++|+.+..  ..++.   ..+.
T Consensus       222 ~~~i~i~dl~~G~~~~l~~~---~~--~~~~~~~SPDG~~La~~~~~~--g--~~~I~~~d~~tg~--~~~lt---~~~~  287 (429)
T PRK03629        222 RSALVIQTLANGAVRQVASF---PR--HNGAPAFSPDGSKLAFALSKT--G--SLNLYVMDLASGQ--IRQVT---DGRS  287 (429)
T ss_pred             CcEEEEEECCCCCeEEccCC---CC--CcCCeEECCCCCEEEEEEcCC--C--CcEEEEEECCCCC--EEEcc---CCCC
Confidence            35788899888876666543   11  11111221  33555543321  1  2469999998753  55553   1111


Q ss_pred             CCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCC
Q 001901          227 PRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVP  306 (998)
Q Consensus       227 ~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~  306 (998)
                        .........++..++|....+.  ...+|.+|+.+.  ...++...+.     .........+++.+++.+....   
T Consensus       288 --~~~~~~wSPDG~~I~f~s~~~g--~~~Iy~~d~~~g--~~~~lt~~~~-----~~~~~~~SpDG~~Ia~~~~~~g---  353 (429)
T PRK03629        288 --NNTEPTWFPDSQNLAYTSDQAG--RPQVYKVNINGG--APQRITWEGS-----QNQDADVSSDGKFMVMVSSNGG---  353 (429)
T ss_pred             --CcCceEECCCCCEEEEEeCCCC--CceEEEEECCCC--CeEEeecCCC-----CccCEEECCCCCEEEEEEccCC---
Confidence              1112222223333333332221  258999999877  5555533221     1112233345555555443322   


Q ss_pred             cccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEcc
Q 001901          307 LASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTK  379 (998)
Q Consensus       307 ~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~  379 (998)
                      ...++.++.... .+..  +...   .........-+++++++.+.++.      ...+++.+.....=..+.
T Consensus       354 ~~~I~~~dl~~g-~~~~--Lt~~---~~~~~p~~SpDG~~i~~~s~~~~------~~~l~~~~~~G~~~~~l~  414 (429)
T PRK03629        354 QQHIAKQDLATG-GVQV--LTDT---FLDETPSIAPNGTMVIYSSSQGM------GSVLNLVSTDGRFKARLP  414 (429)
T ss_pred             CceEEEEECCCC-CeEE--eCCC---CCCCCceECCCCCEEEEEEcCCC------ceEEEEEECCCCCeEECc
Confidence            235666665544 3332  2211   01111223346777777665432      234777777655444444


No 245
>KOG0308 consensus Conserved WD40 repeat-containing protein [Function unknown]
Probab=32.76  E-value=1e+03  Score=29.42  Aligned_cols=69  Identities=19%  Similarity=0.369  Sum_probs=41.7

Q ss_pred             CCEEEEEeCCCCCCCCcccEEEEEcCCCCC----ceEEeeecCCCC-CCCcc-cEEEEECCcEEEEEcCCCCCCCcccEE
Q 001901          184 GTMVVIQGGIGPAGLSAEDLHVLDLTQQRP----RWHRVVVQGPGP-GPRYG-HVMALVGQRYLMAIGGNDGKRPLADVW  257 (998)
Q Consensus       184 ~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~----~W~~l~~~g~~P-~~R~~-hs~~~~~~~~Lyv~GG~~g~~~lndv~  257 (998)
                      ++.+++-||.+      ..+++||+++.+.    ....+.+. .++ .++.. ++.+.-..+.++|-||..     .++-
T Consensus       129 ~~~lvaSgGLD------~~IflWDin~~~~~l~~s~n~~t~~-sl~sG~k~siYSLA~N~t~t~ivsGgte-----k~lr  196 (735)
T KOG0308|consen  129 NNELVASGGLD------RKIFLWDINTGTATLVASFNNVTVN-SLGSGPKDSIYSLAMNQTGTIIVSGGTE-----KDLR  196 (735)
T ss_pred             CceeEEecCCC------ccEEEEEccCcchhhhhhccccccc-cCCCCCccceeeeecCCcceEEEecCcc-----cceE
Confidence            56888999974      5688888885421    12233322 333 44433 333333444688888864     4788


Q ss_pred             EEECCCC
Q 001901          258 ALDTAAK  264 (998)
Q Consensus       258 ~yD~~s~  264 (998)
                      .||+.+.
T Consensus       197 ~wDprt~  203 (735)
T KOG0308|consen  197 LWDPRTC  203 (735)
T ss_pred             Eeccccc
Confidence            8999876


No 246
>PRK11028 6-phosphogluconolactonase; Provisional
Probab=32.56  E-value=7.4e+02  Score=27.59  Aligned_cols=97  Identities=11%  Similarity=0.027  Sum_probs=45.8

Q ss_pred             cEEEEECC-CCcEEEecCCCCCCCCccceEEEEe-CC-EEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC
Q 001901          151 DVHCYDVL-TNKWSRITPFGEPPTPRAAHVATAV-GT-MVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP  227 (998)
Q Consensus       151 dv~~yD~~-t~~W~~l~~~g~~P~pR~~hsa~~~-~~-~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~  227 (998)
                      .+..|++. +..++.+...   +.+-.-+.++.. ++ .+|+.. ..     .+.+.+|++.++......+.   ..+..
T Consensus        58 ~i~~~~~~~~g~l~~~~~~---~~~~~p~~i~~~~~g~~l~v~~-~~-----~~~v~v~~~~~~g~~~~~~~---~~~~~  125 (330)
T PRK11028         58 RVLSYRIADDGALTFAAES---PLPGSPTHISTDHQGRFLFSAS-YN-----ANCVSVSPLDKDGIPVAPIQ---IIEGL  125 (330)
T ss_pred             cEEEEEECCCCceEEeeee---cCCCCceEEEECCCCCEEEEEE-cC-----CCeEEEEEECCCCCCCCcee---eccCC
Confidence            45556664 4566655432   111111223333 33 566654 21     25678888864310111222   12222


Q ss_pred             CcccEEEEECC-cEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          228 RYGHVMALVGQ-RYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       228 R~~hs~~~~~~-~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                      ..-|.+++..+ +++|+..-.     .+.+++||+.+.
T Consensus       126 ~~~~~~~~~p~g~~l~v~~~~-----~~~v~v~d~~~~  158 (330)
T PRK11028        126 EGCHSANIDPDNRTLWVPCLK-----EDRIRLFTLSDD  158 (330)
T ss_pred             CcccEeEeCCCCCEEEEeeCC-----CCEEEEEEECCC
Confidence            33466555433 356664421     257889998763


No 247
>TIGR02658 TTQ_MADH_Hv methylamine dehydrogenase heavy chain. This family consists of the heavy chain of methylamine dehydrogenase light chain, a periplasmic enzyme. The enzyme contains a tryptophan tryptophylquinone (TTQ) prothetic group derived from two Trp residues in the light subunity. The enzyme forms a complex with the type I blue copper protein amicyanin and a cytochrome. Electron transfer procedes from TQQ to the copper and then to the heme group of the cytochrome.
Probab=31.57  E-value=8.6e+02  Score=28.06  Aligned_cols=104  Identities=21%  Similarity=0.245  Sum_probs=58.6

Q ss_pred             CCcEEEEECCCCcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCC---CCCCCcccEEEEEcCCCCCceEEeeecCCCC
Q 001901          149 TADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIG---PAGLSAEDLHVLDLTQQRPRWHRVVVQGPGP  225 (998)
Q Consensus       149 ~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~---~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P  225 (998)
                      .+.++++|..+.+-...-+.|  -.||  +...--+..+|+.-.+.   ..+...+.+.+||+.+... -.+++ .+  +
T Consensus        26 ~~~v~ViD~~~~~v~g~i~~G--~~P~--~~~spDg~~lyva~~~~~R~~~G~~~d~V~v~D~~t~~~-~~~i~-~p--~   97 (352)
T TIGR02658        26 TTQVYTIDGEAGRVLGMTDGG--FLPN--PVVASDGSFFAHASTVYSRIARGKRTDYVEVIDPQTHLP-IADIE-LP--E   97 (352)
T ss_pred             CceEEEEECCCCEEEEEEEcc--CCCc--eeECCCCCEEEEEeccccccccCCCCCEEEEEECccCcE-EeEEc-cC--C
Confidence            479999999997655443333  2233  22222345889887632   3344568899999998641 11222 11  3


Q ss_pred             CCC-----cccEEEEE-CCcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          226 GPR-----YGHVMALV-GQRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       226 ~~R-----~~hs~~~~-~~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                      .||     +.+..++- +++.|||.-=    ..-+.+-++|+.+.
T Consensus        98 ~p~~~~~~~~~~~~ls~dgk~l~V~n~----~p~~~V~VvD~~~~  138 (352)
T TIGR02658        98 GPRFLVGTYPWMTSLTPDNKTLLFYQF----SPSPAVGVVDLEGK  138 (352)
T ss_pred             CchhhccCccceEEECCCCCEEEEecC----CCCCEEEEEECCCC
Confidence            334     22333333 3346777531    22467888999887


No 248
>PRK11907 bifunctional 2',3'-cyclic nucleotide 2'-phosphodiesterase/3'-nucleotidase precursor protein; Reviewed
Probab=31.43  E-value=64  Score=41.31  Aligned_cols=67  Identities=22%  Similarity=0.125  Sum_probs=38.7

Q ss_pred             CCeEEEecCCCCHHH----------------HHHHHHHcCCCCCCCCccceeEEEeccccCCCCCh--------------
Q 001901          698 APIKIFGDLHGQFGD----------------LMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHS--------------  747 (998)
Q Consensus       698 ~~i~vvGDiHG~~~d----------------L~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s--------------  747 (998)
                      -+|+-..||||++..                +..++++..-..     ...-+|..||++.--+.+              
T Consensus       116 LtIL~TnDiHg~l~~~dy~~~~~~~~~GlaRlAtlI~~~Rae~-----~NtLllD~GD~iQGSpl~~~~a~~~~~~~g~~  190 (814)
T PRK11907        116 VRILSTTDLHTNLVNYDYYQDKPSQTLGLAKTAVLIEEAKKEN-----PNVVLVDNGDTIQGTPLGTYKAIVDPVEEGEQ  190 (814)
T ss_pred             EEEEEEEeecCCcccccccccCccccccHHHHHHHHHHHHHhC-----CCEEEEecCCCCCCCcccchhhhccccccCcc
Confidence            457889999999643                223333332111     112466699998754322              


Q ss_pred             HHHHHHHHHhhhcCCCcEEEeecCccc
Q 001901          748 LETITLLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       748 ~evl~ll~~lk~~~p~~v~llrGNHE~  774 (998)
                      .-++.+|=.|.     --.+..||||.
T Consensus       191 ~P~i~amN~LG-----yDA~tLGNHEF  212 (814)
T PRK11907        191 HPMYAALEALG-----FDAGTLGNHEF  212 (814)
T ss_pred             hHHHHHHhccC-----CCEEEechhhc
Confidence            12455555553     44678899997


No 249
>COG5184 ATS1 Alpha-tubulin suppressor and related RCC1 domain-containing proteins [Cell division and chromosome partitioning / Cytoskeleton]
Probab=29.15  E-value=7.8e+02  Score=29.33  Aligned_cols=22  Identities=27%  Similarity=0.359  Sum_probs=16.6

Q ss_pred             ccEEEEECCcEEEEEcCCCCCC
Q 001901          230 GHVMALVGQRYLMAIGGNDGKR  251 (998)
Q Consensus       230 ~hs~~~~~~~~Lyv~GG~~g~~  251 (998)
                      .|++++-.++.||..|=++...
T Consensus       114 ~hsl~ld~Dg~lyswG~N~~G~  135 (476)
T COG5184         114 NHSLGLDHDGNLYSWGDNDDGA  135 (476)
T ss_pred             ceEEeecCCCCEEEeccCcccc
Confidence            4888888887899999664433


No 250
>PF09637 Med18:  Med18 protein;  InterPro: IPR019095 The Mediator complex is a coactivator involved in the regulated transcription of nearly all RNA polymerase II-dependent genes. Mediator functions as a bridge to convey information from gene-specific regulatory proteins to the basal RNA polymerase II transcription machinery. The Mediator complex, having a compact conformation in its free form, is recruited to promoters by direct interactions with regulatory proteins and serves for the assembly of a functional preinitiation complex with RNA polymerase II and the general transcription factors. On recruitment the Mediator complex unfolds to an extended conformation and partially surrounds RNA polymerase II, specifically interacting with the unphosphorylated form of the C-terminal domain (CTD) of RNA polymerase II. The Mediator complex dissociates from the RNA polymerase II holoenzyme and stays at the promoter when transcriptional elongation begins.  The Mediator complex is composed of at least 31 subunits: MED1, MED4, MED6, MED7, MED8, MED9, MED10, MED11, MED12, MED13, MED13L, MED14, MED15, MED16, MED17, MED18, MED19, MED20, MED21, MED22, MED23, MED24, MED25, MED26, MED27, MED29, MED30, MED31, CCNC, CDK8 and CDC2L6/CDK11.  The subunits form at least three structurally distinct submodules. The head and the middle modules interact directly with RNA polymerase II, whereas the elongated tail module interacts with gene-specific regulatory proteins. Mediator containing the CDK8 module is less active than Mediator lacking this module in supporting transcriptional activation.   The head module contains: MED6, MED8, MED11, SRB4/MED17, SRB5/MED18, ROX3/MED19, SRB2/MED20 and SRB6/MED22.  The middle module contains: MED1, MED4, NUT1/MED5, MED7, CSE2/MED9, NUT2/MED10, SRB7/MED21 and SOH1/MED31. CSE2/MED9 interacts directly with MED4.  The tail module contains: MED2, PGD1/MED3, RGR1/MED14, GAL11/MED15 and SIN4/MED16.  The CDK8 module contains: MED12, MED13, CCNC and CDK8.   Individual preparations of the Mediator complex lacking one or more distinct subunits have been variously termed ARC, CRSP, DRIP, PC2, SMCC and TRAP.  Med18 is one subunit of the Mediator complex and a component of the head module that is involved in stimulating basal RNA polymerase II (PolII) transcription. Med18 consists of an eight-stranded beta-barrel with a central pore and three flanking helices. It complexes with Med8 and Med20 proteins by forming a heterodimer of two-fold symmetry with Med20 and binding the C-terminal alpha-helix region of Med8 across the top of its barrel. This complex creates a multipartite TBP-binding site that can be modulated by transcriptional activators []. ; GO: 0001104 RNA polymerase II transcription cofactor activity, 0006357 regulation of transcription from RNA polymerase II promoter, 0016592 mediator complex; PDB: 2HZM_F 2HZS_H 3RJ1_E 3C0T_A.
Probab=27.82  E-value=63  Score=35.29  Aligned_cols=39  Identities=23%  Similarity=0.439  Sum_probs=33.0

Q ss_pred             CHHHHHHHHHHcCCcEEEEcccccccceEEecCCeEEEEecc
Q 001901          883 GPDRVMEFCNNNDLQLIVRAHECVMDGFERFAQGHLITLFSA  924 (998)
Q Consensus       883 g~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~~~~~~iTvfSa  924 (998)
                      ....+.+||+.+|..+   -+|++.+||.|++++-+|+||--
T Consensus       139 ~~~~~~~fl~~lGy~~---~~Eyv~~G~~F~~g~i~I~l~ri  177 (250)
T PF09637_consen  139 TSGSLLSFLNELGYRF---DYEYVVEGYRFFKGDIVIELFRI  177 (250)
T ss_dssp             SSSSHHHHHHHTTEEE---EEEEEEEEEEEEECCEEEEEEEE
T ss_pred             CCCCHHHHHHHcCCce---EEEEEEEEEEEEECCEEEEEEEE
Confidence            4566889999999766   48999999999999988998854


No 251
>PRK04043 tolB translocation protein TolB; Provisional
Probab=27.58  E-value=1.1e+03  Score=27.87  Aligned_cols=193  Identities=11%  Similarity=0.098  Sum_probs=98.3

Q ss_pred             CCcEEEEECCCCcEEEecCCCCCCCCccceEEEEe-CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC
Q 001901          149 TADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAV-GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP  227 (998)
Q Consensus       149 ~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~-~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~  227 (998)
                      ..++|++|+.+++=+.+...   +. ........- +.++++.-...  +  ..++|++|+.+.  +++++.   ..+. 
T Consensus       212 ~~~Iyv~dl~tg~~~~lt~~---~g-~~~~~~~SPDG~~la~~~~~~--g--~~~Iy~~dl~~g--~~~~LT---~~~~-  277 (419)
T PRK04043        212 KPTLYKYNLYTGKKEKIASS---QG-MLVVSDVSKDGSKLLLTMAPK--G--QPDIYLYDTNTK--TLTQIT---NYPG-  277 (419)
T ss_pred             CCEEEEEECCCCcEEEEecC---CC-cEEeeEECCCCCEEEEEEccC--C--CcEEEEEECCCC--cEEEcc---cCCC-
Confidence            45899999998877777543   11 111111222 33555543321  1  368999999876  477775   2221 


Q ss_pred             CcccEEEEEC-CcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCC--
Q 001901          228 RYGHVMALVG-QRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASS--  304 (998)
Q Consensus       228 R~~hs~~~~~-~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~--  304 (998)
                       .......-. +++||+.....+   ..++|++|+.+.  +.+++...+.     . .. ....+++.+++-......  
T Consensus       278 -~d~~p~~SPDG~~I~F~Sdr~g---~~~Iy~~dl~~g--~~~rlt~~g~-----~-~~-~~SPDG~~Ia~~~~~~~~~~  344 (419)
T PRK04043        278 -IDVNGNFVEDDKRIVFVSDRLG---YPNIFMKKLNSG--SVEQVVFHGK-----N-NS-SVSTYKNYIVYSSRETNNEF  344 (419)
T ss_pred             -ccCccEECCCCCEEEEEECCCC---CceEEEEECCCC--CeEeCccCCC-----c-Cc-eECCCCCEEEEEEcCCCccc
Confidence             122222222 335666554332   368999999988  7777654322     1 12 333355544444332211  


Q ss_pred             -CCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCCCeEEEccc
Q 001901          305 -VPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDTKS  380 (998)
Q Consensus       305 -~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v~~  380 (998)
                       ....+++.++.... .+  ..+...   .....-...-+++.+++-...+.      ...++++++....=..++.
T Consensus       345 ~~~~~~I~v~d~~~g-~~--~~LT~~---~~~~~p~~SPDG~~I~f~~~~~~------~~~L~~~~l~g~~~~~l~~  409 (419)
T PRK04043        345 GKNTFNLYLISTNSD-YI--RRLTAN---GVNQFPRFSSDGGSIMFIKYLGN------QSALGIIRLNYNKSFLFPL  409 (419)
T ss_pred             CCCCcEEEEEECCCC-Ce--EECCCC---CCcCCeEECCCCCEEEEEEccCC------cEEEEEEecCCCeeEEeec
Confidence             01246777766544 33  333321   12222222335554444332221      3468899987776555543


No 252
>cd00200 WD40 WD40 domain, found in a number of eukaryotic proteins that cover a wide variety of functions including adaptor/regulatory modules in signal transduction, pre-mRNA processing and cytoskeleton assembly; typically contains a GH dipeptide 11-24 residues from its N-terminus and the WD dipeptide at its C-terminus and is 40 residues long, hence the name WD40; between GH and WD lies a conserved core; serves as a stable propeller-like platform to which proteins can bind either stably or reversibly; forms a propeller-like structure with several blades where each blade is composed of a four-stranded anti-parallel b-sheet; instances with few detectable copies are hypothesized to form larger structures by dimerization; each WD40 sequence repeat forms the first three strands of one blade and the last strand in the next blade; the last C-terminal WD40 repeat completes the blade structure of the first WD40 repeat to create the closed ring propeller-structure; residues on the top and botto
Probab=27.47  E-value=6.8e+02  Score=25.60  Aligned_cols=63  Identities=11%  Similarity=0.159  Sum_probs=32.7

Q ss_pred             CEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          185 TMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       185 ~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                      +..++.|+.      ...+++||+.+.. .-..+.     .....-.++....++.+++.|+.+     ..+..||+.+.
T Consensus        63 ~~~l~~~~~------~~~i~i~~~~~~~-~~~~~~-----~~~~~i~~~~~~~~~~~~~~~~~~-----~~i~~~~~~~~  125 (289)
T cd00200          63 GTYLASGSS------DKTIRLWDLETGE-CVRTLT-----GHTSYVSSVAFSPDGRILSSSSRD-----KTIKVWDVETG  125 (289)
T ss_pred             CCEEEEEcC------CCeEEEEEcCccc-ceEEEe-----ccCCcEEEEEEcCCCCEEEEecCC-----CeEEEEECCCc
Confidence            346666664      3568899988742 111111     111122233333443566666634     36888998755


No 253
>KOG3947 consensus Phosphoesterases [General function prediction only]
Probab=26.85  E-value=82  Score=34.59  Aligned_cols=62  Identities=29%  Similarity=0.319  Sum_probs=40.3

Q ss_pred             CCeEEEecCCCCHHHHHHHHHHcCCCCCCCCccceeEEEeccccCCCCChHHHHH---HHHHhhhcCCCcEEEeecCccc
Q 001901          698 APIKIFGDLHGQFGDLMRLFDEYGSPSTAGDIAYIDYLFLGDYVDRGQHSLETIT---LLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       698 ~~i~vvGDiHG~~~dL~~il~~~g~~~~~~~~~~~~~vfLGDyVDRG~~s~evl~---ll~~lk~~~p~~v~llrGNHE~  774 (998)
                      .+++.|+|.|....+..      ..|+.+      -++-+||+-.-|.. -||+.   .|-+|.-+   .=++|+||||.
T Consensus        62 ~r~VcisdtH~~~~~i~------~~p~gD------vlihagdfT~~g~~-~ev~~fn~~~gslph~---yKIVIaGNHEL  125 (305)
T KOG3947|consen   62 ARFVCISDTHELTFDIN------DIPDGD------VLIHAGDFTNLGLP-EEVIKFNEWLGSLPHE---YKIVIAGNHEL  125 (305)
T ss_pred             eEEEEecCcccccCccc------cCCCCc------eEEeccCCccccCH-HHHHhhhHHhccCcce---eeEEEeeccce
Confidence            46899999998876654      234332      45779999876643 34443   33343332   45789999998


Q ss_pred             c
Q 001901          775 A  775 (998)
Q Consensus       775 ~  775 (998)
                      -
T Consensus       126 t  126 (305)
T KOG3947|consen  126 T  126 (305)
T ss_pred             e
Confidence            4


No 254
>PTZ00421 coronin; Provisional
Probab=26.40  E-value=1.2e+03  Score=28.13  Aligned_cols=51  Identities=20%  Similarity=0.165  Sum_probs=26.9

Q ss_pred             EEEEEcCCCCCCCcccEEEEECCCCCceEE-EcccCCCCCCCccceEEEEEeCCEEEEEeccCC
Q 001901          240 YLMAIGGNDGKRPLADVWALDTAAKPYEWR-KLEPEGEGPPPCMYATASARSDGLLLLCGGRDA  302 (998)
Q Consensus       240 ~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~-~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~  302 (998)
                      .+++.||.++     .+..||+.+.  +-. .+.....     .........++.+++.|+.++
T Consensus       139 ~iLaSgs~Dg-----tVrIWDl~tg--~~~~~l~~h~~-----~V~sla~spdG~lLatgs~Dg  190 (493)
T PTZ00421        139 NVLASAGADM-----VVNVWDVERG--KAVEVIKCHSD-----QITSLEWNLDGSLLCTTSKDK  190 (493)
T ss_pred             CEEEEEeCCC-----EEEEEECCCC--eEEEEEcCCCC-----ceEEEEEECCCCEEEEecCCC
Confidence            4777777664     5778888766  321 1211111     112222334677788877653


No 255
>PF03178 CPSF_A:  CPSF A subunit region;  InterPro: IPR004871 This family includes a region that lies towards the C terminus of the cleavage and polyadenylation specificity factor (CPSF) A (160 kDa) subunit. CPSF is involved in mRNA polyadenylation and binds the AAUAAA conserved sequence in pre-mRNA. CPSF has also been found to be necessary for splicing of single-intron pre-mRNAs []. The function of the aligned region is unknown but may be involved in RNA/DNA binding.; GO: 0003676 nucleic acid binding, 0005634 nucleus; PDB: 2B5M_A 4A0K_C 4A0B_C 3I7L_A 3I8E_A 4A09_A 4A0A_A 3EI4_C 2B5L_A 3I7O_A ....
Probab=26.38  E-value=9.3e+02  Score=26.82  Aligned_cols=101  Identities=12%  Similarity=0.179  Sum_probs=59.1

Q ss_pred             CcEEEEECCCC-----cEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCC
Q 001901          150 ADVHCYDVLTN-----KWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPG  224 (998)
Q Consensus       150 ~dv~~yD~~t~-----~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~  224 (998)
                      +.++.|+....     +++.+...   ..+-.-.+.+.+++++++.-|        +.+++|++.... +|....   ..
T Consensus        62 Gri~v~~i~~~~~~~~~l~~i~~~---~~~g~V~ai~~~~~~lv~~~g--------~~l~v~~l~~~~-~l~~~~---~~  126 (321)
T PF03178_consen   62 GRILVFEISESPENNFKLKLIHST---EVKGPVTAICSFNGRLVVAVG--------NKLYVYDLDNSK-TLLKKA---FY  126 (321)
T ss_dssp             EEEEEEEECSS-----EEEEEEEE---EESS-EEEEEEETTEEEEEET--------TEEEEEEEETTS-SEEEEE---EE
T ss_pred             cEEEEEEEEcccccceEEEEEEEE---eecCcceEhhhhCCEEEEeec--------CEEEEEEccCcc-cchhhh---ee
Confidence            67889998884     66666443   222335677788888777766        468888888763 376666   33


Q ss_pred             CCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcc
Q 001901          225 PGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLE  272 (998)
Q Consensus       225 P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~  272 (998)
                      ..+-+-.++.++++ +|++.--..+    -.++.|+....  +-..++
T Consensus       127 ~~~~~i~sl~~~~~-~I~vgD~~~s----v~~~~~~~~~~--~l~~va  167 (321)
T PF03178_consen  127 DSPFYITSLSVFKN-YILVGDAMKS----VSLLRYDEENN--KLILVA  167 (321)
T ss_dssp             -BSSSEEEEEEETT-EEEEEESSSS----EEEEEEETTTE---EEEEE
T ss_pred             cceEEEEEEecccc-EEEEEEcccC----EEEEEEEccCC--EEEEEE
Confidence            33346666667776 5554322221    23446676554  444444


No 256
>PF02897 Peptidase_S9_N:  Prolyl oligopeptidase, N-terminal beta-propeller domain;  InterPro: IPR004106 In the MEROPS database peptidases and peptidase homologues are grouped into clans and families. Clans are groups of families for which there is evidence of common ancestry based on a common structural fold:  Each clan is identified with two letters, the first representing the catalytic type of the families included in the clan (with the letter 'P' being used for a clan containing families of more than one of the catalytic types serine, threonine and cysteine). Some families cannot yet be assigned to clans, and when a formal assignment is required, such a family is described as belonging to clan A-, C-, M-, N-, S-, T- or U-, according to the catalytic type. Some clans are divided into subclans because there is evidence of a very ancient divergence within the clan, for example MA(E), the gluzincins, and MA(M), the metzincins. Peptidase families are grouped by their catalytic type, the first character representing the catalytic type: A, aspartic; C, cysteine; G, glutamic acid; M, metallo; N, asparagine; S, serine; T, threonine; and U, unknown. The serine, threonine and cysteine peptidases utilise the amino acid as a nucleophile and form an acyl intermediate - these peptidases can also readily act as transferases. In the case of aspartic, glutamic and metallopeptidases, the nucleophile is an activated water molecule. In the case of the asparagine endopeptidases, the nucleophile is asparagine and all are self-processing endopeptidases.   In many instances the structural protein fold that characterises the clan or family may have lost its catalytic activity, yet retain its function in protein recognition and binding.  Proteolytic enzymes that exploit serine in their catalytic activity are ubiquitous, being found in viruses, bacteria and eukaryotes []. They include a wide range of peptidase activity, including exopeptidase, endopeptidase, oligopeptidase and omega-peptidase activity. Over 20 families (denoted S1 - S66) of serine protease have been identified, these being grouped into clans on the basis of structural similarity and other functional evidence []. Structures are known for members of the clans and the structures indicate that some appear to be totally unrelated, suggesting different evolutionary origins for the serine peptidases []. Not withstanding their different evolutionary origins, there are similarities in the reaction mechanisms of several peptidases. Chymotrypsin, subtilisin and carboxypeptidase C have a catalytic triad of serine, aspartate and histidine in common: serine acts as a nucleophile, aspartate as an electrophile, and histidine as a base []. The geometric orientations of the catalytic residues are similar between families, despite different protein folds []. The linear arrangements of the catalytic residues commonly reflect clan relationships. For example the catalytic triad in the chymotrypsin clan (PA) is ordered HDS, but is ordered DHS in the subtilisin clan (SB) and SDH in the carboxypeptidase clan (SC) [, ]. This entry represents the beta-propeller domain found at the N-terminal of prolyl oligopeptidase, including acylamino-acid-releasing enzyme (also known as acylaminoacyl peptidase), which belong to the MEROPS peptidase family S9 (clan SC), subfamily S9A. The prolyl oligopeptidase family consist of a number of evolutionary related peptidases whose catalytic activity seems to be provided by a charge relay system similar to that of the trypsin family of serine proteases, but which evolved by independent convergent evolution. The N-terminal domain of prolyl oligopeptidases form an unusual 7-bladed beta-propeller consisting of seven 4-stranded beta-sheet motifs.  Prolyl oligopeptidase is a large cytosolic enzyme involved in the maturation and degradation of peptide hormones and neuropeptides, which relate to the induction of amnesia. The enzyme contains a peptidase domain, where its catalytic triad (Ser554, His680, Asp641) is covered by the central tunnel of the N-terminal beta-propeller domain. In this way, large structured peptides are excluded from the active site, thereby protecting larger peptides and proteins from proteolysis in the cytosol []. The protein fold of the peptidase domain for members of this family resembles that of serine carboxypeptidase D, the type example of clan SC. Mammalian acylaminoacyl peptidase is an exopeptidase that is a member of the same prolyl oligopeptidase family of serine peptidases. This enzyme removes acylated amino acid residues from the N terminus of oligopeptides [].; GO: 0004252 serine-type endopeptidase activity, 0006508 proteolysis; PDB: 2BKL_B 3DDU_A 1YR2_A 2XE4_A 1VZ3_A 3EQ9_A 1O6F_A 3EQ7_A 4AN0_A 1UOP_A ....
Probab=25.98  E-value=1.1e+03  Score=27.35  Aligned_cols=157  Identities=13%  Similarity=0.105  Sum_probs=75.9

Q ss_pred             CcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCC------CcccEEEEECCCCCceEEEcc
Q 001901          199 SAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKR------PLADVWALDTAAKPYEWRKLE  272 (998)
Q Consensus       199 ~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~------~lndv~~yD~~s~~~~W~~v~  272 (998)
                      -...++++|+.+..  ...-    .++.++... ++...++..+++...+...      +-..+++..+.+..-.=..|-
T Consensus       148 e~~~l~v~Dl~tg~--~l~d----~i~~~~~~~-~~W~~d~~~~~y~~~~~~~~~~~~~~~~~v~~~~~gt~~~~d~lvf  220 (414)
T PF02897_consen  148 EWYTLRVFDLETGK--FLPD----GIENPKFSS-VSWSDDGKGFFYTRFDEDQRTSDSGYPRQVYRHKLGTPQSEDELVF  220 (414)
T ss_dssp             SEEEEEEEETTTTE--EEEE----EEEEEESEE-EEECTTSSEEEEEECSTTTSS-CCGCCEEEEEEETTS-GGG-EEEE
T ss_pred             ceEEEEEEECCCCc--CcCC----cccccccce-EEEeCCCCEEEEEEeCcccccccCCCCcEEEEEECCCChHhCeeEE
Confidence            34579999999862  2211    112222222 5455554455544444322      267889988877621101221


Q ss_pred             cCCCCCCCcc-ceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCC----CeEEEEECCCCCCCCcceeEEEEECCEEE
Q 001901          273 PEGEGPPPCM-YATASARSDGLLLLCGGRDASSVPLASAYGLAKHRD----GRWEWAIAPGVSPSPRYQHAAVFVNARLH  347 (998)
Q Consensus       273 ~~~~~P~~r~-~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~----~~W~w~~~~g~~P~pR~~hsav~~~~~L~  347 (998)
                      ....   ... ...+....+++.+++.-.....  .+++|.++....    ..|......    ..-..+.+...++.+|
T Consensus       221 e~~~---~~~~~~~~~~s~d~~~l~i~~~~~~~--~s~v~~~d~~~~~~~~~~~~~l~~~----~~~~~~~v~~~~~~~y  291 (414)
T PF02897_consen  221 EEPD---EPFWFVSVSRSKDGRYLFISSSSGTS--ESEVYLLDLDDGGSPDAKPKLLSPR----EDGVEYYVDHHGDRLY  291 (414)
T ss_dssp             C-TT---CTTSEEEEEE-TTSSEEEEEEESSSS--EEEEEEEECCCTTTSS-SEEEEEES----SSS-EEEEEEETTEEE
T ss_pred             eecC---CCcEEEEEEecCcccEEEEEEEcccc--CCeEEEEeccccCCCcCCcEEEeCC----CCceEEEEEccCCEEE
Confidence            1111   122 3333344455544433222211  467887777652    345544332    2223334445588999


Q ss_pred             EEcccCCCCCccccCCeEEEEECCCCe---EEE
Q 001901          348 VSGGALGGGRMVEDSSSVAVLDTAAGV---WCD  377 (998)
Q Consensus       348 V~GG~~~~~~~~~~~~dv~vyD~~t~~---W~~  377 (998)
                      +.-..+..      ...+..+++....   |..
T Consensus       292 i~Tn~~a~------~~~l~~~~l~~~~~~~~~~  318 (414)
T PF02897_consen  292 ILTNDDAP------NGRLVAVDLADPSPAEWWT  318 (414)
T ss_dssp             EEE-TT-T------T-EEEEEETTSTSGGGEEE
T ss_pred             EeeCCCCC------CcEEEEeccccccccccee
Confidence            88653222      4568899988876   664


No 257
>PF03178 CPSF_A:  CPSF A subunit region;  InterPro: IPR004871 This family includes a region that lies towards the C terminus of the cleavage and polyadenylation specificity factor (CPSF) A (160 kDa) subunit. CPSF is involved in mRNA polyadenylation and binds the AAUAAA conserved sequence in pre-mRNA. CPSF has also been found to be necessary for splicing of single-intron pre-mRNAs []. The function of the aligned region is unknown but may be involved in RNA/DNA binding.; GO: 0003676 nucleic acid binding, 0005634 nucleus; PDB: 2B5M_A 4A0K_C 4A0B_C 3I7L_A 3I8E_A 4A09_A 4A0A_A 3EI4_C 2B5L_A 3I7O_A ....
Probab=25.75  E-value=9.6e+02  Score=26.73  Aligned_cols=124  Identities=15%  Similarity=0.196  Sum_probs=65.7

Q ss_pred             ccEEEEEcCCC---CCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCce-EEEcccCCC
Q 001901          201 EDLHVLDLTQQ---RPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYE-WRKLEPEGE  276 (998)
Q Consensus       201 ~dv~~~Dl~t~---t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~-W~~v~~~~~  276 (998)
                      ..+++|++...   ..++..+... ..+.+  -.+++.+++ +|++.-|       +.+..|++...  + |........
T Consensus        62 Gri~v~~i~~~~~~~~~l~~i~~~-~~~g~--V~ai~~~~~-~lv~~~g-------~~l~v~~l~~~--~~l~~~~~~~~  128 (321)
T PF03178_consen   62 GRILVFEISESPENNFKLKLIHST-EVKGP--VTAICSFNG-RLVVAVG-------NKLYVYDLDNS--KTLLKKAFYDS  128 (321)
T ss_dssp             EEEEEEEECSS-----EEEEEEEE-EESS---EEEEEEETT-EEEEEET-------TEEEEEEEETT--SSEEEEEEE-B
T ss_pred             cEEEEEEEEcccccceEEEEEEEE-eecCc--ceEhhhhCC-EEEEeec-------CEEEEEEccCc--ccchhhheecc
Confidence            66899998873   1245555422 22222  455666777 5666555       57888888777  5 777665533


Q ss_pred             CCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEE-CCEEEEEcc
Q 001901          277 GPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFV-NARLHVSGG  351 (998)
Q Consensus       277 ~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~-~~~L~V~GG  351 (998)
                          ........+.++.|++ |-..    ....++.|+....   +...+... ..++...++.++ ++. .++++
T Consensus       129 ----~~~i~sl~~~~~~I~v-gD~~----~sv~~~~~~~~~~---~l~~va~d-~~~~~v~~~~~l~d~~-~~i~~  190 (321)
T PF03178_consen  129 ----PFYITSLSVFKNYILV-GDAM----KSVSLLRYDEENN---KLILVARD-YQPRWVTAAEFLVDED-TIIVG  190 (321)
T ss_dssp             ----SSSEEEEEEETTEEEE-EESS----SSEEEEEEETTTE----EEEEEEE-SS-BEEEEEEEE-SSS-EEEEE
T ss_pred             ----eEEEEEEeccccEEEE-EEcc----cCEEEEEEEccCC---EEEEEEec-CCCccEEEEEEecCCc-EEEEE
Confidence                2355556666776665 3221    1223444554222   23333332 356776777777 655 44444


No 258
>KOG0281 consensus Beta-TrCP (transducin repeats containing)/Slimb proteins [Function unknown]
Probab=25.61  E-value=3.3e+02  Score=30.95  Aligned_cols=99  Identities=16%  Similarity=0.144  Sum_probs=49.5

Q ss_pred             CCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCC
Q 001901          227 PRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVP  306 (998)
Q Consensus       227 ~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~  306 (998)
                      .|+.--.+-+.+++|+-..| +     ..+-++++.+.  .....-..      -...-|+.-..++++|.|..+.    
T Consensus       319 HrAaVNvVdfd~kyIVsASg-D-----RTikvW~~st~--efvRtl~g------HkRGIAClQYr~rlvVSGSSDn----  380 (499)
T KOG0281|consen  319 HRAAVNVVDFDDKYIVSASG-D-----RTIKVWSTSTC--EFVRTLNG------HKRGIACLQYRDRLVVSGSSDN----  380 (499)
T ss_pred             hhhheeeeccccceEEEecC-C-----ceEEEEeccce--eeehhhhc------ccccceehhccCeEEEecCCCc----
Confidence            34444444556643332222 1     24555666555  33332211      1234456666999999875432    


Q ss_pred             cccEEEEecCCCCeEEEEECCCCCCCCccee----EEEEECCEEEEEcccCCC
Q 001901          307 LASAYGLAKHRDGRWEWAIAPGVSPSPRYQH----AAVFVNARLHVSGGALGG  355 (998)
Q Consensus       307 ~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~h----sav~~~~~L~V~GG~~~~  355 (998)
                        .+-.++..          .|..-.-..+|    -++.++++-+|.||+++.
T Consensus       381 --tIRlwdi~----------~G~cLRvLeGHEeLvRciRFd~krIVSGaYDGk  421 (499)
T KOG0281|consen  381 --TIRLWDIE----------CGACLRVLEGHEELVRCIRFDNKRIVSGAYDGK  421 (499)
T ss_pred             --eEEEEecc----------ccHHHHHHhchHHhhhheeecCceeeeccccce
Confidence              22222222          22111112333    267789999999998764


No 259
>TIGR00282 metallophosphoesterase, MG_246/BB_0505 family. A member of this family from Mycoplasma Pneumoniae has been crystallized and described as a novel phosphatase.
Probab=25.22  E-value=75  Score=35.08  Aligned_cols=39  Identities=28%  Similarity=0.538  Sum_probs=27.1

Q ss_pred             eEEEeccccCCCCChHHHH-HHHHHhhhcCCCcEEEeecCcccc
Q 001901          733 DYLFLGDYVDRGQHSLETI-TLLLALKVEYPNNVHLIRGNHEAA  775 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s~evl-~ll~~lk~~~p~~v~llrGNHE~~  775 (998)
                      +++|+||+|  |.-+.+.| .+|-.||.+|+-.+  +-.|=|..
T Consensus         2 ~ilfiGDi~--G~~Gr~~l~~~L~~lk~~~~~D~--vIaNgEn~   41 (266)
T TIGR00282         2 KFLFIGDVY--GKAGRKIVKNNLPQLKSKYQADL--VIANGENT   41 (266)
T ss_pred             eEEEEEecC--CHHHHHHHHHHHHHHHHhCCCCE--EEEcCccc
Confidence            799999999  44445544 67778888876554  44576765


No 260
>PRK13684 Ycf48-like protein; Provisional
Probab=24.80  E-value=1.1e+03  Score=26.88  Aligned_cols=197  Identities=11%  Similarity=0.102  Sum_probs=87.6

Q ss_pred             CCcEEEecCCCCCCCCccceEEEEeCC-EEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEEC
Q 001901          159 TNKWSRITPFGEPPTPRAAHVATAVGT-MVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVG  237 (998)
Q Consensus       159 t~~W~~l~~~g~~P~pR~~hsa~~~~~-~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~  237 (998)
                      ...|+.+..    |......+++..+. ..|++|-.       ..++.=.-...  .|+.....  +|........+.+.
T Consensus        34 ~~~W~~~~~----~~~~~l~~v~F~d~~~g~avG~~-------G~il~T~DgG~--tW~~~~~~--~~~~~~~l~~v~~~   98 (334)
T PRK13684         34 SSPWQVIDL----PTEANLLDIAFTDPNHGWLVGSN-------RTLLETNDGGE--TWEERSLD--LPEENFRLISISFK   98 (334)
T ss_pred             CCCcEEEec----CCCCceEEEEEeCCCcEEEEECC-------CEEEEEcCCCC--CceECccC--CcccccceeeeEEc
Confidence            457988863    33344555555554 66777632       11222111122  39887522  22222222222233


Q ss_pred             CcEEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEEecCC
Q 001901          238 QRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGLAKHR  317 (998)
Q Consensus       238 ~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~~~~~  317 (998)
                      ++..|+.|..      ..+++  ....--+|+++......|.  .......+.++.+++.|..       ..++.-.+.-
T Consensus        99 ~~~~~~~G~~------g~i~~--S~DgG~tW~~~~~~~~~~~--~~~~i~~~~~~~~~~~g~~-------G~i~~S~DgG  161 (334)
T PRK13684         99 GDEGWIVGQP------SLLLH--TTDGGKNWTRIPLSEKLPG--SPYLITALGPGTAEMATNV-------GAIYRTTDGG  161 (334)
T ss_pred             CCcEEEeCCC------ceEEE--ECCCCCCCeEccCCcCCCC--CceEEEEECCCcceeeecc-------ceEEEECCCC
Confidence            3356666532      12333  3222238998853211111  1112223334556666532       2233333332


Q ss_pred             CCeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEE-ECCCCeEEEcccCcCCCCCCCCccccCC
Q 001901          318 DGRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVL-DTAAGVWCDTKSVVTSPRTGRYSADAAG  396 (998)
Q Consensus       318 ~~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vy-D~~t~~W~~v~~~~~~p~~~~~~~~~~~  396 (998)
                      . +|+  .....  ..-..+.+....+..++..|..+         .++.. |....+|+.+...               
T Consensus       162 ~-tW~--~~~~~--~~g~~~~i~~~~~g~~v~~g~~G---------~i~~s~~~gg~tW~~~~~~---------------  212 (334)
T PRK13684        162 K-NWE--ALVED--AAGVVRNLRRSPDGKYVAVSSRG---------NFYSTWEPGQTAWTPHQRN---------------  212 (334)
T ss_pred             C-Cce--eCcCC--CcceEEEEEECCCCeEEEEeCCc---------eEEEEcCCCCCeEEEeeCC---------------
Confidence            2 454  44322  22234445555444444433322         23332 4455689887543               


Q ss_pred             CCCccCCCCcceeEEEEE-CCEEEEEcC
Q 001901          397 GDAAVELTRRCRHAAAAV-GDLIFIYGG  423 (998)
Q Consensus       397 ~~~~~~p~~R~~hsa~~~-~~~LyVfGG  423 (998)
                             ..+.-+++... +++++++|.
T Consensus       213 -------~~~~l~~i~~~~~g~~~~vg~  233 (334)
T PRK13684        213 -------SSRRLQSMGFQPDGNLWMLAR  233 (334)
T ss_pred             -------CcccceeeeEcCCCCEEEEec
Confidence                   23334444443 668888875


No 261
>PRK05583 ribosomal protein L7Ae family protein; Provisional
Probab=24.51  E-value=67  Score=30.09  Aligned_cols=69  Identities=16%  Similarity=0.225  Sum_probs=51.4

Q ss_pred             CCCCceeeCHHHHHHHHHHcCCcEEEEcccccccceEEe------cCCeEEEEeccc---cccCCCCCeEEEEEEcCCc
Q 001901          875 RGPGLVTFGPDRVMEFCNNNDLQLIVRAHECVMDGFERF------AQGHLITLFSAT---NYCGTANNAGAILVLGRDL  944 (998)
Q Consensus       875 rg~~~~~fg~~~~~~fl~~~~l~~iiR~H~~~~~G~~~~------~~~~~iTvfSa~---~y~~~~~n~ga~l~~~~~~  944 (998)
                      |.+|-+.+|.+.+.+-+++...+++|.+-++-+++-+-+      ++-.+++.|+.-   .-||. .+.+++.+.+..+
T Consensus        13 ~rAGklv~G~~~v~~aik~gk~~lVI~A~D~s~~~kkki~~~~~~~~vp~~~~~t~~eLg~a~Gk-~~~~~iai~d~g~   90 (104)
T PRK05583         13 KKAGKLLEGYNKCEEAIKKKKVYLIIISNDISENSKNKFKNYCNKYNIPYIEGYSKEELGNAIGR-DEIKILGVKDKNM   90 (104)
T ss_pred             HHhCCeeecHHHHHHHHHcCCceEEEEeCCCCHhHHHHHHHHHHHcCCCEEEecCHHHHHHHhCC-CCeEEEEEeChHH
Confidence            335557899999999999999999999999988876532      344577777752   35665 3477777777654


No 262
>PTZ00422 glideosome-associated protein 50; Provisional
Probab=24.43  E-value=1.2e+02  Score=35.52  Aligned_cols=22  Identities=9%  Similarity=0.247  Sum_probs=19.1

Q ss_pred             HHHHHHHHcCCcEEEEcccccc
Q 001901          886 RVMEFCNNNDLQLIVRAHECVM  907 (998)
Q Consensus       886 ~~~~fl~~~~l~~iiR~H~~~~  907 (998)
                      .++-+|+++++++.|-||+=..
T Consensus       239 ~L~PLL~ky~VdlYisGHDH~l  260 (394)
T PTZ00422        239 YLLPLLKDAQVDLYISGYDRNM  260 (394)
T ss_pred             HHHHHHHHcCcCEEEEccccce
Confidence            6778999999999999998543


No 263
>TIGR01530 nadN NAD pyrophosphatase/5'-nucleotidase NadN. This model describes NadN of Haemophilus influenzae and a small number of close homologs in pathogenic, Gram-negative bacteria. NadN is a periplasmic enzyme that cleaves NAD (nicotinamide adenine dinucleotide) to NMN (nicotinamide mononucleotide) and AMP. The NMN must be converted by a 5'-nucleotidase to nicotinamide riboside for import. NadN belongs a large family of 5'-nucleotidases and has NMN 5'-nucleotidase activity for NMN, AMP, etc.
Probab=24.21  E-value=1.4e+02  Score=36.55  Aligned_cols=37  Identities=24%  Similarity=0.102  Sum_probs=23.2

Q ss_pred             eEEEeccccCCCCCh-----HHHHHHHHHhhhcCCCcEEEeecCccc
Q 001901          733 DYLFLGDYVDRGQHS-----LETITLLLALKVEYPNNVHLIRGNHEA  774 (998)
Q Consensus       733 ~~vfLGDyVDRG~~s-----~evl~ll~~lk~~~p~~v~llrGNHE~  774 (998)
                      -+|.-||.+..-+.+     ...+.+|=++     .--.+..||||.
T Consensus        52 l~ldaGD~~~gs~~~~~~~g~~~i~~~N~~-----g~Da~~lGNHEF   93 (550)
T TIGR01530        52 LVLHAGDAIIGTLYFTLFGGRADAALMNAA-----GFDFFTLGNHEF   93 (550)
T ss_pred             EEEECCCCCCCccchhhcCCHHHHHHHhcc-----CCCEEEeccccc
Confidence            467799998754322     2234444444     345778899997


No 264
>KOG1332 consensus Vesicle coat complex COPII, subunit SEC13 [Intracellular trafficking, secretion, and vesicular transport]
Probab=24.07  E-value=9.7e+02  Score=26.22  Aligned_cols=52  Identities=21%  Similarity=0.409  Sum_probs=31.6

Q ss_pred             CeEEEEECCCCCCCCcceeEEEEECCEEEEEcccCCCCCccccCCeEEEEECCC-CeEEEcccC
Q 001901          319 GRWEWAIAPGVSPSPRYQHAAVFVNARLHVSGGALGGGRMVEDSSSVAVLDTAA-GVWCDTKSV  381 (998)
Q Consensus       319 ~~W~w~~~~g~~P~pR~~hsav~~~~~L~V~GG~~~~~~~~~~~~dv~vyD~~t-~~W~~v~~~  381 (998)
                      +.|+-...... |.+.+..+-...++.|-|.||.          |.+.++-... ++|.++...
T Consensus       245 e~wk~tll~~f-~~~~w~vSWS~sGn~LaVs~Gd----------Nkvtlwke~~~Gkw~~v~~~  297 (299)
T KOG1332|consen  245 EPWKKTLLEEF-PDVVWRVSWSLSGNILAVSGGD----------NKVTLWKENVDGKWEEVGEV  297 (299)
T ss_pred             CcccccccccC-CcceEEEEEeccccEEEEecCC----------cEEEEEEeCCCCcEEEcccc
Confidence            45665555543 4556655666667777777773          3455555444 489988653


No 265
>PF02239 Cytochrom_D1:  Cytochrome D1 heme domain; PDB: 1NNO_B 1HZU_A 1N15_B 1N50_A 1GJQ_A 1BL9_B 1NIR_B 1N90_B 1HZV_A 1AOQ_A ....
Probab=21.55  E-value=1.3e+03  Score=26.68  Aligned_cols=187  Identities=20%  Similarity=0.195  Sum_probs=88.1

Q ss_pred             cCCcEEEEECCCCc-EEEecCCCCCCCCccceEEEEe---CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCC
Q 001901          148 ATADVHCYDVLTNK-WSRITPFGEPPTPRAAHVATAV---GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGP  223 (998)
Q Consensus       148 ~~~dv~~yD~~t~~-W~~l~~~g~~P~pR~~hsa~~~---~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~  223 (998)
                      -.+.+.++|..+++ -.+++..+      ..|....+   +..+|+.+..       ..+.++|+.+..    .+.   .
T Consensus        14 ~~~~v~viD~~t~~~~~~i~~~~------~~h~~~~~s~Dgr~~yv~~rd-------g~vsviD~~~~~----~v~---~   73 (369)
T PF02239_consen   14 GSGSVAVIDGATNKVVARIPTGG------APHAGLKFSPDGRYLYVANRD-------GTVSVIDLATGK----VVA---T   73 (369)
T ss_dssp             GGTEEEEEETTT-SEEEEEE-ST------TEEEEEE-TT-SSEEEEEETT-------SEEEEEETTSSS----EEE---E
T ss_pred             CCCEEEEEECCCCeEEEEEcCCC------CceeEEEecCCCCEEEEEcCC-------CeEEEEECCccc----EEE---E
Confidence            34588899998876 44444432      12554444   3489998631       368999999863    332   2


Q ss_pred             CCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEE-ccc--CCC-CCCCccceEEEEEeCCEEEEEec
Q 001901          224 GPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRK-LEP--EGE-GPPPCMYATASARSDGLLLLCGG  299 (998)
Q Consensus       224 ~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~-v~~--~~~-~P~~r~~~~a~~~~~~~lyvfGG  299 (998)
                      .+.+...+.+++-.+++.++.+.+.    -+.+..+|..+.  +=.+ +..  ... .+.+|. ........+..|++--
T Consensus        74 i~~G~~~~~i~~s~DG~~~~v~n~~----~~~v~v~D~~tl--e~v~~I~~~~~~~~~~~~Rv-~aIv~s~~~~~fVv~l  146 (369)
T PF02239_consen   74 IKVGGNPRGIAVSPDGKYVYVANYE----PGTVSVIDAETL--EPVKTIPTGGMPVDGPESRV-AAIVASPGRPEFVVNL  146 (369)
T ss_dssp             EE-SSEEEEEEE--TTTEEEEEEEE----TTEEEEEETTT----EEEEEE--EE-TTTS---E-EEEEE-SSSSEEEEEE
T ss_pred             EecCCCcceEEEcCCCCEEEEEecC----CCceeEeccccc--cceeecccccccccccCCCc-eeEEecCCCCEEEEEE
Confidence            3344555555554443333333322    357888998776  3222 211  111 111222 2222234555566543


Q ss_pred             cCCCCCCcccEEEEecCCCCeEEEEECCCCCCCCcceeEEEEECC-EEEEEcccCCCCCccccCCeEEEEECCCCeEEEc
Q 001901          300 RDASSVPLASAYGLAKHRDGRWEWAIAPGVSPSPRYQHAAVFVNA-RLHVSGGALGGGRMVEDSSSVAVLDTAAGVWCDT  378 (998)
Q Consensus       300 ~~~~~~~~~dv~~~~~~~~~~W~w~~~~g~~P~pR~~hsav~~~~-~L~V~GG~~~~~~~~~~~~dv~vyD~~t~~W~~v  378 (998)
                      .+     ...+|.++........-..    ....++.|-+.+-.+ +.|+. +...       .+.+-+.|.++.+=..+
T Consensus       147 kd-----~~~I~vVdy~d~~~~~~~~----i~~g~~~~D~~~dpdgry~~v-a~~~-------sn~i~viD~~~~k~v~~  209 (369)
T PF02239_consen  147 KD-----TGEIWVVDYSDPKNLKVTT----IKVGRFPHDGGFDPDGRYFLV-AANG-------SNKIAVIDTKTGKLVAL  209 (369)
T ss_dssp             TT-----TTEEEEEETTTSSCEEEEE----EE--TTEEEEEE-TTSSEEEE-EEGG-------GTEEEEEETTTTEEEEE
T ss_pred             cc-----CCeEEEEEeccccccceee----ecccccccccccCcccceeee-cccc-------cceeEEEeeccceEEEE
Confidence            22     3456666543321111111    124456666655543 43333 3222       45788999988865443


No 266
>PF13088 BNR_2:  BNR repeat-like domain; PDB: 2F11_A 2F0Z_A 1VCU_B 2F25_B 1SO7_A 2F29_A 1SNT_A 2F13_A 2F28_A 2F27_A ....
Probab=21.21  E-value=7.6e+02  Score=26.54  Aligned_cols=136  Identities=13%  Similarity=0.161  Sum_probs=66.6

Q ss_pred             cEEEEECCC-CcEEEecCCCCCCCCccceEEEE-e-CCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCC
Q 001901          151 DVHCYDVLT-NKWSRITPFGEPPTPRAAHVATA-V-GTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGP  227 (998)
Q Consensus       151 dv~~yD~~t-~~W~~l~~~g~~P~pR~~hsa~~-~-~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~  227 (998)
                      .+..|+... .+|+......  ......+.+.+ . ++.++++--.. ...  .-.+.+..+.. ..|+.+... .+|.+
T Consensus       135 ~~~~~S~D~G~tW~~~~~~~--~~~~~~e~~~~~~~dG~l~~~~R~~-~~~--~~~~~~S~D~G-~TWs~~~~~-~~~~~  207 (275)
T PF13088_consen  135 AFVYYSDDGGKTWSSGSPIP--DGQGECEPSIVELPDGRLLAVFRTE-GND--DIYISRSTDGG-RTWSPPQPT-NLPNP  207 (275)
T ss_dssp             EEEEEESSTTSSEEEEEECE--CSEEEEEEEEEEETTSEEEEEEEEC-SST--EEEEEEESSTT-SS-EEEEEE-ECSSC
T ss_pred             eEEEEeCCCCceeecccccc--ccCCcceeEEEECCCCcEEEEEEcc-CCC--cEEEEEECCCC-CcCCCceec-ccCcc
Confidence            334455543 4698886542  22244444433 3 44777775432 111  22333344333 259986644 56777


Q ss_pred             CcccEEEEECCcEEEEEcCCCCCCCcccEEEEECC-CCCceEEEcccCCCCCCC-ccceEEEEEeCCEEEE
Q 001901          228 RYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTA-AKPYEWRKLEPEGEGPPP-CMYATASARSDGLLLL  296 (998)
Q Consensus       228 R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~-s~~~~W~~v~~~~~~P~~-r~~~~a~~~~~~~lyv  296 (998)
                      .....++.+.++.++++....... .+-...+... ..  +|.........+.. ..|-.++...+++|+|
T Consensus       208 ~~~~~~~~~~~g~~~~~~~~~~~r-~~l~l~~S~D~g~--tW~~~~~i~~~~~~~~~Y~~~~~~~dg~l~i  275 (275)
T PF13088_consen  208 NSSISLVRLSDGRLLLVYNNPDGR-SNLSLYVSEDGGK--TWSRPKTIDDGPNGDSGYPSLTQLPDGKLYI  275 (275)
T ss_dssp             CEEEEEEECTTSEEEEEEECSSTS-EEEEEEEECTTCE--EEEEEEEEEEEE-CCEEEEEEEEEETTEEEE
T ss_pred             cCCceEEEcCCCCEEEEEECCCCC-CceEEEEEeCCCC--cCCccEEEeCCCCCcEECCeeEEeCCCcCCC
Confidence            777666666666777776632122 1222222222 34  89866444332211 2334444455778886


No 267
>KOG4649 consensus PQQ (pyrrolo-quinoline quinone) repeat protein [Secondary metabolites biosynthesis, transport and catabolism]
Probab=20.94  E-value=1.2e+03  Score=25.92  Aligned_cols=60  Identities=17%  Similarity=0.303  Sum_probs=43.4

Q ss_pred             ccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCCCCCCcccEEEEECCCCCceEEEccc
Q 001901          201 EDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEP  273 (998)
Q Consensus       201 ~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~  273 (998)
                      ..+...|..+....|..+-      ..|...+++++++  .+|+|-+.+     .+|.++.++...-|..+..
T Consensus        33 ~~~~avd~~sG~~~We~il------g~RiE~sa~vvgd--fVV~GCy~g-----~lYfl~~~tGs~~w~f~~~   92 (354)
T KOG4649|consen   33 GIVIAVDPQSGNLIWEAIL------GVRIECSAIVVGD--FVVLGCYSG-----GLYFLCVKTGSQIWNFVIL   92 (354)
T ss_pred             ceEEEecCCCCcEEeehhh------CceeeeeeEEECC--EEEEEEccC-----cEEEEEecchhheeeeeeh
Confidence            4566788888777898764      5788888888988  477776654     4677777776557776644


No 268
>TIGR02658 TTQ_MADH_Hv methylamine dehydrogenase heavy chain. This family consists of the heavy chain of methylamine dehydrogenase light chain, a periplasmic enzyme. The enzyme contains a tryptophan tryptophylquinone (TTQ) prothetic group derived from two Trp residues in the light subunity. The enzyme forms a complex with the type I blue copper protein amicyanin and a cytochrome. Electron transfer procedes from TQQ to the copper and then to the heme group of the cytochrome.
Probab=20.62  E-value=1.3e+03  Score=26.52  Aligned_cols=72  Identities=8%  Similarity=-0.054  Sum_probs=42.6

Q ss_pred             CEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCcEEEEEcCCC----CCCCcccEEEEE
Q 001901          185 TMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQRYLMAIGGND----GKRPLADVWALD  260 (998)
Q Consensus       185 ~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~~Lyv~GG~~----g~~~lndv~~yD  260 (998)
                      ..+||.-.....  ..+.++++|..+.    ..+.   ..+.+...|.+..-+++.||+.-.+.    -....+.+.+||
T Consensus        13 ~~v~V~d~~~~~--~~~~v~ViD~~~~----~v~g---~i~~G~~P~~~~spDg~~lyva~~~~~R~~~G~~~d~V~v~D   83 (352)
T TIGR02658        13 RRVYVLDPGHFA--ATTQVYTIDGEAG----RVLG---MTDGGFLPNPVVASDGSFFAHASTVYSRIARGKRTDYVEVID   83 (352)
T ss_pred             CEEEEECCcccc--cCceEEEEECCCC----EEEE---EEEccCCCceeECCCCCEEEEEeccccccccCCCCCEEEEEE
Confidence            356776543111  2378999999874    3332   33444444444344455899887631    122357899999


Q ss_pred             CCCCC
Q 001901          261 TAAKP  265 (998)
Q Consensus       261 ~~s~~  265 (998)
                      +.+..
T Consensus        84 ~~t~~   88 (352)
T TIGR02658        84 PQTHL   88 (352)
T ss_pred             CccCc
Confidence            99884


No 269
>KOG2321 consensus WD40 repeat protein [General function prediction only]
Probab=20.43  E-value=5.7e+02  Score=31.10  Aligned_cols=102  Identities=13%  Similarity=0.128  Sum_probs=55.3

Q ss_pred             cccCCcEEEEECCCCcEEEecCCCCCCCCccceEEEEeC--CEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCC
Q 001901          146 AGATADVHCYDVLTNKWSRITPFGEPPTPRAAHVATAVG--TMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGP  223 (998)
Q Consensus       146 ~~~~~dv~~yD~~t~~W~~l~~~g~~P~pR~~hsa~~~~--~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~  223 (998)
                      ++.-.++|+||++.++|-..-...   .+  .--++.++  +-++.+||..      ..+..||+.+.+ .-..+.....
T Consensus       151 ~gsg~evYRlNLEqGrfL~P~~~~---~~--~lN~v~in~~hgLla~Gt~~------g~VEfwDpR~ks-rv~~l~~~~~  218 (703)
T KOG2321|consen  151 VGSGSEVYRLNLEQGRFLNPFETD---SG--ELNVVSINEEHGLLACGTED------GVVEFWDPRDKS-RVGTLDAASS  218 (703)
T ss_pred             eecCcceEEEEccccccccccccc---cc--cceeeeecCccceEEecccC------ceEEEecchhhh-hheeeecccc
Confidence            345679999999999996443221   11  22233333  4788888853      457788877643 2222222111


Q ss_pred             ---CCCCCc--ccEEEEECC-cEEEEEcCCCCCCCcccEEEEECCCC
Q 001901          224 ---GPGPRY--GHVMALVGQ-RYLMAIGGNDGKRPLADVWALDTAAK  264 (998)
Q Consensus       224 ---~P~~R~--~hs~~~~~~-~~Lyv~GG~~g~~~lndv~~yD~~s~  264 (998)
                         .|..-.  .-++..+.+ +-=+.+|-.+|     .++.||+.+.
T Consensus       219 v~s~pg~~~~~svTal~F~d~gL~~aVGts~G-----~v~iyDLRa~  260 (703)
T KOG2321|consen  219 VNSHPGGDAAPSVTALKFRDDGLHVAVGTSTG-----SVLIYDLRAS  260 (703)
T ss_pred             cCCCccccccCcceEEEecCCceeEEeeccCC-----cEEEEEcccC
Confidence               222222  234444544 33334444333     6889999877


No 270
>PF14870 PSII_BNR:  Photosynthesis system II assembly factor YCF48; PDB: 2XBG_A.
Probab=20.13  E-value=1.3e+03  Score=26.07  Aligned_cols=156  Identities=17%  Similarity=0.235  Sum_probs=61.4

Q ss_pred             CcEEEecCCCCCCCCccceEEEEeCCEEEEEeCCCCCCCCcccEEEEEcCCCCCceEEeeecCCCCCCCcccEEEEECCc
Q 001901          160 NKWSRITPFGEPPTPRAAHVATAVGTMVVIQGGIGPAGLSAEDLHVLDLTQQRPRWHRVVVQGPGPGPRYGHVMALVGQR  239 (998)
Q Consensus       160 ~~W~~l~~~g~~P~pR~~hsa~~~~~~lyVfGG~~~~~~~~~dv~~~Dl~t~t~~W~~l~~~g~~P~~R~~hs~~~~~~~  239 (998)
                      .+|+.+....+.+.....+++...++..||.|-.        .+.....+.. ..|+++.....+|.  ..+.+..++++
T Consensus        47 ~tW~~~~~~~~~~~~~~l~~I~f~~~~g~ivG~~--------g~ll~T~DgG-~tW~~v~l~~~lpg--s~~~i~~l~~~  115 (302)
T PF14870_consen   47 KTWQPVSLDLDNPFDYHLNSISFDGNEGWIVGEP--------GLLLHTTDGG-KTWERVPLSSKLPG--SPFGITALGDG  115 (302)
T ss_dssp             SS-EE-----S-----EEEEEEEETTEEEEEEET--------TEEEEESSTT-SS-EE----TT-SS---EEEEEEEETT
T ss_pred             ccccccccCCCccceeeEEEEEecCCceEEEcCC--------ceEEEecCCC-CCcEEeecCCCCCC--CeeEEEEcCCC
Confidence            5798876442112122334455557788888742        1222333322 25999864433443  33445556665


Q ss_pred             EEEEEcCCCCCCCcccEEEEECCCCCceEEEcccCCCCCCCccceEEEEEeCCEEEEEeccCCCCCCcccEEEE-ecCCC
Q 001901          240 YLMAIGGNDGKRPLADVWALDTAAKPYEWRKLEPEGEGPPPCMYATASARSDGLLLLCGGRDASSVPLASAYGL-AKHRD  318 (998)
Q Consensus       240 ~Lyv~GG~~g~~~lndv~~yD~~s~~~~W~~v~~~~~~P~~r~~~~a~~~~~~~lyvfGG~~~~~~~~~dv~~~-~~~~~  318 (998)
                      .++++|..      ..+++=.-.-.  +|+.+.....    ..........++++++++...       .+|.- ++...
T Consensus       116 ~~~l~~~~------G~iy~T~DgG~--tW~~~~~~~~----gs~~~~~r~~dG~~vavs~~G-------~~~~s~~~G~~  176 (302)
T PF14870_consen  116 SAELAGDR------GAIYRTTDGGK--TWQAVVSETS----GSINDITRSSDGRYVAVSSRG-------NFYSSWDPGQT  176 (302)
T ss_dssp             EEEEEETT--------EEEESSTTS--SEEEEE-S--------EEEEEE-TTS-EEEEETTS-------SEEEEE-TT-S
T ss_pred             cEEEEcCC------CcEEEeCCCCC--CeeEcccCCc----ceeEeEEECCCCcEEEEECcc-------cEEEEecCCCc
Confidence            77777643      23444333334  8998754322    122223334577777776432       22222 22222


Q ss_pred             CeEEEEECCCCCCCCcceeEEEEE-CCEEEEEc
Q 001901          319 GRWEWAIAPGVSPSPRYQHAAVFV-NARLHVSG  350 (998)
Q Consensus       319 ~~W~w~~~~g~~P~pR~~hsav~~-~~~L~V~G  350 (998)
                       .|.-....    ..|.-.++.+. ++.|+++.
T Consensus       177 -~w~~~~r~----~~~riq~~gf~~~~~lw~~~  204 (302)
T PF14870_consen  177 -TWQPHNRN----SSRRIQSMGFSPDGNLWMLA  204 (302)
T ss_dssp             -S-EEEE------SSS-EEEEEE-TTS-EEEEE
T ss_pred             -cceEEccC----ccceehhceecCCCCEEEEe
Confidence             45544433    33444444444 56777654


Done!